Forchess - форум о заочных шахматах  

Вернуться   Forchess - форум о заочных шахматах > Заочные турниры и партии > Шахматные программы и движки

Ответ
 
Опции темы Опции просмотра
Старый 04.10.2020, 04:28   #7021
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
Ну и... Посмотрел.
SF согласно Вашим данным за месяц набрал 39 Elo в сравнении с LZ.
Вы опять издеваетесь или у вас проблемы со зрением?
Какой месяц?
Сравнивается Сток от 26 августа 2019 года и от 27 сентября 2020 года
Разница - ГОД И ОДИН МЕСЯЦ!
Цитата: Сообщение от Maratka
там резко было около 70 Elo. Так что вполне можно говорить, что набралось таки 150 Elo, и это без разницы, против кого мерить.
Полный бред. Есть огромная разница, против кого мерять
Если вам недостаточно тестов Гийома Леблана, то вот тест mattblachess. Тут меньше партий и меньше точность, но порядок цифры подтверждается

lczero0.26-J92-100 сильнее Стокфиш-11 на 50 Эло
lczero0.26-J92-100 слабее Стокфиш-12 на 15 Эло


Таким образом, Стокфиш-12 сильнее Стокфиш-11 всего на 65 Эло. Никаких 150 Эло нет и близко

Обратите внимание, что написал mattblachess по итогам своего теста, обнаружив, что он полностью противоречит данным о росте Стокфиша на 130 Эло

SF-рейтинг Стокфиша неверный!
То есть самоЭло Стокфиша бредовое и не имеет никакого отношения к реальности

Омегазеро вне форума   Ответить с цитированием
3 пользователя(ей) сказали cпасибо:
AlphaZero (04.10.2020), gogamoga (04.10.2020), Viktor (04.10.2020)
Старый 04.10.2020, 12:34   #7022
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
Вы опять издеваетесь или у вас проблемы со зрением?
Какой месяц?
Сравнивается Сток от 26 августа 2019 года и от 27 сентября 2020 года
Разница - ГОД И ОДИН МЕСЯЦ!


Пусть так. А теперь расскажите мне, как SF, набирая 39 Elo за год и один месяц, ухитряется держать паритет против LZ, у которого обычное дело:
Цитата: Сообщение от Омегазеро
рост на 22 Эло всего за неделю. Посмотрим, что будет дальше


Даже если эти 22 Elo в неделю -это непонятный всплеск, и реально LZ растет на порядок медленнее, то это все одно 114 Elo в год (не в год и месяц).

И да, у меня действительно проблемы со зрением.
Я вот пялюсь в эту табличку:



И никак не могу не то что найти контроль и оборудование, на котором делались замеры, но и просто увидеть цифры и буквы. Слишком оно мелковатое для меня.
Покрупнее нет?
Maratka вне форума   Ответить с цитированием
Старый 04.10.2020, 13:26   #7023
AlphaZero
2 разряд
 
Аватар для AlphaZero
 
Регистрация: 11.06.2019
Сообщений: 399
Сказал(а) спасибо: 549
Поблагодарили 121 раз(а) в 81 сообщениях
Репутация: 20
По умолчанию Re: LCZero

Цитата: Сообщение от Viktor
Поддержка более чем 64-ёх ядер? Ну наконец-то! Ждал.. Да.. Ждал с нетерпением..
AlphaZero вне форума   Ответить с цитированием
Старый 04.10.2020, 17:09   #7024
Alvir
3 разряд
 
Аватар для Alvir
 
Регистрация: 09.04.2019
Сообщений: 197
Сказал(а) спасибо: 1,130
Поблагодарили 248 раз(а) в 109 сообщениях
Репутация: 56
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
Я вот пялюсь в эту табличку:



И никак не могу не то что найти контроль и оборудование, на котором делались замеры, но и просто увидеть цифры и буквы. Слишком оно мелковатое для меня.
Покрупнее нет?
Тут оригинал:
https://docs.google.com/spreadsheets...#gid=207181789
Alvir вне форума   Ответить с цитированием
Старый 04.10.2020, 17:56   #7025
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
обычное дело
Цитата: Сообщение от Maratka
Даже если эти 22 Elo в неделю -это непонятный всплеск
Maratka! Ну не могу я поверить, что вы НЕ ЧИТАЛИ пост, на который я давала ссылку
Там же ясно написано - 22 Elo в неделю ПОСЛЕ LR-дропа
А перед этим за четыре месяца было всего +6.5 Эло

Вот так развивается Лила - сначала застой, потом скачок после LR-дропа, затем опять застой

Цитата: Сообщение от Maratka
набирая 39 Elo за год и один месяц
Поскольку там фиксированное число узлов, необходима поправка на отношение скоростей (оно отличается в этих тестах)
Если верить Вызвезденцу, надо добавить еще 45-50 Эло, итого 84-90 Эло

А Лила, судя по опубликованному графику, за год выросла примерно на 75 - если сравнивать нынешние сети с прошлогодними 256x20
Омегазеро вне форума   Ответить с цитированием
Старый 04.10.2020, 17:58   #7026
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Опубликованы тесты скоростей Лилы на новых RTX-картах в сравнении со старыми 2080

lczero 0.26.3-rc2 benchmark --cuda-fp16 384x30-t60-4619.pb.gz --num-positions=1 (начальная позиция)

RTX 2080 Ti - 320x24 = 21073 nps
RTX 2080 Ti - 384x30 = 13278 nps
RTX 2080 Super - 384x30 = 14915 nps

RTX 3080 FYI - 384x30 = 23222 (+75%)

RTX 3090 - 320x24 = 47636 nps (+126%)
RTX 3090 - 384x30 = 30591 nps (+130%)
Омегазеро вне форума   Ответить с цитированием
8 пользователя(ей) сказали cпасибо:
alchemist888 (05.10.2020), AlphaZero (04.10.2020), Alvir (04.10.2020), AndreyZhivotkov (04.10.2020), Maratka (04.10.2020), sergey1963 (04.10.2020), SergeyMZ (04.10.2020), svoitsl (04.10.2020)
Старый 04.10.2020, 18:26   #7027
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
Поскольку там фиксированное число узлов, необходима поправка на отношение скоростей (оно отличается в этих тестах)
Тогда вообще не нужно их сравнивать, ибо бесполезно, фискированное количество узлов против короткого (но таки гибкого) контроля, где движок сам решает, когда ему делать ход.


Цитата: Сообщение от Омегазеро
Там же ясно написано - 22 Elo в неделю ПОСЛЕ LR-дропа
А перед этим за четыре месяца было всего +6.5 Эло
Тогда понятно.
Но эти 22 Elo ничто в сравнении с сотней, которую набрал SF после того, как тоже получил сетевую оценку - первое.
Второе - он тоже набирает за счет сетей, в частности буквально неделю назад как раз за счет чуть измененного алгоритма обучения - 4 Elo.

Однако у Fish'а есть еще и собственно движок, который тоже дает вполне себе прилично, где-то полста Elo в год без оценки.

Так что я не знаю, о чем тут спорить. Лучше бы я посмотрел на результаты Ваших тестов, которых почему-то нет с конца июля.
Интересно было бы сравнить с теме сетями LZ, которые были на тот самый конец июля - раз, и текущей сетью - два.
Maratka вне форума   Ответить с цитированием
Старый 04.10.2020, 18:57   #7028
Переяслав
Гроссмейстер
 
Аватар для Переяслав
 
Регистрация: 12.07.2020
Сообщений: 1,784
Сказал(а) спасибо: 650
Поблагодарили 2,306 раз(а) в 1,004 сообщениях
Записей в дневнике: 20
Репутация: 136
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
RTX 3090 - 384x30 = 30591 nps
круто.
на моей 1060 с --num-positions=1 дает 1291
__________________
PGN Spy - top tournaments
Переяслав вне форума   Ответить с цитированием
Старый 04.10.2020, 19:02   #7029
svoitsl
Гроссмейстер
 
Аватар для svoitsl
 
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
который тоже дает вполне себе прилично, где-то полста Elo в год без оценки.
точно без оценки?
раньше вроде было с оценкой,или я что то путаю?
svoitsl вне форума   Ответить с цитированием
Старый 04.10.2020, 19:21   #7030
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Так оценки там 10-20% от общего веса патчей.
Maratka вне форума   Ответить с цитированием
Старый 05.10.2020, 04:59   #7031
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Новая сеть от jhortos https://storage.lczero.org/files/net...ontrib/J92-240

При ее тренировке использовались игры после снижения LR, когда сила Лилы подскочила на 22 Эло

Правда, пока таких результатов нет. Мне кажется, что в связи со снижением LR надо было поменять параметры тренировок, а jhortos гонит со старыми параметрами. Это ошибка

Цитата: Сообщение от Maratka
Но эти 22 Elo ничто в сравнении с сотней, которую набрал SF после того, как тоже получил сетевую оценку
Во-первых, сотня, которую набрал SF - это самоЭло
Если бы это Эло было реальностью, SF бы обогнал Лилу не менее чем на 65 Эло
А теперь посмотрите на результаты суперфинала TCEC-19 и скажите - похоже, чем SF на 65 Эло сильнее Лилы?

Во-вторых, игры после LR-дропа не использовались при тренировке сети, которая сейчас играет в TCEC. То есть прибавка в 22 Эло - это резерв для дальнейших тренировок Лилы
Омегазеро вне форума   Ответить с цитированием
3 пользователя(ей) сказали cпасибо:
AlphaZero (05.10.2020), Alvir (05.10.2020), Viktor (05.10.2020)
Старый 05.10.2020, 05:14   #7032
alchemist888
КМС
 
Аватар для alchemist888
 
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
При ее тренировке использовались игры после снижения LR, когда сила Лилы подскочила на 22 Эло
Правда, пока таких результатов нет. Мне кажется, что в связи со снижением LR надо было поменять параметры тренировок, а jhortos гонит со старыми параметрами. Это ошибка
- LR дроп дает больше тому, у кого он происходит. Все финальные сети jhorthos имели последний LR drop для своих сетей, и неважно на какой LR был у тренировочных игр. То есть, если и реально у T60 был скачок на 22 Elo, то он в любом случае был бы размазан многоступенчатой структурой обучения.
- Нет веских оснований считать, что сила T60 подскочила на 22 Elo. Во-первых последние LR снижения никогда столько Elo нативным сетям не давали. А во-вторых взяты замеры между двумя сетями, одна из которых могла быть неудачной, а вторая удачной. Плюс контроль ультракороткий 1500 nodes/move. Сколько там Elo в реальных условиях никому не известно. Кстати, именно это и основная причина того, что в более-менее длинных контролях SFdev едва-ли покажет 150 Elo разницу с SF11, а не то, что, как Вы считаете, тестирование идет неправильно.
- Алгоритмы обучения у опытных ребят типа jhorthos и Sergio постоянно меняются. В этом поиске время от времени находятся хорошие прорывы. Безапелляционно говорить, что они ошибаются в параметрах обучения сетей - это как минимум пустой критицизм, а как максимум невежественно и грубо.
alchemist888 вне форума   Ответить с цитированием
4 пользователя(ей) сказали cпасибо:
AlphaZero (05.10.2020), Arikchess (05.10.2020), Maratka (05.10.2020), Viktor (05.10.2020)
Старый 05.10.2020, 12:49   #7033
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
А теперь посмотрите на результаты суперфинала TCEC-19 и скажите - похоже, чем SF на 65 Эло сильнее Лилы?
А дебюты Вы смотрели? когда они +0,3 с раздачи, слабейший достаточно легко парирует, когда 1,2 с раздачи - обычно проигрывает. Нет хороших игровых дебютов, где было бы 0,7-0,9, которые можно было бы играть на ничью и на победу.

Ну и в целом, на TCEC'е уже тесты проводят?
Когда первые тысяч пятьдесят-сто партий наиграли движок А против движка Б, в каком году?

И еще раз попрошу, выложите Ваши тесты SF vs LZ.
Те самые, которые Вы выкладывали раз-два в неделю в течении около года до выхода NN-версии SF, и прекратились сразу после ее выхода.
Тесты SF той версии, которая сразу после появления сетевой оценки против тогдашней версии LZ и его сети, и современный SF и LZ с современными же сетями.
Maratka вне форума   Ответить с цитированием
Старый 05.10.2020, 12:54   #7034
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от alchemist888
- Нет веских оснований считать, что сила T60 подскочила на 22 Elo. Во-первых последние LR снижения никогда столько Elo нативным сетям не давали. А во-вторых взяты замеры между двумя сетями, одна из которых могла быть неудачной, а вторая удачной.
Барышня пишет, что это не самоЕло. Т.е. тогда это ни одна сеть LZ против другой сети LZ, а что-то иное.

Цитата: Сообщение от alchemist888
Сколько там Elo в реальных условиях никому не известно. Кстати, именно это и основная причина того, что в более-менее длинных контролях SFdev едва-ли покажет 150 Elo разницу с SF11, а не то, что, как Вы считаете, тестирование идет неправильно.
Ну так это любой движок так покажет. SF11 тоже не на 50 ELo сильнее 10-й версии на часовом контроле. А у текущей версии LZ никогда не будет 22 Elo.
Maratka вне форума   Ответить с цитированием
Старый 05.10.2020, 16:37   #7035
alchemist888
КМС
 
Аватар для alchemist888
 
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
Барышня пишет, что это не самоЕло. Т.е. тогда это ни одна сеть LZ против другой сети LZ, а что-то иное.
Там тестировались две сети T60 через Стокфиш 19082608. Одна из них с последним LR, другая из них с более высоким. Разница в датах между ними примерно месяц. Это я и имел ввиду, говоря что взяты замеры между двумя сетями.
https://forchess.ru/showpost.php?p=1...postcount=6941
alchemist888 вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Maratka (05.10.2020)
Старый 05.10.2020, 20:50   #7036
alchemist888
КМС
 
Аватар для alchemist888
 
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
Опубликованы тесты скоростей Лилы на новых RTX-картах в сравнении со старыми 2080
lczero 0.26.3-rc2 benchmark --cuda-fp16 384x30-t60-4619.pb.gz --num-positions=1 (начальная позиция)
RTX 2080 Ti - 320x24 = 21073 nps
RTX 2080 Ti - 384x30 = 13278 nps
RTX 2080 Super - 384x30 = 14915 nps
Интересно, как RTX 2080 Super смогла прилично превзойти 2080 TI в данном замере?
alchemist888 вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
Alvir (05.10.2020), Maratka (05.10.2020)
Старый 05.10.2020, 22:23   #7037
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от alchemist888
Безапелляционно говорить, что они ошибаются в параметрах обучения сетей - это как минимум пустой критицизм, а как максимум невежественно и грубо
Невежественно утверждать, что параметры обучения всегда оптимальны

Потому что их можно подобрать только экспериментально, теория в лучшем случае может подсказать только общее направление поиска

Поэтому я безапелляционно говорю, что лучшим вариантом были бы распределенные тренировки через сервер - сразу параллельно запустить несколько тренировок с разными параметрами и тестировать получившиеся сети.

Jhortos, каким бы он гением не был, на своем компьютере не может перепробовать всё

Цитата: Сообщение от alchemist888
- Нет веских оснований считать, что сила T60 подскочила на 22 Elo
Есть веские основания!
Гийом ле Блан сейчас сделал повторный тест тех же сетей T60 против последнего нейростокфиша - получилось +22,5 Эло

Цитата: Сообщение от alchemist888
То есть, если и реально у T60 был скачок на 22 Elo, то он в любом случае был бы размазан многоступенчатой структурой обучения
Вы думаете, нельзя подобрать параметры так, чтобы придать больший вес более сильным сетям?

Цитата: Сообщение от alchemist888
Во-первых последние LR снижения никогда столько Elo нативным сетям не давали. А во-вторых взяты замеры между двумя сетями, одна из которых могла быть неудачной, а вторая удачной. Плюс контроль ультракороткий 1500 nodes/move. Сколько там Elo в реальных условиях никому не известно
Бездоказательные рассуждения

Цитата: Сообщение от alchemist888
Кстати, именно это и основная причина того, что в более-менее длинных контролях SFdev едва-ли покажет 150 Elo разницу с SF11, а не то, что, как Вы считаете, тестирование идет неправильно
Какой контроль вы считаете "более менее длинным"?
4m+2s на процессоре 3900x 24 потока - нормально?
Омегазеро вне форума   Ответить с цитированием
Старый 05.10.2020, 22:42   #7038
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Цитата: Сообщение от alchemist888
Кстати, именно это и основная причина того, что в более-менее длинных контролях SFdev едва-ли покажет 150 Elo разницу с SF11, а не то, что, как Вы считаете, тестирование идет неправильно.
Вот это вот - крайне важное замечание.
Если замерять SF dev против SF 11 в буллет 60+0.6 через, допустим, SF7 (ну это-то не самоэло?), там будет что-то типа 130 эло разницы, при том, что contempt давал SF11 в таком матчапе 20-30 эло МИНИМУМ.
Заодно вспоминаем, что SF11 против SF12 на фиштесте играется без выключенного contempt, и -130 эло превращаются совсем не в -130.
Т.е. получаем, что реально это и есть те самые "фиштестовские" разницы в эло, если убрать эффект того, что в стокфише было сделано исключительно для разгрома более слабых движков.
А что оно так себе транслируется на длинные временные контроли? Компрессию эло никто не отменял, в реалиях TCEC с монструозным железом и огромными временными контролями так и выйдет.
__________________

Развернуть для просмотра

[свернуть]
Vizvezdenec вне форума   Ответить с цитированием
Старый 05.10.2020, 22:44   #7039
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
Нет хороших игровых дебютов, где было бы 0,7-0,9, которые можно было бы играть на ничью и на победу
Ага!
Значит, вы признаете, что моя модель тестирования правильная, а Стокфиш тестируют неправильно?

Напоминаю про мою модель. Генерируется репрезентативная база легальных игровых позиций, взятых из реальных партий сильнейших. Затем эти позиции по очереди случайным образом передаются движкам. Если средняя (от двух движков) оценка 0,6-0,9, позиция играется за белых и за черных. Если оценка другая, позиция пропускается и не играется. Тем самым тестирование ведется только на хороших позициях для данных движков.

А в ваших дебютных наборах хороших игровых позиций очень мало, там очень много мусора, кроме того, длина дебютов в основном фиксированная. Не проверяется сила движков как в одноходовых дебютах, так и в миттельшпиле.
Омегазеро вне форума   Ответить с цитированием
Старый 05.10.2020, 23:04   #7040
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
Ага!
Значит, вы признаете, что моя модель тестирования правильная, а Стокфиш тестируют неправильно?
Нет. Методика у Вас как методика, не лучше и не хуже любой другой. На Фиштесте например полно позиций, где одна из сторон всегда проигрывает, и хватает вполне себе ничейных. Те, про которые пишете Вы - всего-то один из этих трех вариантов.

В результате, играя первый и второй вариант, сильнейший движок (т.е. с новым тестируемым патчем, либо новая релизная версия против предыдущей) ничего как правило не набирает, т.к. получает 1:0/1:0 или два по 0,5, и разница вылезает в основном только за счет третьих дебютов, про которые пишите Вы.

Итого, реальная разница, если тестировать по-Вашему в Elo будет еще больше


Цитата: Сообщение от Омегазеро
в ваших дебютных наборах хороших игровых позиций очень мало
Давайте быть реалистами: это не мои дебютные наборы, и я к ним не имею никакого отношения. Имел бы - ну наверное как-то бы попытался их чуть почистить, просто по той причине, что тогда больше патчей проходить станет.
Maratka вне форума   Ответить с цитированием
Старый 05.10.2020, 23:14   #7041
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Вообще говоря, на фиштесте тестировалось штук 8 разных книг.
Текущая - та, которая давала наибольшую разницу в эло среди всех для движков типа в 20-30 эло разницы.
Если бы там было много "совсем не игровых" позиций, то так бы не было, т.к. книга "совсем из не игровых позиций" даёт разницу в 0 эло.
Так ещё можно было про старую книгу сказать, но сейчас там noob_3moves, там вроде 150к позиций примерно, но 3-ходовых, их игровых так то 3-ходовых очень много (надеюсь, никто не будет говорить, что что-то вроде g3 c5 Bg2 f5 Nc3 Nc6 это "не игровая" позиция? То, то это не главная линия мейнстримных дебютов, не делает её неигровой).
__________________

Развернуть для просмотра

[свернуть]
Vizvezdenec вне форума   Ответить с цитированием
Старый 05.10.2020, 23:16   #7042
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Ну улучшить то всегда есть что и как..
Наш сербский друг с год назад писал, что там по книге есть дебюты, где (например) SF3 выигрывает у тогдашней беты версии 11.

Понятно, что это создает лишний шум, и потому мешает проходить патчам, которые в принципе дают Elo, но на грани.

Если это почистили, то и хорошо!
Maratka вне форума   Ответить с цитированием
Старый 05.10.2020, 23:21   #7043
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
Ну улучшить то всегда есть что и как..
Наш сербский друг с год назад писал, что там по книге есть дебюты, где (например) SF3 выигрывает у тогдашней беты версии 11.

Понятно, что это создает лишний шум, и потому мешает проходить патчам, которые в принципе дают Elo, но на грани.

Если это почистили, то и хорошо!
Там вообще книга полностью поменялась, это просто другая книга.
Взята от noobpwnftw, который её сделал точно так же, как делал книгу для сянцы, я не особо вникал, как
__________________

Развернуть для просмотра

[свернуть]
Vizvezdenec вне форума   Ответить с цитированием
Старый 05.10.2020, 23:33   #7044
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Тогда понятно!
И это очень даже неплохо!
Maratka вне форума   Ответить с цитированием
Старый 05.10.2020, 23:39   #7045
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
Jhortos, каким бы он гением не был, на своем компьютере не может перепробовать всё
Вы руки на рельсы положить согласны, в качестве аргумента, что у него компьютер, а не компьютеры?


Цитата: Сообщение от Омегазеро
Гийом ле Блан сейчас сделал повторный тест тех же сетей T60 против последнего нейростокфиша - получилось +22,5 Эло
Если тестировать одно и то же по одной и той же методике и достаточно большом количестве партий, то оно неудивительно.
Только вот я например не знаю, что у него за методика. В частности: железо, контроль, книга, наличие партий с начальной позиции (и если есть - их процент от общего числа партий), условия засчета результата (до упора, или присуждение), и неверное еще пару-тройку моментов найдется, сходу не вспомнишь.

А Вы их знаете?
Maratka вне форума   Ответить с цитированием
Старый 06.10.2020, 01:33   #7046
alchemist888
КМС
 
Аватар для alchemist888
 
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
Невежественно утверждать, что параметры обучения всегда оптимальны...
Jhortos, каким бы он гением не был, на своем компьютере не может перепробовать всё.
Где я такое говорил о том, что Jhorthos оптимально обучает сети? Еще раз, поймите мою мысль, Вы в своем сообщении буквально утверждали, что он в чем-то ошибается. При этом Вы не привели оптимальную, на Ваш взгляд, модель обучения и параметры. Также Вы не обсуждали этот вопрос непосредственно с самим Jhorthos (что странно, если Вам известна ошибка). Таким образом у нас нет его позиции на этот счет.
Получается Вы сказали примерно следующее: Jhorthos ошибается потому что у сетей T60 был LR drop, он принес 22 Elo значит учить его новые сети надо как-то иначе.
Это все равно что я бы сказал: инженеры плохо проектируют двигатели внутреннего сгорания, потому что их КПД далек от 100%. Мы в 21-м веке живем, можно же было их прилично улучшить!
Цитата: Сообщение от Омегазеро
Поэтому я безапелляционно говорю, что лучшим вариантом были бы распределенные тренировки через сервер - сразу параллельно запустить несколько тренировок с разными параметрами и тестировать получившиеся сети.
А Jhorthos тут причем? Он делает что-то свое. Обращайтесь к авторам проекта LCZero с подобным предложением. Только для этих целей, видимо, придется приостановить все остальные тренировочные раны.
Да и, на самом деле, проект LCZero именно этим и занимается, с той лишь разницей, что в нем идет генерация тренировочных игр и вместе с тем, за счет тестовых ранов, происходит поиск оптимальных параметров обучения.
То есть, ребята конечно могут остановить генерацию партий и искать оптимальные модели обучения для форков (чтобы эффективней создавать сильные сети), но кто тогда будет обеспечивать их базой тренировочных игр?
alchemist888 вне форума   Ответить с цитированием
Старый 06.10.2020, 05:50   #7047
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от alchemist888
Вы в своем сообщении буквально утверждали, что он в чем-то ошибается. При этом Вы не привели оптимальную, на Ваш взгляд, модель обучения и параметры
Как говорил Бернард Шоу, чтобы судить о вкусе яичницы, не надо уметь нести яйца
Вот данные самого jhortos

Код:
 # PLAYER              :  RATING  ERROR  PLAYED   (%)      W      L      D  D(%)  CFS(%)
   1 lc0.net.J92-190     :    19.5    5.2    8000    53   2069   1635   4296    54      84
   2 lc0.net.J92-210     :    15.8    5.3    8000    52   2007   1655   4338    54      66
   3 lc0.net.J92B-205    :    14.2    5.3    8000    52   2026   1710   4264    53      51
   4 lc0.net.J92-240     :    14.1    5.2    8000    52   1984   1670   4346    54      55
Я имею полное право сказать, что это не те цифры, которые мы ожидаем, следовательно, в обучении ошибка

Цитата: Сообщение от alchemist888
ребята конечно могут остановить генерацию партий и искать оптимальные модели обучения для форков (чтобы эффективней создавать сильные сети)
Передергиваете!
Генерация партий и поиск оптимальных моделей могут идти параллельно
Даже сейчас параллельно запущено несколько тренировок с генерацией
Омегазеро вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Viktor (06.10.2020)
Старый 06.10.2020, 05:58   #7048
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
Только вот я например не знаю, что у него за методика. В частности: железо, контроль, книга, наличие партий с начальной позиции (и если есть - их процент от общего числа партий), условия засчета результата (до упора, или присуждение), и неверное еще пару-тройку моментов найдется, сходу не вспомнишь.
А Вы их знаете?
Достаточно заглянуть на страничку setting, чтобы все это узнать

Adjudication
draw: 50 moves, 5 moves both eval < 0.08, tb 6 men / resign: 5 moves both eval > 10
ELO ordo -a 0 -A "Stockfish.dev" -W -D -U "0,1,2,3,4,5,6,7,8,9,10" -s 2000

Engines
Stockfish dev 19082608 (4 cores, 1500000 nodes, 512MB transposition table, 6 men TB)
Stockfish dev 20092708 (4 cores, 300000 nodes, 512MB transposition table, 6 men TB)
Leela v 0.25.1 (2 cores, 1500 nodes, backend cudnn-fp16, nncache default, 6 men TB)
Leela v 0.26.0 (2 cores, 1500 nodes, backend cudnn-fp16, nncache default, 6 men TB)
@kiudee setting --cpuct=2.147 --cpuct-base=18368 --cpuct-factor=2.815 --fpu-value=0.443 --policy-softmax-temp=1.607

Book
openings-8ply-10k.pgn (by Chad, 10000 openings, 8 plies, played with black and white)

Цитата: Сообщение от Vizvezdenec
Там вообще книга полностью поменялась, это просто другая книга.
Взята от noobpwnftw, который её сделал точно так же, как делал книгу для сянцы, я не особо вникал, как
Цитата: Сообщение от Maratka
Тогда понятно!
И это очень даже неплохо!
Не вникал, но одобряю!
Это соверешенно ненаучный подход
Омегазеро вне форума   Ответить с цитированием
Старый 06.10.2020, 13:07   #7049
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
Как говорил Бернард Шоу, чтобы судить о вкусе яичницы, не надо уметь нести яйца
Гениально!
Вот только противоречит одной интересной мысли:
Цитата: Сообщение от Омегазеро
Поэтому я безапелляционно говорю, что лучшим вариантом были бы распределенные тренировки через сервер - сразу параллельно запустить несколько тренировок с разными параметрами и тестировать получившиеся сети.
При этом:

Цитата: Сообщение от Омегазеро
Генерация партий и поиск оптимальных моделей могут идти параллельно
Даже сейчас параллельно запущено несколько тренировок с генерацией
Т.е. оказывается не нужно безапелляционно утверждать, что...бла-бла-бла, ибо оно оказывается уже само по себе давно работает.
Maratka вне форума   Ответить с цитированием
Старый 06.10.2020, 13:13   #7050
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
Достаточно заглянуть на страничку setting, чтобы все это узнать
Недостаточно. Я не знаю, где находится страничка setting.


Цитата: Сообщение от Омегазеро
Не вникал, но одобряю!
Это соверешенно ненаучный подход
А что тут вникать? Выбрали из многих книг ту, на которой набирается максимум Elo между двумя движками. Это действительно неплохо.
Или Вы считаете, что плохо? Или научный подход в том, чтобы вручную просмотреть несколько десятков тысяч дебютов, и оценить их?
Maratka вне форума   Ответить с цитированием
Ответ


Здесь присутствуют: 5 (пользователей: 0 , гостей: 5)
 

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 08:43. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.7
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
Рейтинг@Mail.ru