20.06.2019, 23:14 | #3931 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Такой вот пост с их форума
Цитата:
I use cutechess-cli running 20000 games in 500 games series (250 colour reversed). I adapted a script found in discord. You must have to modify some parameters if you change the number of nodes (nncache for Leela and hash for SF).
The batch : for /l %%s in (1,250,9751) do ( cutechess-cli.exe ^ -engine name="Stockfish.dev" cmd="stockfish_19042720_x64_bmi2.exe" dir="C:\path\to\Stockfish-11-win" ^ option.Threads=4 option.Hash=512 nodes=1700000 ^ option.SyzygyPath=C:\path\to\TB\syzygy ^ -engine name="lc0.net.42547" dir="C:\path\to\LC0_v0.21" ^ option.WeightsFile="C:\path\to\LC0_v0.21\weights_4 2547.pb.gz" ^ cmd="lc0.exe --backend=cudnn-fp16 --syzygy-paths=C:\path\to\TB\syzygy" ^ nodes=3000 ^ -debug > Debug.txt -pgnout "match.pgn" min ^ -each proto=uci tc=inf -recover -concurrency 1 -tournament gauntlet ^ -draw movenumber=50 movecount=5 score=8 -resign movecount=5 score=1000 ^ -games 2 -rounds 250 ^ -openings file="C:\path\to\Books\openings-8ply-10k.pgn" format=pgn order=sequential start=%%s ^ -tb C:\path\to\TB\syzygy -repeat ) |
20.06.2019, 23:26 | #3932 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: LCZero
Цитата: Сообщение от Vizvezdenec
Да, это типа 3,5-5,5 эло погрешности.
Да только это 95% На деле она может быть и больше Двойные стандарты получаются |
20.06.2019, 23:29 | #3933 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Цитата: Сообщение от Омегазеро
вывод о снижении Эло Лилы с сети 42500 по сеть 42600
|
21.06.2019, 08:31 | #3935 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Цитата: Сообщение от player-1980
какая сеть сильнейшая сейчас?
Цитата:
Возможно, но все поздние сети T40 находятся в пределах 10-15 ELO: нам нужно, наверное, 100 000 игр для каждой сети или больше, чтобы их упорядочить: никто не может этого сделать.
Я тестирую сети на 20 000 игр, это занимает 5 дней, и этого недостаточно для того, что вы хотите. См .: https://docs.google.com/spreadsheets...it?usp=sharing График ниже показывает статистические колебания при тестировании сетей и иллюстрирует сложность задачи. Никто не знает лучшую сеть. Так что выделить 50 лучших из них просто невозможно. |
2 пользователя(ей) сказали cпасибо: | player-1980 (21.06.2019), Rom77 (21.06.2019) |
21.06.2019, 10:18 | #3937 |
Гроссмейстер
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
|
Re: LCZero
Ну то есть (неожиданно), нету тут никаких 20 эло разницы, когда наиграли 20000 игр, эта разница плавно становится 3 эло и меньше, по-прежнему укладываясь в погрешность.
Кто бы мог подумать-то, а? Поэтому и говорю, что нужно не страдать этим, а просто последнюю брать, ну или сеть джортоса, которая построена на чуть другом обучении и это даёт измеримую прибавку (по крайней мере по сравнению с 247 или какой там). |
21.06.2019, 10:52 | #3938 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: LCZero
Цитата: Сообщение от Vizvezdenec
Ну то есть (неожиданно), нету тут никаких 20 эло разницы, когда наиграли 20000 игр, эта разница плавно становится 3 эло и меньше, по-прежнему укладываясь в погрешность.
Кто бы мог подумать-то, а? Между этими сетями нет такой разницы, да. Можно ли из этого сделать вывод, что между любыми сетями 425xxx такой разницы нет? Обратите также внимание на условия теста - 3000 узлов на ход против 1700000 узлов на ход. Они не вызывают вопросов? |
21.06.2019, 11:06 | #3939 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
Здесь дело в том, что эти сети даже после 1000 партий показывали отклонение до 15 пунктов от истинного. И такое поведение не касается исключительно одной сети. То есть, если бы тесты остановились на 1000 партий , то мы пришли бы к совершенно иным выводам о силе сетей.
|
21.06.2019, 11:10 | #3940 |
Гроссмейстер
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
|
Re: LCZero
Делаю такой вывод на основании вообще абсолютно всех данных разных тестеров, которые видел, начиная с сетей 10xxx.
Ни один из них так и не указал ни одной сети более старой, которая была бы лучше более новой, за исключением 2 случаев: 1) произошёл LR дроп и эло временно упало; 2) обучение просто оказалось забагованным (как тот самый пресловутый баг с превращениями). Помимо этого абсолютно каждый первый тест укладывался в 95% погрешности с небольшой вероятностью "взбрыка" случайной сети вверх/вниз, что вполне соответствует редкому выпаданию из тех самых 95%. Более того, это "очевидно более сильные" сети у разных тестеров почему-то оказывались под разными номерами, а более сильная сеть одного тестера у другого была внизу, что вполне соответствует гипотизе о том, что это просто в одном тесте одной сети вот так повезло. И да, это логически в общем-то должно быть так, это подтверждается наблюдениями, поэтому пока не будет приведён прямой пример обратного - извините, я в обратное не поверю. А прямых примеров как-то того, нету. Более того, все кандидаты на обратные примеры при наигрывании большей статистики такими перестают быть. Конечно, тестировать всё равно нужно, но в основном чтобы баги вылавливать. |
21.06.2019, 11:53 | #3941 |
Гроссмейстер
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
|
Re: LCZero
Вот ещё есть неплохой пример.
https://nextchessmove.com/dev-builds...7d8a61911b34d5 Просто 2 одинаковых движка. +216.49 +/- 9.20 +240.27 +/- 9.55 Вот вам и 19 эло погрешности при разнице в 24, да только движки физически одинаковые в первом и втором случае. |
21.06.2019, 18:18 | #3945 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Цитата: Сообщение от Омегазеро
Обратите также внимание на условия теста - 3000 узлов на ход против 1700000 узлов на ход. Они не вызывают вопросов?
Цитата: Сообщение от Alex_Lk
Это как вообще может быть ?
Цитата: Сообщение от Vizvezdenec
разница плавно становится 3 эло и меньше, по-прежнему укладываясь в погрешность.
(если конечно те же самые дебюты,а если нет то и на все 100 Эло) Помню как то на их форуме тоже один чудак сильно этому факту удивлялся (и ему ещё не сразу удалось доходчиво объяснить, просто он проводил много тестов с большим ТС и морально очень трудно признать свой немалый труд бесполезным) |
Пользователь сказал cпасибо: | Alex_Lk (21.06.2019) |
21.06.2019, 21:22 | #3946 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от sovaz1997
Запросто. +/- не просто так существует.
|
21.06.2019, 21:44 | #3947 |
Гроссмейстер
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
|
Re: LCZero
Цитата: Сообщение от Maratka
Единственное что я не понял, так это зачем его понадобилось тестировать.
|
Пользователь сказал cпасибо: | Maratka (21.06.2019) |
21.06.2019, 22:16 | #3949 |
Гроссмейстер
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
|
Re: LCZero
Да, так и есть, автоматом все версии тестируются.
И при апдейте списка авторов +10 эло. Мы потом долго шутили, что надо бы чаще его обновлять, а то эло слабо прирастает, а это - эло на халяву. |
22.06.2019, 09:41 | #3950 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Это только мне кажется.что обучение сети 4х затормозилась?
За последние 3-е суток наиграно менее 0.8 млн. Может сеть 54х усиленно обучают? (что бы хоть к концу июля все таки начать обучать сеть 6х) |
22.06.2019, 16:13 | #3951 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от svoitsl
Это только мне кажется.что обучение сети 4х затормозилась?
|
22.06.2019, 19:39 | #3952 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Цитата: Сообщение от Maratka
а большего из 4xx вряд-ли получится выдавить.
|
22.06.2019, 21:36 | #3953 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от svoitsl
все таки кажется хотят выдавить побольше
|
23.06.2019, 10:31 | #3954 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Может кто нибудь подсказать какие там видяхи для Лилы из GTC1650/1660 в тренде?
1 Насколько лучше 1660? 2 Чем для Лилы лучше Ti? |
23.06.2019, 10:50 | #3955 |
Заблокирован
Регистрация: 07.05.2019
Сообщений: 37
Сказал(а) спасибо: 0
Поблагодарили 9 раз(а) в 9 сообщениях
Репутация: 1
|
Re: LCZero
По поводу клонов ЛСО.
Играющая сейчас AllieStein на ТСЕС в рапиде имеет от Fire ½ ½ 0, в тоже время счет у LCZero против Fire 3 - 0. И это уже не в первом турнире. Вроде бы клон, если это клон, не должен так лететь. |
23.06.2019, 10:56 | #3956 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Цитата: Сообщение от magbash
не должен так лететь.
Интересно понаблюдать за его будущем. |
23.06.2019, 13:57 | #3957 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от svoitsl
Может кто нибудь подсказать какие там видяхи для Лилы из GTC1650/1660 в тренде?
Цитата: Сообщение от svoitsl
1 Насколько лучше 1660?
Цитата: Сообщение от svoitsl
2 Чем для Лилы лучше Ti?
|
23.06.2019, 14:38 | #3959 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Да, если финансы позволяют.
Но я бы прямо сейчас не брал: через месяц nVidia выпустит обновленные платы, в результате чего придется скидывать цены на старые, и есть шанс получить совсем чуть дороже RTX 2060, которые еще раза в 2-2,5 быстрее. |
23.06.2019, 21:46 | #3960 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: LCZero
Цитата: Сообщение от svoitsl
Прошу огласить список вопросов (а то у меня нет,я правда в тестах свято блюду 1:875 )
Кроме того, это желание "блюсти" какое-то определенное соотношение при разных nps абсурдно Тестеры давно установили (публиковались соответствующие графики), что при уменьшении nps для ab и NN-движков Эло уменьшается по-разному Начиная примерно с 6000 npm Эло Лилы при пропорциональном уменьшении скорости падает гораздо быстрее Эло Стокфиша Опираясь на график, тестеры установили, что для сохранения примерного равенства Эло надо для скорости 3000 npm в 1,8 раз уменьшить скорость Стокфиша Вот отсюда и получили такое соотношение - 3000npm против 1700000npm, с которым вы почему-то не согласны. Хотя тестеры как раз пытались выбрать такое соотношение, которое на больших скоростях равнозначно по Эло для 1:1000 |
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1) | |
Опции темы | |
Опции просмотра | |
|
|