Forchess - форум о заочных шахматах  

Вернуться   Forchess - форум о заочных шахматах > Заочные турниры и партии > Шахматные программы и движки

Ответ
 
Опции темы Опции просмотра
Старый 25.07.2019, 08:27   #4201
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от Vizvezdenec
У меня сейчас вот патч на фиштесте идёт
Total: 44 W: 11 L: 4 D: 29
Думаю пулл реквест создавать, в конце концов перформанс +56 эло.
Это особенность тестов аб-движков, о которой все знают
Омегазеро вне форума   Ответить с цитированием
Старый 25.07.2019, 08:32   #4202
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Нету никакой "особенности тестов АВ-движков".
Нету и быть не может.
Есть статистически значимые результаты, а есть "серию из 20 игр провёл хуже - значит хуже".
И неважно, АВ это движок, нейросеть или он переворачивает доску во время игры.
Vizvezdenec вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
sovaz1997 (25.07.2019)
Старый 25.07.2019, 11:18   #4203
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
Вот только в тесте mattblaches у сети 42802 после 23 игр ни одной победы и два поражения...
При этом я верю, что на скорости 10 узлов/ход сеть может лидировать
Даже у Карлсена скорость 30 узлов/ход
После 23 игр вообще не надо ничего сравнивать. И после 50. И после 100. Слишком мало партий. 10 узлов/ход и 4000 партий хотя бы как-то отражают действительность. Надо запустить с большим числом узлов на ход и сравнить.
Это статистика и +- просто взять и убрать нельзя. А если кажется, что 23 игр достаточно для определения сильнейшего, то это всего лишь переоценка маленькой выборки: https://en.m.wikipedia.org/wiki/Inse...to_sample_size
sovaz1997 вне форума   Ответить с цитированием
Старый 25.07.2019, 12:26   #4204
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
Конечно!
Сеть 42731 после 25 игры выигрывала 6:1
Я же выкладывал эмулятор бросания монетки:
https://yadi.sk/d/t1tXoyl0lWzWYQ

400 партий, результат случайный, по алгоритму вида:
Код:
Randomize Timer

Dim i, a, b, z As Single

For i = 1 To 400
z = Rnd 

If z < 0.5 Then
a = a + 1
Else
b = b + 1

Next


Dim aa, bb As String
aa = a
bb = b

MsgBox aa + "/" + bb
В итоге, каждая 10-15 партия 180/220 или даже 175/225. Ну либо 220/180. А 200/200 бывает вообще очень редко.
Maratka вне форума   Ответить с цитированием
Старый 25.07.2019, 12:39   #4205
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Чуть модифицировал, теперь можно ввести любое разумное количество:

https://yadi.sk/d/mgg0Jaxy1IDwqg

Сравните типичное отклонение в процентах от половины введенного числа при 100 партиях и 100 тыс. партиях.
Maratka вне форума   Ответить с цитированием
Старый 25.07.2019, 12:47   #4206
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Я и без модели могу сказать, что оно обратно пропорционально корню из числа партий, университетский курс теорвера я ещё не забыл.
Vizvezdenec вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Maratka (25.07.2019)
Старый 25.07.2019, 12:49   #4207
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Ну "пощупать" то всегда интереснее
А то вдруг в теории ошибка :D
Maratka вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
svoitsl (25.07.2019)
Старый 25.07.2019, 19:54   #4208
svoitsl
Гроссмейстер
 
Аватар для svoitsl
 
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
По умолчанию Re: LCZero

кстати всего за неделю обучили 55 сеть и начали учить 56-ю.
Работа не останавливается не на минуту :-)

Начался тест новой сети- рост впечатляет!!!
svoitsl вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
byan_mivv (25.07.2019)
Старый 26.07.2019, 00:08   #4209
Kesandr
3 разряд
 
Аватар для Kesandr
 
Регистрация: 28.06.2018
Сообщений: 191
Сказал(а) спасибо: 239
Поблагодарили 87 раз(а) в 54 сообщениях
Репутация: 16
По умолчанию Re: LCZero

Ух как после 42832 до 42842 на данний момент последняя самоело Лили сети взлетело.https://lczero.org
Kesandr вне форума   Ответить с цитированием
Старый 26.07.2019, 09:27   #4210
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от Vizvezdenec
И неважно, АВ это движок, нейросеть или он переворачивает доску во время игры.
Почему ваша ненависть направлена именно против Лилы?
Ненавидьте Брейнфиш!
Он уже на 45 Эло опережает Стокфиш https://forchess.ru/showpost.php?p=101216&postcount=49

Пишите, что это наглый клон, что 45 Эло ошибка статистики

А иначе получается, что Брейнфиш лучший в мире движок, которого незаконно не допускают до соревнований!
Омегазеро вне форума   Ответить с цитированием
Старый 26.07.2019, 11:28   #4211
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Моя ненависть?
Что?
Моя ненависть направлена на тех, кто делает с невероятным апломбом утверждения на базе 40 партий. Делали бы их про Комодо или SF - было бы то же самое.
Причём эти утверждения уже бились фактами не раз и не два и не только мной, но каждый раз как заново.
Vizvezdenec вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
sovaz1997 (26.07.2019), Viktor (26.07.2019)
Старый 26.07.2019, 11:43   #4212
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Вообще, есть много хороших тестов: тот же sp-cc (в данный момент там 3000 партий на движок наигрывается). Зачем смотреть на тесты mattblachess из 100 партий? Это простая трата ресурсов без особого смысла.

Есть один тестер, который выступает против всех тестеров с оборудованием, которое хуже, чем у него (2950x, 2080 Ti): mwyoung. Свои же тесты из 42 партий на движок считает нормальными. А ведь на подобном оборудовании можно нормально параллельно тестировать, как sp-cc, не каждую 5-ю сеть, а каждую 50-100-ю, причем делать это в несколько раз быстрее для разного контроля времени.

--------

Еще одна ошибка - выбирать тесты с лучшим результатом из нескольких. Это будет статистически неверно.
sovaz1997 вне форума   Ответить с цитированием
Старый 26.07.2019, 11:48   #4213
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Ну Stefan Pohl уже понабивал шишек с короткими тестами, поэтому что-то знает про то, как обманчиво они выглядят зачастую.
Но Лила привлекла очень много людей, которые не только не имеют опыта, но ещё и отрицают весь опыт других людей, т.к. "это у нас нейросеть, а не какая-то там альфабета, новый подход, а вы все - узколобые ретрограды и несёте чушь".
Ну а потом получается то, что получается.
Vizvezdenec вне форума   Ответить с цитированием
4 пользователя(ей) сказали cпасибо:
Kesandr (26.07.2019), Maratka (26.07.2019), sovaz1997 (26.07.2019), Viktor (26.07.2019)
Старый 26.07.2019, 11:53   #4214
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от Vizvezdenec
Ну Stefan Pohl уже понабивал шишек с короткими тестами, поэтому что-то знает про то, как обманчиво они выглядят зачастую.
Но Лила привлекла очень много людей, которые не только не имеют опыта, но ещё и отрицают весь опыт других людей, т.к. "это у нас нейросеть, а не какая-то там альфабета, новый подход, а вы все - узколобые ретрограды и несёте чушь".
Ну а потом получается то, что получается.
Вообще да, ощущение, что сейчас раз в 10 больше любителей именно компьютерных шахмат появилось)
Кстати, у меня тоже было такое очень давно: я запустил Komodo против Stockfish, Komodo выиграл +2 -0 =8)) Я тогда думал, что Komodo сильнее))
Потом, когда своим движком занялся, тестировал его, все изменилось, конечно.
sovaz1997 вне форума   Ответить с цитированием
3 пользователя(ей) сказали cпасибо:
Alex_Lk (26.07.2019), Rom77 (26.07.2019), Viktor (26.07.2019)
Старый 26.07.2019, 11:59   #4215
Rom77
Мастер
 
Аватар для Rom77
 
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
По умолчанию Re: LCZero

Цитата: Сообщение от sovaz1997
Кстати, у меня тоже было такое очень давно: я запустил Komodo против Stockfish, Komodo выиграл +2 -0 =8)) Я тогда думал, что Komodo сильнее))
Я начинал с шестнадцати партий Рыбки 2.3.2 против Хиаркс
Rom77 вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
Александр (26.07.2019), Виталий В. (26.07.2019)
Старый 26.07.2019, 12:02   #4216
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Vizvezdenec
Моя ненависть направлена на тех, кто делает с невероятным апломбом утверждения на базе 40 партий. Делали бы их про Комодо или SF - было бы то же самое.
Причём эти утверждения уже бились фактами не раз и не два и не только мной, но каждый раз как заново.
Кстати, SF по весне проиграл в полуфинале кубка Houdini. Вывод очевидный: Houdini сильнее
Maratka вне форума   Ответить с цитированием
Старый 26.07.2019, 14:31   #4217
Neofelis
2 разряд
 
Аватар для Neofelis
 
Регистрация: 14.02.2019
Сообщений: 311
Сказал(а) спасибо: 0
Поблагодарили 149 раз(а) в 107 сообщениях
Репутация: 10
По умолчанию Re: LCZero

Этот день настал.

Цитата:
Test40: Has stopped.
Test60: Starting with these parameters.
model:
filters: 320
residual_blocks: 24
se_ratio: 10
Neofelis вне форума   Ответить с цитированием
5 пользователя(ей) сказали cпасибо:
Maratka (26.07.2019), Rom77 (26.07.2019), sovaz1997 (26.07.2019), svoitsl (26.07.2019), Виндхук (26.07.2019)
Старый 26.07.2019, 14:44   #4218
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Ну собственно уже достаточно давно было понятно, что 20*256 на пределе.
А та, которую сейчас запустили тренироваться будет раза в два медленнее. Учитывая, что 4xx "училась" более полугода, новой потребуется год для игры на +/- том же уровне.

Теперь что важно - найти лучшую из 4xx, ибо она - надолго.
Maratka вне форума   Ответить с цитированием
Старый 26.07.2019, 14:48   #4219
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Maratka, на том же уровне, возможно, и меньше времени (думаю, месяца за 4-5).
sovaz1997 вне форума   Ответить с цитированием
Старый 26.07.2019, 14:51   #4220
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Не-а.
Тут особенность то в чем: сырой интеллект сети - это одно, а сила практической игры, с учетом конечности скорости вычислений - другое. Потому новую сеть нужно прокачать до уровня заметно выше, чем 4xx, дабы в реальности она хотя бы не уступала, т.к. с новой сетью вычисления будут идти заметно медленнее.
Maratka вне форума   Ответить с цитированием
Старый 26.07.2019, 15:01   #4221
Neofelis
2 разряд
 
Аватар для Neofelis
 
Регистрация: 14.02.2019
Сообщений: 311
Сказал(а) спасибо: 0
Поблагодарили 149 раз(а) в 107 сообщениях
Репутация: 10
По умолчанию Re: LCZero

Там поменялось абсолютно все: размер сети, архитектура сети, параметры обучения, параметры генерации тренировочных партий и т.д.
Сейчас обучение идет намного быстрее.
Neofelis вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
sovaz1997 (26.07.2019)
Старый 26.07.2019, 15:33   #4222
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Ну посмотрим...
Maratka вне форума   Ответить с цитированием
Старый 26.07.2019, 18:05   #4223
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Цитата: Сообщение от sovaz1997
Вообще да, ощущение, что сейчас раз в 10 больше любителей именно компьютерных шахмат появилось)
Кстати, у меня тоже было такое очень давно: я запустил Komodo против Stockfish, Komodo выиграл +2 -0 =8)) Я тогда думал, что Komodo сильнее))
Потом, когда своим движком занялся, тестировал его, все изменилось, конечно.
Я ещё веселее помню, кто-то писал что-то вроде "запустил Стокфиш 9 против Стокфиша 8, 2 партии сыграли, обе ничьи, так и не понял, где же он лучше".
Vizvezdenec вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
sovaz1997 (26.07.2019), Viktor (26.07.2019)
Старый 26.07.2019, 19:42   #4224
svoitsl
Гроссмейстер
 
Аватар для svoitsl
 
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
Ну посмотрим...
на отличия в переводе Гугла
Цитата:
Остаточный размер башни составляет 320х24 (24 блока, 320 фильтров).
Глава политики - в стиле AlphaZero (8 × 8 × 73 вместо простого вектора 1858 года).
Значение головы WDL.
Вместо того, чтобы использовать фиксированные узлы для каждого движения во время обучения, вместо этого используется порог KLD (думайте меньше в очевидных случаях, думайте больше в сложных случаях, но в среднем он остается примерно таким же, как был).
Нелегальные шаги скрываются от главы политики, поэтому нейронной сети не нужно учиться обнаруживать легальные шаги самостоятельно.
Вместо того, чтобы тренировать ценность, голова только на исходе игры {-1; 0; 1}, часть значения Q дерева после добавления хода.
Использование разных FPU в корне против остального дерева.
авторство Crem
Если кому то и без Гугла все ясно,то блог
svoitsl вне форума   Ответить с цитированием
Старый 26.07.2019, 19:50   #4225
svoitsl
Гроссмейстер
 
Аватар для svoitsl
 
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
По умолчанию Re: LCZero

Несмотря на то,что эра закончилась, в ней нам жить ещё минимум полгода

Однако думается, что попытки усиления игры на этом не остановятся.
И сеть наверное усилят (для чего то ведь тестировали 49 сеть) на дебютах
И может и будет время заняться движком.
Да и много других вариантов может появиться.
svoitsl вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
alchemist888 (26.07.2019)
Старый 26.07.2019, 20:57   #4226
Corrs
Гроссмейстер
 
Аватар для Corrs
 
Регистрация: 04.04.2019
Сообщений: 2,306
Сказал(а) спасибо: 2,100
Поблагодарили 2,294 раз(а) в 1,175 сообщениях
Репутация: 240
По умолчанию Re: LCZero

Всё, можно уверенно юзать вместо 32930?
Corrs вне форума   Ответить с цитированием
Старый 26.07.2019, 21:06   #4227
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Corrs
Всё, можно уверенно юзать вместо 32930?
Ее уже месяца три как можно использовать.
Maratka вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
sovaz1997 (26.07.2019)
Старый 26.07.2019, 21:07   #4228
svoitsl
Гроссмейстер
 
Аватар для svoitsl
 
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
По умолчанию Re: LCZero

Цитата: Сообщение от Corrs
можно уверенно юзать вместо 32930?
вот только не известно конкретно какую сеть, да и наверняка будет и посильнее скоро (на 10-15 Эло).

А юзать уже можно было начиная с 610, вместо 32930,она кажется на 25 Эло была сильнее (или даже на 40,сейчас точно не помню)

фраза из блога
Цитата:
Если мы обнаружим улучшения во время обучения test60, вполне вероятно, что они будут включены в середине процесса обучения.
кажется косвенно свидетельствует,что все что можно сделать для обучения сети в этот раз будет сделано.
Интересно, кто как думает, насколько сильнее она окажется 40 сети (и текущего движка)
Моё предположение, что на 100-150 Эло
svoitsl вне форума   Ответить с цитированием
Старый 26.07.2019, 21:51   #4229
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от svoitsl
Моё предположение, что на 100-150 Эло
Важнее не на сколько, а как скоро: с практической точки зрения пользы от сети с +150, которая появится через три года меньше, чем от +30 через шесть месяцев.
Maratka вне форума   Ответить с цитированием
Старый 26.07.2019, 22:13   #4230
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: LCZero

svoitsl, а я тоже хотел предположить. Тоже 100-150, думаю)
sovaz1997 вне форума   Ответить с цитированием
Ответ


Здесь присутствуют: 7 (пользователей: 0 , гостей: 7)
 

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 04:24. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.7
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
Рейтинг@Mail.ru