27.01.2020, 00:06 | #5191 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: LCZero
Цитата: Сообщение от Maratka
на весьма заметно бОльшую сеть для 50 ELO? Многие тут на форуме писали что будет 100, а вероятно и 200...
Нынешний принес +70 и обучение еще не закончено. Допустим, что удастся выжать всего +10 Но следующий дроп принесет еще +80 Итого +90 к сегодняшним сетям Другое дело, если существует какое-то "бревно", которое затормозит рост. Я и спрашиваю об этом |
27.01.2020, 01:39 | #5192 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от Maratka
А потому что видно, сколько сетей нужно обучить, чтобы получить +15 ELO, причем видно в динамике, по мере обучения.
И известно, сколько можно получить после снижения LR. |
27.01.2020, 01:40 | #5193 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от Омегазеро
Но следующий дроп принесет еще +80
Иначе в принципе не нужны никаких иные сети, учи себе имеющуюся до бесконечности. После следующего снижения LZ будет хорошо если 40-50, я бы рассчитывал на 30. И все. Даже если теоретически сделать еще один, то будет еще 2-3 месяца, чтобы получить 10-15 ELO. |
27.01.2020, 01:41 | #5194 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от alchemist888
И сколько? Вы эксперт по шахматным нейронным сетям?
А эксперты которые тут по осени сидели в ?опе оказались, ибо предрекали, что LZ обойдет, ну или как минимум сравняется со SF'шем к НГ. А вышло лишь догнать годичной давности версию 10. Собственно, даже сейчас текущие dev-ветки для сети 6xx недоступны: близко, но все же не то. |
27.01.2020, 01:57 | #5195 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от Maratka
По статистике видно.
Эксперты которые тут по осени сидели в ?опе оказались, ибо предрекали, что LZ обойдет, ну или как минимум сравняется со SF'ша к НГ. А вышло лишь догнать годичной давности версию 10. Я конечно далеко не эксперт, но вот в начале ноября того года давал такой прогноз. Как видим, T60 прогрессирует даже несколько быстрее, чем я ожидал. |
27.01.2020, 02:12 | #5196 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от alchemist888
Как видим, T60 прогрессирует даже несколько быстрее, чем я ожидал.
А Вы много таких тестов видели? Цитата: Сообщение от alchemist888
На видеокартах серии RTX и контроле 10+5 и выше.
А вижу я лишь балавство: на минутных контролях, да на выкрученных под эти контроли настройках движков, в количествах, измеряемых сотнями партий. |
27.01.2020, 02:19 | #5197 |
Гроссмейстер
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
|
Re: LCZero
Кстати говоря, новые сети пока не лечат проблему проигранных псевдокрепостей против ферзя.
Т.е. они иногда грамотно против SF убегают на ничью в позиции типа "ладья + конь/слон против ферзя", а иногда неграмотно убегают в такие позиции, которые проигрываются. Только что на стриме Mark Young видел, как последняя (одна из) 60-х сетей в такой эндшпиль ушла и радостно показывала +1.2 для противника, пока SF рисовал +7.5. |
27.01.2020, 02:22 | #5198 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Ну там таблицы вероятно еще значение имеют, SF то набирает глубины в разы выше, и попаданий в таблицы потому у него на порядки больше, чем у LZ.
А подобные эндшпили просчитаны уже давно... |
27.01.2020, 02:44 | #5199 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от Maratka
Может где посмотреть есть, с достаточным количеством партий, хотя бы тысяч пять-десять?
А вижу я лишь балавство: на минутных контролях, да на выкрученных под эти контроли настройках движков, в количествах, измеряемых сотнями партий. |
27.01.2020, 10:21 | #5201 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: LCZero
Цитата: Сообщение от alchemist888
Вы наверное не понимаете назначение большого количества партий. 5000 партий нам пригодятся, если мы хотим выяснить разницу между движками с доверительным интервалом +/- 7 Elo. Однако, если одни движок превосходит другого на 30 Elo, то в большинстве случаев хватит и 500 партий.
Доверительный интервал для n партий рассчитывается как удвоенная стандартная ошибка среднего, потому что сама величина Эло является выборочным средним. Стандартная ошибка среднего вычисляется как дисперсия, деленная на корень квадратный из n. Цифра 7 Elo для 5000 партий - это удвоенное среднеквадратничное отклонение Чтобы узнать доверительный интервал, нам нужно поделить 7 Эло на корень квадратный из 5000, деленных на 2. В результате мы получаем 0,2 Эло Таким образом, на таком большом числе партий доверительный интервал близок к нулю И ошибка Эло целиком и полностью определяется выбором дебютов. Достаточно посмотреть результаты тестов, чтобы это понять. Число партий - Эло - удвоенная сигма 2464 -36.0 - 10.0 5060 -35.0 - 7.3 5799 -34.4 - 6.6 6006 -34.3 - 6.5 6346 -33.7 - 6.3 8156 -32.7 - 5.4 10285 -33.3 - 5.0 Если бы величина справа была доверительным интервалом, разве Эло колебалось бы с размахом в 10 раз меньше? |
27.01.2020, 10:58 | #5202 |
Эксперт
Регистрация: 07.06.2016
Сообщений: 5,907
Сказал(а) спасибо: 13,814
Поблагодарили 12,717 раз(а) в 4,521 сообщениях
Репутация: 726
|
Re: LCZero
Цитата: Сообщение от Alex_Zet
АВ перестают существовать. Точнее они конечно остаются, но прозябая без надобности, смысла в них никакого. Совсем никакого. Цитата: Сообщение от Viktor
И всё пиарство в одном духе. Хоть бы уж разнообразили и увидели "бревно", раз "соринки" замечаете.
Цитата: Сообщение от Омегазеро
Виктор говорит, что сторонники Лилы не видят "бревно в глазу", то есть ни 1000 сетей, ни снижение LR не позволят вырасти Лиле еще хотя бы на 30 Эло
Цитата: Сообщение от Viktor
Про какое "бревно" разговор?
Цитата: Сообщение от Омегазеро
https://forchess.ru/showpost.php?p=1...postcount=2068
По факту сети 24-320 уже превзошли сети 20-256 За 44 миллиона игр они обучились сильнее примерно на 50 Эло Посмотрите предысторию. Я применил выражение "про бревно в глазу" в ответе на "Сообщение от Alex_Zet". И оно не имеет никакого отношения к проекту Лилы, а только к Alex_Zet! Почитайте, что он там писал и вы с этим согласны? Если бы не было А-В движков, то не существовало бы сейчас и Лилы. А дальше развивать мысль - это бред какой-то. Я же не программист и не имею понятия спорить "со спецами" и, кстати, проект уважаю. Но как практик-шахматист отдаю предпочтение Стокфишу по одной простой причине (и об этом неоднократно уже писал!) - Лила непргодна для анализа в Аквариуме как основной движок (только как вспомогательный!). |
27.01.2020, 18:54 | #5203 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от Maratka
А один превосходит другого на 30 ELO?
+54 -24 =322 => 0.5375 ~ 26.25 ELO diff Вот результаты SF против T60 и LS +44 -52 = 304 =>0.49 ~ -7 ELO diff Общий ELO diff около 33 ELO. Так что нам еще бы сотню-другую партий сыграть, и скорее всего все определится К тому же не забывайте, что кроме точной разницы в ELO, которую можно получить только на очень большой выборке, существуют еще и вероятности того, что один движок лучше другого в данных условиях. И по результатам CCCC12 получилась почти 100% вероятность, что T60 сильнее SF11 в контроле 1+1 (и кондициях CCCC). Что касается специальных настроек и прочего. Бинарник - это часть движка, и за счет него сеть может раскрыться значительно лучше. Если у Лилы бинарник позволяет гибко настроить её под разные мощности и TC, то в чем собственно проблема? Ну и что с того, что автор LS? К слову, разрабы SF тоже постоянно тюнят разные параметры + подстраивают contempt под разные пулы соперников. |
27.01.2020, 19:07 | #5204 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от alchemist888
И по результатам CCCC12 получилась почти 100% вероятность, что T60 сильнее SF11 в контроле 1+1 (и кондициях CCCC).
|
27.01.2020, 19:09 | #5205 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от alchemist888
Что касается специальных настроек и прочего. Бинарник - это часть движка, и за счет него сеть может раскрыться значительно лучше. Если у Лилы бинарник позволяет гибко настроить её под разные мощности и TC, то в чем собственно проблема?
Это тест показывает, насколько хорошо сеть со своим движком при дОлжных настройках движка играют на таком-то контроле. |
27.01.2020, 19:13 | #5206 |
2 разряд
Регистрация: 14.02.2019
Сообщений: 311
Сказал(а) спасибо: 0
Поблагодарили 149 раз(а) в 107 сообщениях
Репутация: 10
|
Re: LCZero
Еще раз: для каждой сети есть свои оптимальные настройки. Только сети близкие по номерам можно сравнивать на одном бинарнике. А настолько разные, как T60 и LS - нельзя.
|
Пользователь сказал cпасибо: | alchemist888 (27.01.2020) |
27.01.2020, 19:18 | #5207 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
|
2 пользователя(ей) сказали cпасибо: | alchemist888 (27.01.2020), Viktor (27.01.2020) |
27.01.2020, 19:20 | #5208 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от Neofelis
Еще раз: для каждой сети есть свои оптимальные настройки. Только сети близкие по номерам можно сравнивать на одном бинарнике. А настолько разные, как T60 и LS - нельзя.
|
27.01.2020, 19:24 | #5209 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от Neofelis
Еще раз: для каждой сети есть свои оптимальные настройки. Только сети близкие по номерам можно сравнивать на одном бинарнике. А настолько разные, как T60 и LS - нельзя.
Кто их сравнил? Где результаты теста на одинаковых настройках? |
27.01.2020, 19:29 | #5210 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от Maratka
А кто сказал, что нельзя?
Кто их сравнил? Где результаты теста на одинаковых настройках? |
27.01.2020, 19:30 | #5211 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от alchemist888
Более того, определенно существуют оптимальные настройки для разного железа и контроля времени.
|
27.01.2020, 19:31 | #5212 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от alchemist888
А не очевидно? Сети работают на разных скоростях => что для одной сети блиц, то для другой буллет.
|
27.01.2020, 19:35 | #5213 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Цитата: Сообщение от Maratka
Собственно, даже сейчас текущие dev-ветки для сети 6xx недоступны: близко, но все же не то.
Все таки немного превышает и даже с запасом, даже если он и обнулится то все равно неплохо (если что, Стокфиш за 21.01.2020) Цитата: Сообщение от Омегазеро
Если бы величина справа была доверительным интервалом, разве Эло колебалось бы с размахом в 10 раз меньше?
|
27.01.2020, 19:50 | #5214 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от svoitsl
Все таки немного превышает и даже с запасом
Что же до собственно SF'ша, то играется тут по сути то начальная позиция, в которой запрещены рокировки, так что если SF займет третье место - это будет вполне ожидаемо. Последний раз редактировалось Maratka; 27.01.2020 в 20:34. |
27.01.2020, 20:45 | #5215 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от Maratka
Не очевидно. Ибо одна из них уперлась в два RTX, а вторая что-то там вытягивает и из трех, может и четырех.
|
27.01.2020, 21:11 | #5217 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от AlphaZero
А что будет к концу обучения? Лила достигнет уровня 32-фигурных таблиц?
|
27.01.2020, 21:14 | #5218 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Цитата: Сообщение от AlphaZero
Лила достигнет уровня 32-фигурных таблиц?
Но зато уровень игры возрастет и смотреть турнир будет интетеснее |
27.01.2020, 21:16 | #5219 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Омегазеро, возможно то что Вы пишете про расчеты правильно, однако, чтобы разобраться в этом мне необходимо посмотреть формулы расчета Elo, Elo error в ordo, а также немного подтянуть знания в математике.
Большинство тестовых площадок используют Elo error от ordo, и если Ваш анализ верен, то получается, что они все ошибаются, и выдают не те значения которые нужны. |
27.01.2020, 21:17 | #5220 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от alchemist888
Нет, она поймет, что решать шахматы не имеет смысла и примется за нас.
Смех смехом, а тенденция имеет быть: кто-то когда-то написал самообучающийся движок в шахматы. Кто-то напишет для домино, шашек, или игры в дурака. После чего неизбежно найдется кто-то, кто захочет объединить, вывести общие принципы (с учетом рандома в домино и картах), и создаст некий самообучающийся движок уровня n+1, где n - понимание лишь одной конкректной задачи. Ну вот она и сингулярность на горизонте замаячила, ибо найдется еще 10 человек, которые напишут движки для игры в нарды, а кто-то - для поиска заболевания по симптомам. И их тоже кто-то объединит. А потом объединят первый объединенный ИИ со вторым, и получат n+2 |
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1) | |
|
|