Развернуть для просмотра

Омегазеро · 04.10.2020, 04:28

Цитата: Сообщение от Maratka

Ну и... Посмотрел.
SF согласно Вашим данным за месяц набрал 39 Elo в сравнении с LZ.

Вы опять издеваетесь или у вас проблемы со зрением?
Какой месяц?
Сравнивается Сток от 26 августа 2019 года и от 27 сентября 2020 года
Разница - ГОД И ОДИН МЕСЯЦ!

Цитата: Сообщение от Maratka

там резко было около 70 Elo. Так что вполне можно говорить, что набралось таки 150 Elo, и это без разницы, против кого мерить.

Полный бред. Есть огромная разница, против кого мерять
Если вам недостаточно тестов Гийома Леблана, то вот тест mattblachess. Тут меньше партий и меньше точность, но порядок цифры подтверждается

lczero0.26-J92-100 сильнее Стокфиш-11 на 50 Эло
lczero0.26-J92-100 слабее Стокфиш-12 на 15 Эло

Таким образом, Стокфиш-12 сильнее Стокфиш-11 всего на 65 Эло. Никаких 150 Эло нет и близко

Обратите внимание, что написал mattblachess по итогам своего теста, обнаружив, что он полностью противоречит данным о росте Стокфиша на 130 Эло

SF-рейтинг Стокфиша неверный!
То есть самоЭло Стокфиша бредовое и не имеет никакого отношения к реальности

Maratka · 04.10.2020, 12:34

Цитата: Сообщение от Омегазеро

Вы опять издеваетесь или у вас проблемы со зрением?
Какой месяц?
Сравнивается Сток от 26 августа 2019 года и от 27 сентября 2020 года
Разница - ГОД И ОДИН МЕСЯЦ!

Пусть так. А теперь расскажите мне, как SF, набирая 39 Elo за год и один месяц, ухитряется держать паритет против LZ, у которого обычное дело:

Цитата: Сообщение от Омегазеро

рост на 22 Эло всего за неделю. Посмотрим, что будет дальше

Даже если эти 22 Elo в неделю -это непонятный всплеск, и реально LZ растет на порядок медленнее, то это все одно 114 Elo в год (не в год и месяц).

И да, у меня действительно проблемы со зрением.
Я вот пялюсь в эту табличку:

И никак не могу не то что найти контроль и оборудование, на котором делались замеры, но и просто увидеть цифры и буквы. Слишком оно мелковатое для меня.
Покрупнее нет?

AlphaZero · 04.10.2020, 13:26

Цитата: Сообщение от Viktor

v0.26.3-RC2
https://github.com/LeelaChessZero/lc0/releases

Поддержка более чем 64-ёх ядер? Ну наконец-то! Ждал.. Да.. Ждал с нетерпением..

Alvir · 04.10.2020, 17:09

Цитата: Сообщение от Maratka

Я вот пялюсь в эту табличку:

И никак не могу не то что найти контроль и оборудование, на котором делались замеры, но и просто увидеть цифры и буквы. Слишком оно мелковатое для меня.
Покрупнее нет?

Тут оригинал:
https://docs.google.com/spreadsheets...#gid=207181789

Омегазеро · 04.10.2020, 17:56

Цитата: Сообщение от Maratka

обычное дело

Цитата: Сообщение от Maratka

Даже если эти 22 Elo в неделю -это непонятный всплеск

Maratka! Ну не могу я поверить, что вы НЕ ЧИТАЛИ пост, на который я давала ссылку
Там же ясно написано - 22 Elo в неделю ПОСЛЕ LR-дропа
А перед этим за четыре месяца было всего +6.5 Эло

Вот так развивается Лила - сначала застой, потом скачок после LR-дропа, затем опять застой

Цитата: Сообщение от Maratka

набирая 39 Elo за год и один месяц

Поскольку там фиксированное число узлов, необходима поправка на отношение скоростей (оно отличается в этих тестах)
Если верить Вызвезденцу, надо добавить еще 45-50 Эло, итого 84-90 Эло

А Лила, судя по опубликованному графику, за год выросла примерно на 75 - если сравнивать нынешние сети с прошлогодними 256x20

Омегазеро · 04.10.2020, 17:58

Опубликованы тесты скоростей Лилы на новых RTX-картах в сравнении со старыми 2080

lczero 0.26.3-rc2 benchmark --cuda-fp16 384x30-t60-4619.pb.gz --num-positions=1 (начальная позиция)

RTX 2080 Ti - 320x24 = 21073 nps
RTX 2080 Ti - 384x30 = 13278 nps
RTX 2080 Super - 384x30 = 14915 nps

RTX 3080 FYI - 384x30 = 23222 (+75%)

RTX 3090 - 320x24 = 47636 nps (+126%)
RTX 3090 - 384x30 = 30591 nps (+130%)

Maratka · 04.10.2020, 18:26

Цитата: Сообщение от Омегазеро

Поскольку там фиксированное число узлов, необходима поправка на отношение скоростей (оно отличается в этих тестах)

Тогда вообще не нужно их сравнивать, ибо бесполезно, фискированное количество узлов против короткого (но таки гибкого) контроля, где движок сам решает, когда ему делать ход.

Цитата: Сообщение от Омегазеро

Там же ясно написано - 22 Elo в неделю ПОСЛЕ LR-дропа
А перед этим за четыре месяца было всего +6.5 Эло

Тогда понятно.
Но эти 22 Elo ничто в сравнении с сотней, которую набрал SF после того, как тоже получил сетевую оценку - первое.
Второе - он тоже набирает за счет сетей, в частности буквально неделю назад как раз за счет чуть измененного алгоритма обучения - 4 Elo.

Однако у Fish'а есть еще и собственно движок, который тоже дает вполне себе прилично, где-то полста Elo в год без оценки.

Так что я не знаю, о чем тут спорить. Лучше бы я посмотрел на результаты Ваших тестов, которых почему-то нет с конца июля.
Интересно было бы сравнить с теме сетями LZ, которые были на тот самый конец июля - раз, и текущей сетью - два.

Переяслав · 04.10.2020, 18:57

Цитата: Сообщение от Омегазеро

RTX 3090 - 384x30 = 30591 nps

круто.
на моей 1060 с --num-positions=1 дает 1291

svoitsl · 04.10.2020, 19:02

Цитата: Сообщение от Maratka

который тоже дает вполне себе прилично, где-то полста Elo в год без оценки.

точно без оценки?
раньше вроде было с оценкой,или я что то путаю?

Maratka · 04.10.2020, 19:21

Так оценки там 10-20% от общего веса патчей.

Омегазеро · 05.10.2020, 04:59

Новая сеть от jhortos https://storage.lczero.org/files/net...ontrib/J92-240

При ее тренировке использовались игры после снижения LR, когда сила Лилы подскочила на 22 Эло

Правда, пока таких результатов нет. Мне кажется, что в связи со снижением LR надо было поменять параметры тренировок, а jhortos гонит со старыми параметрами. Это ошибка

Цитата: Сообщение от Maratka

Но эти 22 Elo ничто в сравнении с сотней, которую набрал SF после того, как тоже получил сетевую оценку

Во-первых, сотня, которую набрал SF - это самоЭло
Если бы это Эло было реальностью, SF бы обогнал Лилу не менее чем на 65 Эло
А теперь посмотрите на результаты суперфинала TCEC-19 и скажите - похоже, чем SF на 65 Эло сильнее Лилы?

Во-вторых, игры после LR-дропа не использовались при тренировке сети, которая сейчас играет в TCEC. То есть прибавка в 22 Эло - это резерв для дальнейших тренировок Лилы

alchemist888 · 05.10.2020, 05:14

Цитата: Сообщение от Омегазеро

При ее тренировке использовались игры после снижения LR, когда сила Лилы подскочила на 22 Эло
Правда, пока таких результатов нет. Мне кажется, что в связи со снижением LR надо было поменять параметры тренировок, а jhortos гонит со старыми параметрами. Это ошибка

- LR дроп дает больше тому, у кого он происходит. Все финальные сети jhorthos имели последний LR drop для своих сетей, и неважно на какой LR был у тренировочных игр. То есть, если и реально у T60 был скачок на 22 Elo, то он в любом случае был бы размазан многоступенчатой структурой обучения.
- Нет веских оснований считать, что сила T60 подскочила на 22 Elo. Во-первых последние LR снижения никогда столько Elo нативным сетям не давали. А во-вторых взяты замеры между двумя сетями, одна из которых могла быть неудачной, а вторая удачной. Плюс контроль ультракороткий 1500 nodes/move. Сколько там Elo в реальных условиях никому не известно. Кстати, именно это и основная причина того, что в более-менее длинных контролях SFdev едва-ли покажет 150 Elo разницу с SF11, а не то, что, как Вы считаете, тестирование идет неправильно.
- Алгоритмы обучения у опытных ребят типа jhorthos и Sergio постоянно меняются. В этом поиске время от времени находятся хорошие прорывы. Безапелляционно говорить, что они ошибаются в параметрах обучения сетей - это как минимум пустой критицизм, а как максимум невежественно и грубо.

Maratka · 05.10.2020, 12:49

Цитата: Сообщение от Омегазеро

А теперь посмотрите на результаты суперфинала TCEC-19 и скажите - похоже, чем SF на 65 Эло сильнее Лилы?

А дебюты Вы смотрели? когда они +0,3 с раздачи, слабейший достаточно легко парирует, когда 1,2 с раздачи - обычно проигрывает. Нет хороших игровых дебютов, где было бы 0,7-0,9, которые можно было бы играть на ничью и на победу.

Ну и в целом, на TCEC'е уже тесты проводят?
Когда первые тысяч пятьдесят-сто партий наиграли движок А против движка Б, в каком году?

И еще раз попрошу, выложите Ваши тесты SF vs LZ.
Те самые, которые Вы выкладывали раз-два в неделю в течении около года до выхода NN-версии SF, и прекратились сразу после ее выхода.
Тесты SF той версии, которая сразу после появления сетевой оценки против тогдашней версии LZ и его сети, и современный SF и LZ с современными же сетями.

Maratka · 05.10.2020, 12:54

Цитата: Сообщение от alchemist888

- Нет веских оснований считать, что сила T60 подскочила на 22 Elo. Во-первых последние LR снижения никогда столько Elo нативным сетям не давали. А во-вторых взяты замеры между двумя сетями, одна из которых могла быть неудачной, а вторая удачной.

Барышня пишет, что это не самоЕло. Т.е. тогда это ни одна сеть LZ против другой сети LZ, а что-то иное.

Цитата: Сообщение от alchemist888

Сколько там Elo в реальных условиях никому не известно. Кстати, именно это и основная причина того, что в более-менее длинных контролях SFdev едва-ли покажет 150 Elo разницу с SF11, а не то, что, как Вы считаете, тестирование идет неправильно.

Ну так это любой движок так покажет. SF11 тоже не на 50 ELo сильнее 10-й версии на часовом контроле. А у текущей версии LZ никогда не будет 22 Elo.

alchemist888 · 05.10.2020, 16:37

Цитата: Сообщение от Maratka

Барышня пишет, что это не самоЕло. Т.е. тогда это ни одна сеть LZ против другой сети LZ, а что-то иное.

Там тестировались две сети T60 через Стокфиш 19082608. Одна из них с последним LR, другая из них с более высоким. Разница в датах между ними примерно месяц. Это я и имел ввиду, говоря что взяты замеры между двумя сетями.
https://forchess.ru/showpost.php?p=1...postcount=6941

alchemist888 · 05.10.2020, 20:50

Цитата: Сообщение от Омегазеро

Опубликованы тесты скоростей Лилы на новых RTX-картах в сравнении со старыми 2080
lczero 0.26.3-rc2 benchmark --cuda-fp16 384x30-t60-4619.pb.gz --num-positions=1 (начальная позиция)
RTX 2080 Ti - 320x24 = 21073 nps
RTX 2080 Ti - 384x30 = 13278 nps
RTX 2080 Super - 384x30 = 14915 nps

Интересно, как RTX 2080 Super смогла прилично превзойти 2080 TI в данном замере?

Омегазеро · 05.10.2020, 22:23

Цитата: Сообщение от alchemist888

Безапелляционно говорить, что они ошибаются в параметрах обучения сетей - это как минимум пустой критицизм, а как максимум невежественно и грубо

Невежественно утверждать, что параметры обучения всегда оптимальны

Потому что их можно подобрать только экспериментально, теория в лучшем случае может подсказать только общее направление поиска

Поэтому я безапелляционно говорю, что лучшим вариантом были бы распределенные тренировки через сервер - сразу параллельно запустить несколько тренировок с разными параметрами и тестировать получившиеся сети.

Jhortos, каким бы он гением не был, на своем компьютере не может перепробовать всё

Цитата: Сообщение от alchemist888

- Нет веских оснований считать, что сила T60 подскочила на 22 Elo

Есть веские основания!
Гийом ле Блан сейчас сделал повторный тест тех же сетей T60 против последнего нейростокфиша - получилось +22,5 Эло

Цитата: Сообщение от alchemist888

То есть, если и реально у T60 был скачок на 22 Elo, то он в любом случае был бы размазан многоступенчатой структурой обучения

Вы думаете, нельзя подобрать параметры так, чтобы придать больший вес более сильным сетям?

Цитата: Сообщение от alchemist888

Во-первых последние LR снижения никогда столько Elo нативным сетям не давали. А во-вторых взяты замеры между двумя сетями, одна из которых могла быть неудачной, а вторая удачной. Плюс контроль ультракороткий 1500 nodes/move. Сколько там Elo в реальных условиях никому не известно

Бездоказательные рассуждения

Цитата: Сообщение от alchemist888

Кстати, именно это и основная причина того, что в более-менее длинных контролях SFdev едва-ли покажет 150 Elo разницу с SF11, а не то, что, как Вы считаете, тестирование идет неправильно

Какой контроль вы считаете "более менее длинным"?
4m+2s на процессоре 3900x 24 потока - нормально?

Vizvezdenec · 05.10.2020, 22:42

Цитата: Сообщение от alchemist888

Кстати, именно это и основная причина того, что в более-менее длинных контролях SFdev едва-ли покажет 150 Elo разницу с SF11, а не то, что, как Вы считаете, тестирование идет неправильно.

Вот это вот - крайне важное замечание.
Если замерять SF dev против SF 11 в буллет 60+0.6 через, допустим, SF7 (ну это-то не самоэло?), там будет что-то типа 130 эло разницы, при том, что contempt давал SF11 в таком матчапе 20-30 эло МИНИМУМ.
Заодно вспоминаем, что SF11 против SF12 на фиштесте играется без выключенного contempt, и -130 эло превращаются совсем не в -130.
Т.е. получаем, что реально это и есть те самые "фиштестовские" разницы в эло, если убрать эффект того, что в стокфише было сделано исключительно для разгрома более слабых движков.
А что оно так себе транслируется на длинные временные контроли? Компрессию эло никто не отменял, в реалиях TCEC с монструозным железом и огромными временными контролями так и выйдет.

Омегазеро · 05.10.2020, 22:44

Цитата: Сообщение от Maratka

Нет хороших игровых дебютов, где было бы 0,7-0,9, которые можно было бы играть на ничью и на победу

Ага!
Значит, вы признаете, что моя модель тестирования правильная, а Стокфиш тестируют неправильно?

Напоминаю про мою модель. Генерируется репрезентативная база легальных игровых позиций, взятых из реальных партий сильнейших. Затем эти позиции по очереди случайным образом передаются движкам. Если средняя (от двух движков) оценка 0,6-0,9, позиция играется за белых и за черных. Если оценка другая, позиция пропускается и не играется. Тем самым тестирование ведется только на хороших позициях для данных движков.

А в ваших дебютных наборах хороших игровых позиций очень мало, там очень много мусора, кроме того, длина дебютов в основном фиксированная. Не проверяется сила движков как в одноходовых дебютах, так и в миттельшпиле.

Maratka · 05.10.2020, 23:04

Цитата: Сообщение от Омегазеро

Ага!
Значит, вы признаете, что моя модель тестирования правильная, а Стокфиш тестируют неправильно?

Нет. Методика у Вас как методика, не лучше и не хуже любой другой. На Фиштесте например полно позиций, где одна из сторон всегда проигрывает, и хватает вполне себе ничейных. Те, про которые пишете Вы - всего-то один из этих трех вариантов.

В результате, играя первый и второй вариант, сильнейший движок (т.е. с новым тестируемым патчем, либо новая релизная версия против предыдущей) ничего как правило не набирает, т.к. получает 1:0/1:0 или два по 0,5, и разница вылезает в основном только за счет третьих дебютов, про которые пишите Вы.

Итого, реальная разница, если тестировать по-Вашему в Elo будет еще больше

Цитата: Сообщение от Омегазеро

в ваших дебютных наборах хороших игровых позиций очень мало

Давайте быть реалистами: это не мои дебютные наборы, и я к ним не имею никакого отношения. Имел бы - ну наверное как-то бы попытался их чуть почистить, просто по той причине, что тогда больше патчей проходить станет.

Vizvezdenec · 05.10.2020, 23:14

Вообще говоря, на фиштесте тестировалось штук 8 разных книг.
Текущая - та, которая давала наибольшую разницу в эло среди всех для движков типа в 20-30 эло разницы.
Если бы там было много "совсем не игровых" позиций, то так бы не было, т.к. книга "совсем из не игровых позиций" даёт разницу в 0 эло.
Так ещё можно было про старую книгу сказать, но сейчас там noob_3moves, там вроде 150к позиций примерно, но 3-ходовых, их игровых так то 3-ходовых очень много (надеюсь, никто не будет говорить, что что-то вроде g3 c5 Bg2 f5 Nc3 Nc6 это "не игровая" позиция? То, то это не главная линия мейнстримных дебютов, не делает её неигровой).

Maratka · 05.10.2020, 23:16

Ну улучшить то всегда есть что и как..
Наш сербский друг с год назад писал, что там по книге есть дебюты, где (например) SF3 выигрывает у тогдашней беты версии 11.

Понятно, что это создает лишний шум, и потому мешает проходить патчам, которые в принципе дают Elo, но на грани.

Если это почистили, то и хорошо!

Vizvezdenec · 05.10.2020, 23:21

Цитата: Сообщение от Maratka

Ну улучшить то всегда есть что и как..
Наш сербский друг с год назад писал, что там по книге есть дебюты, где (например) SF3 выигрывает у тогдашней беты версии 11.

Понятно, что это создает лишний шум, и потому мешает проходить патчам, которые в принципе дают Elo, но на грани.

Если это почистили, то и хорошо!

Там вообще книга полностью поменялась, это просто другая книга.
Взята от noobpwnftw, который её сделал точно так же, как делал книгу для сянцы, я не особо вникал, как

Maratka · 05.10.2020, 23:33

Тогда понятно!
И это очень даже неплохо!

Maratka · 05.10.2020, 23:39

Цитата: Сообщение от Омегазеро

Jhortos, каким бы он гением не был, на своем компьютере не может перепробовать всё

Вы руки на рельсы положить согласны, в качестве аргумента, что у него компьютер, а не компьютеры?

Цитата: Сообщение от Омегазеро

Гийом ле Блан сейчас сделал повторный тест тех же сетей T60 против последнего нейростокфиша - получилось +22,5 Эло

Если тестировать одно и то же по одной и той же методике и достаточно большом количестве партий, то оно неудивительно.
Только вот я например не знаю, что у него за методика. В частности: железо, контроль, книга, наличие партий с начальной позиции (и если есть - их процент от общего числа партий), условия засчета результата (до упора, или присуждение), и неверное еще пару-тройку моментов найдется, сходу не вспомнишь.

А Вы их знаете?

alchemist888 · 06.10.2020, 01:33

Цитата: Сообщение от Омегазеро

Невежественно утверждать, что параметры обучения всегда оптимальны...
Jhortos, каким бы он гением не был, на своем компьютере не может перепробовать всё.

Где я такое говорил о том, что Jhorthos оптимально обучает сети? Еще раз, поймите мою мысль, Вы в своем сообщении буквально утверждали, что он в чем-то ошибается. При этом Вы не привели оптимальную, на Ваш взгляд, модель обучения и параметры. Также Вы не обсуждали этот вопрос непосредственно с самим Jhorthos (что странно, если Вам известна ошибка). Таким образом у нас нет его позиции на этот счет.
Получается Вы сказали примерно следующее: Jhorthos ошибается потому что у сетей T60 был LR drop, он принес 22 Elo значит учить его новые сети надо как-то иначе.
Это все равно что я бы сказал: инженеры плохо проектируют двигатели внутреннего сгорания, потому что их КПД далек от 100%. Мы в 21-м веке живем, можно же было их прилично улучшить!

Цитата: Сообщение от Омегазеро

Поэтому я безапелляционно говорю, что лучшим вариантом были бы распределенные тренировки через сервер - сразу параллельно запустить несколько тренировок с разными параметрами и тестировать получившиеся сети.

А Jhorthos тут причем? Он делает что-то свое. Обращайтесь к авторам проекта LCZero с подобным предложением. Только для этих целей, видимо, придется приостановить все остальные тренировочные раны.
Да и, на самом деле, проект LCZero именно этим и занимается, с той лишь разницей, что в нем идет генерация тренировочных игр и вместе с тем, за счет тестовых ранов, происходит поиск оптимальных параметров обучения.
То есть, ребята конечно могут остановить генерацию партий и искать оптимальные модели обучения для форков (чтобы эффективней создавать сильные сети), но кто тогда будет обеспечивать их базой тренировочных игр?

Омегазеро · 06.10.2020, 05:50

Цитата: Сообщение от alchemist888

Вы в своем сообщении буквально утверждали, что он в чем-то ошибается. При этом Вы не привели оптимальную, на Ваш взгляд, модель обучения и параметры

Как говорил Бернард Шоу, чтобы судить о вкусе яичницы, не надо уметь нести яйца
Вот данные самого jhortos

Код:

 # PLAYER              :  RATING  ERROR  PLAYED   (%)      W      L      D  D(%)  CFS(%)
   1 lc0.net.J92-190     :    19.5    5.2    8000    53   2069   1635   4296    54      84
   2 lc0.net.J92-210     :    15.8    5.3    8000    52   2007   1655   4338    54      66
   3 lc0.net.J92B-205    :    14.2    5.3    8000    52   2026   1710   4264    53      51
   4 lc0.net.J92-240     :    14.1    5.2    8000    52   1984   1670   4346    54      55

Я имею полное право сказать, что это не те цифры, которые мы ожидаем, следовательно, в обучении ошибка

Цитата: Сообщение от alchemist888

ребята конечно могут остановить генерацию партий и искать оптимальные модели обучения для форков (чтобы эффективней создавать сильные сети)

Передергиваете!
Генерация партий и поиск оптимальных моделей могут идти параллельно
Даже сейчас параллельно запущено несколько тренировок с генерацией

Омегазеро · 06.10.2020, 05:58

Цитата: Сообщение от Maratka

Только вот я например не знаю, что у него за методика. В частности: железо, контроль, книга, наличие партий с начальной позиции (и если есть - их процент от общего числа партий), условия засчета результата (до упора, или присуждение), и неверное еще пару-тройку моментов найдется, сходу не вспомнишь.
А Вы их знаете?

Достаточно заглянуть на страничку setting, чтобы все это узнать

Adjudication
draw: 50 moves, 5 moves both eval < 0.08, tb 6 men / resign: 5 moves both eval > 10
ELO ordo -a 0 -A "Stockfish.dev" -W -D -U "0,1,2,3,4,5,6,7,8,9,10" -s 2000

Engines
Stockfish dev 19082608 (4 cores, 1500000 nodes, 512MB transposition table, 6 men TB)
Stockfish dev 20092708 (4 cores, 300000 nodes, 512MB transposition table, 6 men TB)
Leela v 0.25.1 (2 cores, 1500 nodes, backend cudnn-fp16, nncache default, 6 men TB)
Leela v 0.26.0 (2 cores, 1500 nodes, backend cudnn-fp16, nncache default, 6 men TB)
@kiudee setting --cpuct=2.147 --cpuct-base=18368 --cpuct-factor=2.815 --fpu-value=0.443 --policy-softmax-temp=1.607

Book
openings-8ply-10k.pgn (by Chad, 10000 openings, 8 plies, played with black and white)

Цитата: Сообщение от Vizvezdenec

Там вообще книга полностью поменялась, это просто другая книга.
Взята от noobpwnftw, который её сделал точно так же, как делал книгу для сянцы, я не особо вникал, как

Цитата: Сообщение от Maratka

Тогда понятно!
И это очень даже неплохо!

Не вникал, но одобряю!
Это соверешенно ненаучный подход

Maratka · 06.10.2020, 13:07

Цитата: Сообщение от Омегазеро

Как говорил Бернард Шоу, чтобы судить о вкусе яичницы, не надо уметь нести яйца

Гениально!
Вот только противоречит одной интересной мысли:

Цитата: Сообщение от Омегазеро

Поэтому я безапелляционно говорю, что лучшим вариантом были бы распределенные тренировки через сервер - сразу параллельно запустить несколько тренировок с разными параметрами и тестировать получившиеся сети.

При этом:

Цитата: Сообщение от Омегазеро

Генерация партий и поиск оптимальных моделей могут идти параллельно
Даже сейчас параллельно запущено несколько тренировок с генерацией

Т.е. оказывается не нужно безапелляционно утверждать, что...бла-бла-бла, ибо оно оказывается уже само по себе давно работает.

Maratka · 06.10.2020, 13:13

Цитата: Сообщение от Омегазеро

Достаточно заглянуть на страничку setting, чтобы все это узнать

Недостаточно. Я не знаю, где находится страничка setting.

Цитата: Сообщение от Омегазеро

Не вникал, но одобряю!
Это соверешенно ненаучный подход

А что тут вникать? Выбрали из многих книг ту, на которой набирается максимум Elo между двумя движками. Это действительно неплохо.
Или Вы считаете, что плохо? Или научный подход в том, чтобы вручную просмотреть несколько десятков тысяч дебютов, и оценить их?

04.10.2020, 04:28	#7021
Омегазеро Гроссмейстер Регистрация: 20.01.2019 Сообщений: 1,067 Сказал(а) спасибо: 2 Поблагодарили 701 раз(а) в 343 сообщениях Репутация: 92	Re: LCZero Цитата: Сообщение от Maratka Ну и... Посмотрел. SF согласно Вашим данным за месяц набрал 39 Elo в сравнении с LZ. Вы опять издеваетесь или у вас проблемы со зрением? Какой месяц? Сравнивается Сток от 26 августа 2019 года и от 27 сентября 2020 года Разница - ГОД И ОДИН МЕСЯЦ! Цитата: Сообщение от Maratka там резко было около 70 Elo. Так что вполне можно говорить, что набралось таки 150 Elo, и это без разницы, против кого мерить. Полный бред. Есть огромная разница, против кого мерять Если вам недостаточно тестов Гийома Леблана, то вот тест mattblachess. Тут меньше партий и меньше точность, но порядок цифры подтверждается lczero0.26-J92-100 сильнее Стокфиш-11 на 50 Эло lczero0.26-J92-100 слабее Стокфиш-12 на 15 Эло Таким образом, Стокфиш-12 сильнее Стокфиш-11 всего на 65 Эло. Никаких 150 Эло нет и близко Обратите внимание, что написал mattblachess по итогам своего теста, обнаружив, что он полностью противоречит данным о росте Стокфиша на 130 Эло SF-рейтинг Стокфиша неверный! То есть самоЭло Стокфиша бредовое и не имеет никакого отношения к реальности

04.10.2020, 12:34	#7022
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Омегазеро Вы опять издеваетесь или у вас проблемы со зрением? Какой месяц? Сравнивается Сток от 26 августа 2019 года и от 27 сентября 2020 года Разница - ГОД И ОДИН МЕСЯЦ! Пусть так. А теперь расскажите мне, как SF, набирая 39 Elo за год и один месяц, ухитряется держать паритет против LZ, у которого обычное дело: Цитата: Сообщение от Омегазеро рост на 22 Эло всего за неделю. Посмотрим, что будет дальше Даже если эти 22 Elo в неделю -это непонятный всплеск, и реально LZ растет на порядок медленнее, то это все одно 114 Elo в год (не в год и месяц). И да, у меня действительно проблемы со зрением. Я вот пялюсь в эту табличку: И никак не могу не то что найти контроль и оборудование, на котором делались замеры, но и просто увидеть цифры и буквы. Слишком оно мелковатое для меня. Покрупнее нет?

04.10.2020, 13:26	#7023
AlphaZero 2 разряд Регистрация: 11.06.2019 Сообщений: 399 Сказал(а) спасибо: 549 Поблагодарили 121 раз(а) в 81 сообщениях Репутация: 20	Re: LCZero Цитата: Сообщение от Viktor v0.26.3-RC2 https://github.com/LeelaChessZero/lc0/releases Поддержка более чем 64-ёх ядер? Ну наконец-то! Ждал.. Да.. Ждал с нетерпением..

04.10.2020, 17:09	#7024
Alvir 3 разряд Регистрация: 09.04.2019 Сообщений: 197 Сказал(а) спасибо: 1,130 Поблагодарили 248 раз(а) в 109 сообщениях Репутация: 56	Re: LCZero Цитата: Сообщение от Maratka Я вот пялюсь в эту табличку: И никак не могу не то что найти контроль и оборудование, на котором делались замеры, но и просто увидеть цифры и буквы. Слишком оно мелковатое для меня. Покрупнее нет? Тут оригинал: https://docs.google.com/spreadsheets...#gid=207181789

04.10.2020, 17:56	#7025
Омегазеро Гроссмейстер Регистрация: 20.01.2019 Сообщений: 1,067 Сказал(а) спасибо: 2 Поблагодарили 701 раз(а) в 343 сообщениях Репутация: 92	Re: LCZero Цитата: Сообщение от Maratka обычное дело Цитата: Сообщение от Maratka Даже если эти 22 Elo в неделю -это непонятный всплеск Maratka! Ну не могу я поверить, что вы НЕ ЧИТАЛИ пост, на который я давала ссылку Там же ясно написано - 22 Elo в неделю ПОСЛЕ LR-дропа А перед этим за четыре месяца было всего +6.5 Эло Вот так развивается Лила - сначала застой, потом скачок после LR-дропа, затем опять застой Цитата: Сообщение от Maratka набирая 39 Elo за год и один месяц Поскольку там фиксированное число узлов, необходима поправка на отношение скоростей (оно отличается в этих тестах) Если верить Вызвезденцу, надо добавить еще 45-50 Эло, итого 84-90 Эло А Лила, судя по опубликованному графику, за год выросла примерно на 75 - если сравнивать нынешние сети с прошлогодними 256x20

04.10.2020, 17:58	#7026
Омегазеро Гроссмейстер Регистрация: 20.01.2019 Сообщений: 1,067 Сказал(а) спасибо: 2 Поблагодарили 701 раз(а) в 343 сообщениях Репутация: 92	Re: LCZero Опубликованы тесты скоростей Лилы на новых RTX-картах в сравнении со старыми 2080 lczero 0.26.3-rc2 benchmark --cuda-fp16 384x30-t60-4619.pb.gz --num-positions=1 (начальная позиция) RTX 2080 Ti - 320x24 = 21073 nps RTX 2080 Ti - 384x30 = 13278 nps RTX 2080 Super - 384x30 = 14915 nps RTX 3080 FYI - 384x30 = 23222 (+75%) RTX 3090 - 320x24 = 47636 nps (+126%) RTX 3090 - 384x30 = 30591 nps (+130%)

04.10.2020, 18:26	#7027
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Омегазеро Поскольку там фиксированное число узлов, необходима поправка на отношение скоростей (оно отличается в этих тестах) Тогда вообще не нужно их сравнивать, ибо бесполезно, фискированное количество узлов против короткого (но таки гибкого) контроля, где движок сам решает, когда ему делать ход. Цитата: Сообщение от Омегазеро Там же ясно написано - 22 Elo в неделю ПОСЛЕ LR-дропа А перед этим за четыре месяца было всего +6.5 Эло Тогда понятно. Но эти 22 Elo ничто в сравнении с сотней, которую набрал SF после того, как тоже получил сетевую оценку - первое. Второе - он тоже набирает за счет сетей, в частности буквально неделю назад как раз за счет чуть измененного алгоритма обучения - 4 Elo. Однако у Fish'а есть еще и собственно движок, который тоже дает вполне себе прилично, где-то полста Elo в год без оценки. Так что я не знаю, о чем тут спорить. Лучше бы я посмотрел на результаты Ваших тестов, которых почему-то нет с конца июля. Интересно было бы сравнить с теме сетями LZ, которые были на тот самый конец июля - раз, и текущей сетью - два.

04.10.2020, 18:57	#7028
Переяслав Гроссмейстер Регистрация: 12.07.2020 Сообщений: 1,784 Сказал(а) спасибо: 650 Поблагодарили 2,306 раз(а) в 1,004 сообщениях Записей в дневнике: 20 Репутация: 136	Re: LCZero Цитата: Сообщение от Омегазеро RTX 3090 - 384x30 = 30591 nps круто. на моей 1060 с --num-positions=1 дает 1291 __________________ PGN Spy - top tournaments

04.10.2020, 19:02	#7029
svoitsl Гроссмейстер Регистрация: 19.04.2017 Сообщений: 4,734 Сказал(а) спасибо: 1,204 Поблагодарили 2,853 раз(а) в 1,885 сообщениях Репутация: 159	Re: LCZero Цитата: Сообщение от Maratka который тоже дает вполне себе прилично, где-то полста Elo в год без оценки. точно без оценки? раньше вроде было с оценкой,или я что то путаю?

04.10.2020, 19:21	#7030
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Так оценки там 10-20% от общего веса патчей.

05.10.2020, 04:59	#7031
Омегазеро Гроссмейстер Регистрация: 20.01.2019 Сообщений: 1,067 Сказал(а) спасибо: 2 Поблагодарили 701 раз(а) в 343 сообщениях Репутация: 92	Re: LCZero Новая сеть от jhortos https://storage.lczero.org/files/net...ontrib/J92-240 При ее тренировке использовались игры после снижения LR, когда сила Лилы подскочила на 22 Эло Правда, пока таких результатов нет. Мне кажется, что в связи со снижением LR надо было поменять параметры тренировок, а jhortos гонит со старыми параметрами. Это ошибка Цитата: Сообщение от Maratka Но эти 22 Elo ничто в сравнении с сотней, которую набрал SF после того, как тоже получил сетевую оценку Во-первых, сотня, которую набрал SF - это самоЭло Если бы это Эло было реальностью, SF бы обогнал Лилу не менее чем на 65 Эло А теперь посмотрите на результаты суперфинала TCEC-19 и скажите - похоже, чем SF на 65 Эло сильнее Лилы? Во-вторых, игры после LR-дропа не использовались при тренировке сети, которая сейчас играет в TCEC. То есть прибавка в 22 Эло - это резерв для дальнейших тренировок Лилы

05.10.2020, 05:14	#7032
alchemist888 КМС Регистрация: 25.04.2019 Сообщений: 674 Сказал(а) спасибо: 293 Поблагодарили 641 раз(а) в 345 сообщениях Репутация: 61	Re: LCZero Цитата: Сообщение от Омегазеро При ее тренировке использовались игры после снижения LR, когда сила Лилы подскочила на 22 Эло Правда, пока таких результатов нет. Мне кажется, что в связи со снижением LR надо было поменять параметры тренировок, а jhortos гонит со старыми параметрами. Это ошибка - LR дроп дает больше тому, у кого он происходит. Все финальные сети jhorthos имели последний LR drop для своих сетей, и неважно на какой LR был у тренировочных игр. То есть, если и реально у T60 был скачок на 22 Elo, то он в любом случае был бы размазан многоступенчатой структурой обучения. - Нет веских оснований считать, что сила T60 подскочила на 22 Elo. Во-первых последние LR снижения никогда столько Elo нативным сетям не давали. А во-вторых взяты замеры между двумя сетями, одна из которых могла быть неудачной, а вторая удачной. Плюс контроль ультракороткий 1500 nodes/move. Сколько там Elo в реальных условиях никому не известно. Кстати, именно это и основная причина того, что в более-менее длинных контролях SFdev едва-ли покажет 150 Elo разницу с SF11, а не то, что, как Вы считаете, тестирование идет неправильно. - Алгоритмы обучения у опытных ребят типа jhorthos и Sergio постоянно меняются. В этом поиске время от времени находятся хорошие прорывы. Безапелляционно говорить, что они ошибаются в параметрах обучения сетей - это как минимум пустой критицизм, а как максимум невежественно и грубо.

05.10.2020, 12:49	#7033
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Омегазеро А теперь посмотрите на результаты суперфинала TCEC-19 и скажите - похоже, чем SF на 65 Эло сильнее Лилы? А дебюты Вы смотрели? когда они +0,3 с раздачи, слабейший достаточно легко парирует, когда 1,2 с раздачи - обычно проигрывает. Нет хороших игровых дебютов, где было бы 0,7-0,9, которые можно было бы играть на ничью и на победу. Ну и в целом, на TCEC'е уже тесты проводят? Когда первые тысяч пятьдесят-сто партий наиграли движок А против движка Б, в каком году? И еще раз попрошу, выложите Ваши тесты SF vs LZ. Те самые, которые Вы выкладывали раз-два в неделю в течении около года до выхода NN-версии SF, и прекратились сразу после ее выхода. Тесты SF той версии, которая сразу после появления сетевой оценки против тогдашней версии LZ и его сети, и современный SF и LZ с современными же сетями.

05.10.2020, 12:54	#7034
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от alchemist888 - Нет веских оснований считать, что сила T60 подскочила на 22 Elo. Во-первых последние LR снижения никогда столько Elo нативным сетям не давали. А во-вторых взяты замеры между двумя сетями, одна из которых могла быть неудачной, а вторая удачной. Барышня пишет, что это не самоЕло. Т.е. тогда это ни одна сеть LZ против другой сети LZ, а что-то иное. Цитата: Сообщение от alchemist888 Сколько там Elo в реальных условиях никому не известно. Кстати, именно это и основная причина того, что в более-менее длинных контролях SFdev едва-ли покажет 150 Elo разницу с SF11, а не то, что, как Вы считаете, тестирование идет неправильно. Ну так это любой движок так покажет. SF11 тоже не на 50 ELo сильнее 10-й версии на часовом контроле. А у текущей версии LZ никогда не будет 22 Elo.

05.10.2020, 16:37	#7035
alchemist888 КМС Регистрация: 25.04.2019 Сообщений: 674 Сказал(а) спасибо: 293 Поблагодарили 641 раз(а) в 345 сообщениях Репутация: 61	Re: LCZero Цитата: Сообщение от Maratka Барышня пишет, что это не самоЕло. Т.е. тогда это ни одна сеть LZ против другой сети LZ, а что-то иное. Там тестировались две сети T60 через Стокфиш 19082608. Одна из них с последним LR, другая из них с более высоким. Разница в датах между ними примерно месяц. Это я и имел ввиду, говоря что взяты замеры между двумя сетями. https://forchess.ru/showpost.php?p=1...postcount=6941

05.10.2020, 20:50	#7036
alchemist888 КМС Регистрация: 25.04.2019 Сообщений: 674 Сказал(а) спасибо: 293 Поблагодарили 641 раз(а) в 345 сообщениях Репутация: 61	Re: LCZero Цитата: Сообщение от Омегазеро Опубликованы тесты скоростей Лилы на новых RTX-картах в сравнении со старыми 2080 lczero 0.26.3-rc2 benchmark --cuda-fp16 384x30-t60-4619.pb.gz --num-positions=1 (начальная позиция) RTX 2080 Ti - 320x24 = 21073 nps RTX 2080 Ti - 384x30 = 13278 nps RTX 2080 Super - 384x30 = 14915 nps Интересно, как RTX 2080 Super смогла прилично превзойти 2080 TI в данном замере?

05.10.2020, 22:23	#7037
Омегазеро Гроссмейстер Регистрация: 20.01.2019 Сообщений: 1,067 Сказал(а) спасибо: 2 Поблагодарили 701 раз(а) в 343 сообщениях Репутация: 92	Re: LCZero Цитата: Сообщение от alchemist888 Безапелляционно говорить, что они ошибаются в параметрах обучения сетей - это как минимум пустой критицизм, а как максимум невежественно и грубо Невежественно утверждать, что параметры обучения всегда оптимальны Потому что их можно подобрать только экспериментально, теория в лучшем случае может подсказать только общее направление поиска Поэтому я безапелляционно говорю, что лучшим вариантом были бы распределенные тренировки через сервер - сразу параллельно запустить несколько тренировок с разными параметрами и тестировать получившиеся сети. Jhortos, каким бы он гением не был, на своем компьютере не может перепробовать всё Цитата: Сообщение от alchemist888 - Нет веских оснований считать, что сила T60 подскочила на 22 Elo Есть веские основания! Гийом ле Блан сейчас сделал повторный тест тех же сетей T60 против последнего нейростокфиша - получилось +22,5 Эло Цитата: Сообщение от alchemist888 То есть, если и реально у T60 был скачок на 22 Elo, то он в любом случае был бы размазан многоступенчатой структурой обучения Вы думаете, нельзя подобрать параметры так, чтобы придать больший вес более сильным сетям? Цитата: Сообщение от alchemist888 Во-первых последние LR снижения никогда столько Elo нативным сетям не давали. А во-вторых взяты замеры между двумя сетями, одна из которых могла быть неудачной, а вторая удачной. Плюс контроль ультракороткий 1500 nodes/move. Сколько там Elo в реальных условиях никому не известно Бездоказательные рассуждения Цитата: Сообщение от alchemist888 Кстати, именно это и основная причина того, что в более-менее длинных контролях SFdev едва-ли покажет 150 Elo разницу с SF11, а не то, что, как Вы считаете, тестирование идет неправильно Какой контроль вы считаете "более менее длинным"? 4m+2s на процессоре 3900x 24 потока - нормально?

05.10.2020, 22:42	#7038
Vizvezdenec Гроссмейстер Регистрация: 30.05.2018 Адрес: Севастополь Сообщений: 4,022 Сказал(а) спасибо: 56 Поблагодарили 5,294 раз(а) в 2,673 сообщениях Репутация: 216	Re: LCZero Цитата: Сообщение от alchemist888 Кстати, именно это и основная причина того, что в более-менее длинных контролях SFdev едва-ли покажет 150 Elo разницу с SF11, а не то, что, как Вы считаете, тестирование идет неправильно. Вот это вот - крайне важное замечание. Если замерять SF dev против SF 11 в буллет 60+0.6 через, допустим, SF7 (ну это-то не самоэло?), там будет что-то типа 130 эло разницы, при том, что contempt давал SF11 в таком матчапе 20-30 эло МИНИМУМ. Заодно вспоминаем, что SF11 против SF12 на фиштесте играется без выключенного contempt, и -130 эло превращаются совсем не в -130. Т.е. получаем, что реально это и есть те самые "фиштестовские" разницы в эло, если убрать эффект того, что в стокфише было сделано исключительно для разгрома более слабых движков. А что оно так себе транслируется на длинные временные контроли? Компрессию эло никто не отменял, в реалиях TCEC с монструозным железом и огромными временными контролями так и выйдет. __________________ Развернуть для просмотра [свернуть]

05.10.2020, 22:44	#7039
Омегазеро Гроссмейстер Регистрация: 20.01.2019 Сообщений: 1,067 Сказал(а) спасибо: 2 Поблагодарили 701 раз(а) в 343 сообщениях Репутация: 92	Re: LCZero Цитата: Сообщение от Maratka Нет хороших игровых дебютов, где было бы 0,7-0,9, которые можно было бы играть на ничью и на победу Ага! Значит, вы признаете, что моя модель тестирования правильная, а Стокфиш тестируют неправильно? Напоминаю про мою модель. Генерируется репрезентативная база легальных игровых позиций, взятых из реальных партий сильнейших. Затем эти позиции по очереди случайным образом передаются движкам. Если средняя (от двух движков) оценка 0,6-0,9, позиция играется за белых и за черных. Если оценка другая, позиция пропускается и не играется. Тем самым тестирование ведется только на хороших позициях для данных движков. А в ваших дебютных наборах хороших игровых позиций очень мало, там очень много мусора, кроме того, длина дебютов в основном фиксированная. Не проверяется сила движков как в одноходовых дебютах, так и в миттельшпиле.

05.10.2020, 23:04	#7040
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Омегазеро Ага! Значит, вы признаете, что моя модель тестирования правильная, а Стокфиш тестируют неправильно? Нет. Методика у Вас как методика, не лучше и не хуже любой другой. На Фиштесте например полно позиций, где одна из сторон всегда проигрывает, и хватает вполне себе ничейных. Те, про которые пишете Вы - всего-то один из этих трех вариантов. В результате, играя первый и второй вариант, сильнейший движок (т.е. с новым тестируемым патчем, либо новая релизная версия против предыдущей) ничего как правило не набирает, т.к. получает 1:0/1:0 или два по 0,5, и разница вылезает в основном только за счет третьих дебютов, про которые пишите Вы. Итого, реальная разница, если тестировать по-Вашему в Elo будет еще больше Цитата: Сообщение от Омегазеро в ваших дебютных наборах хороших игровых позиций очень мало Давайте быть реалистами: это не мои дебютные наборы, и я к ним не имею никакого отношения. Имел бы - ну наверное как-то бы попытался их чуть почистить, просто по той причине, что тогда больше патчей проходить станет.

05.10.2020, 23:14	#7041
Vizvezdenec Гроссмейстер Регистрация: 30.05.2018 Адрес: Севастополь Сообщений: 4,022 Сказал(а) спасибо: 56 Поблагодарили 5,294 раз(а) в 2,673 сообщениях Репутация: 216	Re: LCZero Вообще говоря, на фиштесте тестировалось штук 8 разных книг. Текущая - та, которая давала наибольшую разницу в эло среди всех для движков типа в 20-30 эло разницы. Если бы там было много "совсем не игровых" позиций, то так бы не было, т.к. книга "совсем из не игровых позиций" даёт разницу в 0 эло. Так ещё можно было про старую книгу сказать, но сейчас там noob_3moves, там вроде 150к позиций примерно, но 3-ходовых, их игровых так то 3-ходовых очень много (надеюсь, никто не будет говорить, что что-то вроде g3 c5 Bg2 f5 Nc3 Nc6 это "не игровая" позиция? То, то это не главная линия мейнстримных дебютов, не делает её неигровой). __________________ Развернуть для просмотра [свернуть]

05.10.2020, 23:16	#7042
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Ну улучшить то всегда есть что и как.. Наш сербский друг с год назад писал, что там по книге есть дебюты, где (например) SF3 выигрывает у тогдашней беты версии 11. Понятно, что это создает лишний шум, и потому мешает проходить патчам, которые в принципе дают Elo, но на грани. Если это почистили, то и хорошо!

05.10.2020, 23:21	#7043
Vizvezdenec Гроссмейстер Регистрация: 30.05.2018 Адрес: Севастополь Сообщений: 4,022 Сказал(а) спасибо: 56 Поблагодарили 5,294 раз(а) в 2,673 сообщениях Репутация: 216	Re: LCZero Цитата: Сообщение от Maratka Ну улучшить то всегда есть что и как.. Наш сербский друг с год назад писал, что там по книге есть дебюты, где (например) SF3 выигрывает у тогдашней беты версии 11. Понятно, что это создает лишний шум, и потому мешает проходить патчам, которые в принципе дают Elo, но на грани. Если это почистили, то и хорошо! Там вообще книга полностью поменялась, это просто другая книга. Взята от noobpwnftw, который её сделал точно так же, как делал книгу для сянцы, я не особо вникал, как __________________ Развернуть для просмотра [свернуть]

05.10.2020, 23:33	#7044
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Тогда понятно! И это очень даже неплохо!

05.10.2020, 23:39	#7045
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Омегазеро Jhortos, каким бы он гением не был, на своем компьютере не может перепробовать всё Вы руки на рельсы положить согласны, в качестве аргумента, что у него компьютер, а не компьютеры? Цитата: Сообщение от Омегазеро Гийом ле Блан сейчас сделал повторный тест тех же сетей T60 против последнего нейростокфиша - получилось +22,5 Эло Если тестировать одно и то же по одной и той же методике и достаточно большом количестве партий, то оно неудивительно. Только вот я например не знаю, что у него за методика. В частности: железо, контроль, книга, наличие партий с начальной позиции (и если есть - их процент от общего числа партий), условия засчета результата (до упора, или присуждение), и неверное еще пару-тройку моментов найдется, сходу не вспомнишь. А Вы их знаете?

06.10.2020, 01:33	#7046
alchemist888 КМС Регистрация: 25.04.2019 Сообщений: 674 Сказал(а) спасибо: 293 Поблагодарили 641 раз(а) в 345 сообщениях Репутация: 61	Re: LCZero Цитата: Сообщение от Омегазеро Невежественно утверждать, что параметры обучения всегда оптимальны... Jhortos, каким бы он гением не был, на своем компьютере не может перепробовать всё. Где я такое говорил о том, что Jhorthos оптимально обучает сети? Еще раз, поймите мою мысль, Вы в своем сообщении буквально утверждали, что он в чем-то ошибается. При этом Вы не привели оптимальную, на Ваш взгляд, модель обучения и параметры. Также Вы не обсуждали этот вопрос непосредственно с самим Jhorthos (что странно, если Вам известна ошибка). Таким образом у нас нет его позиции на этот счет. Получается Вы сказали примерно следующее: Jhorthos ошибается потому что у сетей T60 был LR drop, он принес 22 Elo значит учить его новые сети надо как-то иначе. Это все равно что я бы сказал: инженеры плохо проектируют двигатели внутреннего сгорания, потому что их КПД далек от 100%. Мы в 21-м веке живем, можно же было их прилично улучшить! Цитата: Сообщение от Омегазеро Поэтому я безапелляционно говорю, что лучшим вариантом были бы распределенные тренировки через сервер - сразу параллельно запустить несколько тренировок с разными параметрами и тестировать получившиеся сети. А Jhorthos тут причем? Он делает что-то свое. Обращайтесь к авторам проекта LCZero с подобным предложением. Только для этих целей, видимо, придется приостановить все остальные тренировочные раны. Да и, на самом деле, проект LCZero именно этим и занимается, с той лишь разницей, что в нем идет генерация тренировочных игр и вместе с тем, за счет тестовых ранов, происходит поиск оптимальных параметров обучения. То есть, ребята конечно могут остановить генерацию партий и искать оптимальные модели обучения для форков (чтобы эффективней создавать сильные сети), но кто тогда будет обеспечивать их базой тренировочных игр?

06.10.2020, 05:50	#7047
Омегазеро Гроссмейстер Регистрация: 20.01.2019 Сообщений: 1,067 Сказал(а) спасибо: 2 Поблагодарили 701 раз(а) в 343 сообщениях Репутация: 92	Re: LCZero Цитата: Сообщение от alchemist888 Вы в своем сообщении буквально утверждали, что он в чем-то ошибается. При этом Вы не привели оптимальную, на Ваш взгляд, модель обучения и параметры Как говорил Бернард Шоу, чтобы судить о вкусе яичницы, не надо уметь нести яйца Вот данные самого jhortos Код: # PLAYER : RATING ERROR PLAYED (%) W L D D(%) CFS(%) 1 lc0.net.J92-190 : 19.5 5.2 8000 53 2069 1635 4296 54 84 2 lc0.net.J92-210 : 15.8 5.3 8000 52 2007 1655 4338 54 66 3 lc0.net.J92B-205 : 14.2 5.3 8000 52 2026 1710 4264 53 51 4 lc0.net.J92-240 : 14.1 5.2 8000 52 1984 1670 4346 54 55 Я имею полное право сказать, что это не те цифры, которые мы ожидаем, следовательно, в обучении ошибка Цитата: Сообщение от alchemist888 ребята конечно могут остановить генерацию партий и искать оптимальные модели обучения для форков (чтобы эффективней создавать сильные сети) Передергиваете! Генерация партий и поиск оптимальных моделей могут идти параллельно Даже сейчас параллельно запущено несколько тренировок с генерацией

06.10.2020, 05:58	#7048
Омегазеро Гроссмейстер Регистрация: 20.01.2019 Сообщений: 1,067 Сказал(а) спасибо: 2 Поблагодарили 701 раз(а) в 343 сообщениях Репутация: 92	Re: LCZero Цитата: Сообщение от Maratka Только вот я например не знаю, что у него за методика. В частности: железо, контроль, книга, наличие партий с начальной позиции (и если есть - их процент от общего числа партий), условия засчета результата (до упора, или присуждение), и неверное еще пару-тройку моментов найдется, сходу не вспомнишь. А Вы их знаете? Достаточно заглянуть на страничку setting, чтобы все это узнать Adjudication draw: 50 moves, 5 moves both eval < 0.08, tb 6 men / resign: 5 moves both eval > 10 ELO ordo -a 0 -A "Stockfish.dev" -W -D -U "0,1,2,3,4,5,6,7,8,9,10" -s 2000 Engines Stockfish dev 19082608 (4 cores, 1500000 nodes, 512MB transposition table, 6 men TB) Stockfish dev 20092708 (4 cores, 300000 nodes, 512MB transposition table, 6 men TB) Leela v 0.25.1 (2 cores, 1500 nodes, backend cudnn-fp16, nncache default, 6 men TB) Leela v 0.26.0 (2 cores, 1500 nodes, backend cudnn-fp16, nncache default, 6 men TB) @kiudee setting --cpuct=2.147 --cpuct-base=18368 --cpuct-factor=2.815 --fpu-value=0.443 --policy-softmax-temp=1.607 Book openings-8ply-10k.pgn (by Chad, 10000 openings, 8 plies, played with black and white) Цитата: Сообщение от Vizvezdenec Там вообще книга полностью поменялась, это просто другая книга. Взята от noobpwnftw, который её сделал точно так же, как делал книгу для сянцы, я не особо вникал, как Цитата: Сообщение от Maratka Тогда понятно! И это очень даже неплохо! Не вникал, но одобряю! Это соверешенно ненаучный подход

06.10.2020, 13:07	#7049
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Омегазеро Как говорил Бернард Шоу, чтобы судить о вкусе яичницы, не надо уметь нести яйца Гениально! Вот только противоречит одной интересной мысли: Цитата: Сообщение от Омегазеро Поэтому я безапелляционно говорю, что лучшим вариантом были бы распределенные тренировки через сервер - сразу параллельно запустить несколько тренировок с разными параметрами и тестировать получившиеся сети. При этом: Цитата: Сообщение от Омегазеро Генерация партий и поиск оптимальных моделей могут идти параллельно Даже сейчас параллельно запущено несколько тренировок с генерацией Т.е. оказывается не нужно безапелляционно утверждать, что...бла-бла-бла, ибо оно оказывается уже само по себе давно работает.

06.10.2020, 13:13	#7050
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Омегазеро Достаточно заглянуть на страничку setting, чтобы все это узнать Недостаточно. Я не знаю, где находится страничка setting. Цитата: Сообщение от Омегазеро Не вникал, но одобряю! Это соверешенно ненаучный подход А что тут вникать? Выбрали из многих книг ту, на которой набирается максимум Elo между двумя движками. Это действительно неплохо. Или Вы считаете, что плохо? Или научный подход в том, чтобы вручную просмотреть несколько десятков тысяч дебютов, и оценить их?

Здесь присутствуют: 5 (пользователей: 0 , гостей: 5)