Forchess - форум о заочных шахматах  

Вернуться   Forchess - форум о заочных шахматах > Заочные турниры и партии > Шахматные программы и движки

Ответ
 
Опции темы Опции просмотра
Старый 07.03.2019, 10:41   #2461
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Viktor
Так протестировано уже давно и в большом количестве. Было установлено, что ноль - лучший показатель.
Для чего?
Maratka вне форума   Ответить с цитированием
Старый 07.03.2019, 10:45   #2462
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Viktor
Так и не помог он только потому, что это "игрушка программистов", а не объективная оценка позиции.
Вовсе нет. Просто с ненулевой вероятностью сильнейший может проиграть слабейшему. Разницы превращается в пшик при 300 ELO дистанции (и при условии, что движки однотипные), однако при 100 ELO она вполне себе несколько процентов шанса: чуть повезло с дебютом, чуть ошибся соперник, чуть сам угадал лучший ход- и вот тебе. На длинном же матче положительный контемпт дает некоторый бонус против слабейших.
Maratka вне форума   Ответить с цитированием
Старый 07.03.2019, 10:57   #2463
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Цитата: Сообщение от Viktor
А введение контемпта? Это же сделано для "вырубки хвоста" в борьбе с Houdini и Komodo. В то время, как нулевой - лучший!
Не совсем.
Во-первых, "contempt" в стокфише был 100 лет. Просто он не работал Ну как, оценку он завышал, но % набранных очков в играх более слабых движков не повышал.
Да, невыход в финал TCEC 10 заставил пересмотреть подход и в конце концов сделать уже имеющуюся настройку работающей, а не просто косметической.
Более того, работающий contempt породил dynamic contempt, который даёт эло в игре против самого себя.
А вот что "нулевой - лучший" - это все утверждают, но никто не удосужился привести хоть одно доказательство.
В то время как недавно только 24 проходил два [-3;1] против 0 и оба с плюсом по играм, в своё время это делал contempt 20 и 21 тоже.
Тут дело такое - да, он искусственно завышает оценку. Ну и что? В конце концов, оценка с точки зрения движка это просто тот параметр, для максимизации которого выбирается ход в каждый момент времени. Скажем так, добавить к оценке 2 стабильно - и ничего не меняется ни в силе игры движка, ни в выборе ходов, только вот оценку первому ходу e4 он будет давать +2.5
Contempt же переформирует дерево поиска таким образом, чтобы при прочих равных позиция с бОльшим числом материала на доске имела оценку несколько выше, чем позиция с такой же оценкой, но с меньшим числом материала.
И я абсолютно не понимаю, почему все считают самоочевидным, что это ухудшает игру против самого себя. По практически всем тестам до 20-25 Contempt это не ухудшает ничего особо, по крайней мере на разрешении fishtest это неизмеримо, а оно очень неплохое. Возможно, то, что он слегка отпинывает ничьи от нуля (во многих случаях) с помощью contempt позволяет ему находить более эффективные продолжения вместо ничьих повторениями (это моя гипотеза, за верность не ручаюсь).
Другой вопрос, что при анализе он показывает завышенные оценки, но, как мне кажется, если привыкнуть, то можно и так использовать (другой вопрос с анализами с заполнениями деревьев и прочие интересные вещи - я тут не специалист и судить не берусь, может быть, он там и правда мешает).
Кстати говоря, парочка моих знакомых занималась анализами сложных позиций, в достаточно многих случаях изменение contempt с 0 на 20+ позволяет уменьшить время нахождения лучшего хода в десятки раз. В достаточно многих и увеличить, правда
Vizvezdenec вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
sovaz1997 (07.03.2019)
Старый 07.03.2019, 11:10   #2464
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: LCZero

B все-таки, не достигли пока что 32930:

Код:
   # PLAYER        : RATING  ERROR  POINTS   (%)  PLAYED     W     L     D  D(%)  CFS(%)
   1 lc0.net.32930 :    0.0   ----  2164.0    65    3354  1272   298  1784    53     100
>>>2 lc0.net.41350 :  -32.5   12.0  1059.5    53    1987   418   286  1283    65      98<<< New
   3 lc0.net.11258 :  -44.8   10.8  1897.5    58    3257   977   439  1841    57      62
   4 lc0.net.41306 :  -46.6   12.5  1004.5    54    1874   426   291  1157    62      75
   5 lc0.net.36089 :  -51.0   10.9  1971.5    58    3404  1006   467  1931    57     100
   6 lc0.net.41150 :  -75.9   11.2  1595.5    55    2901   762   472  1667    57      54
   7 lc0.net.41250 :  -76.5   11.4  1361.0    53    2560   586   424  1550    61      84
   8 lc0.net.41200 :  -82.6   11.4  1311.0    52    2545   552   475  1518    60     100
  10 lc0.net.50300 : -142.5   12.3   839.0    39    2161   252   735  1174    54     100
  11 lc0.net.50250 : -177.3   12.3   837.5    39    2159   249   733  1177    55      98
  12 lc0.net.50200 : -192.2   12.9   713.0    36    1976   209   759  1008    51      98
  13 lc0.net.50150 : -204.9   11.1  1331.5    36    3745   418  1500  1827    49     100

White advantage = 28.55 +/- 1.75
Draw rate (equal opponents) = 61.70 % +/- 0.41
sovaz1997 вне форума   Ответить с цитированием
Старый 07.03.2019, 11:43   #2465
Viktor
Эксперт
 
Аватар для Viktor
 
Регистрация: 07.06.2016
Сообщений: 5,907
Сказал(а) спасибо: 13,814
Поблагодарили 12,717 раз(а) в 4,521 сообщениях
Репутация: 726
По умолчанию Re: LCZero

Цитата: Сообщение от Vizvezdenec
Другой вопрос, что при анализе он показывает завышенные оценки, но, как мне кажется, если привыкнуть, то можно и так использовать (другой вопрос с анализами с заполнениями деревьев и прочие интересные вещи - я тут не специалист и судить не берусь, может быть, он там и правда мешает).
При анализе в ИДеА оценки в дереве с каждым ходом (полуходом) постоянно "прыгают" то в одну, то в другую сторону. Этим создается дезинформация в действительно правильной оценке.
Что же касается доводов в пользу контемпта при тестировании, игре движков, то я согласен на все 100%. Более того, запуская движок в бесконечном режиме на длительное время, вполне положительно большее значение, чем ноль, так как появятся более перспективные продолжения, чем простое равенство.
Viktor вне форума   Ответить с цитированием
Старый 07.03.2019, 12:01   #2466
Magystr
2 разряд
 
Аватар для Magystr
 
Регистрация: 03.08.2016
Сообщений: 311
Сказал(а) спасибо: 85
Поблагодарили 227 раз(а) в 123 сообщениях
Репутация: 10
По умолчанию Re: LCZero

Цитата: Сообщение от Viktor
По поводу оценки... не слишком ли она завышена у Лилы?
Здесь надо понимать, что в отличие от остальных движков, Лила выдает оценку позиции не в сантипешках, а в процентах. То есть, оценка позиции у нее: 68,17%, к примеру. Но оболочка не предусматривает такое отображение оценки. Чтобы пользователям было более-менее понятно, используется формула, которая пересчитывает эти проценты в привычные всем сантипешки. Получается, предположим, +1.45 пешек.
При этом понятно, что 50% должны соответствовать строгому нулю пешек.
Чему должны соответствовать 100% (или 0%) - уже не очень понятно. Все промежуточные значения - тем более. Разработчики Лилы используют какую-то формулу пересчета, но на каких-то диапазонах она не очень точная. Особенно там, где оценка близка к 50-ти процентам (в пределах +/- 1 пешки).
Magystr вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Viktor (07.03.2019)
Старый 07.03.2019, 12:53   #2467
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Цитата: Сообщение от Magystr
Здесь надо понимать, что в отличие от остальных движков, Лила выдает оценку позиции не в сантипешках, а в процентах. То есть, оценка позиции у нее: 68,17%, к примеру. Но оболочка не предусматривает такое отображение оценки. Чтобы пользователям было более-менее понятно, используется формула, которая пересчитывает эти проценты в привычные всем сантипешки. Получается, предположим, +1.45 пешек.
При этом понятно, что 50% должны соответствовать строгому нулю пешек.
Чему должны соответствовать 100% (или 0%) - уже не очень понятно. Все промежуточные значения - тем более. Разработчики Лилы используют какую-то формулу пересчета, но на каких-то диапазонах она не очень точная. Особенно там, где оценка близка к 50-ти процентам (в пределах +/- 1 пешки).
Да нет.
Пересчёт % оценки в оценки в сантипешках делать очень несложно.
Делается это так - играет миллион (условно) партий и строится для каждой оценки (с шагом, например, 0,1) % набранных очков в партии, где эта оценка достигалась.
Обратная процедура делалась в TCEC для пересчёта оценки стокфиша в % набранных очков.
И вот что можно сказать - у стокфиша оценка менее "вытянутая" по краям, +2 это 90% набранных очков примерно, у Лилы +2 это типа 70, у стокфиша +8 это >99,9%, у Лилы 95% и т.д.
При этом у SF ещё оценка и более агрессивная, чем у Гудини/Комодо.
А по поводу того, о чём говорят адвансеры - Лила легко может показывать оценки вплоть до +5 (или больше) в позициях, где противник может форсировать ничью.
Причём в отличие от любого АВ движка, который будет так делать, она не пропускает в поиске форсированный вариант, она не понимает, что он ничейный.
Условно говоря - SF может не увидеть какой-то тактики, которая даёт вечный шах. Как только он её видит - оценка до 0 падает.
Лила же просто не понимает, что это - вечный шах, и будет 50 ходов ходить королём по кругу, уменьшая оценку на 0,1 каждый ход. При этом оценка бредовая как в сантипешках, так и в %, где я видел и 90+% ожидаемых очков в битых ничьих.
Ну вот даже недавно в такой позиции
5rk1/5p2/4p3/5pQ1/8/8/8/8 w - -
(остальные фигуры не важны, по общему материалу на доске у чёрных лишняя ладья) Лила выдавала какие-то там +1, +0,8 (со стороны чёрных) и т.д.
Хотя как бы очевидно, что тут вечный шах (фигуры чёрных остальные стоят так, что закрываться от шахов нечем).
Vizvezdenec вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
sovaz1997 (07.03.2019), Viktor (07.03.2019)
Старый 07.03.2019, 13:11   #2468
Magystr
2 разряд
 
Аватар для Magystr
 
Регистрация: 03.08.2016
Сообщений: 311
Сказал(а) спасибо: 85
Поблагодарили 227 раз(а) в 123 сообщениях
Репутация: 10
По умолчанию Re: LCZero

Цитата: Сообщение от Vizvezdenec
Да нет.
Пересчёт % оценки в оценки в сантипешках делать очень несложно.
Делается это так - играет миллион (условно) партий и строится для каждой оценки (с шагом, например, 0,1) % набранных очков в партии, где эта оценка достигалась...
Я не люблю заводить дискуссии. Все равно каждый останется при своем мнении. Но, прошу Вас, уточните. Что из написанного мной неправильно?
То что можно взять миллион партий - это не значит, что они были взяты.
В любом случае, перевод матожидания в сантипешки, и обратно - очень условный и ВСЕГДА сопровождается потерей точности, иногда существенной.
Magystr вне форума   Ответить с цитированием
Старый 07.03.2019, 14:38   #2469
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Цитата: Сообщение от Magystr
Я не люблю заводить дискуссии. Все равно каждый останется при своем мнении. Но, прошу Вас, уточните. Что из написанного мной неправильно?
То что можно взять миллион партий - это не значит, что они были взяты.
В любом случае, перевод матожидания в сантипешки, и обратно - очень условный и ВСЕГДА сопровождается потерей точности, иногда существенной.
1) Не очень-то он и условный. Т.к. обратный перевод делается очень просто, то и прямой тоже сделать можно, придётся только "откалибровать" Лилу по стокфишу (условно). Что сейчас стоит просто эмпирическая формула - вопрос другой;
2) Тем не менее, это оригинальная фраза не про это, а про "позиции, где слабейшая сторона может форсировать ничью, Лила это видит, но оценивает не как 0,00, а как +5/+3/+1". И причём если там путь к ничьей ещё нетривиальный, то ладно, но во многих случаях там ничью легко сделаю и я, а не то что движок уровня Лилы, SF или даже Laser. Вот именно про это адвансеры в треде говорят как про "совсем неправильную оценку позиции" с точки зрения как адванса, так и вообще здравого смысла (насколько я понимаю, по крайней мере).
Я Вам скинул FEN - вот в такой позиции Лила на 4х2080 при 10 секундах на ход рисует чёрным +0,6. Хотя очевидно, что тут не нужно и разрядником быть, чтобы оформить абсолютно тривиальный вечный шах.
А за 2-3 хода до этого? Правильно, было +1,5, хотя у белых всегда был форсированный вечный шах, разумеется.
Vizvezdenec вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Maratka (07.03.2019)
Старый 07.03.2019, 14:53   #2470
Neofelis
2 разряд
 
Аватар для Neofelis
 
Регистрация: 14.02.2019
Сообщений: 311
Сказал(а) спасибо: 0
Поблагодарили 149 раз(а) в 107 сообщениях
Репутация: 10
По умолчанию Re: LCZero

Проблема известная, как и ее решение. Но на данном этапе никто не хочет добавлять human knowledge, поскольку это "zero" проект. Думаю, в будущем нас ждет форк и появится Лила, цель которой -- самый сильный движок, а не принцип зеро. Туда войдет и ручной подбор дебютов, и "костыли" с вечным шахом, крепостями, бисбалансы и т.д. Причем, это будет решаться не дописыванием кода, а наигрыванием кастомных позиций самой Лилой.
Neofelis вне форума   Ответить с цитированием
Старый 07.03.2019, 15:05   #2471
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Цитата: Сообщение от Neofelis
Проблема известная, как и ее решение. Но на данном этапе никто не хочет добавлять human knowledge, поскольку это "zero" проект. Думаю, в будущем нас ждет форк и появится Лила, цель которой -- самый сильный движок, а не принцип зеро. Туда войдет и ручной подбор дебютов, и "костыли" с вечным шахом, крепостями, бисбалансы и т.д. Причем, это будет решаться не дописыванием кода, а наигрыванием кастомных позиций самой Лилой.
После добавления эндшпильных таблиц ни о каком "zero" речи уже быть не может, вообще говоря.
Vizvezdenec вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Maratka (07.03.2019)
Старый 07.03.2019, 16:00   #2472
Neofelis
2 разряд
 
Аватар для Neofelis
 
Регистрация: 14.02.2019
Сообщений: 311
Сказал(а) спасибо: 0
Поблагодарили 149 раз(а) в 107 сообщениях
Репутация: 10
По умолчанию Re: LCZero

Не совсем так. В комьюнити велись споры по этому поводу, и сошлись на том, что эндшпильные таблицы -- это не подсказка человека. То-есть, зеро принцип относится только к знаниям человека о шахматах.
Neofelis вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
svoitsl (07.03.2019)
Старый 07.03.2019, 16:25   #2473
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Magystr
о оболочка не предусматривает такое отображение оценки.
Fritz 15 предусматривает.
Неужто остальные такие плохие? Не думаю. Видать просто это непривычно для потребителя, потому и сделали пересчет.

Maratka вне форума   Ответить с цитированием
Старый 07.03.2019, 16:29   #2474
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Neofelis
Причем, это будет решаться не дописыванием кода, а наигрыванием кастомных позиций самой Лилой.
Цитата: Сообщение от Neofelis
То-есть, зеро принцип относится только к знаниям человека о шахматах.
Наигрывание позиций - это тоже не зеро-принцип, это типичное ручное натаскивание на слабые места.
Зеро это: вот тебе правила, вот тебе стартовая позиция. Учись!

Цитата: Сообщение от Neofelis
Не совсем так. В комьюнити велись споры по этому поводу, и сошлись на том, что эндшпильные таблицы -- это не подсказка человека.
Как следствие, книги, составленные на основе игры движков без книг тоже не являются знаниями человека.

Последний раз редактировалось Maratka; 07.03.2019 в 17:05.
Maratka вне форума   Ответить с цитированием
Старый 07.03.2019, 17:27   #2475
Neofelis
2 разряд
 
Аватар для Neofelis
 
Регистрация: 14.02.2019
Сообщений: 311
Сказал(а) спасибо: 0
Поблагодарили 149 раз(а) в 107 сообщениях
Репутация: 10
По умолчанию Re: LCZero

Цитата:
Наигрывание позиций - это тоже не зеро-принцип, это типичное ручное натаскивание на слабые места.
Зеро это: вот тебе правила, вот тебе стартовая позиция. Учись!
Так и я о том же и написал. Если скармливать Лиле опредленные позиции, то это уже не зеро. Потому и не делают сейчас.
Neofelis вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Maratka (07.03.2019)
Старый 07.03.2019, 18:06   #2476
Asunta
Гроссмейстер
 
Аватар для Asunta
 
Регистрация: 10.07.2018
Сообщений: 1,406
Сказал(а) спасибо: 776
Поблагодарили 2,282 раз(а) в 935 сообщениях
Репутация: 230
По умолчанию Re: LCZero

По протоколу UCI движок должен что-то писать в Depth-позицию.
Анализ в усечённом АВ-дереве, где набор глубины приводит к разрастанию
дерева и замедлению анализа с увеличением глубины, прост для понимания..

А что такое Depth(N) для Lc0 ( ? )
То же, что и для АВ-движка или (N) неких "других" итераций ( ? )

Что конкретно Lc0 делает для углубления, скажем, на очередной 1 полуход,
имея сравнительно небольшой файл сети ~45MB ( ? )
Asunta вне форума   Ответить с цитированием
Старый 07.03.2019, 18:11   #2477
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Asunta, Лила не ищет по сети, Лила строит дерево поиска.
sovaz1997 вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Asunta (07.03.2019)
Старый 07.03.2019, 18:24   #2478
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от sovaz1997
Asunta, Лила не ищет по сети, Лила строит дерево поиска.
А как его строит?
Вот например, 8/4k3/8/8/8/8/3Q4/5K2 w - - 0 3
будет ли рассмотрен ход Qd7+, если отмотать пленку на скажем пять ходов назад, когда позиция была ну что-то вроде например:
3b4/4pk2/3P4/5N2/8/8/3Q4/5K2 w - - 0 1
(первый FEN получается из второго ну например так:
{[#]} 1. dxe7 Bxe7 2. Nxe7 Kxe7 *)

Т.е. есть ли отсечение заведомо глупых ходов?
Maratka вне форума   Ответить с цитированием
Старый 07.03.2019, 18:26   #2479
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Maratka, дерево поиска MCTS и нейронная сеть Лилы - это 2 разные вещи. Абсолютно разные. Причем они даже находятся в разных местах: в ОЗУ и на видеокарте.

Нейронная сеть - это нейроны и связи, да и только. Там нет места позициям. И никакого запоминания позиций нет.
sovaz1997 вне форума   Ответить с цитированием
Старый 07.03.2019, 18:29   #2480
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

А какая разница, где оно находится?
из 3b4/4pk2/3P4/5N2/8/8/3Q4/5K2 w - - 0 1
можно прийти к
8/4k3/8/8/8/8/3Q4/5K2 w - - 0 3 ?

Можно!

Легален ли ход Qd7+ ?
Легален!

Так будет ли LZ просматривать вариант Qd7+ в позиции 3b4/4pk2/3P4/5N2/8/8/3Q4/5K2 w - - 0 1 или не будет?

___
Это чисто так пример. Позиции могут быть гораздо тоньше, с гораздо бОльшим материалом на доске.
Maratka вне форума   Ответить с цитированием
Старый 07.03.2019, 18:31   #2481
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Я имею ввиду, что нейронная сеть - это вообще не про дерево поиска. Они не пересекаются. Разница в том, что нейронная сеть считается на видеокарте, а дереву поиска она не нужна (зачем там матрицы перемножать?)
Лила не запоминает связи между позициями и ходами, которые приводят к позициям.
sovaz1997 вне форума   Ответить с цитированием
Старый 07.03.2019, 18:31   #2482
Asunta
Гроссмейстер
 
Аватар для Asunta
 
Регистрация: 10.07.2018
Сообщений: 1,406
Сказал(а) спасибо: 776
Поблагодарили 2,282 раз(а) в 935 сообщениях
Репутация: 230
По умолчанию Re: LCZero

Метод Монте-Карло для поиска в дереве:

https://habr.com/ru/post/282522/
http://ru.knowledgr.com/18212867/%D0...80%D0%BB%D0%BE
Asunta вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
sovaz1997 (07.03.2019)
Старый 07.03.2019, 18:44   #2483
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от sovaz1997
Я имею ввиду, что нейронная сеть - это вообще не про дерево поиска. Они не пересекаются.
А я имею в виду, что для того, чтобы оценить позицию после следующего хода, нужно, чтобы кто-то сказал варианты следующего хода.
И берутся эти варианты из чего-то вроде movegen.cpp (кстати в первых версиях LZ это файл был банально скопирован, возможно с небольшими переделками) с проекта SF.
Maratka вне форума   Ответить с цитированием
Старый 07.03.2019, 18:47   #2484
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Maratka, ну, из банального генератора ходов и берутся.
А MCTS уже определяет, куда дерево поиска лучше расширять.
sovaz1997 вне форума   Ответить с цитированием
Старый 07.03.2019, 22:19   #2485
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от sovaz1997
А MCTS уже определяет, куда дерево поиска лучше расширять.
Т.е. LZ проверяет не все варианты ходов, а обрезает дерево, может агрессивнее и точнее чем SF, может поверхностно и грубо, но таки обрезает?
Maratka вне форума   Ответить с цитированием
Старый 07.03.2019, 22:20   #2486
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
Т.е. LZ проверяет не все варианты ходов, а обрезает дерево, может агрессивнее и точнее чем SF, может поверхностно и грубо, но таки обрезает?
Можно сказать, да. Точнее, но при этом в 1000 раз меньше узлов перебирает.
sovaz1997 вне форума   Ответить с цитированием
Старый 07.03.2019, 22:23   #2487
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от sovaz1997
Точнее, но при этом в 1000 раз меньше узлов перебирает.
А за счет чего точнее?
Ведь чтобы узнать, что ход глупый, нужно его так или иначе оценить?

_____
Мне вот кажется, что наоборот - менее точно. За счет чего не набирает и половины глубины от SF, но зато проверяет больше позиций на каждой глубине, и потому с меньшей вероятностью пропускает хороший ход.
Maratka вне форума   Ответить с цитированием
Старый 07.03.2019, 22:31   #2488
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
А за счет чего точнее?
Ведь чтобы узнать, что ход глупый, нужно его так или иначе оценить?

_____
Мне вот кажется, что наоборот - менее точно. За счет чего не набирает и половины глубины от SF, но зато проверяет больше позиций на каждой глубине, и потому с меньшей вероятностью пропускает хороший ход.
Ну как может быть менее точно, если при скорости в 1000 раз ниже, чем у Стока, играет почти на его уровне? Нейросеть, кстати, не только оценивает позицию, но и выбирает ходы-кандидаты. За счёт этого в совокупности Лила и имеет достаточно хорошее дерево поиска.
sovaz1997 вне форума   Ответить с цитированием
Старый 07.03.2019, 22:43   #2489
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от sovaz1997
Ну как может быть менее точно, если при скорости в 1000 раз ниже, чем у Стока, играет почти на его уровне?
Ну вот именно по этой причине.
Если скажем LZ рассматривает в среднем три хода на позицию, а SF - два, то при равной оценке LZ с меньшей вероятностью пропустит действительно хороший ход. Но а так как оценка у LZ явно сложнее, то увеличение потенциально хороших просмотренных ходов на позицию резко повышает вероятность нахождения действительно лучшего. Отсюда же растет и относительно низкая глубина: сложно достичь высокой глубины, если ты изначально пытаешься работать в ширину.
Maratka вне форума   Ответить с цитированием
Старый 08.03.2019, 11:40   #2490
Кевин
Гроссмейстер
 
Аватар для Кевин
 
Регистрация: 02.07.2016
Адрес: Сахалин
Сообщений: 4,792
Сказал(а) спасибо: 5,116
Поблагодарили 14,196 раз(а) в 4,064 сообщениях
Записей в дневнике: 251
Репутация: Кевин отключил(а) отображение уровня репутации
По умолчанию Re: LCZero

v0.21.0 финальный релиз (без изменений в сравнении с последним кандидатским) вышел.

https://github.com/LeelaChessZero/lc0/releases
__________________
ICCF SIM 2547, International Arbiter, ICCF "Promotional Tournaments - Server" Organiser, RCCA Chess 960 Champion, ICCF 4th Chess 960 World Cup Final Winner.
Кевин вне форума   Ответить с цитированием
6 пользователя(ей) сказали cпасибо:
Rom77 (08.03.2019), SergeyMZ (08.03.2019), sovaz1997 (08.03.2019), Viktor (08.03.2019), Александр (10.03.2019), Философ (08.03.2019)
Ответ


Здесь присутствуют: 5 (пользователей: 0 , гостей: 5)
 

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 19:56. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.7
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
Рейтинг@Mail.ru