LCZero - Страница 83 - Forchess

Maratka · 07.03.2019, 10:41

Цитата: Сообщение от Viktor

Так протестировано уже давно и в большом количестве. Было установлено, что ноль - лучший показатель.

Для чего?

Maratka · 07.03.2019, 10:45

Цитата: Сообщение от Viktor

Так и не помог он только потому, что это "игрушка программистов", а не объективная оценка позиции.

Вовсе нет. Просто с ненулевой вероятностью сильнейший может проиграть слабейшему. Разницы превращается в пшик при 300 ELO дистанции (и при условии, что движки однотипные), однако при 100 ELO она вполне себе несколько процентов шанса: чуть повезло с дебютом, чуть ошибся соперник, чуть сам угадал лучший ход- и вот тебе. На длинном же матче положительный контемпт дает некоторый бонус против слабейших.

Vizvezdenec · 07.03.2019, 10:57

Цитата: Сообщение от Viktor

А введение контемпта? Это же сделано для "вырубки хвоста" в борьбе с Houdini и Komodo. В то время, как нулевой - лучший!

Не совсем.
Во-первых, "contempt" в стокфише был 100 лет. Просто он не работал

Ну как, оценку он завышал, но % набранных очков в играх более слабых движков не повышал.
Да, невыход в финал TCEC 10 заставил пересмотреть подход и в конце концов сделать уже имеющуюся настройку работающей, а не просто косметической.
Более того, работающий contempt породил dynamic contempt, который даёт эло в игре против самого себя.
А вот что "нулевой - лучший" - это все утверждают, но никто не удосужился привести хоть одно доказательство.
В то время как недавно только 24 проходил два [-3;1] против 0 и оба с плюсом по играм, в своё время это делал contempt 20 и 21 тоже.
Тут дело такое - да, он искусственно завышает оценку. Ну и что? В конце концов, оценка с точки зрения движка это просто тот параметр, для максимизации которого выбирается ход в каждый момент времени. Скажем так, добавить к оценке 2 стабильно - и ничего не меняется ни в силе игры движка, ни в выборе ходов, только вот оценку первому ходу e4 он будет давать +2.5

Contempt же переформирует дерево поиска таким образом, чтобы при прочих равных позиция с бОльшим числом материала на доске имела оценку несколько выше, чем позиция с такой же оценкой, но с меньшим числом материала.
И я абсолютно не понимаю, почему все считают самоочевидным, что это ухудшает игру против самого себя. По практически всем тестам до 20-25 Contempt это не ухудшает ничего особо, по крайней мере на разрешении fishtest это неизмеримо, а оно очень неплохое. Возможно, то, что он слегка отпинывает ничьи от нуля (во многих случаях) с помощью contempt позволяет ему находить более эффективные продолжения вместо ничьих повторениями (это моя гипотеза, за верность не ручаюсь).
Другой вопрос, что при анализе он показывает завышенные оценки, но, как мне кажется, если привыкнуть, то можно и так использовать (другой вопрос с анализами с заполнениями деревьев и прочие интересные вещи - я тут не специалист и судить не берусь, может быть, он там и правда мешает).
Кстати говоря, парочка моих знакомых занималась анализами сложных позиций, в достаточно многих случаях изменение contempt с 0 на 20+ позволяет уменьшить время нахождения лучшего хода в десятки раз. В достаточно многих и увеличить, правда

sovaz1997 · 07.03.2019, 11:10

B все-таки, не достигли пока что 32930:

Код:

   # PLAYER        : RATING  ERROR  POINTS   (%)  PLAYED     W     L     D  D(%)  CFS(%)
   1 lc0.net.32930 :    0.0   ----  2164.0    65    3354  1272   298  1784    53     100
>>>2 lc0.net.41350 :  -32.5   12.0  1059.5    53    1987   418   286  1283    65      98<<< New
   3 lc0.net.11258 :  -44.8   10.8  1897.5    58    3257   977   439  1841    57      62
   4 lc0.net.41306 :  -46.6   12.5  1004.5    54    1874   426   291  1157    62      75
   5 lc0.net.36089 :  -51.0   10.9  1971.5    58    3404  1006   467  1931    57     100
   6 lc0.net.41150 :  -75.9   11.2  1595.5    55    2901   762   472  1667    57      54
   7 lc0.net.41250 :  -76.5   11.4  1361.0    53    2560   586   424  1550    61      84
   8 lc0.net.41200 :  -82.6   11.4  1311.0    52    2545   552   475  1518    60     100
  10 lc0.net.50300 : -142.5   12.3   839.0    39    2161   252   735  1174    54     100
  11 lc0.net.50250 : -177.3   12.3   837.5    39    2159   249   733  1177    55      98
  12 lc0.net.50200 : -192.2   12.9   713.0    36    1976   209   759  1008    51      98
  13 lc0.net.50150 : -204.9   11.1  1331.5    36    3745   418  1500  1827    49     100

White advantage = 28.55 +/- 1.75
Draw rate (equal opponents) = 61.70 % +/- 0.41

Viktor · 07.03.2019, 11:43

Цитата: Сообщение от Vizvezdenec

Другой вопрос, что при анализе он показывает завышенные оценки, но, как мне кажется, если привыкнуть, то можно и так использовать (другой вопрос с анализами с заполнениями деревьев и прочие интересные вещи - я тут не специалист и судить не берусь, может быть, он там и правда мешает).

При анализе в ИДеА оценки в дереве с каждым ходом (полуходом) постоянно "прыгают" то в одну, то в другую сторону. Этим создается дезинформация в действительно правильной оценке.
Что же касается доводов в пользу контемпта при тестировании, игре движков, то я согласен на все 100%. Более того, запуская движок в бесконечном режиме на длительное время, вполне положительно большее значение, чем ноль, так как появятся более перспективные продолжения, чем простое равенство.

Magystr · 07.03.2019, 12:01

Цитата: Сообщение от Viktor

По поводу оценки... не слишком ли она завышена у Лилы?

Здесь надо понимать, что в отличие от остальных движков, Лила выдает оценку позиции не в сантипешках, а в процентах. То есть, оценка позиции у нее: 68,17%, к примеру. Но оболочка не предусматривает такое отображение оценки. Чтобы пользователям было более-менее понятно, используется формула, которая пересчитывает эти проценты в привычные всем сантипешки. Получается, предположим, +1.45 пешек.
При этом понятно, что 50% должны соответствовать строгому нулю пешек.
Чему должны соответствовать 100% (или 0%) - уже не очень понятно. Все промежуточные значения - тем более. Разработчики Лилы используют какую-то формулу пересчета, но на каких-то диапазонах она не очень точная. Особенно там, где оценка близка к 50-ти процентам (в пределах +/- 1 пешки).

Vizvezdenec · 07.03.2019, 12:53

Цитата: Сообщение от Magystr

Здесь надо понимать, что в отличие от остальных движков, Лила выдает оценку позиции не в сантипешках, а в процентах. То есть, оценка позиции у нее: 68,17%, к примеру. Но оболочка не предусматривает такое отображение оценки. Чтобы пользователям было более-менее понятно, используется формула, которая пересчитывает эти проценты в привычные всем сантипешки. Получается, предположим, +1.45 пешек.
При этом понятно, что 50% должны соответствовать строгому нулю пешек.
Чему должны соответствовать 100% (или 0%) - уже не очень понятно. Все промежуточные значения - тем более. Разработчики Лилы используют какую-то формулу пересчета, но на каких-то диапазонах она не очень точная. Особенно там, где оценка близка к 50-ти процентам (в пределах +/- 1 пешки).

Да нет.
Пересчёт % оценки в оценки в сантипешках делать очень несложно.
Делается это так - играет миллион (условно) партий и строится для каждой оценки (с шагом, например, 0,1) % набранных очков в партии, где эта оценка достигалась.
Обратная процедура делалась в TCEC для пересчёта оценки стокфиша в % набранных очков.
И вот что можно сказать - у стокфиша оценка менее "вытянутая" по краям, +2 это 90% набранных очков примерно, у Лилы +2 это типа 70, у стокфиша +8 это >99,9%, у Лилы 95% и т.д.
При этом у SF ещё оценка и более агрессивная, чем у Гудини/Комодо.
А по поводу того, о чём говорят адвансеры - Лила легко может показывать оценки вплоть до +5 (или больше) в позициях, где противник может форсировать ничью.
Причём в отличие от любого АВ движка, который будет так делать, она не пропускает в поиске форсированный вариант, она не понимает, что он ничейный.
Условно говоря - SF может не увидеть какой-то тактики, которая даёт вечный шах. Как только он её видит - оценка до 0 падает.
Лила же просто не понимает, что это - вечный шах, и будет 50 ходов ходить королём по кругу, уменьшая оценку на 0,1 каждый ход. При этом оценка бредовая как в сантипешках, так и в %, где я видел и 90+% ожидаемых очков в битых ничьих.
Ну вот даже недавно в такой позиции
5rk1/5p2/4p3/5pQ1/8/8/8/8 w - -
(остальные фигуры не важны, по общему материалу на доске у чёрных лишняя ладья) Лила выдавала какие-то там +1, +0,8 (со стороны чёрных) и т.д.
Хотя как бы очевидно, что тут вечный шах (фигуры чёрных остальные стоят так, что закрываться от шахов нечем).

Magystr · 07.03.2019, 13:11

Цитата: Сообщение от Vizvezdenec

Да нет.
Пересчёт % оценки в оценки в сантипешках делать очень несложно.
Делается это так - играет миллион (условно) партий и строится для каждой оценки (с шагом, например, 0,1) % набранных очков в партии, где эта оценка достигалась...

Я не люблю заводить дискуссии. Все равно каждый останется при своем мнении. Но, прошу Вас, уточните. Что из написанного мной неправильно?
То что можно взять миллион партий - это не значит, что они были взяты.
В любом случае, перевод матожидания в сантипешки, и обратно - очень условный и ВСЕГДА сопровождается потерей точности, иногда существенной.

Vizvezdenec · 07.03.2019, 14:38

Цитата: Сообщение от Magystr

Я не люблю заводить дискуссии. Все равно каждый останется при своем мнении. Но, прошу Вас, уточните. Что из написанного мной неправильно?
То что можно взять миллион партий - это не значит, что они были взяты.
В любом случае, перевод матожидания в сантипешки, и обратно - очень условный и ВСЕГДА сопровождается потерей точности, иногда существенной.

1) Не очень-то он и условный. Т.к. обратный перевод делается очень просто, то и прямой тоже сделать можно, придётся только "откалибровать" Лилу по стокфишу (условно). Что сейчас стоит просто эмпирическая формула - вопрос другой;
2) Тем не менее, это оригинальная фраза не про это, а про "позиции, где слабейшая сторона может форсировать ничью, Лила это видит, но оценивает не как 0,00, а как +5/+3/+1". И причём если там путь к ничьей ещё нетривиальный, то ладно, но во многих случаях там ничью легко сделаю и я, а не то что движок уровня Лилы, SF или даже Laser. Вот именно про это адвансеры в треде говорят как про "совсем неправильную оценку позиции" с точки зрения как адванса, так и вообще здравого смысла (насколько я понимаю, по крайней мере).
Я Вам скинул FEN - вот в такой позиции Лила на 4х2080 при 10 секундах на ход рисует чёрным +0,6. Хотя очевидно, что тут не нужно и разрядником быть, чтобы оформить абсолютно тривиальный вечный шах.
А за 2-3 хода до этого? Правильно, было +1,5, хотя у белых всегда был форсированный вечный шах, разумеется.

Neofelis · 07.03.2019, 14:53

Проблема известная, как и ее решение. Но на данном этапе никто не хочет добавлять human knowledge, поскольку это "zero" проект. Думаю, в будущем нас ждет форк и появится Лила, цель которой -- самый сильный движок, а не принцип зеро. Туда войдет и ручной подбор дебютов, и "костыли" с вечным шахом, крепостями, бисбалансы и т.д. Причем, это будет решаться не дописыванием кода, а наигрыванием кастомных позиций самой Лилой.

Vizvezdenec · 07.03.2019, 15:05

Цитата: Сообщение от Neofelis

Проблема известная, как и ее решение. Но на данном этапе никто не хочет добавлять human knowledge, поскольку это "zero" проект. Думаю, в будущем нас ждет форк и появится Лила, цель которой -- самый сильный движок, а не принцип зеро. Туда войдет и ручной подбор дебютов, и "костыли" с вечным шахом, крепостями, бисбалансы и т.д. Причем, это будет решаться не дописыванием кода, а наигрыванием кастомных позиций самой Лилой.

После добавления эндшпильных таблиц ни о каком "zero" речи уже быть не может, вообще говоря.

Neofelis · 07.03.2019, 16:00

Не совсем так. В комьюнити велись споры по этому поводу, и сошлись на том, что эндшпильные таблицы -- это не подсказка человека. То-есть, зеро принцип относится только к знаниям человека о шахматах.

Maratka · 07.03.2019, 16:25

Цитата: Сообщение от Magystr

о оболочка не предусматривает такое отображение оценки.

Fritz 15 предусматривает.
Неужто остальные такие плохие? Не думаю. Видать просто это непривычно для потребителя, потому и сделали пересчет.

Maratka · 07.03.2019, 16:29

Цитата: Сообщение от Neofelis

Причем, это будет решаться не дописыванием кода, а наигрыванием кастомных позиций самой Лилой.

Цитата: Сообщение от Neofelis

То-есть, зеро принцип относится только к знаниям человека о шахматах.

Наигрывание позиций - это тоже не зеро-принцип, это типичное ручное натаскивание на слабые места.
Зеро это: вот тебе правила, вот тебе стартовая позиция. Учись!

Цитата: Сообщение от Neofelis

Не совсем так. В комьюнити велись споры по этому поводу, и сошлись на том, что эндшпильные таблицы -- это не подсказка человека.

Как следствие, книги, составленные на основе игры движков без книг тоже не являются знаниями человека.

Neofelis · 07.03.2019, 17:27

Цитата:

Наигрывание позиций - это тоже не зеро-принцип, это типичное ручное натаскивание на слабые места.
Зеро это: вот тебе правила, вот тебе стартовая позиция. Учись!

Так и я о том же и написал. Если скармливать Лиле опредленные позиции, то это уже не зеро. Потому и не делают сейчас.

Asunta · 07.03.2019, 18:06

По протоколу UCI движок должен что-то писать в Depth-позицию.
Анализ в усечённом АВ-дереве, где набор глубины приводит к разрастанию
дерева и замедлению анализа с увеличением глубины, прост для понимания..

А что такое Depth(N) для Lc0 ( ? )
То же, что и для АВ-движка или (N) неких "других" итераций ( ? )

Что конкретно Lc0 делает для углубления, скажем, на очередной 1 полуход,
имея сравнительно небольшой файл сети ~45MB ( ? )

sovaz1997 · 07.03.2019, 18:11

Asunta, Лила не ищет по сети, Лила строит дерево поиска.

Maratka · 07.03.2019, 18:24

Цитата: Сообщение от sovaz1997

Asunta, Лила не ищет по сети, Лила строит дерево поиска.

А как его строит?
Вот например, 8/4k3/8/8/8/8/3Q4/5K2 w - - 0 3
будет ли рассмотрен ход Qd7+, если отмотать пленку на скажем пять ходов назад, когда позиция была ну что-то вроде например:
3b4/4pk2/3P4/5N2/8/8/3Q4/5K2 w - - 0 1
(первый FEN получается из второго ну например так:
{[#]} 1. dxe7 Bxe7 2. Nxe7 Kxe7 *)

Т.е. есть ли отсечение заведомо глупых ходов?

sovaz1997 · 07.03.2019, 18:26

Maratka, дерево поиска MCTS и нейронная сеть Лилы - это 2 разные вещи. Абсолютно разные. Причем они даже находятся в разных местах: в ОЗУ и на видеокарте.

Нейронная сеть - это нейроны и связи, да и только. Там нет места позициям. И никакого запоминания позиций нет.

Maratka · 07.03.2019, 18:29

А какая разница, где оно находится?
из 3b4/4pk2/3P4/5N2/8/8/3Q4/5K2 w - - 0 1
можно прийти к
8/4k3/8/8/8/8/3Q4/5K2 w - - 0 3 ?

Можно!

Легален ли ход Qd7+ ?
Легален!

Так будет ли LZ просматривать вариант Qd7+ в позиции 3b4/4pk2/3P4/5N2/8/8/3Q4/5K2 w - - 0 1 или не будет?

___
Это чисто так пример. Позиции могут быть гораздо тоньше, с гораздо бОльшим материалом на доске.

sovaz1997 · 07.03.2019, 18:31

Я имею ввиду, что нейронная сеть - это вообще не про дерево поиска. Они не пересекаются. Разница в том, что нейронная сеть считается на видеокарте, а дереву поиска она не нужна (зачем там матрицы перемножать?)
Лила не запоминает связи между позициями и ходами, которые приводят к позициям.

Asunta · 07.03.2019, 18:31

Метод Монте-Карло для поиска в дереве:

https://habr.com/ru/post/282522/
http://ru.knowledgr.com/18212867/%D0...80%D0%BB%D0%BE

Maratka · 07.03.2019, 18:44

Цитата: Сообщение от sovaz1997

Я имею ввиду, что нейронная сеть - это вообще не про дерево поиска. Они не пересекаются.

А я имею в виду, что для того, чтобы оценить позицию после следующего хода, нужно, чтобы кто-то сказал варианты следующего хода.
И берутся эти варианты из чего-то вроде movegen.cpp (кстати в первых версиях LZ это файл был банально скопирован, возможно с небольшими переделками) с проекта SF.

sovaz1997 · 07.03.2019, 18:47

Maratka, ну, из банального генератора ходов и берутся.
А MCTS уже определяет, куда дерево поиска лучше расширять.

Maratka · 07.03.2019, 22:19

Цитата: Сообщение от sovaz1997

А MCTS уже определяет, куда дерево поиска лучше расширять.

Т.е. LZ проверяет не все варианты ходов, а обрезает дерево, может агрессивнее и точнее чем SF, может поверхностно и грубо, но таки обрезает?

sovaz1997 · 07.03.2019, 22:20

Цитата: Сообщение от Maratka

Т.е. LZ проверяет не все варианты ходов, а обрезает дерево, может агрессивнее и точнее чем SF, может поверхностно и грубо, но таки обрезает?

Можно сказать, да. Точнее, но при этом в 1000 раз меньше узлов перебирает.

Maratka · 07.03.2019, 22:23

Цитата: Сообщение от sovaz1997

Точнее, но при этом в 1000 раз меньше узлов перебирает.

А за счет чего точнее?
Ведь чтобы узнать, что ход глупый, нужно его так или иначе оценить?

_____
Мне вот кажется, что наоборот - менее точно. За счет чего не набирает и половины глубины от SF, но зато проверяет больше позиций на каждой глубине, и потому с меньшей вероятностью пропускает хороший ход.

sovaz1997 · 07.03.2019, 22:31

Цитата: Сообщение от Maratka

А за счет чего точнее?
Ведь чтобы узнать, что ход глупый, нужно его так или иначе оценить?

_____
Мне вот кажется, что наоборот - менее точно. За счет чего не набирает и половины глубины от SF, но зато проверяет больше позиций на каждой глубине, и потому с меньшей вероятностью пропускает хороший ход.

Ну как может быть менее точно, если при скорости в 1000 раз ниже, чем у Стока, играет почти на его уровне? Нейросеть, кстати, не только оценивает позицию, но и выбирает ходы-кандидаты. За счёт этого в совокупности Лила и имеет достаточно хорошее дерево поиска.

Maratka · 07.03.2019, 22:43

Цитата: Сообщение от sovaz1997

Ну как может быть менее точно, если при скорости в 1000 раз ниже, чем у Стока, играет почти на его уровне?

Ну вот именно по этой причине.
Если скажем LZ рассматривает в среднем три хода на позицию, а SF - два, то при равной оценке LZ с меньшей вероятностью пропустит действительно хороший ход. Но а так как оценка у LZ явно сложнее, то увеличение потенциально хороших просмотренных ходов на позицию резко повышает вероятность нахождения действительно лучшего. Отсюда же растет и относительно низкая глубина: сложно достичь высокой глубины, если ты изначально пытаешься работать в ширину.

Кевин · 08.03.2019, 11:40

v0.21.0 финальный релиз (без изменений в сравнении с последним кандидатским) вышел.

https://github.com/LeelaChessZero/lc0/releases

07.03.2019, 10:41	#2461
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Viktor Так протестировано уже давно и в большом количестве. Было установлено, что ноль - лучший показатель. Для чего?

07.03.2019, 10:45	#2462
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Viktor Так и не помог он только потому, что это "игрушка программистов", а не объективная оценка позиции. Вовсе нет. Просто с ненулевой вероятностью сильнейший может проиграть слабейшему. Разницы превращается в пшик при 300 ELO дистанции (и при условии, что движки однотипные), однако при 100 ELO она вполне себе несколько процентов шанса: чуть повезло с дебютом, чуть ошибся соперник, чуть сам угадал лучший ход- и вот тебе. На длинном же матче положительный контемпт дает некоторый бонус против слабейших.

07.03.2019, 10:57	#2463
Vizvezdenec Гроссмейстер Регистрация: 30.05.2018 Адрес: Севастополь Сообщений: 4,022 Сказал(а) спасибо: 56 Поблагодарили 5,294 раз(а) в 2,673 сообщениях Репутация: 216	Re: LCZero Цитата: Сообщение от Viktor А введение контемпта? Это же сделано для "вырубки хвоста" в борьбе с Houdini и Komodo. В то время, как нулевой - лучший! Не совсем. Во-первых, "contempt" в стокфише был 100 лет. Просто он не работал Ну как, оценку он завышал, но % набранных очков в играх более слабых движков не повышал. Да, невыход в финал TCEC 10 заставил пересмотреть подход и в конце концов сделать уже имеющуюся настройку работающей, а не просто косметической. Более того, работающий contempt породил dynamic contempt, который даёт эло в игре против самого себя. А вот что "нулевой - лучший" - это все утверждают, но никто не удосужился привести хоть одно доказательство. В то время как недавно только 24 проходил два [-3;1] против 0 и оба с плюсом по играм, в своё время это делал contempt 20 и 21 тоже. Тут дело такое - да, он искусственно завышает оценку. Ну и что? В конце концов, оценка с точки зрения движка это просто тот параметр, для максимизации которого выбирается ход в каждый момент времени. Скажем так, добавить к оценке 2 стабильно - и ничего не меняется ни в силе игры движка, ни в выборе ходов, только вот оценку первому ходу e4 он будет давать +2.5 Contempt же переформирует дерево поиска таким образом, чтобы при прочих равных позиция с бОльшим числом материала на доске имела оценку несколько выше, чем позиция с такой же оценкой, но с меньшим числом материала. И я абсолютно не понимаю, почему все считают самоочевидным, что это ухудшает игру против самого себя. По практически всем тестам до 20-25 Contempt это не ухудшает ничего особо, по крайней мере на разрешении fishtest это неизмеримо, а оно очень неплохое. Возможно, то, что он слегка отпинывает ничьи от нуля (во многих случаях) с помощью contempt позволяет ему находить более эффективные продолжения вместо ничьих повторениями (это моя гипотеза, за верность не ручаюсь). Другой вопрос, что при анализе он показывает завышенные оценки, но, как мне кажется, если привыкнуть, то можно и так использовать (другой вопрос с анализами с заполнениями деревьев и прочие интересные вещи - я тут не специалист и судить не берусь, может быть, он там и правда мешает). Кстати говоря, парочка моих знакомых занималась анализами сложных позиций, в достаточно многих случаях изменение contempt с 0 на 20+ позволяет уменьшить время нахождения лучшего хода в десятки раз. В достаточно многих и увеличить, правда

07.03.2019, 11:43	#2465
Viktor Эксперт Регистрация: 07.06.2016 Сообщений: 5,907 Сказал(а) спасибо: 13,814 Поблагодарили 12,717 раз(а) в 4,521 сообщениях Репутация: 726	Re: LCZero Цитата: Сообщение от Vizvezdenec Другой вопрос, что при анализе он показывает завышенные оценки, но, как мне кажется, если привыкнуть, то можно и так использовать (другой вопрос с анализами с заполнениями деревьев и прочие интересные вещи - я тут не специалист и судить не берусь, может быть, он там и правда мешает). При анализе в ИДеА оценки в дереве с каждым ходом (полуходом) постоянно "прыгают" то в одну, то в другую сторону. Этим создается дезинформация в действительно правильной оценке. Что же касается доводов в пользу контемпта при тестировании, игре движков, то я согласен на все 100%. Более того, запуская движок в бесконечном режиме на длительное время, вполне положительно большее значение, чем ноль, так как появятся более перспективные продолжения, чем простое равенство.

07.03.2019, 12:01	#2466
Magystr 2 разряд Регистрация: 03.08.2016 Сообщений: 311 Сказал(а) спасибо: 85 Поблагодарили 227 раз(а) в 123 сообщениях Репутация: 10	Re: LCZero Цитата: Сообщение от Viktor По поводу оценки... не слишком ли она завышена у Лилы? Здесь надо понимать, что в отличие от остальных движков, Лила выдает оценку позиции не в сантипешках, а в процентах. То есть, оценка позиции у нее: 68,17%, к примеру. Но оболочка не предусматривает такое отображение оценки. Чтобы пользователям было более-менее понятно, используется формула, которая пересчитывает эти проценты в привычные всем сантипешки. Получается, предположим, +1.45 пешек. При этом понятно, что 50% должны соответствовать строгому нулю пешек. Чему должны соответствовать 100% (или 0%) - уже не очень понятно. Все промежуточные значения - тем более. Разработчики Лилы используют какую-то формулу пересчета, но на каких-то диапазонах она не очень точная. Особенно там, где оценка близка к 50-ти процентам (в пределах +/- 1 пешки).

07.03.2019, 12:53	#2467
Vizvezdenec Гроссмейстер Регистрация: 30.05.2018 Адрес: Севастополь Сообщений: 4,022 Сказал(а) спасибо: 56 Поблагодарили 5,294 раз(а) в 2,673 сообщениях Репутация: 216	Re: LCZero Цитата: Сообщение от Magystr Здесь надо понимать, что в отличие от остальных движков, Лила выдает оценку позиции не в сантипешках, а в процентах. То есть, оценка позиции у нее: 68,17%, к примеру. Но оболочка не предусматривает такое отображение оценки. Чтобы пользователям было более-менее понятно, используется формула, которая пересчитывает эти проценты в привычные всем сантипешки. Получается, предположим, +1.45 пешек. При этом понятно, что 50% должны соответствовать строгому нулю пешек. Чему должны соответствовать 100% (или 0%) - уже не очень понятно. Все промежуточные значения - тем более. Разработчики Лилы используют какую-то формулу пересчета, но на каких-то диапазонах она не очень точная. Особенно там, где оценка близка к 50-ти процентам (в пределах +/- 1 пешки). Да нет. Пересчёт % оценки в оценки в сантипешках делать очень несложно. Делается это так - играет миллион (условно) партий и строится для каждой оценки (с шагом, например, 0,1) % набранных очков в партии, где эта оценка достигалась. Обратная процедура делалась в TCEC для пересчёта оценки стокфиша в % набранных очков. И вот что можно сказать - у стокфиша оценка менее "вытянутая" по краям, +2 это 90% набранных очков примерно, у Лилы +2 это типа 70, у стокфиша +8 это >99,9%, у Лилы 95% и т.д. При этом у SF ещё оценка и более агрессивная, чем у Гудини/Комодо. А по поводу того, о чём говорят адвансеры - Лила легко может показывать оценки вплоть до +5 (или больше) в позициях, где противник может форсировать ничью. Причём в отличие от любого АВ движка, который будет так делать, она не пропускает в поиске форсированный вариант, она не понимает, что он ничейный. Условно говоря - SF может не увидеть какой-то тактики, которая даёт вечный шах. Как только он её видит - оценка до 0 падает. Лила же просто не понимает, что это - вечный шах, и будет 50 ходов ходить королём по кругу, уменьшая оценку на 0,1 каждый ход. При этом оценка бредовая как в сантипешках, так и в %, где я видел и 90+% ожидаемых очков в битых ничьих. Ну вот даже недавно в такой позиции 5rk1/5p2/4p3/5pQ1/8/8/8/8 w - - (остальные фигуры не важны, по общему материалу на доске у чёрных лишняя ладья) Лила выдавала какие-то там +1, +0,8 (со стороны чёрных) и т.д. Хотя как бы очевидно, что тут вечный шах (фигуры чёрных остальные стоят так, что закрываться от шахов нечем).

07.03.2019, 13:11	#2468
Magystr 2 разряд Регистрация: 03.08.2016 Сообщений: 311 Сказал(а) спасибо: 85 Поблагодарили 227 раз(а) в 123 сообщениях Репутация: 10	Re: LCZero Цитата: Сообщение от Vizvezdenec Да нет. Пересчёт % оценки в оценки в сантипешках делать очень несложно. Делается это так - играет миллион (условно) партий и строится для каждой оценки (с шагом, например, 0,1) % набранных очков в партии, где эта оценка достигалась... Я не люблю заводить дискуссии. Все равно каждый останется при своем мнении. Но, прошу Вас, уточните. Что из написанного мной неправильно? То что можно взять миллион партий - это не значит, что они были взяты. В любом случае, перевод матожидания в сантипешки, и обратно - очень условный и ВСЕГДА сопровождается потерей точности, иногда существенной.

07.03.2019, 14:38	#2469
Vizvezdenec Гроссмейстер Регистрация: 30.05.2018 Адрес: Севастополь Сообщений: 4,022 Сказал(а) спасибо: 56 Поблагодарили 5,294 раз(а) в 2,673 сообщениях Репутация: 216	Re: LCZero Цитата: Сообщение от Magystr Я не люблю заводить дискуссии. Все равно каждый останется при своем мнении. Но, прошу Вас, уточните. Что из написанного мной неправильно? То что можно взять миллион партий - это не значит, что они были взяты. В любом случае, перевод матожидания в сантипешки, и обратно - очень условный и ВСЕГДА сопровождается потерей точности, иногда существенной. 1) Не очень-то он и условный. Т.к. обратный перевод делается очень просто, то и прямой тоже сделать можно, придётся только "откалибровать" Лилу по стокфишу (условно). Что сейчас стоит просто эмпирическая формула - вопрос другой; 2) Тем не менее, это оригинальная фраза не про это, а про "позиции, где слабейшая сторона может форсировать ничью, Лила это видит, но оценивает не как 0,00, а как +5/+3/+1". И причём если там путь к ничьей ещё нетривиальный, то ладно, но во многих случаях там ничью легко сделаю и я, а не то что движок уровня Лилы, SF или даже Laser. Вот именно про это адвансеры в треде говорят как про "совсем неправильную оценку позиции" с точки зрения как адванса, так и вообще здравого смысла (насколько я понимаю, по крайней мере). Я Вам скинул FEN - вот в такой позиции Лила на 4х2080 при 10 секундах на ход рисует чёрным +0,6. Хотя очевидно, что тут не нужно и разрядником быть, чтобы оформить абсолютно тривиальный вечный шах. А за 2-3 хода до этого? Правильно, было +1,5, хотя у белых всегда был форсированный вечный шах, разумеется.

07.03.2019, 14:53	#2470
Neofelis 2 разряд Регистрация: 14.02.2019 Сообщений: 311 Сказал(а) спасибо: 0 Поблагодарили 149 раз(а) в 107 сообщениях Репутация: 10	Re: LCZero Проблема известная, как и ее решение. Но на данном этапе никто не хочет добавлять human knowledge, поскольку это "zero" проект. Думаю, в будущем нас ждет форк и появится Лила, цель которой -- самый сильный движок, а не принцип зеро. Туда войдет и ручной подбор дебютов, и "костыли" с вечным шахом, крепостями, бисбалансы и т.д. Причем, это будет решаться не дописыванием кода, а наигрыванием кастомных позиций самой Лилой.

07.03.2019, 15:05	#2471
Vizvezdenec Гроссмейстер Регистрация: 30.05.2018 Адрес: Севастополь Сообщений: 4,022 Сказал(а) спасибо: 56 Поблагодарили 5,294 раз(а) в 2,673 сообщениях Репутация: 216	Re: LCZero Цитата: Сообщение от Neofelis Проблема известная, как и ее решение. Но на данном этапе никто не хочет добавлять human knowledge, поскольку это "zero" проект. Думаю, в будущем нас ждет форк и появится Лила, цель которой -- самый сильный движок, а не принцип зеро. Туда войдет и ручной подбор дебютов, и "костыли" с вечным шахом, крепостями, бисбалансы и т.д. Причем, это будет решаться не дописыванием кода, а наигрыванием кастомных позиций самой Лилой. После добавления эндшпильных таблиц ни о каком "zero" речи уже быть не может, вообще говоря.

07.03.2019, 16:00	#2472
Neofelis 2 разряд Регистрация: 14.02.2019 Сообщений: 311 Сказал(а) спасибо: 0 Поблагодарили 149 раз(а) в 107 сообщениях Репутация: 10	Re: LCZero Не совсем так. В комьюнити велись споры по этому поводу, и сошлись на том, что эндшпильные таблицы -- это не подсказка человека. То-есть, зеро принцип относится только к знаниям человека о шахматах.

07.03.2019, 16:25	#2473
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Magystr о оболочка не предусматривает такое отображение оценки. Fritz 15 предусматривает. Неужто остальные такие плохие? Не думаю. Видать просто это непривычно для потребителя, потому и сделали пересчет.

07.03.2019, 16:29	#2474
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Neofelis Причем, это будет решаться не дописыванием кода, а наигрыванием кастомных позиций самой Лилой. Цитата: Сообщение от Neofelis То-есть, зеро принцип относится только к знаниям человека о шахматах. Наигрывание позиций - это тоже не зеро-принцип, это типичное ручное натаскивание на слабые места. Зеро это: вот тебе правила, вот тебе стартовая позиция. Учись! Цитата: Сообщение от Neofelis Не совсем так. В комьюнити велись споры по этому поводу, и сошлись на том, что эндшпильные таблицы -- это не подсказка человека. Как следствие, книги, составленные на основе игры движков без книг тоже не являются знаниями человека. Последний раз редактировалось Maratka; 07.03.2019 в 17:05.

07.03.2019, 17:27	#2475
Neofelis 2 разряд Регистрация: 14.02.2019 Сообщений: 311 Сказал(а) спасибо: 0 Поблагодарили 149 раз(а) в 107 сообщениях Репутация: 10	Re: LCZero Цитата: Наигрывание позиций - это тоже не зеро-принцип, это типичное ручное натаскивание на слабые места. Зеро это: вот тебе правила, вот тебе стартовая позиция. Учись! Так и я о том же и написал. Если скармливать Лиле опредленные позиции, то это уже не зеро. Потому и не делают сейчас.

07.03.2019, 18:06	#2476
Asunta Гроссмейстер Регистрация: 10.07.2018 Сообщений: 1,406 Сказал(а) спасибо: 776 Поблагодарили 2,282 раз(а) в 935 сообщениях Репутация: 230	Re: LCZero По протоколу UCI движок должен что-то писать в Depth-позицию. Анализ в усечённом АВ-дереве, где набор глубины приводит к разрастанию дерева и замедлению анализа с увеличением глубины, прост для понимания.. А что такое Depth(N) для Lc0 ( ? ) То же, что и для АВ-движка или (N) неких "других" итераций ( ? ) Что конкретно Lc0 делает для углубления, скажем, на очередной 1 полуход, имея сравнительно небольшой файл сети ~45MB ( ? )

07.03.2019, 18:11	#2477
sovaz1997 Гроссмейстер Регистрация: 27.09.2017 Адрес: Москва Сообщений: 4,142 Сказал(а) спасибо: 2,297 Поблагодарили 2,510 раз(а) в 1,635 сообщениях Репутация: 92	Re: LCZero Asunta, Лила не ищет по сети, Лила строит дерево поиска.

07.03.2019, 18:24	#2478
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от sovaz1997 Asunta, Лила не ищет по сети, Лила строит дерево поиска. А как его строит? Вот например, 8/4k3/8/8/8/8/3Q4/5K2 w - - 0 3 будет ли рассмотрен ход Qd7+, если отмотать пленку на скажем пять ходов назад, когда позиция была ну что-то вроде например: 3b4/4pk2/3P4/5N2/8/8/3Q4/5K2 w - - 0 1 (первый FEN получается из второго ну например так: {[#]} 1. dxe7 Bxe7 2. Nxe7 Kxe7 *) Т.е. есть ли отсечение заведомо глупых ходов?

07.03.2019, 18:26	#2479
sovaz1997 Гроссмейстер Регистрация: 27.09.2017 Адрес: Москва Сообщений: 4,142 Сказал(а) спасибо: 2,297 Поблагодарили 2,510 раз(а) в 1,635 сообщениях Репутация: 92	Re: LCZero Maratka, дерево поиска MCTS и нейронная сеть Лилы - это 2 разные вещи. Абсолютно разные. Причем они даже находятся в разных местах: в ОЗУ и на видеокарте. Нейронная сеть - это нейроны и связи, да и только. Там нет места позициям. И никакого запоминания позиций нет.

07.03.2019, 18:29	#2480
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero А какая разница, где оно находится? из 3b4/4pk2/3P4/5N2/8/8/3Q4/5K2 w - - 0 1 можно прийти к 8/4k3/8/8/8/8/3Q4/5K2 w - - 0 3 ? Можно! Легален ли ход Qd7+ ? Легален! Так будет ли LZ просматривать вариант Qd7+ в позиции 3b4/4pk2/3P4/5N2/8/8/3Q4/5K2 w - - 0 1 или не будет? ___ Это чисто так пример. Позиции могут быть гораздо тоньше, с гораздо бОльшим материалом на доске.

07.03.2019, 18:31	#2481
sovaz1997 Гроссмейстер Регистрация: 27.09.2017 Адрес: Москва Сообщений: 4,142 Сказал(а) спасибо: 2,297 Поблагодарили 2,510 раз(а) в 1,635 сообщениях Репутация: 92	Re: LCZero Я имею ввиду, что нейронная сеть - это вообще не про дерево поиска. Они не пересекаются. Разница в том, что нейронная сеть считается на видеокарте, а дереву поиска она не нужна (зачем там матрицы перемножать?) Лила не запоминает связи между позициями и ходами, которые приводят к позициям.

07.03.2019, 18:31	#2482
Asunta Гроссмейстер Регистрация: 10.07.2018 Сообщений: 1,406 Сказал(а) спасибо: 776 Поблагодарили 2,282 раз(а) в 935 сообщениях Репутация: 230	Re: LCZero Метод Монте-Карло для поиска в дереве: https://habr.com/ru/post/282522/ http://ru.knowledgr.com/18212867/%D0...80%D0%BB%D0%BE

07.03.2019, 18:44	#2483
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от sovaz1997 Я имею ввиду, что нейронная сеть - это вообще не про дерево поиска. Они не пересекаются. А я имею в виду, что для того, чтобы оценить позицию после следующего хода, нужно, чтобы кто-то сказал варианты следующего хода. И берутся эти варианты из чего-то вроде movegen.cpp (кстати в первых версиях LZ это файл был банально скопирован, возможно с небольшими переделками) с проекта SF.

07.03.2019, 18:47	#2484
sovaz1997 Гроссмейстер Регистрация: 27.09.2017 Адрес: Москва Сообщений: 4,142 Сказал(а) спасибо: 2,297 Поблагодарили 2,510 раз(а) в 1,635 сообщениях Репутация: 92	Re: LCZero Maratka, ну, из банального генератора ходов и берутся. А MCTS уже определяет, куда дерево поиска лучше расширять.

07.03.2019, 22:19	#2485
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от sovaz1997 А MCTS уже определяет, куда дерево поиска лучше расширять. Т.е. LZ проверяет не все варианты ходов, а обрезает дерево, может агрессивнее и точнее чем SF, может поверхностно и грубо, но таки обрезает?

07.03.2019, 22:20	#2486
sovaz1997 Гроссмейстер Регистрация: 27.09.2017 Адрес: Москва Сообщений: 4,142 Сказал(а) спасибо: 2,297 Поблагодарили 2,510 раз(а) в 1,635 сообщениях Репутация: 92	Re: LCZero Цитата: Сообщение от Maratka Т.е. LZ проверяет не все варианты ходов, а обрезает дерево, может агрессивнее и точнее чем SF, может поверхностно и грубо, но таки обрезает? Можно сказать, да. Точнее, но при этом в 1000 раз меньше узлов перебирает.

07.03.2019, 22:23	#2487
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от sovaz1997 Точнее, но при этом в 1000 раз меньше узлов перебирает. А за счет чего точнее? Ведь чтобы узнать, что ход глупый, нужно его так или иначе оценить? _____ Мне вот кажется, что наоборот - менее точно. За счет чего не набирает и половины глубины от SF, но зато проверяет больше позиций на каждой глубине, и потому с меньшей вероятностью пропускает хороший ход.

07.03.2019, 22:31	#2488
sovaz1997 Гроссмейстер Регистрация: 27.09.2017 Адрес: Москва Сообщений: 4,142 Сказал(а) спасибо: 2,297 Поблагодарили 2,510 раз(а) в 1,635 сообщениях Репутация: 92	Re: LCZero Цитата: Сообщение от Maratka А за счет чего точнее? Ведь чтобы узнать, что ход глупый, нужно его так или иначе оценить? _____ Мне вот кажется, что наоборот - менее точно. За счет чего не набирает и половины глубины от SF, но зато проверяет больше позиций на каждой глубине, и потому с меньшей вероятностью пропускает хороший ход. Ну как может быть менее точно, если при скорости в 1000 раз ниже, чем у Стока, играет почти на его уровне? Нейросеть, кстати, не только оценивает позицию, но и выбирает ходы-кандидаты. За счёт этого в совокупности Лила и имеет достаточно хорошее дерево поиска.

07.03.2019, 22:43	#2489
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от sovaz1997 Ну как может быть менее точно, если при скорости в 1000 раз ниже, чем у Стока, играет почти на его уровне? Ну вот именно по этой причине. Если скажем LZ рассматривает в среднем три хода на позицию, а SF - два, то при равной оценке LZ с меньшей вероятностью пропустит действительно хороший ход. Но а так как оценка у LZ явно сложнее, то увеличение потенциально хороших просмотренных ходов на позицию резко повышает вероятность нахождения действительно лучшего. Отсюда же растет и относительно низкая глубина: сложно достичь высокой глубины, если ты изначально пытаешься работать в ширину.

08.03.2019, 11:40	#2490
Кевин Гроссмейстер Регистрация: 02.07.2016 Адрес: Сахалин Сообщений: 4,792 Сказал(а) спасибо: 5,116 Поблагодарили 14,196 раз(а) в 4,064 сообщениях Записей в дневнике: 251 Репутация:	Re: LCZero v0.21.0 финальный релиз (без изменений в сравнении с последним кандидатским) вышел. https://github.com/LeelaChessZero/lc0/releases __________________ ICCF SIM 2547, International Arbiter, ICCF "Promotional Tournaments - Server" Organiser, RCCA Chess 960 Champion, ICCF 4th Chess 960 World Cup Final Winner.

Здесь присутствуют: 5 (пользователей: 0 , гостей: 5)