Развернуть для просмотра

Maratka · 15.10.2020, 21:43

Чего жаль то?
Смысла от нее только в на коротких контролях.

svoitsl · 15.10.2020, 22:36

Цитата: Сообщение от Maratka

Чего жаль то?

Ну хотя бы потому, что большая сеть не запускается на 1Г

Цитата: Сообщение от Maratka

Смысла от нее только в на коротких контролях.

Вы очевидно перепутали с 10х128? К тому же пока не у всех есть 4xV100

Maratka · 15.10.2020, 22:52

Цитата: Сообщение от svoitsl

Ну хотя бы потому, что большая сеть не запускается на 1Г

Платы даже с 4 гигабайтами стоят не так уж и дорого.
AMD RX550 например:
https://technopoint.ru/product/2e4cb...4gbd5-dh-sale/

Переяслав · 15.10.2020, 23:01

Цитата: Сообщение от Maratka

Смысла от нее только в на коротких контролях.

хоть бы один тест увидеть это подтверждающий

Переяслав · 15.10.2020, 23:11

из более-менее долгих тестов я вижу на СЕГТ 256-ые только сети и оттестированы. И вполне себе неплохо стоят
и видяхи там как моя NVIDIA GTX 1060 так и NVIDIA GTX 1650 - не особо то мощнецкие

Владимир001 · 15.10.2020, 23:26

Opening Books

https://github.com/jhorthos/lczero-t.../Opening-Books

Переяслав · 16.10.2020, 12:15

Цитата: Сообщение от Владимир001

Opening Books

https://github.com/jhorthos/lczero-t.../Opening-Books

Код:

Result:
------------------------------------------------------------------------------
  #  name              games    wins   draws  losses   score    los%  elo+/-
  1. Stockfish 141020    100      46      13      41    52.5    70.4    17.4
  2. Stockfish 12        100      41      13      46    47.5    29.6   -17.4

Tech:
------------------------------------------------------------------------------

Tech (average nodes, depths, time/m per move, others per game):
  #  name                nodes/m         NPS  depth/m   time/m    moves     time
  1. Stockfish 141020      6617K      758870     26.2      8.7     61.6    537.5
  2. Stockfish 12          6578K      731125     25.9      9.0     61.7    554.8
     all ---               6443K      744778     26.1      8.9     61.6    546.1

Код:

Result:
------------------------------------------------------------------------------
  #  name              games    wins   draws  losses   score    los%  elo+/-
  1. Stockfish 12        100       7      86       7    50.0    50.0    -0.0
  2. Stockfish 141020    100       7      86       7    50.0    50.0    -0.0

Tech:
------------------------------------------------------------------------------

Tech (average nodes, depths, time/m per move, others per game):
  #  name                nodes/m         NPS  depth/m   time/m    moves     time
  1. Stockfish 12          6175K      700853     30.7      8.8     50.5    445.4
  2. Stockfish 141020      6472K      741492     30.8      8.7     50.6    441.8
     all ---               6175K      721091     30.8      8.8     50.6    443.6

8-ply book Q > 0.40 [10,184 openings] - конечно сумасшедшая
сравните, первая таблица - результаты по этому набору дебютов, а вторая - по стандортной 4-ходовке Номена сбалансированной

Процент ничьих 13% против 86%
Там дичь конечно та еще! Я давно ищу книги с более-менее несбалансированными дебютами, но чтоб настолько

Переяслав · 16.10.2020, 12:28

8-ply book Q 0.25 to 0.40 [14,852 openings] - наверное это норм будет с ничьими под 60% - проверимс!

Переяслав · 16.10.2020, 12:40

Цитата: Сообщение от Переяслав

8-ply book Q 0.25 to 0.40 [14,852 openings] - наверное это норм будет с ничьими под 60% - проверимс!

Код:

Result:
------------------------------------------------------------------------------
  #  name              games    wins   draws  losses   score    los%  elo+/-
  1. Stockfish 141020    100      34      48      18    58.0    98.7    56.1
  2. Stockfish 12        100      18      48      34    42.0     1.3   -56.1

Tech:
------------------------------------------------------------------------------

Tech (average nodes, depths, time/m per move, others per game), counted for computing moves only, ignored moves with zero nodes:
  #  name                nodes/m         NPS  depth/m   time/m    moves     time
  1. Stockfish 141020      1077K     1427275     20.5      0.8     58.9     44.5
  2. Stockfish 12          1043K     1344180     20.0      0.8     59.0     45.8
     all ---               1035K     1385137     20.2      0.8     59.0     45.1

Эта попроще, но 60% не взяла.
Итого получается интресно, на супер сбалансированной книге 12-ый у меня играет на равных с 141020-ым, а на разбалансе - новый выносит "старичка"!

Вот и не говорите потом, что дебюты не влияют на силу игры

Владимир001 · 16.10.2020, 15:44

https://pixeldrain.com/u/auZJPHwF

Match: 30b nets J92-190 vs J92-270 in time control
LC0 version:0.26.3
LC0 options: 1 thread, move-overhead=50
Time control: 5s+0.5s
Hardware: RTX 2070
Book: Sufi book (293 openings)
Tablebases: 6-man TB for both.
Speed: 9.1 knps (benchmark with 1 thread)
Adjudication: 6-man TB, -draw movenumber=50 movecount=5 score=8 -resign movecount=5 score=800
Software:cutechess-cli
Comments: J92-270 beats J92-190 (+2 elo, CFS 65%): +60 -56 =470

tc=5s+0.5s, 1 thread, move-overhead=50, RTX 2070

J92-190 vs others

Код:

# PLAYER             :  RATING  ERROR  POINTS  PLAYED   (%)  CFS(%)    W     D    L
+  1 lc0.net.J92-270    :       2     13   295.0     586  50.3      65   60   470   56
-  2 lc0.net.J92-190    :       0   ----  1482.5    2930  50.6      57  354  2257  319
   3 lc0.net.J92-220    :      -1     13   292.0     586  49.8      58   70   444   72
   4 lc0.net.J92-210    :      -3     13   290.5     586  49.6      50   64   453   69
   5 lc0.net.J92-180    :      -3     13   290.5     586  49.6      93   67   447   72
   6 lc0.net.J92-100    :     -17     13   279.5     586  47.7     ---   58   443   85

Владимир001 · 16.10.2020, 15:55

Лила проводит типовую атаку в старушке.

https://youtu.be/qIgPEyCdpkY

Омегазеро · 16.10.2020, 21:13

Цитата: Сообщение от svoitsl

А сети обычного размера 20х256 как не было так и нет.... жаль

jhortos начал тренировки сети размерности 192x20b!

Самая первая сеть LJ1-50 https://storage.lczero.org/files/net...contrib/LJ1-50

Владимир001 · 16.10.2020, 21:22

Match Stockfish 11 vs Lc0 JH J92-190
Tournament: Gauntlet
Binaries: BMI2 | Lc0-v0.26.1
Engine Options: Default
Hardware: i7 7700k 4CPU | 1080TI -- 1000:1 Ratio 20b
Time control: 60+1
Book: Balsa v2724
Tablebases: None
Adjudication: +-9 Win
Software: Cutechess-Cli
Sheets: https://docs.google.com/spreadsheets...#gid=201239930
Comments: A good test to see how NNUE has affected SF Perf against Lc0.

H2H

Код:

# PLAYER                    :  RATING  ERROR  POINTS  PLAYED   (%)    W    D    L  D(%)  OppN  CFS(%)
   1 Leela Jhorthos J92-190    :       0     14    80.0     152  52.6   24  112   16  73.7     1      90
   2 Stockfish 11              :     -19     14    72.0     152  47.4   16  112   24  73.7     1     ---

All

Код:

   # PLAYER                       :  RATING  ERROR  POINTS  PLAYED   (%)    W    D    L  D(%)  OppN  CFS(%)
   1 Stockfish 13 Dev [Sep 28]    :      45     16   157.5     280  56.3   43  229    8  81.8     1      96
   2 Stockfish 12                 :      20     18   105.5     200  52.8   26  159   15  79.5     1      96
   3 Leela Jhorthos J92-190       :       0      9   297.0     632  47.0   47  500   85  79.1     3      93
   4 Stockfish 11                 :     -19     20    72.0     152  47.4   16  112   24  73.7     1     ---

White advantage = 38.18 +/- 6.09
Draw rate (equal opponents) = 83.30 % +/- 1.71

Владимир001 · 16.10.2020, 21:26

jhortos:
First 192x20b Lender net posted https://github.com/jhorthos/lczero-t...Leela-Training
Suitable for play on with 18 or fewer pieces left.

Jeweller · 16.10.2020, 21:29

Цитата: Сообщение от Владимир001

Код:

   # PLAYER                       :  RATING  ERROR  POINTS  PLAYED   (%)    W    D    L  D(%)  OppN  CFS(%)
   1 Stockfish 13 Dev [Sep 28]    :      45     16   157.5     280  56.3   43  229    8  81.8     1      96
   2 Stockfish 12                 :      20     18   105.5     200  52.8   26  159   15  79.5     1      96
   3 Leela Jhorthos J92-190       :       0      9   297.0     632  47.0   47  500   85  79.1     3      93
   4 Stockfish 11                 :     -19     20    72.0     152  47.4   16  112   24  73.7     1     ---

White advantage = 38.18 +/- 6.09
Draw rate (equal opponents) = 83.30 % +/- 1.71

какой хороший тест!

измерение разницы SF12-SF11 через Лилу дало 39 Elo

Jeweller · 16.10.2020, 21:47

Цитата: Сообщение от Jeweller

измерение разницы SF12-SF11 через Лилу дало 39 Elo

можно примерно оценить, во сколько раз сжимается самоЭло Стока, полученное при регресс тесте на фиштесте (SF12-SF11 = 133,7)
относительно "лила"Эло Стока, полученное при замере через Лилу (39)

сокращение в 3,43 раза

использовалась отлич книга Balsa_v2724, которая надежно замеряет, в ней очень мало шума, но пмм она возможно немного сжимает интервал, на несколько % (точнее не могу сейчас сказать)
с учетом этого, сокращение интервала SF12-SF11 можно примерно оценить в районе 3,00-3,25

т.е., на основании этого теста - если мы имеем некое самоЭло Стока, его прогресс относительно Лилы составляет ~30-33% самоЭло

svoitsl · 16.10.2020, 22:08

Цитата: Сообщение от Владимир001

Suitable for play on with 18 or fewer pieces left.

То есть она для эндшпилей что ли?

byan_mivv · 16.10.2020, 22:30

Цитата: Сообщение от svoitsl

То есть она для эндшпилей что ли?

"Подходит для игры, когда осталось 18 или меньше фигур."

Получается так... У меня она уже четвертую партию проигрывает всухую сети J92-270...

Vizvezdenec · 16.10.2020, 23:49

Цитата: Сообщение от Jeweller

можно примерно оценить, во сколько раз сжимается самоЭло Стока, полученное при регресс тесте на фиштесте (SF12-SF11 = 133,7)
относительно "лила"Эло Стока, полученное при замере через Лилу (39)

сокращение в 3,43 раза

использовалась отлич книга Balsa_v2724, которая надежно замеряет, в ней очень мало шума, но пмм она возможно немного сжимает интервал, на несколько % (точнее не могу сейчас сказать)
с учетом этого, сокращение интервала SF12-SF11 можно примерно оценить в районе 3,00-3,25

т.е., на основании этого теста - если мы имеем некое самоЭло Стока, его прогресс относительно Лилы составляет ~30-33% самоЭло

А SF12-sf dev 25 эло, т.е. примерно 110% от того, что показывает регресс-тест...

Jeweller · 17.10.2020, 07:19

общая картина еще сложнее -
т.к. характеристики нейро и классического Стока отличаются, также как и
характеристики сетей Лилы разной размерности - измерение Стока каждого типа через сеть Лилы другой размерности может дать разные коэф сжатия самоЭло

эти коэф сжатия можно примерно классифицировать так:

1 - по типам Стока:
а) классический сток относительно классического
б) сетевой - классический
в) сетевой - сетевой

2 - по размерностям сетей Лилы

----------------

значение ~0,30-0,33 из теста выше относится к варианту: измерение "сетевой-классический" через 384-сеть Лилы
для других сочетаний типов Стока и размерностей Лилы, коэф могут быть другими в широких пределах

ну и результатов тестов хотелось бы больше, чтобы основываться на более твердом основании

Владимир001 · 17.10.2020, 08:36

https://www.twitch.tv/navratil25

Stockfish Sufi
Lc0-Sufi

8 ply balanced book
60’ + 60”

Код:

# PLAYER : RATING ERROR POINTS PLAYED (%) CFS(%) W D L D(%)
1 stockfish-Sufi 19 : 16 15 11.0 21 52.4 85 1 20 0 95.2
2 Lc0-Sufi : 0 15 10.0 21 47.6 --- 0 20 1 95.2

MEDIANS

Код:

Name                     Games    Depth       NPS           Nodes
-------------------------------------------------------------------------------------
stockfish-Sufi 19    :      21     55        3234797   2171068966
Lc0-Sufi             :      21     17           23912      7364415

https://pixeldrain.com/u/UUHc6Ynt

Maratka · 17.10.2020, 09:15

Цитата: Сообщение от Jeweller

измерение разницы SF12-SF11 через Лилу дало 39 Elo

А измерение SF13 через LZ в сравнении со SF12 дало 25, при официально замеренной разнице в 23 Elo на 28 сентября:

Сейчас если замерить, то вероятнее всего будет где-то на пару Elo больше, т.е. фактически 100% попадание при измерении хоть напрямую, хоть через прокладку в лице другого движка.

Остюда, ничего подобного оценивать тут нельзя:

Цитата: Сообщение от Jeweller

можно примерно оценить, во сколько раз сжимается самоЭло Стока, полученное при регресс тесте на фиштесте (SF12-SF11 = 133,7)

И уж тем более нельзя делать никаких выводов на основании просмотра части результатов, без анализа полной версии увиденного.

Jeweller · 17.10.2020, 09:26

Maratka, прочитайте 7130
там ответ на Ваше возражение

Maratka · 17.10.2020, 09:37

Не вижу я там возражений, 12-й и 13-й SF'шы - это один и тот же движок, и там 25 Elo за два месяца, практически на ровном месте, ибо оценка уже таких резких прыжков не делала (рост ее где-то на 6-7 Elo, не более).

Вот 11-й - уже другой, но сравнение 12-го с 11-м вида "мы получили 39 Elo", когда 13-й в сравнении с 12-м за два месяца дал 25, и при этом совершенно очевидно, что 12-й вырос в сравнении с 11-м в большей степени как раз из-за принципиально другой, гораздо более точной оценки - это как минимум нужно формулировать свои тезисы более осторожно.

Цитата: Сообщение от Jeweller

ну и результатов тестов хотелось бы больше, чтобы основываться на более твердом основании

А вот с этим соглашусь: пусть замерят через LZ 9-й SF к 8, 10 к 9, 11 к 10. Можно и ниже, - 8 к 7, 7 к 6. Все через LZ.
Посмотрим, если принципиально тип движка - то разницы опять же с официальными данными +\- не будет, ибо все эти старые версии алгоритмически одинаковы.

Jeweller · 17.10.2020, 09:54

Цитата: Сообщение от Maratka

Не вижу я там возражений...

еще раз обратите внимание на это:

Цитата:

характеристики нейро и классического Стока отличаются, также как и характеристики сетей Лилы разной размерности - измерение Стока каждого типа через сеть Лилы другой размерности может дать разные коэф сжатия самоЭло

также как и измерение разных сетей Лилы через Стоки разного типа, в общем случае, может дать разные результаты
в общем случае - это касается любого движка

причины, повторюсь - разные рейтинговые характеристики движков и сетей разного типа и размерности
из-за чего возникают все эти эффекты

их все можно (и полезно) корректно замерить на хорошей статистике и сложных моделях, частично у меня это запланировано, но 1) нескоро, 2) не все публикую

Maratka · 17.10.2020, 09:59

Цитата: Сообщение от Jeweller

также как и измерение разных сетей Лилы через Стоки разного типа, в общем случае, может дать разные результаты
в общем случае - это касается любого движка

В общем случае может и касаться, но не тут: получить 40 Elo вместо 120, зная при этом, что львиная доля этого Elo дала сеть - странно, и вдвойне странно наблюдать эти 40 Elo, зная, что 13-я версия к 12-й уже дала 25 (и эти данные почему-то совпали), хотя там никаких принципиальных изменений как раз таки нет.

Вот если бы намерили скажем 105, да даже и 90 Elo - ну можно было бы поговорить про разное железо, или там разные дебюты, которые и дают разный выхлоп, но 40 - это ни в какие ворота не лезет!

Ну и конечно же количество партий - когда оно варится в районе всего-то 200 (но не точно 200, у разных движков - разное количество партий!!) - это тоже дает свою, и заметную ошибку.

Jeweller · 17.10.2020, 10:07

лезет оно в ворота и ничего странного нет, еще раз - разные рейтинговые характеристики движков и сетей разного типа и размерности

количество партий нужно для учета ширины погрешностей, и даже с их учетом - эффект сжатия значительный

--------------------

добавлено: но конечно партий нужно на порядок больше, и воспроизводимость результата независимо, в том тесте могут быть свои искажения

Maratka · 17.10.2020, 11:22

Не совсем понял, что такое "разные рейтинговые характеристики движков"?
Понятно, что рейтинги заведомо разные, но не совсем понятно, почему разный рейтинг SF12 и 13 совпадает и по официальному тесту, и по приведенному чуть выше, который мы и обсуждаем, но не совпадает в паре SF12 и 11?

Или вот: 11-я версия как измерено всего на 19 Elo слабее, чем некая "Leela Jhorthos J92-190", так как же заметно более сильная версия SF, играющая в TCEC 17 проиграла заметно более слабой версии LZ? Не в том ли дело, что в тесте было всего-то 152 партии, а в TCEC и того меньше, и погрешности могли наложиться так, что этот тест показывает черт знает что, но не реальное соотношение рейтингов движков?

Jeweller · 17.10.2020, 11:54

Цитата: Сообщение от Maratka

Не совсем понял, что такое "разные рейтинговые характеристики движков"?

в частности, разные характеристики "широкополостности/узкополостности", способности движка показывать заметно разные рейтинги против движков сильнее/слабее - в результате, если мерить через такой движок, разница в силе будет сильно отличаться (не только сжиматься, раздвигаться также может)

Maratka · 17.10.2020, 12:30

Ну в тесте 12 vs 11 у 11-й включен (как кажется) contempt, причем положительное его значение явно не способствует максимальному результату против 12-й версии, так что если так и есть, то разница реально должна быть поменьше, чем ~120 Elo, но все одно - 40 слишком мало.
Опять же, это видно по тестам на середину-конце июля, там набегало ~25 Elo, и вдруг сразу стало под сотню, от простой замены оценочной функции.

15.10.2020, 21:43	#7111
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Чего жаль то? Смысла от нее только в на коротких контролях.

15.10.2020, 22:36	#7112
svoitsl Гроссмейстер Регистрация: 19.04.2017 Сообщений: 4,734 Сказал(а) спасибо: 1,204 Поблагодарили 2,853 раз(а) в 1,885 сообщениях Репутация: 159	Re: LCZero Цитата: Сообщение от Maratka Чего жаль то? Ну хотя бы потому, что большая сеть не запускается на 1Г Цитата: Сообщение от Maratka Смысла от нее только в на коротких контролях. Вы очевидно перепутали с 10х128? К тому же пока не у всех есть 4xV100

15.10.2020, 22:52	#7113
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от svoitsl Ну хотя бы потому, что большая сеть не запускается на 1Г Платы даже с 4 гигабайтами стоят не так уж и дорого. AMD RX550 например: https://technopoint.ru/product/2e4cb...4gbd5-dh-sale/

15.10.2020, 23:01	#7114
Переяслав Гроссмейстер Регистрация: 12.07.2020 Сообщений: 1,784 Сказал(а) спасибо: 650 Поблагодарили 2,306 раз(а) в 1,004 сообщениях Записей в дневнике: 20 Репутация: 136	Re: LCZero Цитата: Сообщение от Maratka Смысла от нее только в на коротких контролях. хоть бы один тест увидеть это подтверждающий __________________ PGN Spy - top tournaments

15.10.2020, 23:11	#7115
Переяслав Гроссмейстер Регистрация: 12.07.2020 Сообщений: 1,784 Сказал(а) спасибо: 650 Поблагодарили 2,306 раз(а) в 1,004 сообщениях Записей в дневнике: 20 Репутация: 136	Re: LCZero из более-менее долгих тестов я вижу на СЕГТ 256-ые только сети и оттестированы. И вполне себе неплохо стоят и видяхи там как моя NVIDIA GTX 1060 так и NVIDIA GTX 1650 - не особо то мощнецкие __________________ PGN Spy - top tournaments

15.10.2020, 23:26	#7116
Владимир001 Эксперт Регистрация: 19.12.2019 Сообщений: 7,484 Сказал(а) спасибо: 4,655 Поблагодарили 12,178 раз(а) в 5,475 сообщениях Репутация: 259	Re: LCZero Opening Books https://github.com/jhorthos/lczero-t.../Opening-Books

16.10.2020, 12:28	#7118
Переяслав Гроссмейстер Регистрация: 12.07.2020 Сообщений: 1,784 Сказал(а) спасибо: 650 Поблагодарили 2,306 раз(а) в 1,004 сообщениях Записей в дневнике: 20 Репутация: 136	Re: LCZero 8-ply book Q 0.25 to 0.40 [14,852 openings] - наверное это норм будет с ничьими под 60% - проверимс! __________________ PGN Spy - top tournaments

16.10.2020, 12:40	#7119
Переяслав Гроссмейстер Регистрация: 12.07.2020 Сообщений: 1,784 Сказал(а) спасибо: 650 Поблагодарили 2,306 раз(а) в 1,004 сообщениях Записей в дневнике: 20 Репутация: 136	Re: LCZero Цитата: Сообщение от Переяслав 8-ply book Q 0.25 to 0.40 [14,852 openings] - наверное это норм будет с ничьими под 60% - проверимс! Код: Result: ------------------------------------------------------------------------------ # name games wins draws losses score los% elo+/- 1. Stockfish 141020 100 34 48 18 58.0 98.7 56.1 2. Stockfish 12 100 18 48 34 42.0 1.3 -56.1 Tech: ------------------------------------------------------------------------------ Tech (average nodes, depths, time/m per move, others per game), counted for computing moves only, ignored moves with zero nodes: # name nodes/m NPS depth/m time/m moves time 1. Stockfish 141020 1077K 1427275 20.5 0.8 58.9 44.5 2. Stockfish 12 1043K 1344180 20.0 0.8 59.0 45.8 all --- 1035K 1385137 20.2 0.8 59.0 45.1 Эта попроще, но 60% не взяла. Итого получается интресно, на супер сбалансированной книге 12-ый у меня играет на равных с 141020-ым, а на разбалансе - новый выносит "старичка"! Вот и не говорите потом, что дебюты не влияют на силу игры __________________ PGN Spy - top tournaments

16.10.2020, 15:44	#7120
Владимир001 Эксперт Регистрация: 19.12.2019 Сообщений: 7,484 Сказал(а) спасибо: 4,655 Поблагодарили 12,178 раз(а) в 5,475 сообщениях Репутация: 259	Re: LCZero https://pixeldrain.com/u/auZJPHwF Match: 30b nets J92-190 vs J92-270 in time control LC0 version:0.26.3 LC0 options: 1 thread, move-overhead=50 Time control: 5s+0.5s Hardware: RTX 2070 Book: Sufi book (293 openings) Tablebases: 6-man TB for both. Speed: 9.1 knps (benchmark with 1 thread) Adjudication: 6-man TB, -draw movenumber=50 movecount=5 score=8 -resign movecount=5 score=800 Software:cutechess-cli Comments: J92-270 beats J92-190 (+2 elo, CFS 65%): +60 -56 =470 tc=5s+0.5s, 1 thread, move-overhead=50, RTX 2070 J92-190 vs others Код: # PLAYER : RATING ERROR POINTS PLAYED (%) CFS(%) W D L + 1 lc0.net.J92-270 : 2 13 295.0 586 50.3 65 60 470 56 - 2 lc0.net.J92-190 : 0 ---- 1482.5 2930 50.6 57 354 2257 319 3 lc0.net.J92-220 : -1 13 292.0 586 49.8 58 70 444 72 4 lc0.net.J92-210 : -3 13 290.5 586 49.6 50 64 453 69 5 lc0.net.J92-180 : -3 13 290.5 586 49.6 93 67 447 72 6 lc0.net.J92-100 : -17 13 279.5 586 47.7 --- 58 443 85

16.10.2020, 15:55	#7121
Владимир001 Эксперт Регистрация: 19.12.2019 Сообщений: 7,484 Сказал(а) спасибо: 4,655 Поблагодарили 12,178 раз(а) в 5,475 сообщениях Репутация: 259	Re: LCZero Лила проводит типовую атаку в старушке. https://youtu.be/qIgPEyCdpkY

16.10.2020, 21:13	#7122
Омегазеро Гроссмейстер Регистрация: 20.01.2019 Сообщений: 1,067 Сказал(а) спасибо: 2 Поблагодарили 701 раз(а) в 343 сообщениях Репутация: 92	Re: LCZero Цитата: Сообщение от svoitsl А сети обычного размера 20х256 как не было так и нет.... жаль jhortos начал тренировки сети размерности 192x20b! Самая первая сеть LJ1-50 https://storage.lczero.org/files/net...contrib/LJ1-50

16.10.2020, 21:22	#7123
Владимир001 Эксперт Регистрация: 19.12.2019 Сообщений: 7,484 Сказал(а) спасибо: 4,655 Поблагодарили 12,178 раз(а) в 5,475 сообщениях Репутация: 259	Re: LCZero Match Stockfish 11 vs Lc0 JH J92-190 Tournament: Gauntlet Binaries: BMI2 \| Lc0-v0.26.1 Engine Options: Default Hardware: i7 7700k 4CPU \| 1080TI -- 1000:1 Ratio 20b Time control: 60+1 Book: Balsa v2724 Tablebases: None Adjudication: +-9 Win Software: Cutechess-Cli Sheets: https://docs.google.com/spreadsheets...#gid=201239930 Comments: A good test to see how NNUE has affected SF Perf against Lc0. H2H Код: # PLAYER : RATING ERROR POINTS PLAYED (%) W D L D(%) OppN CFS(%) 1 Leela Jhorthos J92-190 : 0 14 80.0 152 52.6 24 112 16 73.7 1 90 2 Stockfish 11 : -19 14 72.0 152 47.4 16 112 24 73.7 1 --- All Код: # PLAYER : RATING ERROR POINTS PLAYED (%) W D L D(%) OppN CFS(%) 1 Stockfish 13 Dev [Sep 28] : 45 16 157.5 280 56.3 43 229 8 81.8 1 96 2 Stockfish 12 : 20 18 105.5 200 52.8 26 159 15 79.5 1 96 3 Leela Jhorthos J92-190 : 0 9 297.0 632 47.0 47 500 85 79.1 3 93 4 Stockfish 11 : -19 20 72.0 152 47.4 16 112 24 73.7 1 --- White advantage = 38.18 +/- 6.09 Draw rate (equal opponents) = 83.30 % +/- 1.71

16.10.2020, 21:26	#7124
Владимир001 Эксперт Регистрация: 19.12.2019 Сообщений: 7,484 Сказал(а) спасибо: 4,655 Поблагодарили 12,178 раз(а) в 5,475 сообщениях Репутация: 259	Re: LCZero jhortos: First 192x20b Lender net posted https://github.com/jhorthos/lczero-t...Leela-Training Suitable for play on with 18 or fewer pieces left.

16.10.2020, 21:29	#7125
Jeweller 2 разряд Регистрация: 24.01.2018 Сообщений: 351 Сказал(а) спасибо: 481 Поблагодарили 311 раз(а) в 153 сообщениях Репутация: 56	Re: LCZero Цитата: Сообщение от Владимир001 Код: # PLAYER : RATING ERROR POINTS PLAYED (%) W D L D(%) OppN CFS(%) 1 Stockfish 13 Dev [Sep 28] : 45 16 157.5 280 56.3 43 229 8 81.8 1 96 2 Stockfish 12 : 20 18 105.5 200 52.8 26 159 15 79.5 1 96 3 Leela Jhorthos J92-190 : 0 9 297.0 632 47.0 47 500 85 79.1 3 93 4 Stockfish 11 : -19 20 72.0 152 47.4 16 112 24 73.7 1 --- White advantage = 38.18 +/- 6.09 Draw rate (equal opponents) = 83.30 % +/- 1.71 какой хороший тест! измерение разницы SF12-SF11 через Лилу дало 39 Elo

16.10.2020, 21:47	#7126
Jeweller 2 разряд Регистрация: 24.01.2018 Сообщений: 351 Сказал(а) спасибо: 481 Поблагодарили 311 раз(а) в 153 сообщениях Репутация: 56	Re: LCZero Цитата: Сообщение от Jeweller измерение разницы SF12-SF11 через Лилу дало 39 Elo можно примерно оценить, во сколько раз сжимается самоЭло Стока, полученное при регресс тесте на фиштесте (SF12-SF11 = 133,7) относительно "лила"Эло Стока, полученное при замере через Лилу (39) сокращение в 3,43 раза использовалась отлич книга Balsa_v2724, которая надежно замеряет, в ней очень мало шума, но пмм она возможно немного сжимает интервал, на несколько % (точнее не могу сейчас сказать) с учетом этого, сокращение интервала SF12-SF11 можно примерно оценить в районе 3,00-3,25 т.е., на основании этого теста - если мы имеем некое самоЭло Стока, его прогресс относительно Лилы составляет ~30-33% самоЭло

16.10.2020, 22:08	#7127
svoitsl Гроссмейстер Регистрация: 19.04.2017 Сообщений: 4,734 Сказал(а) спасибо: 1,204 Поблагодарили 2,853 раз(а) в 1,885 сообщениях Репутация: 159	Re: LCZero Цитата: Сообщение от Владимир001 Suitable for play on with 18 or fewer pieces left. То есть она для эндшпилей что ли?

16.10.2020, 22:30	#7128
byan_mivv Гроссмейстер Регистрация: 02.07.2016 Сообщений: 2,104 Сказал(а) спасибо: 4,488 Поблагодарили 5,221 раз(а) в 1,744 сообщениях Репутация: 435	Re: LCZero Цитата: Сообщение от svoitsl То есть она для эндшпилей что ли? "Подходит для игры, когда осталось 18 или меньше фигур." Получается так... У меня она уже четвертую партию проигрывает всухую сети J92-270... __________________ "Не-ум - цветы вечности." Ошо

16.10.2020, 23:49	#7129
Vizvezdenec Гроссмейстер Регистрация: 30.05.2018 Адрес: Севастополь Сообщений: 4,022 Сказал(а) спасибо: 56 Поблагодарили 5,294 раз(а) в 2,673 сообщениях Репутация: 216	Re: LCZero Цитата: Сообщение от Jeweller можно примерно оценить, во сколько раз сжимается самоЭло Стока, полученное при регресс тесте на фиштесте (SF12-SF11 = 133,7) относительно "лила"Эло Стока, полученное при замере через Лилу (39) сокращение в 3,43 раза использовалась отлич книга Balsa_v2724, которая надежно замеряет, в ней очень мало шума, но пмм она возможно немного сжимает интервал, на несколько % (точнее не могу сейчас сказать) с учетом этого, сокращение интервала SF12-SF11 можно примерно оценить в районе 3,00-3,25 т.е., на основании этого теста - если мы имеем некое самоЭло Стока, его прогресс относительно Лилы составляет ~30-33% самоЭло А SF12-sf dev 25 эло, т.е. примерно 110% от того, что показывает регресс-тест... __________________ Развернуть для просмотра [свернуть]

17.10.2020, 07:19	#7130
Jeweller 2 разряд Регистрация: 24.01.2018 Сообщений: 351 Сказал(а) спасибо: 481 Поблагодарили 311 раз(а) в 153 сообщениях Репутация: 56	Re: LCZero общая картина еще сложнее - т.к. характеристики нейро и классического Стока отличаются, также как и характеристики сетей Лилы разной размерности - измерение Стока каждого типа через сеть Лилы другой размерности может дать разные коэф сжатия самоЭло эти коэф сжатия можно примерно классифицировать так: 1 - по типам Стока: а) классический сток относительно классического б) сетевой - классический в) сетевой - сетевой 2 - по размерностям сетей Лилы ---------------- значение ~0,30-0,33 из теста выше относится к варианту: измерение "сетевой-классический" через 384-сеть Лилы для других сочетаний типов Стока и размерностей Лилы, коэф могут быть другими в широких пределах ну и результатов тестов хотелось бы больше, чтобы основываться на более твердом основании

17.10.2020, 08:36	#7131
Владимир001 Эксперт Регистрация: 19.12.2019 Сообщений: 7,484 Сказал(а) спасибо: 4,655 Поблагодарили 12,178 раз(а) в 5,475 сообщениях Репутация: 259	Re: LCZero https://www.twitch.tv/navratil25 Stockfish Sufi Lc0-Sufi 8 ply balanced book 60’ + 60” Код: # PLAYER : RATING ERROR POINTS PLAYED (%) CFS(%) W D L D(%) 1 stockfish-Sufi 19 : 16 15 11.0 21 52.4 85 1 20 0 95.2 2 Lc0-Sufi : 0 15 10.0 21 47.6 --- 0 20 1 95.2 MEDIANS Код: Name Games Depth NPS Nodes ------------------------------------------------------------------------------------- stockfish-Sufi 19 : 21 55 3234797 2171068966 Lc0-Sufi : 21 17 23912 7364415 https://pixeldrain.com/u/UUHc6Ynt

17.10.2020, 09:15	#7132
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Jeweller измерение разницы SF12-SF11 через Лилу дало 39 Elo А измерение SF13 через LZ в сравнении со SF12 дало 25, при официально замеренной разнице в 23 Elo на 28 сентября: Сейчас если замерить, то вероятнее всего будет где-то на пару Elo больше, т.е. фактически 100% попадание при измерении хоть напрямую, хоть через прокладку в лице другого движка. Остюда, ничего подобного оценивать тут нельзя: Цитата: Сообщение от Jeweller можно примерно оценить, во сколько раз сжимается самоЭло Стока, полученное при регресс тесте на фиштесте (SF12-SF11 = 133,7) И уж тем более нельзя делать никаких выводов на основании просмотра части результатов, без анализа полной версии увиденного.

17.10.2020, 09:26	#7133
Jeweller 2 разряд Регистрация: 24.01.2018 Сообщений: 351 Сказал(а) спасибо: 481 Поблагодарили 311 раз(а) в 153 сообщениях Репутация: 56	Re: LCZero Maratka, прочитайте 7130 там ответ на Ваше возражение

17.10.2020, 09:37	#7134
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Не вижу я там возражений, 12-й и 13-й SF'шы - это один и тот же движок, и там 25 Elo за два месяца, практически на ровном месте, ибо оценка уже таких резких прыжков не делала (рост ее где-то на 6-7 Elo, не более). Вот 11-й - уже другой, но сравнение 12-го с 11-м вида "мы получили 39 Elo", когда 13-й в сравнении с 12-м за два месяца дал 25, и при этом совершенно очевидно, что 12-й вырос в сравнении с 11-м в большей степени как раз из-за принципиально другой, гораздо более точной оценки - это как минимум нужно формулировать свои тезисы более осторожно. Цитата: Сообщение от Jeweller ну и результатов тестов хотелось бы больше, чтобы основываться на более твердом основании А вот с этим соглашусь: пусть замерят через LZ 9-й SF к 8, 10 к 9, 11 к 10. Можно и ниже, - 8 к 7, 7 к 6. Все через LZ. Посмотрим, если принципиально тип движка - то разницы опять же с официальными данными +\- не будет, ибо все эти старые версии алгоритмически одинаковы.

17.10.2020, 09:54	#7135
Jeweller 2 разряд Регистрация: 24.01.2018 Сообщений: 351 Сказал(а) спасибо: 481 Поблагодарили 311 раз(а) в 153 сообщениях Репутация: 56	Re: LCZero Цитата: Сообщение от Maratka Не вижу я там возражений... еще раз обратите внимание на это: Цитата: характеристики нейро и классического Стока отличаются, также как и характеристики сетей Лилы разной размерности - измерение Стока каждого типа через сеть Лилы другой размерности может дать разные коэф сжатия самоЭло также как и измерение разных сетей Лилы через Стоки разного типа, в общем случае, может дать разные результаты в общем случае - это касается любого движка причины, повторюсь - разные рейтинговые характеристики движков и сетей разного типа и размерности из-за чего возникают все эти эффекты их все можно (и полезно) корректно замерить на хорошей статистике и сложных моделях, частично у меня это запланировано, но 1) нескоро, 2) не все публикую

17.10.2020, 09:59	#7136
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Цитата: Сообщение от Jeweller также как и измерение разных сетей Лилы через Стоки разного типа, в общем случае, может дать разные результаты в общем случае - это касается любого движка В общем случае может и касаться, но не тут: получить 40 Elo вместо 120, зная при этом, что львиная доля этого Elo дала сеть - странно, и вдвойне странно наблюдать эти 40 Elo, зная, что 13-я версия к 12-й уже дала 25 (и эти данные почему-то совпали), хотя там никаких принципиальных изменений как раз таки нет. Вот если бы намерили скажем 105, да даже и 90 Elo - ну можно было бы поговорить про разное железо, или там разные дебюты, которые и дают разный выхлоп, но 40 - это ни в какие ворота не лезет! Ну и конечно же количество партий - когда оно варится в районе всего-то 200 (но не точно 200, у разных движков - разное количество партий!!) - это тоже дает свою, и заметную ошибку.

17.10.2020, 10:07	#7137
Jeweller 2 разряд Регистрация: 24.01.2018 Сообщений: 351 Сказал(а) спасибо: 481 Поблагодарили 311 раз(а) в 153 сообщениях Репутация: 56	Re: LCZero лезет оно в ворота и ничего странного нет, еще раз - разные рейтинговые характеристики движков и сетей разного типа и размерности количество партий нужно для учета ширины погрешностей, и даже с их учетом - эффект сжатия значительный -------------------- добавлено: но конечно партий нужно на порядок больше, и воспроизводимость результата независимо, в том тесте могут быть свои искажения Последний раз редактировалось Jeweller; 17.10.2020 в 10:57.

17.10.2020, 11:22	#7138
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Не совсем понял, что такое "разные рейтинговые характеристики движков"? Понятно, что рейтинги заведомо разные, но не совсем понятно, почему разный рейтинг SF12 и 13 совпадает и по официальному тесту, и по приведенному чуть выше, который мы и обсуждаем, но не совпадает в паре SF12 и 11? Или вот: 11-я версия как измерено всего на 19 Elo слабее, чем некая "Leela Jhorthos J92-190", так как же заметно более сильная версия SF, играющая в TCEC 17 проиграла заметно более слабой версии LZ? Не в том ли дело, что в тесте было всего-то 152 партии, а в TCEC и того меньше, и погрешности могли наложиться так, что этот тест показывает черт знает что, но не реальное соотношение рейтингов движков?

17.10.2020, 11:54	#7139
Jeweller 2 разряд Регистрация: 24.01.2018 Сообщений: 351 Сказал(а) спасибо: 481 Поблагодарили 311 раз(а) в 153 сообщениях Репутация: 56	Re: LCZero Цитата: Сообщение от Maratka Не совсем понял, что такое "разные рейтинговые характеристики движков"? в частности, разные характеристики "широкополостности/узкополостности", способности движка показывать заметно разные рейтинги против движков сильнее/слабее - в результате, если мерить через такой движок, разница в силе будет сильно отличаться (не только сжиматься, раздвигаться также может)

17.10.2020, 12:30	#7140
Maratka Эксперт Регистрация: 11.04.2017 Адрес: РФ, Крым, Севастополь. Сообщений: 11,849 Сказал(а) спасибо: 3,311 Поблагодарили 5,952 раз(а) в 4,245 сообщениях Репутация: 253	Re: LCZero Ну в тесте 12 vs 11 у 11-й включен (как кажется) contempt, причем положительное его значение явно не способствует максимальному результату против 12-й версии, так что если так и есть, то разница реально должна быть поменьше, чем ~120 Elo, но все одно - 40 слишком мало. Опять же, это видно по тестам на середину-конце июля, там набегало ~25 Elo, и вдруг сразу стало под сотню, от простой замены оценочной функции.

Здесь присутствуют: 3 (пользователей: 0 , гостей: 3)