Forchess - форум о заочных шахматах  

Вернуться   Forchess - форум о заочных шахматах > Заочные турниры и партии > Шахматные программы и движки

Ответ
 
Опции темы Опции просмотра
Старый 15.10.2020, 21:43   #7111
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Чего жаль то?
Смысла от нее только в на коротких контролях.
Maratka вне форума   Ответить с цитированием
Старый 15.10.2020, 22:36   #7112
svoitsl
Гроссмейстер
 
Аватар для svoitsl
 
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
Чего жаль то?
Ну хотя бы потому, что большая сеть не запускается на 1Г

Цитата: Сообщение от Maratka
Смысла от нее только в на коротких контролях.
Вы очевидно перепутали с 10х128? К тому же пока не у всех есть 4xV100
svoitsl вне форума   Ответить с цитированием
Старый 15.10.2020, 22:52   #7113
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от svoitsl
Ну хотя бы потому, что большая сеть не запускается на 1Г
Платы даже с 4 гигабайтами стоят не так уж и дорого.
AMD RX550 например:
https://technopoint.ru/product/2e4cb...4gbd5-dh-sale/
Maratka вне форума   Ответить с цитированием
Старый 15.10.2020, 23:01   #7114
Переяслав
Гроссмейстер
 
Аватар для Переяслав
 
Регистрация: 12.07.2020
Сообщений: 1,784
Сказал(а) спасибо: 650
Поблагодарили 2,306 раз(а) в 1,004 сообщениях
Записей в дневнике: 20
Репутация: 136
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
Смысла от нее только в на коротких контролях.
хоть бы один тест увидеть это подтверждающий
__________________
PGN Spy - top tournaments
Переяслав вне форума   Ответить с цитированием
Старый 15.10.2020, 23:11   #7115
Переяслав
Гроссмейстер
 
Аватар для Переяслав
 
Регистрация: 12.07.2020
Сообщений: 1,784
Сказал(а) спасибо: 650
Поблагодарили 2,306 раз(а) в 1,004 сообщениях
Записей в дневнике: 20
Репутация: 136
По умолчанию Re: LCZero





из более-менее долгих тестов я вижу на СЕГТ 256-ые только сети и оттестированы. И вполне себе неплохо стоят
и видяхи там как моя NVIDIA GTX 1060 так и NVIDIA GTX 1650 - не особо то мощнецкие
__________________
PGN Spy - top tournaments
Переяслав вне форума   Ответить с цитированием
Старый 15.10.2020, 23:26   #7116
Владимир001
Эксперт
 
Аватар для Владимир001
 
Регистрация: 19.12.2019
Сообщений: 7,484
Сказал(а) спасибо: 4,655
Поблагодарили 12,178 раз(а) в 5,475 сообщениях
Репутация: 259
По умолчанию Re: LCZero

Opening Books

https://github.com/jhorthos/lczero-t.../Opening-Books
Владимир001 вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
Jeweller (16.10.2020), Переяслав (15.10.2020)
Старый 16.10.2020, 12:15   #7117
Переяслав
Гроссмейстер
 
Аватар для Переяслав
 
Регистрация: 12.07.2020
Сообщений: 1,784
Сказал(а) спасибо: 650
Поблагодарили 2,306 раз(а) в 1,004 сообщениях
Записей в дневнике: 20
Репутация: 136
По умолчанию Re: LCZero

Цитата: Сообщение от Владимир001


Код:
Result:
------------------------------------------------------------------------------
  #  name              games    wins   draws  losses   score    los%  elo+/-
  1. Stockfish 141020    100      46      13      41    52.5    70.4    17.4
  2. Stockfish 12        100      41      13      46    47.5    29.6   -17.4

Tech:
------------------------------------------------------------------------------

Tech (average nodes, depths, time/m per move, others per game):
  #  name                nodes/m         NPS  depth/m   time/m    moves     time
  1. Stockfish 141020      6617K      758870     26.2      8.7     61.6    537.5
  2. Stockfish 12          6578K      731125     25.9      9.0     61.7    554.8
     all ---               6443K      744778     26.1      8.9     61.6    546.1

Код:
Result:
------------------------------------------------------------------------------
  #  name              games    wins   draws  losses   score    los%  elo+/-
  1. Stockfish 12        100       7      86       7    50.0    50.0    -0.0
  2. Stockfish 141020    100       7      86       7    50.0    50.0    -0.0

Tech:
------------------------------------------------------------------------------

Tech (average nodes, depths, time/m per move, others per game):
  #  name                nodes/m         NPS  depth/m   time/m    moves     time
  1. Stockfish 12          6175K      700853     30.7      8.8     50.5    445.4
  2. Stockfish 141020      6472K      741492     30.8      8.7     50.6    441.8
     all ---               6175K      721091     30.8      8.8     50.6    443.6
8-ply book Q > 0.40 [10,184 openings] - конечно сумасшедшая
сравните, первая таблица - результаты по этому набору дебютов, а вторая - по стандортной 4-ходовке Номена сбалансированной

Процент ничьих 13% против 86%
Там дичь конечно та еще! Я давно ищу книги с более-менее несбалансированными дебютами, но чтоб настолько
__________________
PGN Spy - top tournaments
Переяслав вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
Alvir (16.10.2020), Jeweller (16.10.2020)
Старый 16.10.2020, 12:28   #7118
Переяслав
Гроссмейстер
 
Аватар для Переяслав
 
Регистрация: 12.07.2020
Сообщений: 1,784
Сказал(а) спасибо: 650
Поблагодарили 2,306 раз(а) в 1,004 сообщениях
Записей в дневнике: 20
Репутация: 136
По умолчанию Re: LCZero

8-ply book Q 0.25 to 0.40 [14,852 openings] - наверное это норм будет с ничьими под 60% - проверимс!
__________________
PGN Spy - top tournaments
Переяслав вне форума   Ответить с цитированием
Старый 16.10.2020, 12:40   #7119
Переяслав
Гроссмейстер
 
Аватар для Переяслав
 
Регистрация: 12.07.2020
Сообщений: 1,784
Сказал(а) спасибо: 650
Поблагодарили 2,306 раз(а) в 1,004 сообщениях
Записей в дневнике: 20
Репутация: 136
По умолчанию Re: LCZero

Цитата: Сообщение от Переяслав
8-ply book Q 0.25 to 0.40 [14,852 openings] - наверное это норм будет с ничьими под 60% - проверимс!
Код:
Result:
------------------------------------------------------------------------------
  #  name              games    wins   draws  losses   score    los%  elo+/-
  1. Stockfish 141020    100      34      48      18    58.0    98.7    56.1
  2. Stockfish 12        100      18      48      34    42.0     1.3   -56.1

Tech:
------------------------------------------------------------------------------

Tech (average nodes, depths, time/m per move, others per game), counted for computing moves only, ignored moves with zero nodes:
  #  name                nodes/m         NPS  depth/m   time/m    moves     time
  1. Stockfish 141020      1077K     1427275     20.5      0.8     58.9     44.5
  2. Stockfish 12          1043K     1344180     20.0      0.8     59.0     45.8
     all ---               1035K     1385137     20.2      0.8     59.0     45.1
Эта попроще, но 60% не взяла.
Итого получается интресно, на супер сбалансированной книге 12-ый у меня играет на равных с 141020-ым, а на разбалансе - новый выносит "старичка"!

Вот и не говорите потом, что дебюты не влияют на силу игры
__________________
PGN Spy - top tournaments
Переяслав вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
Alvir (16.10.2020), Jeweller (16.10.2020)
Старый 16.10.2020, 15:44   #7120
Владимир001
Эксперт
 
Аватар для Владимир001
 
Регистрация: 19.12.2019
Сообщений: 7,484
Сказал(а) спасибо: 4,655
Поблагодарили 12,178 раз(а) в 5,475 сообщениях
Репутация: 259
По умолчанию Re: LCZero

https://pixeldrain.com/u/auZJPHwF

Match: 30b nets J92-190 vs J92-270 in time control
LC0 version:0.26.3
LC0 options: 1 thread, move-overhead=50
Time control: 5s+0.5s
Hardware: RTX 2070
Book: Sufi book (293 openings)
Tablebases: 6-man TB for both.
Speed: 9.1 knps (benchmark with 1 thread)
Adjudication: 6-man TB, -draw movenumber=50 movecount=5 score=8 -resign movecount=5 score=800
Software:cutechess-cli
Comments: J92-270 beats J92-190 (+2 elo, CFS 65%): +60 -56 =470

tc=5s+0.5s, 1 thread, move-overhead=50, RTX 2070

J92-190 vs others

Код:
# PLAYER             :  RATING  ERROR  POINTS  PLAYED   (%)  CFS(%)    W     D    L
+  1 lc0.net.J92-270    :       2     13   295.0     586  50.3      65   60   470   56
-  2 lc0.net.J92-190    :       0   ----  1482.5    2930  50.6      57  354  2257  319
   3 lc0.net.J92-220    :      -1     13   292.0     586  49.8      58   70   444   72
   4 lc0.net.J92-210    :      -3     13   290.5     586  49.6      50   64   453   69
   5 lc0.net.J92-180    :      -3     13   290.5     586  49.6      93   67   447   72
   6 lc0.net.J92-100    :     -17     13   279.5     586  47.7     ---   58   443   85
Владимир001 вне форума   Ответить с цитированием
Старый 16.10.2020, 15:55   #7121
Владимир001
Эксперт
 
Аватар для Владимир001
 
Регистрация: 19.12.2019
Сообщений: 7,484
Сказал(а) спасибо: 4,655
Поблагодарили 12,178 раз(а) в 5,475 сообщениях
Репутация: 259
По умолчанию Re: LCZero

Лила проводит типовую атаку в старушке.

https://youtu.be/qIgPEyCdpkY
Владимир001 вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Переяслав (16.10.2020)
Старый 16.10.2020, 21:13   #7122
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от svoitsl
А сети обычного размера 20х256 как не было так и нет.... жаль
jhortos начал тренировки сети размерности 192x20b!

Самая первая сеть LJ1-50 https://storage.lczero.org/files/net...contrib/LJ1-50
Омегазеро вне форума   Ответить с цитированием
3 пользователя(ей) сказали cпасибо:
Alvir (16.10.2020), Arikchess (17.10.2020), byan_mivv (16.10.2020)
Старый 16.10.2020, 21:22   #7123
Владимир001
Эксперт
 
Аватар для Владимир001
 
Регистрация: 19.12.2019
Сообщений: 7,484
Сказал(а) спасибо: 4,655
Поблагодарили 12,178 раз(а) в 5,475 сообщениях
Репутация: 259
По умолчанию Re: LCZero

Match Stockfish 11 vs Lc0 JH J92-190
Tournament: Gauntlet
Binaries: BMI2 | Lc0-v0.26.1
Engine Options: Default
Hardware: i7 7700k 4CPU | 1080TI -- 1000:1 Ratio 20b
Time control: 60+1
Book: Balsa v2724
Tablebases: None
Adjudication: +-9 Win
Software: Cutechess-Cli
Sheets: https://docs.google.com/spreadsheets...#gid=201239930
Comments: A good test to see how NNUE has affected SF Perf against Lc0.

H2H
Код:
# PLAYER                    :  RATING  ERROR  POINTS  PLAYED   (%)    W    D    L  D(%)  OppN  CFS(%)
   1 Leela Jhorthos J92-190    :       0     14    80.0     152  52.6   24  112   16  73.7     1      90
   2 Stockfish 11              :     -19     14    72.0     152  47.4   16  112   24  73.7     1     ---

All
Код:
   # PLAYER                       :  RATING  ERROR  POINTS  PLAYED   (%)    W    D    L  D(%)  OppN  CFS(%)
   1 Stockfish 13 Dev [Sep 28]    :      45     16   157.5     280  56.3   43  229    8  81.8     1      96
   2 Stockfish 12                 :      20     18   105.5     200  52.8   26  159   15  79.5     1      96
   3 Leela Jhorthos J92-190       :       0      9   297.0     632  47.0   47  500   85  79.1     3      93
   4 Stockfish 11                 :     -19     20    72.0     152  47.4   16  112   24  73.7     1     ---

White advantage = 38.18 +/- 6.09
Draw rate (equal opponents) = 83.30 % +/- 1.71
Владимир001 вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
ck195708 (16.10.2020), Jeweller (16.10.2020)
Старый 16.10.2020, 21:26   #7124
Владимир001
Эксперт
 
Аватар для Владимир001
 
Регистрация: 19.12.2019
Сообщений: 7,484
Сказал(а) спасибо: 4,655
Поблагодарили 12,178 раз(а) в 5,475 сообщениях
Репутация: 259
По умолчанию Re: LCZero

jhortos:
First 192x20b Lender net posted https://github.com/jhorthos/lczero-t...Leela-Training
Suitable for play on with 18 or fewer pieces left.
Владимир001 вне форума   Ответить с цитированием
Старый 16.10.2020, 21:29   #7125
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: LCZero

Цитата: Сообщение от Владимир001
Код:
   # PLAYER                       :  RATING  ERROR  POINTS  PLAYED   (%)    W    D    L  D(%)  OppN  CFS(%)
   1 Stockfish 13 Dev [Sep 28]    :      45     16   157.5     280  56.3   43  229    8  81.8     1      96
   2 Stockfish 12                 :      20     18   105.5     200  52.8   26  159   15  79.5     1      96
   3 Leela Jhorthos J92-190       :       0      9   297.0     632  47.0   47  500   85  79.1     3      93
   4 Stockfish 11                 :     -19     20    72.0     152  47.4   16  112   24  73.7     1     ---

White advantage = 38.18 +/- 6.09
Draw rate (equal opponents) = 83.30 % +/- 1.71
какой хороший тест!

измерение разницы SF12-SF11 через Лилу дало 39 Elo
Jeweller вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
ck195708 (16.10.2020), Владимир001 (16.10.2020)
Старый 16.10.2020, 21:47   #7126
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: LCZero

Цитата: Сообщение от Jeweller
измерение разницы SF12-SF11 через Лилу дало 39 Elo
можно примерно оценить, во сколько раз сжимается самоЭло Стока, полученное при регресс тесте на фиштесте (SF12-SF11 = 133,7)
относительно "лила"Эло Стока, полученное при замере через Лилу (39)

сокращение в 3,43 раза

использовалась отлич книга Balsa_v2724, которая надежно замеряет, в ней очень мало шума, но пмм она возможно немного сжимает интервал, на несколько % (точнее не могу сейчас сказать)
с учетом этого, сокращение интервала SF12-SF11 можно примерно оценить в районе 3,00-3,25

т.е., на основании этого теста - если мы имеем некое самоЭло Стока, его прогресс относительно Лилы составляет ~30-33% самоЭло
Jeweller вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Владимир001 (16.10.2020)
Старый 16.10.2020, 22:08   #7127
svoitsl
Гроссмейстер
 
Аватар для svoitsl
 
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
По умолчанию Re: LCZero

Цитата: Сообщение от Владимир001
Suitable for play on with 18 or fewer pieces left.
То есть она для эндшпилей что ли?
svoitsl вне форума   Ответить с цитированием
Старый 16.10.2020, 22:30   #7128
byan_mivv
Гроссмейстер
 
Аватар для byan_mivv
 
Регистрация: 02.07.2016
Сообщений: 2,104
Сказал(а) спасибо: 4,488
Поблагодарили 5,221 раз(а) в 1,744 сообщениях
Репутация: 435
По умолчанию Re: LCZero

Цитата: Сообщение от svoitsl
То есть она для эндшпилей что ли?
"Подходит для игры, когда осталось 18 или меньше фигур."

Получается так... У меня она уже четвертую партию проигрывает всухую сети J92-270...
__________________
"Не-ум - цветы вечности." Ошо
byan_mivv вне форума   Ответить с цитированием
Старый 16.10.2020, 23:49   #7129
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: LCZero

Цитата: Сообщение от Jeweller
можно примерно оценить, во сколько раз сжимается самоЭло Стока, полученное при регресс тесте на фиштесте (SF12-SF11 = 133,7)
относительно "лила"Эло Стока, полученное при замере через Лилу (39)

сокращение в 3,43 раза

использовалась отлич книга Balsa_v2724, которая надежно замеряет, в ней очень мало шума, но пмм она возможно немного сжимает интервал, на несколько % (точнее не могу сейчас сказать)
с учетом этого, сокращение интервала SF12-SF11 можно примерно оценить в районе 3,00-3,25

т.е., на основании этого теста - если мы имеем некое самоЭло Стока, его прогресс относительно Лилы составляет ~30-33% самоЭло
А SF12-sf dev 25 эло, т.е. примерно 110% от того, что показывает регресс-тест...
__________________

Развернуть для просмотра

[свернуть]
Vizvezdenec вне форума   Ответить с цитированием
Старый 17.10.2020, 07:19   #7130
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: LCZero

общая картина еще сложнее -
т.к. характеристики нейро и классического Стока отличаются, также как и
характеристики сетей Лилы разной размерности - измерение Стока каждого типа через сеть Лилы другой размерности может дать разные коэф сжатия самоЭло

эти коэф сжатия можно примерно классифицировать так:

1 - по типам Стока:
а) классический сток относительно классического
б) сетевой - классический
в) сетевой - сетевой

2 - по размерностям сетей Лилы

----------------

значение ~0,30-0,33 из теста выше относится к варианту: измерение "сетевой-классический" через 384-сеть Лилы
для других сочетаний типов Стока и размерностей Лилы, коэф могут быть другими в широких пределах

ну и результатов тестов хотелось бы больше, чтобы основываться на более твердом основании
Jeweller вне форума   Ответить с цитированием
Старый 17.10.2020, 08:36   #7131
Владимир001
Эксперт
 
Аватар для Владимир001
 
Регистрация: 19.12.2019
Сообщений: 7,484
Сказал(а) спасибо: 4,655
Поблагодарили 12,178 раз(а) в 5,475 сообщениях
Репутация: 259
По умолчанию Re: LCZero

https://www.twitch.tv/navratil25

Stockfish Sufi
Lc0-Sufi

8 ply balanced book
60’ + 60”
Код:
# PLAYER : RATING ERROR POINTS PLAYED (%) CFS(%) W D L D(%)
1 stockfish-Sufi 19 : 16 15 11.0 21 52.4 85 1 20 0 95.2
2 Lc0-Sufi : 0 15 10.0 21 47.6 --- 0 20 1 95.2
MEDIANS
Код:
Name                     Games    Depth       NPS           Nodes
-------------------------------------------------------------------------------------
stockfish-Sufi 19    :      21     55        3234797   2171068966
Lc0-Sufi             :      21     17           23912      7364415
https://pixeldrain.com/u/UUHc6Ynt
Владимир001 вне форума   Ответить с цитированием
3 пользователя(ей) сказали cпасибо:
Jeweller (17.10.2020), Viktor (17.10.2020), Виталий В. (18.10.2020)
Старый 17.10.2020, 09:15   #7132
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Jeweller
измерение разницы SF12-SF11 через Лилу дало 39 Elo
А измерение SF13 через LZ в сравнении со SF12 дало 25, при официально замеренной разнице в 23 Elo на 28 сентября:



Сейчас если замерить, то вероятнее всего будет где-то на пару Elo больше, т.е. фактически 100% попадание при измерении хоть напрямую, хоть через прокладку в лице другого движка.

Остюда, ничего подобного оценивать тут нельзя:
Цитата: Сообщение от Jeweller
можно примерно оценить, во сколько раз сжимается самоЭло Стока, полученное при регресс тесте на фиштесте (SF12-SF11 = 133,7)
И уж тем более нельзя делать никаких выводов на основании просмотра части результатов, без анализа полной версии увиденного.
Maratka вне форума   Ответить с цитированием
Старый 17.10.2020, 09:26   #7133
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: LCZero

Maratka, прочитайте 7130
там ответ на Ваше возражение
Jeweller вне форума   Ответить с цитированием
Старый 17.10.2020, 09:37   #7134
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Не вижу я там возражений, 12-й и 13-й SF'шы - это один и тот же движок, и там 25 Elo за два месяца, практически на ровном месте, ибо оценка уже таких резких прыжков не делала (рост ее где-то на 6-7 Elo, не более).

Вот 11-й - уже другой, но сравнение 12-го с 11-м вида "мы получили 39 Elo", когда 13-й в сравнении с 12-м за два месяца дал 25, и при этом совершенно очевидно, что 12-й вырос в сравнении с 11-м в большей степени как раз из-за принципиально другой, гораздо более точной оценки - это как минимум нужно формулировать свои тезисы более осторожно.

Цитата: Сообщение от Jeweller
ну и результатов тестов хотелось бы больше, чтобы основываться на более твердом основании
А вот с этим соглашусь: пусть замерят через LZ 9-й SF к 8, 10 к 9, 11 к 10. Можно и ниже, - 8 к 7, 7 к 6. Все через LZ.
Посмотрим, если принципиально тип движка - то разницы опять же с официальными данными +\- не будет, ибо все эти старые версии алгоритмически одинаковы.
Maratka вне форума   Ответить с цитированием
Старый 17.10.2020, 09:54   #7135
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
Не вижу я там возражений...
еще раз обратите внимание на это:
Цитата:
характеристики нейро и классического Стока отличаются, также как и характеристики сетей Лилы разной размерности - измерение Стока каждого типа через сеть Лилы другой размерности может дать разные коэф сжатия самоЭло
также как и измерение разных сетей Лилы через Стоки разного типа, в общем случае, может дать разные результаты
в общем случае - это касается любого движка

причины, повторюсь - разные рейтинговые характеристики движков и сетей разного типа и размерности
из-за чего возникают все эти эффекты

их все можно (и полезно) корректно замерить на хорошей статистике и сложных моделях, частично у меня это запланировано, но 1) нескоро, 2) не все публикую
Jeweller вне форума   Ответить с цитированием
Старый 17.10.2020, 09:59   #7136
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Цитата: Сообщение от Jeweller
также как и измерение разных сетей Лилы через Стоки разного типа, в общем случае, может дать разные результаты
в общем случае - это касается любого движка
В общем случае может и касаться, но не тут: получить 40 Elo вместо 120, зная при этом, что львиная доля этого Elo дала сеть - странно, и вдвойне странно наблюдать эти 40 Elo, зная, что 13-я версия к 12-й уже дала 25 (и эти данные почему-то совпали), хотя там никаких принципиальных изменений как раз таки нет.

Вот если бы намерили скажем 105, да даже и 90 Elo - ну можно было бы поговорить про разное железо, или там разные дебюты, которые и дают разный выхлоп, но 40 - это ни в какие ворота не лезет!

Ну и конечно же количество партий - когда оно варится в районе всего-то 200 (но не точно 200, у разных движков - разное количество партий!!) - это тоже дает свою, и заметную ошибку.
Maratka вне форума   Ответить с цитированием
Старый 17.10.2020, 10:07   #7137
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: LCZero

лезет оно в ворота и ничего странного нет, еще раз - разные рейтинговые характеристики движков и сетей разного типа и размерности

количество партий нужно для учета ширины погрешностей, и даже с их учетом - эффект сжатия значительный

--------------------

добавлено: но конечно партий нужно на порядок больше, и воспроизводимость результата независимо, в том тесте могут быть свои искажения

Последний раз редактировалось Jeweller; 17.10.2020 в 10:57.
Jeweller вне форума   Ответить с цитированием
Старый 17.10.2020, 11:22   #7138
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Не совсем понял, что такое "разные рейтинговые характеристики движков"?
Понятно, что рейтинги заведомо разные, но не совсем понятно, почему разный рейтинг SF12 и 13 совпадает и по официальному тесту, и по приведенному чуть выше, который мы и обсуждаем, но не совпадает в паре SF12 и 11?

Или вот: 11-я версия как измерено всего на 19 Elo слабее, чем некая "Leela Jhorthos J92-190", так как же заметно более сильная версия SF, играющая в TCEC 17 проиграла заметно более слабой версии LZ? Не в том ли дело, что в тесте было всего-то 152 партии, а в TCEC и того меньше, и погрешности могли наложиться так, что этот тест показывает черт знает что, но не реальное соотношение рейтингов движков?
Maratka вне форума   Ответить с цитированием
Старый 17.10.2020, 11:54   #7139
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: LCZero

Цитата: Сообщение от Maratka
Не совсем понял, что такое "разные рейтинговые характеристики движков"?
в частности, разные характеристики "широкополостности/узкополостности", способности движка показывать заметно разные рейтинги против движков сильнее/слабее - в результате, если мерить через такой движок, разница в силе будет сильно отличаться (не только сжиматься, раздвигаться также может)
Jeweller вне форума   Ответить с цитированием
Старый 17.10.2020, 12:30   #7140
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: LCZero

Ну в тесте 12 vs 11 у 11-й включен (как кажется) contempt, причем положительное его значение явно не способствует максимальному результату против 12-й версии, так что если так и есть, то разница реально должна быть поменьше, чем ~120 Elo, но все одно - 40 слишком мало.
Опять же, это видно по тестам на середину-конце июля, там набегало ~25 Elo, и вдруг сразу стало под сотню, от простой замены оценочной функции.
Maratka вне форума   Ответить с цитированием
Ответ


Здесь присутствуют: 3 (пользователей: 0 , гостей: 3)
 

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 01:25. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.7
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
Рейтинг@Mail.ru