Forchess - форум о заочных шахматах  

Вернуться   Forchess - форум о заочных шахматах > Заочные турниры и партии > Шахматные программы и движки

Ответ
 
Опции темы Опции просмотра
Старый 22.07.2016, 06:26   #1
Гудвин
Администратор
 
Аватар для Гудвин
 
Регистрация: 24.05.2016
Сообщений: 4,186
Сказал(а) спасибо: 7,165
Поблагодарили 7,655 раз(а) в 3,086 сообщениях
Репутация: 348
По умолчанию Komodo



Официальный сайт
http://komodochess.com/
Последняя версия Komodo 13.2

Последний раз редактировалось Гудвин; 30.11.2019 в 18:58. Причина: Актуализация версии движка
Гудвин вне форума   Ответить с цитированием
5 пользователя(ей) сказали cпасибо:
Alexandr_L (07.09.2017), Ghppn (13.01.2022), PanDoors (22.07.2017), ValstepAS (02.01.2019), Виталий В. (22.07.2017)
Старый 13.11.2020, 00:49   #661
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: Komodo

Цитата: Сообщение от Jeweller
ну вот и хорошо, всего за 3 часа Вы прошли путь от
"Это крепко сказано! Т.е. у SF'ша "недостатки методики" значит?"
до "я не считаю ее идеальной"
Да нет, это Вы прошли путь от критики методики тестирования SF (напомю - сам против себя, лучшего предыдущего), вместо "тестировать против конкурентов" до "оказывается, эта методика дает эффект поболее других".

Не в обиду, но так и есть: SF побил всех за последние года четыре за счет классной методы, к которой липнут разработчики (а вот к LZ почему-то не липнут, хотя последний несколько лет он был в целом равен SF, да и проект - открытый, входи кто хочет!).

Ну и собственно сама методика "сравнивать новую версию с предыдущей лучшей" - оказывается не так уж и провальная, скорее наоборот - она выигрышная против любой другой.
Maratka вне форума   Ответить с цитированием
Старый 13.11.2020, 00:54   #662
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

Цитата: Сообщение от Vizvezdenec
Но наступит ли "не экспансивный" этап? Потому что пока что желания что-то я ни у кого не наблюдаю.
ну Грант с Halogen что то делали кажется, Nemorino что то поменял
это мелочи пока, но дело не в объеме изменений, пмм, а в их характере - он авторский, и более вероятен в авторский проектах,
а не в проектах типа стока/лилы, более заточенных на экспансивный рост до упора
Jeweller вне форума   Ответить с цитированием
Старый 13.11.2020, 01:00   #663
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: Komodo

Цитата: Сообщение от Jeweller
а не в проектах типа стока/лилы, более заточенных на экспансивный рост до упора
А почему Вы решили, что SF вот так буквально "до упора"?
Я вижу ровно обратное: нашлась новая (сетевая) методика ОФ - внедрили, получили... полтораста Elo.

А вот в LZ никак не могут переписать поиск с MCTS на a-b, вот то- проблема, которая их за жабры держит, ибо уровень сетей (уверен) у LZ выше на 100-200 Elo, чем у SF (банально, за три года навострились, да и размерность, а значит и точность коэффициентов - гораздо лучше).
Maratka вне форума   Ответить с цитированием
Старый 13.11.2020, 01:10   #664
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

Цитата: Сообщение от Maratka
Да нет, это Вы прошли путь от критики методики тестирования SF (напомю - сам против себя, лучшего предыдущего), вместо "тестировать против конкурентов" до "оказывается, эта методика дает эффект поболее других".
чего???
Maratka, я ни слова не говорил ни о чем из Вами перечисленного

вот мой тезис, с которым Вы стали спорить
Цитата:
2--- оптимизация ручной ОФ на партиях других движков (в игре с другими движками) по сути аналогичный процесс, и многократно используемый, я не слышал еще чтобы кто-нибудь называл это незаконным)
Jeweller вне форума   Ответить с цитированием
Старый 13.11.2020, 01:19   #665
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

Цитата: Сообщение от Maratka
А почему Вы решили, что SF вот так буквально "до упора"?
а потому что такое мое мнение
большая машина - большая инерция
прорыв - слом инерции, которая в авторском случае меньше
Jeweller вне форума   Ответить с цитированием
Старый 13.11.2020, 02:37   #666
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: Komodo

Цитата: Сообщение от Jeweller
ну Грант с Halogen что то делали кажется, Nemorino что то поменял
это мелочи пока, но дело не в объеме изменений, пмм, а в их характере - он авторский, и более вероятен в авторский проектах,
а не в проектах типа стока/лилы, более заточенных на экспансивный рост до упора
Именно по этой причине NNUE первым в стоке появился?
Ну я не согласен с этим тезисом. Инновации - всегда хорошо, более того, на стокфише их можно оттестировать, т.к. есть и железо, и программисты.
Ну, например, LazySMP в общий доступ со стокфиша пошёл, да, Комодо показал, что так тоже можно, но написал именно рабочую версию, которую раскопировали всё, mbootsector, и она пошла в тираж.
Capture history pruning - автор, по-моему, sg.
Старая идея, но в новой обёртке, которая, казалось бы, была хорошо забыта, так как не давала эло, но сейчас есть почти везде (ну точно есть в Ethereal и Winter), а именно multicut - творчество xoroshiro.
Ну даже моя идея по оценке с двойной защитой пешек - ушла в Ethereal, оттуда, по-моему, в winter, может быть куда-то ещё.
И т.д.
Можно говорить что угодно, но происходит в последние 5 лет ровно обратное - малые/средние/большие идеи первыми появляются в SF, а потом растекаются всюду. Авторы движков на 2800 эло больше озабочены тем, как бы ввести probcut (условно).
Нужно быть совершенно повёрнутым (в хорошем смысле), как Andrew Grant, чтобы в одиночку довести свой движок до уровня хотя бы топ-3, когда уже нельзя просто брать идеи SF, а надо делать что-то своё. Ну и иметь заодно 400 ядер для тестирования.
__________________

Развернуть для просмотра

[свернуть]
Vizvezdenec вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Maratka (13.11.2020)
Старый 13.11.2020, 10:10   #667
Переяслав
Гроссмейстер
 
Аватар для Переяслав
 
Регистрация: 12.07.2020
Сообщений: 1,784
Сказал(а) спасибо: 650
Поблагодарили 2,306 раз(а) в 1,004 сообщениях
Записей в дневнике: 20
Репутация: 136
По умолчанию Re: Komodo

Код:
Result:
-------------------------------------------------------------------------------------------
  #  name                           games    wins   draws  losses   score    los%  elo+/-
  1. Cfish 081120 64 BMI2            1000     285     701      14   635.5   100.0    96.6
  2. Dragon by Komodo Chess 64-bit   1000      14     701     285   364.5     0.0   -96.6

Tech:
-------------------------------------------------------------------------------------------

Tech (average nodes, depths, time/m per move, others per game):
  #  name                             nodes/m         NPS  depth/m   time/m    moves     time
  1. Cfish 081120 64 BMI2               3544K     2296582     26.2      1.5     52.7     81.3
  2. Dragon by Komodo Chess 64-bit      2795K     1752579     21.6      1.6     52.8     84.2
TC=1min+0.6sec
Threads=2
Concurrency=12
Noomen4moves.pgn

Ничьи Дракон неплохо клепает, но вот с победами беда прям беда
__________________
PGN Spy - top tournaments
Переяслав вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
Rom77 (13.11.2020), Виталий В. (13.11.2020)
Старый 13.11.2020, 10:39   #668
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

Цитата: Сообщение от Переяслав
Ничьи Дракон неплохо клепает, но вот с победами беда прям беда
это может быть связано с характером конкретной сети, ее рейтинговыми характеристиками
dkappe умеет делать узкополосные сети (пример Dark Horse, по некоторым сообщениям)), которые хорошо выбивают тех кто слабее и меньше набирают на тех кто сильнее, возможно здесь аналогичный случай

это предположение можно проверить и уточнить, но сейчас комп занят длинной серией тестов
до комодо доберусь очень не скоро, однако неизбежно
Jeweller вне форума   Ответить с цитированием
Старый 13.11.2020, 11:25   #669
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

Цитата: Сообщение от Vizvezdenec
Именно по этой причине NNUE первым в стоке появился?
nnue не появился в стоке - он был рожден в авторском проекте и развивался так годами, эксперименты по прикручиванию nnue к chess шли "на стороне", и только через 2 месяца, сторонняя технология с очевидно большим рейтинговым плюсом начала интегрироваться в большую машину официального стока

но, если бы
1) вместо рейтингового плюса был бы минус, даже небольшой, не была бы интегрирована, несмотря на сколь угодно большой прорывной потенциал, пока не появится рейтинговый плюс
2) если бы японские авторы имели бОльшую субъектность и интерес, вполне могли бы сделать свой движок "Япона-Мать NNUE" - прикручивание к стоку, даже в современном полудохлом состоянии отрасли, не является исторически неизбежным шагом

большие проекты-машины типа сток/лила - проекты по рейтинговой оптимизации инженерно/экспансивного типа, с идеологией - у нас самый длинный писюн, мы делаем его еще длиннее
это не проекты творческого прорыва, в подавляющем числе случаев большая новая идея/концепция может не давать сразу рейтинговый плюс, ей нужно время окрепнуть и усилиться в рамках авторских проектов, для которых творчество и прорывные идеи важнее длины писюна
Jeweller вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
Corrs (13.11.2020), Viktor (13.11.2020)
Старый 13.11.2020, 14:56   #670
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: Komodo

Цитата: Сообщение от Jeweller
nnue не появился в стоке - он был рожден в авторском проекте и развивался так годами, эксперименты по прикручиванию nnue к chess шли "на стороне", и только через 2 месяца, сторонняя технология с очевидно большим рейтинговым плюсом начала интегрироваться в большую машину официального стока

но, если бы
1) вместо рейтингового плюса был бы минус, даже небольшой, не была бы интегрирована, несмотря на сколь угодно большой прорывной потенциал, пока не появится рейтинговый плюс
2) если бы японские авторы имели бОльшую субъектность и интерес, вполне могли бы сделать свой движок "Япона-Мать NNUE" - прикручивание к стоку, даже в современном полудохлом состоянии отрасли, не является исторически неизбежным шагом

большие проекты-машины типа сток/лила - проекты по рейтинговой оптимизации инженерно/экспансивного типа, с идеологией - у нас самый длинный писюн, мы делаем его еще длиннее
это не проекты творческого прорыва, в подавляющем числе случаев большая новая идея/концепция может не давать сразу рейтинговый плюс, ей нужно время окрепнуть и усилиться в рамках авторских проектов, для которых творчество и прорывные идеи важнее длины писюна
LazySMP пытались в сток интегрировать несколько месяцев, пока наконец-то он не стал показывать + эло на 15 ядрах (кстати, по-прежнему показывая минус на 4).
И сразу был интегрирован и уже потом доделан до чего-то более вменяемого.
В стоке есть возможность (которой, кстати, многие пользуются) сделать свой бранч и тестировать прогресс по отношению к нему, а не к мастеру - таких экспериментов проводилось много достаточно.
Проблема в том, что большинство "перспективных" идей даже в оформившемся виде дают минус.
Но, вообще говоря, никто не мешает их полировать, более того, на стоке это крайне удобно делать, потому что у тебя есть почти неограниченное железо, что помогает оценивать прогресс куда лучше, чем домашнее тестирование на 1 машине. Да и подискутировать есть с кем.
__________________

Развернуть для просмотра

[свернуть]
Vizvezdenec вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Arikchess (13.11.2020)
Старый 13.11.2020, 17:08   #671
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: Komodo

Цитата: Сообщение от Jeweller
вот мой тезис, с которым Вы стали спорить
Цитата:
2--- оптимизация ручной ОФ на партиях других движков (в игре с другими движками) по сути аналогичный процесс, и многократно используемый, я не слышал еще чтобы кто-нибудь называл это незаконным)
Он законный, что тут незаконного.
Только в нормальных движках он не используется, а те, кто используют - сидят далеко внизу таблицы, и на лидерство не претендуют.
Maratka вне форума   Ответить с цитированием
Старый 13.11.2020, 18:09   #672
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: Komodo

Цитата: Сообщение от Maratka
Он законный, что тут незаконного.
Только в нормальных движках он не используется, а те, кто используют - сидят далеко внизу таблицы, и на лидерство не претендуют.
Ну как, такие патчи были - на основе поражений от #enginename#.
Но их типа 5%, потому что реально мало работает.
__________________

Развернуть для просмотра

[свернуть]
Vizvezdenec вне форума   Ответить с цитированием
Старый 13.11.2020, 19:42   #673
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

Цитата: Сообщение от Maratka
Только в нормальных движках он не используется
нет никакого деления движков на "нормальные" и "ненормальные" по признаку силы - все движки нормальные
Jeweller вне форума   Ответить с цитированием
Старый 13.11.2020, 20:24   #674
Владимир001
Эксперт
 
Аватар для Владимир001
 
Регистрация: 19.12.2019
Сообщений: 7,484
Сказал(а) спасибо: 4,655
Поблагодарили 12,178 раз(а) в 5,475 сообщениях
Репутация: 259
По умолчанию Re: Komodo

у Stockfish появился новый сильный соперник, теперь: 7000 игр testrun of KomodoDragon 1.0 закончен:

https://www.sp-cc.de
Владимир001 вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
Alvir (13.11.2020), Виталий В. (14.11.2020)
Старый 14.11.2020, 01:11   #675
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: Komodo

Цитата: Сообщение от Владимир001
у Stockfish появился новый сильный соперник, теперь: 7000 игр testrun of KomodoDragon 1.0 закончен:
Это не сильный соперник:
+151,=784,- 65 в пользу 12-й версии SF.
Maratka вне форума   Ответить с цитированием
Старый 14.11.2020, 10:08   #676
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

Цитата: Сообщение от Владимир001
у Stockfish появился новый сильный соперник, теперь: 7000 игр testrun of KomodoDragon 1.0 закончен:

https://www.sp-cc.de
KomodoDragon для Stockfish настолько же сильный соперник,
как Адамс, Витюгов, Свидлер, Андрейкин для --- Непо и Дин Лиженя
как Топалов, Накамура, Фирузджа, Карякин, Крамник, Ананд для --- Каруаны
и даже более сильный соперник, чем Гири, Со, Мамедьяров, Аронян, Дин Лижень, МВЛ, Непо для --- Магнуса

так что да, сильный
Jeweller вне форума   Ответить с цитированием
Старый 14.11.2020, 10:13   #677
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: Komodo

Есть принципиальная разница между играми людей и движков, и состоит она в том, что движки могут легко наиграть хоть 1000, хоть 10000 партий за минимальное время, что про людей не скажешь.
Поэтому и серьёзные соперники у движков несколько другие обычно просто из-за того, что в партиях людей 100 эло на дистанции типичного турнира может быть вполне себе и не видно (я уж и не говорю, что у людей уровень игры "плавает" в зависимости от множества разных факторов).
__________________

Развернуть для просмотра

[свернуть]
Vizvezdenec вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Viktor (14.11.2020)
Старый 14.11.2020, 10:23   #678
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

нет-нет)
давайте не смешивать и не путать на ровном месте
серьезность соперников зависит от относительного класса, который выражается в разности в рейтах на большой дистанции (что и отражается в рейтингах фиде), а не из-за больших флуктуаций на короткой дистанции белковых турниров
Jeweller вне форума   Ответить с цитированием
Старый 14.11.2020, 10:29   #679
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

у меня есть изящный критерий "сильный/не_сильный" - золотое сечение - 0,618 в личной встрече, это 83,6 пунктов разницы

определяю попадание в этот интервал как "сильный соперник" - по этому критерию нейро-Комодо проходит

1/2 этого интервала (41,8 пунктов разницы) определяю как "очень сильный соперник" - вот в эту категорию новый нейро-Комодо не проходит
Jeweller вне форума   Ответить с цитированием
Старый 14.11.2020, 11:46   #680
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

в память о Доне
последняя версия предыдущего шахматного движка Дона, предшественника Комодо

Doch 1.3.4 JA (2010)
Jeweller вне форума   Ответить с цитированием
3 пользователя(ей) сказали cпасибо:
SergeyMZ (14.11.2020), Viktor (14.11.2020), Виталий В. (15.11.2020)
Старый 14.11.2020, 13:10   #681
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: Komodo

Цитата: Сообщение от Jeweller
у меня есть изящный критерий "сильный/не_сильный" - золотое сечение - 0,618 в личной встрече, это 83,6 пунктов разницы

определяю попадание в этот интервал как "сильный соперник" - по этому критерию нейро-Комодо проходит

1/2 этого интервала (41,8 пунктов разницы) определяю как "очень сильный соперник" - вот в эту категорию новый нейро-Комодо не проходит
Ну не знаю, у меня критерий "сильный соперник" - это тот, кто хотя бы с 5% вероятностью может у SF забрать финал TCEC, например.
По этому критерию нейро-комодо явно мимо будет, лила где-то тут, но и всё.
__________________

Развернуть для просмотра

[свернуть]
Vizvezdenec вне форума   Ответить с цитированием
Старый 14.11.2020, 13:25   #682
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: Komodo

http://fastgm.de/60-0.60.html
Из любопытного.
Похоже, что contempt для NNUE у Комодо тоже не очень-то работает.
Он прилично сильнее SF11, но в листе с огромным хвостом отстал за счёт худшего вырубания хвоста.
Казалось бы, NNUE не должно мешать работе contempt, но по факту мешает.
__________________

Развернуть для просмотра

[свернуть]
Vizvezdenec вне форума   Ответить с цитированием
Старый 14.11.2020, 15:02   #683
StenR
2 разряд
 
Аватар для StenR
 
Регистрация: 13.01.2017
Сообщений: 294
Сказал(а) спасибо: 321
Поблагодарили 145 раз(а) в 80 сообщениях
Репутация: 21
По умолчанию Re: Komodo

М-да 60 секунд на игру, это конечно, замечательный материал для обширных выводов :-) Комодо вроде никогда блицором не был, это не Гудини
StenR вне форума   Ответить с цитированием
Старый 14.11.2020, 16:08   #684
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

Цитата: Сообщение от Vizvezdenec
Ну не знаю, у меня критерий "сильный соперник" - это тот, кто хотя бы с 5% вероятностью может у SF забрать финал TCEC, например.
По этому критерию нейро-комодо явно мимо будет, лила где-то тут, но и всё.
в таком определении Ваш критерий "сильный соперник" примерно соответствует моему "очень сильный соперник", даже жестче

пмм, использовать TCEC критерием хуже, потому что:
1) книги tcec не подходят для хорошего замера, к тому же они раз от раза отличаются, и 5% разных финалов друг другу не равны(сильно не равны)
2) железо и контроль такие, что компрессия эло(очень сложная) приводит к большим искажениям, и они тоже разные для разных финалов и очень разные для разных движков, мы почти полностью теряем масштаб пункта эло

безотносительно к tcec:
3) если думать о движковой среде в целом, то лучше использовать контроли и железо в бытовом формате (близкое к ccrl), на них искажения малы
4) хорошие книги (только не книги tcec) с адекватным масштабом пункта эло
5) а думая о развитии движковой среды, лучше не сужать слишком интервал "сильный соперник" - он должен быть универсальным для любого движка из сотен существующих, а не ориентирован только на сток (тем более на tcec, в котором большинство движков никогда не сыграют), поэтому и интервалы лучше взять лояльными и близкими белковым

поэтому я бы даже расширил группы
0 ---> 41,6 - очень сильный соперник
41,6 ---> 83,6 - сильный соперник
83,6 ---> 167,2 - крепкий соперник (не очень сильный, но возможны сюрпризы)
167,2 ---> 334,4 - слабый соперник (группа плохо подходит для замера рейтинга)
>334,4 - доминация, вероятность проигрыша очень мала, группа не подходит для замера рейтинга

Последний раз редактировалось Jeweller; 14.11.2020 в 16:45.
Jeweller вне форума   Ответить с цитированием
Старый 14.11.2020, 16:15   #685
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

Цитата: Сообщение от Vizvezdenec
% набранных очков в хорошем тесте не должен очень сильно отличаться от 50
а там 93,25% - при таком проценте очень сильные деформации, это очень плохой замер, причем для всех движков сверху это так
на фоне этих искажений эффект контемпта тонет внутри, по этому тесту ничего невозможно сказать ни с какой долей уверенности, зачем так тестировать непонятно
Jeweller вне форума   Ответить с цитированием
Старый 14.11.2020, 17:08   #686
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: Komodo

Цитата: Сообщение от Jeweller
% набранных очков в хорошем тесте не должен очень сильно отличаться от 50
а там 93,25% - при таком проценте очень сильные деформации, это очень плохой замер, причем для всех движков сверху это так
на фоне этих искажений эффект контемпта тонет внутри, по этому тесту ничего невозможно сказать ни с какой долей уверенности, зачем так тестировать непонятно
Да всё по нему можно сказать, почти все версии стокфиша очень хорошо ложатся на регресс-тесты того же стокфиша, например.
По нему можно сказать, насколько часто движок делает ничьи с противниками на 800-400 эло меньше - если не делать для этого специальные настройки, то на самом деле эло и так замерять можно.
И SF12 и новый Комодо делают это очевидно чаще, чем SF11 и старый Комодо.
Для SF12 это связано с тем, что в нём толком перестал работать contempt - ну я думаю, что и для Комодо дело в том же самом абсолютно.
А по поводу "хорошего" и "плохого" блицора...
Ерунда это всё в основном. Разве что на каких-нибудь 10+0.1, а то и ниже, начинает ползти всё, а так на 60+0.6, 180+1.8 или там часу на партию разница невелика, она только в том состоит, что эло сжимается, т.к. более слабый движок начинает делать больше ничьих, но не более того.
__________________

Развернуть для просмотра

[свернуть]
Vizvezdenec вне форума   Ответить с цитированием
Старый 14.11.2020, 17:25   #687
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

Цитата: Сообщение от Vizvezdenec
Да всё по нему можно сказать, почти все версии стокфиша очень хорошо ложатся на регресс-тесты того же стокфиша, например
разные версии стока по отношению друг к другу родственные движки и искажения/сдвиги для них близки, поэтому относительные рейты могут хорошо сохраняться
для множества всех движков, с их разными рейтинговыми характеристиками, это уже в общем случае неверно, поэтому индукция в Вашем рассуждении, распространяющая вывод, верный для группы стока, на все движки - некорректна

хороший тест, когда в контрольной группе движки, набирающие 0,382-0,618 (0,9325 за пределами добра и зла)
при этом сам тестируемый движок, желательно как можно ближе к 50% (это не всегда возможно, например для движков на самом верху, или в самом низу)
Jeweller вне форума   Ответить с цитированием
Старый 14.11.2020, 17:28   #688
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

кто касается контемпта комодо, конечно вероятно, что его влияние также уменьшилось, как и у стока, путь эволюции ведь тот же
Jeweller вне форума   Ответить с цитированием
Старый 14.11.2020, 17:44   #689
Jeweller
2 разряд
 
Аватар для Jeweller
 
Регистрация: 24.01.2018
Сообщений: 351
Сказал(а) спасибо: 481
Поблагодарили 311 раз(а) в 153 сообщениях
Репутация: 56
По умолчанию Re: Komodo

Цитата: Сообщение от Vizvezdenec
А по поводу "хорошего" и "плохого" блицора...
Ерунда это всё в основном.
прямо сейчас в проходящих тестах, в режиме реального времени, я наблюдаю очень разную компрессию эло, причем даже не на разных движках, а на стоке с разными сетями
неожиданная для меня величина эффекта..

насколько это справедливо для комодо не знаю, тем более с переходом на сеть прежние выводы могут больше не работать
Jeweller вне форума   Ответить с цитированием
Старый 14.11.2020, 18:34   #690
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: Komodo

Цитата: Сообщение от Jeweller
прямо сейчас в проходящих тестах, в режиме реального времени, я наблюдаю очень разную компрессию эло, причем даже не на разных движках, а на стоке с разными сетями
неожиданная для меня величина эффекта..

насколько это справедливо для комодо не знаю, тем более с переходом на сеть прежние выводы могут больше не работать
Ну такой эффект есть, да.
Причём он наблюдался на NCM хорошо, когда новая сеть в селфплее дала 4 эло, а против SF7 - больше 10 скачок и стабильный уровень потом, т.е. на случайность не спишешь.
То же может быть и для патчей.
Но, тем не менее, обычно этот эффект не слишком велик и раз на раз не приходится.
__________________

Развернуть для просмотра

[свернуть]
Vizvezdenec вне форума   Ответить с цитированием
Ответ


Здесь присутствуют: 6 (пользователей: 0 , гостей: 6)
 

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 20:01. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.7
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
Рейтинг@Mail.ru