Forchess - форум о заочных шахматах  

Вернуться   Forchess - форум о заочных шахматах > Заочные турниры и партии > Шахматные программы и движки

Ответ
 
Опции темы Опции просмотра
Старый 04.06.2016, 17:13   #1
Харлампий
2 разряд
 
Аватар для Харлампий
 
Регистрация: 03.06.2016
Сообщений: 441
Сказал(а) спасибо: 534
Поблагодарили 1,949 раз(а) в 431 сообщениях
Репутация: 181
По умолчанию Stockfish и его производные



Stockfish 14
Stockfish 14 для Android
https://ufile.io/f/8ardx
https://pixeldrain.com/l/ndVpnHXc#item=1

Архив предыдущих версий: https://www.dropbox.com/sh/75gzfgu7q...UfHbBr4r_RwhGa

Официальный сайт стокфиш

Обновления тестовых версий стокфиша: http://abrok.eu/stockfish/

Сборки Stockfish и CorChess от I. Ivec

Развитие движка http://tests.stockfishchess.org/tests

Stockfish_NNUE https://github.com/nodchip/Stockfish

Сети: https://www.comp.nus.edu.sg/~sergio-v/nnue/

AsmFish

Сборки от Maratka

Компиляции движков от ChessMan

Сборка Stockfish от Otodranik

Sugar от Marco Zerbinati

Shark и Orka

О Stockfish

Цитата:
Авторы движка
Двигатель Stockfish был разработан Tord Romstad, Marco Costalba и Joona Kiiski. В настоящее время он развивается и поддерживается сообществом Stockfish.

Авторы приложений
Stockfish для Mac был собран Daylen Yang. Stockfish для iOS был собран Tord Romstad.

История
Проект Stockfish начался с движка Glaurung с открытым исходным кодом, созданного Tord Romstad. В ноябре 2008 года Марко Косталба разветвил код Glaurung 2.1 и представил Stockfish 1.0. Торд и Джоона Кииски присоединились к проекту «Стилфиш», и проект «Гларунг» постепенно исчез. Тем временем, Stockfish быстро поднялся, чтобы стать самым сильным шахматным движком с открытым исходным кодом, с частыми обновлениями каждые несколько месяцев. Сегодня он остается одним из самых сильных двигателей в мире.

О GPL
Stockfish является бесплатным и распространяется в соответствии с GNU General Public License Version 3 (GPLv3). По сути, это означает, что вы можете делать практически все, что хотите, с программой, включая ее распространение среди своих друзей, делая ее доступной для загрузки с вашего веб-сайта, продавая ее (либо самостоятельно, либо как часть некоторого более крупного программного пакета ) или использовать его в качестве отправной точки для собственного программного проекта.

Единственное реальное ограничение заключается в том, что всякий раз, когда вы каким-либо образом распространяете Stockfish, вы всегда должны включать полный исходный код или ссылку на исходный код. Если вы внесете какие-либо изменения в исходный код, эти изменения также должны быть доступны в GPL.

Для получения полной информации прочитайте GPL.
[свернуть]

Последний раз редактировалось ChessMan; 04.07.2021 в 09:38. Причина: Добавил ссылку на Стокфиш 14 + ссылка на пред. версии + Android
Харлампий вне форума   Ответить с цитированием
59 пользователя(ей) сказали cпасибо:
ALEKS (05.10.2017), Alexandr_L (07.09.2017), Alex_Lk (28.09.2018), Alex_Zet (04.12.2018), Antuan (01.01.2019), Arikchess (02.03.2018), Benoni (18.05.2020), Borisk (02.12.2018), Chess762 (01.12.2016), ChessMan (30.10.2017), Cr@ck (30.03.2019), Demch (15.07.2018), genadiy (06.12.2018), gens (26.10.2018), Ghppn (31.12.2019), Gigabayt (14.09.2020), GL2016 (04.06.2016), IgorPastukhov (06.02.2018), ivm1995 (03.12.2017), KERCH (04.06.2016), kruzh (08.02.2019), Lawyer (18.09.2018), Maratka (24.05.2018), Michael Strelkov (29.01.2017), Ofiscer (06.06.2016), ogr56 (08.07.2019), Padre (18.11.2020), Psyclone2513 (06.10.2017), Raptor (17.11.2018), Rybka (21.01.2020), SergeyTUR (04.02.2019), Shadow (15.11.2017), SKY (11.05.2020), sovaz1997 (03.10.2017), ssserg (27.06.2020), Stavross (04.06.2016), tt66 (04.06.2016), valery 64 (16.07.2021), ValstepAS (23.12.2018), Vovan (22.03.2019), Александр (30.10.2018), Александр Руденко (26.07.2020), АЛЕКСЕЙ1976 (15.08.2021), Валекс (27.11.2018), Виталий В. (13.07.2016), Владимир Харламов (09.12.2019), Владимир001 (09.08.2020), Гудвин (04.06.2016), Иван (03.07.2021), илья (13.07.2021), Кевин (30.03.2017), Котюргин (12.09.2021), Ларин (09.02.2018), Петригин Олег (04.06.2016), Реналь (18.07.2020), Ренат (17.10.2016), Роман (02.06.2021), Философ (04.06.2016)
Старый 18.08.2019, 10:03   #5431
Viktor
Эксперт
 
Аватар для Viktor
 
Регистрация: 07.06.2016
Сообщений: 5,907
Сказал(а) спасибо: 13,814
Поблагодарили 12,717 раз(а) в 4,521 сообщениях
Репутация: 726
По умолчанию Re: Stockfish и его производные

И еще хотелось бы не только "глубокой философии", но и реального практического применения в тестировании. Простым языком: а как правильно тестировать силу движков?
Viktor вне форума   Ответить с цитированием
Старый 18.08.2019, 10:05   #5432
Alex_Zet
Эксперт
 
Аватар для Alex_Zet
 
Регистрация: 01.12.2016
Сообщений: 5,696
Сказал(а) спасибо: 264
Поблагодарили 1,517 раз(а) в 1,153 сообщениях
Записей в дневнике: 15
Репутация: Alex_Zet отключил(а) отображение уровня репутации
По умолчанию Re: Stockfish и его производные

Это конечно же не 33.

19-08-14 sni master diff

ELO: 32.24 +-1.9 (95%) LOS: 100.0%
Total: 40000 W: 7869 L: 4168 D: 27963

40000 @ 60+0.6 th 1 Regression/progression test against SF10 after "Tweak unsafe checks" of August 14th.

Ну что же, Сток вышел на фантастический рубеж, 1 эло в неделю.
__________________
10 оттенков https://www.youtube.com/playlist?lis...7RKv2pEmatnOBs
Alex_Zet вне форума   Ответить с цитированием
Старый 18.08.2019, 10:55   #5433
peruri
3 разряд
 
Аватар для peruri
 
Регистрация: 09.03.2017
Адрес: СССР
Сообщений: 184
Сказал(а) спасибо: 3
Поблагодарили 118 раз(а) в 70 сообщениях
Репутация: peruri отключил(а) отображение уровня репутации
По умолчанию Re: Stockfish и его производные

Да здравствует математика.
peruri вне форума   Ответить с цитированием
Старый 18.08.2019, 11:06   #5434
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Омегазеро
Поскольку бесконечно больших выборок не существует в реальности, вопрос распадается на ДВА
Почему не на три?


Цитата: Сообщение от Омегазеро
Это полностью разоблачает ваше вранье про "ошибки" и "погрешности"
Это где Вы вранье нашли?
Я лично вижу, что тут есть лишь Ваша брехня: выдаете желаемое за действительное. Сиграл например Komodo против SF 10 партий, 8 ничьих, и по победе. Рейтинг SF известен. Какой рейтинг у Komodo?
Maratka вне форума   Ответить с цитированием
Старый 18.08.2019, 11:18   #5435
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Maratka
Я лично вижу, что тут есть лишь Ваша брехня: выдаете желаемое за действительное. Сиграл например Komodo против SF 10 партий, 8 ничьих, и по победе. Рейтинг SF известен. Какой рейтинг у Komodo?
Брехня у вас!
В рейтинг-системе Эло предполагается, что ОБА участника игры до ее начала обладают определенным рейтингом, т.к. он есть и у SF, и у Komodo.
По итогам десяти партий рейтинг каждого движка будет пересчитан и получено новое значение
Затем еще один матч и новый пересчет
Так задумал Арпад Эло

А вы занимаетесь издевательством - перед каждым матчем обнуляете рейтинги игроков (т.е. предполагаете, что они равны по силе).

При таком предположении вы сразу получите отклонение силы игры от рейтинга в сотню Эло. Потому что на самом деле силы не равны.
Омегазеро вне форума   Ответить с цитированием
Старый 18.08.2019, 11:23   #5436
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: Stockfish и его производные

Математи́ческое ожида́ние — среднее значение случайной величины при стремлении количества выборок или количества её измерений (иногда говорят — количества испытаний) к бесконечности. (определение)
В применении к шахматной партии мат ожидание % набранных очков (т.е. разницы в эло) - среднее значение числа набранных очков при стремлении числа партий к бесконечности (при одном и том же выборе дебютов, от которых тот самый % и правда зависит).
Если у какой-то последовательности есть какой-то предел (а "разница в эло после n партий" - ни что иное, как последовательность), то для любого e > 0 найдётся такой номер n, что при числе больше n отклонение величины от предела всегда < e (определение предела последовательности).
В применении к разнице в эло получаем, что для любой заранее заданной погрешности найдётся определённое n, после которого отклонение эло от реального будет меньше этой самой погрешности. А распределение там может быть вообще какое угодно. Да, погрешности в эло считаются на основе нормального распределения, которое, наверное, может быть на деле и не нормальным, но они ВСЁ РАВНО стремятся к нулю (при одном и том же наборе дебютов).
Ну если Вы хотите мне сказать, что определения предела и матожидания неправильные, то вы придумываете свой собственный матанализ и теорвер, с чем Вас я только поздравить могу, но что-то серьёзно обсуждать не буду.
Vizvezdenec вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
Maratka (18.08.2019), sovaz1997 (18.08.2019)
Старый 18.08.2019, 11:43   #5437
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Vizvezdenec
Математи́ческое ожида́ние — среднее значение случайной величины при стремлении количества выборок или количества её измерений (иногда говорят — количества испытаний) к бесконечности. (определение)
В применении к шахматной партии мат ожидание % набранных очков (т.е. разницы в эло) - среднее значение числа набранных очков при стремлении числа партий к бесконечности (при одном и том же выборе дебютов, от которых тот самый % и правда зависит)
Первая ошибка (или вранье) - в системе Эло нет никаких бесконечностей, она работает только на конечных матчах (выборках)
Цитата: Сообщение от Vizvezdenec
Если у какой-то последовательности есть какой-то предел (а "разница в эло после n партий" - ни что иное, как последовательность), то для любого e > 0 найдётся такой номер n, что при числе больше n отклонение величины от предела всегда < e (определение предела последовательности)
Вот тут у вас вторая ошибка (или сознательное вранье), так как случайные последовательности не имеют предела
Гуглим "сходимость по вероятности"
Цитата: Сообщение от Vizvezdenec
В применении к разнице в эло получаем, что для любой заранее заданной погрешности найдётся определённое n, после которого погрешность эло будет меньше этой самой погрешности
А вот тут третья ошибка (или сознательное вранье)
Для случайных величин или случайных процессов (и их матожиданий) понятие "погрешности" не применяется. Погрешность бывает у точных величин, которые измеряют инструментом, на работу которого влияют случайные факторы

Вы путаете погрешность со стандартным отклонением на выборке

Цитата: Сообщение от Vizvezdenec
А распределение там может быть вообще какое угодно. Да, погрешности в эло считаются на основе нормального распределения, которое, наверное, может быть на деле и не нормальным, но они ВСЁ РАВНО стремятся к нулю (при одном и том же наборе дебютов)
Угу, возьмите любое несимметричное распределение и посмотрите, к чему там всё будет стремиться
Кстати! Реальные шахматы как раз имеют несимметричную функцию распределения из-за разных вероятностей побед белых и черных
Цитата: Сообщение от Vizvezdenec
Ну если Вы хотите мне сказать, что определения предела и матожидания неправильные, то вы придумываете свой собственный матанализ и теорвер, с чем Вас я только поздравить могу, но что-то серьёзно обсуждать не буду.
Да, вы только что придумали собственный теорвер, я вас поздравляю!
Мне кажется, что вы знаете настоящий теорвер и просто издеваетесь
Омегазеро вне форума   Ответить с цитированием
Старый 18.08.2019, 11:47   #5438
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Омегазеро
В рейтинг-системе Эло предполагается, что ОБА участника игры до ее начала обладают определенным рейтингом,
У ты как оно!
И какой же тогда рейтинг у движка, который вчера вечером написали с нуля?
А у человека, которому объяснили правила, но который не сыграл пока что ни одной партии?

Т.е. имеем: и движок, и человек играть заведомо умеют, следовательно имеют ELO?
Maratka вне форума   Ответить с цитированием
Старый 18.08.2019, 11:53   #5439
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Омегазеро
А вы занимаетесь издевательством - перед каждым матчем обнуляете рейтинги игроков (т.е. предполагаете, что они равны по силе).
"Вы" - это кто? Я? Или (согласно грамматике русского языка, т.к. написано с маленькой буквы) это группа людей? Если группа, то из кого состоит?

Короче, не могли бы вы объявить массив перед его использованием, а то компилятор ошибку выбивает!
Maratka вне форума   Ответить с цитированием
Старый 18.08.2019, 12:03   #5440
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Maratka
У ты как оно!
И какой же тогда рейтинг у движка, который вчера вечером написали с нуля?
А у человека, которому объяснили правила, но который не сыграл пока что ни одной партии?
Т.е. имеем: и движок, и человек играть заведомо умеют, следовательно имеют ELO?
Кстати... вообще говоря возможна ситуация, когда играет тот, кто даже правил не знает. Как минимум один такой случай задокументирован в литературе у Ильфа и Петрова.

Игрок чисто случайно двигает фигуры, и "угадывает", что пешка ходит вперед, а бьет по диагонали, делает свои пять ходов, и получает мат. И следовательно, он тоже имеет рейтинг ELO?
Maratka вне форума   Ответить с цитированием
Старый 18.08.2019, 12:08   #5441
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Viktor
И еще хотелось бы не только "глубокой философии", но и реального практического применения в тестировании. Простым языком: а как правильно тестировать силу движков?
Если вопрос в количестве партий, то ответ на этом теоретическом графике

После того, как средний рейтинг стабилизировался (смотрим правый график), имеет смысл прервать тестирование, потому что он стабилизировался навсегда

Важно, что для этого не нужно огромного числа партий
В данном случае, по расчетам автора диссертации, при отклонении в "корень из двух" хватает 17 партий (отклонение я посчитала исходя из указанного значения "альфа")
В реальной жизни таких маленьких отклонений не бывает, поэтому число партий оказывается больше на порядок

Как определить отклонение? Смотрим на левый график и вычисляем (интересно, что размах там действительно корень из двух)

В общем, эти величины определяются экспериментально в ходе тестирования. Но теоретически они невелики

Омегазеро вне форума   Ответить с цитированием
Старый 18.08.2019, 12:12   #5442
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Maratka
У ты как оно!
И какой же тогда рейтинг у движка, который вчера вечером написали с нуля?
У такого движка рейтинга еще нет
Но вы писали про Комодо, у которого 13 версий уже вышло и они сыграли массу турниров
Омегазеро вне форума   Ответить с цитированием
Старый 18.08.2019, 12:12   #5443
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: Stockfish и его производные

Бррр.
Нет, ну формально в какой-то степени это всё правда.
Но это по большей части придирки к терминологии.
Возьмём определённую позицию. И будем играть в ней два движка, один белыми, один чёрными.
Сыграли партию - посчитали эло. Сыграли ещё партию - пересчитали. У такой последовательности, понятное дело, есть некоторое матожидание % набранных очков первым движком.
На основании его можно посчитать разницу в эло в данной конкретной позиции. При этом с какой угодно заданной точностью, разумеется, вопрос только в том, сколько игр для этого потребуется.
Теперь же играем партии через раз белыми и чёрными. Понятно, что у каждого движка всё равно есть матожидание набранных очков и на его основании можно, опять-таки, сделать некоторую разницу в эло. Которую, опять-таки, можно посчитать со сколь угодно большой точностью.
В принципе это можно расширить на произвольное число дебютов.
Т.е. на каждом произвольном наборе дебютов (каждый из дебютов играется одинаковое количество раз за оба цвета) можно определить со сколь угодно заданной точностью разницу в эло у двух конкретных движков (если его определить как предел % набранных очков при стремлении количества партий к бесконечности, когда дебюты играются по очереди). И единственное, что будет отличаться у разных наборов дебютов - этот самый набор и связанная с ним разница в эло, конечно.
В общем чёрт его знает, зачем я всё это пишу, на самом деле, в дискуссии с человеком, который на полном серьёзе говорит, что 20 партий достаточно для того, чтобы посчитать разницу в эло между двумя версиями лилы через стокфиш. Да у вас дискретизация той шкалы эло уже как минимум 5 эло, если что.
Vizvezdenec вне форума   Ответить с цитированием
Старый 18.08.2019, 12:13   #5444
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Омегазеро
После того, как средний рейтинг стабилизировался
Как может стабилизироваться то, что заведомо является точным значением?
И что такое вообще "средний рейтинг", ежели нет никакого среднего, а есть вполне конкретная величина?

Барышня, Вы или трусы оденьте, или крестик снимите!
Maratka вне форума   Ответить с цитированием
Старый 18.08.2019, 12:15   #5445
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Омегазеро
Но вы писали про Комодо, у которого 13 версий уже вышло и они сыграли массу турниров
Бог мой Маруся! Это другой Komodo сыграл! Однофамилец!
Или Вам нужно объяснить еще тот простой факт, что если в программе изменился код, то это вообще говоря уже другая программа?
Maratka вне форума   Ответить с цитированием
Старый 18.08.2019, 12:16   #5446
Vizvezdenec
Гроссмейстер
 
Аватар для Vizvezdenec
 
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Омегазеро
В общем, эти величины определяются экспериментально в ходе тестирования. Но теоретически они невелики
А практически рейтинг эло при тестировании стокфиша против стокфиша 10 ползает на 2-4 эло при увеличении партий с 20к до 40к.
А при наигрывании 100 партий рейтинг через 50 и через 100 партий вполне честно и на сотню эло отличается.
Для одних и тех же движков.
И у Лилы против стокфиша в этом плане вообще ничего не меняется - точно так же при увеличении партий от 50 до 100 или от 100 до 200 перформанс в пределах 100 - 50 эло плавает.
Особенно если сюда добавить то, что никому не интересно эло, усреднённое по игре на 5 стартовых позициях с переменой цвета, т.к. дебютных вариантов актуальных больше на несколько порядков. Да за 100 или 200 партий Вы даже по одному разу каждый НЕ СЫГРАЕТЕ физически, потому что их больше 100 или 200
Vizvezdenec вне форума   Ответить с цитированием
Старый 18.08.2019, 12:17   #5447
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Vizvezdenec
В общем чёрт его знает, зачем я всё это пишу, на самом деле, в дискуссии с человеком, который на полном серьёзе говорит, что 20 партий достаточно для того, чтобы посчитать разницу в эло между двумя версиями лилы через стокфиш. Да у вас дискретизация той шкалы эло уже как минимум 5 эло, если что.
Ну вот я и предложил подсчитать ELO Komodo по 10 партиям против SF. Не хочет считать чего-то. Отказывается. Возможно докумекала таки? ;)
Maratka вне форума   Ответить с цитированием
Старый 18.08.2019, 12:21   #5448
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Viktor
Простым языком: а как правильно тестировать силу движков?
Второй вопрос - по поводу выбора дебютных начал
К сожалению, их выбор очень сильно влияет на тестирование

Ключевой вопрос: обладает ли игра движков эргодичностью?

Я не видела исследований на этот счет, но мне кажется, что это утверждение не доказано и сомнительно

Поэтому матрица тестирования должна быть прямоугольной. Какой именно - сказать навскидку не смогу

Но например: сто разных начал играются десять раз белыми и черными - итого 2000 партий, матрица 100x20

Сейчас тестируют 1000x2. А если выбор этой тысячи начал недостаточно сбалансирован? А если при всей сбалансированности он не даст усреднения по силе движков?

Необходимы тесты, чтобы разобраться
Омегазеро вне форума   Ответить с цитированием
Старый 18.08.2019, 12:23   #5449
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Vizvezdenec
А практически рейтинг эло при тестировании стокфиша против стокфиша 10 ползает на 2-4 эло при увеличении партий с 20к до 40к
Он ползает потому, что вы тестируете на дебютных наборах из тысяч и даже десятков тысяч партий
Омегазеро вне форума   Ответить с цитированием
Старый 18.08.2019, 12:27   #5450
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Vizvezdenec
с человеком, который на полном серьёзе говорит, что 20 партий достаточно для того, чтобы посчитать разницу в эло между двумя версиями лилы через стокфиш
Я такого никогда не говорила, это передергивание
Я говорила, что у меня в тестах движок, лидирующий на 30 партиях, лидирует и на 400 партиях
При этом разница в Эло "гуляет". Я выкладывала цифры и Маратка даже посчитал, что на 27%.
Так что не надо выдумывать
Омегазеро вне форума   Ответить с цитированием
Старый 18.08.2019, 12:32   #5451
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Vizvezdenec
А при наигрывании 100 партий рейтинг через 50 и через 100 партий вполне честно и на сотню эло отличается
А вот в этом утверждении есть важная недоговорка
При наигрывании 100 партий рейтинг может отличаться а сотню Эло от силы игры (мгновенного рейтинга) в ОДНОЙ партии

Но насколько рейтинг на 100 партиях будет отличаться от рейтинга на 1000 партий? Вот тут никаких ста Эло не будет

Рейтинг вообще может уже стабилизироваться к тому времени
Омегазеро вне форума   Ответить с цитированием
Старый 18.08.2019, 12:35   #5452
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Омегазеро
Но насколько рейтинг на 100 партиях будет отличаться от рейтинга на 1000 партий? Вот тут никаких ста Эло не будет

Рейтинг вообще может уже стабилизироваться к тому времени

Может и будет, а может и нет. Важно, что с 95%-й вероятностью он будет находится в определенных границах, а с вероятностью 5% - выйдет за их пределы. И это все проверяется, я не вижу смысла в споре.
sovaz1997 вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Maratka (18.08.2019)
Старый 18.08.2019, 12:36   #5453
Corrs
Гроссмейстер
 
Аватар для Corrs
 
Регистрация: 04.04.2019
Сообщений: 2,306
Сказал(а) спасибо: 2,100
Поблагодарили 2,294 раз(а) в 1,175 сообщениях
Репутация: 240
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Maratka
Барышня, Вы или трусы оденьте, или крестик снимите!
с барышней это не работает, Маратка

З.Ы. чиста анатомически...
Corrs вне форума   Ответить с цитированием
Старый 18.08.2019, 12:38   #5454
Maratka
Эксперт
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Омегазеро
Я говорила, что у меня в тестах движок, лидирующий на 30 партиях, лидирует и на 400 партиях
А какое оно имеет значение, то что у ВАС в тестах? По 30 партиям один может вынести другого где-то 22:8, нет ни малейших проблем! Однако, если в паре у нас SF и LZ, тот этот счет явно не отражает истинного положения движков относительно друг друга, причем без разницы, кто выиграл 30 партий с этим счетом.
Maratka вне форума   Ответить с цитированием
Старый 18.08.2019, 12:39   #5455
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Vizvezdenec
Бррр.
Нет, ну формально в какой-то степени это всё правда.
Но это по большей части придирки к терминологии
Это не придирки, это принципиальный вопрос. Взгляните на эти два графика внимательно

Вот та "сотня Эло", которой вы размахиваете - она на графике слева. С таким размахом мгновенная сила игры (в одной партии) может отклоняться от среднего рейтинга (на длинном матче)

А на графике справа - тот самый средний рейтинг, который вы хотите узнать при тестировании по большой выборке. Этот рейтинг после определенного количества партий стабилизируется

Омегазеро вне форума   Ответить с цитированием
Старый 18.08.2019, 12:41   #5456
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от sovaz1997
Важно, что с 95%-й вероятностью он будет находится в определенных границах, а с вероятностью 5% - выйдет за их пределы. И это все проверяется
Правильно! Смотри на левый график. Видишь колебания? Вот это они и есть. 95% из них укладываются в два стандартных отклонения

А теперь смотри на правый график. Что видишь?
Омегазеро вне форума   Ответить с цитированием
Старый 18.08.2019, 12:43   #5457
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Омегазеро, откуда эти графики?
sovaz1997 вне форума   Ответить с цитированием
Старый 18.08.2019, 12:47   #5458
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от sovaz1997
Омегазеро, откуда эти графики?
Ты предыдущую страницу не читал?

Диссертация Вадима Авдеева "Исследование вероятностных моделей рейтинговых систем" http://mech.math.msu.su/~snark/files/diss/0110diss.pdf

Он там как раз анализирует случай бесконечной игры двух игроков - как меняется их Эло

Важно, что теоретический результат ОЧЕНЬ ПОХОЖ на результат тестов gblchess64
Омегазеро вне форума   Ответить с цитированием
Старый 18.08.2019, 13:01   #5459
sovaz1997
Гроссмейстер
 
Аватар для sovaz1997
 
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Омегазеро, читал, но не всю. Сейчас гляну)
sovaz1997 вне форума   Ответить с цитированием
Старый 18.08.2019, 13:08   #5460
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: Stockfish и его производные

Цитата: Сообщение от Maratka
Как может стабилизироваться то, что заведомо является точным значением?
И что такое вообще "средний рейтинг", ежели нет никакого среднего, а есть вполне конкретная величина?
R(n) - рейтинг на n партиях, и это значение является точным
Если R(n) мало отличается от R(n+m) при любом m - я говорю "стабилизировался"
Слово "средний" я употребила, чтобы вы не путали его с силой игры R на конкретной партии, которую можно назвать мгновенным рейтингом

График мгновенного рейтинга (силы игры) - слева. График среднего рейтинга - справа. И он стабилизируется, что доказано математически
Омегазеро вне форума   Ответить с цитированием
Ответ


Здесь присутствуют: 23 (пользователей: 0 , гостей: 23)
 

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 07:07. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.7
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
Рейтинг@Mail.ru