04.06.2016, 17:13 | #1 |
2 разряд
Регистрация: 03.06.2016
Сообщений: 441
Сказал(а) спасибо: 534
Поблагодарили 1,949 раз(а) в 431 сообщениях
Репутация: 181
|
Stockfish и его производные
Stockfish 14 Stockfish 14 для Android https://ufile.io/f/8ardx https://pixeldrain.com/l/ndVpnHXc#item=1 Архив предыдущих версий: https://www.dropbox.com/sh/75gzfgu7q...UfHbBr4r_RwhGa Официальный сайт стокфиш Обновления тестовых версий стокфиша: http://abrok.eu/stockfish/ Сборки Stockfish и CorChess от I. Ivec Развитие движка http://tests.stockfishchess.org/tests Stockfish_NNUE https://github.com/nodchip/Stockfish Сети: https://www.comp.nus.edu.sg/~sergio-v/nnue/ AsmFish Сборки от Maratka Компиляции движков от ChessMan Сборка Stockfish от Otodranik Sugar от Marco Zerbinati Shark и Orka О StockfishЦитата:
Авторы движка
Двигатель Stockfish был разработан Tord Romstad, Marco Costalba и Joona Kiiski. В настоящее время он развивается и поддерживается сообществом Stockfish. Авторы приложений Stockfish для Mac был собран Daylen Yang. Stockfish для iOS был собран Tord Romstad. История Проект Stockfish начался с движка Glaurung с открытым исходным кодом, созданного Tord Romstad. В ноябре 2008 года Марко Косталба разветвил код Glaurung 2.1 и представил Stockfish 1.0. Торд и Джоона Кииски присоединились к проекту «Стилфиш», и проект «Гларунг» постепенно исчез. Тем временем, Stockfish быстро поднялся, чтобы стать самым сильным шахматным движком с открытым исходным кодом, с частыми обновлениями каждые несколько месяцев. Сегодня он остается одним из самых сильных двигателей в мире. О GPL Stockfish является бесплатным и распространяется в соответствии с GNU General Public License Version 3 (GPLv3). По сути, это означает, что вы можете делать практически все, что хотите, с программой, включая ее распространение среди своих друзей, делая ее доступной для загрузки с вашего веб-сайта, продавая ее (либо самостоятельно, либо как часть некоторого более крупного программного пакета ) или использовать его в качестве отправной точки для собственного программного проекта. Единственное реальное ограничение заключается в том, что всякий раз, когда вы каким-либо образом распространяете Stockfish, вы всегда должны включать полный исходный код или ссылку на исходный код. Если вы внесете какие-либо изменения в исходный код, эти изменения также должны быть доступны в GPL. Для получения полной информации прочитайте GPL. [свернуть] Последний раз редактировалось ChessMan; 04.07.2021 в 09:38. Причина: Добавил ссылку на Стокфиш 14 + ссылка на пред. версии + Android |
59 пользователя(ей) сказали cпасибо: | ALEKS (05.10.2017), Alexandr_L (07.09.2017), Alex_Lk (28.09.2018), Alex_Zet (04.12.2018), Antuan (01.01.2019), Arikchess (02.03.2018), Benoni (18.05.2020), Borisk (02.12.2018), Chess762 (01.12.2016), ChessMan (30.10.2017), Cr@ck (30.03.2019), Demch (15.07.2018), genadiy (06.12.2018), gens (26.10.2018), Ghppn (31.12.2019), Gigabayt (14.09.2020), GL2016 (04.06.2016), IgorPastukhov (06.02.2018), ivm1995 (03.12.2017), KERCH (04.06.2016), kruzh (08.02.2019), Lawyer (18.09.2018), Maratka (24.05.2018), Michael Strelkov (29.01.2017), Ofiscer (06.06.2016), ogr56 (08.07.2019), Padre (18.11.2020), Psyclone2513 (06.10.2017), Raptor (17.11.2018), Rybka (21.01.2020), SergeyTUR (04.02.2019), Shadow (15.11.2017), SKY (11.05.2020), sovaz1997 (03.10.2017), ssserg (27.06.2020), Stavross (04.06.2016), tt66 (04.06.2016), valery 64 (16.07.2021), ValstepAS (23.12.2018), Vovan (22.03.2019), Александр (30.10.2018), Александр Руденко (26.07.2020), АЛЕКСЕЙ1976 (15.08.2021), Валекс (27.11.2018), Виталий В. (13.07.2016), Владимир Харламов (09.12.2019), Владимир001 (09.08.2020), Гудвин (04.06.2016), Иван (03.07.2021), илья (13.07.2021), Кевин (30.03.2017), Котюргин (12.09.2021), Ларин (09.02.2018), Петригин Олег (04.06.2016), Реналь (18.07.2020), Ренат (17.10.2016), Роман (02.06.2021), Философ (04.06.2016) |
18.08.2019, 10:03 | #5431 |
Эксперт
Регистрация: 07.06.2016
Сообщений: 5,907
Сказал(а) спасибо: 13,814
Поблагодарили 12,717 раз(а) в 4,521 сообщениях
Репутация: 726
|
Re: Stockfish и его производные
И еще хотелось бы не только "глубокой философии", но и реального практического применения в тестировании. Простым языком: а как правильно тестировать силу движков?
|
18.08.2019, 10:05 | #5432 |
Эксперт
Регистрация: 01.12.2016
Сообщений: 5,696
Сказал(а) спасибо: 264
Поблагодарили 1,517 раз(а) в 1,153 сообщениях
Записей в дневнике: 15
|
Re: Stockfish и его производные
Это конечно же не 33.
19-08-14 sni master diff ELO: 32.24 +-1.9 (95%) LOS: 100.0% Total: 40000 W: 7869 L: 4168 D: 27963 40000 @ 60+0.6 th 1 Regression/progression test against SF10 after "Tweak unsafe checks" of August 14th. Ну что же, Сток вышел на фантастический рубеж, 1 эло в неделю.
__________________
10 оттенков https://www.youtube.com/playlist?lis...7RKv2pEmatnOBs |
18.08.2019, 10:55 | #5433 |
3 разряд
|
Re: Stockfish и его производные
Да здравствует математика.
|
18.08.2019, 11:06 | #5434 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: Stockfish и его производные
Цитата: Сообщение от Омегазеро
Поскольку бесконечно больших выборок не существует в реальности, вопрос распадается на ДВА
Цитата: Сообщение от Омегазеро
Это полностью разоблачает ваше вранье про "ошибки" и "погрешности"
Я лично вижу, что тут есть лишь Ваша брехня: выдаете желаемое за действительное. Сиграл например Komodo против SF 10 партий, 8 ничьих, и по победе. Рейтинг SF известен. Какой рейтинг у Komodo? |
18.08.2019, 11:18 | #5435 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от Maratka
Я лично вижу, что тут есть лишь Ваша брехня: выдаете желаемое за действительное. Сиграл например Komodo против SF 10 партий, 8 ничьих, и по победе. Рейтинг SF известен. Какой рейтинг у Komodo?
В рейтинг-системе Эло предполагается, что ОБА участника игры до ее начала обладают определенным рейтингом, т.к. он есть и у SF, и у Komodo. По итогам десяти партий рейтинг каждого движка будет пересчитан и получено новое значение Затем еще один матч и новый пересчет Так задумал Арпад Эло А вы занимаетесь издевательством - перед каждым матчем обнуляете рейтинги игроков (т.е. предполагаете, что они равны по силе). При таком предположении вы сразу получите отклонение силы игры от рейтинга в сотню Эло. Потому что на самом деле силы не равны. |
18.08.2019, 11:23 | #5436 |
Гроссмейстер
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
|
Re: Stockfish и его производные
Математи́ческое ожида́ние — среднее значение случайной величины при стремлении количества выборок или количества её измерений (иногда говорят — количества испытаний) к бесконечности. (определение)
В применении к шахматной партии мат ожидание % набранных очков (т.е. разницы в эло) - среднее значение числа набранных очков при стремлении числа партий к бесконечности (при одном и том же выборе дебютов, от которых тот самый % и правда зависит). Если у какой-то последовательности есть какой-то предел (а "разница в эло после n партий" - ни что иное, как последовательность), то для любого e > 0 найдётся такой номер n, что при числе больше n отклонение величины от предела всегда < e (определение предела последовательности). В применении к разнице в эло получаем, что для любой заранее заданной погрешности найдётся определённое n, после которого отклонение эло от реального будет меньше этой самой погрешности. А распределение там может быть вообще какое угодно. Да, погрешности в эло считаются на основе нормального распределения, которое, наверное, может быть на деле и не нормальным, но они ВСЁ РАВНО стремятся к нулю (при одном и том же наборе дебютов). Ну если Вы хотите мне сказать, что определения предела и матожидания неправильные, то вы придумываете свой собственный матанализ и теорвер, с чем Вас я только поздравить могу, но что-то серьёзно обсуждать не буду. |
18.08.2019, 11:43 | #5437 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от Vizvezdenec
Математи́ческое ожида́ние — среднее значение случайной величины при стремлении количества выборок или количества её измерений (иногда говорят — количества испытаний) к бесконечности. (определение)
В применении к шахматной партии мат ожидание % набранных очков (т.е. разницы в эло) - среднее значение числа набранных очков при стремлении числа партий к бесконечности (при одном и том же выборе дебютов, от которых тот самый % и правда зависит) Цитата: Сообщение от Vizvezdenec
Если у какой-то последовательности есть какой-то предел (а "разница в эло после n партий" - ни что иное, как последовательность), то для любого e > 0 найдётся такой номер n, что при числе больше n отклонение величины от предела всегда < e (определение предела последовательности)
Гуглим "сходимость по вероятности" Цитата: Сообщение от Vizvezdenec
В применении к разнице в эло получаем, что для любой заранее заданной погрешности найдётся определённое n, после которого погрешность эло будет меньше этой самой погрешности
Для случайных величин или случайных процессов (и их матожиданий) понятие "погрешности" не применяется. Погрешность бывает у точных величин, которые измеряют инструментом, на работу которого влияют случайные факторы Вы путаете погрешность со стандартным отклонением на выборке Цитата: Сообщение от Vizvezdenec
А распределение там может быть вообще какое угодно. Да, погрешности в эло считаются на основе нормального распределения, которое, наверное, может быть на деле и не нормальным, но они ВСЁ РАВНО стремятся к нулю (при одном и том же наборе дебютов)
Кстати! Реальные шахматы как раз имеют несимметричную функцию распределения из-за разных вероятностей побед белых и черных Цитата: Сообщение от Vizvezdenec
Ну если Вы хотите мне сказать, что определения предела и матожидания неправильные, то вы придумываете свой собственный матанализ и теорвер, с чем Вас я только поздравить могу, но что-то серьёзно обсуждать не буду.
Мне кажется, что вы знаете настоящий теорвер и просто издеваетесь |
18.08.2019, 11:47 | #5438 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: Stockfish и его производные
Цитата: Сообщение от Омегазеро
В рейтинг-системе Эло предполагается, что ОБА участника игры до ее начала обладают определенным рейтингом,
И какой же тогда рейтинг у движка, который вчера вечером написали с нуля? А у человека, которому объяснили правила, но который не сыграл пока что ни одной партии? Т.е. имеем: и движок, и человек играть заведомо умеют, следовательно имеют ELO? |
18.08.2019, 11:53 | #5439 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: Stockfish и его производные
Цитата: Сообщение от Омегазеро
А вы занимаетесь издевательством - перед каждым матчем обнуляете рейтинги игроков (т.е. предполагаете, что они равны по силе).
Короче, не могли бы вы объявить массив перед его использованием, а то компилятор ошибку выбивает! |
18.08.2019, 12:03 | #5440 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: Stockfish и его производные
Цитата: Сообщение от Maratka
У ты как оно!
И какой же тогда рейтинг у движка, который вчера вечером написали с нуля? А у человека, которому объяснили правила, но который не сыграл пока что ни одной партии? Т.е. имеем: и движок, и человек играть заведомо умеют, следовательно имеют ELO? Игрок чисто случайно двигает фигуры, и "угадывает", что пешка ходит вперед, а бьет по диагонали, делает свои пять ходов, и получает мат. И следовательно, он тоже имеет рейтинг ELO? |
18.08.2019, 12:08 | #5441 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от Viktor
И еще хотелось бы не только "глубокой философии", но и реального практического применения в тестировании. Простым языком: а как правильно тестировать силу движков?
После того, как средний рейтинг стабилизировался (смотрим правый график), имеет смысл прервать тестирование, потому что он стабилизировался навсегда Важно, что для этого не нужно огромного числа партий В данном случае, по расчетам автора диссертации, при отклонении в "корень из двух" хватает 17 партий (отклонение я посчитала исходя из указанного значения "альфа") В реальной жизни таких маленьких отклонений не бывает, поэтому число партий оказывается больше на порядок Как определить отклонение? Смотрим на левый график и вычисляем (интересно, что размах там действительно корень из двух) В общем, эти величины определяются экспериментально в ходе тестирования. Но теоретически они невелики |
18.08.2019, 12:12 | #5442 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от Maratka
У ты как оно!
И какой же тогда рейтинг у движка, который вчера вечером написали с нуля? Но вы писали про Комодо, у которого 13 версий уже вышло и они сыграли массу турниров |
18.08.2019, 12:12 | #5443 |
Гроссмейстер
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
|
Re: Stockfish и его производные
Бррр.
Нет, ну формально в какой-то степени это всё правда. Но это по большей части придирки к терминологии. Возьмём определённую позицию. И будем играть в ней два движка, один белыми, один чёрными. Сыграли партию - посчитали эло. Сыграли ещё партию - пересчитали. У такой последовательности, понятное дело, есть некоторое матожидание % набранных очков первым движком. На основании его можно посчитать разницу в эло в данной конкретной позиции. При этом с какой угодно заданной точностью, разумеется, вопрос только в том, сколько игр для этого потребуется. Теперь же играем партии через раз белыми и чёрными. Понятно, что у каждого движка всё равно есть матожидание набранных очков и на его основании можно, опять-таки, сделать некоторую разницу в эло. Которую, опять-таки, можно посчитать со сколь угодно большой точностью. В принципе это можно расширить на произвольное число дебютов. Т.е. на каждом произвольном наборе дебютов (каждый из дебютов играется одинаковое количество раз за оба цвета) можно определить со сколь угодно заданной точностью разницу в эло у двух конкретных движков (если его определить как предел % набранных очков при стремлении количества партий к бесконечности, когда дебюты играются по очереди). И единственное, что будет отличаться у разных наборов дебютов - этот самый набор и связанная с ним разница в эло, конечно. В общем чёрт его знает, зачем я всё это пишу, на самом деле, в дискуссии с человеком, который на полном серьёзе говорит, что 20 партий достаточно для того, чтобы посчитать разницу в эло между двумя версиями лилы через стокфиш. Да у вас дискретизация той шкалы эло уже как минимум 5 эло, если что. |
18.08.2019, 12:13 | #5444 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: Stockfish и его производные
Цитата: Сообщение от Омегазеро
После того, как средний рейтинг стабилизировался
И что такое вообще "средний рейтинг", ежели нет никакого среднего, а есть вполне конкретная величина? Барышня, Вы или трусы оденьте, или крестик снимите! |
18.08.2019, 12:15 | #5445 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: Stockfish и его производные
Цитата: Сообщение от Омегазеро
Но вы писали про Комодо, у которого 13 версий уже вышло и они сыграли массу турниров
Или Вам нужно объяснить еще тот простой факт, что если в программе изменился код, то это вообще говоря уже другая программа? |
18.08.2019, 12:16 | #5446 |
Гроссмейстер
Регистрация: 30.05.2018
Адрес: Севастополь
Сообщений: 4,022
Сказал(а) спасибо: 56
Поблагодарили 5,294 раз(а) в 2,673 сообщениях
Репутация: 216
|
Re: Stockfish и его производные
Цитата: Сообщение от Омегазеро
В общем, эти величины определяются экспериментально в ходе тестирования. Но теоретически они невелики
А при наигрывании 100 партий рейтинг через 50 и через 100 партий вполне честно и на сотню эло отличается. Для одних и тех же движков. И у Лилы против стокфиша в этом плане вообще ничего не меняется - точно так же при увеличении партий от 50 до 100 или от 100 до 200 перформанс в пределах 100 - 50 эло плавает. Особенно если сюда добавить то, что никому не интересно эло, усреднённое по игре на 5 стартовых позициях с переменой цвета, т.к. дебютных вариантов актуальных больше на несколько порядков. Да за 100 или 200 партий Вы даже по одному разу каждый НЕ СЫГРАЕТЕ физически, потому что их больше 100 или 200 |
18.08.2019, 12:17 | #5447 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: Stockfish и его производные
Цитата: Сообщение от Vizvezdenec
В общем чёрт его знает, зачем я всё это пишу, на самом деле, в дискуссии с человеком, который на полном серьёзе говорит, что 20 партий достаточно для того, чтобы посчитать разницу в эло между двумя версиями лилы через стокфиш. Да у вас дискретизация той шкалы эло уже как минимум 5 эло, если что.
|
18.08.2019, 12:21 | #5448 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от Viktor
Простым языком: а как правильно тестировать силу движков?
К сожалению, их выбор очень сильно влияет на тестирование Ключевой вопрос: обладает ли игра движков эргодичностью? Я не видела исследований на этот счет, но мне кажется, что это утверждение не доказано и сомнительно Поэтому матрица тестирования должна быть прямоугольной. Какой именно - сказать навскидку не смогу Но например: сто разных начал играются десять раз белыми и черными - итого 2000 партий, матрица 100x20 Сейчас тестируют 1000x2. А если выбор этой тысячи начал недостаточно сбалансирован? А если при всей сбалансированности он не даст усреднения по силе движков? Необходимы тесты, чтобы разобраться |
18.08.2019, 12:23 | #5449 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от Vizvezdenec
А практически рейтинг эло при тестировании стокфиша против стокфиша 10 ползает на 2-4 эло при увеличении партий с 20к до 40к
|
18.08.2019, 12:27 | #5450 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от Vizvezdenec
с человеком, который на полном серьёзе говорит, что 20 партий достаточно для того, чтобы посчитать разницу в эло между двумя версиями лилы через стокфиш
Я говорила, что у меня в тестах движок, лидирующий на 30 партиях, лидирует и на 400 партиях При этом разница в Эло "гуляет". Я выкладывала цифры и Маратка даже посчитал, что на 27%. Так что не надо выдумывать |
18.08.2019, 12:32 | #5451 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от Vizvezdenec
А при наигрывании 100 партий рейтинг через 50 и через 100 партий вполне честно и на сотню эло отличается
При наигрывании 100 партий рейтинг может отличаться а сотню Эло от силы игры (мгновенного рейтинга) в ОДНОЙ партии Но насколько рейтинг на 100 партиях будет отличаться от рейтинга на 1000 партий? Вот тут никаких ста Эло не будет Рейтинг вообще может уже стабилизироваться к тому времени |
18.08.2019, 12:35 | #5452 |
Гроссмейстер
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от Омегазеро
Но насколько рейтинг на 100 партиях будет отличаться от рейтинга на 1000 партий? Вот тут никаких ста Эло не будет
Рейтинг вообще может уже стабилизироваться к тому времени Может и будет, а может и нет. Важно, что с 95%-й вероятностью он будет находится в определенных границах, а с вероятностью 5% - выйдет за их пределы. И это все проверяется, я не вижу смысла в споре. |
Пользователь сказал cпасибо: | Maratka (18.08.2019) |
18.08.2019, 12:36 | #5453 |
Гроссмейстер
Регистрация: 04.04.2019
Сообщений: 2,306
Сказал(а) спасибо: 2,100
Поблагодарили 2,294 раз(а) в 1,175 сообщениях
Репутация: 240
|
Re: Stockfish и его производные
Цитата: Сообщение от Maratka
Барышня, Вы или трусы оденьте, или крестик снимите!
З.Ы. чиста анатомически... |
18.08.2019, 12:38 | #5454 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: Stockfish и его производные
Цитата: Сообщение от Омегазеро
Я говорила, что у меня в тестах движок, лидирующий на 30 партиях, лидирует и на 400 партиях
|
18.08.2019, 12:39 | #5455 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от Vizvezdenec
Бррр.
Нет, ну формально в какой-то степени это всё правда. Но это по большей части придирки к терминологии Вот та "сотня Эло", которой вы размахиваете - она на графике слева. С таким размахом мгновенная сила игры (в одной партии) может отклоняться от среднего рейтинга (на длинном матче) А на графике справа - тот самый средний рейтинг, который вы хотите узнать при тестировании по большой выборке. Этот рейтинг после определенного количества партий стабилизируется |
18.08.2019, 12:41 | #5456 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от sovaz1997
Важно, что с 95%-й вероятностью он будет находится в определенных границах, а с вероятностью 5% - выйдет за их пределы. И это все проверяется
А теперь смотри на правый график. Что видишь? |
18.08.2019, 12:47 | #5458 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от sovaz1997
Омегазеро, откуда эти графики?
Диссертация Вадима Авдеева "Исследование вероятностных моделей рейтинговых систем" http://mech.math.msu.su/~snark/files/diss/0110diss.pdf Он там как раз анализирует случай бесконечной игры двух игроков - как меняется их Эло Важно, что теоретический результат ОЧЕНЬ ПОХОЖ на результат тестов gblchess64 |
18.08.2019, 13:08 | #5460 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: Stockfish и его производные
Цитата: Сообщение от Maratka
Как может стабилизироваться то, что заведомо является точным значением?
И что такое вообще "средний рейтинг", ежели нет никакого среднего, а есть вполне конкретная величина? Если R(n) мало отличается от R(n+m) при любом m - я говорю "стабилизировался" Слово "средний" я употребила, чтобы вы не путали его с силой игры R на конкретной партии, которую можно назвать мгновенным рейтингом График мгновенного рейтинга (силы игры) - слева. График среднего рейтинга - справа. И он стабилизируется, что доказано математически |
Здесь присутствуют: 21 (пользователей: 0 , гостей: 21) | |
|
|