03.03.2020, 05:20 | #5641 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
Цитата: Сообщение от player-1980
А почему рейт такой низкий? Напр., последняя - 62588 с рейтом 2902. Или это фикция?
|
2 пользователя(ей) сказали cпасибо: | Ofiscer (03.03.2020), player-1980 (03.03.2020) |
03.03.2020, 07:19 | #5642 |
Super Moderator
Регистрация: 30.05.2016
Сообщений: 5,559
Сказал(а) спасибо: 15,168
Поблагодарили 11,397 раз(а) в 4,599 сообщениях
Репутация: 603
|
Re: LCZero
Цитата: Сообщение от player-1980
а не подскажете, какая сеть сейчас лучшая?
Цитата: Сообщение от Rom77
В общем и целом, последняя из 60-й серии.
|
03.03.2020, 07:34 | #5643 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
Цитата: Сообщение от Ofiscer
А если строго для адванса (длительный анализ), то какую порекомендуете?
В любом случае следует смотреть на сети, которые размером не меньше T60. А более мелкие сети... Ну не знаю... Может быть для поиска каких-то альтернатив, в дополнение к более крупным сетям они сгодятся. |
3 пользователя(ей) сказали cпасибо: |
03.03.2020, 16:25 | #5644 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от Rom77
Это фикция. Давно уже перестал обращать внимание на этот рейт.
Там конечно же есть погрешности, но все значимые изменения параметров прекрасно отображаются на графике: http://training.lczero.org/training_run/1?full_elo=1 Тут легко можно увидеть и 1-й (60781) и 2-й (61771) LR дропы; изменение порога KDL на 9 (62281), использования параметров из теста T59 для T60 (62479). Сами числа рейтинга 2902 и т.п. относятся только к рейтингу Лилы, но даже они, похоже, очень близки к каким-нибудь рейтингам движков с CCRL. Ведь само-эло строится на матчах с контролем примерно 1000 nodes/move. Что очень мало, и вполне вероятно, что рейтинг движка в этом случае и будет падать где-то в районе 2900-3000 ELO. |
3 пользователя(ей) сказали cпасибо: |
03.03.2020, 18:21 | #5645 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
Цитата: Сообщение от alchemist888
После того, как рейтинг начали считать не только по матчу с предыдущей сетью, но и с 3-мя и 10-ю предыдущими, то корреляция ELO стала очень даже информативной.
Кроме того, если взять цифры в абсолютном выражении, то мы видим также анормальные рейтинги у сетей T59 и T70. То что у T60 числа отличаются, говорит совсем не в её пользу. И то что эти числа могут на некоторых отрезках напоминать нормальные, совсем не является показателем их истинности. Я уже три года отслеживаю самоэло нейросетей в поисках закономерностей. Сначала в го, затем в шахматах, но пришел лишь к выводу, что в этом шуме искать смысл особо ни к чему. Проще найти нормальные тесты. Тем более что для коротких контролей ситуация с ними сейчас более-менее неплохая. По крайней мере не так как полтора-два года назад, когда и тестов особо не было и проводили их новички, которые не имели опыта. |
Пользователь сказал cпасибо: | Kesandr (03.03.2020) |
03.03.2020, 19:02 | #5646 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от Rom77
С моей точки зрения этого недостаточно.
Насколько помню, T40 стартовала по старой схеме матчей, потом были введены 3-и и 10-e сети для проверки, затем, несколько позже, 30-e, 100-e и 1000-e. В общем, T60 график очень хорош, на мой взгляд. На нем видны все ключевые изменения в тренировочном процессе, что, на мой взгляд, является важнейшим показателем. Да, скорее всего там также есть погрешности, которые сказываются на рейтинге в сторону увеличения Elo. Но они на порядок меньше, чем были раньше. Вот сравните само-эло T60 с тестом policy head: https://gist.github.com/Tilps/6e9098...f75d9ea377749e Цитата: Сообщение от Rom77
Кроме того, если взять цифры в абсолютном выражении, то мы видим также анормальные рейтинги у сетей T59 и T70. То что у T60 числа отличаются, говорит совсем не в её пользу
|
2 пользователя(ей) сказали cпасибо: | svoitsl (03.03.2020), Владимир001 (03.03.2020) |
03.03.2020, 19:42 | #5647 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
Цитата: Сообщение от alchemist888
Насколько помню, T40 стартовала по старой схеме матчей, потом были введены 3-и и 10-e сети для проверки, затем, несколько позже, 30-e, 100-e и 1000-e.
Если более отдаленные сети улучшают результат, то в этом я вижу подтверждение своего тезиса - близкие сети больше приносят вреда, чем пользы, дальние поменьше. Поэтому их лучше исключить. А самое правильное взять в соперники сеть другого поколения или классические движки. Цитата: Сообщение от alchemist888
Тут интересный момент, что T70 стартовала с отметки 0, а Т60 с отметки "-1200". Так что если и сравнивать значения само-эло, то нужно прибавлять 1200 к рейтингу T60. Не знаю откуда взялось это значение, но получилось очень даже неплохо
В общем, скажем так, в какой-то момент я понял, что эти "штаны" никак не могут быть впору, как их не надевай. Либо коленки будут видны, либо ... хм ... другое место. У меня в общем-то немало опыта, но эти рейтинги самоэло нейросетей я объяснить не могу. Сигнал просто тонет в шуме. Так что пусть ими пользуется тот, кто пользуется, но, извините, я пас. P.S. Сейчас я вижу, что во времена 40700, были даже 80-е сети для проверки. Ну, тем более. |
Пользователь сказал cпасибо: | Владимир001 (03.03.2020) |
03.03.2020, 22:14 | #5648 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: LCZero
Тестируем dx-версию Лилы!
Так как она на 27% медленнее cuda-fp16, Стокфиш играл на 18 потоках вместо 24 RTX2060 против 3900x lc0-62525 vs stockfish_20022521_x64_modern: 32 - 27 - 141 На этот раз в качестве дебютного набора использовались многоходовые short lines от Noomen Контроль 78s+1s Игры прилагаются |
5 пользователя(ей) сказали cпасибо: | alchemist888 (03.03.2020), SergeyMZ (03.03.2020), svoitsl (03.03.2020), Viktor (04.03.2020), Виталий В. (04.03.2020) |
03.03.2020, 22:52 | #5649 |
2 разряд
Регистрация: 31.03.2019
Сообщений: 250
Сказал(а) спасибо: 49
Поблагодарили 215 раз(а) в 117 сообщениях
Репутация: 13
|
Re: LCZero
К вопросу о самоэло. Я время от времени играю с Лилой в шахматы ради забавы. С разными сетями, так вот особенно мне нравится играть с т60 и я примерно представляю силу игры начальных сетей в пересчёте на человеческий рейтинг. Я КМС, рейтинг 2300-2400 на популярных интернет площадках. С переменным успехом справляюсь с сетью 60045. Сеть 60050 меня уже обыгрывает просто с разгромным счётом. Самоэло у сети 60045 если не ошибаюсь около 1600, что соответствует примерно 3 разряду у людей. Так что ерунда все эти самоэло, могу вам сказать с полной уверенностью.
|
03.03.2020, 23:36 | #5650 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Цитата: Сообщение от Hendry
Так что ерунда все эти самоэло, могу вам сказать с полной уверенностью.
Поэтому самоэло - это просто немного другая шкала,но ерундой я бы (не КМС) не стал ёё бы называть |
3 пользователя(ей) сказали cпасибо: |
03.03.2020, 23:42 | #5651 |
Гроссмейстер
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
|
Re: LCZero
А тем временем улучшенные настройки обучения (от 59-й сети) показали отличный результат
По итогам теста 20000 партий glbchess64 с дебютным набором от chad https://docs.google.com/spreadsheets...gid=1825444216 сеть 62525 на 10.3 Эло сильнее сети 62450 (за 75 сетей - 10 Эло) хотя сеть 62450 всего на 2.4 Эло сильнее сети 62380 (за 70 сетей - 2,4 Эло) сеть 62380 всего на 4 Эло сильнее сети 62298 (за 82 сети - 4 Эло) |
Пользователь сказал cпасибо: | Владимир001 (03.03.2020) |
03.03.2020, 23:46 | #5652 |
2 разряд
Регистрация: 31.03.2019
Сообщений: 250
Сказал(а) спасибо: 49
Поблагодарили 215 раз(а) в 117 сообщениях
Репутация: 13
|
Re: LCZero
Цитата: Сообщение от svoitsl
Поэтому самоэло - это просто немного другая шкала,но ерундой я бы (не КМС) не стал ёё бы называть
|
Пользователь сказал cпасибо: | Владимир001 (04.03.2020) |
04.03.2020, 02:04 | #5653 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от Hendry
Я время от времени играю с Лилой в шахматы ради забавы. С разными сетями, так вот особенно мне нравится играть с т60 и я примерно представляю силу игры начальных сетей в пересчёте на человеческий рейтинг. Я КМС, рейтинг 2300-2400 на популярных интернет площадках. С переменным успехом справляюсь с сетью 60045. Сеть 60050 меня уже обыгрывает просто с разгромным счётом.
|
2 пользователя(ей) сказали cпасибо: | Alex_Lk (04.03.2020), Владимир001 (04.03.2020) |
04.03.2020, 06:32 | #5654 |
2 разряд
Регистрация: 31.03.2019
Сообщений: 250
Сказал(а) спасибо: 49
Поблагодарили 215 раз(а) в 117 сообщениях
Репутация: 13
|
Re: LCZero
играю с контролем 10+5 или 5+5. на домашнем компе, видео gtx 1050ti
|
Пользователь сказал cпасибо: | Владимир001 (04.03.2020) |
04.03.2020, 17:37 | #5655 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от Hendry
играю с контролем 10+5 или 5+5. на домашнем компе, видео gtx 1050ti
Ну вот и считаем, что в среднем получаем не меньше 20-30 kn/move, когда само-эло строится из расчета менее 1 kn/move. Так что рейтинг сетки, с которой Вы играете на своей машине значительно выше. Сложно сказать насколько именно. По старым scaling тестам для T10 получается порядка 500 Elo. Но для T60 с новым движком цифры могут быть другими. И я сразу говорил, что абсолютные цифры само-эло не стоит к чему-то привязывать. Скорее всего просто удачно получилось, что текущий рейтинг само-эло очень близок к рейтингам CCRL. Возможно именно для этого стартовую отметку, уже во время тренировочного процесса, спустили на значение "-1200". |
04.03.2020, 18:09 | #5656 |
2 разряд
Регистрация: 31.03.2019
Сообщений: 250
Сказал(а) спасибо: 49
Поблагодарили 215 раз(а) в 117 сообщениях
Репутация: 13
|
Re: LCZero
Скорость там меньше, около 1kn в начальной позиции. Но это не суть. Что меня больше интересует, то почему Вы и не только пишете что у Лилы Эло считается для 800 узлов и при этом оно отличается от Эло скажем на 10к узлов. То есть понятное дело что оно отличается, но логично сравнивать программы играющие на одном контроле времени. То есть если перевести ноды на ход во время, то на моей карточке 800 нодов на ход равен, скажем, контролю 1 +0.8 секунд на партию. Но на такой скорости и стокфиш будет играть не то чтобы очень сильно. То есть Стокфиш играет на свои к примеру 3500 рейтинга и с контролем 1 +0.1 сек и с 100 + 10 сек и с любым другим контролем, но сравнивать нужно или одинаковые контроли времени или равноценные соотношения нодов.
|
04.03.2020, 18:20 | #5657 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Я немного не понял суть проблемы. Для Лилы есть policy head тесты (без поиска 1 nodes/move); есть само-эло матчи (около 1000 nodes/move); есть тесты с фиксированными узлами против других сетей и Стокфиша; есть также обычные тесты с контролем времени на разных машинах. Для каждого случая Elo определяется отдельно и показывает оно разницу между тестируемым движком и его противниками в заданных условиях.
|
04.03.2020, 18:28 | #5658 |
2 разряд
Регистрация: 31.03.2019
Сообщений: 250
Сказал(а) спасибо: 49
Поблагодарили 215 раз(а) в 117 сообщениях
Репутация: 13
|
Re: LCZero
Я имею в виду, что самоэло в данном случае для сети 60045 равное примерно 1600 для 800 нодов должно равняться примерно 1600 и для самоэло 8к нодов на ход, если бы оно проводилось. Соответственно какой смысл указывать что Эло получено именно на 800 нодах. То есть 1600 и есть 1600 сколько бы нодов мы на ход не взяли или я не прав?
Это я к тому что сеть когда играет против меня все же имеет 1600 рейтинга, так как я, как оппонент сети с одной стороны и человек, с другой, тоже играю пропорционально сильнее при увеличении контроля на партию. |
04.03.2020, 19:47 | #5659 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Ну объективно рейтинг при увеличении кол-ва узлов должен расти.
Вас же не удивляет, что любой движок обыгрывает сам себя, имя фору по времени? А при некоторой форе, даже слабейший может дать бой сильному, скажем LZ при часе на партию камня на камне не оставит от SF, у которого 10 минут, естественно при более-менее сопоставимом железе, а-ля RTX (лучше два) у LZ, и многоядер у SF. При этом поменяй их местами с точки зрения форы по времени - счет изменится на противоположный. |
04.03.2020, 19:55 | #5660 |
2 разряд
Регистрация: 31.03.2019
Сообщений: 250
Сказал(а) спасибо: 49
Поблагодарили 215 раз(а) в 117 сообщениях
Репутация: 13
|
Re: LCZero
Цитата: Сообщение от Maratka
Ну объективно рейтинг при увеличении кол-ва узлов должен расти.
Вас же не удивляет, что любой движок обыгрывает сам себя, имя фору по времени? |
Пользователь сказал cпасибо: | Alvir (05.03.2020) |
04.03.2020, 20:00 | #5661 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от Hendry
Нет, не должен. Допустим возьмём такой пример, есть гроссмейстер допустим Магнус Карлсен. У него есть рейтинг в блиц, быстрые шахматы и классику и везде он примерно 2800 пунктов. То есть сила игры при увеличении времени на партию растет, а рейтинг нет, потому что для каждого контроля времени он считается отдельно и против шахматистов с таким же контролем времени.
Объяснение столь же простое: один гросс тратит много времени на стратегию, другой чувствует тактику. В долгих шахматах у первого будет преимущество, в быстрых - у второго. Ничего личного, просто склад ума. Все то же и движки. |
04.03.2020, 20:05 | #5662 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
В дополнение: сверхкороткие контроли среди людей вообще говоря не имеют смысла.
Объясняю: выигрыш в них зависит в том числе и от мышечной массы и скорости ее моторики: если кто-то тратит за минуту лишние три секунды на то, чтобы нажать кнопку на часах, он имеет больше шансов проиграть по флагу, играя объективно лучше. |
Пользователь сказал cпасибо: | Владимир001 (04.03.2020) |
04.03.2020, 20:10 | #5663 |
2 разряд
Регистрация: 31.03.2019
Сообщений: 250
Сказал(а) спасибо: 49
Поблагодарили 215 раз(а) в 117 сообщениях
Репутация: 13
|
Re: LCZero
Это общий пример, конечно колебания рейтинга в зависимости от контроля есть и у разных шахматистов и программ они могут отличаться, но разговор не про это. Разговор про то, что нельзя сказать что движок с контролем 1 час на партию имеет рейтинг на 200 пунктов больше, чем движок с контролем 1 минута на партию. Потому что они считаются отдельно для каждого контроля времени.
|
Пользователь сказал cпасибо: | Владимир001 (04.03.2020) |
04.03.2020, 20:14 | #5664 |
2 разряд
Регистрация: 31.03.2019
Сообщений: 250
Сказал(а) спасибо: 49
Поблагодарили 215 раз(а) в 117 сообщениях
Репутация: 13
|
Re: LCZero
Разговор не о силе игры, а о рейтинге
|
Пользователь сказал cпасибо: | Владимир001 (04.03.2020) |
04.03.2020, 20:19 | #5665 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Цитата: Сообщение от Hendry
Потому что они считаются отдельно для каждого контроля времени.
и получу, что Цитата: Сообщение от Hendry
движок с контролем 1 час на партию имеет рейтинг на 200 пунктов больше, чем движок с контролем 1 минута на партию
|
Пользователь сказал cпасибо: | Владимир001 (04.03.2020) |
04.03.2020, 20:23 | #5666 |
2 разряд
Регистрация: 31.03.2019
Сообщений: 250
Сказал(а) спасибо: 49
Поблагодарили 215 раз(а) в 117 сообщениях
Репутация: 13
|
Re: LCZero
Не можете. Рейтинг является верным только при одинаковых или очень близких контролях. Вы путаете рейтинг и силу игры. Рейтинг понятие математически точное, а вы пытаетесь померить кто сильнее кит или слон.
|
Пользователь сказал cпасибо: | Владимир001 (04.03.2020) |
04.03.2020, 20:27 | #5667 |
КМС
Регистрация: 25.04.2019
Сообщений: 674
Сказал(а) спасибо: 293
Поблагодарили 641 раз(а) в 345 сообщениях
Репутация: 61
|
Re: LCZero
Цитата: Сообщение от Hendry
Никто не считает рейтинг дав одному шахматисту 5 минут на партию, а второму 2 часа.
Например, мы получили рейтинг движка в системе 1 kn/move - 2900 Elo. Теперь мы проводим большой тест этого же движка, но с 10 kn/move, получаем значение 3300 Elo. Теперь, если система тестирования достаточно точна, то мы будем достаточно точно предсказывать Elo движков в значениях 1 kn/move и 10 kn/move. Также, мы можем за основу взять хорошо протестированный движок, и по нему делать ordo расчет для любого теста. Еще можно, путем многочисленных тестирований, вывести сложную формулу scaling фактора, затем установить систему координат, например Stockfish11 1500 kn/move будет присвоено 3200 Elo. И уже на основе этого вычислять Elo движка scaling фактор которого известен. |
Пользователь сказал cпасибо: | Maratka (04.03.2020) |
04.03.2020, 20:36 | #5668 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от Hendry
Это общий пример, конечно колебания рейтинга в зависимости от контроля есть и у разных шахматистов и программ они могут отличаться, но разговор не про это. Разговор про то, что нельзя сказать что движок с контролем 1 час на партию имеет рейтинг на 200 пунктов больше, чем движок с контролем 1 минута на партию. Потому что они считаются отдельно для каждого контроля времени.
Да тот же LZ, в теме про которой мы находимся: есть сети маленькие, которые идеальны для минутных контролей, и на которых они громят крупные сети для себя же родного. Но на контроле в десятки минут они уже идут +/- ровно (конечно же зависит от скорости видеоплаты, где-то и на 3-5 минут равенство будет), а на всем, что больше - вчистую сливают. |
04.03.2020, 20:44 | #5669 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от alchemist888
Для движков параллели в рейтинге сделать вполне можно, проводя условные "мосты".
Например, мы получили рейтинг движка в системе 1 kn/move - 2900 Elo. Теперь мы проводим большой тест этого же движка, но с 10 kn/move, получаем значение 3300 Elo. Теперь, если система тестирования достаточно точна, то мы будем достаточно точно предсказывать Elo движков в значениях 1 kn/move и 10 kn/move. |
04.03.2020, 20:45 | #5670 |
2 разряд
Регистрация: 31.03.2019
Сообщений: 250
Сказал(а) спасибо: 49
Поблагодарили 215 раз(а) в 117 сообщениях
Репутация: 13
|
Re: LCZero
alchemist888,
Нет, я снова вынужден не согласиться. Рейтинг одного и того же движка всегда примерно равен. Если мы дадим 1kn/move то мы будем сравнивать его с другими движками тоже с 1kn/move и получим к примеру 2900 рейтинг. Потом мы будем проводить тест этого же движка и дадим ему 10kn/move и будем тестить его с другими движкоми с контролем 10kn/move и получим допустим 2870. Разница конечно будет какая-то. Но не факт, что положительная. Я ещё раз обращаю ваше внимание что сила игры и рейтинг не одно и то же. |
Пользователь сказал cпасибо: | alchemist888 (04.03.2020) |
Здесь присутствуют: 5 (пользователей: 0 , гостей: 5) | |
|
|