11.04.2018, 19:04 | #31 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
sovaz1997, а версию Лилы для CPU не пробовали запускать? Для такой нейросети можно получить около 1000 узлов в секунду на максимальном числе потоков.
|
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 19:20 | #32 |
Гроссмейстер
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
|
Re: LCZero
Rom77, попробую. У меня на 1-м потоке около 200 nps, могу на 7-ми попробовать. Странно, по идее, на видеокарте должно быть быстрее.
|
2 пользователя(ей) сказали cпасибо: | Alexandr_L (18.04.2018), Alex_Lk (11.04.2018) |
11.04.2018, 19:24 | #33 |
КМС
Регистрация: 21.11.2016
Сообщений: 709
Сказал(а) спасибо: 433
Поблагодарили 1,545 раз(а) в 582 сообщениях
Репутация: 197
|
Re: LCZero
122 сеть с v0.5 развивает 500 nps на моём поганеньком ноутбуке спокойно. Думаю, на 860 будет спокойно под 800-900.
|
3 пользователя(ей) сказали cпасибо: |
11.04.2018, 19:27 | #34 |
КМС
Регистрация: 21.11.2016
Сообщений: 709
Сказал(а) спасибо: 433
Поблагодарили 1,545 раз(а) в 582 сообщениях
Репутация: 197
|
Re: LCZero
Цитата: Сообщение от sovaz1997
Странно, по идее, на видеокарте должно быть быстрее.
|
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 19:32 | #35 |
Гроссмейстер
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
|
Re: LCZero
Aster, вероятно, код оптимизирован именно под новые GPU.
Скорость на 7 потоках высокая (с каждой новой глубиной увеличивается). Код:
info depth 15 nodes 246 nps 690 score cp -10 winrate 47.21% time 354 pv e4 e6 d4 d5 e5 c5 c3 Nc6 Nf3 h6 Be2 info depth 16 nodes 426 nps 758 score cp -4 winrate 48.67% time 560 pv e4 e6 d4 d5 e5 c5 c3 Nc6 Nf3 h6 Be2 info depth 17 nodes 759 nps 845 score cp -1 winrate 49.69% time 896 pv e4 e6 d4 d5 e5 c5 c3 Nc6 Nf3 h6 Be2 Nge7 info depth 18 nodes 1333 nps 901 score cp 0 winrate 50.17% time 1477 pv e4 e6 d4 d5 e5 c5 c3 Nc6 Nf3 h6 Be2 Nge7 O-O info depth 19 nodes 2355 nps 968 score cp 1 winrate 50.50% time 2430 pv e4 e6 d4 d5 e5 c5 c3 h6 Nf3 Nc6 Be2 Nge7 O-O Ng6 Be3 info depth 20 nodes 4196 nps 1026 score cp 2 winrate 50.70% time 4089 pv e4 e6 d4 d5 e5 c5 c3 h6 Nf3 Nc6 Be2 Nge7 O-O Ng6 Be3 info depth 21 nodes 7438 nps 1109 score cp 3 winrate 50.83% time 6704 pv e4 e6 d4 d5 e5 c5 c3 h6 Nf3 Nc6 Be2 Nge7 O-O Ng6 Be3 info depth 22 nodes 13181 nps 1148 score cp 3 winrate 50.98% time 11478 pv e4 e6 d4 d5 e5 c5 c3 h6 Nf3 Nc6 Be2 Nge7 O-O Ng6 Be3 cxd4 info depth 23 nodes 23312 nps 1227 score cp 3 winrate 51.09% time 18992 pv e4 e6 c4 c5 Nf3 Nc6 Nc3 Nf6 Be2 d5 exd5 exd5 cxd5 Nxd5 d4 cxd4 Nxd4 Nxc3 bxc3 Be7 O-O info depth 24 nodes 41316 nps 1328 score cp 4 winrate 51.10% time 31108 pv e4 e6 c4 c5 Nf3 Nc6 Nc3 Nf6 Be2 d5 exd5 exd5 cxd5 Nxd5 d4 cxd4 Nxd4 Nxc3 bxc3 Be7 O-O O-O Be3 info depth 25 nodes 73313 nps 1472 score cp 4 winrate 51.15% time 49817 pv e4 e6 d4 d5 e5 c5 c3 Nc6 Nf3 h6 Be2 Nge7 O-O Ng6 Be3 cxd4 cxd4 Be7 Nc3 info depth 26 nodes 130353 nps 1494 score cp 4 winrate 51.23% time 87260 pv e4 e6 d4 d5 e5 c5 c3 Nc6 Nf3 Bd7 Be2 Nge7 O-O Ng6 Be3 cxd4 cxd4 Be7 Nc3 O-O |
2 пользователя(ей) сказали cпасибо: | Alexandr_L (18.04.2018), Alex_Lk (11.04.2018) |
11.04.2018, 19:35 | #36 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
sovaz1997, потому что нейросеть маленькая, да и шахматная доска это по сути картинка разрешением всего 8х8. Я на своём i760 4х2,13 Ггц получаю скорость 550 n/s на -t 4. (запускаю из консоли на -p 800 и набираю пару раз команду go)
Можно ещё вас попросить проверить скорость последней сетки 10х128? https://drive.google.com/drive/folde...0FMOeuNg43npln на CPU и GPU c -t 1, -t 2, -t 7 , а то у меня видеокарта совсем уж плоха. Кстати, бенчмарки GPU на сетке 6х64 можно посмотреть здесь: https://github.com/glinscott/leela-chess/issues/203 |
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 20:08 | #38 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
Интересно...
Видеокарта "съела" среднеразмерную нейросетку и даже не поперхнулась. А вот проц по скорости просел в 4 раза. Интересно, как бы повели себя современные CPU с поддержкой AVX2 ? |
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 20:10 | #39 |
Гроссмейстер
Регистрация: 27.09.2017
Адрес: Москва
Сообщений: 4,142
Сказал(а) спасибо: 2,297
Поблагодарили 2,510 раз(а) в 1,635 сообщениях
Репутация: 92
|
Re: LCZero
Всё-таки, немного медленнее, чем маленькая (на GPU). Но на процессоре разница огромная. Думаю, чем больше размер сети, тем лучше она будет работать на видеокарте в сравнении с процессом.
|
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 20:11 | #40 |
Гроссмейстер
Регистрация: 28.05.2016
Сообщений: 3,184
Сказал(а) спасибо: 11,937
Поблагодарили 5,570 раз(а) в 2,288 сообщениях
Репутация: 614
|
Re: LCZero
Цитата: Сообщение от Rom77
Интересно...
Видеокарта "съела" среднеразмерную нейросетку и даже не поперхнулась. А вот проц по скорости просел в 4 раза. Интересно, как бы повели себя современные CPU с поддержкой AVX2 ? |
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 20:26 | #41 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
Цитата: Сообщение от SergeyMZ
У меня процессор поддерживает AVX2. Что надо скачать и как запустить?
https://github.com/glinscott/leela-c...eases/tag/v0.5 Распаковать в отдельные папки. 2) Скачать нейросетку ID 107 (размер 6х64): http://162.217.248.187/networks и последнюю сетку 128x10-238: https://drive.google.com/drive/folde...0FMOeuNg43npln Распаковать каждую нейросеть в папки c gpu и cpu 3) Запустить lczero.exe через файлы .bat c параметрами (позже напишу какие) 4) Дождаться инициализации в консоли, набрать go, посмотреть nps |
5 пользователя(ей) сказали cпасибо: | Alexandr_L (18.04.2018), Alex_Lk (11.04.2018), DeepBallack (11.04.2018), SergeyMZ (11.04.2018), Александр (16.10.2018) |
11.04.2018, 20:49 | #42 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
В прилагаемом архиве файлы .bat
Те которые оканчиваются на cpu надо положить в папку с cpu. Два других положить как в папку cpu, так и gpu. Запустить эти файлы, подождать десяток секунд до окончания инициализации Лилы, набрать go, дождаться завершения теста и посмотреть скорость (nps) |
4 пользователя(ей) сказали cпасибо: |
11.04.2018, 20:53 | #43 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Как эту хрень запустить в оболочке Fritz?
|
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 20:55 | #44 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
SergeyMZ, Итого получите 6 скоростей: мелкой и средней сети, на cpu и gpu, на одном и четырех тредах.
|
2 пользователя(ей) сказали cпасибо: | Alexandr_L (18.04.2018), SergeyMZ (11.04.2018) |
11.04.2018, 20:57 | #45 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
Цитата: Сообщение от Maratka
Как эту хрень запустить в оболочке Fritz?
|
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 21:01 | #46 |
КМС
Регистрация: 21.11.2016
Сообщений: 709
Сказал(а) спасибо: 433
Поблагодарили 1,545 раз(а) в 582 сообщениях
Репутация: 197
|
Re: LCZero
Цитата: Сообщение от sovaz1997
Aster, вероятно, код оптимизирован именно под новые GPU.
|
2 пользователя(ей) сказали cпасибо: | Alexandr_L (18.04.2018), Alex_Lk (12.04.2018) |
11.04.2018, 21:01 | #47 |
Гроссмейстер
Регистрация: 28.05.2016
Сообщений: 3,184
Сказал(а) спасибо: 11,937
Поблагодарили 5,570 раз(а) в 2,288 сообщениях
Репутация: 614
|
Re: LCZero
Цитата: Сообщение от Rom77
SergeyMZ, Итого получите 6 скоростей: мелкой и средней сети, на cpu и gpu, на одном и четырех тредах.
|
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 21:04 | #48 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
Цитата: Сообщение от SergeyMZ
А ничего, что у меня 6 физических ядер?
|
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 21:06 | #49 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
Цитата: Сообщение от Aster
Да нет, я читал, там "чистый" openCL. Надо было не выпендриваться и использовать cuDNN для нейросетей, но видимо разработчики решили сделать использование ГПУ более доступным.
|
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 21:12 | #50 |
Гроссмейстер
Регистрация: 28.05.2016
Сообщений: 3,184
Сказал(а) спасибо: 11,937
Поблагодарили 5,570 раз(а) в 2,288 сообщениях
Репутация: 614
|
Re: LCZero
Всё установил. Провёл тесты. Вот результат:
Цитата:
CPU
1 ядро info depth 16 nodes 513 nps 494 score cp 3 winrate 50.87% time 1036 pv e4 e6 d4 d5 e5 c5 c3 Nc6 Nf3 h6 Be2 Nge7 O-O bestmove e2e4 1 ядро большая info depth 16 nodes 622 nps 139 score cp 9 winrate 52.52% time 4461 pv e4 e6 d4 d5 e5 c5 c3 cxd4 cxd4 Qa5+ Nc3 Nc6 Nf3 bestmove e2e4 4 ядра info depth 16 nodes 549 nps 1505 score cp 2 winrate 50.77% time 363 pv e4 e6 d4 d5 e5 c5 c3 Nc6 Nf3 h6 Be2 Nge7 O-O Ng6 bestmove e2e4 4 ядра большая info depth 16 nodes 634 nps 502 score cp 9 winrate 52.62% time 1260 pv e4 e6 d4 d5 e5 c5 c3 cxd4 cxd4 Qa5+ Nc3 Nc6 Nf3 bestmove e2e4 GPU Малая info depth 16 nodes 513 nps 1133 score cp 3 winrate 50.87% time 451 pv e4 e6 d4 d5 e5 c5 c3 Nc6 Nf3 h6 Be2 Nge7 O-O bestmove e2e4 Большая info depth 16 nodes 622 nps 820 score cp 9 winrate 52.52% time 756 pv e4 e6 d4 d5 e5 c5 c3 cxd4 cxd4 Qa5+ Nc3 Nc6 Nf3 bestmove e2e4 |
2 пользователя(ей) сказали cпасибо: | Alexandr_L (18.04.2018), Rom77 (11.04.2018) |
11.04.2018, 21:17 | #51 |
КМС
Регистрация: 21.11.2016
Сообщений: 709
Сказал(а) спасибо: 433
Поблагодарили 1,545 раз(а) в 582 сообщениях
Репутация: 197
|
Re: LCZero
Цитата: Сообщение от Rom77
Были ещё какие-то заморочки с лицензией GPL и возможностью запуска на видеокартах AMD.
А так - сети сейчас вообще (на практике) не тренируются на картах AMD. Это в любом случае решение организаторов. |
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 21:24 | #52 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от Aster
Надо было не выпендриваться и использовать cuDNN для нейросетей
Если да - то и правильно, что реализация сделана через OpenCL: Open - на то и "open", чтобы быть доступным всем. Технически, его даже встройка Intel должна поддерживать (ну конечно же последних поколений, а не древности времен Sandy Bridge). Вопрос выхлопа от этой поддержки - это уже отдельный вопрос (если видео уж очень медленное, то его задействование может дать даже отрицательный эффект). ______ API в любом случае разовьется до нужного уровня, а математически - Radeon'ы за те же деньги быстрее, чем функциональные аналоги nVidia. Потому OpenCL. |
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 21:25 | #53 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
Цитата: Сообщение от SergeyMZ
Всё установил. Провёл тесты. Вот результат:
Цитата:
CPU
1 ядро info depth 16 nodes 513 nps 494 score cp 3 winrate 50.87% time 1036 pv e4 e6 d4 d5 e5 c5 c3 Nc6 Nf3 h6 Be2 Nge7 O-O bestmove e2e4 1 ядро большая info depth 16 nodes 622 nps 139 score cp 9 winrate 52.52% time 4461 pv e4 e6 d4 d5 e5 c5 c3 cxd4 cxd4 Qa5+ Nc3 Nc6 Nf3 bestmove e2e4 А какой у вас процессор и видеокарта, не подскажете? |
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 21:27 | #54 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от Rom77
Выходит не так и помогают процессору инструкции AVX2... Может быть нужна программная адаптация?...
|
2 пользователя(ей) сказали cпасибо: | Alexandr_L (18.04.2018), Rom77 (11.04.2018) |
11.04.2018, 21:28 | #55 |
Гроссмейстер
Регистрация: 28.05.2016
Сообщений: 3,184
Сказал(а) спасибо: 11,937
Поблагодарили 5,570 раз(а) в 2,288 сообщениях
Репутация: 614
|
Re: LCZero
Цитата: Сообщение от Rom77
Скорость просела в 3,5 раза. Выходит не так и помогают процессору инструкции AVX2... Может быть нужна программная адаптация?...
А какой у вас процессор и видеокарта, не подскажете? Видеокарта NVIDIA Geforce 960 GTX |
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 21:40 | #56 |
Мастер
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
|
Re: LCZero
Цитата: Сообщение от SergeyMZ
CPU
4 ядра info depth 16 nodes 549 nps 1505 score cp 2 winrate 50.77% time 363 pv e4 e6 d4 d5 e5 c5 c3 Nc6 Nf3 h6 Be2 Nge7 O-O Ng6 bestmove e2e4 4 ядра большая info depth 16 nodes 634 nps 502 score cp 9 winrate 52.62% time 1260 pv e4 e6 d4 d5 e5 c5 c3 cxd4 cxd4 Qa5+ Nc3 Nc6 Nf3 bestmove e2e4 GPU Малая info depth 16 nodes 513 nps 1133 score cp 3 winrate 50.87% time 451 pv e4 e6 d4 d5 e5 c5 c3 Nc6 Nf3 h6 Be2 Nge7 O-O bestmove e2e4 Большая info depth 16 nodes 622 nps 820 score cp 9 winrate 52.52% time 756 pv e4 e6 d4 d5 e5 c5 c3 cxd4 cxd4 Qa5+ Nc3 Nc6 Nf3 bestmove e2e4 Сергей, спасибо большое за помощь! |
2 пользователя(ей) сказали cпасибо: | Alexandr_L (18.04.2018), SergeyMZ (11.04.2018) |
11.04.2018, 21:52 | #57 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от SergeyMZ
Процессор Intel Core i7 6-cores 8700k 4.5 Ггц
Видеокарта NVIDIA Geforce 960 GTX Кстати, замерьте использование видеопамяти (GPU-Z), если у Вас плата с 2-мя мегабайтами - вполне возможно, что "затор" вызван именно этим. |
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 22:31 | #58 |
КМС
Регистрация: 21.11.2016
Сообщений: 709
Сказал(а) спасибо: 433
Поблагодарили 1,545 раз(а) в 582 сообщениях
Репутация: 197
|
Re: LCZero
Цитата: Сообщение от Maratka
Насколько я понимаю - это привилегия плат nVidia?
Если да - то и правильно, что реализация сделана через OpenCL: Open - на то и "open", чтобы быть доступным всем. Технически, его даже встройка Intel должна поддерживать (ну конечно же последних поколений, а не древности времен Sandy Bridge). Вопрос выхлопа от этой поддержки - это уже отдельный вопрос (если видео уж очень медленное, то его задействование может дать даже отрицательный эффект). ______ API в любом случае разовьется до нужного уровня, а математически - Radeon'ы за те же деньги быстрее, чем функциональные аналоги nVidia. Потому OpenCL. Радеоны пока даже в исследовательском коде не дошли до производительности нвидии, и глупо не использовать приемущество, когда почти у всех юзеров карты nvidia. |
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
11.04.2018, 23:19 | #59 |
Эксперт
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 11,849
Сказал(а) спасибо: 3,311
Поблагодарили 5,952 раз(а) в 4,245 сообщениях
Репутация: 253
|
Re: LCZero
Цитата: Сообщение от Aster
Что значит "API разовьётся до нужного уровня"?
Представьте себе, что OpenCL - это не кубик Рубика, а вполне документированый интерфейс, подкрепленный своим компилятором. И так само, как нельзя использовать AVX в компиляторе C++ 2010 года, так само не получится использовать "по полной" математику современных плат nVidia и AMD на "старом" OpenCL 1.2 А ведь уже есть OpenCL версии 2.1.... А между тем движок написан под OpenCL 1.2, для совместимости со "старьем". Цитата: Сообщение от Aster
и глупо не использовать приемущество, когда почти у всех юзеров карты nvidia.
А там выбор как раз другой: либо AMD, либо Intel, и графика в APU составляют львиную долю продаж видео "вообще". Внешние платы контролируют хорошо если 30% рынка, а значиит nViidia контролирует хорошо если 20%. Еще 20% - AMD, за счет как встройки, так и "внешних" решений. Остальное (т.е. 60%!!) доля Intel. |
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
12.04.2018, 09:12 | #60 |
Гроссмейстер
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
|
Re: LCZero
Число игр неумолимо приближается к 4 млн (возможно уже завтра достигнет), а вот сила игры что то уже мало ростёт (по крайней мере для сети 6х64).
|
Пользователь сказал cпасибо: | Alexandr_L (18.04.2018) |
Здесь присутствуют: 6 (пользователей: 0 , гостей: 6) | |
|
|