Forchess - форум о заочных шахматах  

Вернуться   Forchess - форум о заочных шахматах > Заочные турниры и партии > Шахматные программы и движки

Ответ
 
Опции темы Опции просмотра
Старый 22.09.2019, 22:33   #4681
svoitsl
Гроссмейстер
 
Аватар для svoitsl
 
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
то по производительности GTX 1650 Ti будет находиться между GTX 1650 и GTX 1660, то есть на уровне, примерно соответствующем быстродействию GeForce GTX 1060.
А разве уже сейчас для Лилы GTX 1650 не лучше GTX 1060?
svoitsl вне форума   Ответить с цитированием
Старый 22.09.2019, 23:03   #4682
dew
Гроссмейстер
 
Аватар для dew
 
Регистрация: 21.02.2019
Сообщений: 1,206
Сказал(а) спасибо: 131
Поблагодарили 514 раз(а) в 368 сообщениях
Репутация: 62
По умолчанию Re: LCZero

Цитата: Сообщение от svoitsl
А разве уже сейчас для Лилы GTX 1650 не лучше GTX 1060?
Нет

http://www.hwcompare.com/38531/gefor...orce-gtx-1650/
dew вне форума   Ответить с цитированием
Старый 22.09.2019, 23:13   #4683
svoitsl
Гроссмейстер
 
Аватар для svoitsl
 
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
По умолчанию Re: LCZero

Цитата: Сообщение от dew
Нет
Может и так, но этот вывод нельзя сделать по приведенной ссылке, там нет не одного теста Лилы (или может я невнимателен?)
svoitsl вне форума   Ответить с цитированием
Старый 22.09.2019, 23:13   #4684
ChessMan
Super Moderator
 
Аватар для ChessMan
 
Регистрация: 04.01.2017
Сообщений: 3,629
Сказал(а) спасибо: 2,879
Поблагодарили 6,463 раз(а) в 2,331 сообщениях
Репутация: 354
По умолчанию Re: LCZero

Цитата: Сообщение от dew
А Вы уверены?
GTX 1650 поддерживает cudnn-fp16, так что скорость Лилы удваивается.
ChessMan вне форума   Ответить с цитированием
Старый 22.09.2019, 23:17   #4685
svoitsl
Гроссмейстер
 
Аватар для svoitsl
 
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
По умолчанию Re: LCZero

Цитата: Сообщение от ChessMan
так что скорость Лилы удваивается.
Это только на RTX вроде, а на GTX1650 только 80% (а может и меньше, не помню что там crem писал)
svoitsl вне форума   Ответить с цитированием
Старый 22.09.2019, 23:21   #4686
ChessMan
Super Moderator
 
Аватар для ChessMan
 
Регистрация: 04.01.2017
Сообщений: 3,629
Сказал(а) спасибо: 2,879
Поблагодарили 6,463 раз(а) в 2,331 сообщениях
Репутация: 354
По умолчанию Re: LCZero

Цитата: Сообщение от svoitsl
Это только на RTX вроде, а на GTX1650 только 80% (а может и меньше, не помню что там crem писал)
Мерял через бенч.
1900 с копейками превращаются в 3900 с копейками при fp16.
ChessMan вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Maratka (10.05.2024)
Старый 22.09.2019, 23:25   #4687
ChessMan
Super Moderator
 
Аватар для ChessMan
 
Регистрация: 04.01.2017
Сообщений: 3,629
Сказал(а) спасибо: 2,879
Поблагодарили 6,463 раз(а) в 2,331 сообщениях
Репутация: 354
По умолчанию Re: LCZero

E:\Engines\Lc0\lc0-v0.22.0-windows-cuda_Fp32>lc0.exe benchmark --backend=cudnn-fp16

Развернуть для просмотра

_
| _ | |
|_ |_ |_| v0.22.0 built Aug 5 2019
Found pb network file: ./eeffb512c9c953e41f2bdc9592df1129cc1c5d047730c633d253f7e9ecce19a5
Creating backend [cudnn-fp16]...
GPU: GeForce GTX 1650
GPU memory: 4 Gb
GPU clock frequency: 1740 MHz
GPU compute capability: 7.5
CUDA Runtime version: 10.0.0
Cudnn version: 7.4.2
Latest version of CUDA supported by the driver: 10.1.0
Benchmark time 41ms, 2 nodes, 48 nps, move e2e4
Benchmark time 60ms, 3 nodes, 50 nps, move e2e4
Benchmark time 80ms, 4 nodes, 50 nps, move e2e4
Benchmark time 99ms, 5 nodes, 50 nps, move e2e4
Benchmark time 117ms, 6 nodes, 51 nps, move e2e4
Benchmark time 137ms, 9 nodes, 65 nps, move e2e4
Benchmark time 156ms, 12 nodes, 76 nps, move e2e4
Benchmark time 166ms, 14 nodes, 84 nps, move e2e4
Benchmark time 175ms, 22 nodes, 125 nps, move e2e4
Benchmark time 193ms, 35 nodes, 181 nps, move e2e4
Benchmark time 230ms, 47 nodes, 204 nps, move e2e4
Benchmark time 266ms, 60 nodes, 225 nps, move e2e4
Benchmark time 301ms, 81 nodes, 269 nps, move e2e4
Benchmark time 334ms, 100 nodes, 299 nps, move e2e4
Benchmark time 369ms, 128 nodes, 346 nps, move e2e4
Benchmark time 402ms, 166 nodes, 412 nps, move e2e4
Benchmark time 435ms, 198 nodes, 455 nps, move e2e4
Benchmark time 469ms, 231 nodes, 492 nps, move e2e4
Benchmark time 502ms, 272 nodes, 541 nps, move e2e4
Benchmark time 536ms, 341 nodes, 636 nps, move e2e4
Benchmark time 571ms, 392 nodes, 686 nps, move e2e4
Benchmark time 613ms, 470 nodes, 766 nps, move e2e4
Benchmark time 655ms, 561 nodes, 856 nps, move e2e4
Benchmark time 782ms, 872 nodes, 1115 nps, move e2e4
Benchmark time 1046ms, 1734 nodes, 1657 nps, move e2e4
Benchmark time 1200ms, 2276 nodes, 1896 nps, move e2e4
Benchmark time 1273ms, 2534 nodes, 1990 nps, move e2e4
Benchmark time 1474ms, 3287 nodes, 2229 nps, move e2e4
Benchmark time 1606ms, 3757 nodes, 2339 nps, move e2e4
Benchmark time 1691ms, 4074 nodes, 2409 nps, move e2e4
Benchmark time 1766ms, 4353 nodes, 2464 nps, move e2e4
Benchmark time 1866ms, 4711 nodes, 2524 nps, move e2e4
Benchmark time 1946ms, 5028 nodes, 2583 nps, move e2e4
Benchmark time 2013ms, 5264 nodes, 2615 nps, move e2e4
Benchmark time 2089ms, 5578 nodes, 2670 nps, move e2e4
Benchmark time 2262ms, 6332 nodes, 2799 nps, move e2e4
Benchmark time 2487ms, 7219 nodes, 2902 nps, move e2e4
Benchmark time 2619ms, 7765 nodes, 2964 nps, move e2e4
Benchmark time 2717ms, 8162 nodes, 3004 nps, move e2e4
Benchmark time 3739ms, 12329 nodes, 3297 nps, move e2e4
Benchmark time 4908ms, 17579 nodes, 3581 nps, move e2e4
Benchmark time 6905ms, 27152 nodes, 3932 nps, move e2e4
Benchmark time 6980ms, 27455 nodes, 3933 nps, move e2e4
Benchmark time 7114ms, 27977 nodes, 3932 nps, move e2e4
Benchmark time 7320ms, 28758 nodes, 3928 nps, move e2e4
Benchmark time 7372ms, 28937 nodes, 3925 nps, move e2e4
bestmove e2e4
[свернуть]

Benchmark final time 7.40437s calculating 3917.96 nodes per second.

=============

E:\Engines\Lc0\lc0-v0.22.0-windows-cuda_Fp32>lc0.exe benchmark --backend=cudnn

Развернуть для просмотра

_
| _ | |
|_ |_ |_| v0.22.0 built Aug 5 2019
Found pb network file: ./eeffb512c9c953e41f2bdc9592df1129cc1c5d047730c633d253f7e9ecce19a5
Creating backend [cudnn]...
GPU: GeForce GTX 1650
GPU memory: 4 Gb
GPU clock frequency: 1740 MHz
GPU compute capability: 7.5
CUDA Runtime version: 10.0.0
Cudnn version: 7.4.2
Latest version of CUDA supported by the driver: 10.1.0
WARNING: you will probably get better performance from the cudnn-fp16 backend.
Benchmark time 62ms, 2 nodes, 32 nps, move e2e4
Benchmark time 91ms, 3 nodes, 32 nps, move e2e4
Benchmark time 123ms, 4 nodes, 32 nps, move e2e4
Benchmark time 153ms, 5 nodes, 32 nps, move e2e4
Benchmark time 183ms, 6 nodes, 32 nps, move e2e4
Benchmark time 213ms, 8 nodes, 37 nps, move e2e4
Benchmark time 273ms, 10 nodes, 36 nps, move e2e4
Benchmark time 330ms, 19 nodes, 57 nps, move e2e4
Benchmark time 390ms, 30 nodes, 76 nps, move e2e4
Benchmark time 449ms, 46 nodes, 102 nps, move e2e4
Benchmark time 479ms, 52 nodes, 108 nps, move e2e4
Benchmark time 509ms, 59 nodes, 115 nps, move e2e4
Benchmark time 595ms, 83 nodes, 139 nps, move e2e4
Benchmark time 654ms, 103 nodes, 157 nps, move e2e4
Benchmark time 712ms, 140 nodes, 196 nps, move e2e4
Benchmark time 742ms, 163 nodes, 219 nps, move e2e4
Benchmark time 772ms, 185 nodes, 239 nps, move e2e4
Benchmark time 801ms, 210 nodes, 262 nps, move e2e4
Benchmark time 832ms, 231 nodes, 277 nps, move e2e4
Benchmark time 892ms, 262 nodes, 293 nps, move e2e4
Benchmark time 950ms, 302 nodes, 317 nps, move e2e4
Benchmark time 1009ms, 357 nodes, 353 nps, move e2e4
Benchmark time 1067ms, 414 nodes, 388 nps, move e2e4
Benchmark time 1134ms, 492 nodes, 433 nps, move e2e4
Benchmark time 1200ms, 576 nodes, 480 nps, move e2e4
Benchmark time 1335ms, 790 nodes, 591 nps, move e2e4
Benchmark time 1372ms, 843 nodes, 614 nps, move e2e4
Benchmark time 1772ms, 1627 nodes, 918 nps, move e2e4
Benchmark time 1878ms, 1856 nodes, 988 nps, move e2e4
Benchmark time 2142ms, 2435 nodes, 1136 nps, move e2e4
Benchmark time 2197ms, 2549 nodes, 1160 nps, move e2e4
Benchmark time 2578ms, 3488 nodes, 1352 nps, move e2e4
Benchmark time 2795ms, 3953 nodes, 1414 nps, move e2e4
Benchmark time 2974ms, 4356 nodes, 1464 nps, move e2e4
Benchmark time 3094ms, 4610 nodes, 1489 nps, move e2e4
Benchmark time 3210ms, 4846 nodes, 1509 nps, move e2e4
Benchmark time 3359ms, 5217 nodes, 1553 nps, move e2e4
Benchmark time 3592ms, 5791 nodes, 1612 nps, move e2e4
Benchmark time 3729ms, 6119 nodes, 1640 nps, move e2e4
Benchmark time 3881ms, 6501 nodes, 1675 nps, move e2e4
Benchmark time 4039ms, 6923 nodes, 1714 nps, move e2e4
Benchmark time 4439ms, 7855 nodes, 1769 nps, move e2e4
Benchmark time 5822ms, 11239 nodes, 1930 nps, move e2e4
Benchmark time 6610ms, 12837 nodes, 1942 nps, move e2e4
bestmove e2e4
[свернуть]

Benchmark final time 6.70083s calculating 1953.64 nodes per second.
ChessMan вне форума   Ответить с цитированием
Старый 22.09.2019, 23:29   #4688
dew
Гроссмейстер
 
Аватар для dew
 
Регистрация: 21.02.2019
Сообщений: 1,206
Сказал(а) спасибо: 131
Поблагодарили 514 раз(а) в 368 сообщениях
Репутация: 62
По умолчанию Re: LCZero

Цитата: Сообщение от ChessMan
А Вы уверены?
GTX 1650 поддерживает cudnn-fp16, так что скорость Лилы удваивается.
Теперь не уверен, но думаю, что, все же, прав - 1650 вся в целом как черепаха.
Ну и так рубить этим fp16, то зачем? 1060 тоже поддерживает fp16, ток медленно получается. А Вы уверены, что на 1650 в два раза быстрее, а не как на 10xx серии?
dew вне форума   Ответить с цитированием
Старый 22.09.2019, 23:33   #4689
ChessMan
Super Moderator
 
Аватар для ChessMan
 
Регистрация: 04.01.2017
Сообщений: 3,629
Сказал(а) спасибо: 2,879
Поблагодарили 6,463 раз(а) в 2,331 сообщениях
Репутация: 354
По умолчанию Re: LCZero

Цитата: Сообщение от dew
Теперь не уверен, но думаю, что, все же, прав - 1650 вся в целом как черепаха.
Ну и так рубить этим fp16, то зачем? 1060 тоже поддерживает fp16, ток медленно получается. А Вы уверены, что на 1650 в два раза быстрее, а не как на 10xx серии?
Выше результаты бенча.
1953.64 nodes per second против 3917.96 nodes per second.
ChessMan вне форума   Ответить с цитированием
Старый 22.09.2019, 23:37   #4690
ChessMan
Super Moderator
 
Аватар для ChessMan
 
Регистрация: 04.01.2017
Сообщений: 3,629
Сказал(а) спасибо: 2,879
Поблагодарили 6,463 раз(а) в 2,331 сообщениях
Репутация: 354
По умолчанию Re: LCZero

Можно ещё немного "разогнать":

E:\Engines\Lc0\lc0-v0.22.0-windows-cuda_Fp32>lc0.exe benchmark --nncache=8000000 --max-collision-events=256 --minibatch-size=256 --backend=cudnn-fp16 --cpuct=3.1

Развернуть для просмотра

_
| _ | |
|_ |_ |_| v0.22.0 built Aug 5 2019
Found pb network file: ./eeffb512c9c953e41f2bdc9592df1129cc1c5d047730c633d253f7e9ecce19a5
Creating backend [cudnn-fp16]...
GPU: GeForce GTX 1650
GPU memory: 4 Gb
GPU clock frequency: 1740 MHz
GPU compute capability: 7.5
CUDA Runtime version: 10.0.0
Cudnn version: 7.4.2
Latest version of CUDA supported by the driver: 10.1.0
Benchmark time 40ms, 2 nodes, 50 nps, move e2e4
Benchmark time 59ms, 3 nodes, 50 nps, move e2e4
Benchmark time 78ms, 4 nodes, 51 nps, move e2e4
Benchmark time 98ms, 5 nodes, 51 nps, move e2e4
Benchmark time 118ms, 6 nodes, 50 nps, move e2e4
Benchmark time 138ms, 9 nodes, 65 nps, move e2e4
Benchmark time 158ms, 12 nodes, 75 nps, move e2e4
Benchmark time 165ms, 14 nodes, 84 nps, move e2e4
Benchmark time 179ms, 22 nodes, 122 nps, move e2e4
Benchmark time 197ms, 36 nodes, 182 nps, move e2e4
Benchmark time 215ms, 53 nodes, 246 nps, move e2e4
Benchmark time 233ms, 79 nodes, 339 nps, move e2e4
Benchmark time 271ms, 121 nodes, 446 nps, move e2e4
Benchmark time 288ms, 136 nodes, 472 nps, move e2e4
Benchmark time 313ms, 189 nodes, 603 nps, move e2e4
Benchmark time 378ms, 338 nodes, 894 nps, move e2e4
Benchmark time 427ms, 454 nodes, 1063 nps, move e2e4
Benchmark time 474ms, 547 nodes, 1154 nps, move e2e4
Benchmark time 525ms, 677 nodes, 1289 nps, move e2e4
Benchmark time 579ms, 827 nodes, 1428 nps, move e2e4
Benchmark time 637ms, 1001 nodes, 1571 nps, move e2e4
Benchmark time 710ms, 1230 nodes, 1732 nps, move e2e4
Benchmark time 788ms, 1488 nodes, 1888 nps, move e2e4
Benchmark time 856ms, 1733 nodes, 2024 nps, move e2e4
Benchmark time 1007ms, 2249 nodes, 2233 nps, move e2e4
Benchmark time 1109ms, 2648 nodes, 2387 nps, move e2e4
Benchmark time 1219ms, 3075 nodes, 2522 nps, move e2e4
Benchmark time 1262ms, 3238 nodes, 2565 nps, move e2e4
Benchmark time 1411ms, 3864 nodes, 2738 nps, move e2e4
Benchmark time 1953ms, 6143 nodes, 3145 nps, move e2e4
Benchmark time 2431ms, 8286 nodes, 3408 nps, move e2e4
Benchmark time 2591ms, 8978 nodes, 3465 nps, move e2e4
Benchmark time 2750ms, 9668 nodes, 3515 nps, move e2e4
Benchmark time 2911ms, 10389 nodes, 3568 nps, move e2e4
Benchmark time 3071ms, 11104 nodes, 3615 nps, move e2e4
Benchmark time 3232ms, 11769 nodes, 3641 nps, move e2e4
Benchmark time 3391ms, 12404 nodes, 3657 nps, move e2e4
Benchmark time 3472ms, 12734 nodes, 3667 nps, move e2e4
Benchmark time 3633ms, 13406 nodes, 3690 nps, move e2e4
Benchmark time 3792ms, 14224 nodes, 3751 nps, move e2e4
Benchmark time 4192ms, 16251 nodes, 3876 nps, move e2e4
Benchmark time 4351ms, 17089 nodes, 3927 nps, move e2e4
Benchmark time 6261ms, 26872 nodes, 4291 nps, move e2e4
Benchmark time 6500ms, 27995 nodes, 4306 nps, move e2e4
Benchmark time 6581ms, 28320 nodes, 4303 nps, move e2e4
Benchmark time 6741ms, 28987 nodes, 4300 nps, move e2e4
Benchmark time 6902ms, 29648 nodes, 4295 nps, move e2e4
Benchmark time 7142ms, 30570 nodes, 4280 nps, move e2e4
Benchmark time 7215ms, 30617 nodes, 4243 nps, move e2e4
bestmove e2e4
[свернуть]

Benchmark final time 7.30409s calculating 4261.86 nodes per second.
ChessMan вне форума   Ответить с цитированием
Старый 22.09.2019, 23:42   #4691
dew
Гроссмейстер
 
Аватар для dew
 
Регистрация: 21.02.2019
Сообщений: 1,206
Сказал(а) спасибо: 131
Поблагодарили 514 раз(а) в 368 сообщениях
Репутация: 62
По умолчанию Re: LCZero

Цитата: Сообщение от ChessMan
Выше результаты бенча.
1953.64 nodes per second против 3917.96 nodes per second.
Ну, наверное, тогда Вы правы... Ибо тут:

https://groups.google.com/forum/#!to...ro/1sJcvkttLfA

1060 выдает 3к с копейками, правда давненько.. но чисто психологически - если предложить на выбор, я бы взял 1060 (поиграть тоже иногда охота не в шахматы
dew вне форума   Ответить с цитированием
Старый 22.09.2019, 23:46   #4692
ChessMan
Super Moderator
 
Аватар для ChessMan
 
Регистрация: 04.01.2017
Сообщений: 3,629
Сказал(а) спасибо: 2,879
Поблагодарили 6,463 раз(а) в 2,331 сообщениях
Репутация: 354
По умолчанию Re: LCZero

Цитата: Сообщение от dew
Ну, наверное, тогда Вы правы... Ибо тут:

https://groups.google.com/forum/#!to...ro/1sJcvkttLfA

1060 выдает 3к с копейками, правда давненько.. но чисто психологически - если предложить на выбор, я бы взял 1060 (поиграть тоже иногда охота не в шахматы
GTX 1650 вполне нормально тянет игры. Лишь слегка хуже чем GTX 1060.
ChessMan вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
dew (22.09.2019)
Старый 23.09.2019, 04:31   #4693
player-1980
3 разряд
 
Аватар для player-1980
 
Регистрация: 05.03.2019
Сообщений: 227
Сказал(а) спасибо: 158
Поблагодарили 87 раз(а) в 58 сообщениях
Репутация: 12
По умолчанию Re: LCZero

Цитата: Сообщение от svoitsl
на 2 RTX 2080Ti)
а сколько можно всего ставить их в один комп?
player-1980 вне форума   Ответить с цитированием
Старый 23.09.2019, 11:11   #4694
svoitsl
Гроссмейстер
 
Аватар для svoitsl
 
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
По умолчанию Re: LCZero

Это ещё и от матплаты зависит,но не думаю, что больше 8
svoitsl вне форума   Ответить с цитированием
Старый 23.09.2019, 13:41   #4695
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от dew
1060 тоже поддерживает fp16
Это троллинг в стиле Маратки с Вызвезденцем?
Омегазеро вне форума   Ответить с цитированием
Старый 23.09.2019, 13:42   #4696
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от ChessMan
Можно ещё немного "разогнать":
calculating 4261.86 nodes per second
У меня она без разгона выдает 4230
Омегазеро вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
ChessMan (23.09.2019)
Старый 23.09.2019, 13:54   #4697
dew
Гроссмейстер
 
Аватар для dew
 
Регистрация: 21.02.2019
Сообщений: 1,206
Сказал(а) спасибо: 131
Поблагодарили 514 раз(а) в 368 сообщениях
Репутация: 62
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
Это троллинг в стиле Маратки с Вызвезденцем?
В чем проблема? fp16 работает, но медленнее чем fp32
dew вне форума   Ответить с цитированием
Старый 23.09.2019, 14:10   #4698
ChessMan
Super Moderator
 
Аватар для ChessMan
 
Регистрация: 04.01.2017
Сообщений: 3,629
Сказал(а) спасибо: 2,879
Поблагодарили 6,463 раз(а) в 2,331 сообщениях
Репутация: 354
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
У меня она без разгона выдает 4230
Это зависит от сети. Разные сети с одинаковой размерностью иногда дают разную скорость.

===========
Хотя, возможно у Вас карта получше.
У меня MSI PCI-Ex GeForce GTX 1650 Ventus XS 4G OC 4GB GDDR5 (128bit) (1740/8000)
ChessMan вне форума   Ответить с цитированием
Старый 23.09.2019, 14:21   #4699
ChessMan
Super Moderator
 
Аватар для ChessMan
 
Регистрация: 04.01.2017
Сообщений: 3,629
Сказал(а) спасибо: 2,879
Поблагодарили 6,463 раз(а) в 2,331 сообщениях
Репутация: 354
По умолчанию Re: LCZero

Испробовал очень старую сеть, размерностью 20*256


E:\Engines\Lc0\lc0-v0.22.0-windows-cuda_Fp32 — копия>lc0.exe benchmark --max-collision-events=256 --minibatch-size=256 --backend=cudnn-fp16

Развернуть для просмотра

_
| _ | |
|_ |_ |_| v0.22.0 built Aug 5 2019
Found pb network file: ./093eb742d27cb725825ed4ec213a9a21a56c9a316c2a4773b116f54a4118ed06
Creating backend [cudnn-fp16]...
GPU: GeForce GTX 1650
GPU memory: 4 Gb
GPU clock frequency: 1740 MHz
GPU compute capability: 7.5
CUDA Runtime version: 10.0.0
Cudnn version: 7.4.2
Latest version of CUDA supported by the driver: 10.1.0
Benchmark time 37ms, 4 nodes, 108 nps, move g1f3
Benchmark time 52ms, 6 nodes, 115 nps, move d2d4
Benchmark time 68ms, 12 nodes, 176 nps, move g2g3
Benchmark time 100ms, 22 nodes, 220 nps, move g2g3
Benchmark time 131ms, 45 nodes, 343 nps, move g2g3
Benchmark time 163ms, 79 nodes, 484 nps, move g2g3
Benchmark time 195ms, 129 nodes, 661 nps, move g2g3
Benchmark time 230ms, 215 nodes, 934 nps, move g2g3
Benchmark time 250ms, 261 nodes, 1044 nps, move c2c4
Benchmark time 272ms, 317 nodes, 1165 nps, move g2g3
Benchmark time 300ms, 395 nodes, 1316 nps, move c2c4
Benchmark time 321ms, 472 nodes, 1470 nps, move c2c4
Benchmark time 410ms, 783 nodes, 1909 nps, move c2c4
Benchmark time 446ms, 901 nodes, 2020 nps, move c2c4
Benchmark time 486ms, 1036 nodes, 2131 nps, move c2c4
Benchmark time 571ms, 1345 nodes, 2355 nps, move c2c4
Benchmark time 655ms, 1647 nodes, 2514 nps, move c2c4
Benchmark time 741ms, 1964 nodes, 2650 nps, move c2c4
Benchmark time 787ms, 2124 nodes, 2698 nps, move g1f3
Benchmark time 882ms, 2496 nodes, 2829 nps, move g1f3
Benchmark time 1003ms, 2970 nodes, 2961 nps, move g1f3
Benchmark time 1060ms, 3222 nodes, 3039 nps, move g1f3
Benchmark time 1267ms, 4131 nodes, 3260 nps, move g1f3
Benchmark time 1492ms, 5174 nodes, 3467 nps, move g1f3
Benchmark time 1568ms, 5522 nodes, 3521 nps, move d2d4
Benchmark time 1643ms, 5849 nodes, 3559 nps, move d2d4
Benchmark time 2018ms, 7581 nodes, 3756 nps, move d2d4
Benchmark time 2168ms, 8316 nodes, 3835 nps, move d2d4
Benchmark time 2393ms, 9418 nodes, 3935 nps, move d2d4
Benchmark time 2618ms, 10503 nodes, 4011 nps, move d2d4
Benchmark time 2770ms, 11263 nodes, 4066 nps, move d2d4
Benchmark time 2919ms, 11982 nodes, 4104 nps, move d2d4
Benchmark time 2994ms, 12363 nodes, 4129 nps, move d2d4
Benchmark time 3146ms, 13120 nodes, 4170 nps, move d2d4
Benchmark time 3297ms, 13866 nodes, 4205 nps, move d2d4
Benchmark time 3447ms, 14626 nodes, 4243 nps, move d2d4
Benchmark time 3972ms, 17441 nodes, 4390 nps, move d2d4
Benchmark time 4123ms, 18237 nodes, 4423 nps, move d2d4
Benchmark time 4274ms, 19028 nodes, 4452 nps, move d2d4
Benchmark time 4499ms, 20196 nodes, 4488 nps, move g1f3
Benchmark time 5622ms, 25975 nodes, 4620 nps, move e2e4
Benchmark time 6969ms, 33076 nodes, 4746 nps, move e2e4
Benchmark time 8614ms, 41942 nodes, 4869 nps, move d2d4
Benchmark time 9289ms, 45486 nodes, 4896 nps, move d2d4
Benchmark time 9620ms, 47166 nodes, 4902 nps, move d2d4
bestmove d2d4
[свернуть]

Benchmark final time 9.74137s calculating 4894.38 nodes per second.
ChessMan вне форума   Ответить с цитированием
Старый 23.09.2019, 15:49   #4700
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от dew
В чем проблема? fp16 работает, но медленнее чем fp32
1060 не поддерживает fp16
а так называемая "работа" - это эмуляция
хватит троллить
Омегазеро вне форума   Ответить с цитированием
Старый 23.09.2019, 16:04   #4701
dew
Гроссмейстер
 
Аватар для dew
 
Регистрация: 21.02.2019
Сообщений: 1,206
Сказал(а) спасибо: 131
Поблагодарили 514 раз(а) в 368 сообщениях
Репутация: 62
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
1060 не поддерживает fp16
а так называемая "работа" - это эмуляция
хватит троллить
Какая еще эмуляция? если fp16 без всяких эмуляций при царе горохе еще с cuda 7.5 поддерживается, как минимум?

https://devblogs.nvidia.com/new-features-cuda-7-5/

Вам там плохо? Может помочь?

А пока просто сюда внимательно смотрите и читайте тоже вниматьно про быстродействие:

https://www.techpowerup.com/gpu-spec...060-6-gb.c2862

Повторюсь, внимательно:

FP16 (half) performance: 68.36 GFLOPS (1:64)

А я на первый раз Вам сделаю скидку, предположив, что не важно себя чувствуете или что-то в жизни случилось..
dew вне форума   Ответить с цитированием
Старый 23.09.2019, 16:20   #4702
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от dew
FP16 (half) performance: 68.36 GFLOPS (1:64)
А вас эта дробь не смущает?

При поддержке FP16 скорость была бы вдвое больше скорости FP32, то есть 8.6 TFLOPS, а не меньше в 64 раза
Омегазеро вне форума   Ответить с цитированием
Старый 23.09.2019, 16:26   #4703
dew
Гроссмейстер
 
Аватар для dew
 
Регистрация: 21.02.2019
Сообщений: 1,206
Сказал(а) спасибо: 131
Поблагодарили 514 раз(а) в 368 сообщениях
Репутация: 62
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
А вас эта дробь не смущает?

При поддержке FP16 скорость была бы вдвое больше скорости FP32, то есть 8.6 TFLOPS, а не меньше в 64 раза
А я об этом изначально и сказал (читайте выше с самого начала). А эмуляции там никой нет и не было - в двух словах медленно потому что логика gpu такова и больше на игровые нужды было направленно в маркетинговой стратегии на то время. И пожалуйста, если что сначала изучите материал прежде чем в оскорбления лезть. А лучше вообще не лезть.
dew вне форума   Ответить с цитированием
Старый 23.09.2019, 16:33   #4704
dew
Гроссмейстер
 
Аватар для dew
 
Регистрация: 21.02.2019
Сообщений: 1,206
Сказал(а) спасибо: 131
Поблагодарили 514 раз(а) в 368 сообщениях
Репутация: 62
По умолчанию Re: LCZero

А вообще - я ху.. фигею, дорогая редакция..
Вот у AMD во многих процессорах есть поддержка AVX..
Но вот какое дело, оно работает медленнее popcount SSE
С такой логикой можно так нагло и аппеляционно врубить - "А вот если бы была поддерка AVX, то она работала бы быстрее POPC!!!" А так все эмуляция, господа..
dew вне форума   Ответить с цитированием
Старый 23.09.2019, 16:35   #4705
Омегазеро
Гроссмейстер
 
Аватар для Омегазеро
 
Регистрация: 20.01.2019
Сообщений: 1,067
Сказал(а) спасибо: 2
Поблагодарили 701 раз(а) в 343 сообщениях
Репутация: 92
По умолчанию Re: LCZero

Цитата: Сообщение от dew
в двух словах медленно потому что логика gpu такова и больше на игровые нужды было направленно
в двух словах - если бы FP16 была реализована напрямую, то ее скорость была бы вдвое больше скорости FP32
Какая "напавленность на нужды" и "логика gpu" могла в 64 раза уменьшить скорость?
Омегазеро вне форума   Ответить с цитированием
Старый 23.09.2019, 16:46   #4706
dew
Гроссмейстер
 
Аватар для dew
 
Регистрация: 21.02.2019
Сообщений: 1,206
Сказал(а) спасибо: 131
Поблагодарили 514 раз(а) в 368 сообщениях
Репутация: 62
По умолчанию Re: LCZero

Цитата: Сообщение от Омегазеро
в двух словах - если бы FP16 была реализована напрямую
Вы меня, сейчас, ей богу утомите.. Что значит напрямую?
Я не буду долго поддерживать эту.. беседу?
Просто в двух словах объясню, а дальше, я надеюсь Вы почитаете побольше и поймете - как все на самом деле в деталях..
И так объяснение: даже в вашей карте нет никакой "реализации FP16 напрямую", просто ее схематехника(логика) такова, что она это делает быстрее.. Надеюсь, дальше Вы успокоитесь, перестанете провоцировать оскорблениями и внемлите моему совету..
dew вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
Maratka (10.05.2024), Александр (24.09.2019)
Старый 26.09.2019, 16:48   #4707
Kesandr
3 разряд
 
Аватар для Kesandr
 
Регистрация: 28.06.2018
Сообщений: 191
Сказал(а) спасибо: 239
Поблагодарили 87 раз(а) в 54 сообщениях
Репутация: 16
По умолчанию Re: LCZero

А есть где-то тесты сети 42872? И как она по сравнению с 42850?
Kesandr вне форума   Ответить с цитированием
Старый 26.09.2019, 18:01   #4708
Rom77
Мастер
 
Аватар для Rom77
 
Регистрация: 11.08.2017
Адрес: Киров
Сообщений: 912
Сказал(а) спасибо: 888
Поблагодарили 1,197 раз(а) в 632 сообщениях
Репутация: 132
По умолчанию Re: LCZero

Цитата: Сообщение от Kesandr
А есть где-то тесты сети 42872? И как она по сравнению с 42850?
Хуже
Rom77 вне форума   Ответить с цитированием
Пользователь сказал cпасибо:
Alvir (26.09.2019)
Старый 28.09.2019, 10:15   #4709
svoitsl
Гроссмейстер
 
Аватар для svoitsl
 
Регистрация: 19.04.2017
Сообщений: 4,734
Сказал(а) спасибо: 1,204
Поблагодарили 2,853 раз(а) в 1,885 сообщениях
Репутация: 159
По умолчанию Re: LCZero

По слухам новая сеть T60 уже достигла SF7,к сожалению в собщении не приводится на каком CPU играл SF7, но подозреваю что мог быть перекос скорости (Не уверен, что даже какой нибудь i9 может на равных играть с RTX2080)
svoitsl вне форума   Ответить с цитированием
2 пользователя(ей) сказали cпасибо:
Kesandr (28.09.2019), sovaz1997 (28.09.2019)
Старый 28.09.2019, 10:59   #4710
Kesandr
3 разряд
 
Аватар для Kesandr
 
Регистрация: 28.06.2018
Сообщений: 191
Сказал(а) спасибо: 239
Поблагодарили 87 раз(а) в 54 сообщениях
Репутация: 16
По умолчанию Re: LCZero

А по темпам по сравнению с сетью 40ххх кто быстрее идет? По памяти мне кажется т40 за такой примерно период времени сильнее играла. Но это не точно)
Kesandr вне форума   Ответить с цитированием
Ответ


Здесь присутствуют: 2 (пользователей: 0 , гостей: 2)
 

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 12:43. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.7
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
Рейтинг@Mail.ru