Rywal układu Tesla A100 od Nvidii z ChRL? Baidu prezentuje Kunlun II
Kunlun Chip poinformowała w tym tygodniu, że rozpoczęła masową produkcję swojego procesora Kunlun II do zastosowań SI.
Baidu w czerwcu br. przekształcił swoją działalność w zakresie projektowania półprzewodników w niezależną firmę Kunlun Chip Technology Co i wycenia ją na blisko 2 mld. USD.
Nowy chip został oparty na mikroarchitekturze XPU drugiej generacji i jest wykonany w 7 nm litografii. Chińczycy obiecują podwojenie lub nawet potrojenie wydajności w stosunku do poprzednika. Mowa tutaj chipie Kunlun K200 zaprojektowanym do zastosowań chmurowych, obliczeń brzegowych i do użycia w pojazdach autonomicznych. Ogłoszony trzy lata temu układ oferuje 256 TOPS wydajności w operacjach INT8, około 64 TOPS w INT/FP16 i 16 TOPS w INT/FP32 przy 150 watach. Układy są aktualnie wykorzystywane w chmurowych centrach danych Baidu oraz w platformie pojazdów autonomicznych Apolong.
Jeśli twierdzenia o około 2-3 razy wyższej wydajności układu Kunlun II w stosunku do poprzednika są realne, to nowy układ może zapewnić 512 - 768 TOPS w operacjach INT8, 128 – 192 TOPS w INT/FP16 oraz 32 – 48 TOPS w INT/FP32. Zmianie w stosunku do poprzednika nie uległ podsystem pamięci graficznej obejmujący dwa pakiety pamięci typu HBM o przepustowości 512 GB/s. Dla porównania Tesla A100 Nvidii oferuje 19,5 TFLOPS w obliczeniach FP32 i pomiędzy 624/1248 TOPS w INT8.
Wynika to z tego, że Kunlun II będzie miał jakieś szanse konkurować z Nvidią tylko w przypadku obliczeń związanych tylko ze sztuczną inteligencją. Warto jednak zaznaczyć, że porównywanie wydajności różnych układów w obliczeniach SI jest trudne, ponieważ wiele zależy od oprogramowania.