Nvidia Tesla V100s oficjalnie. Najpotężniejszy akcelerator świata stał się jeszcze szybszy
Nvidia przedstawiła nowy wariant swojego flagowego akceleratora z rodziny Tesla. Model V100s, bo o nim tu mowa, charakteryzuje się identyczną specyfikacją jak dotychczasowy lider, V100, ale ma wyższe turbo i usprawniony podsystem pamięci. Producent obiecuje wzrost wydajności obliczeniowej na poziomie 17 proc., działając w obrębie niezmienionego budżetu energetycznego.
Tesla V100s bazuje na czipie Volta GV100, wytwarzanym w procesie litograficznym klasy 12 nm FFN z 21,1 mld tranzystorów, na powierzchni 815 mm². Tym samym konsekwentnie pozostaje największym procesorem graficznym na świecie.
Układ ten zawiera: 5120 jednostek CUDA FP32, 2560 CUDA FP64 oraz 320 jednostek teksturujących, a ponadto aż 6144 KB wbudowanej pamięci L2. Ale te liczby znamy już od czasów Tesli V100. Co zatem zmienia V100s? Otóż podbija częstotliwość turbo z 1380 MHz do 1601 MHz, a także przepustowość 16 GB pamięci HBM2 z 900 GB/s do 1134 GB/s.
Tym sposobem teoretyczna wydajność w obliczeniach zmiennoprzecinkowych połowicznej precyzji (FP16), kluczowych w przypadku AI, wzrasta z 28 TFLOPs do bagatela 32,8 TFLOPs.
Co ciekawe, niezmienne pozostaje TDP, równe 250 W. I to samo, jak podaje Nvidia, ma się tyczyć zużycia energii. Najprawdopodobniej układy przeznaczone do zastosowania w modelu V100s są odpowiednio selekcjonowane, aby uzyskać wyższe taktowanie bez zmiany napięć.
Jest jednak pewne obostrzenie: podczas gdy Tesla V100 dostępna jest zarówno w formacie PCI Express, jak i SMX2 (NV Link), V100s przewidziano tylko dla PCIe.
Cena nie została ujawniona, jednak tanio z pewnością nie będzie. Regularny model w wariancie PCIe kosztuje w Polsce blisko 39 tys. zł. Trudno oczekiwać, by V100s była tańsza. Z tym że – aby była jasność – w realiach centrów danych i farm obliczeniowych, gdzie adresowana jest seria Tesla, sumy te nie są jakoś wybitnie astronomiczne. Są raczej typowe.