GPU NVIDIA Ampere A100 250W TDP en PCIe 4.0 Creat per a IA, ciència de dades i supercomputació llançat amb un rendiment promès del 90% del model de 400W

Maquinari / GPU NVIDIA Ampere A100 250W TDP en PCIe 4.0 Creat per a IA, ciència de dades i supercomputació llançat amb un rendiment promès del 90% del model de 400W 2 minuts de lectura

Nvidia



NVIDIA ha llançat oficialment l'A100, una GPU compatible amb PCIe 4.0 basada en l'arquitectura Ampere de nova generació. Tot i que presenta un perfil TDP inferior a 250 W, NVIDIA promet que la GPU PCIe 4.0 Ampere A100 podrà oferir fins al 90 per cent del rendiment de la GPU A100 HGX de 400 W completa. La tercera variant de la seva creixent família de GPU Ampere A100, l’A100 PCIe, està pensada per a servidors que utilitzen clústers d’Intel·ligència Artificial (IA), Data Science i Supercomputing.

NVIDIA va revelar una variant PCI-Express 4.0 de la GPU A100. La GPU es basa en la microarquitectura Ampere de 7 nm. A més, la companyia també va anunciar diversos sistemes alimentats per A100 de fabricants de servidors líders, inclosos Asus, Dell, Cisco, Lenovo i molt més. L’accelerador GPU A100 PCIe 4.0 de 250 W és força similar a la variant TDP completa de 400 W, i NVIDIA també promet un rendiment gairebé idèntic malgrat la caiguda significativa del perfil TDP.



GPU NVIDIA A100 Ampere en factor de forma PCIe 4.0 amb la mateixa configuració de la GPU A100 HGX 400W, però a 250W:

NVIDIA ha anunciat el seu accelerador PCIe 4.0 A100 PCIe GPU. La GPU Ampere està disponible per a un conjunt divers de casos d’ús industrials amb sistemes que van des d’una sola GPU PCIe A100 fins a servidors que utilitzen dues targetes alhora a través dels 12 canals NVLINK que ofereixen un total de 600 GB / s d’amplada de banda d’interconnexió. L’accelerador de la GPU PCIe TDP A100 de 250W no canvia gaire en termes de configuració bàsica en comparació amb la GPU A100 HGX de 400W



La GPU GA100 té les especificacions de la variant A100 HGX de 400W amb 6912 nuclis CUDA distribuïts en 108 unitats SM, 432 nuclis tensors i 40 GB de memòria HBM2 que proporciona el mateix ample de banda de memòria de 1,55 TB / s (arrodonit a 1,6 TB / s). Tanmateix, desplegant el paquet GPU al Estàndard PCIe 4.0 tenia el seu propi inconvenient de reduir significativament el TDP. Segons els informes, això significa una penalització del rendiment del 10 al 50 per cent en funció de la càrrega de treball. A més, la variant TDP de 250W de la GPU A100 és més adequada per a ràfegues curtes que per a càrregues sostingudes.

GPU NVIDIA A100 Ampere en rendiment de factor de forma PCIe 4.0:

A causa de la reducció significativa del perfil TDP, es podria suposar que la targeta tindria rellotges més baixos per compensar la menor entrada TDP. Tot i això, les mètriques de rendiment que ha llançat NVIDIA són realment sorprenents, ja que s’acosten força a la variant TDP de 400W. El rendiment FP64 encara es valora en 9,7 / 19,5 TFLOPs, el rendiment FP32 es valora en 19,5 / 156/312 TFLOPs (Sparsity), el rendiment FP16 es valora en 312/624 TFLOPs (Sparsity) i INT8 amb 624/1248 TOPs ( Sparsity).



Les matemàtiques senzilles indiquen, i NVIDIA assegura, que la GPU PCIe 4.0 250W A100 basada en Ampere pot oferir el 90% del rendiment de la targeta A100 HGX (400W) en aplicacions de servidor més importants. Això és justificable perquè la nova variant triga menys a completar les tasques esmentades. Tanmateix, els números han de ser vàlids només per a intervals curts. En situacions complexes que requereixen capacitats de GPU sostingudes, la GPU PCIe 4.0 de 250W pot oferir des de fins a un 90% fins a un 50% el rendiment de la GPU A100 HGX de 400W.

La microarquitectura d’Ampere segur que beneficiarà el nou A100. NVIDIA promet almenys un augment de rendiment de 20X respecte al predecessor basat en Volta. La GPU PCIe 4.0 A100 compta amb tecnologia de GPU de diverses instàncies. Això significa que un sol A100 es pot particionar en fins a set GPU separades per gestionar diferents tasques informàtiques. Tot i que això augmenta la segmentació, hi ha NVLink de tercera generació, que permet unir diverses GPU en una sola GPU gegant.

Etiquetes nvidia