PC & HW

NVIDIA H200: la nuova GPU Tensor Core con HBM3e per l’AI

13 Novembre 2023

Con l’introduzione della nuova GPU NVIDIA H200 basata sull’architettura Hopper e l’annuncio del supercomputer JUPITER, la big tech segna un significativo progresso nella tecnologia di intelligenza artificiale e calcolo ad alte prestazioni.

NVIDIA ha annunciato un importante avanzamento tecnologico con la presentazione della sua nuova GPU Tensor Core H200, parte integrante della recentemente lanciata piattaforma HGX H200, basata sull’innovativa architettura NVIDIA Hopper. Questa nuova GPU rappresenta un salto qualitativo nel mondo delle accelerazioni hardware, essendo la prima a offrire HBM3e, una memoria più grande e più veloce focalizzata sull’accelerazione dell’intelligenza artificiale generativa e dei modelli linguistici di grandi dimensioni.

La tecnologia HBM3e non solo migliora l’AI generativa, ma è anche fondamentale per il calcolo scientifico nei carichi di lavoro HPC (High-Performance Computing), offrendo 141 GB di memoria a una velocità impressionante di 4,8 TB/s. Questo rappresenta quasi il doppio della capacità e una larghezza di banda 2,4 volte superiore rispetto al suo predecessore, il NVIDIA A100.

La NVIDIA H200 sarà disponibile in due formati. Il primo formato comprende le schede server NVIDIA HGX H200 in configurazioni a quattro e otto vie, con quest’ultima che offre oltre 32 petaflop di elaborazione FP8 per il deep learning e 1,1 TB di memoria aggregata ad alta larghezza di banda. Il secondo formato è il superchip NVIDIA GH200 Grace Hopper con HBM3e, annunciato nell’agosto di quest’anno.

L’obiettivo di NVIDIA è che l’H200 possa equipaggiare qualsiasi tipo di data center, sia esso on-premises, cloud, hybrid cloud o edge. Inoltre, i partner NVIDIA avranno la possibilità di aggiornare i loro sistemi basati su H100 con quelli dotati della GPU più recente.

Un altro sviluppo significativo di NVIDIA è il debutto della configurazione quad-nodo del NVIDIA GH200 Grace Hopper Superchip nel supercomputer JUPITER. Questo sistema, ospitato presso il Forschungszentrum Jülich in Germania, è stato realizzato in collaborazione tra NVIDIA, ParTec, Eviden e SiPearl. JUPITER è destinato ad accelerare la creazione di modelli fondamentali di intelligenza artificiale in vari campi, tra cui la ricerca climatica e meteorologica, la scienza dei materiali, la scoperta di farmaci, l’ingegneria industriale e l’informatica quantistica.

La configurazione quadrupla di GH200 in JUPITER presenta un’architettura a nodi con 288 core Arm Neoverse, raggiungendo 16 petaflop di prestazioni AI e consumando fino a 2,3 TB di memoria ad alta velocità. È presente anche una connessione NVIDIA NVLink individuale per ogni GH200.

Infine, la NVIDIA H200 sarà disponibile per la vendita attraverso produttori di sistemi globali e fornitori di servizi cloud a partire dal secondo trimestre del 2024. L’installazione del sistema JUPITER è prevista per il prossimo anno, sebbene non sia stata fissata una data specifica.

Fonte