Intel ha svelato diverse novità all’evento Intel Vision, tra cui il chip Gaudi 3 per l’IA aziendale, una strategia per sistemi di intelligenza artificiale aperti e un portafoglio di soluzioni per accelerare l’adozione dell’IA.
In occasione dell’evento Intel Vision, tenutosi lo scorso martedì pomeriggio (9 aprile), Intel ha annunciato una serie di novità, come la strategia per i sistemi di intelligenza artificiale aperti e il chip Gaudi 3 per l’AI aziendale.
L’azienda ha inoltre svelato nuovi clienti e partner per il suo acceleratore e ha presentato un portafoglio di soluzioni aziendali per accelerare la distribuzione di software e servizi.
Intel Gaudi 3
Intel Gaudi 3 è un acceleratore che alimenterà sistemi di intelligenza artificiale con decine di migliaia di acceleratori. Questi sono collegati tramite il comune standard Ethernet. Secondo Intel, Gaudi 3 offre un’elaborazione AI quattro volte superiore per BF16 e un aumento di 1,5 volte della larghezza di banda della memoria rispetto al suo predecessore.
Le statistiche sulle prestazioni rilasciate dall’azienda mostrano anche un aumento del 50% delle prestazioni rispetto a NVIDIA H100 in media, nonché un aumento del 40% rispetto al concorrente in termini di efficienza energetica media di inferenza tra i parametri Llama 7B e 70B e i modelli Falcon 180B.
Il componente fornisce un software aperto e basato sulla comunità, oltre a una rete Ethernet standard. Sarà disponibile per produttori come Dell Technologies, HPE, Lenovo e Supermicro e si prevede che sarà disponibile nel secondo trimestre del 2024.
Ecosistema aperto
Un’altra novità è la strategia di Intel per i sistemi di intelligenza artificiale aperti e scalabili. Questo nuovo approccio è pensato per consentire soluzioni da un ecosistema aperto di protagonisti in grado di soddisfare le esigenze dell’IA generativa utilizzata dalle aziende.
La pianificazione comprende produttori di apparecchiature, fornitori di database, integratori di sistemi, fornitori di software e servizi. Le aziende potranno comunque utilizzare partner e soluzioni dell’ecosistema conosciuti e fidati. Tra i clienti aziendali che implementeranno l’acceleratore per applicazioni di IA generativa ci sono organizzazioni come NAVER, Bosch, IBM, Ola/Krutrim, Advent International/NielsenIQ, Seekr, IFF, CtrlS Group, Bharti Airtel, Landing AI, Roboflow e Infosys.
Intel collaborerà anche con Google Cloud, Thales e Cohesity per sfruttare le sue risorse di calcolo riservate nelle istanze cloud di queste aziende. L’elenco comprende le Intel Trust Domain Extensions (Intel TDX), le Intel Software Guard Extensions (Intel SGX) e il suo servizio di attestazione.
Ampliamento della roadmap
L’azienda ha annunciato aggiornamenti sui suoi prodotti e servizi di prossima generazione nel settore. Una delle introduzioni è rappresentata dai nuovi processori Intel Xeon 6, che si concentrano sulla fornitura di prestazioni per l’esecuzione di soluzioni GenAI attuali, come RAG, per risultati aziendali specifici utilizzando dati proprietari.
Le CPU dispongono di core efficienti (E-cores), i Sierra Forest, o di core ad alte prestazioni (P-cores, chiamati Granite Rapids). Il primo offre prestazioni per watt 2,4 volte superiori e una densità di rack 2,7 volte superiore rispetto agli Intel Xeon di seconda generazione. Il secondo offre il supporto software per il formato dati MXFP4, che riduce la latenza del token successivo fino a 6,5 volte rispetto ai processori Intel Xeon di quarta generazione che utilizzano FP16.
Infine, è stato presentato il portafoglio Intel Tiber. Si tratta di soluzioni aziendali che mirano ad accelerare l’implementazione di software e servizi aziendali, compresa l’IA generativa. I clienti possono già iniziare a esplorare la libreria, con il lancio previsto per il terzo trimestre del 2024.