Google ha rilasciato Gemini 1.5 Flash-8B, un modello di IA che raddoppia la velocità e dimezza i costi, ideale per gestire grandi volumi di attività semplici.

Google ha annunciato il rilascio di Gemini 1.5 Flash-8B, una versione aggiornata del suo modello di intelligenza artificiale, ottimizzato per garantire maggiore velocità ed efficienza. La nuova iterazione è ora pronta per l’uso in produzione, portando un ulteriore progresso nell’ambito delle prestazioni e dell’accessibilità per gli sviluppatori.

Secondo Logan Kilpatrick e Shrestha Basu Mallick, membri del team Gemini di Google, Flash-8B offre diversi miglioramenti rispetto a Gemini 1.5 Flash. Tra i principali vantaggi figurano una riduzione del 50% dei costi, un raddoppio dei limiti di velocità e una diminuzione della latenza, soprattutto nei casi di prompt brevi.

Gemini 1.5 Flash-8B è il frutto di mesi di perfezionamento portato avanti da Google DeepMind, che ha ascoltato il feedback degli sviluppatori e sottoposto il modello a continui test. Pur essendo un modello di dimensioni ridotte, riesce comunque a mantenere prestazioni simili a quelle della versione lanciata a maggio, rivelandosi particolarmente efficace in compiti come la chat, la trascrizione e la traduzione linguistica di testi lunghi.

Un aspetto particolarmente interessante di Flash-8B è il suo “costo per intelligenza”, il più basso di tutti i modelli della gamma Gemini. Google ha stabilito tariffe competitive: $0,0375 per milione di token in input e $0,15 per milione di token in output per prompt sotto i 128K, offrendo ulteriori sconti per quelli memorizzati nella cache.

google rilascia gemini 1.5 flash 8b più veloce, costi dimezzati 1

Per incentivare l’adozione di questo modello, l’azienda ha raddoppiato i limiti di velocità, consentendo fino a 4.000 richieste al minuto, il che rende Flash-8B particolarmente adatto per gestire grandi volumi di attività semplici.

Gli sviluppatori possono accedere gratuitamente a Gemini 1.5 Flash-8B tramite Google AI Studio e l’API Gemini, mentre la fatturazione per gli utenti a pagamento inizierà il 14 ottobre.

Articolo precedenteApple rilascia iOS 18.0.1, macOS 15.0.1 e watchOS: bug fix
Articolo successivoiPhone SE 4 integrerà il primo modem 5G di Apple
Carolina Napolano
La tecnologia, roba da donne: ecco la blogger per promuovere il lato rosa della tecnologia.