Google annuncia Gemini 1.5 Flash, un nuovo modello AI più leggero e conveniente del potente Gemini 1.5 Pro, ideale per applicazioni di sintesi, chat, didascalie e analisi di testo.
Durante il Google I/O, la conferenza annuale per sviluppatori, Big G ha rivelato l’ultimo aggiornamento della sua serie di modelli di intelligenza artificiale denominata Gemini. È stato presentato un nuovo modello, Gemini 1.5 Flash, che, secondo quanto riferito da Google, è stato migliorato per essere più veloce ed efficiente.
“Gemini 1.5 Flash eccelle nella sintesi, nelle applicazioni di chat, nelle didascalie di immagini e video, nell’estrazione di dati da lunghi documenti e tabelle e altro ancora”, ha scritto Demis Hassabis, CEO di Google DeepMind, in un post sul blog. Hassabis ha aggiunto che Google ha creato il nuovo modello di AI perché gli sviluppatori avevano bisogno di un modello più leggero e meno costoso della versione Pro, che Google ha annunciato a febbraio. Gemini 1.5 Pro è più efficiente e potente del modello Gemini originale annunciato l’anno scorso.
Gemini 1.5 Flash si posiziona nella gamma di modelli di Google tra Gemini 1.5 Pro e il più compatto Gemini 1.5 Nano, che funziona direttamente sui dispositivi locali. Pur essendo più leggero del modello Pro, il modello Flash mantiene la stessa potenza. Google ha spiegato che ciò è stato possibile attraverso un metodo denominato “distillazione“, per il quale le competenze principali del modello Pro sono state concentrate nel modello più ridotto.
Di conseguenza, Gemini 1.5 Flash possiede le stesse capacità multimodali del Pro e una vasta finestra di contesto di un milione di token, il che gli permette di processare fino a 1.500 pagine di documenti o oltre 30.000 righe di codice in un’unica sessione. Questo modello, secondo Google, offre un modo più rapido ed economico per gli sviluppatori di sviluppare nuovi prodotti e servizi AI.
In aggiunta al debutto di Gemini 1.5 Flash, Google ha anche migliorato Gemini 1.5 Pro, potenziando le sue funzionalità di scrittura di codice, di ragionamento e di analisi di audio e immagini. Un ulteriore importante aggiornamento, previsto per quest’anno, raddoppierà la finestra di contesto del modello a due milioni di token, permettendo al modello di gestire due ore di video o 22 ore di audio, 60.000 righe di codice o oltre 1,4 milioni di parole.
Gemini 1.5 Flash e Pro sono ora accessibili in anteprima pubblica su Google AI Studio e Vertex AI. Oggi, Google ha anche lanciato una nuova versione del suo modello open source, chiamata Gemma 2. Questi aggiornamenti, tuttavia, sono principalmente rivolti a sviluppatori e tecnici appassionati, piuttosto che al grande pubblico.