Google ha svelato nuove funzionalità basate sull’intelligenza artificiale per Android durante l’I/O 2024, tra cui miglioramenti a Cerchia e Cerca, l’introduzione di Gemini e l’arrivo di Gemini Nano con modalità multimodale.
All’evento Google I/O 2024, l’azienda ha annunciato le novità che porterà al suo portafoglio di servizi e prodotti Android, tra cui miglioramenti a Cerchia e Cerca, l’introduzione di Gemini e l’arrivo di Gemini Nano con modalità multimodale.
Nuove funzioni per Cerchia e Cerca
Cerchia e Cerca è integrato direttamente nell’esperienza utente di alcuni telefoni, come il Pixel 8 Pro e il Galaxy S24. Con questo strumento è possibile cercare qualsiasi cosa si veda sullo schermo con un semplice gesto “circolare”, senza dover interrompere l’attività o passare a un’altra app.
Ora questo strumento può aiutare gli studenti a fare i compiti. Invece di generare semplici risposte, la funzione cercherà di fornire una maggiore comprensione dell’argomento. Cerchiando una domanda su cui non si è sicuri, gli studenti riceveranno istruzioni passo-passo per risolvere i quesiti di fisica e matematica con affermazioni.
Più avanti nel corso dell’anno, Cerchia e Cerca riceverà anche la capacità di risolvere problemi più complessi, tra cui formule, diagrammi, grafici e molto altro. Google sostiene che questa funzionalità si basa sul suo grande modello linguistico “LearnLM”.
Gemini per Android
Progettata come sostituto di Google Assistant, l’app Gemini per Android rappresenta un nuovo modo di utilizzare l’intelligenza artificiale sugli smartphone. Lo strumento potrà presto essere visualizzato in un “foglio” nella parte inferiore dello schermo, in modo che l’utente possa continuare a svolgere le proprie attività mentre parla con l’IA.
In questo modo sarà possibile trascinare delle immagini generate in Gmail, Google Messaggi e altre app direttamente sul foglio Gemini, in modo che l’assistente virtuale possa trovare informazioni correlate o porre domande sul materiale. Ci sarà anche una funzione per trovare informazioni nei video di YouTube.
Per gli utenti che si abbonano a Gemini Advanced – una versione a pagamento dell’IA che costa 20 dollari al mese – ci sarà anche un’opzione chiamata “Chiedi informazioni su questo PDF” per ottenere informazioni sul contenuto dei documenti PDF. Secondo l’azienda, l’aggiornamento sarà distribuito a “milioni di dispositivi nei prossimi mesi”.
Gemini Nano sarà multimodale su Android
Gemini Nano è la versione più efficiente del modello di intelligenza artificiale di Google. Date le sue dimensioni “compatte”, è in grado di funzionare direttamente sull’hardware dello smartphone ed è già disponibile sul Pixel 8 Pro. Ora l’azienda annuncia un’importante spinta per questo strumento con il lancio di “Gemini Nano with Multimodality”. La funzione consentirà al modello di intelligenza artificiale di interpretare altre forme di input, come immagini, suoni e linguaggio parlato, oltre al testo. Google afferma che queste esperienze dovrebbero “mantenere le vostre informazioni completamente private”, ribadendo che la funzione non richiederà internet.
Questa funzione dovrebbe essere disponibile quest’anno “a partire dal Pixel”, il che suggerisce che i telefoni del brand saranno i primi. Le funzioni multimodali del Gemini Nano arriveranno a TalkBack, per aiutare gli utenti affetti da cecità o ipovisione. Con la nuova funzione, le immagini non etichettate saranno descritte dal telefono in base ai dettagli percepiti dall’intelligenza artificiale. Ad esempio, sarà in grado di descrivere immagini di vestiti con dettagli su colore, stile e taglio.
Avvisi per sospette truffe con chiamate vocali
Google sta sperimentando una funzione di Gemini Nano che fornisce avvisi in tempo reale durante una telefonata se rileva schemi di conversazione sospetti. Ad esempio, se un presunto rappresentante di una banca chiede all’utente di trasferire urgentemente del denaro, di effettuare un pagamento con una carta regalo o di richiedere informazioni personali, come numeri di carte e password, il sistema operativo visualizzerà un avviso lampeggiante sullo schermo per informare l’utente della presunta truffa.
L’azienda sottolinea che tutta l’elaborazione avverrà direttamente sull’hardware del dispositivo, per cui il contenuto rimarrà privato. La funzione sarà facoltativa. Google afferma che condividerà ulteriori dettagli sugli avvisi nel corso dell’anno.
Le nuove funzioni annunciate durante l’evento I/O 2024 dovrebbero essere disponibili per tutti gli utenti Android. Google afferma che mercoledì 15 maggio rivelerà informazioni su Android 15, la prossima versione del sistema operativo.