Google presenta Veo e Imagen 3, due nuovi strumenti AI per la creazione di video 1080p “di alta qualità” e immagini “fotorealistiche”.

All’evento Google I/O si parla sempre di intelligenza artificiale (AI)! Oggi Google ha annunciato i suoi nuovi motori di creazione multimediale AI: Veo, in grado di produrre video a 1080p di “alta qualità”, e Imagen 3, il suo ultimo framework per la creazione di testi e immagini. Nessuno dei due sembra particolarmente rivoluzionario, ma sono un modo per Google di continuare a contrastare Sora di OpenAI e Dall-E 3, uno strumento che è praticamente diventato sinonimo di immagini generate dall’intelligenza artificiale.

Google sostiene che Veo ha “una comprensione avanzata del linguaggio naturale e della semantica visiva” per creare qualsiasi video abbiate in mente. I video generati dall’IA possono durare “oltre un minuto”. Veo è anche in grado di comprendere tecniche cinematografiche e visive, come il concetto di timelapse.

Per dimostrare che Veo non vuole rubare il lavoro agli artisti, Google ha collaborato con Donald Glover e Gilga, il suo studio creativo, per mostrare le capacità del modello. In un brevissimo video promozionale, vediamo Glover e la sua squadra usare il testo per creare il video di una decappottabile che arriva in una casa e di una barca a vela che naviga nell’oceano. Secondo Google, Veo è in grado di simulare la fisica del mondo reale meglio dei modelli precedenti e ha anche migliorato il rendering dei filmati ad alta definizione.

Resta da vedere se qualcuno vorrà davvero guardare i video generati dall’intelligenza artificiale, al di là della morbosa curiosità di vedere una macchina che tenta di ricreare algoritmicamente il lavoro di artisti umani. Ma questo non impedisce a Google o a OpenAI di promuovere questi strumenti e di sperare che siano utili. Veo sarà disponibile da oggi all’interno dello strumento VideoFX di Google per alcuni creator, e l’azienda afferma che arriverà anche su YouTube Shorts e altri prodotti. Se Veo diventerà parte integrante di YouTube Shorts, sarà almeno una caratteristica che Google potrà vantare rispetto a TikTok.

Per quanto riguarda Imagen 3, Google fa le solite promesse: si dice che sia il modello text-to-image di “altissima qualità” dell’azienda, con un “incredibile livello di dettaglio” per “immagini fotorealistiche e realistiche” e meno artefatti. Il vero test, naturalmente, sarà vedere come gestisce le richieste rispetto a Dall-E 3. Imagen 3 gestisce il testo meglio di prima, dice Google, ed è anche più intelligente nel gestire i dettagli delle richieste lunghe.

Google sta inoltre collaborando con artisti discografici come Wyclef Jean e Bjorn per testare la sua Music AI Sandbox, un insieme di strumenti che possono aiutare a creare canzoni e ritmi. Ne abbiamo visto solo un breve assaggio, ma ha portato ad alcune demo intriganti, come potete vedere nel video sopra.

Articolo precedenteGoogle svela Gemini 1.5 Flash, l’AI più veloce ed efficiente
Articolo successivoGoogle I/O: Project Astra l’AI per la vita di tutti i giorni
Team CEOTECH
La tecnologia dovrebbe arricchire la vita delle persone oltre a tutelare il pianeta.