Google presenta Veo e Imagen 3, due nuovi strumenti AI per la creazione di video 1080p “di alta qualità” e immagini “fotorealistiche”.
All’evento Google I/O si parla sempre di intelligenza artificiale (AI)! Oggi Google ha annunciato i suoi nuovi motori di creazione multimediale AI: Veo, in grado di produrre video a 1080p di “alta qualità”, e Imagen 3, il suo ultimo framework per la creazione di testi e immagini. Nessuno dei due sembra particolarmente rivoluzionario, ma sono un modo per Google di continuare a contrastare Sora di OpenAI e Dall-E 3, uno strumento che è praticamente diventato sinonimo di immagini generate dall’intelligenza artificiale.
Google sostiene che Veo ha “una comprensione avanzata del linguaggio naturale e della semantica visiva” per creare qualsiasi video abbiate in mente. I video generati dall’IA possono durare “oltre un minuto”. Veo è anche in grado di comprendere tecniche cinematografiche e visive, come il concetto di timelapse.
Per dimostrare che Veo non vuole rubare il lavoro agli artisti, Google ha collaborato con Donald Glover e Gilga, il suo studio creativo, per mostrare le capacità del modello. In un brevissimo video promozionale, vediamo Glover e la sua squadra usare il testo per creare il video di una decappottabile che arriva in una casa e di una barca a vela che naviga nell’oceano. Secondo Google, Veo è in grado di simulare la fisica del mondo reale meglio dei modelli precedenti e ha anche migliorato il rendering dei filmati ad alta definizione.
Resta da vedere se qualcuno vorrà davvero guardare i video generati dall’intelligenza artificiale, al di là della morbosa curiosità di vedere una macchina che tenta di ricreare algoritmicamente il lavoro di artisti umani. Ma questo non impedisce a Google o a OpenAI di promuovere questi strumenti e di sperare che siano utili. Veo sarà disponibile da oggi all’interno dello strumento VideoFX di Google per alcuni creator, e l’azienda afferma che arriverà anche su YouTube Shorts e altri prodotti. Se Veo diventerà parte integrante di YouTube Shorts, sarà almeno una caratteristica che Google potrà vantare rispetto a TikTok.
Per quanto riguarda Imagen 3, Google fa le solite promesse: si dice che sia il modello text-to-image di “altissima qualità” dell’azienda, con un “incredibile livello di dettaglio” per “immagini fotorealistiche e realistiche” e meno artefatti. Il vero test, naturalmente, sarà vedere come gestisce le richieste rispetto a Dall-E 3. Imagen 3 gestisce il testo meglio di prima, dice Google, ed è anche più intelligente nel gestire i dettagli delle richieste lunghe.
Google sta inoltre collaborando con artisti discografici come Wyclef Jean e Bjorn per testare la sua Music AI Sandbox, un insieme di strumenti che possono aiutare a creare canzoni e ritmi. Ne abbiamo visto solo un breve assaggio, ma ha portato ad alcune demo intriganti, come potete vedere nel video sopra.