OpenAI presenta Voice Engine, un sistema di clonazione vocale che genera discorsi realistici da campioni audio. Scopri le sue potenziali applicazioni e i rischi associati, come i deepfake.
OpenAI ha svelato Voice Engine, un avanzato strumento di clonazione vocale capace di riprodurre qualsiasi voce umana analizzando un breve campione audio di appena 15 secondi. L’azienda descrive la tecnologia come produttrice di “discorsi dal suono naturale” con “voci emotive e realistiche”, basandosi sull’API text-to-speech preesistente e in sviluppo dal 2022.
Lo strumento promette applicazioni innovative nell’assistenza alla lettura, nella traduzione linguistica e nel supporto a chi è affetto da patologie improvvise o degenerative del linguaggio. Ad esempio, OpenAI ha menzionato un programma pilota della Brown University che ha impiegato questa tecnologia per aiutare un paziente con difficoltà di linguaggio, evidenziando il potenziale umanitario di Voice Engine.
L’entusiasmo per le capacità di Voice Engine è però accompagnato da preoccupazioni legate ai rischi di abuso, in particolare riguardo alla creazione di deepfake vocali. In una crescente sofisticazione delle tecnologie di manipolazione digitale, il potenziale per l’uso malevolo di strumenti come Voice Engine solleva allarmi seri, specialmente in contesti sensibili come le campagne elettorali.
OpenAI è consapevole di questi rischi e ha affermato di aver consultato una vasta gamma di partner internazionali, tra cui governi, media e settore educativo, per lanciare il prodotto con le dovute precauzioni. Le misure di sicurezza includono watermarking audio per tracciare l’origine delle registrazioni e un monitoraggio proattivo dell’uso del sistema. Sarà inoltre introdotta una “lista di voci non consentite” per prevenire l’imitazione di figure pubbliche senza autorizzazione.
OpenAI non ha ancora annunciato una data ufficiale di lancio. Tuttavia, i dettagli sui prezzi potenziali suggeriscono che sarà più accessibile rispetto a soluzioni concorrenti, con un costo di 15 dollari per un milione di caratteri. Questo rende Voice Engine un’opzione economicamente vantaggiosa per la produzione di audiolibri e altri contenuti vocali.
L’annuncio di Voice Engine arriva in un momento di intensa attività per OpenAI, che ha anche rivelato una partnership con Microsoft per lo sviluppo di un supercomputer AI chiamato “Stargate”, con un investimento previsto di 100 miliardi di dollari.