Qualcomm ha appena dimostrato un significativo progresso nella tecnologia Stable Diffusion, un modello di intelligenza artificiale (IA) addestrato su una vasta scala di dati in grado di generare immagini dal testo. Per la prima volta, l’azienda ha mostrato che questa tecnologia funziona in modo nativo in uno smartphone con Snapdragon 8 Gen 2, rinunciando all’elaborazione in cloud.
Stable Diffusion è stata dimostrata per la prima volta su un telefono Android con processore Snapdragon 8 Gen 2. Il video che segue mostra l’effettiva acquisizione di un dispositivo che genera l’immagine di un “gatto con armatura” in meno di 15 secondi.
Per dimostrare le capacità dell’intelligenza artificiale, Qualcomm ha utilizzato lo stesso testo di input per generare quattro immagini con una risoluzione di 512 x 512 pixel. I parametri inseriti per le dimostrazioni erano i seguenti: “gatto guerriero super carino in armatura, fotorealistico, 4K, ultra-dettagliato, rendering vray, motore unreal”.
La maggior parte delle applicazioni di intelligenza artificiale per la generazione di immagini prevede un’elaborazione basata sul cloud, ovvero utilizza server dotati di processori incredibilmente potenti per fornire un risultato in pochi minuti. Nella dimostrazione di Qualcomm, tutta l’elaborazione è avvenuta sul telefono stesso.
Il dottor Jilei Hou, vicepresidente del settore ingegneria di Qualcomm, ha dichiarato che sono state necessarie diverse ottimizzazioni per far funzionare senza problemi Stable Diffusion su uno smartphone con hardware già in commercio per i consumatori. A tal fine, sono stati apportati degli adattamenti basati sulla versione 1-5 di Stable Diffusion open source.
Qualcomm sottolinea lo stretto legame tra hardware e software, che consente al modello di sfruttare appieno l’Hexagon Processor, un processore dedicato ai compiti di intelligenza artificiale presente nell’AI Engine di Snapdragon 8 Gen 2.
“Il risultato di questa ottimizzazione totale è l’esecuzione di Stable Diffusion su un telefono cellulare in meno di 15 secondi con soli 20 passaggi di inferenza per generare un’immagine di 512 x 512 pixel“, commenta Hou, sottolineando che si tratta della velocità di elaborazione dell’intelligenza artificiale più elevata su uno smartphone.
L’inizio del 2023 sembra segnato da progressi nelle intelligenze artificiali di vario tipo. Oltre alla tecnologia di generazione di immagini dimostrata da Qualcomm, OpenAI ha dato il via alla diffusione di macchine in grado di generare testo con ChatGPT, che alimenta il nuovo (e controverso) Bing Chat di Microsoft.