Ci sono cose che possono essere definite in vari modi: pensiamo, ad esempio, a “penna” e “biro” oppure “matita” e “lapis”. Alle volte è una caratteristica della lingua di riferimento, altre volte dipende da tendenze o sfumature culturali, o semplicemente da dove ci troviamo mentre effettuiamo una ricerca.
Un esempio particolarmente significativo di questo è il COVID-19. Mentre le persone, in tutto il mondo, andavano alla ricerca di informazioni sul virus, abbiamo dovuto imparare a identificare tutte le diverse frasi usate per riferirsi al nuovo coronavirus per essere sicuri di far emergere informazioni tempestive e di qualit messe a disposizione da parte di autorità sanitarie affidabili come l’Organizzazione Mondiale della Sanità e i Centri per il controllo e la prevenzione delle malattie. A distanza di un anno dopo, stiamo riscontrando una sfida simile con i vari nomi dei vaccini, solo che questa volta abbiamo a disposizione un nuovo strumento: la tecnologia Multitask Unified Model (MUM).
Comprendere le ricerche di informazioni sui vaccini
AstraZeneca, CoronaVac, Moderna, Pfizer, Sputnik e altri vaccini distribuiti su larga scala hanno ciascuno dei nomi diversi in varie parti del mondo: oltre 800, stando alla nostra analisi. Le persone che cercano informazioni sui vaccini possono cercare “Coronavaccin Pfizer,” “mRNA-1273,” “CoVaccine” – e la lista continua.
La nostra capacità di identificare correttamente tutti questi termini è fondamentale per offrire alle persone le informazioni più aggiornate ed affidabili sul vaccino. Ma identificare i diversi modi in cui le persone si riferiscono ai vaccini in tutto il mondo richiede un enorme dispendio di tempo e centinaia di ore in risorse umane.
Con MUM, in pochi secondi siamo stati in grado di identificare oltre 800 varianti di nomi di vaccini in oltre 50 lingue. Dopo aver convalidato questi risultati, li abbiamo applicati alla Ricerca Google in modo che le persone potessero trovare informazioni tempestive e di alta qualità sui vaccini COVID-19 in tutto il mondo.
Trasferire conoscenza attraverso le lingue
MUM è stato in grado di fare in pochi secondi un lavoro che avrebbe richiesto diverse settimane grazie alle sue capacità di trasferimento di conoscenza. MUM può imparare e trasferire conoscenza attraverso le oltre 75 lingue su cui è stato testato. Per esempio, immaginate di leggere un libro: se siete multilingue, sarete in grado di condividere le principali conclusioni del libro nelle altre lingue che parlate – a seconda della vostra fluidità – perché avete una comprensione del libro che non dipende dalla lingua o dalla traduzione. MUM trasferisce la conoscenza attraverso le lingue in modo molto simile.
Allo stesso modo, grazie a questa proprietà, MUM non deve imparare una nuova funzionalità per ogni lingua, ma può trasferire ciò che apprende tra di loro, aiutandoci a scalare rapidamente i miglioramenti ottenuti anche per lingue meno testate di altre. Questo è in parte merito dell’efficienza del campione di MUM – il che significa che MUM richiede molti meno input di dati rispetto ai modelli precedenti per realizzare lo stesso compito. Nel caso dei vaccini, con solo un piccolo campione di nomi ufficiali, MUM è stato in grado di identificare rapidamente queste variazioni tra le lingue.
Migliorare la Ricerca Google con MUM
Questa prima implementazione di MUM ci ha aiutato a fornire alle persone informazioni fondamentali in modo tempestivo, ovunque si trovassero, e siamo impazienti di scoprire i molti modi in cui MUM può rendere la Ricerca ancora più utile per le persone in futuro. I nostri primi test indicano che non solo MUM sarà in grado di migliorare molti aspetti dei nostri attuali sistemi, ma ci aiuterà anche a creare modi completamente nuovi di cercare ed esplorare le informazioni.