Microsoft presenta Phi-3, una famiglia di modelli linguistici di piccole dimensioni addestrati su dati sintetici di alta qualità, che offre prestazioni eccellenti a un costo contenuto. Phi-3-mini, con i suoi 3,8 miliardi di parametri, supera modelli ben più grandi dimostrando che le dimensioni non contano sempre.
Nell’ambito dell’intelligenza artificiale, i modelli di linguaggio stanno diventando progressivamente più grandi, arrivando a contare trilioni di parametri. Microsoft sfida questa tendenza con il lancio di Phi-3, una nuova famiglia di modelli linguistici che evidenzia come non sempre “più grande” significhi “migliore”. Con soli 3,8 miliardi di parametri, il modello Phi-3-mini ha dimostrato di poter superare i modelli dieci volte più grandi, offrendo una soluzione più accessibile e efficiente per diverse esigenze di costi, latenza e infrastruttura.
Il modello Phi-3 è addestrato su dati sintetici di alta qualità, garantendo uno dei migliori rapporti costo-prestazioni nel mercato attuale. Questo approccio consente a Microsoft di ottimizzare le capacità del modello senza compromettere la qualità. L’addestramento utilizza metodi innovativi ispirati all’apprendimento umano, come le tecniche adottate dal nuovo team GenAI dell’azienda, che si è ispirato al modo in cui i più piccoli possono imparare concetti complessi attraverso le storie della buonanotte.
Oltre a garantire elevate prestazioni, il team di Microsoft ha posto un’enfasi particolare sulla Responsible AI, adottando misure per ridurre i rischi associati all’uso di linguaggio potenzialmente dannoso. Ciò si riflette nella scelta di non addestrare i modelli con dati prelevati direttamente da Internet, che spesso includono bias e linguaggio inappropriato.
La famiglia Phi-3 non si limita al modello mini, con i prossimi modelli Phi-3-small e Phi-3-medium che promettono ulteriori avanzamenti in termini di prestazioni e accessibilità. Questi modelli saranno disponibili con 7 miliardi e 14 miliardi di parametri rispettivamente, offrendo ulteriori opzioni per le aziende e gli sviluppatori alla ricerca di soluzioni su misura.
Microsoft ha reso il modello Phi-3 disponibile su diverse piattaforme, tra cui Azure, HuggingFace e Ollama, permettendo agli sviluppatori di accedere facilmente alle risorse e di implementarle in modo flessibile nei propri progetti. La dimensione ridotta del modello Phi-3-mini in particolare, offre la possibilità di eseguire il modello direttamente su dispositivi locali senza necessità di connessione internet o accesso al cloud, una caratteristica che democratizza ulteriormente l’accesso all’intelligenza artificiale, specialmente in luoghi privi delle infrastrutture tecniche avanzate.