Anthropic presenta la nuova versione Claude AI, il primo modello della sua nuova serie di LLM, che supera i rivali GPT-4o e Gemini 1.5 Pro in diverse attività.
Anthropic ha appena rilasciato Claude 3.5 Sonnet, il primo dei tre modelli della nuova generazione Claude 3.5. Secondo l’annuncio ufficiale di Anthropic, questo nuovo modello di intelligenza artificiale “stabilisce nuovi parametri di riferimento per il settore” in vari benchmark AI. L’azienda sostiene che Claude 3.5 Sonnet fornisce risposte più accurate rispetto a GPT-4o e Gemini 1.5 Pro. Simile a ChatGPT, Anthropic sta rendendo Claude 3.5 Sonnet disponibile gratuitamente, anche se con limitazioni. Dopo alcune risposte, si raggiunge un limite di velocità che richiede di pagare 20 dollari al mese per un piano Pro o di aspettare qualche ora prima che il contatore si azzeri.
Claude 3.5 Sonnet ha ottenuto risultati impressionanti in vari benchmark, tra cui codifica, matematica e comprensione a livello universitario, almeno secondo i dati forniti da Anthropic. Anche se i benchmark autodichiarati possono non essere completamente affidabili, il miglior modello precedente di Anthropic tiene il passo con la concorrenza nelle classifiche di LLM in crowdsourcing. Il nuovo modello offre anche migliori capacità di visione, specialmente nei compiti di ragionamento come la lettura e l’interpretazione di grafici. Anthropic afferma che Claude 3.5 Sonnet è in grado di trascrivere accuratamente il testo dalle immagini, competendo con GPT-4o e Gemini 1.5 Pro.
Claude 3.5 Sonnet assomiglia all’ultimo LLM di Google, in quanto il modello medio supera la variante più grande del suo predecessore. Gemini 1.5 Pro è attualmente il miglior modello di Google e supera Gemini 1.0 Ultra. Allo stesso modo, Claude 3.5 Sonnet occupa per ora il primo posto, sostituendo Claude 3 Opus a una frazione del costo. Tuttavia, Anthropic prevede di rilasciare anche una variante più grande “Opus” di Claude 3.5 e un modello più piccolo e veloce “Haiku” entro la fine dell’anno.
Anthropic ha anche annunciato una nuova funzione Artifacts, che permette a Claude di generare frammenti di codice, documenti e piccoli giochi in una finestra separata dall’interfaccia di chat. Anche se questa è una funzione sperimentale, l’azienda la vede come le fondamenta di un “ambiente di lavoro collaborativo”. Anthropic immagina un futuro in cui i team possano lavorare insieme su progetti di design o di codice in uno spazio condiviso, simile alla collaborazione in tempo reale di Google Docs.
L’azienda ha ricevuto 2,75 miliardi di dollari da Amazon nel suo ultimo round di finanziamento e un impegno di 2 miliardi di dollari da Google, con almeno 500 milioni di dollari già erogati. Anche se Claude non è ancora diventato un nome noto come ChatGPT, Anthropic si sta affermando come uno dei maggiori rivali di OpenAI. Ad ogni modo, né Amazon né Google hanno ancora deciso di integrare Claude nei loro prodotti.