SynthID Text: Google offre uno strumento gratuito e open source per marcare i testi AI e combattere la disinformazione. Leggi tutti i dettagli nell’articolo.

Google ha annunciato una novità importante per il mondo dell’intelligenza artificiale: lo strumento SynthID Text è ora disponibile gratuitamente per sviluppatori e aziende. Il tool permette di riconoscere e inserire watermark in testi generati da modelli di AI generativi, con l’obiettivo di rendere più facile identificare i contenuti creati artificialmente. L’azienda ha messo a disposizione lo strumento su Hugging Face e tramite il Responsible Gen AI Toolkit di Google.

SynthID Text è progettato per funzionare con i modelli di generazione del testo, che operano utilizzando i cosiddetti “token”. Quando l’IA riceve una richiesta, calcola quale token è più probabile che inizi il testo e quali dovrebbero seguirlo. I token possono essere singoli caratteri o parole e formano le basi su cui l’intelligenza artificiale genera una risposta.

Per creare un watermark, SynthID altera leggermente la probabilità con cui i token vengono selezionati, incorporando informazioni aggiuntive che diventano parte del testo finale. Grazie a queste modifiche, è possibile verificare se un testo è stato generato da un modello AI analizzando i punteggi dei token e confrontandoli con modelli di riferimento.

Google ha specificato che SynthID Text ha già trovato applicazione su Gemini a partire dalla metà di marzo, dimostrando che non compromette la qualità o la velocità della generazione dei testi. Lo strumento funziona anche su testi che sono stati modificati, tagliati o parafrasati, per garantire una certa forza nel rilevamento dei contenuti generati da IA.

Tuttavia, Google riconosce alcuni limiti. SynthID fatica a funzionare efficacemente su testi brevi, su testi tradotti o riscritti da altre lingue, e su risposte a domande specifiche. In questi casi, la possibilità di alterare la distribuzione dei token senza influire sull’accuratezza del testo si riduce e rende più difficile l’inserimento del watermark.

Anche altre aziende stanno sviluppando tecnologie simili. OpenAI, la compagnia dietro ChatGPT, sta lavorando su metodi di watermarking da anni, ma ha rimandato il lancio a causa di questioni tecniche e commerciali.

Strumenti come SynthID Text possono giocare un ruolo importante nel futuro della comunicazione online. Se implementati su larga scala, potrebbero ridurre l’imprecisione dei rilevatori di IA attuali, che spesso etichettano erroneamente testi scritti da esseri umani come generati artificialmente. Inoltre, potrebbero aiutare a individuare e declassare i contenuti generati sinteticamente, una sfida sempre più urgente man mano che i contenuti online generati dall’AI continuano a crescere. Secondo alcune stime, entro il 2026 il 90% dei contenuti su internet potrebbe essere generato artificialmente, una percentuale che potrebbe salire fino al 99% entro il 2030.

In Cina, è già obbligatorio contrassegnare i contenuti generati dalle intelligenze artificiali, e anche la California sta considerando di introdurre una legislazione simile, segno che la necessità di regolamentare l’uso dell’IA sta diventando una priorità anche in Occidente.

Articolo precedenteWindows 11 24H2: prestazioni migliorate, installazione più rapida
Articolo successivoGoogle estende aggiornamenti Android a 7 anni per tutti

LASCIA UN COMMENTO

Per favore inserisci il tuo commento!
Per favore inserisci il tuo nome qui