Edward Tian, studente di Princeton, ha sviluppato GPTZero per combattere il plagio accademico. Come suggerisce il nome, il programma nasce in risposta a ChatGPT e ai rischi di plagio che derivano dal suo utilizzo, cercando di proteggere la paternità dei testi.
GPTZero è in grado di riconoscere se il testo che gli viene sottoposto è scritto da un umano o generato da una macchina. Il programma, utilizzabile gratuitamente nella versione base, è diventato virale in pochissimo tempo e i feedback sono per la maggior parte positivi.
L'analisi di GPTZero
GPTZero analizza il testo in input basandosi su due metriche principali: la perplexity e la burstiness. La prima può essere considerata come una misura di "incertezza" e di casualità del modello: più il risultato è prevedibile, migliore è la valutazione del testo. Un input testuale imprevedibile si traduce in un testo poco sensato dal punto di vista logico.
La burstiness invece misura il numero di nuove occorrenze di un termine da quando viene individuato per la prima volta in un testo. Secondo il principio della metrica, se un termine appare nel documento è molto probabile che venga riutilizzato in seguito; le occorrenze successive, però, tenderanno a essere meno significative della prima. Un testo con un numero troppo alto di ripetizioni ha più probabilità di essere stato generato dall'IA e non scritto dall'uomo.
GPTZero combina i risultati delle due metriche per definire se il testo inserito è stato generato dall'IA o scritto da una persona. I risultati sono più accurati per testi di maggiore lunghezza: si consiglia un minimo di 10 righe per ottenere analisi precise.
Il programma si sta rivelando molto utile in ambito accademico per individuare tesine e saggi generati dall'IA. Molti studenti hanno infatti sfruttato ChatGPT per generare testi universitari.
GPTZero può essere usato anche in settori come il giornalismo e il copywriting per identificare e segnalare articoli e post generati da IA.