News I risultati dei motori di ricerca sono affidabili solo all'apparenza
2' 6''
06/06/2023

I moderni motori di ricerca intelligenti producono risultati che nella maggior parte dei casi sono solo all'apparenza utili e precisi.

I risultati dei motori di ricerca sono affidabili solo all'apparenza

Uno dei prerequisiti per realizzare sistemi di IA affidabili è l’accuratezza e la verificabilità dell’output; non sempre, però, i tool esistenti riescono a garantire queste due qualità, mettendo a rischio la fiducia nella tecnologia.

Nelson F. Liu, Tianyi Zhang e Percy Liang, ricercatori dell’università di Stanford, hanno pubblicato i risultati di una ricerca volta a misurare l’accuratezza dei motori di ricerca intelligenti.

Il team ha preso in esame Bing Chat, NeevaAI, perplexity.ai e YouChat, mettendoli alla prova su diversi argomenti e misurando l’output secondo quattro dimensioni: la scorrevolezza, l’utilità percepita dell’informazione, il numero di citazioni a corredo del testo e la precisione delle citazioni. 

Le domande richiedevano una risposta informativa; tra gli esempi riportati nel paper figurano quesiti come “Qual è il film con più nomination agli oscar?”, o anche “La Florida si trova tutta nello stesso fuso orario?”.

Pexels
motore ricerca

Un motore di ricerca generativo dovrebbe garantire elevati valori per le metriche relative alle citazioni e al contempo fornire output utili e semplici da comprendere.

Secondo i risultati, in media soltanto il 51,5% delle risposte generate erano corredate da citazioni, e solo il 74,5% delle citazioni supportava correttamente le frasi. 

È inoltre interessante notare che la precisione nelle citazioni si è rivelata inversamente proporzionale all’utilità percepita e alla scorrevolezza del testo: le risposte considerate più utili erano anche quelle col minor numero di citazioni precise a corredo. Ciò significa che gli utenti sono potenzialmente più portati ad affidarsi a risposte che sembrano soddisfacenti ma sono in realtà imprecise. 

Al contrario, i risultati con maggiori punteggi per le citazioni erano anche quelli percepiti come meno scorrevoli e poco utili. Secondo i ricercatori questo fenomeno è un effetto secondario che accomuna tutti i motori di ricerca generativi, dovuto alla propensione dei sistemi di copiare frasi o interi paragrafi dalla sorgente senza parafrasarli.

Pexels
ricerca

"La precisione e il livello di citazioni dei sistemi attuali sono inaccettabilmente basse, dal momento che stanno diventando uno strumento molto popolare per rispondere alle query utente e sono usati già da milioni di persone" hanno affermato i ricercatori.

Il team si dice preoccupato di questi risultati, visto che molti utenti inesperti potrebbero prendere decisioni sbagliate affidandosi a output che solo all’apparenza sono utili. La speranza è che questi risultati aiutino lo sviluppo di motori di ricerca sempre più affidabili e precisi.

 

Potrebbe interessarti anche

Scenario

Una nuova era di creatività o una minaccia per la società?

L'IA generativa promette di espandere la creatività umana, ma solleva preoccupazioni per l'impatto sulla società e sull'economia.

Approfondimenti

Soluzioni di IA integrate ed efficienti per l'OCX: la visione di Spitch

Alessandra Peterlin, Director of Sales and Consultancy di Spitch Italia, condivide il suo punto di vista sull'uso dell'IA nell'OCX.

News

Futureberry presenta COSMO per l'apprendimento personalizzato e on-demand basato su IA

Futureberry ha lanciato COSMO, una piattaforma di apprendimento personalizzato on-demand basata su IA per aiutare i giovani a inserirsi nel mondo del lavoro del futuro.

News

Valutare il rischio di credito, un aiuto da AI Generativa e dati alternativi

L'AI Generativa permette di analizzare dati non strutturati e alternativi per conoscere meglio i clienti e valutare il rischio di credito con efficacia.