Tecnologia Anthropic e OpenAI sfruttano il web senza reciprocità
3' 52''
28/01/2026

I dati Cloudflare rivelano che i giganti dell'IA prelevano massicciamente contenuti dal web tramite crawling, ma restituiscono poco traffico ai siti originali.

Anthropic e OpenAI sfruttano il web senza reciprocità

I colossi dell'intelligenza artificiale stanno saccheggiando il web senza restituire nulla in cambio. È quanto emerge dai dati aggiornati di Cloudflare, piattaforma che gestisce circa il 20% dei siti mondiali, relativi alla prima settimana di gennaio 2025. Le cifre mostrano un deterioramento del rapporto tra attività di crawling – l'acquisizione sistematica di contenuti dai siti – e i rinvii di traffico verso le fonti originali, specialmente per realtà come Anthropic e OpenAI. Il fenomeno solleva interrogativi sul modello economico che regge l'ecosistema digitale e sulla sostenibilità del patto implicito tra produttori di contenuti e aggregatori tecnologici.

Per decenni, il web ha funzionato secondo un accordo tacito ma fondamentale: i siti accettavano che i propri contenuti venissero indicizzati gratuitamente dai motori di ricerca, ricevendo in cambio traffico qualificato. Questo flusso di visitatori permetteva ai publisher di monetizzare attraverso pubblicità, abbonamenti o altri strumenti commerciali. L'avvento dei chatbot generativi e degli answer engine basati su intelligenza artificiale sta scardinando questo equilibrio, offrendo risposte dirette agli utenti senza la necessità di cliccare verso le fonti che hanno prodotto, verificato e pubblicato quelle informazioni.

La metrica elaborata da Cloudflare misura il rapporto tra richieste di crawling effettuate dai bot delle big tech e i rinvii di traffico verso i siti web. Un rapporto di 100 a 1, per esempio, significa che un'azienda ha scansionato i contenuti 100 volte per ogni singolo utente indirizzato verso la fonte originale. I dati di gennaio rivelano una situazione particolarmente squilibrata per alcune società dell'IA.

Anthropic si distingue in modo evidente: secondo i dati Cloudflare, scansiona i siti molto più di quanto indirizzi utenti verso il web esterno

La startup fondata da ex dirigenti di OpenAI ha addirittura intensificato l'attività di crawling rispetto ai primi di settembre 2024, mentre la quota di traffico restituito ai siti non è cresciuta proporzionalmente. Anche OpenAI mostra un peggioramento del rapporto crawl-to-refer, segnalando una dinamica estrattiva crescente. Questi pattern confermano quanto già emerso da un'inchiesta di Business Insider nel 2024, che aveva documentato come i bot di queste aziende stessero causando picchi drammatici nei costi di traffico per alcuni proprietari di siti.

Uno sviluppatore web aveva registrato il raddoppio delle spese di cloud computing per un cliente nell'arco di pochi mesi, attribuibile esclusivamente all'intensificarsi delle scansioni operate dai bot dell'IA. Il paradosso è duplice: non solo le società di intelligenza artificiale estraggono valore dal web restituendone sempre meno, ma lasciano anche fatture più salate a carico di chi produce i contenuti che alimentano i loro modelli.

Interpellata sulle ragioni di questo comportamento, Anthropic non ha fornito risposta alle richieste di commento. A settembre 2024, l'azienda aveva contestato la metodologia di Cloudflare, sostenendo di non poter confermare i rapporti calcolati e segnalando possibili problemi nella misurazione. La startup aveva anche evidenziato il lancio della funzione di ricerca web per il suo chatbot Claude, che secondo le loro dichiarazioni stava generando traffico crescente verso i siti. Anche OpenAI ha scelto il silenzio di fronte alle domande sul tema.

I numeri del rapporto crawl-to-refer si concentrano sul web e escludono l'attività delle app native, che se inclusa potrebbe abbassare i rapporti

Va precisato che la metodologia di Cloudflare si focalizza sul traffico web, escludendo l'attività delle applicazioni native. L'inclusione di questi dati potrebbe modificare i rapporti, ma il criterio è applicato uniformemente a tutte le società analizzate. Google presenta un rapporto relativamente contenuto, probabilmente grazie al suo motore di ricerca tradizionale che continua a mostrare link diretti verso i siti nelle pagine dei risultati. Tuttavia, il colosso di Mountain View sta progressivamente integrando risposte in stile chatbot attraverso le AI Overviews e la modalità AI, riducendo la necessità per gli utenti di visitare le fonti originali.

Mountain View sostiene pubblicamente di continuare a inviare traffico verso il web e di preoccuparsi della salute dell'ecosistema digitale. Ma la tensione è palpabile: mentre le aziende tecnologiche investono miliardi in datacenter, GPU e talenti, evitano accuratamente di discutere l'altro ingrediente cruciale del successo dell'IA – i dati di alta qualità prodotti dagli esseri umani. Preferiscono inviare bot per raccoglierli gratuitamente piuttosto che negoziare accordi di licenza o compensi.

Il modello di business emergente dell'intelligenza artificiale solleva interrogativi strutturali. Se i produttori di contenuti originali non ricevono più traffico né compensi, quale incentivo avranno a continuare a creare informazioni verificate e di qualità? E se il flusso di contenuti si inaridisce, su quali fondamenta poggeranno i futuri modelli di addestramento dell'IA? Il rischio è che l'ecosistema digitale, costruito in decenni attraverso un fragile equilibrio di interessi reciproci, collassi sotto il peso di un'estrazione unilaterale di valore, lasciando sia i creatori di contenuti che le società di IA davanti a un web impoverito e meno affidabile.

Questo comportamento suggerisce che le aziende di IA stanno prendendo più di quanto restituiscono al web

Condividi questo contenuto