Nel corso del 2025, i principali produttori mondiali di semiconduttori — tra cui Nvidia, Arm e Amazon Web Services — hanno lanciato una campagna di posizionamento che ridefinisce i loro processori di uso generale come chip progettati appositamente per agenti di intelligenza artificiale. Si tratta di un fenomeno di marketing globale che attraversa l'intero settore, con implicazioni dirette sulle strategie di acquisto dei datacenter e sulle valutazioni di mercato delle aziende coinvolte.
Il settore dei chip per datacenter vale centinaia di miliardi di dollari e la corsa al posizionamento nell'ecosistema dell'intelligenza artificiale è diventata una leva fondamentale per giustificare prezzi premium e attrarre investimenti. Riclassificare prodotti esistenti come soluzioni "agentiche" consente alle aziende di intercettare budget IT già orientati verso l'AI, senza necessariamente sviluppare architetture radicalmente diverse.
Analizzando nel dettaglio le architetture presentate, emerge un quadro meno entusiasmante rispetto alla narrativa aziendale. Arm ha denominato il suo primo chip per datacenter "AGI CPU", ma si tratta essenzialmente di un processore Neoverse V3 a 136 core, privato del multithreading simultaneo e degli acceleratori dedicati per contenere i consumi, con elevata larghezza di banda di memoria. Amazon, con il suo Graviton 5 a 192 core annunciato a Re:Invent, replica la stessa architettura Neoverse V3 in forma scalata, risultando — secondo analisti indipendenti — ancora più generica.
Nvidia ha costruito il proprio Vera CPU su 88 core, puntando su alte prestazioni single-thread e ampia larghezza di banda di memoria e interconnessione. Il CEO Jensen Huang, durante il keynote al GTC Taiwan, ha argomentato che questa combinazione è essenziale per minimizzare la latenza: "Ci saranno miliardi di agenti e questi agenti utilizzeranno le CPU con pochissima pazienza, perché il costo delle GPU che gli stanno accanto è troppo elevato." Una dichiarazione che, non a caso, proviene dall'amministratore delegato del maggiore produttore mondiale di GPU.
La risposta competitiva di AMD non si è fatta attendere. Dopo i primi benchmark di Vera, la società ha contestato la rilevanza della latenza come metrica principale, sostenendo che la concorrenza — ossia la capacità di gestire richieste parallele — sia il parametro che conta davvero su larga scala. AMD proietta che i suoi Epyc Venice a 256 core, attesi nel corso dell'anno, offriranno un throughput per rack 3,3 volte superiore a Vera con un'identica dotazione energetica di 100 kW. Intel, dal canto suo, ha presentato a Computex design di rack di riferimento capaci di integrare fino a 36.864 core x86 in 100 kW.
I primi benchmark indipendenti condotti dalla pubblicazione Phoronix su Vera mostrano risultati articolati: il chip segna un punteggio medio geometrico superiore del 10% rispetto all'Epyc 9575F di AMD a 128 core e del 55% rispetto allo Xeon 6980P di Intel. Numeri significativi in termini assoluti, ma che nascondono variabilità considerevole a seconda dell'applicazione specifica, confermando che nessuna architettura domina trasversalmente tutti i carichi di lavoro.
Il vero interrogativo che questo ciclo di annunci lascia aperto riguarda le decisioni di spesa dei responsabili IT aziendali: in quale misura le scelte di procurement nei datacenter europei e italiani vengono influenzate da narrative di marketing costruite attorno a un'etichetta — "agentic AI" — che, al momento, descrive più un'aspirazione commerciale che una categoria tecnica consolidata? La risposta a questa domanda determinerà chi, tra i grandi produttori di semiconduttori, riuscirà a tradurre il ciclo dell'hype in quota di mercato duratura.