Intel sfida Nvidia con la nuova GPU per datacenter

A Computex 2026, Intel ha svelato nuovi dettagli su Crescent Island, la sua prossima generazione di GPU per datacenter, posizionandosi come alternativa alla GPU Rubin CPX di Nvidia, archiviata nei mesi scorsi dopo l'acquisizione di Groq da parte della stessa Nvidia. La mossa rappresenta un tentativo di Intel di ritagliarsi spazio in un mercato dell'accelerazione AI per l'inferenza in rapida evoluzione, dove le architetture disaggregate stanno ridisegnando le regole della competizione.

Il contesto è quello di una corsa tecnologica che coinvolge i più grandi operatori mondiali di infrastrutture cloud e datacenter. Le architetture di inferenza disaggregata — che separano le fasi di prefill (elaborazione del prompt) e decode (generazione dei token) su hardware distinto — stanno diventando lo standard de facto per chi gestisce carichi di lavoro AI su larga scala. Questa transizione apre nicchie di mercato che player come Intel possono tentare di occupare, anche senza competere frontalmente con Nvidia sul piano delle prestazioni assolute.

Crescent Island si distingue per scelte progettuali fuori dagli schemi attuali. Adotta un fattore di forma PCIe quando la maggior parte delle GPU high-end è passata a design con socket, e soprattutto rinuncia alla memoria HBM (High Bandwidth Memory) in favore di LPDDR5x, la stessa tipologia usata negli smartphone e nei notebook di fascia alta. Il vantaggio economico è tangibile: i prezzi della memoria HBM sono più che triplicati nell'ultimo anno per via delle tensioni nelle catene di fornitura dei semiconduttori a livello globale.

Crescent Island will be offered with up to 480 GB of memory, significantly more than you'll find on Nvidia's flagship GPUs, which currently top out at 288 GB.

La capacità di memoria fino a 480 GB supera quella delle GPU di punta di Nvidia e AMD, ma la larghezza di banda rimane il punto critico. Ipotizzando un bus da 1.024 bit, la velocità stimata si aggira intorno a 1,2 terabyte al secondo, contro i 20 TB/s delle soluzioni concorrenti più recenti. Questo gap è determinante per le operazioni di decode, dove la velocità di generazione dei token dipende direttamente dalla banda disponibile. Per il prefill, invece, il collo di bottiglia è il calcolo, non la memoria: un vantaggio strutturale per Crescent Island.

È proprio qui che si innesta la logica strategica. La GPU Rubin CPX di Nvidia — annunciata l'estate scorsa con 128 GB di memoria GDDR7 e fino a 30 petaFLOP in precisione NVFP4 — era pensata esattamente per questo ruolo: accelerare il prefill nei sistemi disaggregati, lasciando il decode ai chip Vera Rubin con memoria HBM4. Il progetto è stato però abbandonato a marzo 2025, quando Nvidia ha scelto di prioritizzare le architetture basate sulle unità LPU di Groq, orientate invece all'ottimizzazione del decode.

Ian Buck VP of Hyperscale and HPC at Nvidia said CPX was still a good idea and we may see the concept resurface in future generations.

Intel ha segnalato che Nvidia Dynamo sarà supportato su Crescent Island. Dynamo è il framework di Nvidia per orchestrare prefill e decode su GPU multiple in architetture disaggregate. L'endorsement — per quanto indiretto — da parte di un concorrente diretto è un dato degno di nota, che riflette il progressivo avvicinamento tra le due aziende da quando Lip Bu Tan ha assunto la guida di Intel nel 2024.

Sul fronte delle specifiche tecniche, Intel ha confermato l'adozione della microarchitettura Xe-3P con supporto ai formati FP8 e FP4, con un dissipazione termica di 350 watt in raffreddamento ad aria. I dati sulle prestazioni in FLOP non sono ancora stati resi pubblici, rendendo difficile una valutazione oggettiva del posizionamento competitivo. Parallelamente, Intel ha già co-investito 350 milioni di dollari nella startup di chip AI SambaNova, con cui sta costruendo una piattaforma di inferenza disaggregata che ad aprile ha rivelato l'utilizzo anche di GPU Nvidia — un dettaglio che mostra quanto il confine tra collaborazione e competizione sia fluido in questo settore.

There is no reason that Intel couldn't use something like LLMd — the open source, open vendor contemporary to Dynamo — to combine its own GPUs with SambaNova RDUs instead.

La domanda aperta riguarda la sostenibilità di questa strategia nel medio termine. Intel si trova a competere in un segmento dove Nvidia continua a dominare l'ecosistema software oltre che hardware, e dove AMD avanza con soluzioni ad alta larghezza di banda. Se Crescent Island riuscisse a conquistare una quota anche marginale nei datacenter dei grandi operatori cloud, rappresenterebbe un segnale di inversione di tendenza per una società che negli ultimi anni ha perso terreno significativo nel mercato dei chip per intelligenza artificiale. Ma a quel punto la vera battaglia non sarà più tecnologica: sarà quella dell'adozione software e dell'integrazione negli stack esistenti.

Articoli Correlati