Qualcomm prova ad allargare il proprio campo d’azione dall’edge al cuore dei data center con un’offerta da 3,9 miliardi di dollari per acquisire Modular, società guidata da Chris Lattner e presentata come alternativa portabile allo stack software di NVIDIA. L’operazione punta a intercettare una fase in cui il calcolo per l’intelligenza artificiale non ruota più intorno al singolo chip, ma a sistemi distribuiti, eterogenei e sempre più difficili da programmare in modo efficiente.
La tesi di Modular è che le imprese abbiano bisogno di usare acceleratori AI diversi, provenienti da più fornitori, senza restare vincolate a un’unica piattaforma hardware. Lattner descrive la società come impegnata da 4,5 anni nella costruzione di una piattaforma capace di scalare dal data center fino all’edge, con l’obiettivo di trasformare infrastrutture eterogenee in fabbriche di token basate su più tipi di silicio.
Il punto economico è centrale. Modular sostiene che una piattaforma progettata per l’eterogeneità possa offrire maggiore portabilità, migliori prestazioni e un TCO più basso, consentendo a clienti enterprise, partner e sviluppatori di scegliere il silicio più adatto a ciascun carico di lavoro. Per Qualcomm, questa impostazione apre uno spazio competitivo proprio mentre i costi dell’AI generativa e agentica rendono più visibile il tema della tokenomics.
Secondo Christiano Amon, amministratore delegato di Qualcomm, gli agenti stanno cambiando l’architettura e l’economia dell’AI perché generano una domanda molto più alta di token. Amon indica una proiezione di crescita di 40x nella domanda annuale di token tra 2026 e 2030, collegando questa dinamica sia all’espansione del cloud sia alla trasformazione dell’edge in una piattaforma di calcolo capace a sua volta di generare token.
La contrapposizione tra cloud ed edge, nella lettura di Qualcomm, perde quindi centralità. Le attività destinate al cloud resteranno nel cloud, mentre l’edge diventa parte di un’infrastruttura di inferenza distribuita. Amon parla di una nuova forma di compute, in cui l’inferenza si disaggrega e si distribuisce ovunque. Per le imprese, la conseguenza è una maggiore complessità architetturale, ma anche la possibilità di distribuire capacità AI più vicino ai dispositivi e ai flussi operativi.
Antonios Pialis, general manager Data Center di Qualcomm, porta il discorso sul piano infrastrutturale: con l’arrivo degli agenti, il numero di token cresce rapidamente e le richieste di inferenza aumentano in modo non lineare. Pialis afferma che una singola interrogazione di un agente può generare da 50x a 100x richieste di inferenza e superare 1 milione di token. Da qui la conclusione: l’infrastruttura tradizionale non scala abbastanza per sostenere l’AI agentica di massa.
Il modello basato su GPU, nato per sostenere sia training sia inferenza, viene descritto come sempre più esigente sul piano energetico. Pialis cita data center che già operano su centinaia di kilowatt e soluzioni destinate a superare i 500 kilowatt. La risposta di Qualcomm è una infrastruttura di calcolo disaggregata, con accelerazione hardware mirata per funzioni specifiche, CPU dedicate e XPU progettate per compiti come pre-fill, attenzione e KV caching durante la fase di decode.
Il collo di bottiglia non è solo la potenza di calcolo. Pialis sostiene che le dimensioni dei transformer stiano crescendo di 240x nell’arco di due anni, mentre la memoria raddoppia nello stesso periodo. Qualcomm afferma di avere ripensato l’architettura separando l’acceleratore AI dalla XPU e collocando quest’ultima sotto uno stack DRAM, cercando di combinare vantaggi prestazionali simili alla SRAM con densità e capacità tipiche degli stack HBM.
La scommessa di Qualcomm passa quindi da una doppia frattura: rompere il lock-in dello stack dominante e ridurre i limiti fisici di memoria, consumi e calore che emergono con l’inferenza agentica. L’offerta per Modular non è solo una mossa di portafoglio: è il tentativo di entrare nel data center con un’architettura diversa, pensata per un mercato in cui token, acceleratori e memoria diventano le nuove unità di misura della competizione.