L'universo del cloud computing si arricchisce di una nuova soluzione tecnologica che promette di rivoluzionare il modo in cui le aziende gestiscono carichi di lavoro complessi. Google Cloud ha annunciato mercoledì di essere il primo fornitore di servizi cloud a commercializzare macchine virtuali equipaggiate con la tecnologia GPU Blackwell di Nvidia, consolidando la propria posizione nel competitivo mercato dell'intelligenza artificiale e del calcolo ad alte prestazioni. Questa mossa strategica rappresenta non solo un traguardo tecnologico, ma anche un segnale chiaro delle priorità dell'azienda di Mountain View nel settore enterprise.
Le caratteristiche tecniche che fanno la differenza
Le nuove macchine virtuali G4 si distinguono per una configurazione hardware impressionante che combina otto GPU Nvidia RTX PRO 6000, due processori AMD Turin e i processori Google Titanium per l'offload. Ogni acceleratore è in grado di generare 3.753 teraFLOPS di calcolo sparse FP4 ed è equipaggiato con 96GB di memoria GDDR7 con una larghezza di banda di 1,6TB/s. Nel complesso, le VM G4 vantano 768 GB di memoria GDDR7 e 384 vCPU con 12 TiB di SSD locale Titanium, espandibili fino a 512 TiB di storage a blocchi di rete Hyperdisk.
Questi numeri rappresentano un salto qualitativo significativo rispetto alla generazione precedente: le G4 offrono quattro volte più potenza di calcolo e memoria, oltre a una larghezza di banda sei volte superiore rispetto alle VM G2. Per i carichi di lavoro di inferenza AI, maggiore memoria significa poter eseguire modelli con parametri più numerosi, mentre una larghezza di banda superiore si traduce direttamente in un throughput più elevato.
Un coltellino svizzero per l'intelligenza artificiale
La versatilità rappresenta il punto di forza distintivo delle nuove macchine virtuali. A differenza delle serie A4 e A4X introdotte quest'anno, anch'esse basate su GPU Blackwell ma ottimizzate specificamente per training e inferenza AI, le G4 VM mantengono le pipeline grafiche necessarie per carichi di lavoro di visualizzazione e rendering. Questa caratteristica le rende particolarmente adatte a una gamma più ampia di applicazioni, dall'inferenza economicamente efficiente all'AI fisica avanzata, dalle simulazioni robotiche alla creazione di contenuti abilitati dall'AI generativa, fino al rendering di giochi di nuova generazione.
Le RTX Pro 6000 Server Edition, annunciate durante l'Nvidia GTC della scorsa primavera, rappresentano l'evoluzione naturale delle ormai datate L40 e L40S. Queste GPU basate su PCIe sono progettate per una combinazione di inferenza AI, fine-tuning di modelli e carichi di lavoro di visualizzazione dati come i digital twin.
Il mercato risponde con interesse
Le prime reazioni dal mondo enterprise sembrano confermare le aspettative di Google Cloud. Vinay Kola, senior manager of software engineering di Snap, ha commentato positivamente i test iniziali: "I nostri primi test delle VM G4 mostrano un grande potenziale, specialmente per i casi d'uso di inferenza LLM self-hosted. Siamo entusiasti di testare le VM G4 per una varietà di altri carichi di lavoro di ranking in futuro."
Gli analisti indipendenti interpretano questa mossa come una dimostrazione di forza e un segnale delle priorità cloud di Google. Crawford Del Prete, Presidente di IDC, sottolinea come questa iniziativa evidenzi "la priorità che Google sta ponendo nell'affrontare le esigenze di un ampio set di carichi di lavoro dei clienti su GCP, su scala e nell'involucro di performance richiesto dai clienti."
Strategia a lungo termine nell'AI Hypercomputer
L'introduzione delle G4 VM si inserisce nella più ampia strategia di Google denominata "AI Hypercomputer", un sistema integrato pensato per offrire soluzioni cloud ad alte prestazioni. Secondo Del Prete, questo approccio attrarrà "un insieme di clienti disposti a pagare di più per quel tipo di performance", posizionando Google Cloud come alternativa competitiva per carichi di lavoro orientati alle prestazioni che richiedono CPU AI, storage performante e workload intensivi di memoria.
Tuttavia, gli utenti di Google Cloud dovranno moderare l'entusiasmo: le G4 VM sono attualmente disponibili in anteprima, il che significa che potrebbe essere necessaria una negoziazione con un rappresentante delle vendite di Google Cloud per utilizzarle effettivamente. La disponibilità globale è prevista entro la fine dell'anno, quando si potrà valutare concretamente l'impatto di questa innovazione tecnologica sul mercato del cloud computing enterprise.