Tecnologia NVIDIA affida agli agenti AI l'addestramento dei robot
3' 53''
18/06/2026

NVIDIA sperimenta ENPIRE, un framework che permette ad agenti AI di progettare e migliorare autonomamente l’addestramento di bracci robotici.

NVIDIA affida agli agenti AI l'addestramento dei robot

NVIDIA sta portando gli agenti di coding oltre il software, dentro un laboratorio popolato da bracci robotici, risorse di calcolo e un ampio budget di token. Il risultato è un esperimento in cui sistemi di intelligenza artificiale hanno definito in autonomia procedure di addestramento per insegnare ai robot compiti fisici complessi, dal taglio di fascette fino all’inserimento di una GPU in uno slot sottile su una scheda madre.

Il dato più rilevante è che, usando il framework ENPIRE, gli agenti sono arrivati a un tasso di successo del 99 percento su diverse attività di manipolazione. Non si tratta soltanto di generare codice o suggerire strategie: il sistema orchestra cicli di prova, verifica, correzione e nuovo addestramento, mostrando come un agente AI possa iniziare a dirigere parti del lavoro sperimentale che, fino a poco tempo fa, richiedevano una supervisione umana continua.

ENPIRE è stato sviluppato dai ricercatori del laboratorio NVIDIA GEAR, insieme a collaboratori della Carnegie Mellon University e della University of California, Berkeley. Jim Fan, direttore AI di NVIDIA, ha descritto il laboratorio come una struttura che ora può auto-migliorarsi durante la notte, lasciando ai ricercatori il compito di leggere i report al mattino. Lo stesso Fan ha anche indicato l’intenzione di rendere tutto open source, così da consentire ad altri di ospitare un proprio laboratorio robotico auto-operativo.

Gli agenti AI non scrivono solo codice: iniziano ad addestrare robot fisici.

Dal punto di vista tecnico, il framework funziona come un involucro agentico attorno ai modelli AI. I suoi quattro moduli permettono agli agenti di eseguire reset e verifiche automatiche, rifinire le policy che guidano il comportamento dei robot, valutarle su più macchine fisiche in parallelo e correggere i fallimenti analizzando log, integrando paper di ricerca e intervenendo sul codice dell’infrastruttura di training. I dettagli tecnici sono contenuti in un paper caricato il 16 giugno 2026.

Il sistema è stato testato con tre agenti di coding: OpenAI Codex con GPT-5.5, Claude Code di Anthropic con Opus 4.7 e Kimi Code di Moonshot AI con Kimi K2.6. I team di agenti hanno sviluppato approcci algoritmici differenti, li hanno provati in esperimenti fisici e hanno mantenuto le modifiche capaci di migliorare il tasso complessivo di riuscita. La dinamica ricorda un processo di ricerca iterativa, ma accelerato e parzialmente trasferito a sistemi autonomi.

Le attività affrontate coprono un ventaglio interessante per la robotica industriale e di laboratorio. Oltre al benchmark Push-T, in cui un robot deve spostare un blocco a forma di T fino a una posizione obiettivo su un tavolo, gli agenti hanno lavorato su organizzazione di pin, legatura e taglio di fascette, inserimento di una GPU in una motherboard e successiva rimozione della scheda per preparare il tentativo seguente. Nel compito di inserimento e organizzazione dei pin, gli agenti hanno raggiunto quasi il 100 percento di successo più rapidamente di un metodo avanzato con essere umano nel ciclo.

ENPIRE automatizza cicli di prova, errore e miglioramento nel laboratorio robotico.

La scala del team ha inciso sui risultati. Un gruppo di otto agenti ha raggiunto il 99 percento di successo nel Push-T in due ore di ricerca, contro le tre ore richieste da un team di quattro agenti e quasi cinque ore per un singolo agente. Per le imprese, il segnale è chiaro: l’automazione dell’addestramento robotico potrebbe ridurre i tempi di sperimentazione e rendere più rapida la messa a punto di sistemi fisici, soprattutto quando più robot e più agenti lavorano in parallelo.

Restano però limiti importanti. I ricercatori hanno osservato che i robot restavano spesso inattivi mentre gli agenti leggevano log, scrivevano codice, facevano debug o attendevano il modello linguistico sottostante. I team più grandi, inoltre, consumavano tempo nel sintetizzare le idee reciproche e non sempre sfruttavano appieno le risorse di calcolo disponibili. La maggiore velocità ha anche un costo: più agenti e più cicli significano maggiore consumo di token, un fattore economico non secondario per chi usa servizi AI su larga scala.

Più agenti accelerano i risultati, ma aumentano anche il consumo di token.

L’esperimento si inserisce nella strategia di NVIDIA sulla physical AI, area in cui l’azienda sta moltiplicando iniziative e partnership. Il 31 maggio ha annunciato una collaborazione con Unitree per fornire un Reference Humanoid Robot ai laboratori di ricerca, mentre a inizio giugno Jensen Huang ha incontrato Hyundai Motor per discutere la produzione su larga scala di robot basati su AI. In questa prospettiva, ENPIRE non è solo una prova di laboratorio: è un tassello verso robot che imparano più velocemente perché anche il loro addestramento diventa sempre più automatizzato.

Condividi questo contenuto