Meta rafforza il lavoro sugli agenti intelligenti portando nei propri Superintelligence Labs una delle figure più riconosciute nel campo della sicurezza dell’intelligenza artificiale. Dawn Song, docente di informatica alla University of California, Berkeley, ha annunciato su X che entrerà nel gruppo come vicepresidente della ricerca AI, insieme a molti membri del team di Virtue AI, la start-up di sicurezza per l’AI aziendale che ha cofondato.
Il passaggio arriva mentre gli agenti AI vengono presentati sempre più come la prossima soglia applicativa dei modelli generativi: non solo sistemi capaci di rispondere a una richiesta, ma strumenti in grado di svolgere compiti complessi in domini concreti. Song ha chiarito il perimetro dell’ambizione con una formula netta: l’obiettivo “non è sostituire gli esseri umani”, ma rendere questi sistemi più efficaci nei contesti del mondo reale, aiutando le persone a lavorare meglio e a produrre maggiore valore economico.
La nomina di Song porta in Meta un profilo che combina ricerca accademica, sicurezza informatica e applicazioni enterprise. A Berkeley è co-direttrice del Centre for Responsible, Decentralised Intelligence, noto come RDI, e viene descritta come una scienziata sino-americana di riferimento nella sicurezza AI. La sua traiettoria spiega anche il tipo di competenza che Meta sembra voler innestare nei laboratori dedicati alla superintelligenza: non soltanto capacità di modellazione, ma controllo, affidabilità e valutazione dei comportamenti degli agenti.
Il tema della valutazione è centrale. Il centro RDI di Berkeley ha introdotto all’inizio del mese Agents’ Last Exam, o ALE, un benchmark pensato per misurare quanto bene gli agenti AI riescano a svolgere compiti reali e “economicamente preziosi”. Il test copre oltre 1.500 attività distribuite in 55 settori, una scala che sposta la discussione dalla semplice performance su prove astratte alla capacità di operare in situazioni più vicine al lavoro quotidiano.
La prospettiva indicata da Song è quindi meno spettacolare e più operativa: agenti che non si limitano a generare testo, ma che possano intervenire in flussi di lavoro dove accuratezza, sicurezza e utilità misurabile diventano condizioni essenziali. In questa cornice, la promessa degli agenti non riguarda solo l’automazione, ma la possibilità di estendere il raggio d’azione dei professionisti in ambiti dove il costo dell’errore, la complessità delle decisioni e la necessità di coordinamento sono elevati.
Per le imprese, il passaggio dagli assistenti conversazionali agli AI agent introduce una domanda più difficile: come capire se un sistema sta davvero creando valore e non soltanto eseguendo passaggi formalmente corretti. Un benchmark come ALE risponde proprio a questa esigenza, perché prova a collocare gli agenti dentro attività concrete, misurabili e trasversali a molti comparti. Il riferimento ai 55 settori segnala che il confronto non è confinato a un singolo caso d’uso, ma guarda a una possibile infrastruttura di produttività diffusa.
L’ingresso di molti membri del team Virtue AI rafforza anche l’asse tra ricerca e sicurezza applicata. Se gli agenti devono agire in domini reali, la loro affidabilità non può essere trattata come un controllo successivo. Deve entrare nella progettazione, nella valutazione e nelle modalità con cui i sistemi vengono messi al lavoro. È qui che la competenza di Song, maturata tra accademia e impresa, può diventare un tassello strategico per i laboratori AI di Meta.
La direzione indicata è chiara: la competizione sugli agenti non si giocherà solo sulla potenza dei modelli, ma sulla capacità di dimostrare utilità, sicurezza e ritorno economico in attività verificabili. Con Song nei Superintelligence Labs, Meta porta questo tema al centro della propria ricerca: agenti più capaci, ma soprattutto più controllabili, pensati per lavorare con gli esseri umani nei processi in cui l’intelligenza artificiale deve produrre risultati concreti.