Tecnologia Alibaba svela Wan Streamer, l'AI conversa come un umano
2' 32''
29/06/2026

Alibaba presenta Wan Streamer, modello AI end-to-end che conversa in tempo reale con voce, espressioni facciali e gesti sincronizzati.

Alibaba svela Wan Streamer, l'AI conversa come un umano

Alibaba ha svelato Wan Streamer, un modello di intelligenza artificiale progettato per rendere la conversazione con una macchina molto più simile a un'interazione faccia a faccia. Il sistema e pensato per vedere, ascoltare, elaborare e rispondere in tempo reale, combinando voce sincronizzata, espressioni del volto e gesti delle mani in un unico flusso conversazionale.

Il dato tecnico più significativo e la latenza sotto il secondo, abbinata a capacità full-duplex: Wan Streamer può ascoltare mentre parla, avvicinandosi alla dinamica naturale di una conversazione umana. Non si tratta quindi del classico chatbot che attende una domanda e restituisce una risposta testuale, ma di un assistente digitale che punta a replicare ritmo, presenza e segnali non verbali.

Nelle dimostrazioni, il modello ride in modo naturale, mantiene il contatto visivo, annuisce e sostiene conversazioni leggere su temi di intrattenimento quotidiano, inclusi i film di Stephen Chow. La combinazione di sguardo, mimica e risposta vocale sposta l'esperienza oltre la semplice interfaccia domanda-risposta, verso un interlocutore digitale immersivo.

Wan Streamer trasforma il chatbot in una presenza conversazionale quasi umana

Per le imprese, un modello di questo tipo apre scenari immediati in ambiti come customer service, formazione e educazione virtuale. Un assistente capace di parlare, ascoltare e reagire con segnali corporei coerenti potrebbe rendere più fluide le interazioni con clienti, studenti o utenti che cercano supporto. La promessa non è solo l'automazione, ma un'automazione che prova a ridurre la distanza emotiva percepita tra persona e macchina.

La stessa caratteristica introduce pero una zona più ambigua. Wan Streamer si colloca vicino alla cosiddetta uncanny valley, quella soglia in cui una rappresentazione quasi umana può risultare affascinante e insieme destabilizzante. Se un avatar digitale ride, annuisce e simula empatia con crescente precisione, la qualità dell'esperienza non dipende più soltanto dall'accuratezza della risposta, ma anche dalla fiducia che l'utente e disposto ad accordare a una presenza artificiale.

La latenza sotto il secondo rende il dialogo piu naturale e continuo

Il nodo generazionale emerge con forza. La Gen Z vive in ambienti digitali permanenti, ma allo stesso tempo mostra una domanda crescente di relazioni più dirette, esperienze non filtrate e comunità fisiche. In questo quadro, un assistente ultra-realistico può apparire come uno strumento potente per contenuti e servizi, oppure come un ulteriore livello sintetico in un ecosistema già saturo di mediazione tecnologica.

Wan Streamer e ancora una release di ricerca, non un prodotto maturo già descritto come pronto per l'adozione di massa. Proprio questa collocazione sperimentale ne rende interessante la traiettoria: il modello segnala l'avanzamento dei digital human, sistemi in cui linguaggio, voce, visione e movimento convergono per costruire una presenza artificiale sempre più credibile.

Il confine tra assistenza digitale ed empatia simulata diventa sempre piu sottile

La frontiera, a questo punto, non riguarda solo quanto un'AI sappia rispondere correttamente, ma quanto possa imitare i codici dell'empatia umana senza perdere trasparenza. Wan Streamer rappresenta un passaggio netto dal chatbot al compagno conversazionale: una prospettiva che può migliorare servizi e apprendimento, ma che impone a imprese e utenti di interrogarsi su quale tipo di relazione vogliano davvero instaurare con le macchine.

Fonte: radii.co

Condividi questo contenuto