Spotify sta lavorando a un brevetto di un sistema text-to-speech per automatizzare la creazione delle inserzioni e personalizzarle.
VALL-E è il modello text-to-speech di Microsoft in grado di replicare l'inflessione e il timbro della voce di input in soli 3 secondi.