eDiff-I: il modello text-to-image NVidia

News eDiff-I: il modello text-to-image NVidia

1' 34''

02/12/2022

Nvidia ha annunciato il suo modello di text-to-image confrontandolo coi migliori attualmente sul mercato: i risultati sono impressionanti.

Anche Nvidia è entrato nel mondo del text-to-timage con eDiff-I, il suo primo modello per la generazione di immagini a partire da un input testuale.

eDiff-I è in grado di generare immagini sia fotorealistiche che più astratte, esattamente come Stable Diffusion e Dall-E2, ma offre anche due nuove funzionalità: lo style transfer, che permette di controllare lo stile dell'output prendendo un'immagine di riferimento, e il paint with words, con la quale l'utente può definire la struttura dell'ambientazione di output disegnando uno "schema" in cui ogni segmento corrisponde a un input testuale.

Lum3n on Pexels

Nvidia ha pubblicato i risultati di alcuni test effettuati confrontando il suo modello con gli altri due principali. Esaminando gli output dei tre modelli a partire da uno stesso input testuale si nota come eDiff-I produca immagini molto più dettagliate e fedeli alla descrizione dell'utente, oltre che di qualità elevata.

Lo style transfer si rivela uno strumento molto potente e preciso: data un'immagine da cui prendere lo stile ed estratto questo come vettore di riferimento, lo si può applicare a una qualsiasi immagine generata per modificarne profondamente l'aspetto.

Come negli altri modelli, è comunque possibile specificare uno stile di disegno già nell'input testuale, che sia realistico, in pixel art, ispirato a una corrente artistica o a un artista in particolare.

Ann H on Pexels

Paint with words invece permette all'utente di specificare la posizione degli oggetti nella scena, controllandone anche altezza ed estensione. L'input in questo caso non è solo testuale: per ogni soggetto rappresentato, ma anche per lo sfondo, è possibile "scarabocchiarlo" nella scena per avere un maggior controllo dell'output.

eDiff-I si è rivelato il modello più preciso tra i tre messi a confronto, discostandosi di molto dai risultati ottenuti dagli altri due. Dal modello emergono una precisione e una qualità senza eguali, almeno per il momento.

Condividi questo contenuto

Le nuove restrizioni sull'export dei chip potrebbero minare l'impero di NVIDIA

Le nuove restrizioni sull'esportazione dei chip in Cina mettono a rischio la posizione competitiva di NVIDIA, favorendo la concorrenza.

23 nov 2023

News

Microsoft potrebbe presentare a breve il suo primo chip per l'IA

Secondo alcune indiscrezioni, Microsoft starebbe per presentare il suo primo chip dedicato all'IA. L'annuncio è atteso durante Ignite 2023.

11 ott 2023

News

TensorRT-LLM di NVIDIA moltiplica le performance di inferenza delle GPU

NVIDIA ha annunciato il rilascio di TensorRT-LLM, un software che potenzia le performance delle GPU per l'inferenza degli LLM .

12 set 2023

Opinioni

L'impatto di GH200 di NVIDIA sul mercato dei chip e sull'IA

Il nuovo superchip Grace Hopper GH200 di NVIDIA potrebbe portare a un cambiamento significativo nel mondo dell'intelligenza artificiale.

17 ago 2023

News eDiff-I: il modello text-to-image NVidia

Marina Londei

Tempo di lettura: 1' 34''

Pubblicato il: 02/12/2022

Tags

Condividi questo contenuto

Le nuove restrizioni sull'export dei chip potrebbero minare l'impero di NVIDIA

Microsoft potrebbe presentare a breve il suo primo chip per l'IA

TensorRT-LLM di NVIDIA moltiplica le performance di inferenza delle GPU

L'impatto di GH200 di NVIDIA sul mercato dei chip e sull'IA

News eDiff-I: il modello text-to-image NVidia Marina Londei Tempo di lettura: 1' 34'' Pubblicato il: 02/12/2022

Tags

Condividi questo contenuto

News eDiff-I: il modello text-to-image NVidia

Marina Londei

Tempo di lettura: 1' 34''

Pubblicato il: 02/12/2022