OpenAI rilascia Point-E per generare immagini 3D

News OpenAI rilascia Point-E per generare immagini 3D

1' 43''

29/12/2022

OpenAI ha rilasciato Point-E, un modello per la generazione di immagini 3D a partire da input testuali che supera gli altri in velocità.

Le tecnologie di generazione di immagini da testo fanno un altro passo avanti: OpenAI ha rilasciato Point-E, un algoritmo in grado di creare un modello 3D a partire da un input testuale.

Successore di DALL-E, il nuovo modello di machine learning può generare l'immagine tridimensionale in soli 2 minuti su una singola GPU. Il problema dei precedenti metodi di generazione 3D stava proprio nell'eccessivo tempo richiesto per produrre il modello.

Point-E lavora in due fasi principali: durante la prima genera una vista sintetica tramite un modello di diffusione text-to-image; in seguito produce una nuvola di punti nello spazio che rappresenta la forma dell'oggetto da renderizzare. Il primo modello è simile a quello usato da DALL-E e Stable Diffusion, mentre il secondo è un nuovo algoritmo addestrato su un set di coppie di immagini 2D-3D.

Rodion Kutsaiev on Pexels

Rispetto ad altri modelli di generazione 3D, Point-E ha un grado di precisione inferiore e in alcuni casi non riesce a interpretare correttamente l'input testuale. Gli errori si verificano più spesso nella seconda fase di generazione, quando il modello della nuvola di punti sbaglia a calcolare le proporzioni del soggetto o inferisce alcune parti non presenti.

Point-E non ha l'accuratezza di altri modelli per il 3D, ma è in assoluto il più veloce: i sistemi di generazione di immagini 3D impiegano ore o addirittura giorni per una singola immagine, mentre Point-E solo pochi minuti. Secondo i ricercatori di OpenAI, il modello può essere utilizzato per applicazioni pratiche come la stampa di oggetti 3D.

Lutz Peter on Pixabay

Si tratta comunque di un progetto ancora nelle fasi iniziali, che dovrà passare attraverso diverse fasi di perfezionamento per poter essere usato in ambito professionale. Point-E presenta molti limiti, primo fra tutti una risoluzione troppo bassa quando lavora con rappresentazioni 3D colorate. Inoltre, l'accuratezza del modello dipende fortemente dal dataset con cui è stato addestrato.

In ogni caso il modello può essere un ottimo punto di partenza per sviluppi futuri nel campo della generazione text-to-3D.

Condividi questo contenuto

BLOOM: l'LLM multilingua open-source più grande al mondo

BigScience ha presentato BLOOM, un nuovo LLM totalmente open-source frutto della collaborazione di migliaia di ricercatori di tutto il mondo.

31 gen 2025

News

OpenAI sta testando SearchGPT, il suo motore di ricerca intelligente

OpenAI ha annunciato SearchGPT, un motore di ricerca che usa l'intelligenza artificiale per offrire agli utenti risultati più rilevanti.

31 lug 2024

News

OpenAI vieta le sue tecnologie in Cina: comincia la guerra tech

La guerra tech sta per iniziare dopo la decisione storica di OpenAI: la compagnia di Sam Altman sta per bloccare l'accesso ai propri servizi in Cina e a Hong Kong. Sviluppatori e compagnie non potrann...

03 lug 2024

Opinioni

L'impatto dell'IA generativa è appena cominciato: parola del CTO di OpenAI

Mira Murati, CTO di OpenAI, ritiene che l'impatto dell'IA generativa sui business e sul mondo del lavoro è appena cominciato.

31 mag 2024

News OpenAI rilascia Point-E per generare immagini 3D

Marina Londei

Tempo di lettura: 1' 43''

Pubblicato il: 29/12/2022

Tags

Condividi questo contenuto

BLOOM: l'LLM multilingua open-source più grande al mondo

OpenAI sta testando SearchGPT, il suo motore di ricerca intelligente

OpenAI vieta le sue tecnologie in Cina: comincia la guerra tech

L'impatto dell'IA generativa è appena cominciato: parola del CTO di OpenAI

News OpenAI rilascia Point-E per generare immagini 3D Marina Londei Tempo di lettura: 1' 43'' Pubblicato il: 29/12/2022

Tags

Condividi questo contenuto

News OpenAI rilascia Point-E per generare immagini 3D

Marina Londei

Tempo di lettura: 1' 43''

Pubblicato il: 29/12/2022