Stable Diffusion 2.0: nuova profondità per l'image to image

News Stable Diffusion 2.0: nuova profondità per l'image to image

1' 7''

25/11/2022

Stability AI ha rilasciato la versione 2.0 di Stable Diffusion. Tra le nuove feature c'è anche depth2img per preservare la profondità della scena.

Stability AI ha rilasciato la nuova versione di Stable Diffusion che, tra le altre novità, aggiunge la feature depth2img, un nuovo modello per la definizione della profondità nei processi IA di image-to-image.

Il modello inferisce la profondità di un'immagine di input e ne genera di nuove mantenendo la struttura originaria, senza perdere informazioni. La nuova feature permette di trasformare totalmente l'immagine senza alterare la coerenza e la profondità dell'originale.

A differenza dei modelli precedenti, dove le uniche informazioni disponibili erano quelle dei pixel e delle definizioni testuali, ora la generazione di immagini si arricchisce di nuovi dettagli per preservare le caratteristiche dell'input.

Il modello genera una mappa di profondità simile a quella usata dagli smartphone per l'effetto sfocatura Bokeh nelle foto, per risaltare il soggetto della foto rispetto al background.

Depth2img usa MiDas di Intel, un modello per il calcolo della profondità relativa di un'immagine. Si parla in questo caso di monocular depth estimation, ovvero della stima della profondità di un singolo pixel in relazione alla telecamera della scena. Questo passaggio è fondamentale per calcolare la coerenza dell'ambiente.

La potenza dell'approccio può essere sfruttata non solo nei task di image-to-image, ma anche per la ricostruzione 3D delle scene, anche in ambito cinematografico, i sistemi di guida autonoma e di realtà aumentata.

Condividi questo contenuto

Una nuova era di creatività o una minaccia per la società?

L'IA generativa promette di espandere la creatività umana, ma solleva preoccupazioni per l'impatto sulla società e sull'economia.

30 gen 2025

Approfondimenti

Usare prompt negativi per migliorare le immagini generate

Max Woolf, data scientist di BuzzFeed, ha sperimentato l'uso dei prompt negativi per migliorare la generazione di immagini a partire da output errati.

25 ago 2023

Tecnologia

Un modello generativo trasforma in immagini le idee degli stilisti

Un gruppo di ricercatori di tre università italiane ha sviluppato un modello capace di trasformare gli schizzi e i prompt testuali in immagini realistiche.

27 apr 2023

Tecnologia

Un sistema ML trasforma gli schizzi in modelli 3D

Un gruppo di ricercatori della Carnegie Mellon University ha presentato i risultati di una ricerca per realizzare un sistema di generazione 3D interattivo.

12 apr 2023

News Stable Diffusion 2.0: nuova profondità per l'image to image

Marina Londei

Tempo di lettura: 1' 7''

Pubblicato il: 25/11/2022

Tags

Condividi questo contenuto

Una nuova era di creatività o una minaccia per la società?

Usare prompt negativi per migliorare le immagini generate

Un modello generativo trasforma in immagini le idee degli stilisti

Un sistema ML trasforma gli schizzi in modelli 3D

News Stable Diffusion 2.0: nuova profondità per l'image to image Marina Londei Tempo di lettura: 1' 7'' Pubblicato il: 25/11/2022

Tags

Condividi questo contenuto

News Stable Diffusion 2.0: nuova profondità per l'image to image

Marina Londei

Tempo di lettura: 1' 7''

Pubblicato il: 25/11/2022