News Da Microsoft un framework open-source per ottimizzare i modelli generativi
Marina Londei
2' 33''
21/02/2023

I ricercatori di Microsoft hanno rilasciato un framework open-source per migliorare i risultati prodotti dai modelli generativi.

Da Microsoft un framework open-source per ottimizzare i modelli generativi

Microsoft ha reso open-source LMOps, un framework sviluppato da un team di ricercatori dell'azienda, pensato per semplificare e promuovere nuove best practice di sviluppo dei modelli generativi.

Il progetto di ricerca consiste in una serie di paper in cui i ricercatori illustrano nuove tecniche per migliorare le capacità dei modelli, in particolare per ottimizzare gli input forniti dagli utenti e aumentare il numero di prompt che il modello può gestire in fase di addestramento, così che possa consumare sequenze più estese di input.

Ottimizzare gli input per la generazione di immagini

Uno dei problemi più sentiti quando si usano i modelli generativi text-to-image è la differenza tra il risultato atteso e il risultato effettivo, non tanto per la qualità dell'immagine prodotta quanto per il rispetto delle "intenzioni" dell'utente.

Chi sta lavorando con questi modelli si sarà accorto che non sempre il modello riesce a cogliere tutte le sfumature che si volevano dare all'immagine: il risultato, seppur di alta qualità, si discosta da ciò che l'utente aveva in mente.

Freepik
ottimizzazione output immagini

I ricercatori hanno sviluppato Promptist, un'interfaccia per Stable Diffusion v1-4, che ottimizza l'input utente trasformando il testo in un input più comprensibile per il modello e che al contempo riesca a produrre un'immagine dettagliata e di qualità. Ciò che fa Promptist è parafrasare il testo in input per permettere al modello di generare immagini che si avvicinino il più possibile alle intenzioni dell'utente.

Nel caso, per esempio, dell'input "A rabbit is wearing a space suit", ciò che produce l'interfaccia è "A rabbit is wearing a space suit, digital Art, Greg
rutkowski, Trending cinematographic artstation": Promptist arricchisce il testo con ulteriori dettagli che permettono da una parte di rispettare la richiesta dell'utente, e dall'altra di produrre un'immagine di elevata qualità e ben dettagliata.

Consumare lunghe sequenze di input

Gli ultimi modelli sul mercato possiedono l'abilità di in-context learning, ovvero sono in grado di svolgere dei task per cui sono stati addestrati con pochi esempi. L'apprendimento in questo caso avviene senza aggiornare manualmente i parametri dell'algoritmo, che impara da solo dal contesto di input.

rawpixel.com - Freepik
in-context learning

Al momento i modelli generativi sono in grado di consumare input di lunghezza ridotta. Ciò limita significativamente il potenziale dell'in-context learning, che finora è stato testato con un numero esiguo di esempi.

Per ovviare al problema, i ricercatori di Microsoft hanno sviluppato lo structured prompting, un approccio che supera i limiti di lunghezza in input e permette ai modelli di scalare nell'abilità di in-context learning, riuscendo a lavorare anche con migliaia di esempi.

Invece di concatenare gli esempi uno dopo l'altro, come avviene nel prompting convenzionale, l'approccio di Microsoft divide gli esempi in diversi gruppi, ognuno dei quali viene codificato singolarmente dal modello. L'encoding, in questo modo, ritorna a una complessità lineare.

rawpixel.com - Freepik
structured prompting

Il progetto di Microsoft vuole supportare lo sviluppo dei large language model, facilitando le fasi di addestramento e migliorando anche la qualità dei risultati dei modelli generativi.

Potrebbe interessarti anche

Opinioni

I rischi legali e di conformità di ChatGPT, secondo Gartner

Gli analisti dell’azienda hanno identificato i principali pericoli collegati all’uso di ChatGPT in ambito professionale.

News

Salesforce annuncia l'integrazione tra Einstein GPT e Flow

L’azienda ha annunciato il prossimo rilascio, in versione beta, dell’integrazione tra il modello Einstein GPT e il siste...

Approfondimenti

IA nel customer care: l’impatto sulla produttività

Ricercatori di Stanford e del MIT hanno analizzato gli effetti dell’introduzione di un assistente AI nel customer care d...

Scenario

Mettere in sicurezza la supply chain del software con i LLM

Gli strumenti di intelligenza artificiale come ChatGPT possono fornire un supporto prezioso per individuare eventuali di...