Databricks ha rilasciato Dolly 2.0, l’ultima versione del modello di linguaggio di grandi dimensioni interattivo, che segue di sole due settimane il debutto della prima versione.
Dolly 2.0 è il primo LLM (large language model) open-source liberamente utilizzabile per scopi commerciali.
Si basa su un insieme di istruzioni trasparenti e su un dataset open-source, che sono disponibili senza la necessità di pagare l'accesso API o condividere i dati con terze parti.
Secondo il CEO di Databricks, Ali Ghodsi, sebbene esistano altri LLM utilizzabili per scopi commerciali, nessuno di essi è paragonabile a Dolly 2.0.
Gli utenti possono modificare e migliorare i dati di formazione poiché sono disponibili gratuitamente sotto licenza open-source, consentendo loro di creare la propria versione di Dolly.
Accesso illimitato
Il set di dati su cui Dolly 2.0 è stato addestrato, chiamato databricks-dolly-15k, è stato anche rilasciato come corpus di oltre 15.000 record generati da migliaia di dipendenti Databricks.
Questo corpus è il primo ad essere stato progettato per consentire a un linguaggio di grandi dimensioni di mostrare un'interattività simile a ChatGPT.
Databricks ha aggirato questo problema addestrando Dolly 2.0 su un piccolo corpus di record di istruzioni open source generati dai dipendenti di Databricks. I termini di licenza di questo set di dati ne consentono l'utilizzo, la modifica e l'estensione per qualsiasi scopo, comprese le applicazioni accademiche o commerciali.
Molti modelli sono stati addestrati sull'output ChatGPT, ma queste procedure si collocano in una zona grigia dal punto di vista legale. “Molti stanno rilasciando modelli di questo genere, ma nessuno di loro potrebbe essere utilizzato commercialmente", ha detto Ghodsi.
Ali Ghodsi ha sottolineato che il modello ha dimensioni ridotte e un’alta qualità; per questo il livello di sforzo e spesa necessari per costruire tecnologie di intelligenza artificiale potenti è inferiore a quanto immaginato in precedenza.
Inoltre, Ghodsi crede che Dolly 2.0 avvierà un effetto “palla di neve” nella comunità dell'AI, e che altri sviluppatori potranno unirsi per sviluppare nuove alternative.
Il limite all'uso commerciale, che è stato un ostacolo fino ad ora, è stato superato aprendo la strada a molte nuove applicazioni.