Hugging Face, in collaborazione con ServiceNow, ha annunciato la disponibilità di StarCoder, un sistema di IA generativa specifico per la programmazione.
Lo strumento si presenta come un’alternativa open-source a Copilot e ChatGPT. Il tool fa parte del progetto BigCode che mira a realizzare un sistema di IA open source in grado di rispondere ai requisiti di affidabilità e trasparenza dei modelli.
StarCoder conta 15 miliardi e mezzo di parametri ed è stato addestrato su più di 80 linguaggi di programmazione utilizzando codice e informazioni provenienti da centinaia di repository di GitHub, compresi i commit, le issue e Jupyter notebook.
Secondo i dati condivisi da Hugging Face, StarCoder ha superato le performance degli LLM open source esistenti sui principali benchmark di programmazione. Lo strumento può essere usato per apportare modifiche al programma, completare in maniera automatica il codice, generare dei test case e fornire una spiegazione in linguaggio naturale di una porzione di codice.
StarCoder può essere anche usato come chatbot per rispondere a numerose questioni di carattere tecnico: essendo stato addestrato sulla documentazione e le issue dei progetti GitHub, il modello è in grado di elaborare la conoscenza e fornire risposte a domande di più alto livello.
“Crediamo che con le sue performance StarCoder diventerà un fondamento per la comunità che potrà usarlo e adattarlo ai propri casi d’uso e prodotti” hanno affermato Loubna Ben Allal e Leandro von Werra di Hugging Face.
“La collaborazione tra ServiceNow e Hugging Face estende il nostro impegno di lunga data per l’IA d’eccellenza” ha affermato Harm de Vries, a capo del Large Language Model Lab di ServiceNow e co-leader del progetto BigCode. “Le nuove pratiche di IA responsabile per addestrare e condividere i Large Language Model sono vitali per assicurare che i protocolli, le tutele e le licenze siano ben definiti per nostri clienti, e StarCoder lo sta rendendo possibile”.
StarCoder è stato rilasciato con licenza BigCode OpenRAIL-M che garantisce l’accesso libero allo strumento e il riutilizzo e la distribuzione del codice sorgente. Il tool è già disponibile come estensione per Visual Studio Code.