News GitHub Copilot ha copiato codice sotto copyright
1' 16''
03/11/2022

I creatori di GitHub Copilot hanno copiato del codice da un paper senza citarne l'autore o rispettare le licenze di utilizzo.

GitHub Copilot ha copiato codice sotto copyright

Gran parte del codice sorgente di GitHub Copilot è stato copiato senza permesso da un paper accademico, senza che venissero pagati i diritti al creatore o venisse citato.

Copilot è un tool per la scrittura automatizzata del codice che sfrutta l'intelligenza artificiale per assistere gli sviluppatori in ambienti come Visual Studio, Visual Studio Code e IntelliJ.

A denunciare l'accaduto è Tim Davis, professore presso la Texas A&M University e scrittore del codice sotto copywright. Davis ha pubblicato in un post su Twitter due immagini per confrontare le linee di codice presenti nel paper e quelle di Copilot.

In effetti confrontando i due frammenti la somiglianza - o meglio, l'uguaglianza - salta subito all'occhio. Molte variabili hanno lo stesso nome, così come il metodo riportato e addirittura i commenti. 

https://pixabay.com/photos/code-programming-computer-data-1486361/
GitHub Copilot

Davis ha affermato che Copilot ha copiato numerosi pezzi del codice riportati nel paper senza rispettare i diritti di proprietà intelletuale.

Il codice copiato riguarda metodi e algoritmi per risolvere problemi legati a matrici sparse. Gli stesso algoritmi sono usati da package open-source come GIMP, R e Octave. 

Copilot non ha ancora risposto alle accuse, mentre Davis non è intenzionato a lasciare ulteriori dichiarazioni prima di confrontarsi con gli sviluppatori del tool. 

Questa non è la prima volta che GitHub Copilot usa codice di altri senza autorizzazione: nel 2021 Armin Ronacher, sviluppatore di Flask, ha scoperto che il tool aveva generato il codice del videogame Quake copiandolo da altri repository senza rispettarne le licenze.