Gran parte del codice sorgente di GitHub Copilot è stato copiato senza permesso da un paper accademico, senza che venissero pagati i diritti al creatore o venisse citato.
Copilot è un tool per la scrittura automatizzata del codice che sfrutta l'intelligenza artificiale per assistere gli sviluppatori in ambienti come Visual Studio, Visual Studio Code e IntelliJ.
A denunciare l'accaduto è Tim Davis, professore presso la Texas A&M University e scrittore del codice sotto copywright. Davis ha pubblicato in un post su Twitter due immagini per confrontare le linee di codice presenti nel paper e quelle di Copilot.
In effetti confrontando i due frammenti la somiglianza - o meglio, l'uguaglianza - salta subito all'occhio. Molte variabili hanno lo stesso nome, così come il metodo riportato e addirittura i commenti.
Davis ha affermato che Copilot ha copiato numerosi pezzi del codice riportati nel paper senza rispettare i diritti di proprietà intelletuale.
Il codice copiato riguarda metodi e algoritmi per risolvere problemi legati a matrici sparse. Gli stesso algoritmi sono usati da package open-source come GIMP, R e Octave.
Copilot non ha ancora risposto alle accuse, mentre Davis non è intenzionato a lasciare ulteriori dichiarazioni prima di confrontarsi con gli sviluppatori del tool.
Questa non è la prima volta che GitHub Copilot usa codice di altri senza autorizzazione: nel 2021 Armin Ronacher, sviluppatore di Flask, ha scoperto che il tool aveva generato il codice del videogame Quake copiandolo da altri repository senza rispettarne le licenze.