Kort tid etter at Github lanserte Copilot i samarbeid med Open AI, kom de første synlige tegn på at Github bruker all åpen kode på sin plattform til å lære opp den kunstige intelligensen.
Det amerikanske nettstedet The Verge skriver at programvareingeniøren Kyle Peacock delte en kodesnutt på Twitter der Copilot hadde generert en «om meg» side.
Den kunstige intelligensen hadde lagt inn en lenke til Github-profilen til programmereren David Celis. Celis har tidligere jobbet for Github og har store mengder koder liggende åpent på Github.
Bekymret for opphavsrett
Til The Verge sier Celis at han ikke er overrasket og ikke bryr seg om at en algoritme skriver ut hans navn. Han er derimot bekymret over problemene det kan bli med opphavsrett hvis Github snapper opp all kode den kan komme over for å trene den kunstige intelligensen.
Github-sjef Nat Friedman sier at selskapet er innenfor lovverket og at bruk av kode til trening av AI går under det amerikanske rettsprinsippet «fair use». Github er ikke de eneste som bruker tilgjengelig data på nett, men som selskapet ikke eier, til å trene AI.
Et eksempel er den kunstige intelligensen Imagenet, som skraper bilder fra internett for å ha noe den kan trene på.
Ble kalt et «sikkerhetsmareritt» – slik beroliger Microsoft kundene
Ingen rettslige føringer
Selv om Celis og Github sier kodetreningen faller under «fair use», er det ingen rettslig presedens som tilsier at det er lov eller ikke lov. Uten noen dom er det stor usikkerhet om hva som faktisk er greit eller ikke.
Det nærmeste man kommer er da Google vant retten til å opprettholde Google Books som en database for maskinlæring. Problemet blir når en kunstig intelligens bruker andres løsninger på kodeproblemer og ukritisk skriver dem inn i koden din.
Da er det ikke lenger trening, men faktisk bruk i et sluttprodukt. Her glir man, ifølge to jusprofessorer ved Stanford, inn i gråsonen.
Det betyr at å bruke Githubs Copilot kan være risikofylt, men at det mest sannsynlig ikke er noe stort problem. Et alternativ for Github kan være å sørge for å legge inn kreditering når Creative Commons-kode blir brukt.
Hva som er lov eller ikke basert på amerikanske lover, vil ikke blir avgjort før noen saksøker og det foreligger en rettskraftig dom.
Reddit ekskluderer søkemotorer