KUNSTIG INTELLIGENS

Githubs automatiske kodeverktøy ligger i en juridisk gråsone

Reiser spørsmål om mulig brudd på opphavsrett.

Githubs maskot Octocat.
Githubs maskot Octocat. Illustrasjon: Github
16. juli 2021 - 12:00

Kort tid etter at Github lanserte Copilot i samarbeid med Open AI, kom de første synlige tegn på at Github bruker all åpen kode på sin plattform til å lære opp den kunstige intelligensen.

Det amerikanske nettstedet The Verge skriver at programvareingeniøren Kyle Peacock delte en kodesnutt på Twitter der Copilot hadde generert en «om meg» side.

Den kunstige intelligensen hadde lagt inn en lenke til Github-profilen til programmereren David Celis. Celis har tidligere jobbet for Github og har store mengder koder liggende åpent på Github.

Bekymret for opphavsrett 

Til The Verge sier Celis at han ikke er overrasket og ikke bryr seg om at en algoritme skriver ut hans navn. Han er derimot bekymret over problemene det kan bli med opphavsrett hvis Github snapper opp all kode den kan komme over for å trene den kunstige intelligensen.

Github-sjef Nat Friedman sier at selskapet er innenfor lovverket og at bruk av kode til trening av AI går under det amerikanske rettsprinsippet «fair use». Github er ikke de eneste som bruker tilgjengelig data på nett, men som selskapet ikke eier, til å trene AI.

Et eksempel er den kunstige intelligensen Imagenet, som skraper bilder fra internett for å ha noe den kan trene på.

De nye Copilot+ PC-ene kom med en ny KI-funksjon som raskt ble kontroversiell, men Microsoft insisterer på at «Recall» nå er trygg.
Les også

Ble kalt et «sikkerhetsmareritt» – slik beroliger Microsoft kundene

Ingen rettslige føringer

Selv om Celis og Github sier kodetreningen faller under «fair use», er det ingen rettslig presedens som tilsier at det er lov eller ikke lov. Uten noen dom er det stor usikkerhet om hva som faktisk er greit eller ikke.

Det nærmeste man kommer er da Google vant retten til å opprettholde Google Books som en database for maskinlæring. Problemet blir når en kunstig intelligens bruker andres løsninger på kodeproblemer og ukritisk skriver dem inn i koden din.

Da er det ikke lenger trening, men faktisk bruk i et sluttprodukt. Her glir man, ifølge to jusprofessorer ved Stanford, inn i gråsonen.

Det betyr at å bruke Githubs Copilot kan være risikofylt, men at det mest sannsynlig ikke er noe stort problem. Et alternativ for Github kan være å sørge for å legge inn kreditering når Creative Commons-kode blir brukt.

Hva som er lov eller ikke basert på amerikanske lover, vil ikke blir avgjort før noen saksøker og det foreligger en rettskraftig dom.

Google har inngått en avtale med Reddit, som gir giganten eksklusiv tilgang til ferske Reddit-data.
Les også

Reddit ekskluderer søkemotorer

Del
Kommentarer:
Du kan kommentere under fullt navn eller med kallenavn. Bruk BankID for automatisk oppretting av brukerkonto.