OpenAI har hatt braksuksess med sin avanserte snakkerobot ChatGPT, men kontroversene har heller ikke latt vente på seg. Nå har selskapet blitt saksøkt av en amerikansk komiker, rapporterer den britiske avisen The Guardian.
Det er Sarah Silverman, kjent som standup-komiker og skuespiller, som nå saksøker både OpenAI og Facebooks moderselskap Meta. Bakgrunnen er brudd på opphavsretten.
Kopierte bøker
OpenAIs kreasjon ChatGPT er som kjent trent på store mengder menneskeskapte data. I dette tilfellet skal snakkeroboten ifølge søksmålet ha blitt trent på opphavsbeskyttet materiale som tilhører komikeren, utenat selskapet ha fått tillatelse på forhånd.
Silverman har også levert søksmål mot Meta med samme begrunnelse. Meta lanserte sin ChatGPT-konkurrent LLaMA (Large Language Model Meta AI) tidligere i år, og også denne trenes på store mengder data.
Søksmålet dreier seg spesifikt om en selvbiografisk bok forfattet av Silverman, kalt The Bedwetter. To andre forfattere er også involvert i søksmålet, Christopher Golden og Richard Kadrey.
I søksmålsdokumentet hevdes det at OpenAI kopierte mange bøker under treningen av GPT-3-modellen, forgjengeren til dagens GPT-4 som ChatGPT er basert på. Det hevdes videre at en betydelig andel av bøkene som modellene er trent på, aldri er blitt offentliggjort av OpenAI, og verkene til saksøkerne skal altså være blant disse.
– Mye av materialet in OpenAIs datasett kommer fra opphavsbeskyttet arbeid – inkludert bøker skrevet av saksøkerne – som ble kopiert uten samtykke, uten kreditering og uten kompensasjon, heter det i dokumentet. Lignende formuleringer benyttes i søksmålet mot Meta.
Mange er bekymret
Den saksøkende part hevder at det er spesielt attraktivt for AI-aktører å trene modellene på bøker, siden de inneholder mye tekst på ett sted og derfor er godt egnet for formålet.
– Mange typer materiale har blitt brukt til å trene store språkmodeller. Bøker har imidlertid alltid vært en nøkkelingrediens i treningsdatasett for store språkmodeller fordi bøker representerer de beste eksemplene på langformatskriving av høy kvalitet, står det i dokumentet.
Adferden til de saksøkte partene fortsetter å påføre forfatterne stor, «uopprettelig» skade som ikke kan kompenseres for eller måles i penger, hevder advokatene. Likevel kreves det erstatning for skadene, og partene krever også endringer i måten ChatGPT fungerer på.
Som The Guardian peker på, har advokatene som representerer forfatterne, opprettet en egen nettside i forbindelse med søksmålet. Der hevder advokatene at de har blitt kontaktet av mange andre innholdsskapere som er urolige for utviklingen.
– Siden lanseringen av OpenAIs ChatGPT-system i mars 2023 har vi hørt fra skribenter, forfattere og utgivere som er bekymret over dens nifse evne til å generere tekst som ligner på den som finnes i opphavsbeskyttet tekstmateriale, inkludert tusenvis av bøker, skriver advokatene.