I løpet av de siste par dagene har Deepseeks språkmodell V3 blitt den høyest ratede appen på Apples App Store, og R1, som er mer rettet mot resonnering, er ,den mest nedlastede modellen på Hugging Face. Ikke dårlig for en språkmodell (LLM) som ble utviklet av et kinesisk softwareselskap ingen tidligere hadde hørt om og med utviklingskostnader under den gjennomsnittlige årslønnen til en mellomleder i Meta.
Mange har kommentert at dette er en fantastisk ting, og det er unektelig en fantastisk ting at utviklingskostnadene og energiforbruket ved språkmodeller blir kuttet dramatisk. Nerdene blant oss vil sikkert også kose seg over at uveiledet maskinlæring nå er tilbake i business, og beskrivelsen av at systemet dermed er i stand til selv å utvikle strategier for problemløsning på autonomt vis (omtalt som «the aha moment» i referansenotatet som følger modellen på GitHub), er nesten litt skremmende.
Se gjennom brukervilkårene
Men før man kaster seg på bølgen, laster ned Deepseek på jobbens mobiltelefon og går i gang med å forbedre bedriftens strategiplan med en modell som faktisk resonnerer bra, kan det være en tanke å bruke noen minutter på brukervilkårene.
For det første kan det være lurt å gjøre seg noen tanker over lovvalgsbestemmelsen i brukervilkårenes pkt. 9, og til opplysning har plattformvilkårene samme bestemmelse. Den sier at alle tvister rundt bruken ligger under kinesisk lov og skal avgjøres ved en domstol i Hangzhou. Det er jo interessant når personvernerklæringen forteller at informasjonen som samles inn om deg, lagres på en sikker server i folkerepublikken Kina.
PC-vanene dine lagres
Og vær ikke i tvil, det er mye data som lagres ifølge personvernerklæringen: Brukerinput, inklusive prompter og opplastede dokumenter, men også det de kaller automatisk innhentet informasjon – som går fra cookies og detaljerte opplysninger om telefonen eller pc’en du bruker for å logge deg på og helt ned til hvordan du bruker keyboardet («keystroke patterns or rhythms»).
Dette ble lagret av enkelte amerikanske HR-programmer for 15 år siden for å måle de ansattes ytelse, men droppet da selv amerikanske arbeidsgivere mente det var å gå for langt. Videre innhenter de informasjon fra uspesifiserte tredjeparter om slike ting som dine aktiviteter på andre websider, på apper og i nettbutikker. Alt sammen trygt lagret på en server i Kina. Flere detaljer om dette finner du i personvern-erklæringen.
Dokumentene går til myndighetene
Men det er heller ikke alt. Ifølge brukervilkårenes pkt. 7.2 gjelder det at «For adferd som mistenkes å være i strid med lover og forskrifter eller som involverer ulovlige aktiviteter, vil relevante opptegnelser bli beholdt, og det vil bli rapportert til de kompetente myndigheter i henhold til loven, samt samarbeidet med deres etterforskning.»
Med andre ord, hvis du legger inn spørsmål eller dokumenter som mistenkes å være i strid med (kinesiske) lover og forskrifter, vil disse bli kopiert, lagret og rapportert til myndighetene.
Så har du tenkt å bruke Deepseek til å bearbeide Amnesty Internationals rapporter om uigurers levevilkår, kan det tenkes at du bør unngå mellomlandinger i Hongkong i tiden fremover.
Må rapportere sikkerhetsbrudd
En annen sak er at Kina faktisk har en omfattende regulering av kunstig intelligens (KI), som Deepseek, Tiktok, Temu og andre nettsteder som har grensesnitt mot vestlige brukere, er dekket av. Mennesker som jobber med IT-sikkerhet har i lengre tid vært bekymret over en kinesisk forskrift om forvaltning av sårbarheter i nettverksprodukter fra 2021. Denne gir softwareleverandører i Kina rapporteringsplikt for sikkerhetshull innen 48 timer etter at de er oppdaget, samtidig som de har forbud mot å offentliggjøre sårbarheten før en oppdatering er tilgjengelig. Tilsynelatende er det fornuftig å ti stille om sikkerhetshull inntil man har plugget dem, men så var det denne rapporteringsplikten da.
Det skal ikke mye paranoia til for å tenke seg en situasjon hvor Deepseeks informasjonsinnhenting om telefonen din avdekker et sikkerhetshull i jobbens IT-systemer, som umiddelbart må rapporteres til det kinesiske Industri- og informasjonsteknologideparteme
Teknologisk gjennombrudd
Og det er før vi går inn på problemene med å få ut informasjon om slike ting som Tianmen, behandlingen av minoriteter eller for den saks skyld bare om Ole Brumm.
Det tar neppe lang tid før systemet blir litt bedre, slik at alignment slår inn før resultatet fra språkmodellen presenteres på skjermen, men når man bruker en modell utviklet i et diktatur, bør man ikke bli overrasket over at resultatene sensureres. Det kan jo i seg selv bli interessant etterhvert som handelskrigen mellom USA og Kina utvikler seg og det kinesiske kommunistpartiet føler behov for å sensurere viktigere ting enn Ole Brumm.
Så på den positive siden er dette så absolutt et teknologisk gjennombrudd som kommer til å gjøre KI enklere, billigere og kanskje også i stand til å resonnere bedre. Men først bør man nok tenke ganske nøye over hva man laster opp på Deepseek og hvor man laster ned den appen.
Høyteknologisk handelskrig tilspisser seg