Etterretning, etterrettelighet og moderne lovgiving

Av og til lurer jeg på hva de røyker oppe på Lutvann.

Espen Andersen. Foto: BI

Espen Andersen

23. apr. 2019 - 13:34

Denne kommentaren gir uttrykk for skribentens meninger.

Etterretningstjenesten har prestert to spektakulære skivebommer i det siste. De har sendt en pensjonert grenseinspektør til Moskva med kontanter i konvolutter. Og de har kommet med et lovforslag om lagring av «grensekryssende» data som er blitt slaktet av Datatilsynet, Politiets Sikkerhetstjeneste og Riksadvokaten, tre enheter som inntil dette forslaget kom ikke har vært enige om noe som helst.

Om Espen Andersen

Espen Andersen (www.espen.com) er førsteamanuensis i strategi ved BI, førsteamanuensis II ved Institutt for Informatikk ved UiO, konsulent, foredragholder og svært utålmodig kommentator. Han sendte sin første epost i 1985 og synes digitaliseringen av Norge går altfor sent.

Begge episoder viser at dette er en organisasjon som lever i fortiden. Kontanter i konvolutter? Til og med kidnappere på Lillestrøm har sluttet med den slags. Og «grensekryssende» data? Hvis du (som nordmann) sender en epost til en annen nordmann, om det så er fra et hus til nabohuset, er sjansen stor for at eposten krysser grensen (i hvert fall om du har Gmail eller sender en melding via Facebook eller Instagram.) Resultatet er at E-tjenesten blir sittende med masse data de ikke har lov til å ha, uten at det ser ut til å bekymre dem.

Jeg er imidlertid nokså bekymret, særlig etter å ha vært på et Civita-seminar forleden, der det ble nokså klart for meg at deltakerne (med unntak av en skarp professor fra NTNU, Lise Lyngsnes Randeberg, som også er president i Tekna) var fokusert på innsamlingen av dataene, ikke hva som skjer med dem etterpå. Og jeg er stygt redd for at professorens poeng ikke kom godt nok frem, så la meg lage et lite resonnement her. (Og ja, det vil ta litt tid. Kompliserte ting gjør det. Men dette er viktig.)

Maskinlæring mot terrorisme *

Med store datamengder (og det E-tjenesten vil ha, er enormt) kan man bruke maskinlæring for å innsnevre det man leter etter. Dette blir ofte fremstilt som at man bruker «kunstig intelligens» for å finne terrorister og spioner, en slags automagisk teknologi som spinner gjennom høystakker og finner nålen.

Virkeligheten er litt mer prosaisk.

Skal man lære opp en datamaskin til å finne terrorister, trenger man et treningssett – et datasett med vanlige mennesker og beviste terrorister. La oss ta flydata som et eksempel: I fjor var det omtrent fire milliarder flyturer i verden. La oss si at vi har alle passasjerdataene, og vil bruke dem for å bestemme hvilke passasjerer som er mulige terrorister. To problemer melder seg øyeblikkelig: Vi vet ikke hvordan en terrorist ser ut, selv om vi har noen få observasjoner. Innen maskinlæring kalles dette et ubalansert datasett - det er enormt mange uskyldige, og svært få terrorister. Det finnes teknikker for å gjøre noe med dette, men de reduserer modellens treffsikkerhet.

Det andre problemet har med prosentregning å gjøre. Sett at vi klarer å lage en modell som identifiserer terrorister med fantastiske 99 prosent sikkerhet (og bare så det er klart, det vil vi aldri klare). Det betyr at 1 prosent av alle flyvninger vil klassifiseres som mulige terrorister - og 1 prosent av fire milliarder er 40 millioner...

Siden antallet reelle terrorister er svært få (la oss ta i litt og si 10 000 i løpet av et år) så betyr det at 99,99975 prosent av de som blir identifisert som terrorister ikke er det. Dette kalles «falske positive». (Det omvendte av «falske positive» er «falske negative», i dette eksempelet terrorister vi ikke finner. Det er nok en del av dem også.)

Å være «falsk positiv» - bli feilaktig identifisert som mulig terrorist – er ikke særlig morsomt. Jeg kjenner en person som havnet på USAs «no-fly» liste fordi han hadde det samme navnet (et svært vanlig navn) som en mulig terrorist. Det betød timevis med avhør og tapte flyavganger hver gang han skulle ut og reise.

Men dere hadde jo dataene…

Det E-tjenesten ikke ser ut til å forstå, er at det å ha en enorm datamengde bare vil føre til at de havner i heisen neste gang vi får en terroraksjon, og at man deretter kan finne at E-tjenesten (eller, for den saks skyld, PST) hadde data om terroristen men ikke kunne finne dem.

Anders Behring Breivik lå inne i en database over folk som hadde kjøpt visste typer kjemikalier fra utlandet. Han hadde bakgrunn fra ulike diskusjonsfora og en hel del andre indikasjoner på at ting ikke var helt på stell. Men PST eller E-tjenesten klarte ikke å identifisere ham som en fare. Det er fullt forståelig, for indikasjonene var svake, og det var ingen mangel på folk med de samme indikasjonene som ikke hadde tenkt å massemyrde barn.

Så kan man alltids si at E-tjenesten og politiet og etter hvert flere og flere offentlige og private aktører har enorme data allerede, og disse dataene kan i alle fall brukes til å bygge en bevisrekke post faktum. Det er så, men hvis det er dette som er hensikten, så er det faktisk ulovlig i henhold til EUs domstol: Datalagringsdirektivet, der hensikten var nettopp å samle inn masse kommunikasjonsdata i tilfelle noen av de man lagret skulle komme til å gjøre noe galt de neste seks månedene, ble forbudt av EUs egen domstol i 2014.

Quis custodiet ipsos custodes? **

Det er nokså klart at mange av de dataene vi skaper gjennom vår kommunikasjon er interessant og legitimt materiale for etterretningsvesen, politi og andre instanser. Men mengden data som samles, hvor lett man kan sammenstille dem, og hva de forteller om oss gjør at muligheten for misbruk er enormt mye større enn den tidligere har vært. Tenk deg å forsøke å være Gunnar Sønsteby i en digital verden. Spørsmålet er hvordan man skal lovregulere og kontrollere innsamling og bruk av data.

Bjørn Erik Thon, leder for Datatilsynet, hadde et utmerket forslag: Kom med et lovforslag som spesifiserer kontrollorganene og reglene for bruk, i detalj, først. Det er nemlig de innsamlende myndigheter som skriver lovforslag, og et effektivt kontrollregime er noe som kommer som et tillegg etterpå, gjerne som noe som skal utvikles etter hvert.

Dette forslaget er faktisk svært moderne og i tråd med en systemutviklingsmetode kalt Extreme Programming – der man skriver testene før man skriver programmet. På den måten sikrer man at det nye programmet virker korrekt første gang det blir skrevet.

Enda bedre: Hva om vi innførte en lov som sa at man ikke kunne foreslå nye lover uten at man først hadde utviklet, budsjettert og organisert kontrollmekanismene for den?

Det ville være å ta den lovgivende makt inn i et moderne verdensbilde, og samtidig sikre at våre rettigheter som privatpersoner ville ha i alle fall en liten sjanse til å bli ivaretatt i en fremtid der agendaen settes av de som vil ha informasjonen heller enn de som vil at den ikke skal kunne benyttes. Og det ville sikre at vi ikke implementerer ting vi ikke kan kontrollere.

Hva med litt extreme legislation?

Fotnoter:
* Jada, E-tjenesten skal ikke alltid finne terrorister, det er PSTs jobb. Men oppgavene ligner og dette er et eksempel.
** Hvem skal passe på dem som passer på. Juvenal, 100 e.kr. Slå det opp.

Debatt E-tjenesten Tversoversk

Kommentarer

Du må være innlogget hos Ifrågasätt for å kommentere. Bruk BankID for automatisk oppretting av brukerkonto. Du kan kommentere under fullt navn eller med kallenavn.

Se flere jobber

Tre jobbtilbud 10 måneder før masteravslutning!

Les mer

Fagleder Datainnsikt og Rapportering

Cyber Security Researcher

Direktoratet for strålevern og atomsikkerhet

Dataansvarlig senioringeniør / seniorrådgiver atomberedskap

Få annonsen din her og nå frem til de beste kandidatene

Lag en bedriftsprofil

En tjeneste fra