NRK Brennpunkt lanserte i går Maktbasen, et nettbasert verktøy som ved hjelp av data fra ulike kilder gjør det mulig for journalister og befolkningen forøvrig å kontrollere habiliteten til politikere både på lokalt og nasjonalt plan i forhold til selskapet og bransjer.
digi.no har snakket med Espen Andersen om hvordan tjenesten er laget. Andersen er både journalist og utvikler i NRK faktaavdelingen.
Han forteller at det meste av dataene i Maktbasen er hentet fra Vismas liste over foretak. Denne er koblet til en oversikt over 11.170 lokalpolitikere. I tillegg kommer alle politikerne på Stortinget, inkludert vararepresentantene. Databasen over stortingspolitikerne har vært tilgjengelig på nettet en stund allerede, under navnet Politikerbasen.
- Opprinnelig gikk vil til SSB for å få disse dataene, men de ville ikke utlevere dem med begrunnelse at det var personopplysninger. Men Kommuneforlaget selger slike lister over lokalpolitikere, basert på SSB-listene. Så lenge man er villig til å betale var det altså ikke så farlig med personopplysningene, sier Andersen syrlig.
Dataene om politikerne, som legges inn i databasen, er fornavn, etternavn, fødselsår, parti, kjønn og bostedskommune.
- Jeg skulle ønske at man kunne fått fødselsdato på politikerne, sier Andersen.
- Med bare fødselsår økes faren for feilkobling mellom dataene. Noen ganger føler jeg at kampen for personvern kjempes på feil fronter, sier han og mener man heller burde arbeide mot datalagringsdirektivet og overvåkningskameraer.
Likevel mener sier Andersen at det var få duplikater som måtte sjekkes manuelt.
Politikerdataene er så blitt koblet sammen med foretaksinformasjonen. Nå kan man søke på blant annet firmanavn, kommune, polikerens navn og personer som ikke er politikere, men som sitter i samme styre som én eller flere politikere. Tjenesten kan fortelle hvilke styreverv, eierskapsforhold og daglig leder-stillinger politikerne har, samt hvilke bransjer de er involvert i.
Andersen understreker at dataene ikke er dynamisk oppdatert, men at de oppdateres et antall ganger i året, minimum fire.
- I foretaksregisteret er det endringer hele tiden. Det må man være klar over, sier han.
Men Maktbasen inneholder enda mer data knyttet til politikerne. I forbindelse med stortingspolitikerne inkluderer databasen voteringsutskrifter, som er tilgjengelige i et spesielt formatert tekstformat. I tillegg har Andersen benyttet skjermskrapingsteknikker på enkeltbiografiene på nettstedet til Stortinget, samt i stortingsreferatene.
- Referatene har vi koblet mot voteringslistene, men den eneste referansen mellom disse er klokkeslett som er oppgitt i en parantes i referatene, forteller Andersen.
Han legger til at det ikke er voteringsanlegg i Lagtingsalen og at det heller ikke alltid benyttes i de andre salene heller.
- Da har man ingen mulighet til å hente disse dataene. Norsk samfunnsvitenskapelig datatjeneste samler inn dette, men med et historisk perspektiv, med et visst etterslep.
Når det gjelder lokalpolitikerne er utfordringene større.
- Jeg skulle ønske at alle kommuner kunne bruke samme system for referater og avstemninger, men nesten alle har sin egen løsning eller ulik måte å legge dette ut på. De aller fleste kommuner legger likevel ut veldig mye informasjon, sier Andersen, som drømmer om et enhetlig system med en god RSS-feed.
Mens dataene fra Visma og Kommuneforlaget leveres strukturert i Excel regneark, er ofte dataene som hentes ned fra websider langt mindre strukturerte.
- Så lenge dokumentene inneholder informasjon fra en database, er det gjerne mulig å systematisere dem for å finne strukturer, sier Andersen.
- Man vil alltid kunne kjenne igjen mønstre ved hjelp av regulære uttrykk, sier Andersen, men legger til at han håper at i alle fall Brønnøysundregistrene etter hvert åpner opp for bedre tilgang til dataene.
Andersen benytter i dag programmer han har skrevet i C# som håndterer skjermskrapingen og som genererer XML-filer av de filtrerte dataene.
- Programmene må kunne skrive om raskt, blant annet når det gjøres endringer på websidene. Da er det praktisk å gjøre dette i et kraftig språk hvor mye kan gjøres med få linjer, sier Andersen.
Selve webapplikasjonen er derimot basert på objektorientert PHP og databasemotoren MySQL.
Datamengdene det er snakk om, er betydelige. For eksempel har tabellen over roller, altså forholdet mellom personer og foretak, drøyt 93.000 rader.
Brukere av Maktbasen kan også få presentert en grafisk oversikt over politikerne roller og nettverk gjennom en Flash-basert visualiseringsmotor. Der ser man hvem som sitter sammen i ulike foretak. Man kan også få oversikt over alle folkevalgte som driver innen en gitt næring.
Andersen mener at flere redaksjoner bør få inn dataprogrammerere.
- Dette er nødvendig for å kunne lage mer spennende ting enn det malverket i publiseringssystemet tillater, sier Andersen.
- Man kan ikke legge opp til en testfase på tre dager for en Flash-applikasjon for en dagsaktuell sak. Man må finne en balanse mellom det å få ut ting raskt og å gjøre det på en forsvarlig måte.
Andersen mener at en journalist vil se etter andre ting enn en tekniker, og ønske tjenester basert på dette. Med utgangspunkt i Maktbasen nevner han for eksempel en oversikt over hvilke lokalpolitikere som er involvert i flest verv og roller.
- Dette vil skape debatt, blant annet om hva slike verv gjør med habiliteten, sier Andersen.
Han sier videre at norsk presse i det store og hele har utnyttet skattelistene veldig dårlig.
- Det finnes langt mer interessante ting enn kjendiser og dyneløfting. Også innen eiendomsoverdragelser kunne det har vært gjort mye spennende.
Når det gjelder selve utvikleren, mener Andersen at redaksjonen er avhengig av å finne en som har genuin interesse for området.
- Utvikleren vil være involvert i både research- og presentasjonsfasen. Jeg tror dette kommer mer og mer, i stadig flere redaksjoner. De største avisene er allerede i full gang, sier Andersen.
Men flere aviser sliter i dag med økonomien, og da er det ikke sikkert det er like enkelt å overbevise ledelsen om at en slik tilleggsutgift er nødvendig. Kanskje må redaksjonen kunne vise til resultatene før pengene kommer på bordet.
- Når det gjelder vinnerne av journalistprisene, er det sjelden alt arbeidet er gjort i arbeidstiden, sier Andersen.
NRK Brennpunkt døpte om tjenesten til Maktbasen i går fordi redaksjonen har planer om å utvide den med informasjon om også andre personer som har makt i det norske samfunnet, blant annet redaktører.
Her kan du selv sjekke alle alndets politikere på Maktbasen.