Denne artikkelen er levert av Titan.uio.no, en nettavis utgitt av Universitetet i Oslo (UiO).
Du har sett på et hotell eller en bok på nettet, og etterpå forfølger hotellet og boken deg i evigheter i form av annonser. Dette skjer uavhengig av om du har bestilt dem, om du har forkastet dem eller om du fortsatt er interessert. Mange synes dette er irriterende.
– Det finnes mange tjenester som baserer seg på algoritmer som tar i bruk klikkdata for hver enkelt av oss. Slike data samles og brukes innen en rekke områder, ikke bare i næringslivet, men også innen politikk og underholdning, sier statistikkprofessor Ingrid Glad.
Hun leder innovasjonsklyngen DataScience@UiO. Et av prosjektene de jobber med, er nye tilnærminger og algoritmer som skal gi bedre kunnskap om de ulike brukerne, slik at man skal kunne foreslå mer relevant informasjon for dem.
Klikk avslører preferanser
– Brukernes klikk på nettsider, vurderinger og rangering av ulike tjenester avslører preferansene deres, sier Sylvia Liu, som i sitt doktorgradsarbeid samarbeider med Finn.no og NRK med å utvikle slike tjenester.
Når det gjelder NRK handler det om å få på plass en brukertilpasning av kanalens internettbaserte TV-innhold. Brukerne skal blant annet få innholds-anbefalinger basert på hva de har valgt tidligere.
Metoden hun har utviklet, ligner på filmtjenesten Netflix - som foreslår nye filmer for deg basert på filmer du har sett før.
Liu understreker imidlertid at det er krevende å få laget en treffsikker løsning.
Hvorfor hopper seeren av?
Dataene kan vurderes på ulikt vis. Hvordan tolker man for eksempel at en seer skrur av etter 5 minutter eller 15 minutter, eller hopper av en serie etter én episode? Er det fordi han/hun ikke liker filmen, eller plutselig ikke har tid, eller skjer det noe uforutsett i vedkommendes liv?
– For å lage en god anbefaling for deg, må man sammenligne deg med andre brukere. Man må finne de som ligner mest på deg og se hva de har sett som du ikke har sett ennå, sier Liu.
Hennes veiledere, professor Arnoldo Frigessi og førsteamanuensis Ida Scheel, nikker.
De påpeker at utfordringen er å få tilgang til data av så høy kvalitet at man kan komme med forslag som oppleves som nyttige av brukeren. Derfor legges det opp til at man ikke gir anbefalinger før man vet nok om vedkommende.
– Dårlige anbefalinger virker mot sin hensikt, sier Scheel.
– Vi jobber videre med vår metode. Den er basert på en statistisk modell som vi har kalt BayesMallows. Er vi bedre på testdata enn de metodene som brukes i industrien, skal vi prøve den ut i samarbeid med Finn.no og NRK, sier Frigessi – som også leder BigInsight, som er et Senter for forskningsdrevet innovasjon (SFI).
Brukertilpasning - en het trend
Frigessi påpeker at personifisering og brukertilpasning av ulike tjenester på nett er en het trend som bare vil forsterke seg framover.
På dette feltet har Liu utviklet en metode gjennom bruk av sanntidsdata og bayesiansk statistikk.
Denne metoden har potensial til å bli kommersielt interessant. Derfor er den meldt inn som oppfinnelse, en såkalt DOFI (Disclosure of Invention) til UiOs kommersialiseringsenhet Inven2.
Forskning, nytt studium, drop-in-tjeneste
DataScience@UiO-klyngen har også satt i gang flere andre aktiviteter. Blant annet er det utviklet et nytt og svært etterlengtet masterprogram innen data science, som starter til høsten.
Senteret har også fått etablert drop-in tjenesten DataScience@UiO Advisory Service for UiO-forskere som trenger hjelp med å analysere data.
Ting, som består av ting, som består av ting
Også tre andre forskningsprosjekter er satt i gang. Et av dem har tilknytning til digitaliseringen som pågår i oljeindustrien. Doktorgradsstipendiat Daniel Bakkelund ser på data om utstyr og hvordan dette er registrert i databaser. Over tid kan det forekomme avvik i hvordan utstyr blir registrert. Dette kan i sin tur skape problemer når man nå ønsker å øke graden av automatisk datahåndtering.
– Jeg ser på modeller av ting, som består av ting, som består av ting. En bil, for eksempel, består av deler, som igjen består av deler, og så videre. Det samme gjelder utstyret som benyttes i oljeindustrien, og jeg ser på data som nettopp beskriver hvordan utstyr er satt sammen av annet utstyr, sier Bakkelund.
Han jobber med å utvikle metoder for automatisk å finne avvik i disse dataene og å foreslå metoder for å gjøre dataene mer enhetlige. Målet er å komme frem til generelle metoder og teorier som vil være nyttige ikke bare i oljeindustrien. Partner i prosjektet er TechnipFMC.