Tro det eller ei! Uansett hva du leter etter på Finn.no, landets største markedsplass, blir de automatiske annonseanbefalingene mer relevante jo mer Finn.no tar hensyn til usikkerhetene.
Etter at nettstedet tok i bruk nye usikkerhetsberegninger, har den gjennomsnittlige brukeren klikket seg inn på 7 prosent flere annonser enn tidligere. Mer trafikk betyr større omsetning og mer penger i kassen.
– Det gjelder å engasjere brukeren nok til at han bryr seg om hva vi anbefaler, forteller data scientist Simen Eide på Finn.no. Han tar nå en industriell doktorgrad på BigInsight – et senter for forskningsdrevet innovasjon ved Universitetet i Oslo – om hvordan det er mulig å bruke kunnskapen om usikkerheter for at markedsplassen kan anbefale de beste annonsene til nettopp deg som bruker.
Ut av digital boble
La oss ta det hele fra starten. Du har klikket ti ganger på noe du er interessert i. Anta at du har sett på ti biler. Før ville Finn.no ha anbefalt deg annonser med tilsvarende biler.
– Det er vanligvis slik anbefalingsalgoritmene fungerer, sier Eide.
Dette har dessverre noen uheldige konsekvenser. Hvis du bare blir anbefalt det markedsplassen tror du ser etter, havner du i en digital boble.
– Da vil ikke anbefalingene dekke hele interessebredden din.
Eide har forsøkt å gjøre noe med dette. Det har vært alt annet enn enkelt. Selv om Finn. no sitter på enorme mengder data, vet de nesten ingenting om den enkelte bruker.
– Usikkerheten er svært stor om hva brukeren er interessert i. Hvis du har sett på ti biler, men også er interessert i noe annet, er det i tillegg viktig for oss å oppdage de andre interessene dine.
Dyp læring
For å klare dette må Eide kvantifisere usikkerhetene. Anbefalingssystemet til Finn.no bygger på dyp læring, en viktig metode for å trene opp datamaskinen til å gjenkjenne mønstre i data. Problemet med dyp læring er at denne metoden ikke tar hensyn til usikkerheter.
– Vi prøver nå å bake inn usikkerheten i den dype læringen.
Hvis du har sett på femten biler og ett sofabord, er det best å vise annonser av biler, men det er samtidig en viss sannsynlighet for at du også har andre preferanser. Simen Eide tar derfor også hensyn til hva de andre brukerne, med tilsvarende interesser for biler, ser etter.
– Det eneste vi vet, er at en bruker som har sett på en bil, også har stor sannsynlighet for å se på en annen bil.
Da må Finn.no finne den rette bilen blant de to millioner gjenstandene som finnes i databasen deres.
50-dimensjonal fotballbane
For å skjønne hvordan Finn.no tenker, kan du se for deg at nettstedet har plassert alle annonsene – det er altså mer enn to millioner av dem – ut over en fotballbane. Hver gang en av brukerne tar en titt på to bestemte annonser, blir disse to annonsene plassert nærmere hverandre på fotballbanen.
– Brukere har en tendens til å se på lignende ting over tid. Kanskje vil alle de dyre bilene havne på den ene siden av fotballbanen, mens sofaene havner på den andre siden.
Jo kortere avstanden er mellom to objekter, jo større er sannsynligheten for at de to annonsene blir vist til samme bruker.
Det er ikke mulig å plassere alle objektene på en to-dimensjonal fotballbane. Eide jobber heller ikke i tre dimensjoner.
– Vi er nødt til å sortere alle annonsene på en fotballbane med 50 dimensjoner. Vi trenger så mange dimensjoner for å kunne finne den rette avstanden mellom alle annonsene.
Sannsynlighetsfordeling
Så kommer neste problem. Det handler om det Eide kaller for kaldstartproblemet.
– Hvis det legges ut en ny bilannonse, er det ingen som har sett på denne bilen før. Da er det umulig å legge ut bilen på fotballbanen.
Poenget er å anbefale den til brukere så tidlig som mulig. Og det er nå vi omsider kommer til det saliggjørende hovedpoenget om usikkerheter. På tide! Og nå snakker han om brukerne og ikke annonsene. Han legger også brukerne inn på fotballbanen.
– Vi legger også brukerne på fotballbanen, men vi er usikre på nøyaktig hvor de skal plasseres. Det er ikke nok å legge dem på et bestemt punkt. Vi må også lage en sannsynlighetsfordeling for hvert av disse punktene.
Det betyr at alle brukerne får et område på fotballbanen der de med en viss usikkerhet kan ligge.
– Sannsynligheten blir da kanskje størst for at brukeren fortsatt ønsker å lete etter en annen bil, mens sannsynligheten også er til stede for at han har lyst til å se etter et sofabord.
Etter at Finn.no la denne spesielle formen for usikkerhet inn i modellen, økte klikkraten med 7 prosent.
– Det er bra. Hvis folk finner annonsene mer interessante, vil de kjøpe og selge mer. Vi får da mer fornøyde brukere, samtidig som Finn.no får en sterkere posisjon i markedet.
Tunge beregninger
Det kreves en del datakraft for å ta hensyn til alle usikkerhetene. Dette er intet stress for akademikere. Det har ingenting å si for dem om de må bruke en ukes databeregninger for å trene opp modellen.
I det virkelige liv er en uke altfor mye. Før alle beregningene er i boks, er resultatene i mellomtiden blitt irrelevante. Det er derfor viktig at markedsplassen klarer å løse beregningene i løpet av noen få nattetimer, slik at brukerne kan få de beste anbefalingene når de setter seg ved tastaturet neste morgen.
– Jo fortere vi får dette til, jo mer ferskvare blir resultatene.
Det beste hadde vært om det var mulig å trene opp modellen i sanntid, slik at Finn.no vet hva brukeren er interessert i der og da.
– Med en liten algoritme skal det være mulig å få fornuftige resultater i løpet av 80 millisekunder. Det betyr at systemet vårt kan beregne hva du liker best hver gang du klikker deg inn på nettstedet.
Spiller med åpne kort
Selv om alle algoritmene blir publisert i vitenskapelige tidsskrifter, er ikke Eide redd for at noen andre luringer skal stikke av gårde med ideene hans.
– På konferanser utveksler vi ideer med konkurrentene våre. Det er givende. Verdien av algoritmene er begrenset kommersielt. Finn.no er mye mer enn dette. Men den gangen jeg jobbet i finansverdenen, diskuterte vi ikke løsningene med andre. Det hadde vært mye farligere for bedriften.
Artikkelen ble først publisert på Apollon