Google har siden starten for ti år siden vokst enormt. Antall ansatte, servere, løsninger og ja, selve merkevaren har løftet seg enormt siden da.
Samtidig som internett vokste har selskapets opprinnelige, og fortsatt viktigste tjeneste holdt tritt. Googles søkemotor tygger idag i seg innhold på nettet i et imponerende tempo.
- Vi henter inn rundt 50.000 nettsider i sekundet, analyserer dem og lager en søkbar indeks av et utvalg av sidene. Om lag halvparten forkastes som duplikater, forklarer sjef for Googles utviklingsavdeling i Trondheim, Knut Magne Risvik.
Indeksen i Google består av over tusen milliarder nettsider, altså en norsk billion.
Opprinnelig benyttet Google seg av selskapets berømte og patenterte søkealgortime, kalt PageRank. Den tar mest vesentlig hensyn til antall lenker en nettadresse har fra andre nettsteder. Men tidene forandrer seg, og Google jobber hardt med å henge med i svingene etter hvert som nettet fortsetter å vokse.
- Nå benytter vi om lag 500 forskjellige algoritmer, eller signaler. PageRank er fortsatt en viktig del av systemet, men den brukes ikke lenger alene, forklarer Risvik.
Mange av de 500 ulike "signalene" er imidlertid en godt bevart forretningshemmelighet. Det er noe av grunnen til at det har vokst opp en skog av selskaper som selger kunnskap om hvordan verdens viktigste søkemotor er skrudd sammen.
- Dessuten endrer vi dette hver fjerde dag, om ikke oftere. Signalene har også et personlig snev, så dette oppleves ikke likt for alle brukere, fortsetter utviklingssjefen.
Google Norge er selv med på denne typen fininnstilling av motoren. I Trondheim sitter rundt 50 utviklere, mens resten av av norgeskontoret, rundt ti mann, driver med salg i Oslo.
Blant utfordringene nevner Risvik nettsteder som plutselig får en voldsom vekst i innhold eller antall sider. Dette kan være "tullesider", sier han. Slike sider har de åpenbart jobbet med å begrense innslagene av.
- Teksten i lenker er også interessant. Det bør være et samsvar mellom beskrivelsen og hva du faktisk lenker til.
Det kan også tas høyde for hvor lenge du besøker et nettsted. Ifølge Risvik kan de måle hvor mange sekunder det går fra en bruker klikker på en lenke til vedkommende klikker seg tilbake til dem. Er denne tiden kort kan man tenke seg at besøket var en bomtur.
Det går mange diskusjoner om hvor mye Google vet om brukerne sine. Men vi skulle gjerne visst mye mer. Den etter hvert enorme datafangsten er imidlertid ikke uproblematisk. Det er trolig ingen andre nettjenester som vet like mye om så mange, som nettopp søkegiganten.
- Det går mange diskusjoner om hvor mye Google vet om brukerne sine. Men vi skulle gjerne visst mye mer. Det ville ført til at vi kunne gitt dem enda bedre tjenester, sier Risvik.
Også politiet ønsker til stadighet at lovens lange arm skal nå inn til selskapets interne data. Men de får alltid nei, med mindre det foreligger en rettslig kjennelse, understreker Risvik.
- Det kommer sikkert et brev i uken fra norsk politi som vil ha tilgang til kontoopplysninger. Dette er nesten utelukkende spørsmål om tilgang til Gmail-kontoer.