Rundt fire prosent av alle nettsider som er indeksert av Googles søkemotor forsvant i april fra søkeindeksen, ifølge anslag fra Moz Marketing, som Search Engine Land viser til. Nå har Google gått ut med informasjon om hva som egentlig skjedde, skriver Engadget.
Google bekrefter ikke selv hvor mange nettsider som ble berørt, men skriver at de i perioden etter problemene som rammet deler av Googles infrastruktur har gjort en grundig analyse av hva som gikk galt – og hvorfor det skulle ta flere uker å få alt på stell igjen.
Selskapet skriver at de med jevne mellomrom ruller ut nye versjoner av sin søkeindeks til alle sine datasentere verden over. Søkeindeksen er en database med oversikt over flere hundre milliarder nettsider, og som Googles søkealgoritmer henter informasjon fra når en bruker søker etter noe via for eksempel google.com eller google.no.
Søkeforespørsler sendes til det datasenteret som er nærmest, slik at brukeren får svar så raskt som mulig. Når det gjøres endringer i søkeindeksen – for eksempel at nye websider legges til eller fjernes – må disse endringene reflekteres på tvers av alle Googles datasentere verden over, så alle brukere får søkeresultater fra den nyeste versjonen av indeksen.
Det å holde søkeindeksen lik på tvers av alle datasenterne er en ganske omfattende jobb, ifølge Google. For tjenester som brukes av mange brukere starter de gjerne utrullingen på ett datasenter og fortsetter videre til alle datasenterne er oppdatert.
Tok mange dager å fikse
Det var i forbindelse med en slik oppdatering av søkeindeksen at ting gikk galt fredag 5. april i år. I det indeksen ble oppdatert ved noen av datasenterne, ble «et lite antall dokumenter» ved en feil droppet fra indeksen.
Ifølge Google ble hendelsen raskt fanget opp av Googles ingeniører som var på vakt, og selskapet fikk også tilbakemeldinger via sosiale medier.
«Som et resultat var vi i stand til å begynne å tilbakestille søkeindeksen til forrige stabile tilstand i alle datasenterne bare få timer etter at problemet ble avdekket (vi har sikkerhetskopier av indeksene våre i tilfelle slike ting skjer)», skriver selskapet.
Google kan bli delt opp
Det å gjenopprette Googles gigantiske søkeindeks er ingen liten jobb, og det var først den 7. april – to dager etter at problemene startet – at Google kunne melde at ting begynte å nærme seg normale tilstander igjen. Den 11. april var selskapet sikre på at alle datasenterne hadde en komplett søkeindeks.
Følgefeil i flere uker
På grunn av feilene i søkeindeksen kunne mange brukere også melde om problemer med Google Search Console, et verktøy som brukes for å blant annet holde et øye med søkemotortrafikk til egne nettsteder.
Search Console henter dataene fra en egen database som er delvis bygget opp fra informasjon som hentes fra søkeindeksen. Når Google måtte rulle tilbake til en tidligere versjon av søkeindeksen, måtte de sette oppdateringen av Search Console-databasen på pause.
Siden det tok flere dager å rulle tilbake søkeindeksen, valgte Google å vente med å fikse Search Console-databasen til de var sikre på at søkeindeksen var i orden. Den 15. april meldte Google om at det var problemer med søkekonsollen, og først den 28. april var også søkekonsollen i orden igjen. Dette ble så kommunisert på Twitter den 30. april.
Det skulle med andre ord ta mer enn tre uker fra indeks-problemene startet, til alle følgefeilene var rettet opp i.
Google sier nå at de i fremtiden har planer om å dele relevant informasjon om denne typen problemer enda raskere, både via sosiale medier og også gjennom Search Console-verktøyet.