Mange av våre lesere opplevde i går at de ikke kom inn på Digi.no og TU.no. Problemet varte helt fra sen ettermiddag og var i praksis ikke over før nærmere klokken 23.
Mye av denne perioden var nettstedene helt utilgjengelige. Mot slutten kom leserne bare til en side som i hovedsak fortalte at forsiden ikke eksisterte.
Konfigurasjonsfeil
Problemene er knyttet til en spesifikk hendelse hos TU Medias driftsleverandør. En ny ruter som ble tatt i bruk ved det datasenteret som TU Medias applikasjonsrigg er installert, hadde en feilkonfigurasjon som antagelig lagde en BGP-loop.
BGP (Border Gateway Protocol) er et nettverksprotokoll som brukes til å utveksle veibeskrivelser mellom systemene som utgjør den bakenforliggende infrastrukturen på internett.
Men med en loop sendes trafikken tilbake til utgangspunktet.
Resultatet av feilkonfigurasjonen var at en del virtuelle rutere i OpenStack falt ned. Dette førte til at en del kunder av driftsleverandøren opplevde et kort avbrudd, men noen fikk langvarige avbrudd. TU Medias nettsteder var i den siste kategorien.
Driftsleverandøren opplyser at det i alt tok omkring åtte timer fra de første problemene oppsto og til at siste problem var bekreftet løst.
Utvider tilsyn med Telenor etter nye problemer med nødnumrene
Fysisk flytting
En bakenforliggende årsak til at problemene oppsto, kan være knyttet til at datasenteret er i ferd med å bli flyttet fysisk. Digi.no og TU.no opplevde også tidligere denne uken et fire timer langt avbrudd, men det skjedde midt på natten, så det var mindre merkbart. Årsaken til dette er trolig også relatert til flyttingen.
– Det er en fortvilet situasjon. Vi beklager til alle leserne våre, for dette skal ikke skje, sier ansvarlig redaktør i TU Media, Tor M. Nondal.
– Vi må gå gjennom rutinene våre. Samtidig har vi tidligere hatt lite nedetid, fortsetter han.
Med to små unntak, har vi hatt 100 prosent opptid i hver eneste måned det siste året.
Noe av årsaken til at Digi.no og TU.no ble hardere rammet enn andre kunder av leverandøren, kan skyldes nettstedene kun kjøres fra ett datasenter. Hadde vi hatt servere på to ulike steder, ville vi kanskje ha sluppet unna med en kort nedetid. Som Nondal sier, har dette gått utmerket til nå.
Noe som også var uheldig, var at vi ikke hadde noen enkel måte å varsle leserne på om hvorfor Digi.no og TU.no var utilgjengelige, siden hele riggen var utilgjengelig. Vi benytter sosiale medier, men det når bare ut til enkelte. Vi ønsker derfor å få på plass en løsning som kan brukes i slike tilfeller som det vi opplevde torsdag ettermiddag og kveld.
Astronautene klarer ekstra måneder i rommet – men vil Boeings romsatsing overleve?