I en av de mest omfattende undersøkelser av nettets kriker og kroker, har forskere fra IBM, Compaq og AltaVista gransket 1,5 milliarder pekere på 200 millioner utvalgte nettsider. Undersøkelsen avviser tidligere påstander om at du kan nå ethvert nettsted fra et annet via maksimalt 19 hopp.
De amerikanske forskerne konkluderer tvert imot med at verdensveven er atskillig mer intrikat sammensatt. Mens enkelte nettsteder har en bred kontaktflate til andre steder på webben, er det noen som er svært vanskelig å finne, og andre pekere fører ikke noensteds.
Undersøkelsen slår fast at det bare er "i hjertet av Internett" at nettsider lenkes til hverandre. Forskerne antyder at bare 30 prosent av alle websider er med i denne kjernen av nettet, som også er basisen i de fleste søkemotorindekser. Dataekspertene kaller denne kjernen "the giant strongly connected component", skriver BBC News.
Bak denne kjernen ligger det imidlertid en rekke nettsider som er helt eller delvis isolert. Forskergruppen, ledet av Ravi Kumar ved IBMs Almaden-laboratorium, fant ut at 24 prosent av nettstedene hadde pekere til kjernen. Ytterligere 24 prosent er nettsider som kan nås ved å følge pekere ut fra websider i kjernen. 22 prosent er fullstendig isolert fra kjernen, eller er selvstendige øyer med innhold for spesielle interesse- eller vennegrupper. Det betyr at 46 prosent av websidene ikke går noen steder, konkluderer forskergruppen.
Konklusjonen støttes av søkeselskapet Inktomi og det arbeidet de har gjort med å indeksere nettet. Inktomi har indeksert omlag 1,4 milliarder websider for å få en bedre oversikt og forståelse for hvilke sider som kommer opp som resultat av et websøk.
- Omlag 30 prosent av de 1,4 milliarder unike dokumentene på webben er søppel eller datagenerert - kort sagt stoff som folk ikke er interesserte i, sier markedsdirektør Joe Frost i Inktomi til BBC News.
Den nye web-rapporten imøtegår en undersøkelse utført av Alberto-Laszlo Barabasi ved Notre Dame-universitetet, der han antydet at det tok maksimum 19 klikk fra å gå fra den ene siden av webben til den andre. Den nyeste undersøkelsen sier det kan ta hundrevis av klikk for å nå visse nettsider mens andre ikke kan nås i hele tatt.
Hele undersøkelsen presenteres under den niende, internasjonale WWW-konferansen i Amsterdam denne uken.