Mens Google og Microsoft tilbyr bredt anlagte søketjenester basert på indekser av ord og uttrykk, prøver andre utviklingsmiljøer å lage søkemotorer som skal kunne forstå mer av det man faktisk spør om. Det russisk-norske selskapet Stochasto har allerede teknologi på markedet, og IBM har begynt å vise noen av sine prosjekter.
Les også:
- [23.11.2005] Norsk søkebedrift vil satse mobilt
- [19.10.2004] Stochasto fikk søkemotoravtale
- [22.09.2004] Stochasto klar for Internett-søk
- [01.09.2004] Ny norsk søkemotor forstår engelsk språk
- [11.05.2004] Russisk teknologi skal gi superintelligente søk
En artikkel i New York Times forteller om en demonstrasjon av flere kommende IBM-teknologier for mer intelligente søk, under utvikling ved selskapets Thomas J. Watson Research Center tre mil nord for New York. Søketeknologien er en del av IBMs forskning i maskinprosessering av naturlig språk, som også er ment å gi gevinster innen blant annet oversettelsessystemer. Utfordringen er å gi en datamaskin en mulighet til å forstå tekst og søke på grunnlag av det, og ikke bare finne dokumenter med de samme ordene som søkestrengen.
Artikkelen nevner tre konkrete prosjekter som kan gi tjenester i løpet av forholdsvis kort tid.
Systemet som ligger nærmest opp til det Stochasto gjør, er IBMs Piquant – «Practical Intelligent QUestion ANswering Technology». IBMs demonstrasjon gikk ut på å la systemet skanne en artikkel om kanadisk politikk, og så la den svare på spørsmål av typen «hvem er statsminister i Canada?». I våres fikk digi.no demonstrert et Stochasto-system som hadde gått gjennom en stor samling artikler om amerikansk historie, og som kunne svare på samme type spørsmål. Svarene her kom i form at lenker til de relevante dokumentene, med gjengivelser av nøyaktig de avsnittene der svaret sto.
Et annet IBM-system under utvikling, Semantic Analysis Workbench, er i stand til automatisk å gruppere tekster som likner hverandre. Denne teknologien antas i første omgang å kunne anvendes i situasjoner der man ikke er klar over sammenhenger, og trenger et hjelpemiddel for å oppdage dem. Et eksempel er systemer for kundestøtte, der teknologien vil kunne varsle når flere kunder har samme type problem, ved å sammenlikne notater og spor fra kundehenvendelser. Et annet er prosjekter innen genforskning, der det trengs hjelpemidler for å avdekke mønstre som går igjen. Et tredje er systemer som logger spor etter telefonsamtaler, med tanke på raskere avdekking av terrorisme og annen kriminalitet.
Et tredje IBM-system kombinerer maskinoversettelse med søk. Brukeren kan skrive en søkestreng på ett språk, og få treff på andre språk, med oversettelse av overskrift og de første linjene. Dersom man ønsker å se et helt dokument på fremmedspråket, får man opp en maskinoversettelse av den aktuelle siden.