Det er heldigvis fortsatt noen oppgaver mennesker er flinkere til enn datamaskiner, men det blir stadig færre. I forrige uke presenterte forskere ved Microsoft Research Asia i Beijing en vitenskapelig artikkel om de ved hjelp av konvolusjonelle, nevrale nettverk har oppnådd å kategorisere et stort sett med fotografier med en nøyaktighet som er minst på høyde med det mennesker klarer.
Lavest feilrate
Forskerne har tatt utgangspunkt i den årlige kategoriseringskonkurransen til ImageNet, hvor tusenvis av bilder skal klassifiseres i tusen ulike kategorier. En forskergruppe fra Google oppnådde under fjorårets konkurranse en feilrate på 6,66 prosent. Tidligere i år oppnådde en gruppe fra kinesiske Baidu en feilrate på 5,33 prosent. Nå har Microsoft-forskerne oppnådd en feilrate på 4,94 prosent. Det menneskelige nivået anses for å være på 5,1 prosent i denne testen, skriver Microsoft-forskerne.
Rekorden tilskrives to faktorer – utviklingen av mer tilpasningsdyktige, ikke-lineære nevrale enheter i det nevrale nettverket, og en treningsalgoritme som gjør det nevrale nettverket kraftigere.
Les også: Åpner opp verktøy for maskinlæring
Dette fagområde kalles for «Computer Vision» og handler om å gjøre datamaskiner effektive til å oppfatte, prosessere og forstå visuelle data i for eksempel fotografier og videoer. Målet er å etterligne oppfattelsesevnen til menneskenes øyne og hjerne.
Spesielt, ikke generelt
Selv om systemet til Microsoft-forskerne har greid å overgå nøyaktighetsnivået til mennesker, så gjelder dette kun i denne ene, spesifikke testen.
– Selv om algoritmen vår produserer et overlegent resultat for dette spesielle datasettet, så indikerer ikke dette at maskinbasert synsevne utkonkurrerer menneskelig synsevne inen generell objektgjenkjenning, skriver forskerne. Det forteller at maskiner gjør åpenbare feil i forbindelse med gjenkjenning av elementære objektkategorier som anses som trivielle for mennesker.
– Mennesker har ingen vansker med å skille mellom en sau og en ku. Men datamaskiner er ikke perfekte når det gjelder slike enkle oppgaver, sier Jian Sun, forskeren som har ledet prosjektet, i et internintervju hos Microsoft.
– Når det derimot gjelder å skille mellom ulike saueraser, blir mennesker utkonkurrert av datamaskiner. Datamaskiner kan læres opp til å se på detaljene, tekturen, formen og konteksten i bilder, og de kan se forskjeller som ikke kan observeres av mennesker, forteller Sun.