– Løser nesten alle captchaene

Selskap varsler stort framskritt innen kunstig intelligens.

Vicarious' teknologi klarer å knekke de fleste typer tekstbaserte captchaer. Bilde: Vicarious

Del

29. okt. 2013 - 07:45

Mange nettsteder krever at brukerne gjennomfører en turingtest før de for eksempel får lov til å sende inn skjemaer. Dette gjøres for å unngå at automatisert programvare sender inn masse skjemaer for å generere spam. Disse turingtestene kalles gjerne for CAPTCHA (Completely Automated Public Turing Test To Tell Computers and Humans Apart). Målet med testene er at de skal kunne bestås av mennesker, men ikke av dagens programvare. I de fleste tilfeller gjelder det å kunne lese fordreid tekst.

Men som alltid gjøres det stadig teknologiske framskritt. Dette gjelder også innen feltet kunstig intelligens, som er et område det amerikanske selskapet Vicarious fokuserer på.

I går kunngjorde selskapet at dets algoritmer nå kan løse moderne CAPTCHA-er med relativt høy pålitelighet. Dette skal ifølge Vicarious også inkludere den mest brukte varianten, reCaptcha, som Google kjøpte i 2009.

I pressemeldingen siteres en forskningsartikkel skrevet av forskere for Stanford University, som skriver at designmålet for captchaer er at automatiske skript ikke skal kunne lykkes med testen ved mer enn 1 av 10 000 forsøk (0,01 prosent). Men fordi vilkårlige gjetninger kan være vellykkede, er mener forskerne at dette målet er for ambisiøst. De anser derfor en captcha-ordning som knekt dersom en angriper er i stand til å lykkes ved mer enn 1 prosent av forsøkene.

Vicarious hevder at selskapet, ved hjelp av innsikt i maskinlæring og neurovitenskap, har greid å utvikle AI-algoritmer (Artificial Intelligence) som kan løse captchaer med en suksessrate på opptil 90 prosent. Dette inkluderer nevnte reCaptcha, men også lignende tester fra Yahoo, PayPal, Captcha.com og andre. Selskapet konkluderer dermed med at tekstbaserte captchaer ikke lenger er effektive som turingtest.

– Nyere AI-systemer som IBMs Watson og , neurale nettverk avhenger av rå kraft, ved å knytte massiv regnekraft til massive datasett. Dette er den første gangen at den typisk menneskelige handlingen av oppfatning har blitt

D. Scott Phoenix, en av gründerne av Vicarious, sier i en pressemelding at mens nyere AI-systemer som IBMs Watson avhenger av rå kraft, hvor massive mengder regnekraft behandler digre datasett, så har Vicarious greid å gjenskape den menneskelige evnen av oppfatning («perception»), og dette bare med relativt små mengder med data og regnekraft.

– Vicarious-argoritmene oppnår et nivå for effektivitet og virkningsgrad som er mye nærmere det til faktiske menneskehjerner, sier Phoenix.

– Forståelse av hvordan hjernen skaper intelligens, er den største, vitenskapelige utfordringen. Vicarious har en langsiktig strategi om å utvikle kunstig intelligens på et menneskelig nivå, og det starter med å bygge et hjernelignende synssystem. Moderne captchaer tilbyr et øyeblikksbilde av utfordringene ved synsoppfatning, og å løse disse på en generell måte krever at vi forstår hvordan hjernen gjør det, sier Dileep George, en annen medgründer i selskapet.

Teknologien som Vicarious har benyttes, kalles for Recursive Cortical Network (RCN). Videoen over utgjør den første offentlige demonstrasjonen av denne teknologien. Målet med teknologien er ikke først og fremst å løse captchaer. Vicarious skriver i pressemeldingen er at RCN vil få stor betydning innen robotteknologi, medisinsk bildeanalyse, bilde- og videosøk, samt innen mange andre områder.

Artikkelen fortsetter etter annonsen

annonsørinnhold

Den ultimate løsningen for ledere som ønsker full kontroll på miljørapportering

Ny vanskelighet?

Videoen over viser at Vicarious-teknologien tilsynelatende greit knekker det forvrengte ordet i reCaptcha. Det andre ordet er egentlig ikke en del av testen, men er hentet fra en bok som har blitt skannet. OCR-systemer (Optical Character Recognition) er ikke i stand til å lese ordet korrekt, men det kan ofte mennesker.

Men samtidig som at Vicarious har utviklet et system som kan knekke captchaer med tilsynelatende letthet, har Google videreutviklet reCaptcha. På fredag, bare to dager før Vicarious presenterte RCN, kunngjorde Google en ny versjon av reCaptcha som ikke bare skal være vanskeligere for datamaskiner å løse, men også enklere for mennesker.

Google går ikke særlig i detalj i kunngjøringen, men skriver i alle fall at det oppdaterte systemet bruker avanserte teknikker for sikkerhetsanalyse og aktivt vurderer brukerens samlede engasjement med captchaen, både før, under og etter testen.

Basert på dette skaper reCaptcha ulike klasser med captchaer for ulike typer brukere.

– Denne mangesidige tilnærmingen gjør det mulig for oss å avgjøre om en potensiell bruker faktisk er et menneske eller ikke, og å tilby våre legitime brukere captchaer de fleste vil synes er enkle å løse. Boter vil derimot se captchaer som er betydelig vanskeligere og som er designet for å hindre at botene slipper gjennom, skriver Vinay Shet, produktsjef for reCaptcha, i Googles blogginnlegg.

Captchaer med tall i stedet for bokstaver er helt sikkert enklere å løse enn , både for mennesker og maskiner, men ifølge Google vil maskinene aldri se denne typen captchaer fra selskapets reCaptcha-tjeneste. Bilde: Google

Blant de enklere captchaene som nå tilbys gjennom reCaptcha, er noen hvor den vilkårlige teksten har blitt erstattet av tall. Men disse skal aldri bli vist til automatisert programvare.

Artikkelen fortsetter etter annonsen

annonse

Internasjonalt samarbeid skal styrke ansvarlig KI

Shet antyder også at dette bare er første skritt mot en bedre captcha-løsning, og at flere forbedringer skal avdukes om noen måneder.

Det finnes forøvrig captchaer som ikke primært handler om tolkning av tegn, men som baserer seg på andre områder hvor mennesker fortsatt er flinkere enn datamaskiner. Men disse er ikke så mye brukt.

Les også: