Googles talegjenkjenning kan bli uavhengig av nettilgang

Nyutviklet system krever bare 20 megabyte med minne på mobilen.

Del

14. mars 2016 - 12:07

De fleste av Googles tjenester som tar i bruk kunstig intelligens og maskinlæring, er avhengige av nettilgang fordi selve prosesseringen gjøres på selskapets servere. Det er trolig flere årsaker til dette, men en viktig årsak er at løsningene er for ressurskrevende til å kunne kjøres på for eksempel en smartmobil.

Men det er også flere ulemper med dette. Det ene er at man er avhengige av å ha nettilgang for å kunne bruke tjenestene. En annen ulempe er at man kanskje må dele mer med Google enn det man egentlig ønsker.

Dette gjelder også avansert talegjenkjenning, hvor mer enn bare et begrenset utvalg av faste kommandoer skal støttes.

Artikkelen fortsetter etter annonsen

annonsørinnhold

Ny og sikrere ID-løsning bruker chipen i passet ditt

Google gjør maskinlæring tilgjengelig for alle

Lettvekt

Men nå har forskere ved Google utviklet et system for personlig talegjenkjenning for mobile enheter som krever ikke nettilgang. Det er ZDNet som først har omtalt dette systemet.

På en 2,5 år gammel Nexus 5-mobil kjøres programvaren med en median hastighet som er sju ganger høyere enn sanntid. Systemet beskrives som et kompakt talegjenkjenningssystem med støtte for et stort vokabular. Minnebruken skal være begrenset til 20,3 megabyte, omtrent 1 prosent av den totale minnemengden til Nexus 5.

Det ulike teknikkene som har blitt tatt i bruk for å oppnå den beskjedne minnebruken, er omtalt i dette dokumentet.

Systemet kan nå håndtere en kommando som denne:

«Send an email message to Darnica Cumberland: can we reschedule?»

En utfordring er navnet som er oppgitt i kommandoen. Dette løses ved integrere personlig informasjon på enheten, for eksempel kontaktlisten, med språkmodellen.

Forskerne oppgir at systemet deres har en feilrate på ordnivå på 13,5 prosent i forbindelse med dikteringsoppgaver.

Systemet skal presenteres under IEEE-konferansen International Conference on Acoustics, Speech and Signal Processing som arrangeres i Shanghai i nesten uke. Det er ikke kjent når teknologien eventuelt vil gjøres tilgjengelig i tjenester som Google Now.

Google overrasker med tidlig testversjon av neste Android

Les mer om:

ANDROID BEDRIFTSTEKNOLOGI GOOGLE NYHETSBREV TALEGJENKJENNING

Del

Kommentarer:

Du kan kommentere under fullt navn eller med kallenavn. Bruk BankID for automatisk oppretting av brukerkonto.

Tekjobb

Se flere jobber

Har muligheten for hjemmekontor blitt den nye normalen?

Les mer

En tjeneste fra