Det som blir sagt i de millioner av hjem som nå har en stemmeaktivert smarthøyttaler fra Amazon, lagres og lyttes på i stor skala, melder Bloomberg.
Det amerikanske nyhetsbyrået ha vært i kontakt med syv anonyme kilder på innsiden av det som skal være et internasjonalt team på flere tusen personer.
Teamet går gjennom lydopptak for å forbedre selskapets stemmeaktiverte smarthøyttalere, som den svært populære Echo (som ved standardinnstilling aktiveres av ordet «Alexa»).
Stikkprøver av opptakene transkriberes manuelt, merkes og sendes deretter tilbake inn i programvaren. Målet er å forbedre høyttalernes evne til å oppfatte og tolke det som blir sagt, slik brukerne mener det.
Høyttalerne har blitt stadig mer populære, i de siste årene også i Norge og andre land utenfor USA. Med suksessen kommer også behovet for at høyttalerne oppfatter og kan skille flere språk.
Bloomberg setter med sin kartlegging lys på hvordan mennesker oftere enn mange kanskje tror, er en del av prosessen med å trene algoritmer.
- Bak Amazon har markedet for smarthøyttalere eksplodert: Spesielt ett marked har nå våknet.
Sitter i Costa Rica, India og Romania
De syv arbeiderne som nyhetsbyrået Bloomberg har vært i kontakt med, står ikke frem med navn fordi de som ansatte angivelig har signert en avtale som hindrer dem å snakke om programmet offentlig.
Teamet består av både faste og midlertidige ansatte, som jobber i kontorer i Costa Rica, India og Romania, skal vi tro Bloombergs kilder. De jobber ni timer om dagen og går gjennom opp mot tusen lydklipp per vakt, ifølge to arbeidere i kontoret București som nyhetsbyrået har snakket med.
Kontoret i den rumenske hovedstaden utgjør de tre øverste etasjene i et større næringsbygg uten noe utvendig skilt eller lignende som viser at Amazon er i bygget, skriver Bloomberg.
- Les også: Google, Apple og Amazons taleassistenter kan lures av skjulte kommandoer i tale og musikk.
Deler morsomme klipp internt
Ifølge nyhetsbyråets kilder går arbeidet stort sett ut på å merke utsagn for å gjøre høyttalerne bedre til å tolke det som blir sagt. Men noen ganger kommer de også over ting som kan oppleves mer privat, som at en dame synger falskt i dusjen eller at et barn skriker etter hjelp.
Noen av arbeiderne er satt til å transkribere brukernes kommandoer og sammenligne sine egne tolkninger med programvarens automatiske tolkning. Andre noterer alt høyttaleren fanger opp, inkludert samtaler i bakgrunnen.
Hvis arbeiderne kommer over sensitive ting som navn eller bank-informasjon, skal de merke klippet med «kritiske data» og hoppe videre til neste klipp.
Teamet deler lydklipp i interne chatte-kanaler når de trenger hjelp til å tolke et ord eller kommer over noe morsomt, skriver nyhetsbyrået.
Kildene skal ha fortalt at de innimellom også hører ting de oppfatter som rystende eller muligens kriminelt. To av kildene fortalte at de hørte noe noe det trodde var seksuelle overgrep, noe de også kan dele internt for å bearbeide inntrykkene, ifølge Bloomberg.
Amazon: – Identifiserer ikke brukerne
I sitt tilsvar til Bloomberg skriver Amazon at de kun lytter til en veldig liten del av Alexas opptak, og at formålet er å forbedre kundeopplevelsen. Videre skriver selskapet at de har strenge retningslinjer og nulltoleranse for brudd på disse.
«Informasjonen behandles konfidensielt, vi bruker flerfaktor-autentisering for å begrense tilganger og krypteringer for å beskytte dem (...) Ansatte har ikke direkte tilgang på informasjon som kan identifisere brukerne som en del av sin arbeidsflyt», skriver Amazon.
Både Apples «Siri» og Googles smarthøyttalere bruker også større eller mindre grad av menneskelig hjelp til å forbedre programvaren, skriver Bloomberg.
- Vi har testet Google Home og Google Home Mini: Nå snakker Googles smarthøyttaler norsk – vi lot den «ta over huset»
Skriver ned alt
Ifølge Amazons nettsider lagres ingen lyd med mindre høyttaleren hører aktiveringsordet (ofte «Alexa») eller at det trykkes på en knapp. Men noen ganger aktiveres enhetene tilsynelatende helt uten formål, og lydfilen starter uten at brukeren gir noen kommando.
Arbeiderne må transkribere det de hører, uavhengig av om enheten ble aktivert med vilje eller ikke, ifølge nyhetsbyråets kilder.
En av kildene skal ha fortalt at arbeiderne transkriberer opp mot 100 lydfiler om dagen der Alexa er aktivert ved et uhell eller ikke har mottar noen kommando.
Les også: Forskningen som gjør deg kritisk til dine digitale hjelpere