Microsoft sletter database med 10 millioner bilder av nærmere 100.000 ulike ansikter.
Databasen, kjent som «MS Celeb», har blitt brukt som treningsdata for systemer for ansiktsgjenkjenning verden over.
Dette skriver Financial Times.
Databasen ble publisert i 2016 og er beskrevet av selskapet som det største offentlig tilgjengelige datasettet for ansiktsgjenkjenning i verden.
Menneskene på bildene ble ikke spurt om å gi samtykke. Bildene ble skrapet fra søkemotorer og videoer med Creative Commons-lisensen som tillater akademisk gjenbruk av bilder.
«Siden var tenkt til akademiske formål. Den var drevet av en ansatt som ikke lenger jobber for Microsoft, og har siden blitt fjernet», sier Microsoft i en uttalelse.
- Ansiktsgjenkjenning i Norge: Dette har du rett til å vite om bruken av dine data (saken kan leses av abonnenter).
Brukt av kinesiske myndigheter
Databasen ble fjernet bare dager etter avisen Financial Times skrev om selskapers bruk av datasettet.
Datasettet har blitt brukt av flere store selskaper som IBM, Panasonic, Alibaba, Nvidia, Hitachi, Sensetime og Megvii.
Både Sensetime og Megvii er kinesiske leverandører av utstyr til myndighetene i Xinjiang i Kina, hvor minoriteter blir sporet og holdt i interneringsleire, skriver avisen.
- Mener IT-gigantens ansiktsgjennkjenning feilaktig koblet han til tyverier fra flere Apple-butikker: 18-åring fra New York saksøker Apple for 8,5 milliarder kroner
"Kjendiser"
Databasens fikk navnet «MS Celeb» for å indikere at ansiktene var av offentlige personer, men det viser seg at flere av bildene var av personer helt utenfor det offentlige rom. Databasen inkluderte til og med bilder av forfattere, journalister og andre som har uttalt seg kritisk mot Microsofts bruk av biometri i sin teknologiutvikling.
Researcher Adam Harvey, som med den uavhengige researchgruppen Megapixles har avslørt detaljene rundt dette og andre datasett, sier til Financial Times at Microsoft har misbrukt order «celebrity».
- Les også kommentaren: Hva vi kan lære av de første GDPR-sakene? Fire konkrete saker, hvorav én fra Norge.
Deles som åpen kildekode
Teknologieksperter har uttalt at Microsofts bruk av databasen er i strid med EUs personvernforordning GDPR, som trådte i kraft i fjor sommer.
– De har sannsynligvis fjernet databasen fordi advokatene deres har uttrykt bekymring at selskapet ikke har rett til å behandle ansiktsdata i henhold til artikkel 9 i GDPR, sier Michael Veale, forsker ved Alan Turing-instituttet i London, til Financial Times.
Microsoft bestrider overfor avisen påstandene om at fjerningen av databasen har noe med personvernlovgivningen å gjøre.
Datasettet er fortsatt tilgjengelig for de som allerede har lastet det ned, og skal også være delt på nettet som åpen kildekode.
– Det finnes ingen måte å fjerne datasettet helt på. Det deles og eksisterer på harddisker over hele verden, og nå er det også fjernet fra alle lisenser, regler eller kontroll som Microsoft tidligere hadde over det, sier Adam Harvey fra Megapixles til avisen.
- Mer om ansiktsgjenkjenning: Slik bruker norske myndigheter ansiktsgjenkjenning (saken kan leses av abonnenter).