Vi har sett flere imponerende fremskritt innen kunstig intelligens den siste tiden, deriblant et system som kan lage videoer av mennesker pp bakgrunn av bare ett stillbilde. Nå har det dukket opp et prosjekt litt i samme gate, melder blant andre nettstedet Gizmodo.
Det kjente teknologiuniversitet MIT har utviklet en AI-algoritme som kan rekonstruere utseendet til mennesker bare ved å lytte til stemmen til vedkommende.
Brukte flere millioner YouTube-klipp
Forskerne trente opp systemet sitt med flere millioner videosegmenter fra YouTube som inneholdt over 100 000 forskjellige personer som prater.
På bakgrunn av disse dataene ble systemet brukt til å konstruere falske bilder av mennesker basert på korrelasjoner mellom ansiktene og stemmene i datagrunnlaget.
I forskningsdokumentet skriver forskerne at det er en sterk sammenheng mellom tale og utseende, da faktorer som alder, kjønn, benstrukturen i ansiktet, formen på munnen og hvorvidt man har tynne eller tykke lepper påvirker lyden av stemmen.
I tillegg er mange av egenskapene knyttet til hvordan man snakker felles for nasjonaliteter og kulturer, slik som for eksempel språk, aksent, tempo og uttale. Dette kan igjen oversettes til fysiske attributter, heter det videre i dokumentet.
Ikke presise kopier
Forskerne understreker at målet ikke var å forutsi et gjenkjennelig bilde av ansiktene, men i stedet å fange opp dominerende ansiktstrekk til vedkommende som korrelerer med stemmen. Resultatet er dermed det forskerne kaller «gjennomsnittsansikter», og ikke ansikter av spesifikke individer.
Forskerne peker på at nettopp denne faktoren bidrar til å betrygge de som måtte være bekymret på det personvernrelaterte aspektet ved teknologien.
I forskningsdokumentet er det imidlertid vedlagt flere bilder av testene, og selv om de konstruerte bildene på ingen måte er identiske med de opprinnelige bildene, er det klart mange likhetstrekk – og i noen tilfeller er bildene faktisk skremmende like.
Prosjektet er i utgangspunktet kun ment som en akademisk undersøkelse, men teknologien kan ifølge forskerne potensielt få anvendelser innen kommunikasjon og generering av animasjoner og visuelle representasjoner.
Alle de tekniske detaljene kan du finne i selve forskningsdokumentet.
Les også: Hjerneforsker leder bred satsing på kunstig intelligens »