Vi ser stadig nye imponerende eksempler på hva som kan oppnås med fremskrittene som gjøres innen kunstig intelligens, ikke minst når det gjelder realistiske gjengivelser av mennesker. Nå har Samsung vist frem et nytt oppsiktsvekkende prosjekt, melder Cnet.
Elektronikkgiganten har nemlig utviklet et system som kan brukes til å lage realistiske videoklipp med kun et lite knippe stillbilder – faktisk med så lite som kun ett bilde.
Det finnes allerede programvare som er i stand til å lage realistiske videoer basert på stillbilder, men de fleste av disse krever et relativt stort antall bilder av samme person for å fungere – noe dette nye konseptet altså ikke gjør.
Laget demonstrasjonsvideo
Forskerne, som jobber ved et russisk Samsung-laboratorium, viste frem teknologien i en video som du kan se nederst i artikkelen, og beskriver de tekniske detaljene i et eget forskningsdokument.
Kjernen i den nye løsningen er noe forskerne kaller en «meta-læringsmodell», som i korte trekk innebærer at systemet gjennomgår en ekstra omfattende opplæringsprosess på forhånd, på bakgrunn av et meget stort og variert antall videoer av snakkende hoder.
På bakgrunn av dette defineres «landemerker», hovedtrekkene i hvordan ansiktet beveger seg, og dermed bruker en generator disse til å lage falske videoer som kvalitetssikres av et såkalt diskriminator-nettverk.
Ifølge forskerne har systemet den store fordelen at det raskt kan tilpasses nye målpersoner ved å kun bruke noen få bilder, uten å måtte trene systemet opp på nytt hver gang. Modellen er dermed mer generaliserbar og mindre tidkrevende, sier forskerne.
Kan få bruksområder innen «deepfake»
Systemet kan, som man kan se i videoen, lage videoer utfra et fåtall bilder av personer som systemet aldri før har sett videoer av. I noen av demonstrasjonene brukes altså kun ett, enkelt bilde til å lage videoer, deriblant portrettmalerier – i dette tilfellet det berømte Mona Lisa – og bilder av kjente personer som Einstein og Marilyn Monroe.
Med bare ett bilde som grunnlag vil videoene naturlig nok være noe mindre overbevisende, hvor bildene vil bære noe preg av modellene som landemerkene er hentet fra.
Når det gjelder bruksområder sier forskerne at teknikken blant annet kan få stor betydning på alle felt som innebærer å lage realistiske, digitale utgaver av mennesker, slik som telekonferanser, dataspill og spesialeffekter.
Som Cnet peker på er det imidlertid en viss grunn til bekymring for at teknologien kan brukes til å forverre det såkalte «deepfake»-fenomenet, altså det å skape realistiske, falske representasjoner av personer til ondsinnede formål – og eventuelt til falske nyheter.
Som digi.no har rapportert tidligere har forskere også her til lands advart mot at «deepfake»-videoer trolig kommer for fullt i år.
Alle de tekniske detaljene om den nye teknologien kan du finne i forskningsdokumentet.