ChatGPT lagde store bølger da den først ble lansert, men siden den gang har OpenAI jobbet hardt med å forbedre tjenesten og bygge inn nye funksjoner. Nå har selskapet sluppet en av de aller mest betydningsfulle oppdateringene til ChatGPT så langt.
På nettsidene sine kan OpenAI nå meddele at den populære snakkeroboten har fått evnen til å nettopp snakke. Dette er imidlertid ikke den eneste nyheten, for ChatGPT kan nå også gjenkjenne – og diskutere – bilder.
De nye funksjonene rulles ut til Plus- og Enterprise-brukere av tjenesten i løpet av de neste par ukene, og til andre brukere kort tid senere. Stemmebasert kommunikasjon kommer også til de mobile plattformene iOS og Android, mens bildegjenkjenning vil komme til alle plattformer.
Profesjonelle stemmeskuespillere
OpenAI har ikke spesifisert hvilke språk de nye funksjonene støtter utover engelsk, så det er uvisst om eller når støtte for norsk vil være på plass fra begynnelsen, eller eventuelt komme senere. Norsk er blant språkene som ChatGPT offisielt støtter til tekstkommunikasjon.
Støtte for stemmekommunikasjon innebærer at man heretter vil kunne kommunisere med ChatGPT på omtrent samme måte som man kommuniserer med andre mennesker, og ha en naturlig samtale.
På samme måte som at man i dag kan be ChatGPT om å skrive et dikt eller en historie, kan man altså nå få servert diktene eller historiene i verbal form. OpenAI opplyser at de har jobbet med profesjonelle stemmeskuespillere for å lage stemmene.
Funksjonen bygger på en helt ny tekst-til-stemme-modell som er i stand til å generere menneskelignende audio fra tekst og kun noen få sekunder med tale. Den benytter seg også av Whisper til transkripsjoner fra tale til tekst. Whisper, som ble introdusert i september i fjor, er en modell for talegjenkjenning som blant annet kan brukes til oversettelser, transkripsjoner og tale-til-tekst.
Kan nå også analysere bilder
Den andre nyheten er kanskje enda mer interessant, nemlig den nye bildegjenkjenningsfunksjonen. Med denne funksjonen kan ChatGPT analysere bilder som brukeren viser snakkeroboten, og komme med meningsfulle tilbakemeldinger og beskrivelser av hva den ser.
Denne funksjonaliteten kan for eksempel brukes til å be ChatGPT om å hjelpe deg å reparere produkter som man kanskje ikke er helt komfortabel med å fikse på egen hånd. Ved å simpelthen vise snakkeroboten et bilde av hva man jobber med, kan den respondere med hvordan man bør gå frem, basert på hva som finnes i bildet.
I et eksempel som OpenAI la ut ble ChatGPT vist et bilde av en verktøykasse, og basert på dette kunne den identifisere de riktige verktøyene for en spesifikk oppgave som brukeren jobbet med – i dette tilfellet justering av et sykkelsete. Bildene kan man simpelthen ta med mobilkameraet og legge inn i samtalen i mobilapp-versjonen av ChatGPT.
Mer informasjon om de nye funksjonene kan man finne på OpenAIs nettsider.