Barneleger trenger foreløpig ikke frykte å miste jobben til Chat GPT.
En ny studie, publisert denne uken i det amerikanske tidsskriftet JAMA Pediatrics, viser at fjerde generasjon av språkmodellen er spesielt dårlig når det gjelder diagnostisering av barn, skriver Ars Technica.
Chat GPT traff kun riktig i 17 prosent av forsøkene, som altså betyr at 83 prosent av tilfellene var feildiagnostiseringer av pediatriske (barnemedisinske) tilstander.
– Studien understreker den uvurderlige rollen klinisk erfaring har, sier forskerne bak studien.
Forskerne klarte imidlertid også å identifisere hvilke svakheter som gjorde at feilmarginen ble så høy i pediatrisk diagnose. Derfor er det fortsatt grunnlag for å bruke Chat GPT som et verdifullt verktøy på feltet, skriver Ars Technica.
Alder spiller en stor rolle
Studien, som ble utført ved Cohen Children's Medical Center i New York, fant at Chat GPT 4 ennå ikke er klar for pediatriske diagnoser.
Her er det et langt større behov for å vurdere pasientens alder enn det er ved diagnostisering av voksne, heter det i en av konklusjonene. I tillegg kompliseres diagnosen av at spedbarn og små barn ikke kan peke på eller uttrykke sine symptomer verbalt.
Helt konkret matet forskerne Chat GPT 4 med 100 forskjellige pediatriske tilfeller som var publisert i to medisinske tidsskrifter fra 2013 til 2023. Men her klarte språkmodellen altså bare å treffe riktig i rundt en femtedel av tilfellene.
I fjor ble det utført nok et KI-eksperiment innen diagnostisering, der nøyaktigheten var litt høyere. Her skulle Chat GPT diagnostisere en rekke «utfordrende medisinske tilfeller», noe de lyktes med i 39 prosent av forsøkene.
Artikkelen ble først publisert på Version 2
Microsoft: Investerer i europeisk Chat GPT-konkurrent