Chat GPT skuffer ved diagnostisering av barn: Bommer i 83 prosent av tilfellene

Det er langt frem til Chat GPT kan begynne å diagnostisere barn. En ny studie viser at chatboten bare treffer riktig i 17 prosent av tilfellene.

Det er av flere grunner vanskeligere å få Chat GPT til å gi barn riktig diagnose enn å klare det for voksne. Språkmodellen klarte bare å treffe riktig i rundt en femtedel av tilfellene, ifølge en undersøkelse. Illustrasjonsfoto: Colourbox

Del

2 Kommentarer

Rasmus Jessen Ginman, Version 2

14. jan. 2024 - 09:00

Barneleger trenger foreløpig ikke frykte å miste jobben til Chat GPT.

En ny studie, publisert denne uken i det amerikanske tidsskriftet JAMA Pediatrics, viser at fjerde generasjon av språkmodellen er spesielt dårlig når det gjelder diagnostisering av barn, skriver Ars Technica.

Chat GPT traff kun riktig i 17 prosent av forsøkene, som altså betyr at 83 prosent av tilfellene var feildiagnostiseringer av pediatriske (barnemedisinske) tilstander.

Artikkelen fortsetter etter annonsen

annonsørinnhold

Bankfusjon og nytt partnerskap. – Et taktskifte

– Studien understreker den uvurderlige rollen klinisk erfaring har, sier forskerne bak studien.

Forskerne klarte imidlertid også å identifisere hvilke svakheter som gjorde at feilmarginen ble så høy i pediatrisk diagnose. Derfor er det fortsatt grunnlag for å bruke Chat GPT som et verdifullt verktøy på feltet, skriver Ars Technica.

Alder spiller en stor rolle

Studien, som ble utført ved Cohen Children's Medical Center i New York, fant at Chat GPT 4 ennå ikke er klar for pediatriske diagnoser.

Her er det et langt større behov for å vurdere pasientens alder enn det er ved diagnostisering av voksne, heter det i en av konklusjonene. I tillegg kompliseres diagnosen av at spedbarn og små barn ikke kan peke på eller uttrykke sine symptomer verbalt.

Helt konkret matet forskerne Chat GPT 4 med 100 forskjellige pediatriske tilfeller som var publisert i to medisinske tidsskrifter fra 2013 til 2023. Men her klarte språkmodellen altså bare å treffe riktig i rundt en femtedel av tilfellene.

I fjor ble det utført nok et KI-eksperiment innen diagnostisering, der nøyaktigheten var litt høyere. Her skulle Chat GPT diagnostisere en rekke «utfordrende medisinske tilfeller», noe de lyktes med i 39 prosent av forsøkene.

Artikkelen ble først publisert på Version 2