– Så lenge KI ikkje tenkjer logisk, er den ikkje eigentleg intelligent

Chatroboten er dårlegare til å løysa likningar enn ein gjengs ungdomsskulelev, påpeikar matematikkforskar.

– Lukkast vi fyrst i å utvikla modellar som skjønar logikk, kan vi ta med oss det til andre fag, som realfag og jus, seier Trung Tuyen Truong. Foto: Torstein Helleve/UiO

Torstein Helleve, Titan.uio.no

25. feb. 2024 - 11:34

Seksjonen Fra forskning består av saker som er skrevet av ansatte i Sintef, NTNU, Universitetet i Oslo, Oslo Met, Universitetet i Agder, UiT Norges arktiske universitet, Universitetet i Sørøst-Norge og NMBU.

La oss seia at absolutt alle innbyggjarar i landet Alfabetia bur i enten den eine eller den andre av dei to byane i landet, Bjørgvin og Christiania, og det finst òg ein by i Alfabetia som heiter Drammen, der det bur minst ein innbyggjar. Er denne påstanden sann eller usann?

Forhåpentleg får du ikkje dette til å gå opp og konkluderer med at påstanden må vera usann. Chat GPT hevdar derimot at han er sann, fordi Drammen er ein by i Alfabetia som verken er Bjørgvin eller Christiania.

Slik var det i alle fall for ti månadar sidan, men sidan den gong har Chat GPT lært seg riktig svar. For den som ynskjer det, vil likevel ikkje by på store vanskar å setja Chat GPT eller andre språkmodellar fast på liknande logiske feller.

Hamnar fort på djupt vatn

For professor Trung Tuyen Truong ved Matematisk institutt på Universitetet i Oslo er den manglande logikken derimot alvor: det fyrste steget som må overvinnast før vi kan snakka om ein intelligent kunstig intelligens.

– Språkmodellane gjenkjenner mønster i språk, og dermed kan dei føra ein velstrukturert samtale. Dei skjønar at det passar med ein positiv respons på «Eg har det bra i dag», at «Eg har vondt i hovudet» er negativt og at andre utsegner er nøytrale, seier han.

– Men dei hamnar fort på djupt vatn når dei må argumentera logisk for noko. Fyrst når dei er i stand til det, får vi det som vert kalla kunstig generell intelligens, KGI. På engelsk: AGI.

Tolking av lovtekstar

– Matematikk er mitt eige fag, men hovudgrunnen er at det er det mest logiske faget, samanlikna med til dømes fysikk og kjemi, seier Truong.

– Lukkast vi fyrst i å utvikla modellar som skjønar logikk, kan vi ta med oss det til andre fag. Ikkje berre til andre realfag, men òg til fag som jus, som baserer seg på logisk tolking av lovtekstar.

Menneske heng ikkje med

Men det er eit stykke dit. Sjølv ei enkel likning som 2x+1=3 vert for vanskeleg for UiO sin modell GPT UiO, som likevel klarar å løysa x+1+x=3.

GPT UiO er ikkje heilt stø på fyrstegradslikningar. Illustrasjon: GPT UiO

– Vi ser at modellen ikkje har noko logisk forståing, sjølv om den skråsikkert slår fast at slik er det, seier Truong.

Han forklarar at i prinsippet kan alle matematiske bevis reduserast til ei logisk form. Dermed skulle ein KI med forståing for logikk kunna sjekka matematiske spørsmål.

– Problemet er at dersom slike bevis skal skrivast på ei form som ein datamaskin kan lesa, vert dei så lange og innfløkte at vi menneske ikkje heng med. Vi uttrykkjer oss i setningar i staden for – og skjønar det betre, forklarar han.

Mange milliardar løysingar

– Men i ein artikkel i Nature presenterte Google nyleg modellen Alpha Geometry, som – ifylgje Google – presterer godt nok til ei topplassering i den internasjonale matematikkolympiaden, ei tevling for elevar under 20 år frå heile verda (og som i 2022 vart arrangert av Matematisk institutt).

Han går tilbake til eksempelet med positive, negative og nøytrale utsegner.

– Då må modellen forholda seg til éin variabel med tre moglege verdiar. Men i ei geometrisk oppgåve har du kanskje femti variablar (for hjelpekonstruksjonar som eit nytt punkt eller ei ny linje) med ti moglege verdiar kvar. Talet på moglege løysingar er mange milliardar, forklarar han.

Kan gje fleire oppgåver

– Å begynna på toppen og rekna seg gjennom moglege løysingar er sjølvsagt håplaust for eit menneske. Alpha Geometry kan identifisera mønster og raskt finna fram til dei mest aktuelle løysingane veldig fort, der eit menneske ville trengt mykje lenger tid. Sjølv om Alpha Geometry imponerer, har han enno ikkje noko forståing av logiske argument.

Sjølv om det opphavlege prosjektet hans er ferdig, er Truong open for å arbeida vidare med å bruka modellar til å skriva betre matematikkoppgåver for norske skular, om det dukkar opp nokon som er interesserte i å samarbeida..

– Ein modell vil dessutan ha tid til å gje mange fleire oppgåver enn ein lærar i løpet av ein time. Elevane kan òg få støtte til læringa si, som kanskje ikkje alle kan få frå foreldra sine.

Artikkelen ble først publisert på Titan.uio.no