Komma eller punktum er bare det første hinderet når du skal lese inn tall fra en tekst

En sak de fleste kan være enige om, er at vi på norsk markerer desimaler med et komma – i motsetning til på engelsk, det det brukes punktum.

Komma eller punktum? Og skal man bruke punktum eller mellomrom som tusenskille på norsk?
Komma eller punktum? Og skal man bruke punktum eller mellomrom som tusenskille på norsk?
Jesper Stein Sandal, <a href="https://version2.dk">Version2.dk</a>
14. apr. 2017 - 06:00

3,142 – er dette pi med tre desimaler, eller står det tretusenetthundreogførtito?

De fleste som har jobbet med tall og datamaskiner, er nok oppmerksomme på at deres norske matematikkbok og dataterminalen ikke er helt enige om hvilket tegn som skal markere skillet mellom et heltall og desimalene bak det. Men dette er bare begynnelsen på problemene med å tolke tall.

Det er opplagt at vi må anta at det må finnes en SI- eller ISO-standard, og at det nok er amerikanerne som nok en gang er sprø, og har valgt å bruke punktum i stedet for komma. Men fullt så enkelt er det faktisk ikke.

Det nærmeste vi kan komme på en form for vitenskapelig konsensus, er en resolusjon fra den 22. konferansen om mål og vekt, som slår fast at desimaler skal markeres med enten et punktum eller et komma. Så det er ingen hjelp å hente fra vitenskapen.

I Canada har dette ført til at normen er å bruke et punktum når man skriver på engelsk, og et komma når man skriver på fransk. I Sveits er det vanlig å bruke punktum når man skriver beløp i sveitserfranc, men komma i alle andre tall.

Wikipedias liste viser en nesten jevn fordeling på verdensdeler og land – dog med litt flere land som bruker komma, men til gjengjeld flere mennesker som bruker punktum.

Problemet er at dette derfor krever at man holder styr på hvilket land et tall kommer fra, hvis man for eksempel skal hente det inn fra en tekst i en bit programvare.

10,00,00,000 og 1,0000,0000

Selv et regneark er nødt til å holde styr på språkinnstillingene for å unngå at det oppstår forvirring om komma og punktum hvis arket åpnes i en utenlandsk versjon av programmet.

Men desimalmarkøren er bare det første problemet du kan støte på. Den samme resolusjonen fra de kloke folkene som holder styr på metersystemet, spesifiserer svært diplomatisk at man aldri skal bruke komma eller punktum for å markere grupper av sifre i et tall.

Mange velger – også i Norge – å øke lesbarheten til store heltall ved å legge til et punktum mellom hver faktor 10³. Altså for eksempel 100.000.000.

(Innen norske medier er det stort sett enighet om følgende oppdeling: 10, 100, 1000, 10 000, 100 000, 1 000 000 etc, overs. anm.). På andre språk er det vanlig å skrive det som 100,000,000. Den korrekte måten for å øke lesbarheten på i vitenskapelige tekster, er imidlertid 100 000 000, men det gir et nytt problem når det overføres fra papir til digitale data.

For et mellomrom er ikke bare et mellomrom. Anbefalingen er at man bruker en non-breaking space, altså et mellomrom som ikke påvirkes av linjeskift. Disse er det minst to av i Unicode, og det er opplagt at man benytter U+202F i stedet for U+00A0.

Men dette er ikke helt over ennå. For selv om det er konsensus om å bruke denne oppdelingen i grupper på tre sifre i et heltall, er ikke alle med på det. Blant annet gjør to land med til sammen flere enn 2,5 milliarder innbyggere det litt annerledes – men selvfølgelig ikke annerledes på samme måte.

I Kina kan man støte på at det finnes er grupper med fire sifre i stedet. Dermed skrives 100 millioner som 1,0000,0000 – men fullt så enkelt er det likevel ikke, for forklaringen bak de fire sifrene er at kineserne har et ord (wàn på mandarin) for 10 000, så for dem gir det mening å telle i grupper på ti tusen. Men de har også et ord for 100 millioner (yì), så en milliard er ti hundremillioner.

Forklaringen er nesten den samme i India, hvor det finnes ord for 100 000 (lakh) og for ti millioner (crore). Så i India skriver de hundre millioner som ti timillioner, noe som blir til 10,00,00,000. Inderne setter altså et komma for annethvert siffer – bortsett fra de første tre sifrene.

Komma og punktum for viderekomne

Dermed har vi gått gjennom de fleste problemene, og hvor de enkelte plasserer sine kommaer, punktum og mellomrom. Men dette er ikke de eneste tegnene som kan finnes i tall. Det er en rekke andre tegn som brukes i stedet for dem, men som heldigvis bare sjeldent dukker opp elektronisk.

Du kan for eksempel støte på bruken av apostrofer for å skille mellom grupper av sifre i større tall, slik at 100 millioner skrives som 100'000'000,00. Det ville selvsagt bli en ekstra utfordring for den som skulle tolke det i elektronisk form, hvis det dukker opp sitattegn i et tall som normalt brukes til å markere begynnelsen og slutten av tekststrenger. Men C++ er likevel i stand til å håndtere dette hvis du skulle komme borti det.

Eksempelet over finnes blant annet i håndskrift i Sveits, og selvfølgelig kan man finne nærmest det motsatte, bare man drar til Spania, hvor man i håndskrift kan støte på 100.000.000'00, hvor apostrofen altså markerer skillet mot desimalene.

I tillegg har vi de mer eksotiske ulike prikkene hvor den vanligste er den som også brukes som gangetegn eller til prikkproduktet i matematikk. Av samme årsak er den ikke lengre vanlig som desimalmarkør. Det finnes også en mere høytflygende prikk ˙, som igjen i hovedsak finnes i håndskrift i Italia.

Artikkelen er levert av Version2.dk

Del
Kommentarer:
Du kan kommentere under fullt navn eller med kallenavn. Bruk BankID for automatisk oppretting av brukerkonto.
Tekjobb
Se flere jobber
4 fordeler med å bruke Tekjobb til rekruttering
Les mer
4 fordeler med å bruke Tekjobb til rekruttering
Tekjobb
Få annonsen din her og nå frem til de beste kandidatene
Lag en bedriftsprofil
En tjeneste fra