Hatytringer er et stort problem for sosiale medier. De ulike aktørene har etter eget utsagn investert store summer for å få bukt med det, uten at man kan si de er i mål. Det krever store menneskelige ressurser å finne og fjerne slikt, og auto-moderering, for eksempel ved hjelp av kunstig intelligens, har heller ikke vist seg å være noe godt alternativ. Ofte vil auto-moderering reagere med å sperre ytringer som egentlig er helt OK.
Med andre ord vil det klart beste være om brukerne selv modererer sin uttalelser og ikke kommer med de hatefulle ytringene i det hele tatt.
Nettopp dette har forskere ved New York University’s Center for Social Media and Politics sett nærmere på. De sjekket en teori om at personlige advarsler, høflig og informativt formulert, kanskje kunne bidra til ønsket adferd og dermed redusere antall hatefulle ytringer på Twitter.
Og det ser det ut til at det kan.
Undersøkelsen var riktignok ganske liten – og uten samarbeid fra Twitter selv. Likevel kunne forskerne konkludere med at slike advarsler, selv om de kom fra en tredjepart, kunne redusere mengden hatytringer med 10-20 prosent på en uke.
Forsøkte å være troverdige og overbevisende
Twitter strammer inn reglene mot hatefullt innhold
De begynte med å identifisere Twitter-kontoer som risikerte utestengelse for hatytringer. Det gjorde de ved å se etter kontoer som hadde brukt minst ett ord som var å finne i en «ordliste av hatytringer» siste uke og som i tillegg fulgte minst én konto som hadde blitt utestengt for slik språkbruk.
Deretter laget forskerne testkontoer med navn som «hate speech warner» og lignende og brukte disse kontoene til å sende meldinger til Twitter-kontoene de hadde identifisert som i faresonen.
«Vi forsøkte å være så troverdige og overbevisende som mulig», uttalte forskningsrapportens hovedforfatter Mustafa Mikdat Yildirim til Engadget.
I undersøkelsen var de nøye med å spesifisere at de mistenkte at en bruker var utestengt på grunn av hatytringer og ikke skrive at de faktisk var det. Delvis fordi det var helt riktig – de kunne ikke være sikre. På den annen side påpeker forskerne i sin rapport at en slik usikkerhet fra Twitter kan virke mindre troverdig og på den måten redusere ønsket effekt.
Blir sett av andre
Konklusjonen var som nevnt at bare én enkelt slik advarselmelding, fra kontoer med mindre enn 100 følgere og som ikke var tilknyttet noe troverdig organisasjon eller lignende, kunne redusere hatytringer med opptil 10 prosent. De eksperimenterte også med enda mer høflige meldinger og fant at økt høflighet ga enda bedre effekt, faktisk opp til 20 prosent reduksjon av hatytringer.
Forskerne mener at slike personlige advarselmeldinger kan være enda mer effektive dersom de kommer fra Twitter selv eller fra andre organisasjoner eller autoriteter.
«Det vi lærte av dette eksperimentet, er at den virkelige mekanismen som spiller inn her, kan være det faktum at vi faktisk lar disse menneskene få vite at det er en konto, eller en autoritet, som ser på og overvåker oppførselen deres», sier Yildirim til Engadget. «Det faktum at deres bruk av hatytringer blir sett av noen andre, kan være den viktigste faktoren som førte til at disse menneskene reduserte hatytringene sine».
Facebook skal slå ned på hatefulle ytringer