TWIFT.DK | Nyt i Danmark | Ny algoritme kan kortlægge chikane på nettet

Ny algoritme kan kortlægge chikane på nettet

En ny og potentielt banebrydende algoritme har set dagens lys. Den er udviklet af analysebureauet Analyse & Tal, og hedder At&tack-Ha&te. Algoritmen er den mest avancerede, som nogensinde er blevet udviklet til det danske sprog. Nu har den trawlet 63 millioner kommentarer igennem fra Facebook for at vi kan blive klogere på chikane og hadefulde kommentarer på nettet.

ny algoritme

En nyskabende algoritme

Det der gør algoritmen nyskabende er, at den nærmest kan forstå, hvad der bliver skrevet i kommentarerne. Netop denne evne gør, at den med en helt utrolig præcision kan opdage hadefulde kommentarer på facebook.

Når der tidligere er blevet lavet studier af danskernes sprogbrug på nettet, så har de ofte bygget på mindre stikprøver af bestemte miljøer, fordi det ville være menneskeligt umuligt at gennemgå alle kommentarer. Det kan den nye algoritme til gengæld. Den har derfor analyseret ca. 63 millioner kommentarer på facebook-profiler for en lang række danske medier, politikere og politiske partier.  

Algoritmen blev trænet ved hjælp af kommentarer og data, som blev kategoriseret af skaberne bag projektet. Den blev ikke kun trænet til at genkende stødende ord og udtryk, men også til at få en forståelse for semantik og slang. Efterhånden som forskerne fodrede algoritmen med mere og mere data, og løbende rettede den, når den tog fejl, blev algoritmen i stand til at finde mere og mere komplekse udtryk for chikane og hadefulde kommentarer. 

Den foreløbige gennemgang og kortlægning af 63 millioner kommentarer på Facebook er den mest omfangsrige i en dansk kontekst nogensinde. 

Muslimer og kvinder er skydeskiver

Noget af det som algoritmen fandt var, at muslimer og kvinder ofte var i den modtagende ende for hadefulde kommentarer. Ud af de 63 millioner kommentarer, så var ca. hver 20. eller 5,2% deciderede sproglige angreb på personer eller grupper.

50% af de hadefulde kommentarer rettet mod en samfundsgruppe gik på nationalitet, etnicitet eller religion. Ca 14% var rettet mod kvinder. Desuden fandt algoritmen, at I debatter og opslag der handler om islam, muslimer, indvandrere eller integration, så kunne 13% af kommentarerne karakteriseres som angreb. 

Algoritmen fandt også, at de 3 politikere med fleste hadefulde kommentarer på deres Facebook-side alle er medlemmer af Dansk Folkeparti. Nummer 1 er Peter Skaarup, mens nummer 2 og 3 er henholdsvis Lise Bech og Peter Kofod. 

Algoritmen bekræfter dermed andre studier, der tidligere er lavet på området, som har vist at særligt muslimer og kvinder er udsat for online chikane og hadefulde angreb, når de blander sig i den offentlige debat. 

Et nyt værktøj i kampen for den offentlige samtale

Analyse & Tal, som står bag algoritmen, håber selv, at andre vil tage teknologien til sig og f.eks. bruge den aktivt til forskning eller som medieringsværktøj. Bl.a. udtalte Sarah Steinitz, som er partner og analytiker hos Analyse & Tal til Politiken: 

 “Vi håber, at nogle af de forskere i Danmark, der arbejder med at kvalificere, hvor grænsen i den offentlige samtale går, nu får et redskab, så vi kan måle samtalen og få et fælles fodslag at diskutere ud fra – noget, der ellers kan være svært, fordi Facebook virkelig holder på sine data”.

Det kan lade sig gøre, fordi Analyse & Tal har valgt at frigive algoritmen og den kode, som den bygger på. På den måde vil andre kunne bruge og videreudvikle den. 

Analysebureauet forestiller sig også, at det på sigt vil være muligt at udvikle et program på baggrund af algoritmen. Et program som f.eks. politikere vil kunne bruge til at hjælpe med at mediere kommentarsporet på deres Facebook-sider. Dette er dog stadig kun et fremtidsscenarie. 

Selvom algoritmen er imponerende, så mener skaberne, at den stadig misser omkring 27% af angreb, som finder sted i kommentarsporene. Det skyldes primært, at det kan være svært for algoritmen at forstå underforståede kommentarer.  

F$cking related   F$cking related    F$cking related   F$cking related    F$cking related   F$cking related    F$cking related   F$cking related