Online antisemitisme

Verantwoording bij onderzoek het naar antisemitisme op Twitter

In samenwerking met De Groene Amsterdammer voerde Utrecht Data School (Universiteit Utrecht) een onderzoek uit naar het Twitter-debat rondom antisemitisme, joden en jodendom. Welke twitteraars spelen een prominente rol in dergelijke discussies? Met wie interacteren ze? En op welke manier praten ze hierover?

Om deze vragen te beantwoorden, hebben we een jaar aan tweets verzameld – gepubliceerd tussen 1 januari en 31 december 2019 – die in brede zin raken aan het thema antisemitisme. We brengen dus nadrukkelijk niet het complete Twitter-debat in kaart, maar een specifiek, thematisch meer homogeen deel daarvan.

We zochten naar tweets die sleutelwoorden bevatten die expliciet – en eventueel ook op beschouwende wijze – aan antisemitisme en/of jodendom refereren, zoals ‘antisemitisme’, ‘jodenhaat’ of ‘jood’, maar ook naar tweets die sleutelwoorden bevatten die veelal in de context van (debatten over) antisemitisme opduiken, zoals ‘Soros’, ‘Israël’, en ‘goyim’. De volledige zoekopdracht beslaat 94 unieke termen en 74 combinaties van twee termen. Aan de hand van deze zoekopdracht hebben we in totaal 1.299.218 tweets verzameld.

Netwerkanalyse

We gebruiken een netwerkanalyse om groepen – of: gemeenschappen – van gebruikers die veel met elkaar in discussie treden (of het juist vaak met elkaar eens zijn) in kaart te brengen. Hierbij zien we de gebruikers als de knopen van het netwerk. Wanneer een gebruiker met een andere gebruiker interacteert, bijvoorbeeld in de vorm van een retweet, markeert dat een verbinding (een lijn) tussen twee knopen. Aan de hand van deze interacties kunnen we de gebruikers vervolgens indelen in groepen die onderling veel interactie vertonen, maar minder met de rest van het netwerk. Dit doen we met behulp van een algoritme, de zogeheten Louvain-methode. Het algoritme zoekt stapsgewijs naar de verdeling van het netwerk waarbij de onderlinge verbondenheid van gebruikers in dezelfde groep (de modularity) het sterkst is (zie ook een eerdere verantwoording van Utrecht Data School voor een stapsgewijze uitleg van de Louvain-methode).

Representativiteit van het Twitter-debat

In dit onderzoek concentreren we ons alleen op het debat op Twitter. Twitter is uiteraard niet representatief voor de samenleving – de demografie van Twitter-gebruikers verschilt van de gehele samenleving. Dit wordt versterkt door de manier waarop Twitter wordt gebruikt. Slechts een minderheid van de geregistreerde gebruikers verstuurt daadwerkelijk berichten. Volgens het Amerikaanse Pew Research Center is tien procent van de gebruikers verantwoordelijk voor tachtig procent van de berichten. Omdat Twitter een laagdrempelige manier biedt om berichten te zenden of te delen, is het medium bijzonder geschikt voor personen die professioneel communiceren, zoals politici, marketeers, journalisten en auteurs, en vooral voor iedereen die een mening wil uiten of verder wil verspreiden. Dit leidt ook tot een oververtegenwoordiging van extreme posities. We pretenderen dan ook nadrukkelijk niet het ‘volledige’ publieke debat aan de hand van een Twitter-analyse te kunnen vatten. Tegelijkertijd veronderstellen we wél dat de processen die we in dit debat hebben aangetroffen – groepsvorming, normalisering – zich niet uitsluitend tot de Twitter-sfeer beperken. Het in het artikel genoemde profiel van George Soros van de NOS is daar al een goed voorbeeld van.

Welke interacties je gebruikt om het netwerk te construeren, heeft invloed op de samenstelling van de groepen. Zo kun je een retweet beschouwen als een affirmatieve actie: wanneer een gebruiker een bericht retweet geeft dit – uitzonderingen daargelaten – aan dat deze gebruiker de inhoud van die tweet onderschrijft. Een retweet-netwerk kunnen we daarom zien als een netwerk van overeenstemming en de groepen die je op basis van zo’n netwerk vindt, zullen in veel gevallen ideologisch relatief homogeen zijn.

Dat is niet noodzakelijk het geval wanneer we ook mentions en quote retweets (retweets met opmerkingen) in de netwerkanalyse verdisconteren. Wanneer een gebruiker reageert op een tweet of een andere gebruiker aanhaalt, kan het immers zo zijn dat de gebruiker het eens is met een andere gebruiker, maar in veel gevallen reageren gebruikers juist omdat ze het oneens zijn met een tweet. Vanuit dat perspectief kunnen we een netwerk van mentions veel eerder beschouwen als een netwerk van debat en zullen de groepen gebruikers veel minder ideologisch homogeen zijn, maar eerder indicatief voor actoren die vaak met elkaar in discussie treden.

Het interactienetwerk: elk bolletje, elke knoop, representeert één gebruiker. De grootte van de knoop correspondeert met het aantal interacties dat deze gebruiker heeft ontvangen; de knopen zijn gekleurd op basis van het Louvain-algoritme.

Voor dit onderzoek kozen we voor een tweetal netwerkanalyses. Om een min of meer compleet beeld te krijgen van de manier waarop verschillende gebruikers met elkaar interacteren, analyseren we het Twitter-debat over antisemitisme ten eerste in de vorm van een zogeheten interactienetwerk, waarbij we zowel retweets, mentions als quote retweets in onze analyse meenemen. Daarnaast voeren we, om meer ideologisch homogene groepen van gebruikers op te sporen, een netwerkanalyse uit op alleen retweets.

De netwerkanalyses zijn uitgevoerd met de netwerkvisualisatiesoftware Gephi en het Python-pakket NetworkX. We gebruiken Gephi’s layout-algoritme ForceAtlas2 om de knopen van het netwerk ruimtelijk te positioneren. Hierbij worden krachten tussen knopen en verbindingen gesimuleerd, waarbij de knopen elkaar afstoten en de verbindingen knopen naar elkaar toetrekken. Gebruikers die veel interactie met elkaar hebben worden zodoende dichter bij elkaar gepositioneerd, en naarmate een gebruiker meer interactie heeft met verschillende andere gebruikers, wordt deze meer naar het centrum getrokken. Voor zowel het interactienetwerk als het retweet-netwerk hebben we de scaling ingesteld op 2, de gravity op 0.05, met de opties ‘stronger gravity’ en ‘dissuade hubs’ aangevinkt. We hebben het layout-algoritme voor ongeveer tienduizend iteraties gedraaid; voor convergentie is handmatig gecontroleerd. Alle gebruikers die geen interacties hebben ontvangen óf niet minimaal eenmaal met een andere gebruiker hebben geïnteracteerd zijn uit de uiteindelijke visualisatie gefilterd.

We hebben de groepen van het interactienetwerk en het retweet-netwerk handmatig gelabeld. Dit hebben we in eerste instantie gedaan op basis van de meest prominente gebruikers (de gebruikers die het vaakst geretweet of gementioned zijn) per groep. Om de labels verder te verifiëren, hebben we eveneens gekeken naar de populairste tweets van elke groep.
Ten behoeve van de consistentie gebruiken we voor beide netwerken dezelfde labels en kleuren. Dat betekent echter niet dat de groepen ook uit exact dezelfde gebruikers bestaan. Hoewel de rode groep in het interactienetwerk bijvoorbeeld overwegend uit conservatief-nationalistische gebruikers bestaat, plaatst het algoritme ook het Twitter-account van Lodewijk Asscher in die groep. Dat komt niet doordat hij veel interactie met deze gebruikers heeft, maar doordat hij – in de vorm van mentions – veel door deze gebruikers wordt aangehaald. In het retweet-netwerk wordt Lodewijk Asscher wel in de mainstream-groep geplaatst. Iets soortgelijks geldt voor Thierry Baudet: zijn Twitter-account wordt door het Louvain-algoritme in het interactienetwerk in de mainstream-groep geplaatst, terwijl hij in het retweet-netwerk juist onderdeel is van de conservatief-nationalistische groep.

Ook de manier waarop de verschillende groepen zich tot elkaar verhouden is in het retweet-netwerk anders dan in het interactienetwerk. De mainstream-groep en de groep van conservatief-nationalistische gebruikers staan in het retweet-netwerk veel verder van elkaar af dan in het interactienetwerk. Dit duidt erop dat tussen beide groepen nauwelijks overeenstemming is, maar wel relatief veel interactie. En waar de uitgesproken pro-Israël-groep in het interactienetwerk verwant is aan zowel de mainstream als de conservatief-nationalistische groep, staat de groep in het retweet-netwerk veel dichter bij de conservatief-nationalistische groep. De groep van complotdenkers, ten slotte, staat in het retweet-netwerk weliswaar dichter bij de conservatief-nationalistische groep, maar is ook gefragmenteerder. Dat betekent dat deze gebruikers vooral in de vorm van mentions met elkaar interacteren.

Het retweet-netwerk: elk bolletje, elke knoop, representeert één gebruiker. De grootte van de knoop correspondeert met het aantal retweets dat deze gebruiker heeft ontvangen; de knopen zijn gekleurd op basis van het Louvain-algorithme.

Automatische tekstanalyse

Waar een netwerkanalyse ons vertelt welke gebruikers onderling veel interactie hebben, gebruiken we een vergelijkende sleutelwoordenanalyse om de verschillende groepen van gebruikers meer inhoudelijk te karakteriseren. Met een sleutelwoordenanalyse kunnen we zien welke woorden significant vaker voorkomen in de tweets van een bepaalde groep gebruikers, vergeleken met de tweets van de gebruikers die niet tot die groep behoren. Hierbij gaat het dus niet zozeer om de woorden die het vaakst voorkomen, maar om de woorden die in frequentie het sterkst tussen gemeenschappen verschillen. We gebruiken – en vergelijken – daarvoor de groepen van het retweet-netwerk. De groepen van het retweet-netwerk zijn immers ideologisch meer homogeen, waardoor we betekenisvolle sleutelwoorden van een bepaalde groep veel eerder als representatief voor een achterliggend vertoog kunnen beschouwen dan bij de groepen in het interactienetwerk.

We hebben de vergelijkende sleutelwoordenanalyse als volgt uitgevoerd. Eerst hebben we, voor elk van de zeven grootste groepen in het retweet-netwerk, alle tweets in de dataset verzameld die door de gebruikers in deze groepen zijn verstuurd, waarbij we alleen tweets meenemen die door de gebruiker zelf zijn geschreven. Met behulp van de tweetpreprocessor van de Python-bibliotheek hebben we alle niet-tekstuele informatie (mentions, url’s, etc.) uit deze tweets verwijderd. Vervolgens kijken we welke woorden in de tweets van een bepaalde gemeenschap vaker voorkomen dan in de tweets van de andere gemeenschappen. Dit doen we aan de hand van een chi-kwadraattoets, waarmee we dus ook het totaal aantal woorden in de analyse verdisconteren (zie ook hier voor een verdere uitleg van frequentievergelijkingsmaatstaven). De woorden met de hoogste chi-kwadraatwaarde kunnen we daarbij als het meest onderscheidend voor een bepaalde gemeenschap beschouwen.

Discursieve overlap tussen verschillende groepen. Voor elke groep zijn de dertig meest onderscheidende woorden weergeven. De grootte geeft daarbij aan hoe onderscheidend de woorden zijn.

Naast de woorden die het meest onderscheidend zijn voor een bepaalde gemeenschap (de linker- en rechterkant van de venn-diagrammen), analyseren we ook op welke manier het woordgebruik van twee gemeenschappen met elkaar overlapt (het midden van de venn-diagrammen). Daarvoor voegen we eerst de tweets van twee gemeenschappen samen. Vervolgens kijken we welke woorden significant vaker voorkomen in de tweets van deze twee gemeenschappen samen, vergeleken met de tweets van gebruikers die niet tot een van deze twee gemeenschappen behoren. Omdat de frequenties van één gemeenschap zwaar kunnen doorwegen wanneer je twee gemeenschappen samenvoegt, beschouwen we een woord alleen als onderscheidend – of: overlappend – voor twee gemeenschappen als de chi-kwadraatwaarde groter is dan de chi-kwadraatwaarde van hetzelfde woord wanneer je een van de twee gemeenschappen apart neemt. Met andere woorden: het verschil moet groter zijn wanneer je de tweets van twee gemeenschappen samenvoegt.