Verantwoording bij het onderzoek naar de verspreiding van coronacomplotten op sociale media

In samenwerking met De Groene Amsterdammer onderzocht de Utrecht Data School (Universiteit Utrecht) hoe coronacomplotten zich sinds het begin van de coronacrisis op sociale media verspreidden. Daarvoor keken we specifiek naar Twitter en Instagram – twee sociale media die wat betreft publiek en sociale interactie wezenlijk van elkaar verschillen.

Voor Twitter is onze analysemethode grotendeels vergelijkbaar met ons eerder uitgevoerde onderzoek naar antisemitisme op sociale media. Allereerst hebben we twintig steekproeven verzameld van circa twintigduizend Nederlandstalige tweets die termen gerelateerd aan corona (corona, Covid-19, RIVM, pandemie) bevatten. Op basis van de retweets van deze tweets hebben we vervolgens een netwerkanalyse uitgevoerd, om zodoende groepen van gebruikers (deelpublieken) die, wanneer het gaat over onderwerpen rondom corona, veel met elkaar interacteren in kaart te brengen. De groepen die te vinden zijn in de interactieve visualisatie, zijn het resultaat van deze netwerkanalyse.

De tweede stap was om te identificeren welke gebruikers binnen dit ‘corona-netwerk’ ook over de relatie tussen 5G en corona hebben getweet, en vooral: op welke manier ze dat deden. We kozen hierbij specifiek voor complottheorieën rondom 5G en corona vanwege hun brede verspreiding en verregaande consequenties (bijvoorbeeld: het in brand steken van zendmasten). Om de volledige verspreiding van deze complotten op Twitter in kaart te brengen, verzamelden we alle Nederlandstalige tweets – gepubliceerd tussen 1 januari 2020 en 25 juni 2020 – waarin zowel ‘5G’ als een term gerelateerd aan corona voorkwam. Deze zoekopdracht resulteerde in 36.679 berichten.

Niet in elk van deze berichten wordt uiteraard daadwerkelijk gesuggereerd dat er een relatie is tussen de introductie van 5G en het coronavirus. Een substantieel deel van de 36.679 tweets is juist sceptisch, of satirisch – berichten over ‘5G-gekkies’, of waarin een Speld-artikel dat 5G presenteert als medicijn wordt gedeeld. Daarom onderscheiden we, deels geïnspireerd op onderzoek naar complottheorieën rond het zikavirus, drie manieren waarop de relatie tussen 5G en corona tot uiting kan komen: geloof (overtuigd van samenhang corona en 5G), ongeloof (sceptisch over een samenhang corona en 5G), en neutraal (geen expliciete mening).

Voor het toekennen van deze categorieën aan de Twitter-berichten hebben we allereerst achthonderd (unieke) berichten handmatig gelabeld. Om te bepalen hoe intersubjectief het toekennen van deze labels is, zijn tweehonderd tweets door twee codeurs gelabeld. De zogeheten interbeoordelaarsbetrouwbaarheid bleek volgens gangbare maatstaven goed (Cohens κ > 0,6). Hierna hebben we een logistisch regressiemodel op de gelabelde tweets getraind om de overige tweets te kunnen classificeren. Daarbij gebruiken we, omdat de spelling op Twitter nogal kan variëren, karakter n-grams (groter of gelijk aan 1 en kleiner of gelijk aan 6) als features. Het classificatiemodel presteerde aardig tot goed (een nauwkeurigheid van 0,76), maar allerminst foutloos. Dit betekent dat niet alle berichten die als ‘geloof’ zijn gemarkeerd, bij handmatige inspectie daadwerkelijk ook tot deze categorie zullen behoren. Tegelijkertijd kunnen we met een dergelijke score er wel vanuit gaan dat de algemene patronen die we in het artikel vooral ook willen aanhalen – bijvoorbeeld dat complotten rond 5G en corona een grotere weerslag hebben op conservatief-nationalistische kringen – wel blijven gelden.

Instagram is, in vergelijking met Twitter, veel minder makkelijk doorzoekbaar. Het is weliswaar mogelijk om op specifieke hashtags te zoeken, maar daarmee ondervang je slechts een beperkt deel van de complotten die daar geplaatst worden. In plaats van op content gerelateerd aan het coronavirus te zoeken, hebben we voor de Instagram-analyse gebruikgemaakt van een lijst van de vijfhonderd grootste Nederlandse Instagram-accounts, afkomstig van StarNgage en – omdat deze lijst niet compleet bleek – aangevuld door de lijst van InfluencerWiki. Uiteindelijk zijn wij gaan werken met 470 Nederlandse Instagram-accounts, omdat dertig van de vijfhonderd accounts privé-accounts bleken. Die hebben we buiten de analyse gehouden.

Van de 470 grootste Instagram-accounts hebben we gekeken naar welke accounts zij volgen. Elk account dat door minstens twee influencers werd gevolgd, hebben we geselecteerd om zo tot een lijst van circa dertigduizend accounts te komen. Voor elk account in deze lijst hebben we vervolgens geanalyseerd aan welke andere gebruikers dit account volgens Instagram gerelateerd is. Zodoende ontstaat er een netwerk van aanbevelingen, waarmee we net als bij Twitter via een netwerkanalyse met Gephi groepen van gebruikers kunnen opsporen.

De sociale interactie op Instagram en het verspreiden van berichten werkt anders dan op Twitter. Dit maakt het voor ons op Instagram moeilijker om automatisch accounts te inventariseren die complottheorieën verspreiden. Daarom hebben we daarnaast twee lijsten van accounts opgesteld: een lijst van spirituele accounts, en een lijst van complotaccounts. Voor de complotaccounts geldt dat dit accounts zijn die vrijwel uitsluitend gericht zijn op het verspreiden van complottheorieën, zoals @project_knowledge of @qanon4u. Accounts zoals die van Lange Frans, Doutzen Kroes, of Willie Wartaal vallen hier dus niet onder: zij verspreiden slechts (incidenteel) berichten, direct of indirect, van deze complotaccounts.

Vervolgens hebben we niet alleen gekeken naar welke influencers dergelijke spirituele en complotaccounts volgen, maar ook naar de manier waarop complotaccounts en spirituele accounts inhoudelijk met elkaar overlappen. Dit hebben we gedaan aan de hand van een vergelijkende hashtag-analyse, waarbij we voor elk account in onze twee lijsten alle hashtags in de vijftig meest recente posts hebben verzameld. Om te bepalen in hoeverre de frequentie van een hashtag onderscheidend is voor een van de twee groepen, voeren we – net als in het onderzoek bij het antisemitisme – een chi-kwadraattoets uit.

Dit onderzoek maakt inzichtelijk hoe wezenlijk anders de sociale-medianetwerken Instagram en Twitter zijn. Waar Twitter duidelijker de vorm aanneemt van een netwerk, met verschillende doelpublieken, lijkt Instagram op het eerste oog meer gericht op individuele accounts; meer gericht op influencers. Onze analyse legt bloot dat wanneer je een netwerkanalyse op Instagram uitvoert, er wél duidelijke clusters van gebruikers ontstaan. Clusters van gebruikers rond mode, rapmuziek, bekende Nederlanders, rond sporters. Maar in tegenstelling tot Twitter zijn deze ‘deelpublieken’ nauwelijks ideologisch georiënteerd: we vinden op Instagram geen evidente links-progressieve sferen, geen conservatief-nationalistische sferen, en ook geen afgebakende (Nederlandse) complotsfeer. Daarmee is de verspreiding van complottheorieën op Instagram echter niet minder belangwekkend: juist het feit dat complotdenkers zich op Instagram overal bevinden, kan bijdragen aan een brede verspreiding van complottheorieën. Ook wie geen uitgesproken complotaccounts volgt, kan op Instagram gemakkelijk in aanraking komen met de verregaande theorieën die op dergelijke accounts geplaatst worden – niet alleen via Doutzen, maar ook via talloze andere influencers in Nederland.


Joris Veerbeek is onderzoeker bij de Utrecht Data School