Hoe typeer je De Telegraaf? Waarover schrijft de krant zoal, hoe vaak wordt dit gedaan, en hoe wordt dit gedaan? Om met deze vragen bezig te gaan werden voor het verhaal over De Telegraaf  in De Groene Amsterdammer van 13 november 2019 niet alleen 12 (oud-)medewerkers geïnterviewd, maar werden ook data van teksten uit De Telegraaf en andere kranten geanalyseerd om bredere trends in kaart te brengen.

Bronnen

Voor het artikel is geput uit twee databronnen: krantenartikelen die verschenen zijn sinds de eeuwwisseling en spreekbeurten uit de Tweede Kamer.

Krantenartikelen

Om de teksten uit De Telegraaf vanuit een macro-perspectief te karakteriseren, moesten eerst genoeg artikelen worden verzameld. De krantenartikelen voor het onderzoek zijn afkomstig uit Nexis Uni, een grote database van juridische teksten en journalistiek artikelen. Voor De Telegraaf zijn artikelen sinds 1999 opgeslagen, wat voor het onderzoek resulteerde in een datumbereik van de laatste eenentwintig jaar. Een klein aantal artikelen met afwijkende commerciële rechten zijn ‘mogelijk niet altijd beschikbaar’, zo valt te lezen op de Nexis Uni website. Los van een paar uitzonderingen* werden teksten uit elk katern binnen de krant in ogenschouw genomen.

Aangezien niet zomaar alle krantenartikelen kunnen worden verzameld, werden alleen teksten met bepaalde sleutelwoorden geselecteerd. We stelden zoekopdrachten (zie kader) op voor de volgende thema’s, samengesteld aan de hand van kernpunten voor De Telegraaf en controversiële onderwerpen:

  • Klimaatverandering
  • Asiel, migratie en vluchtelingen
  • De ‘elite’
  • Femke Halsema 
  • Namen van Nederlandse politieke partijen 

Na de dataverzameling stuitten we al snel op een fundamentele vraag: onderzoek je met deze data maatschappelijke tendensen via de krant, of de krant zelf? In hoeverre is de krant een doorgeefluik van wat er in de wereld speelt versus een hevig geredigeerde lens daarop? In een eerder onderzoek vonden Michael Hameleers en Rens Vliegenthart dat populistisch taalgebruik in Nederlandse kranten sterk toenam, maar of het ging om ‘passief’ taalgebruik, zoals het doorgeven van quotes van politici, of een ‘actieve’ framing werd in het midden gelaten. Zo zagen wij ook dat artikelen over vluchtelingen en Femke Halsema in De Telegraaf spectaculair toenamen, maar het was hiermee nog onduidelijk of dit kenmerkend was voor de krant, of dat het hier om een bredere trend ging.

Één manier om met deze vraag om te gaan is door meerdere kranten te vergelijken. Zo wordt duidelijk wat breed wordt uitgemeten, en wat een specifieke redactionele focus voor één krant is. Om deze reden werden niet alleen Telegraaf-artikelen, maar ook artikelen van de Volkskrant, de NRC en het AD verzameld, om zo te vergelijken of de resultaten per krant afweken.

Spreekbeurten in de Tweede Kamer

Voor het artikel wilden we weten of De Telegraaf op weerklank van Nederlandse politici kan rekenen. Om dit te onderzoeken, bekeken we hoe vaak kranten werden vermeld in Tweede Kamer. We gebruikten een eerder verzamelde dataset met documenten van het officiële online kanaal voor overheidsdata: officielebekendmakingen.nl. Op deze website publiceert de rijksoverheid documenten parlementaire ‘handelingen’. Deze handelingen omvatten onder meer transcripties van spreekbeurten binnen vergaderingen, stemmingen, moties, Kamervragen en algemene overleggen. Met een ‘spreekbeurt’ wordt hier gewezen op één moment waarop een parlementariër iets aan de microfoon zegt. De dataset bestaat hiermee uit 867,313 spreekbeurten (zónder de voorzitter meegerekend). De tijdspanne beslaat 19 mei 1995 tot en met 27 november 2018. Het jaar 2019 ontbrak aangezien de dataset vorig jaar werd verzameld en niet eenvoudig kon worden aangevuld; officielebekendmakingen.nl veranderde haar documentnummering en interface waardoor het originele script niet meer werkt.

Analyse

Met de verzamelde artikelen konden we verschillende ‘perspectieven’ op de data genereren. We maakten visualisaties met behulp van RAWGraphs, Bernhard Rieder’s RankFlow en Andres Mueller’s WordCloud.

Frequenties

Frequentiegrafieken zijn simpel, maar kunnen veel inzichten bieden wat betreft hoeveel bepaalde thema’s in kranten worden besproken, en wanneer dit werd gedaan. We maakten daarom frequentiegrafieken voor artikelen met bepaalde sleutelwoorden. De teleenheid hierbij was per artikel, dus waar een sleutelwoord minimaal één keer voorkomt. Een artikel waarin twintig keer “Femke Halsema” voorkomt telde dus maar als één.

Voor een krant voor het ‘gewone volk’, een concept met een populistische lading, was het interessant om na te gaan of er ook vaak wordt geschreven over diens tegenhanger: ‘de elite’. Er is een duidelijke toename van artikelen met dit woord wat overeenkomt met bevindingen van toenemend populistisch taalgebruik door Hameleers en Vliegenthart. Voornamelijk de jaren na 2006 (na de oprichting van de PVV) en in 2016 (met Brexit en Donald Trump’s presidentiële overwinning) namen de aantallen toe. Vergeleken met de Volkskrant is er echter weinig verschil qua frequentie-tendensen, waardoor het niet als specifieke focus van De Telegraaf moet worden opgevat. 

Bij Femke Halsema verscheen er echter een opmerkelijk verschil. Terwijl kranten als de Volkskrant en de NRC vaker over de huidige Amsterdamse burgemeester schreven in haar tijd als Tweede Kamerlid, met uitschieters rond verkiezingstijd, is nu De Telegraaf verreweg de grootste berichtgever over haar. In 2019 werden al driehonderd artikelen over Halsema geschreven – ruim twee keer meer dan de NRC en de Volkskrant. We vermoedden nog dat dit kwam door een focus op lokaal en Amsterdams nieuws, maar ook vergeleken met de vorige burgemeester Eberhard van der Laan gaat het vaker over Halsema. Terwijl 2019 nog niet voorbij is, zijn er dit jaar al meer artikelen in De Telegraaf getikt over Halsema dan ooit per jaar over Van der Laan.

Uit de Tweede Kamer-dataset werd duidelijk dat uit de vier grote kranten De Volkskrant tot begin 21e eeuw de meest genoemde krant was in de Tweede Kamer, met zo’n 60 tot 130 vermeldingen per jaar. Vergeleken met het eind jaren ’90 steeg De Telegraaf flink wat betreft vermeldingen door politici: de krant wordt tegenwoordig in zo’n 100 tot 120 spreekbeurten genoemd, met de PVV als voornaamste aanjager. Hoewel de oplagecijfers dalen kan de krant van ‘wakker Nederland’ dus rekenen op toenemende weerklank in Tweede Kamer.

Daarna stelden we de tegenovergestelde vraag: over welke Nederlandse partijen en politici schrijft De Telegraaf het meest? Wat betreft politieke partijen waren geen enorm opvallende resultaten te vinden, ook niet vergeleken met de Volkskrant: de aantallen reflecteerden grotendeels de zetelverdelingen in het parlement. De politieke realiteit en de aandacht in De Telegraaf komen hier dus overeen: waar de beginjaren van deze eeuw nog werden gedomineerd door de VVD, PvdA, CDA en D66, is het landschap nog nooit zo versplinterd geweest als nu.

Binnen deze dataset gingen we vervolgens na welke Haagse politici het meeste benoemd werden. Ook dit resulteerde in een afspiegeling van parlementaire macht en breder uitgemeten controverses. De minister-president staat consequent bovenaan, met uitzondering van het jaar 2010, wanneer Geert Wilders gedoogsteun gaf aan kabinet Rutte-I. Tegenwoordig is De Telegraaf na Mark Rutte het meeste inkt kwijt aan Thierry Baudet, en is Jesse Klaver na Geert Wilders en Klaas Dijkhoff de eerste linkse leider vaak die wordt besproken. Deze aantallen zijn vergelijkbaar tussen De Telegraaf en de Volkskrant. Wel schreef De Telegraaf tussen 2006 en 2009 relatief vaker over Rita Verdonk terwijl de Volkskrant meer aandacht gaf aan toenmalig PvdA-voorman Wouter Bos.

Woordburen

Om te onderzoeken hoe woorden in krantenartikelen werden gebruikt, maakten we gebruik van een methode die berekent welke woorden vaak elkaars buren vormen. Deze zogenaamde ‘woordcollocaties’ worden veelal gebruikt om woordparen op te speuren (zoals ‘Verenigde’ en ‘Staten’), maar kunnen ook gebruikt worden om associaties tussen woorden inzichtelijk te maken. Deze methode werd ook gebruik in een eerder onderzoek over racisme in Nederland.

Voor dit soort kwantitatieve tekstanalyse moet de desbetreffende tekst eerst worden ‘opgeschoond’, zodat irrelevante woorden worden verwijderd en gelijke woorden worden gelijkgesteld. Lidwoorden en stopwoorden (e.g. ‘ik’, ‘met’, ‘daar’) zijn hier geen semantisch interessante eenheden, en zijn daarom verwijderd. De overgebleven woorden zijn ‘gestemd’, oftewel teruggebracht tot hun stam: ‘crimineel’ en ‘criminele’ worden bijvoorbeeld herleid naar ‘criminel’. Hiervoor gebruikten we de NLTK SnowballStemmer library, een digitaal woordenboek met stamwoorden. In de uiteindelijke visualisaties zijn volledige versies van de woorden uitgeschreven om ze leesbaarder te maken. De stam ‘criminel’ is bijvoorbeeld genoteerd als ‘criminel(e)’, maar omvat dus ook ‘crimineel’. Uiteindelijk werden collocaties berekend uit één woord direct vóór of na bepaalde sleutelwoorden (bigrams). Alleen bij elite keken we alleen naar woorden die vóór dit woord werden genoemd, aangezien dit beter liet zien naar wat voor soort elite er werd gerefereerd. Daarnaast filterde het irrelevante combinaties als als ‘elite troepen’ weg. Om leesbare resultaten te krijgen berekende we de collocaties per drie jaar. Dus: zeven groepen van drie, vanaf 1999-2001 tot en met 2016-2019. Voor het artikel visualiseerden we de vijf woorden die het meest rondom bepaalde sleutelwoorden werden gebruikt.

Met de kennis dat er meer over ‘elite’ wordt geschreven in De Telegraaf, kan hiermee dus ook een blik worden geworpen op hoe dit wordt gedaan. Als het over de elite gaat in De Telegraaf, is ‘politieke’ het voornaamste woord wat er aan vooraf gaat, gevolgd door ‘Russische’ en ‘bestuurlijke’. Waar deze ‘politieke elite’ in de beginjaren van deze eeuw nog nauwelijks werd vermeld in De Telegraaf, lijkt het nu dus meer ingeburgerd. Overigens zien we deze tendens ook in de Volkskrant, maar is er in deze krant géén sprake van een toenemende trend; in 2005 tot en met 2007 kwam het bijvoorbeeld nog 169 keer voor, de laatste drie jaar nog maar 66 keer.
 

Wat betreft migratie viel op dat De Telegraaf de laatste drie jaar veel meer schrijft over ‘criminele’ en ‘kansloze’ asielzoekers dan voorheen. In de laatste drie jaar werden deze woorden respectievelijk 59 en 37 keer direct naast ‘asielzoeker’ geplaatst. Dit is veel meer dan in eerdere jaren, waar het nauwelijks voorkwam; tussen 2002 en 2004 komen de combinaties beiden maar twee keer voor. Hier is ook sprake van een groot verschil met bijvoorbeeld de Volkskrant, waar ‘criminele’ de laatste drie jaar maar acht keer rond het woord ‘asielzoeker’ is gebruikt, en ‘kansloze’ maar tien keer. De Telegraaf legt dus een grotere nadruk op illegaliteit en uitzichtloosheid wanneer het over asielzoekers gaat.

Woorden in krantenkoppen

Als iets De Telegraaf kenmerkt, zijn het wel diens ophitsende koppen. Daarnaast hebben woorden in krantenkoppen een zwaardere lading dan die in de artikeltekst zelf. Daarom bekeken we ook welke woorden vaak in koppen in De Telegraaf, de Volkskrant, de NRC en het AD werden gebruikt voor artikelen met verwijzingen naar klimaatverandering en Femke Halsema. We visualiseerden de honderd meest voorkomende woorden uit titels van de laatste jaren als woordwolken. Hier zijn enkele herhaalde woorden uitgesloten, zoals ‘Stan’ voor het Stan Huygens Journaal of ‘klimaat’ voor ‘klimaatverandering’. Woorden zijn gekleurd die níet in de top honderd van de andere kranten voorkomen om te benadrukken welke woorden het meest onderscheidend per krant zijn.

In artikelen met het woord ‘klimaatverandering’ vallen bij De Telegraaf enkele verschillen op. De Telegraaf gebruikt meer woorden over het bedrijfsleven en de economie; er verschijnen woorden als ‘economen’, ‘Unilever’, ‘betalen’, ‘belegger’ en ‘bedrijfsleven’. Ook zien we alleen bij De Telegraaf ‘burger’ voorbij komen, terwijl de andere kranten het vaker over ‘we’ hebben. In tegenstelling tot het prominente ‘Nederland’ van De Telegraaf, koppen de Volkskrant, NRC en het AD veelal met internationaal vocabulaire: ‘wereld’, ‘Europa’ en ‘Trump’.

In recente artikelen met verwijzingen naar Femke Halsema verschijnt bij De Telegraaf een focus op veiligheid en handhaving ( ‘aanpak’, ‘wapens’, ‘criminelen’, ‘geweld’, ‘veiligheid’ en ‘misdaad’). Ook komen titels over Amsterdamse krakers en stadsnomaden duidelijk naar voren (‘ADM’, ‘krakers’,  ‘nomaden’/‘stadsnomaden’). De Telegraaf-aandacht voor sport komt aan het licht, aangezien ‘Ajax’ prominent is vertegenwoordigd. De speerpunten lijken elders te liggen bij de andere kranten: bij de Volkskrant valt gender op ( ‘vrouw’, ‘man’), terwijl het AD het relatief vaak over het boerkaverbod heeft. Tot slot komt ‘burgemeester’, een woord om status en gezag aan te geven, veel vaker voor in de Volkskrant, de NRC en het AD. Dit kan komen door kortere titels in De Telegraaf, maar kan ook gezien worden als uiting van de geraffineerde vete tussen de krant en Halsema.


Voor de datasets werden de volgende queries (zoekopdrachten) geformuleerd:

  • Elite Query: elite

Voor deze dataset zijn de categorieën “Sports & Recreation” en “Trends & events” uitgesloten gezien deze veel foutpositieven meegaven (zoals het tennistoernooi WTA Elite Trophy).

  • Klimaatverandering
    Query: klimaatverandering

  • Migratie
    Query: migrant OR vluchtel* OR asiel*

  • Femke Halsema
    Query: “femke halsema” OR (halsema AND burgemeester) OR (halsema AND groenlinks)

Namen worden niet altijd volledig uitgeschreven. Om artikelen zonder voornaam te verzamelen zijn woorden met ‘halsema’ en ‘burger’ of ‘amsterdam’ ook goedgekeurd.

  • Politieke partijen Query: PvdA OR Partij van de Arbeid OR allcaps(CDA) OR allcaps(VVD) OR allcaps(SP) OR D66 OR GroenLinks OR PVV OR “Partij voor de Vrijheid” OR ChristenUnie OR allcaps(SGP) OR PvdD OR “Partij voor de Dieren” OR 50PLUS OR allcaps(LPF) OR “Lijst Pim Fortuyn” OR allcaps(RPF) OR allcaps(GPV) OR allcaps(DENK) OR “Groep Kuzu/Öztürk” OR “RPF/GPV” OR FvD OR “Forum voor Democratie” OR “Groep Bontes/Van Klaveren” OR “groep-Nijpels”

Voor deze dataset zijn kortstondige groeperingen in de Tweede Kamer niet meegerekend. Indien gangbaar zijn afkortingen en volle namen beiden goedgekeurd (bijvoorbeeld ‘PvdA’ en ‘Partij van de Arbeid’).