Geen peil op te trekken

Bij de Amerikaanse presidentsverkiezingen beleefden we het bankroet van de opiniepeiling. Valt de ‘mening van het volk’ überhaupt nog te peilen? Henri Beunders duikt in de geschiedenis en filosofie van de opiniepeilingen en zoekt naar een nieuwe ‘glazen bol’ om toch weer vat op de toekomst te krijgen.

Medium 1 2

Wat de globale gevolgen zullen zijn van ‘T_rump’s Triumph’_ weten we nog niet. Ook niet of we nu leven in ‘Trump’s New World Disorder’, zoals het afgelopen week heette in The New York Times. Deze krant adviseerde altijd voor Democraten te stemmen, ook nu. Net als vrijwel álle kwaliteitskranten, en vele andere audiovisuele MSM, Mean Stream Media. Deze MSM, permanent aangevallen door Trump en vele bloggers en sites op de ‘social media’, krabben zich nu achter de oren. Om twee redenen. Waarom heeft ‘men’ niet naar ons advies geluisterd? Ofwel, wat stellen wij als ‘voorlichters van Het Volk’ eigenlijk nog voor? En: hoe konden wij – media, opiniepeilers, wetenschappers - er zo naast zitten met onze voorspellingen dat Trump uiteindelijk geen schijn van kans zou hebben en dat Amerika wis en waarachtig voor het eerst een vrouw tot president zou kiezen, Hillary Clinton geheten?

De verkiezing van Trump is misschien het begin van een nieuw tijdperk. Maar is zeker het einde van een ander tijdperk, het tijdperk van ‘de opiniepeilingen’ zoals we die kenden. Er zal een geheel nieuwe mix van parameters en thermometers gebrouwen moeten worden, willen we voortaan een iets betere voorspelling kunnen doen over de vraag wat ‘the national mood’ is en waar de burgers uit de diverse bevolkingslagen en -segmenten op zullen gaan stemmen áls ze naar de stembus gaan voor deze of die verkiezingen, over deze of gene partij of persoon, of over dit of dat onderwerp.

Het bankroet van ‘de opiniepeiling’ is in feite niet zo moeilijk te begrijpen. De geschiedenis ervan kan kort worden samengevat, en het afsterven ervan tot een comateus instrument ook. De term ‘publieke opinie’ is rond 1750 gemunt door de radicale anti-Establishment-denker Rousseau. Hij bedoelde ermee ‘de zeden van het volk’. Dat volk was voor hem heilig. Volgens hem bestond er ook zoiets als een ‘algemene wil’ van dat volk. In zijn ogen diende de overheid daaraan te gehoorzamen, en diende de staat via een ‘sociaal contract’ de balans te vestigen tussen de rechten en plichten van de staat, en van ‘het volk’. Volgens sommigen is Trump een opvolger van Rousseau. Rousseaus romantisch-radicale ideeën sloegen aan op het hoogtepunt van de Verlichting (1650-1800).

Maar Rousseau bleef een, weliswaar erg beroemde, outsider. Voltaire en de ‘Republiek der Letteren’ bepaalden via onderlinge discussie wat ‘de waarheid’ was. Deze groep van intellectuelen en welgestelde burgers, wilden een anti-macht zijn tegen de staat, de absolute monarchie in het geval van Frankrijk. Zij zagen niets in een vanzelf opborrelende ‘algemene wil’, zij geloofden dat ‘de waarheid’ of ‘de dominante wens’ vanzelf zou opborrelen uit een vrije discussie op basis van rationele argumenten. In Engeland dachten filosofen als John Locke en J.S. Mill ook zo.

Een eeuw na Rousseau kwam er in rap tempo een massapers tot wasdom, en de eigenaren van deze massapers, ook wel Yellow Press genoemd, waren zo succesvol omdat hun business model nieuw was: het is lucratiever aan veel mensen een goedkope krant te verkopen dan aan weinig mensen een dure krant. Vanwege die miljoenenoplage konden zij, met enig recht, beweren dat zíj de vertolkers waren van ‘de publieke opinie’. Een opinie die zij, zelfbewust als ze waren, niet zelden zelf eerst op de voorpagina ten tonele hadden gevoerd.

In de decennia rond 1900 kwam de verwetenschappelijking van al die voorheen vage aspecten van het leven: hoe men zich voelt, hoe mensen zich in groepen gedragen, hoe statistiek werkte, en hoe je de productie van vlees en auto’s zo efficiënt mogelijk kon organiseren in een fabriek. Al die nieuwe laboratoria, kansberekening, dieptegesprekken, proeven en experimenten met mensen en dieren en planten mondden uit in ‘de mechanisering van het wereldbeeld’, zoals ‘onze’ E.J. Dijksterhuis het een halve eeuw later zou noemen, of in de ‘onttovering van de wereld’, zoals Max Weber het rond de Eerste Wereldoorlog noemde.

***

De opiniepeiling komt voort uit deze twee voorlopers: de volkstelling (zo oud als Josef en Maria in Bethlehem) en de parlementaire enquête die voortvloeide uit de groeiende angst voor nieuwe uitbraken van de cholera in de explosief groeiende steden, en de humanitaire bezorgdheid over de wantoestanden in de nieuwe fabrieken, wat ‘de sociale kwestie’ ging heten. Men hoorde over medische wantoestanden, over uitbuiting, en over kinderarbeid. Zo kwamen er onder druk van links-liberalen onderzoekscommissies die het land rondgingen om de zaak zelf in ogenschouw te nemen. Het Kinderwetje van Van Houten in 1874 is hier een bekend voorbeeld van. Men had het met eigen ogen aanschouwd.

Journalisten van de massapers gingen dit ook doen, bijvoorbeeld de ellende in de kelderwoningen in de grote steden beschrijven, en – dankzij het net uitgevonden flitslicht – fotograferen. Bekend voorbeeld is het in woord en beeld uitgedrukte J’Accuse van de Amerikaanse journalist Jacob Riis in 1890: How the Other Half Lives. Het politieke resultaat van deze ‘Muckrakers’ (slijkdelvers) was ook in de VS een begin van sociale wetgeving en antikartelwetgeving, ingevoerd door een soort voorganger van Donald Trump, Theodore Roosevelt.

Na 1918 zorgde een fusie van twee opkomende wetenschappen voor een soort kernfusie: de dieptepsychologie van Sigmund Freud en de statistiek. Een neef van Freud, Edward L. Bernays, vergezelde, net als de econoom John Maynard Keynes, president Wilson naar het Congres/Verdrag van Versailles. Beide geleerden zouden hun radicale conclusies trekken uit deze meest irrationele aller oorlogen. Keynes lanceerde het idee van de economische conjuncturele impuls om mensen aan het werk te krijgen. Bernays benutte zijn kennis, en die van zijn oom, van het irrationele in de mens voor de verkoop van auto’s en sigaretten, tandpasta en wat al niet aan de burger, die om deze reden voor het eerst ‘consument’ werd genoemd.

Terwijl politiek commentator Walter Lippmann in zijn boek Public Opinion (1922) beweerde dat het begrip ‘publieke opinie’ een fictie was, dat de politieke elites hadden geschapen voor hun eigen belangen – omdat ‘de gewone man’ ook te dom was om alles te begrijpen – kwam een decennium later een andere journalist en wetenschapper op, George Gallup. Gallup geloofde dat die publieke opinie kon worden gekwantificeerd. In 1936 voorspelde hij de onverwacht grote zege van Franklin D. Roosevelt. Hij geloofde zelf weliswaar niet in dit soort voorspellingen, maar deed ze als gratis advertentie voor zijn opinieonderzoeksbureau dat vragen van fabrikanten beantwoordde zoals welke tandpasta bevalt het beste en waarom. Maar Gallup was ook een progressieve Democraat die geloofde dat het niet genoeg was als een burger eens per vier jaar een wit vierkantje kon rood maken. Tussentijdse directe peilingen naar de wensen van het volk, dat was een progressieve eis (zoals die nu een eis is van rechts-populistische politici – les extrêmes se touchent, wederom).

***

Dit is een lang intro om de halve eeuw te beschrijven na 1936, de Gouden Eeuw van de opiniepeiling. Het werd het heilige geloof van de moderniserende, industrialiserende en anoniemer wordende ‘samenleving’. Als je samen-leeft weet je wat de ander vindt, in een ‘massa-maatschappij’ had je wetenschappers nodig die de Freudiaanse psychologie konden combineren met de ‘keiharde’ wetenschap van de statistiek, de ponskaart en later de software van de ‘big data’.

Wat door de zege van Trump eindelijk voor iedereen zichtbaar is geworden, was dat voor insiders al veel langer: die opiniepeilingen kunnen wel de opinie van een ‘respondent’ optellen, delen en vermenigvuldigen over wat men nu denkt of z ojuist heeft aangeschaft en waarom, maar niet of nauwelijks voorspellen wat deze mensen over twee, drie of acht maanden vinden of doen. Maar Gallup werd een begrip, ook al had hij grote missers op zijn naam staan inzake voorspellingen.

Na 1945 begonnen politici en overheden, aansluitend op de massaproductie de massamaatschappij en de ‘massamens’, ook behoefte te krijgen aan een ‘massapolitiek’, waarbij het nodig werd geacht om vooraf te weten hoe beleidsmaatregelen gaan vallen bij het volk. Veel later gingen ook ‘de media’ gebruik maken van opiniebureaus, omdat ‘de opiniepeiling’ een heilig geloof was geworden, maar ook omdat dit een stuk goedkoper was dan om journalisten als Jacob Riis of een hele onderzoekscommissie het land door te sturen om zelf die roemruchte ‘thermometer in de kont van de samenleving’ te duwen.

Hoe deden Gallup en al zijn imitatoren hun peilingen? Op basis van de ‘quota sampling’. Als op basis van een volkstelling was vastgesteld hoeveel procent van de bevolking blank, zwart, arm, vrouw, stedeling, laag opgeleid et cetera was, belde men aan de hand van de nieuwerwetse telefoonboeken of registers van autobezitters net zo lang mensen op voor een antwoord tot men het quotum voor de groep vol had. Het probleem was dat veel respondenten geen auto of telefoon hadden. Dit loste men op door het ‘over-corrigeren’ van de uitkomsten. Als in een stad een kwart van de bevolking zwart was, en slechts vijf procent had een telefoon en meegewerkt, dan deed je de uitkomst maal vijf.

Zo ongeveer – ik ben geen statisticus – is het een halve eeuw gegaan, en in feite gaat het nog zo. Maurice de Hond vierde onlangs zijn veertigjarige bestaan als opiniepeiler, en in zijn zelf-feliciterende essay bleek uit niets dat hij sinds 1976 zijn methode van een vast panel van respondenten ook maar één millimeter had aangepast aan de veranderende maatschappelijke en technologische omstandigheden. En die zijn de redenen waarom opiniepeilingen weinig tot nagenoeg niets meer voorstellen.

Waarom? Hierom.

  1. Rond 1980 had elk huishouden een vaste telefoon. Men vond het toen ook nog een eer dat men gebeld werd om zijn/haar mening te geven, over deze tandpasta of die politicus. De respons lag toen boven de negentig procent. Een respons van tachtig procent vonden de bureaus bedenkelijk laag. Nu is de respons bij telefonische peilingen gedaald tot vér beneden de tien procent. Waarom?

  2. Na de komst van de mobiele telefoon kwam er, in VS en ook hier, wetgeving die verbood dat bureaus automatisch 06-nummers belden tot er iemand opnam. Mensen met een vaste lijn waren vooral ouderen. Handmatig bellen kostte veel geld. Steeds meer mensen lieten zich in het ‘bel-me-niet-register’ zetten. Men werd ook doodziek van al die ‘call centers’ die een half uur nadat je een tandenborstel had gekocht al wilden weten hoe je deze belevenis had ervaren. Ter verhoging van de kwaliteit van het product tandenborstel, en de service, dat spreekt.

  3. Mensen nemen hun mobiele nummer mee als ze naar een ander uiteinde van het land verhuizen. Hierdoor worden de voorspellingen per staat/provincie/stad nog onbetrouwbaarder.

  4. Steeds meer burgers, zeker in Amerika, kregen de afgelopen paar decennia het idee dat de opiniepeilers bevooroordeeld waren, dat de politieke vragen suggestief waren, en dat zij – intussen geëmancipeerd ten opzichte van de elites en zeker die sneue call center-_bellers – helemaal geen zin hadden hun intieme meningen te geven. Eigendunk speelde hierbij een rol, maar ook de bekende ‘spiraal van zwijgen’ (E. Noelle-Naumann), die zegt dat als men het gevoel krijgt dat een politieke mening niet door de directe omgeving wordt gedeeld men deze mening minder zal uiten, ter voorkoming van sociale uitsluiting. Maar dat men daarna, achter het gordijntje in het stemhok, wél – en met nog meer overtuiging – die stem uitbrengt op die figuur die de doorsnee-weldenkenden blijkbaar niet vinden deugen. Deze ‘zwijgspiraal’ treedt ook acuut in werking zodra de eigen held in een schandaal is verwikkeld: Trumps ‘kleedkamerpraat: ‘You can grab them by the pussy’_-video, Clinton, de FBI en de e-mails - dan willen hun fans helemaal geen opiniepeiler te woord staan. Ook dit soort feiten valt niet te corrigeren.

5.Internet heeft dit non-respons-probleem niet opgelost. Bijna honderd procent van de kiezers tussen 18 en 27 jaar is altijd online. Van de burgers boven de zestig is dat veertig procent of minder, terwijl maar tien tot vijftien procent van de eerste groep naar de stembus gaat, en boven de zestig wel zestig procent. Voeg hierbij het fenomeen van het sociaal wenselijke antwoord, en de getallen worden nog krommer. Bij de Amerikaanse Congresverkiezingen in 2014 zei ruim zestig procent ‘Ja, natuurlijk ga ik stemmen’, en nauwelijks veertig procent deed dat ook.

  1. Dit sociaal wenselijke antwoord heeft nog een cruciaal aspect, zo bleek bij het Brexit-referendum in juni in Groot-Brittannië. Alle peilingen voorspelden een Remain versus Brexit van 52-48 (bookmakers voorspelden een tachtig procent kans op Remain). Het werd 52 procent vóór Brexit. Waarom? Omdat veel mensen, ook bejaarden, voor het eerst (of sinds lange tijd weer eens) gingen stemmen om néé te zeggen – ‘taking back contro_l’ – en daar met hun rollators weer en wind voor trotseerden. En de pro-Europeaanse jongeren? _‘Ik heb Remain toch geliked op Facebook? Was dat niet voldoende? En buiten regende het trouwens’. Het algemene gevoel blijkt even onberekenbaar als belangrijk.

  2. Nieuwerwetse methodes als ‘Big Data’ hebben ook alle gefaald. Of het nu om ‘sentiment mining’ gaat – je scant alle blogs en tweets op emoties als boosheid of vreugde – of om ‘data mining’ – je volgt rhizomatisch welke heftige opinie door wie en waar word gekopieerd of aangevuld – of om een geheel nieuwe algoritmische mix van alle mogelijke data – wat Nate Slater doet in zijn site FiveThirtyEight (naar het aantal zetels in het kiescollege dat in december officieel de nieuwe president aanwijst). Nate Silver voorspelde in 2012 de uitslag in alle vijftig staten in de VS. Hij werd direct een goeroe, schreef een bestseller (The Signal and the Noise), voorspelde afgelopen maanden een kans op succes voor Hillary Clinton tot boven de negentig procent, en is nu de afgang van het seizoen.

  3. Tot slot zagen we bij deze verkiezingen de voorliefde van veel media – die intussen tot de grote commerciële afnemers behoorden van ‘de peilingen’ – om peilingen te kopen van bureaus die álle peilingen in de magimix mikten en dan een gemiddelde ervan te publiceren. Dit lijkt ogenschijnlijk op de methode van ‘The Wisdom of Crowds’ – duizend mensen raden tezamen het gewicht van de koe beter dan vijf of tien ‘kenners van de koe’ – maar is dat niet. Deze zogeheten Galtung-normaalverdeling gaat niet op als je het gemiddelde neemt van twintig opiniebureaus die alle de verkeerde methode gebruiken. Dat zou hetzelfde zijn als twintig mensen, die alle boven een elektrische deken liggen, vragen hoe warm het bij hen is, en dan het gemiddelde ervan voor de temperatuur in het land te houden.

***

Hoe dan wel?

Er zijn diverse methoden te bedenken om een betere glazen bol te construeren voor het voorspellen van de nabije toekomst. Ik heb hem voor de helft al klaar, maar het prototype vergt nog enige verfijning. Ik wil hier wel al twee methoden noemen die niet of slechts ten dele gebruik maken van opiniepeilingen, big data of statistiek.

De methode van Nate Silver was op zich al een verbetering van de Gallup-methode. Silver was beroemd geworden omdat hij de vraag of honkbalspeler Jansen vanavond het goed of minder goed zou doen kon beantwoorden. Dit deed hij door álle historische gegevens van de prestaties van speler Jansen, zijn team, en de tegenstander in een algoritme te stoppen, en dan te kijken wat er uit kwam. Die voorspellingen bleken vaak te kloppen. Nu blijkt dat Trump ook deze methode om zeep heeft geholpen: er zijn geen data van gevallen zoals hij.

Een andere methode is die welke hoogleraar Allan Lichtman al jaar en dag hanteert, eentje zonder wat voor data ook. Hij gebruikt bij elke presidentsverkiezingen een set van dertien vragen over de toestand van de president en het land. Hij stelt niet anderen maar gewoon zichzelf dertien vragen waarop je alleen ja of nee kunt antwoorden. Dat zijn vragen als: is de kandidaat zittend president? Is de economie in recessie? Is er een grote buitenlandse crisis? Is er sociale onrust binnenslands? Is er een schandaal? Heeft de uitdager charisma? En nog een paar. Als de meerderheid van de vragen met ja wordt beantwoord, verliest de zittende kandidaat, of zijn uitdager. Lichtman heeft alle winnaars bij de presidentsverkiezingen sinds 1984, toen hij er mee begon, goed voorspeld, ook afgelopen 8 november. Zie zijn boek heet Thirteen Keys to the White House (2016)

Een andere methode is die welke de psychologen Philip Tetlock en Dan Gardner hebben uitgetest. In hun boek Superforecasting. The Art & Science of Prediction (2015) beschrijven ze deze methode, die eigenlijk ontstaan is door een ontdekking. De ontdekking was deze: Tetlock onderzocht afgelopen decennia de voorspellingen van duizenden wetenschappers over de nabije toekomst, of er een recessie kwam, of er een oorlog kwam, en dergelijke. Zijn conclusie: deze experts hadden het net zo vaak goed als wanneer chimpansees met pijltjes naar een dartsbord gooien, de helft komt op het bord terecht. Tetlock zag dat sommige van die duizenden voorspellers het significant beter deden. En hij bestudeerde hen. Wat bleek? Die ‘s_uperforecasters’_ hadden kenmerken gemeen.

De ‘s_uperforecasters’_ waren bijvoorbeeld weerman, kunstrecensent of hovenier. Ze keken zelden televisie, luisterden veel naar de radio, lazen veel, wisten wel iets van statistiek, vonden het leuk om voor zichzelf puzzels op te lossen. Belangrijkste: ze waren heel snel in het verwerken van nieuwe informatie. Daardoor pasten ze hun ideeën of voorspellingen direct aan. Ze hadden dus een ‘open mind’, waren nieuwsgierig, hadden totaal geen belang bij een of andere mening, ofwel ze hadden geen last van ‘wishful thinking’ of ‘group think’ en vonden het ‘gewoon leuk’ om aan testjes mee te doen van wetenschappers als Tetlock. Deze ‘supervoorspellers’ scoorden beter dan de beste experts van Harvard of de FBI.

Dit leidt tot de vraag: hoe kunnen we wel beter greep krijgen op de toekomst? Hoe creëren we een sociaal-politieke Buienradar? Misschien zo: via onconventionele onderzoeksmethoden zoals divers samengestelde focus-groepen, of via niet-conventionele onderzoeks-journalistieke methoden.

***

Mao zei tegen zijn getrouwen: ‘De revolutionair zwemt in het volk als een vis in het water.’ Dat is de aanbeveling van Marshal McLuhan voor de bestudering van de bewegingen van en in de ‘tijdgeest’. In zijn eerste boek, The Mechanical Bride uit 1951, voert hij als zijn beste ontdekker van de tijdgeest de zeeman op uit het verhaal van Edgar Allan Poe ‘Een afdaling in de Maalstroom’. Poe’s held overleeft de val in de kolkende tijdstroom dankzij zijn waarnemingsgave: hij bestudeert de dynamiek van de stromingen, terwijl hij zich er midden in bevindt. We moeten, zegt McLuhan, al die verschijnselen, al die heisa, al die media, niet van grote afstand aanzien, maar we moeten ons er midden in begeven.

McLuhan vergat wel dat de situatie van de zeeman (lees: wetenschapper, journalist) nogal oncomfortabel is. Op een vat vastgebonden draait hij rond in de kolkende wateren. En na dit gelukkig maar één dag durende avontuur leeft hij nog, maar zijn haar is grijs geworden.

Maar ja, misschien is dat de prijs wie we moeten betalen als we de tijdgeest –en de mogelijke toekomsten – willen doorgronden. En als we die opdracht verdelen over vele onderzoekers die ‘een rondje doen’ en afdalen in de werkelijkheid, hebben we iets meer kans om met een verscherpt inzicht in zowel heden als nabije toekomst weer boven water te komen. En kunnen we meer beredeneerd zeggen, zoals die grote publieksintellectuelen van vroeger of de statistiekintellectuelen van nu, of de beste fictieschrijvers van nu en de beste essayisten: ‘Volgens mij gaat het die kant op. Dus als je dat niet wilt, kun je beter nu beginnen er iets aan te doen.’


Henri Beunders is hoogleraar Ontwikkelingen in de Publieke Opinie, Erasmus Universiteit Rotterdam