Geschiedenis: Ontsloten archieven

Voorbij de witte mannen

Door handschriftherkenning worden miljoenen documenten op Google-achtige wijze doorzoekbaar. Het kan nieuw licht werpen op onder meer het koloniale verleden. Maar ontsluiten betekent niet automatisch ‘dekoloniseren’.

Brief uit het archief van de Sociëteit van Suriname over het inzetten van troepen tegen de Marrons, gevluchte slaven, Suriname, 1750-1752 © Nationaal Archief

Het portret stond al jaren stof te vangen op zolder. Historicus Henk van Nierop had nooit veel behoefte gehad het erfstuk op te hangen. Dat heeft veel te maken met de afbeelding: schuin achter zijn achttiende-eeuwse voorvader – donkergroene rok, zwart vest, poederpruik – staat een zwarte jongen afgebeeld, naakt en met een parel in het oor, opkijkend naar de witte man. De palmbomen en zeekaart op de achtergrond verwijzen naar koloniale betrekkingen. De jongen reikt de koopman een brief aan, als om diens status als man van de wereld te onderstrepen.

Maar om dat ding nou weg te doen, daarvoor is de emeritus hoogleraar dan toch te veel historicus. Eerst eens de archieven in, noodgedwongen vanachter de computer door de sluiting van archiefinstellingen. Gelukkig is steeds meer archiefmateriaal online beschikbaar.

In het notarieel archief van Amsterdam achterhaalt Van Nierop wie de witte man is: Pieter Willeumier, die samen met zijn twee broers eigenaar is van de Surinaamse plantage Cortenduur. Willeumier voer tweemaal naar Suriname. Op de plantage werkten tot slaaf gemaakten voor hem. Van Nierop schrijft er een stuk over voor Amstelodamum. Maar als het tijdschrift al bijna bij de drukker ligt, hoort hij plotseling dat de archieven van de voc, de wic en de Sociëteit van Suriname digitaal zijn getranscribeerd. Een slimme historicus heeft een zoekprogramma geschreven dat ruim twee miljoen documenten doorzoekbaar maakt. Toch eens kijken, denkt Van Nierop. Hij voert ‘Willeumier’ in en tot zijn schrik krijgt hij 280 hits. Als hij ze bekijkt, beseft hij dat zijn verhaal nog lang niet compleet is. De publicatie wordt uitgesteld.

Nederland loopt voorop in het ontsluiten van historische archieven door middel van machine learning. Met hulp van vrijwilligers en historici leert de computer steeds beter oude handschriften lezen en maakt die op een Google-achtige manier doorzoekbaar. ‘Ik zou dat wel een revolutie in archiefonderzoek durven noemen’, zegt Gerhard de Kok, de universitair docent geschiedenis uit Leiden die het zoekprogramma schreef waar Van Nierop mee werkte.

Een zoektocht die voorheen maanden in beslag kon nemen, is nu uit te voeren met een druk op de knop. En het is niet alleen een kwestie van tijd, het is ook een kwestie van perspectief. Er kan gezocht worden op andere termen, naar andere verhalen en met big data. Archiefwetenschappers denken dat je met slimme toepassingen van de nieuwe zoekwijze voorbij de blik van de machthebbers kunt komen die de archiefstukken schreven, en voorbij de witte mannen die er al eeuwenlang onderzoek in doen en de archieven hebben geordend volgens hun logica.

Het Nationaal Archief presenteert op 17 mei het grote project ‘De ijsberg zichtbaar maken’, met meer dan twee miljoen scans van handgeschreven archiefstukken die relatief makkelijk doorzoekbaar worden. Maar er is veel meer. Het Huygens Instituut voor Nederlandse Geschiedenis maakt een half miljoen pagina’s met resoluties van de Staten Generaal digitaal doorzoekbaar en veel regionale en stadsarchieven voeden grote collecties aan de computer. Juist die hoeveelheden zijn belangrijk, want de techniek erachter, Handwritten Text Recognition (htr), is gebaat bij grote aantallen. Hoe meer de computer leest, des te beter leert die de hanenpoten en logica van oude handschriften herkennen. Het achttiende-eeuws van de software is al heel behoorlijk, het zeventiende-eeuws gaat iets stroever, toch zitten veel systemen zo rond de 95 procent accuraatheid.

Een belangrijke slag wordt gemaakt op de zesde verdieping van het Stadsarchief Amsterdam, dat vrijwel geheel in beslag wordt genomen door de notariële akten die tussen 1578 en 1915 werden opgesteld. Het is drieënhalve kilometer papier, voorheen alleen geordend op naam van de notaris en het jaartal. ‘We kregen vaak op ons donder van onderzoekers dat dit mooiste archief van Amsterdam vrijwel niet doorzoekbaar was’, zegt Pauline van den Heuvel, projectleider van ‘Alle Amsterdamse akten’. ‘Maar waar begin je in een berg van die omvang? En het scannen alleen al kost een paar miljoen.’

In de zeventiende en achttiende eeuw gingen Amsterdammers veel vaker naar de notaris dan nu. Zo herbergt het archief bijvoorbeeld ook ooggetuigenverslagen van opstootjes en geeft dus een rijke blik op het stadsleven. Volgens de projectsite zijn eind april al bijna negen miljoen pagina’s gescand en hielpen al meer dan elfhonderd vrijwilligers met het trainen van de computer. Een scan wordt eerst getranscribeerd met behulp van het programma Transkribus, dat door veel internationale archieven en onderzoekers wordt gebruikt, maar herbergt soms nog veel fouten. Een vrijwilliger corrigeert die en voert het document opnieuw in, waardoor de computer leert.

‘Maar weinig mensen kunnen het zeventiende-eeuws lezen. htr is een soort Google Translate naar het verleden’, zegt Van den Heuvel. Het leidt tot nieuwe toepassingen. Het project ‘Virtual Interiors’ probeert aan de hand van gedetailleerde gegevens de zeventiende-eeuwse inboedels van grachtenpanden virtueel te reconstrueren. De juiste schilderijen aan de juiste muren, precies als vier eeuwen geleden.

‘Het zijn de archief­instellingen die toegang verlenen. Daarin schuilt een machtsverhouding’

De notariële akten bulken van de historische vondsten. Zo duikt via htr de inheemse Surinaamse leider Uquerika op. Hij moet in 1682 een van de eerste inheemse Surinamers in Amsterdam zijn geweest. Uit de ondertekende akte blijkt dat hij geen Nederlands kende, maar wel zijn naam in Latijns schrift kon schrijven. Het toont dat htr verhalen naar boven kan toveren die in de gebruikelijke indexering van archieven onvindbaar waren gebleven. De documenten en archieven zijn opgesteld voor en door de machthebbers, maar ze gaan vaak over gemarginaliseerde groepen. Door dwars door de indexering heen op zoektermen te zoeken, lukt het soms om ook hun een identiteit te geven.

Pieter Willeumier, schilder onbekend, 1750-1770. Olieverf op doek, 86,2 x 104,2 cm © Henk van Nierop / collectie Amsterdam Museum

Ook de voorvader op het schilderij van Van Nierop liet sporen achter in de notariële akten, er bleek vooral veel in het archief van de Sociëteit van Suriname te vinden dat sinds januari met htr doorzoekbaar is. ‘Ik was er altijd van uitgegaan dat het zwarte jongetje geen echt portret was’, zegt Van Nierop, ‘maar een soort attribuut om de status van de koopman aan te geven.’ Nu vond hij dat Willeumier op een terugreis uit Suriname een verstekeling aan boord aantrof, een jongen van zijn plantage die hij dus meenam naar Amsterdam.

Volgens Willeumier was de jongen aan boord gegaan omdat hij geen afscheid kon nemen van zijn meester. Dat lijkt twijfelachtig. In Suriname hield de planter zich onder andere bezig met expedities om marrons, naar het oerwoud gevluchte slaven, op te sporen en te straffen. Ook organiseerde Willeumier een openbare verkoop van 176 mannen, vrouwen, jongens en meisjes die op een slavenschip uit Angola waren aangekomen. De veiling duurde vier dagen en bracht 48.895 gulden op. Zonder htr had het Van Nierop weken werk gekost om dit te achterhalen en was hij het verhaal mogelijk helemaal nooit tegengekomen.

De ontwikkelingen in htr gaan snel en zijn afhankelijk van de inzet van vrijwilligers en van historici met technische kennis. De zoekmachine die Van Nierop gebruikte, bouwde historicus Gerhard de Kok op eigen initiatief in de kerstvakantie. Hij zag dat het Nationaal Archief verschillende koloniale archieven zoals van de wic, voc en Sociëteit van Berbice door de htr had gehaald, maar kon niet wachten tot de lancering van de zoeksite in mei en ging aan de slag. ‘Ik had eigenlijk nog nooit serieus met htr gewerkt’, vertelt De Kok, ‘maar ik kan een beetje programmeren.’ Het werkt verrassend goed, zegt hij, maar zeker in zeventiende-eeuwse teksten komen veel verschillende spellingsvormen voor. ‘Je kunt zeggen dat het nu werkt als Google twintig jaar geleden. Hij zoekt heel letterlijk op de termen, niet op wat je er eigenlijk mee bedoelt.’

De Kok deelt zijn scherm en toont een soort woordenwolk. Met software uit de linguïstiek heeft hij de computer door middel van een ‘neuraal netwerk’ laten kijken welke woorden in de archieven verband met elkaar houden. Wanneer hij het woord ‘schilderij’ intikt, verschijnen tientallen spellingsvarianten en gerelateerde woorden: ‘schildery’, ‘schilderye’, ‘lantschap’, ‘tronie’, ‘kontrefeijtsel’. ‘Dit laat zien dat als je alleen op “schilderij” zoekt, je heel veel mist. Misschien ontdek je op “kontrefeytsel” wel nieuwe werken. De computer gaat relaties leggen. Toen ik zocht op het woord “rebellie”, suggereerde de computer een relatie met het woord “Betlehem”. Dat bleek te verwijzen naar een plantage in Suriname waar een grote opstand was. Ik denk dat dit het begin is van de mogelijkheden.’

Er starten nu ongelooflijk veel htr-projecten, ziet Charles Jeurgens, hoogleraar archiefwetenschappen aan de Universiteit van Amsterdam. Hij snapt het enthousiasme, maar waarschuwt voor ‘tech-optimisme’. ‘De suggestie wordt gewekt dat je met één druk op de knop door die kilometers archief kunt en dan antwoorden vindt. Ja, je zult zeker iets vinden, maar vervolgens moet je de vondsten interpreteren. Daar blijven historici en vooral archivarissen voor nodig.’

Hij houdt zich bezig met het vraagstuk van het dekoloniseren van archieven. ‘Kunnen we door htr gemarginaliseerde groepen, zoals tot slaaf gemaakten, identificeren?’ Samen met studenten doorzocht Jeurgens tienduizend testamenten van voc-dienaren. ‘In meer dan zestig procent daarvan figureren vrouwen, en in dertig procent tot slaaf gemaakten en inheemsen. Dat leert ons dat er veel te vinden is, maar de volgende stap is de moeilijkste: hoe ga je ze identiteit geven? Je zou op lange termijn willen dat je andere typen documenten, zoals politieke besluiten en correspondentie, kunt koppelen aan die data en zo misschien verbanden legt. Ook met archieven in bijvoorbeeld Indonesië en Zuid-Afrika. Maar dat is nog verre toekomst.’

Het ligt zelfs voor de hand dat htr nog altijd een koloniaal perspectief in stand houdt. Het aan de universiteit van Innsbruck ontwikkelde programma Transkribus leert lezen aan de hand van de koloniale archieven en wordt getraind op vragen van overwegend Europese onderzoekers. ‘Het idee heerst dat ontsluiting automatisch leidt tot dekolonisatie’, zegt onderzoeker Stevie Nolten, die werkt aan het project ‘Sounds Familiar’ rond dekolonisatie bij het Instituut voor Beeld en Geluid. ‘Maar het zijn nog steeds de archiefinstellingen die toegang verlenen. Daarin schuilt al een machtsverhouding: zij zijn blijkbaar eigenaar, terwijl die documenten vaak gaan over mensen die aan kolonisatie onderworpen zijn.’

Nolten roept op om elke stap uiterst kritisch te benaderen. ‘Ik heb zelf een Indonesisch-Nederlandse achtergrond en ik vond het erg heftig om die documenten te lezen. In onderzoek dat gebruikmaakt van htr wordt nog steeds volgens westerse normen gecategoriseerd. Als je in voc-stukken zoekt naar mensen van Java, vind je mensen die op Java tot slaaf zijn gemaakt, maar de kans is aanwezig dat ze oorspronkelijk van andere eilanden kwamen. Wat het dekoloniseren van archieven eigenlijk inhoudt en of dit geslaagd is, kunnen volgens mij alleen diegenen die aan kolonisatie onderworpen zijn en hun nazaten bepalen.’

Het schilderij heeft Van Nierop inmiddels overgedragen aan het Amsterdam Museum, dat geïnteresseerd is in het koloniale verleden en de zeventiende-eeuwse zwarte gemeenschap in de hoofdstad. ‘Daar gaat het waarschijnlijk wegkwijnen in het depot’, zegt Van Nierop. ‘Prima, ik hoef het niet meer in mijn huis te hebben.’