Data-opslag in DNA

Van bits en bytes naar moleculen

We willen zoveel data bewaren dat de technologie het bijna niet meer kan bijbenen. Maar op een campus in een Engels gehucht werken pioniers aan een oplossing: dataopslag in synthetisch DNA. Werkt dat echt? En is het veilig?

close-up van een DNA-structuur, 1963 © Fritz Goro/ The LIFE Picture collection / Getty Images

Belangrijke uitvindingen zijn dikwijls een kwestie van toeval. Serendipiteit wordt dat ook wel genoemd: zonder dat je ernaar op zoek was, stuit je op een bijzonder inzicht. dna-informatieopslag is zo’n inzicht: het gevolg van een gelukkige samenloop van omstandigheden die de manier waarop we data opslaan, en misschien zelfs de manier waarop we leven, volledig op zijn kop zou kunnen zetten.

In dit geval lag de bron voor de serendipiteit op de Wellcome Genome Campus, een wetenschappelijke onderzoekscampus in het gehucht Hinxton in Engeland. Hier is het European Bioinformatics Institute ofwel embl-ebi gevestigd; een onderdeel van het European Molecular Biology Laboratory. Bij deze internationale organisatie, hierna kortweg aangeduid met ebi, werken zeshonderd mensen die onderzoek doen en service verlenen op het gebied van biologische data. De campus is tevens de plek waar alle codes van het menselijk genoom in kaart zijn gebracht. Het Wellcome Trust Sanger Institute, naamgever van de campus, voert hier bovendien momenteel zijn ambitieuze Darwin Tree of Life-project uit: het in kaart brengen van het genoom van álle organismen. Inmiddels zijn er al 66.000 soorten in het Verenigd Koninkrijk verzameld.

Tijdens mijn bezoek aan de campus ontmoet ik als eerste de Roemeense Oana Stroe, pr-medewerker van het ebi. Stroe voelt zich hier duidelijk thuis. ‘Er werken hier mensen van wel zestig nationaliteiten!’ Lachend verontschuldigt ze zich voor de kleur van haar paraplu en oorbellen: die is dezelfde als de kleur van het ebi-logo. ‘Iedereen zegt dat ik zó on-brand ben, maar het is gewoon mijn lievelingskleur.’ Na een harde plensbui (‘I blame Brexit’) is ze opgelucht dat het helemaal opklaart. Nu kan ze me de campus in zonovergoten staat laten zien. Tijdens onze tour somt ze alle faciliteiten op: ‘Tennisbanen, sportschool, kinderopvang, een pendeldienst heen en weer naar Cambridge.’

Het uitgangspunt hier is dat alle biologische data vrij beschikbaar moeten zijn voor wetenschappers over de hele wereld: open science. Het ebi is dan ook cruciaal voor wetenschappelijk onderzoek. ‘We krijgen wel twee miljoen aanvragen per jaar’, vertelt Stroe. Alleen in de Verenigde Staten is een vergelijkbare hoeveelheid biologische data beschikbaar. Toen de Amerikaanse overheid een jaar geleden een shutdown van een maand meemaakte, zagen ze hier in Hinxton dan ook een forse stijging van het aantal verzoeken om data.

Het meest futuristische gebouw van de uitgestrekte campus ligt aan de zuidkant en maakt deel uit van het ebi. Het lijkt op een plat ruimteschip met aan de ene kant een lange, holle cilinder waar je doorheen kunt kijken en aan de andere kant een naar beneden buigende driehoek. Filmproductiebedrijf Marvel vroeg ooit of ze hier opnames mochten maken waarin het gebouw dienst zou doen als het ‘kwaadaardige hol’ van een groepje griezelige wetenschappers. Uiteindelijk werd de film niet gemaakt.

De noordkant van het terrein ademt juist eeuwenoude Engelse historie. Een monumentale eik met dikke, wijze stam rijst op uit een weids grasveld. Achter de statige boom liggen een riviertje en het klassieke Hinxton House. Hier kwamen de jongens van Cambridge vroeger om te vissen en te jagen. Het kantoor van Nick Goldman, een van de hoofdonderzoekers bij het ebi, ligt dicht bij de oude eik. Hier vertelt de tengere, gedreven wiskundige me zijn verhaal. Het begint in 2010.

ethernetkabels verbonden met een server, 2017 © Chris Ratcliffe / Getty Images
Het datacenter van Facebook in Luleå, Noord-Zweden, gebruikt het poolklimaat om te koelen in plaats van airconditioning. 2015 © David Levene / Eyevine / HH

Op een avond zitten Nick Goldman en Ewan Birney, eveneens wetenschapper van het ebi, in de bar van het Gastwerk Hotel in Hamburg. Ze zijn bezorgd. Ze hebben die dag een conferentie bezocht over de uitdijende stroom van genetische informatie. Op de Genome Campus in Hinxton brengen wetenschappers op dat moment het volledig menselijk genoom in kaart. ‘Men verwachtte van ons dat we de snel toenemende hoeveelheid genetische informatie die we verzamelden met dezelfde snelheid zouden opslaan en toegankelijk maken voor wetenschappers over de hele wereld. Dat was een probleem. Onze computers werden weliswaar beter, maar niet zó veel beter dat ze die explosieve informatiestromen konden bijhouden. En onze funding nam ook maar nauwelijks toe.’ Goldman pauzeert bedachtzaam.

Uit de Verenigde Staten, waar in een parallel project wetenschappers eveneens het menselijk genoom in kaart brachten, kwam een jaar eerder zelfs al het bericht dat ze de opname van data moesten staken, omdat ze de rap stijgende hoeveelheid simpelweg niet meer konden opslaan. Hoewel het European Bioinformatics Institute ‘genereuze funding’ ontving van de 27 landen die het instituut bij verdrag hadden opgericht, en hoewel het Verenigd Koninkrijk als gastland miljoenen bijdroeg, hadden de wetenschappers meer geld nodig. ‘26 miljoen pond, alstublieft’, glimlacht Goldman een beetje ondeugend. ‘We zagen het opslagprobleem groter worden. Tegelijkertijd vraagt de aard van ons werk erom dat we dna-moleculen als drager van informatie zien. Wat we hier vastleggen zijn immers de sequenties – de codes van het genoom – van de dna-moleculen.’

Zo’n sequentie ziet er niet anders uit dan een computerbestand met codes van vier letters. ‘Eerst neem je een stukje menselijk weefsel. Met een centrifuge haal je daar het dna uit. Dat breek je op in kleinere stukjes. Ten slotte is er dan een machine die elke bouwsteen van elk stukje dna uitleest en naar je terugstuurt in een computerbestand.’ Uiteindelijk houd je dan een computerbestand over met de volgordes van die verschillende bouwstenen: aangeduid met de letters A, G, C en T. In groepjes van drie lees je combinaties van deze vier letters uit. Goldman: ‘Uiteindelijk moet je met al die kleine stukjes dna een enorme legpuzzel maken en zo krijg je dan 23 stukken dna, de chromosomen.’ Daarmee is het menselijk genoom, de genetische blauwdruk voor de mens, vastgelegd.

Het aha-moment kwam die avond in Hamburg na een niet meer te achterhalen aantal glazen bier. Zou het niet mogelijk zijn om digitale informatie, bestaande uit codes van nullen en enen, om te zetten in dna-sequenties, codes van de vier letters A, G, C en T? Zou je informatie niet kunnen opslaan zoals genen? Het begon als een soort grap, maar al snel werd het serieus.

Voor Goldman is dit namelijk een minder bizar idee dan voor de meesten van ons. Computation zit hem in het bloed. Als wiskundige werkt hij aan modellen voor het opslaan van biologische informatie. Voor hem was de stap van een digitaal informatiesysteem – lees: de opslag van informatie in een code van nullen en enen op een magnetische schijf – naar een biologisch informatiesysteem – lees: de opslag van informatie in een code van de vier letters A, G, C en T in een molecuul – minder groot. ‘We hadden alle rekenvaardigheden in huis om een systeem te ontwerpen dat digitale informatie zou omzetten in informatie op een dna-molecuul en weer terug’, zegt hij. ‘Weliswaar hadden we zelf geen lab waar we het synthetisch dna konden maken, maar we kenden de mensen die dat wel hadden.’

Birney en Goldman maakten direct een paar berekeningen. Die vormden de basis voor het later in een paper vastgelegde wiskundig bewijs dat het in principe mogelijk is om digitale informatie om te zetten naar informatie in een dna-molecuul. Het door hen ontworpen systeem bestond in feite uit een softwareprogramma dat de computer vertelt op welke manier de code van nullen en enen moet worden omgezet naar de vier letters A, G, C, en T in het dna. Ze stuurden de codes die ze daarmee kregen naar collega’s die dna-moleculen konden synthetiseren in hun lab. Niet veel later ontvingen ze een buisje met synthetisch dna terug.

‘Het was echt piepklein!’ vertelt Goldman. ‘Ik zag bijna niet dat er iets in zat.’ Maar er zat wel degelijk iets in: de 154 sonnetten van Shakespeare, een clip van de beroemde ‘I Have a Dream’-speech van Martin Luther King, een pdf van de publicatie van James Watson en Francis Crick over de structuur van dna en een foto van de oude eik op het terrein van de Genoom Campus. Plus een code om al deze informatie in dna-code om te zetten. Alles was foutloos overgebracht.

Dit eerste geval van informatieopslag in dna vond plaats in 2013. Maar hoewel de Scientific American in juli 2019 dna-informatieopslag onder een van de tien meest veelbelovende technologische doorbraken schaarde, slaan we onze data vooralsnog niet op in dna-moleculen. Waarom niet? En de omgekeerde vraag is misschien minstens zo relevant: waarom eigenlijk wél? Om deze vraag te beantwoorden moet je eerst een stapje terug doen. Terug naar de struikelblokken van onze eigen, ‘ouderwetse’, digitale opslag.

‘Het heilige doel is dat we elk jaar sneller moeten. Maar zowel de rekencapaciteit als de opslagcapaciteit stijgt helemaal niet meer zo snel’

Op een heldere winterdag meld ik me bij het datacentrum op het Science Park in Amsterdam. De raamloze hoge toren oogt als een kruising van een gevangenis en een kluis. De patronen op de muren doen denken aan islamitische tekens. Als ik naar boven kijk, steekt de toren fel af tegen de blauwe lucht waardoor het lijkt of hij op me valt.

Amsterdam is een van de grootste digitale knooppunten van Europa. Dat heeft vooral te maken met de aanwezigheid van de Amsix, de Amsterdam Internet Exchange: een soort ‘knooppunt Rottepolderplein’, maar dan voor digitale gegevens. De strikte beveiligingsprocedure geeft mijn bezoek een spannende dimensie. Paspoort afgeven, speciale pas, eerste poortje door, wachten, nog een poortje door, wachten. Twee medewerkers van SURFsara leiden mij rond. De eigenaar van het gebouw, Digital Realty, verhuurt ruimte aan verschillende bedrijven. SURFsara is hierbij een grote partij.

Eerst bezoeken we de ‘gewone’ opslagruimtes: gangen vol op elkaar gestapelde, zacht ronkende computers met rode en groene lichtjes die aan en uit knipperen. Het pièce de résistance is echter een supercomputer met de naam Cartesius: een aantal kasten vol aan elkaar geschakelde computers die samenwerken en op die manier nóg meer rekenkracht vergaren. Cartesius helpt bijvoorbeeld klimaatwetenschappers om hun klimaatmodellen door te rekenen. Klimaatmodellen moeten immers rekening houden met heel veel verschillende factoren, en die factoren beïnvloeden elkaar ook nog eens allemaal. Dat maakt de berekeningen complex en vergt extra rekenkracht. Cartesius kan dat aan.

Ik krijg oordoppen tegen het lawaai. Hoewel de ruimtes voortdurend worden gekoeld, is het er benauwd en warm. Koeling is dan ook een van de belangrijkste kostenposten van rekenen en data-analyse. De elektriciteit die in de computer wordt gestopt, komt er een beetje uit als rekenkracht en verder vooral als warmte. In IJsland, waar enorme datacentra voor bitcoin-berekeningen staan, gaat inmiddels zelfs een groter deel van de totale energie naar deze centra dan naar alle IJslandse huishoudens bij elkaar.

Mijn gids bij SURFsara is Niek Bosch. Op zijn LinkedIn-pagina staat onder zijn naam de slogan ‘pushing bits through clouds’. Bosch is hps-medewerker bij SURFsara; die afkorting staat voor high processing services en dat komt neer op ‘rekenen in de cloud’. Bosch legt uit: ‘We zijn aan de fysieke grenzen gekomen van rekenen op een enkele computer. Daarom zijn we computers aan elkaar gaan koppelen, zodat de rekenkracht kan worden verdeeld over meerdere computers. Dat is in feite wat supercomputer Cartesius doet.’

Later, op het kantoor van SURFsara, praat ik daarover door met Jos van Wezel, senior advisor dataservices. Van Wezel trekt in twijfel of we wel moeten proberen telkens sneller te gaan: ‘Het is niet milieuvriendelijk, want je verliest ontzettend veel energie.’ Hij denkt na terwijl hij praat, neemt pauzes en weegt zijn woorden zorgvuldig. ‘Aan de andere kant hadden we zonder die snelheden misschien nu wel niet zulke goede klimaatmodellen gehad.’ Even later: ‘Toch blijft het de vraag waarom we eigenlijk alles, maar dan ook alles, willen bewaren. Zelfs alle oude Tina’s zijn digitaal opgeslagen! En overal wordt ook een kopie van bewaard. Of drie, of vier.’

De ‘Wet van Moore’, geformuleerd door Intel-chipfabrikant Gordon Moore, zegt dat het aantal schakelende componenten op een computerchip elk jaar verdubbelt. Daarmee wordt dus ook elk jaar de rekenkracht van computers vergroot en, sinds data meer en meer worden opgeslagen op een chip waarvoor rekenkracht is vereist, de opslagcapaciteit eveneens. Van Wezel: ‘En deze wet jagen we nog steeds na in computerland. Het heilige doel is dat we elk jaar sneller moeten. De industrie heeft dat jarenlang beloofd en ook geleverd. Maar zowel de rekencapaciteit als de opslagcapaciteit stijgt helemaal niet meer zo snel. Die zwakken juist af. De vraag is op een gegeven moment waarom je dan nóg sneller wilt.’

Want, vervolgt hij: ‘Iedereen in computerland weet: de fysieke grenzen zijn bereikt.’ Dat heeft te maken met het feit dat de structuren in computerchips inmiddels het formaat van atomen benaderen en dus niet meer kleiner kunnen worden. Daarbij treden effecten op die de stabiliteit van de componenten ondermijnen.

Ik vraag Van Wezel naar cloudopslag, voor mij een mysterieus fenomeen. Want waar ís al die informatie die we in een cloud opslaan? Zweeft die in de lucht? Van Wezel: ‘Vergelijk het met een carsharing- of leenfietsensysteem. Je hebt niet een eigen auto, en het maakt ook niet uit welke auto je krijgt, maar als je er eentje nodig hebt, dan staat hij voor je klaar. Zo werkt het hier ook met de rekenkracht van computers of de opslagcapaciteit van datacentra.’

Digitale notering van het menselijk genoom. De kleuren zijn representatief voor de vier componenten van DNA. American Museum of Natural History, New York. 2001 © Mario Tama / Getty Images
Het door het Amerikaanse bedrijf Celera ontcijferde menselijk DNA opgebouwd uit de letters A, G, C en T © Raphael Gaillarde / Gamma-Rapho / Getty Images
Servercenter, Berlijn. 2018 © Thomas Koehler / Getty Images

Cartesius, oftewel de Franse filosoof Descartes, scheidde ooit lichaam en geest en beschouwde de geest als de enige bewijsbare waarheid (ik denk, dus ik besta). De cloud weekt op vergelijkbare wijze de materiële basis van informatie los van de boodschap en stelt hiervoor het onzichtbare netwerk in de plaats. De cloud bestaat dus uit al die ‘leenfietsen’ die niet van jou zijn. En tegelijkertijd staan er dus wel degelijk overal fietsen, net zoals er wel degelijk fysiek overal bits informatie op harddrives staan. Om die informatie eraf te halen, te doorzoeken of te veranderen hebben we energie nodig. Veel energie.

Ondertussen neemt de hoeveelheid informatie die we opslaan in duizelingwekkend tempo toe. In de afgelopen paar jaar hebben we als mensheid al meer data opgeslagen dan in de gehele geschiedenis van de mensheid daarvóór. De zorgen van Goldman en Birney die avond in de pub in Hamburg zijn dus eigenlijk de zorgen van ons allemaal. Want onze huidige technologie voldoet niet bepaald aan de normen van duurzame opslag. En de hoeveelheid data neemt niet alleen met ongekende snelheid toe, het medium waarop al die data worden opgeslagen verandert ook voortdurend, evenals de systemen waarmee je die data kunt aflezen.

Dina Zielinski, een wetenschapper die zich eveneens bezighoudt met dna-dataopslag, momenteel aan het Institut Curie in Parijs, legt het allemaal haarfijn uit in een TED Talk: ‘Alle technologie gaat uiteindelijk verloren of raakt in onbruik.’ En voor die tijd moeten de data naar nieuwe technologie worden overgezet. ‘Je moet er op tijd bij zijn. Zelfs de bits van digitale technologie vergaan na verloop van tijd. In dit verband spreekt men dan ook wel van “bit rot”.’

dna blijft daarentegen altijd relevant, want al het leven op aarde bevat dna. Zielinski vertelt over het skelet van Ötzi, de ijsmummie die in 1991 uit een Tiroler gletsjer tevoorschijn kwam. Met behulp van dna-onderzoek kwamen wetenschappers veel te weten over deze verre voorouder. ‘We hebben meer kans om informatie te reconstrueren uit het skelet van een prehistorisch mens dan uit een oude telefoon’, aldus Zielinski. De 21ste eeuw wordt om al deze redenen wel eens de toekomstige digital dark age genoemd. Is het mogelijk dat men in de toekomst zal denken dat er, gezien het gebrek aan robuuste dataopslag, in onze digitale tijd maar weinig werd nagedacht? Vergelijk het eens met het begin van de veertiende eeuw. Onderzoekers dachten lang dat het denken in die periode een beetje stillag. Men vond immers nauwelijks geschreven teksten terug. Later bleek dat het gebrek aan informatie te maken had met de overgang van perkament naar papier. De eerste vorm van papier was nog maar weinig robuust en overleefde zelden de tand des tijds. Het gebrek aan vondsten had dus waarschijnlijk eerder te maken met de vergankelijkheid van het materiaal dan met een gebrek aan gedachten.

Eerst is er een inzicht. Dan komt de hype, gevolgd door tegenvallende experimenten. Als de technologie desondanks levensvatbaar blijkt, kan het hard gaan

Terug naar Nick Goldman, die zijn carrière begon bij het Museum of Natural History in Londen. ‘Wetenschappers bestudeerden daar fossielen en in die tijd begonnen we voor het eerst te kijken naar genetische informatie voor de classificatie van soorten.’ Dat we genetische informatie uit fossielen kunnen aflezen, bewijst hoe duurzaam dna is. ‘Als je dna koel opslaat, kun je het duizenden jaren bewaren.’

Ik leg hem een dystopisch toekomstscenario voor; hoe synthetisch dna zich straks in ons lichaam nestelt en met ons aan de haal gaat. Goldman wijst dat geduldig van de hand. ‘Als je een synthetisch dna-molecuul in je lichaam zou brengen, wordt dat waarschijnlijk afgebroken. We krijgen voortdurend stukjes dna in ons lichaam, denk aan griepvirussen. Maar dat dna wordt vrijwel nooit onderdeel van ons eigen dna, van ons genoom. Alle levende organismen zijn er vrij goed in om géén willekeurige stukjes dna te incorporeren. Bovendien is het synthetische dna-molecuul niet gecodeerd met opdrachten om eiwitten te bouwen. Er zitten expres stop-met-bouwen-codes in die moleculen.’ Het is dus ‘ander dna’.

De problemen met deze technologie liggen volgens Goldman dan ook eerder op praktisch vlak. ‘Het aflezen van dna-codes en veel van het schrijven van de codes is nog te duur en gaat te langzaam. Zelfs als je het efficiënt zou opschalen, gaat het nog te traag. Specialisten zijn het erover eens dat we ten minste tien tot de macht vijf of zes sneller moeten gaan voordat deze technologie levensvatbaar kan worden. Dat klinkt behoorlijk hopeloos, maar in de genoomsequenties is tien tot de macht zes precies wat er gebeurde aan opschaling in een periode van vijf jaar. Of denk aan de eerste computers. Die namen nog kamers in beslag; nu zitten ze in je broekzak.’

Verschillende onderzoekers werken aan het ontwerpen van betere algoritmes die de foutmarges van het overzetten van digitaal naar dna (en terug) kleiner maken en het hele proces sneller. Yaniv Erlich en Dina Zielinski ontwikkelden bijvoorbeeld een nieuw algoritme met de naam ‘DNA fountain’. Daarmee waren ze in staat om 2.14 megabytes aan computerdata, inclusief een computerbesturingssysteem en een cadeaukaart van Amazon, te coderen én weer foutloos af te lezen in dna. Hun strategie bereikte een record wat betreft de dichtheid van data: 215 petabytes in een gram dna.

Jossy Sayir, verbonden aan de Universiteit van Cambridge, werkt verder aan het verfijnen van de rekenmodellen die aan de basis staan van dna-informatieopslag. Ik ontmoet hem bij Newnham College in Cambridge. Hij groet verschillende voorbijgangers uitbundig terwijl hij me rondleidt langs de historische gebouwen van de campus. Alleen meisjes kunnen hier studeren, maar Sayir wordt als man ‘gedoogd’, legt hij lachend uit. Bij de ingang van de bibliotheek staat een borstbeeld van Rosalind Franklin, die een belangrijk aandeel had in de ontrafeling van de dubbele-helixstructuur van dna.

Sayir deed twee studies naar de mogelijke gevaren van dna-dataopslag. Is het mogelijk dat het dna met de data onderdeel wordt van ons genoom en dat we op die manier onbedoeld ons eigen genoom blijvend veranderen? Uiteindelijk hebben alle zoogdieren op die manier ooit hun placenta gekregen. In een ver verleden werd een virus met een placentafunctie opgenomen in het dna van een organisme, waardoor nageslacht kon groeien in het lichaam van een organisme zelf. Er was een afscheiding tussen moeder en baby gecreëerd. Kortom: het ís in theorie mogelijk dat dna van buitenaf zich nestelt in ons dna. Sayir geeft toe dat er een piepkleine kans is, maar verzekert mij direct dat de risico’s zó minimaal zijn dat ze echt verwaarloosbaar zijn. ‘Zeker gezien de kleine schaal waarop we nu experimenteren.’

Sayir heeft dozen met lego bij zich. Ze zijn van Nick Goldman, die ze gebruikt bij veel van zijn lezingen. We bouwen twee torens van legoblokjes. De blokjes hebben vier kleuren en precies dezelfde kleurenvolgorde. Hij laat zien wat er gebeurt als je bij een van de torens een blokje weghaalt. Nu klopt de hele volgorde vanaf de plek van de mutatie niet meer. ‘Als er één blokje verandert, dan klopt alles niet meer. Dit maakt het heel moeilijk om erachter te komen waar de fout precies zit en dat is een van de redenen waarom dna-opslag kostbaar en langzaam is.’

Een van de wiskundige manieren om hiermee om te gaan is om de volgorde, de code, niet te zien als een sequentie – een rechte lijn – maar als een set. In plaats van een lineaire code krijg je dan een soort ‘cloud’-code. Ik geef aan dat dit mij boven de pet gaat, waarop Sayir gelukkig toegeeft dat het ingewikkelde materie is. ‘Dat soort theoretische ideeën, dat is waar wij vooral mee bezig zijn. Net als Claude Shannon, de grondlegger van de informatietheorie. We bedenken wat in theorie mogelijk zou moeten zijn. Daarna komt pas de praktische uitvoering. In de informatietheorie, vooral onder computertechnici, gaat het meestal juist andersom. Dan begin je met experimenten.’

Sayir ziet het niet op korte termijn gebeuren, informatieopslag in dna. ‘Het aflezen van dna, de sequenties lezen, dat is niet zo moeilijk. Waarschijnlijk kan je huisarts over tien jaar gemakkelijk een deel van jouw dna lezen.’ Maar het schrijven van de codes in het dna, het synthetiseren in de moleculen, ‘dat is veel lastiger en kostbaarder’.

Ondanks alle praktische bezwaren zijn verschillende bedrijven bereid om flink te investeren in deze technologie. Het is goed mogelijk dat die op dit moment door de zogenaamde ‘trog van desillusie’ gaat. IT-bedrijf Gardner muntte deze term, met bijbehorende grafiek van de zogenaamde hype cycle, voor alle nieuwe technologie. Eerst is er een spannend inzicht, een lijntje opwaarts. Dan komt de hype, de lijn schiet hard omhoog. Vervolgens leveren de eerste experimenten weinig op en zakt de lijn naar beneden: de ‘trog van desillusie’. Maar als daarna gestaag wordt doorgewerkt aan de technologie en deze is levensvatbaar, dan kan het hard gaan. Je ziet dat nu gebeuren bij kunstmatige intelligentie; die is over de trog van desillusie heen geraakt en maakt nu daadwerkelijk sprongen. De bitcoin lijkt op dit moment midden in de trog te zitten. Hoe zit dat met dna-informatieopslag?

De ervaring leert dat opschaling hard kan gaan en dna-dataopslag is dan ook ‘commercieel gevoelige technologie’ waarvan ‘verschillende bedrijven claimen dat ze het nu al kunnen’, aldus Nick Goldman. De meeste bedrijven zijn echter niet erg happig op het delen van hun laatste inzichten. Goldman begrijpt dat wel, ‘het is hun businessmodel’. Het zijn bedrijfsgeheimen. Maar soms is het wel frustrerend. ‘Op conferenties is iedereen enthousiast, maar niemand vertelt precies waar ze mee bezig zijn. Ze zijn vaak meer bezig met reclame maken en window shopping.’

Goldman zelf is inmiddels met ander onderzoek bezig. ‘We hebben dit net zo hard geprobeerd als we het zelf wílden proberen. Uiteindelijk hebben we zelf geen bedrijf opgericht. We wilden allebei graag ons werk hier blijven doen.’ Ik kijk naar de eik op de groene weide en begrijp Goldman maar al te goed.

Terwijl het ebi zijn onderzoek op het gebied van dna-dataopslag terugschroeft, verwacht Goldman nu ‘de grote doorbraken uit de commerciële hoek. Want zij hebben het geld.’ Het ziet ernaar uit dat techbedrijven veel geld kunnen gaan verdienen met technologie waarvan de kiem is gelegd met publiek geld. Microsoft introduceerde dit jaar bijvoorbeeld een handzame machine die het woord ‘hello’ in een dna-molecuul kan coderen en ook weer aflezen. De techgigant publiceerde op 21 maart dit jaar een paper met het bewijs in Nature Scientific Papers.

Maar ook andere bedrijven leggen zich toe op de verdere ontwikkeling van deze technologie en doen forse investeringen. Marktleider is het Californische bedrijf Twist Bioscience, specialist in het synthetiseren van dna. Emily Leproust, ceo van het bedrijf, vertelt me aan de telefoon: ‘Ons doel is om de prijs van dna-opslag te verlagen tot honderd dollar per terabyte. Dat is dezelfde prijs als voor opslag op een harddrive, maar dan dus wel met alle voordelen van dna: de duurzaamheid, robuustheid en dichtheid.’

Omdat Twist technologische kennis heeft op zowel het gebied van programmeren (het omzetten van digitale naar dna-codes) als synthetiseren (het schrijven van de codes in dna), heeft het bedrijf alles in huis om de technologie flink door te ontwikkelen. Het duurste aspect is het schrijven van de codes in het dna en juist daar heeft Twist unieke en waardevolle kennis.

Welke kennis precies, dat laat het bedrijf in het midden vanwege de commerciële gevoeligheid, maar, zegt Leproust: ‘Wij werken met een tijdlijn van drie tot vijf jaar.’


Deze publicatie is tot stand gekomen met steun van het VWN Tripfonds onder beheer van de Vereniging voor Wetenschapsjournalistiek en -communicatie Nederland.vwn.nu/over-ons/vwn-tripfonds