Onderzoekers van de University of Texas in Austin (VS) hebben een manier ontwikkeld om data op te slaan in moleculen met een hexadecimale code. Daarmee kun je in potentie veel meer data opslaan dan in binaire code en omdat de data in moleculen is opgeslagen neemt het ook veel minder ruimte in beslag dan op een harde schijf. Er is nog wel veel laboratoriumapparatuur voor nodig.

Wetenschappers zoeken al langer naar alternatieve opslagmethoden voor data. DNA is hét voorbeeld, met materiaal uit de natuur, en we schreven daar al eerder over. In dit lange molecuul zit een enorme hoeveelheid genetische data opgeslagen als een code in de letters A, C, T en G. Maar DNA is lastig te maken en niet onder alle omstandigheden stabiel.

De Amerikaanse onderzoekers hebben nu een systeem ontwikkeld dat niet uit vier maar uit zestien ‘letters’ bestaat. Er kan dus in theorie nog meer data in dan DNA. Bovendien is hun molecuul makkelijker te maken en uit te lezen. Ze beschrijven de details van hun methode deze week in een artikel in vakblad Cell Reports Physical Science, dat gratis toegankelijk is. 
 

Syntheserobot

Van tevoren hadden de onderzoekers zestien verschillende monomeren (moleculaire bouwstenen) gemaakt. Dan geven ze de software die ze zelf ontwikkelden een woord of zin, die het vervolgens vertaalt in een volgorde voor de bouwstenen. Daarin zit de informatie besloten, net als de letters in een woord of de volgorde van enen en nullen in binaire data. Daarna laten ze een syntheserobot de monomeren aan elkaar rijgen tot een polymeer.

Om de data uit te lezen worden de bouwstenen weer een voor een van de polymeerketen gehaald en geanalyseerd. Daarna zet de software die lettercode weer terug om in - in dit geval - een reeks woorden, oftewel een zin.
 

Literaire code

Het lukte de onderzoekers om eerst de woorden ‘Hello, World!’, bekend uit de informatica, en daarna een hele zin te coderen en weer te ontcijferen. Het ging om een citaat van Jane Austen uit 1814: ‘If one scheme of happiness fails, human nature turns to another; if the first calculation is wrong, we make a second better: we find comfort somewhere.’

Ook een mede-onderzoeker lukte het om een code te ontcijferen. Hij kreeg een potje met polymeer en een set instructies voor het bedienen van de analyseapparatuur en de software. Na twee pogingen rolde er ook bij hem de juiste zin uit de software.
 



Complex proces

De nieuwe methode leunt nog sterk op ingewikkelde chemische synthese en analyse, hoewel alle gebruikte methoden in principe geschikt zijn om te automatiseren. Zo gaat het ‘opslaan’ van de data in een syntheserobot via een snelle methode die high-throughput parallel synthesis heet.

De robot krijgt van de software de instructie welke monomeren hij in welke volgorde aan elkaar moet koppelen. De analyseapparatuur die het polymeer weer moet uitlezen, gebaseerd op vloeistofchromatografie en massaspectrometrie (in het Engels afgekort tot LC-MS), doet dat ook volautomatisch en stuurt zijn gegevens weer naar de software die het omzet in data.
 

Te duur

Voor praktische dataopslag is de nieuwe methode nog lang niet geschikt. Het hele proces duurt nog veel te lang (minuten tot uren) en is veel te duur om al te denken aan vervanging van de harde schijf. De onderzoekers richten zich voorlopig meer op het ontwikkelen van de chemische methoden dan op een praktische vorm van data-opslag.

 

Tekst: Bastienne Wentzel
Afbeeldingen: Dahlhauser et al., Cell Reports Physical Science, 2021 / CC BY-NC-ND 4.0