Harvard bewaart 70 miljard boeken in DNA

door

DNA boeken

door

Achtergrond - Een onderzoeksteam is erin geslaagd 5,5 petabits aan informatie (ruim een half miljoen GB) op te slaan in een kubieke millimeter DNA.

Onderzoekers van de Amerikaanse universiteit Harvard hebben het voor elkaar gekregen 70 miljard exemplaren van een wetenschappelijk boekwerk binair op te slaan in DNA. De onderzoeksresultaten van het project, uitgevoerd door het Wyss Institute for Biologically Inspired Engineering, werden afgelopen week gepubliceerd in het wetenschappelijke magazine Science.

“De totale hoeveelheid informatie op deze wereld, samen zo’n 1,8 Zettabytes (21 nullen – red.), kan worden opgeslagen in pakweg vier gram DNA,” vertelt Sriram Kosuri, senior scientist aan het Wyss instituut, in de onderstaande video-presentatie. De onderzoekers bedachten een manier om binaire code (digitale data) op te slaan in DNA. De data die voor het onderzoek werd gebruikt bestaat uit de inhoud van het boek Regenesis: How Synthetic Biology Will Reinvent Nature and Ourselves in DNA van George Church, een van de onderzoekers die aan het project hebben deelgenomen.

“We wilden iets moderns en digitaals, dus we hebben een HTML-versie van het boek genomen,” vertelt Church. “De HTML-versie – zeg maar de web-versie – bevat digitaal beeldmateriaal en Javascript dat interactie met de lezer mogelijk maakt. En dat alles hebben we in de vorm van enen en nullen opgeslagen in DNA.”

Church, professor genetica aan de Harvard Medical School, heeft in 1984 mede aan de wieg gestaan van de eerste directe genoom sequentiemethode. Hij maakte ook deel uit van het team dat het initiatief nam tot het menselijk genoomproject (HBG of Human Genome Project).

De onderzoekers van Harvard konden uiteindelijk 5,5 Petabits (687.500 Gigabytes) aan informatie kwijt per kubieke millimeter DNA. Omdat het opslaan van de data relatief veel tijd vraagt, beschouwen de onderzoekers DNA als opslagmedium op dit moment alleen nog geschikt voor data-archivering. “De informatiedichtheid en de schaal verhouden zich zeer gunstig tot andere experimentele opslagmethoden uit de biologie en fysica,” aldus Kosuri.

Wetenschappers kijken al veel langer naar DNA als potentieel opslagmedium, vanwege de atomaire schaal, de stabiliteit en de houdbaarheid van duizenden jaren. Dit is dan ook niet de eerste keer dat data door mensen in DNA is opgeslagen. In 2007 lukte het onderzoekers aan de Keio universiteit in Japan al om een korte boodschap op te slaan in het DNA van een bacterie, en vorig jaar wisten onderzoekers van diezelfde universiteit meer dan 100 bits aan data op te slaan in kunstmatig DNA.

“De meeste niet-DNA opslagmethoden slaan data op in een plat vlak, terwijl DNA kan worden opgeslagen in een volume (een reageerbuis). De dichtheid is opvallend hoog, tot een bit per base en een base per kubieke nanometer. Op die manier komen we tot bijna een Zetabyte per gram DNA in een volume van een kubieke millimeter,” legt Church uit.

De onderzoekers maakten gebruik van de vier basen die samen de kenmerkende DNA-code vormen: adenine, cytosine, guanine en thymine, gewoonlijk afgekort als respectievelijk A, C, G en T. De A en de C staan in deze methodiek voor binaire 0 en de T en de G voor de binaire 1.

Er zijn andere experimentele manieren om grote hoeveelheden data op te slaan, zoals kwantumholografie, maar die vragen temperaturen rond het absolute nulpunt (-273 graden Celcius) en enorme hoeveelheden energie. DNA daarentegen is stabiel op kamertemperatuur, melden de onderzoekers. “Je kunt het achterlaten waar je maar wilt, in de woestijn of je eigen achtertuin, en 400.000 jaar later is het nog steeds leesbaar,” zegt Church.

Een verschil met eerdere onderzoeken is volgens Church dat voor dit onderzoek ‘dood DNA’ is gebruikt: waar de Japanners in 2007 nog gebruikmaakten van het DNA van de eenvoudige grondbacterie Bacillius Subtilis, kozen de onderzoekers van Harvard voor commercieel verkrijgbare DNA microchips waarmee vrijstaande DNA werd geproduceerd. “We hebben er bewust voor gekozen levende cellen te vermijden,” zegt Church. “In een organisme zijn jouw gegevens maar een heel klein deel van de hele cel, dus wordt er heel veel ruimte verspild. Maar belangrijker nog is dat, zodra je DNA toevoegt aan een levende cel, het zichzelf zal moeten bewijzen, want als het evolutionair gezien niets oplevert, zal de cel vanzelf mutaties doen ontstaan en zal het de informatie uiteindelijk vanzelf verwijderen.”

Het team van Harvard greep terug op de informatietechnologie om de informatie in het DNA op te slaan in datablokken van 96 bits, elk met een adres van 19 bits om de informatie te helpen herstellen. Inclusief JPEG-afbeeldingen en HTML-code bestrijkt elke versie van het boek zo 54.898 van dit soort datablokken, elk met een unieke DNA sequentie.

Aanbevolen artikelen

Lees meer over:

data, toekomst

eerst ▾ Reacties

De reacties worden ingeladen...

Insider naam

 
{$quantity}%

Mijn insider overzicht Uitloggen

Briefcase({$quantity}) Mijn Downloads({$quantity})

Word insider

  • Exclusieve content
  • Achtergrond verhalen
  • Praktische tips

Topbedrijven met ICT vacatures

Consumerization Event: Early Bird Actie
 
dagen
:
 
uren
:
 
minuten
:
 
seconden
promotionele afbeeldingen promotionele afbeeldingen

Computerworld nieuwsbrief

Ontvang tweemaal per week een overzicht van de laatste achtergrondartikelen in uw mailbox.