Think Outside The Box

Transindex rovatok


Aktualitás | 1.2.2013

Shall I compare thee to a summer’s day? – olvashatjuk a DNS-ben


Az Európai Bioinformatikai Intézet DNS-ben kódolt fényképe

Egy kutatócsoport mesterségesen létrehozott DNS-molekulákra tárolt különböző adatokat, majd a “DNS-merevlemezről” szinte tökéletesen vissza is tudta olvasni azokat. Nick Goldman és munkatársainak cikke a Nature szaklapban az elmúlt hét tudományos fénypontja. Az áttörő jelentőségű tanulmány társszerzője Sipos Botond, erdélyi biológus, őt kérdeztük munkájuk jelentőségéről és felhasználási lehetőségeiről.

kérdezett: Marton Attila

Kifejtenéd kicsit bővebben a laikusok számára, hogy miről is szól a cikketek, illetve eredményeitek milyen újdonságokat hoznak információ-tárolás terén?

Egy mondatba sűrítve, a cikkben közölt eredmények demonstrálják, miként lehet DNS-t digitális adat tárolására használni, egyféle “DNS-merevlemezként”, ha úgy tetszik. Az elektronikus információtároló eszközökhöz hasonlóan, amelyek az adatokat nullák és egyesek sorozatában kódolva tárolják, mi az adatokat a DNS építőelemeit jelképező A, T, G és C karakterek sorozatába kódoltuk át. Az információ tárolásának ezen lehetőségéről számos elméleti cikk született, azonban a mi munkánk az egyik első, amelyik jelentős mennyiségű információt hordozó DNS-molekulák szintézisét is megvalósította, és így a DNS-merevlemez koncepcióját gyakorlatba ültette.

Az általunk kifejlesztett DNS-merevlemez rendelkezik néhány figyelemre méltó tulajdonsággal. Először is korábban elképzelhetetlen adatsűrűséget lehet a segítségével elérni, vagyis hatalmas mennyiségű információt lehet tárolni egy apró darab kiszárított, biológiai szempontból inaktív DNS-darabkában. Másodsorban, a fagyasztva szárított DNS egy meglepően stabil molekula, ami több száz, vagy akár ezer évig is eltartható anélkül, hogy bármilyen átírásra szorulna. Végül, de nem utolsósorban, lehetőség nyílik a DNS-molekulákban tárolt információ másolására egy egyszerű és olcsó kémiai reakció révén, ami új távlatokat nyithat a nagymennyiségű információt érintő adatmegosztás terén.

Ha jól értettem, az Európai Nukleáris Kutatási Szervezet (CERN) jelenleg 90 petabyte-nyi (1 PB = 10^6 GB) adatot tárol körülbelül 100 óriási mágnesszalagon, holott ez az adatmennyiség a ti módszeretekkel kódolva 41 gramm DNS-t igényelne. Elképzelhető, hogy a DNS lesz a jövő adattározója tudományos berkekben?

A DNS-merevlemez a már említett tulajdonságai miatt ideális adattároló eszköz hosszútávú archiválásra, ezért szerintünk egyáltalán nem elképzelhetetlen, hogy ez lesz a jövő tudományos adattárolója. A fő akadály a kódolt információ DNS-molekulákba “írásának” meglehetősen magas ára, ami miatt jelenleg még csak olyan adatok tárolása kifizetődő, amelyeket több száz vagy ezer évre szándékozunk archiválni. Azonban az adatok írásának ára várhatóan csökkeni fog a DNS-molekulák szintetizálására használt módszerek fejlődésével. Becsléseink szerint ötven év múlva nem csak hogy fontos tudományos adatok, de akár személyes adatok (például esküvői videofelvételek) tárolása is kifizetődő lehet.

DNS-be zártátok Shakespeare összes szonettjét, Watson és Crick korszakalkotó, DNS szerkezetét leíró művét, ifjú Martin Luther King híres „Van egy álmom” szónoklatának hangfelvételéből egy részletet, és egy képet az intézetről, ahol dolgoztok. Ezek szerint bármi megírható DNS-be? Van valami különösebb ok amögött, hogy pont ezeket az alkotásokat, elemeket kódoltátok?

Egy szokásos merevlemezhez hasonlóan a DNS-molekulák bármilyen információ tárolására használhatók. Pontosan ezt akartuk szemléltetni azzal, hogy számos, a mindennapi életben gyakran használt formátumú (TXT, PDF, MP3, JPEG) fájlt tároltunk DNS-ben. És, természetesen, igyekeztünk kulturális szempontból fontos, megörökítésre érdemes művekből szemelgetni.

Azonkívül, hogy bármilyen formátumú fájl tárolására képes, kódolási sémánk már a jelenleg elérhető DNS-szintetizáló módszerekkel egyetemben is képes lenne egy csapásra bekódolni a Földön található összes adatot – már ha állni tudnánk a szintézis borsos árát.

Mennyire hozzáférhető az információ kódolás után? Sikerül ugyanazokat az adatokat hibátlanul leolvasni? A régebbi kódolási módszerek megengedték ugyanezt a teljesítményt?

Az adatok kiolvasása igazából a folyamat könnyebbik része, ugyanis ez már ma is meglehetősen olcsó, tehát az adatok elérhetősége nem probléma. Azonban muszáj a teljes adatcsomagot kiolvasni, nincs lehetőség specifikus részekre koncentrálni.

Ami az olvasási hibákat illeti: az általunk használt kódolási sémát úgy terveztük, hogy védelmet nyújtson az adatok írása és olvasása során fellépő sajátos hibák ellen. Ennek köszönhetően sikerült szinte tökéletesen visszanyerni a kódolt adatokat. Egy amerikai kutatókból álló csapat nemrégiben közölt egy munkát, amelynek során hozzánk hasonló mennyiségű információt kódoltak DNS-be, azonban ők több információt vesztettek el az olvasás során.

Lehet-e ezt az információt élőlényekben tárolni, vagy rongálódna a folyamatos átírás miatt? Esetleg jelentene valami veszélyt egy élőlény egészségére, ha egy szonett lenne elrejtve valahova a génállományába?

Szeretném kihangsúlyozni, hogy mi az adatokat nagyszámú és viszonylag rövid szintetikus DNS-molekulákban tároltuk, amelyek semmiképpen sem építhetők be egy élőlény genomjába. Ha mégis valamilyen módon ezek a molekulák bejutnának egy sejtbe, az nem tudná ezeket értelmezni és így egyszerűen lebomlanának, és újbóli felhasználásra kerülnének.

Elméletileg lehetséges lenne adatokat hosszabb DNS-molekulákban tárolni, amelyek beépíthetők lehetnének például egy baktérium genomjának bizonyos részeibe anélkül, hogy bármi gondot okoznának. Azonban ez több okból sem lenne praktikus: a hosszú DNS-molekulák szintézise még drágább lenne, több hibával járna, és ahogyan arra rámutattál, az információ rongálódna minden replikáció során. Ezért szerintünk a jövő “DNS-merevlemezei” az általunk alkalmazott elvek alapján fognak majd működni, bármilyen élő organizmus közreműködése nélkül.

Sipos Botond 1983-ban született a Szatmár megyei Bogdánon, a középiskolát a Szatmárnémetiben végezte a Kölcsey Ferenc Főgimnáziumban. Egyetemi tanulmányait a kolozsvári Babeş-Bolyai Tudományegyetem Biológia és Geológia Karának magyar nyelvű biológia szakán végezte, majd a Sejtbiológia és Molekuláris Biotechnológia mesteri program keretén belül folytatta. PhD-fokozatát a Szegedi Tudományegyetem és a Szegedi Biológiai Kutatóközpont Molekuláris Biodiverzitás Csoportjában szerezte. Jelenleg az Európai Bioinformatikai Intézetben (EMBL-EBI), a Goldman-csoportban posztdoktori kutató, fő érdeklődési köre új módszerek kidolgozása az új generációs szekvenálási adatok elemzésére.
Címkék: , , , , ,

3 hozzászólás

  1. A hozzászólás szerzője: placebo
    Közzétéve: 1.2.2013, 12:25 pm

    Elírás a cikkben!
    Ez a kijelentés nem igaz: 1 PB = 106 GB, ugyanis: 1 PB = 1024 TB.
    De, ha nagyon szőrszálhasogatóak akarunk lenni, akkor 1 PB = 1000 TB és 1 PiB = 1024 TiB
    Bővebb infó: http://hu.wikipedia.org/wiki/Byte

Szólj hozzá!