2013: Una Odisea en los nuevos soportes de información de ADN

Cuando el director de cine Stanley Kubrick estrenó en 1968 una de sus películas más brillantes (2001: Una Odisea del espacio), la forma de elevar la ciencia ficción al séptimo arte cambió drásticamente. La obra, basada en una novela de Arthur C. Clarke, narraba de una manera realmente curiosa la evolución del ser humano, condensando 4 millones de años en una película con una duración de 141 minutos.

Con una banda sonora apabullante, una de las escenas más recordadas es aquella donde en una población de simios aparece de manera misteriosa un monolito negro, fabricado con material desconocido, que podrá verse en otros tres momentos de la película, enterrado en la Luna, en las cercanías de Júpiter y en el cuarto del personaje Dave Bowman.

Esta enigmática pieza, de proporciones matemáticas perfectas, como narra Clarke, afecta el desarrollo de la evolución humana a lo largo de la película, conectando las distintas etapas separadas por millones de años. Parece como si el monolito de Kubrick, cuyo origen es desconocido, uniera la civilización con una entidad no desvelada (quizás el propio Universo, quizás de otra cultura anterior). En otras palabras, este objeto extraño sirve de enlace o puente para el salto de años que se sucede en la película.

La ciencia ficción hecha (casi) realidad

Igual que Clarke y Kubrick soñaron un mundo futurista, los investigadores llevan más de cuarenta años intentando conectar nuestra civilización con hipotéticas sociedades alienígenas. La primera sonda que llevó al espacio un mensaje de los seres humanos fue la Pioneer 2010, como relataba Carl Sagan en un artículo histórico publicado en la revista Science. Desde aquel primer intento, se han sucedido más iniciativas del mismo tipo, en forma de botellas lanzadas al inmenso mar que conforma nuestro Universo.

La última idea la han desarrollado desde el Instituto Europeo de Bioinformática (European Bioinformatics Institute), utilizando las técnicas más avanzadas en supercomputación y biología molecular. El proyecto, conocido como «The 10,000 year archive«, se basa en la capacidad de nuestro ADN de permanecer inalterable durante aproximadamente diez mil años, siempre que se mantenga en condiciones adecuadas (temperaturas bajas y ambiente seco y oscuro). En ese ADN, además de guardar el mensaje que quisiéramos, también deberíamos almacenar las claves para desentrañar el código utilizado, una especie de Piedra Rosetta a nivel molecular.

ADN como soporte físico de información

¿Pero cuáles son las bases de este (por ahora) utópico proyecto? Las ideas del revolucionario artículo publicado en Nature surgieron lejos de los laboratorios, mientras Ewan Birney y Nick Goldman disfrutaban de una cerveza en un pub inglés. Se trataba de utilizar el propio ADN como fuente de almacenamiento, imitando lo que la naturaleza lleva haciendo miles de años. Los dos límites principales a este proyecto eran, por una parte, que la síntesis del ADN sólo se realiza en fragmentos pequeños y, por otra, que esta escritura y su propia lectura (o secuenciación) suelen contener errores. Superar estas dos barreras significaría empezar a tener una nueva fuente de almacenamiento digital.

De esta forma, una vez que Birney y Goldman contaron con un método rápido para sintetizar ADN, decidieron ponerse manos a la obra, y tratar de archivar una fotografía del propio Instituto (formato *.jpg), un fragmento del discurso «I have a dream» de Luther King (formato *.mp3), 157 sonetos de Shakespeare (formato *.ascii), el artículo donde Watson y Crick desvelaban la estructura del propio ADN (formato *.pdf) y una «Piedra Rosetta» del código que usaron.

Para trasladar los formatos anteriores al lenguaje que utiliza el ADN (donde existen cuatro letras: A, C, G y T; pero en el que cada palabra se lee «de tres en tres»), Birney y Goldman desarrollaron un código específico. Tradujeron los datos de los que disponían (bien textos en los formatos escritos, bien de otro tipo) a un lenguaje binario estándar, formado únicamente por ceros y unos. A continuación, realizaron el paso a código trinario, de 0, 1 y 2, para así evitar errores en la lectura del ADN que se sintetizaría después. A partir del lenguaje generado, reescribieron los datos que tenían según las bases químicas de la molécula que porta nuestra información genética. En únicamente tres fases, habían conseguido pasar de formatos de archivos específicos a un mismo código, el que también tenemos en el interior de nuestras células y es el encargado de decir cómo somos.

El trabajo de los científicos ingleses no es, sin embargo, completamente novedoso. Una investigación realizada en Harvard había conseguido el año pasado «guardar» de una manera similar 700 terabits por gramo de ADN. El avance que presentaron hace sólo unos días en Cambridge suponía una mejora espectacular, al poder almacenar en la misma cantidad 2,2 petabits de información. Ni Clarke ni Kubrick hubieran imaginado final mejor de una historia futurista: la odisea para que el ADN sea el disco duro del futuro sólo acaba de comenzar.

Imágenes | Wikipedia, Flickr