Hachimoji: Las ocho letras del ADN artificial

Hachimoji (“ocho letras” en japonés) es un término que en pocas horas ha dado la vuelta al mundo a través de artículos y notas periodísticas que se refieren a un artículo publicado hoy (22 de febrero de 2019) en la revista Science [1]. Un equipo encabezado por Steven A. Benner, de la Fundación para la Evolución Molecular Aplicada, en Florida, Estados Unidos, reporta haber sintetizado moléculas de ADN con nucleobases no naturales, es decir, diferentes a las cuatro que existen en el ADN de los organismos vivos.

Las nucleobases (o simplemente bases) son los compuestos químicos que, en parejas,  forman los “peldaños” de la gigantesca “escalera” en forma de hélice que es una molécula de ADN.  El orden en el que aparecen las bases en la secuencia de piezas que forman el ADN es lo que determina la información genética contenida en la molécula. Por analogía se puede decir que el código genético consiste en una serie de “palabras” formadas por diferentes combinaciones de cuatro “letras” —una por cada tipo de nucleobase.

El equipo de Benner ha logrado crear moléculas de ADN sintético —con cuatro nucleobases artificiales además de las cuatro naturales—  que es capaz de replicarse y de transferir información a secuencias de ARN formadas también con ocho tipos de bases.  Floyd Romesberg, un pionero en el desarrollo de organismos sintéticos [2], afirma que el desarrollo de hachimoji abre la posibilidad de crear organismos vivientes completamente diferentes de los naturales. Asimismo, científicos de la NASA han señalado que el nuevo desarrollo demuestra la posibilidad de que existan formas de vida extraterrestre con códigos genéticos diferentes a los que conocemos en nuestro planeta [3].

Una de las características del nuevo ADN, al contar con ocho tipos de nucleobases en lugar de cuatro, es que es capaz de almacenar una mayor cantidad de información en menos espacio que el ADN natural. Para entender este punto, veamos primero cómo funciona el lenguaje molecular de la vida.

El código natural

La información en la molécula de ADN está codificada con cuatro “letras”, cuyo orden en una secuencia dada determina las “palabras” que el ADN puede transferir para dar las instrucciones de ensamblaje de las proteínas. Esas cuatro letras son las bases adenina (A), citosina (C), guanina (G) y timina (T). En el ARN, que es la molécula que transfiere la información del ADN a los centros de síntesis de las proteínas, el uracilo (U) sustituye a la timina, pero la información sigue codificada en cuatro “letras”.

dna seq
Secuencia de las letras ACGT. Parque jurásico (1993)

Las “palabras” que se pueden crear con las cuatro bases son los llamados codones, que son grupos de tres bases que determinan la adición de un aminoácido en particular para formar una proteína (las proteínas son largas moléculas formadas por cadenas de aminoácidos). Así, por ejemplo, la secuencia AAA corresponde con el aminoácido lisina y CGC  con la argininaEs fácil constatar que con cuatro elementos es posible producir sesenta y cuatro palabras diferentes de tres letras. Para empezar, veamos cuántas palabras de dos letras podemos crear con las cuatro bases del ADN:

AA AC AG AT CA CC CG CT GA GC GG GT TA TC TG TT

Existen 16 (4×4) posibles pares formados a partir de cuatro elementos. Como a cada uno de estos pares le podemos añadir uno de cuatro posibles elementos para crear una palabra con tres letras, vemos que existen 4×4×4 = 64 posibles tríos:

AAA
ACA
AGA
ATA
CAA
CCA
CGA
CTA
GAA
GCA
GGA
GTA
TAA
TCA
TGA
TTA
AAC
ACC
AGC
ATC
CAC
CCC
CGC
CTC
GAC
GCC
GGC
GTC
TAC
TCC
TGC
TTC
AAG
ACG
AGG
ATG
CAG
CCG
CGG
CTG
GAG
GCG
GGG
GTG
TAG
TCG
TGG
TTG
AAT
ACT
AGT
ATT
CAT
CCT
CGT
CTT
GAT
GCT
GGT
GTT
TAT
TCT
TGT
TTT

Existe una veintena de aminoácidos fundamentales, de manera que con un código formado por cuatro letras en grupos de tres tenemos información de sobra para usar una o más palabras para cada aminoácido. Por el contrario, con las dieciséis palabras de dos letras no tendríamos suficiente capacidad para hacerlo [4]. De hecho, existen codones que dan instrucciones especiales, como “iniciar” o “terminar”, y el código genético es redundante en el sentido de que dos secuencias diferentes pueden determinar el mismo aminoácido. Por ejemplo, cualquiera de las secuencias que empiezan con CG, independientemente de la base que se encuentre en la tercera posición, produce arginina.

Un código sintético con ocho letras

Al sintetizar cuatro tipos de bases que no existen en forma natural e incorporarlos a moléculas de ADN, Benner y su equipo han añadido cuatro nuevas letras al abecedario genético y de esa manera han creado un sistema de almacenamiento y transmisión de información de mayor capacidad, que es justo a lo que han llamado hachimoji. Han llamado a las nuevas bases S, B, P y Z. ¿Cuántos posible tríos podemos formar con ocho letras? Como existen ocho alternativas para llenar cada uno de los tres espacios, el total de combinaciones es de 8×8×8 = 512, que es mucho más de lo que necesitamos para nombrar e identificar veinte aminoácidos. De hecho, nos bastaría con usar pares de esas ocho letras, pues es posible formar 64  (8×8) de ellos:

AA AC AG AT AS AB AP AZ
CA CC CG CT CS CB CP CZ
GA GC GG GT GS GB GP GZ
TA TC TG TT TS TB TP TZ
SA SC SG ST SS SB SP SZ
BA BC BG BT BS BB BP BZ
PA PC PG PT PS PB PP PZ
ZA ZC ZG ZT ZS ZB ZP ZZ

 Vemos que con ocho letras se puede construir un sistema de palabras de dos elementos que tendría la misma capacidad de información que el código natural, basado en tríos de cuatro posibles letras. Planteado de otra manera, con tríos de ocho posibles letras es en teoría posible codificar muchos más aminoácidos que los que existen en forma natural, o que existen pero que no son utilizados por los seres vivos. Además del ADN sintético podríamos imaginar un gran conjunto de aminoácidos artificiales que podrían formar tipos de proteínas que no existen, por lo pronto, mas que en teoría.

Más allá de la capacidad para codificar aminoácidos, hachimoji tiene horizontes de aplicación mucho más amplios en tecnologías futurísticas, como la de usar ADN sintético como medio de almacenamiento de información. Es posible que en el futuro resguardemos nuestra información no en chips de silicio o en medios electromagnéticos, como lo hacemos actualmente, sino en aparatos que almacenen y transmitan información a través de cadenas de ADN sintético. El año pasado se anunció que un grupo de investigación había logrado no solo almacenar información —imágenes, videos y otros documentos— en cadenas de ADN, sino que había sido capaz de copiar y acceder a esa información en puntos particulares de la secuencia, sin necesidad de leer toda la secuencia cada vez. En otras palabras, se logró emular la función de memoria de acceso aleatorio (RAM) que es la base del funcionamiento de los dispositivos de almacenamiento de información actuales. [5]

DNA

Si a estos avances tecnológicos le añadimos ahora el hachimoji, un lenguaje con una mucho mayor capacidad de almacenamiento de información, vemos que no es tan descabellada la idea de ver pronto centros de almacenamiento e intercambio de información guardada en moléculas de ADN.

Por supuesto, como sucede con casi cualquier avance tecnológico, hachimoji abre al mismo tiempo ventanas de oportunidad y grandes portales de grave riesgo. Los propios investigadores se pusieron un límite ético al no intentar poner a prueba la capacidad del ADN sintético de ocho bases de replicarse en células vivas. Es difícil predecir las posibles consecuencias de incorporar  moléculas sintéticas en seres vivos fuera del laboratorio. Este es un tema que habrá de discutirse a profundidad antes de explorar todo el nuevo mundo de información que promete el hachimoji.

Notas y referencias

[1] Hoshika, S. et al. (2019). Hachimoji DNA and RNA: A genetic system with eight building blocksScience, 363:884-887.

[2] El equipo de Romesberg logró en 2014 insertar ADN sintético, con dos bases no naturales, en células vivas.
Malyshev, D. A., et al. (2014). A semi-synthetic organism with an expanded genetic alphabetNature509(7500), 385-388.

[3] Curiosamente, la entrada Hachimoji en la Wikipedia recalca que el financiamiento para el estudio provino de la NASA y ni siquiera menciona a los investigadores involucrados (excepto en las referencias).  [consultado el 22 de febrero de 2019 a las 18:00, tiempo del centro de México].

[4] Poco después del descubrimiento de la estructura del ADN en 1953, el físico George Gamow estableció que se necesitaban grupos de al menos tres bases para poder codificar los veinte aminoácidos fundamentales. Francis Crick y sus colaboradores siguieron la sugerencia de Gamov y dieron los primeros pasos para descifrar el lenguaje molecular de la vida.

[5] El reporte del logro tecnológico se publicó en
Organick, L., et al. (2018). Random access in large-scale DNA data storageNature Biotechnology36(3):242-248

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s