Hachimoji: Las ocho letras del ADN artificial

ADN sintético, Astrobiología, Lenguaje, Vida extraterrestre, Vida sintética

Hachimoji: Las ocho letras del ADN artificial

Published by

Héctor T. Arita

on

22 febrero, 2019

Hachimoji («ocho letras» en japonés) es un término que en pocas horas ha dado la vuelta al mundo a través de artículos y notas periodísticas que se refieren a un artículo publicado hoy (22 de febrero de 2019) en la revista Science [1]. Un equipo encabezado por Steven A. Benner, de la Fundación para la Evolución Molecular Aplicada, en Florida, Estados Unidos, reporta haber sintetizado moléculas de ADN con nucleobases no naturales, es decir, diferentes a las cuatro que existen en el ADN de los organismos vivos.

Las nucleobases (o simplemente bases) son los compuestos químicos que, en parejas, forman los «peldaños» de la gigantesca «escalera» en forma de hélice que es una molécula de ADN. El orden en el que aparecen las bases en la secuencia de piezas que forman el ADN es lo que determina la información genética contenida en la molécula. Por analogía se puede decir que el código genético consiste en una serie de «palabras» formadas por diferentes combinaciones de cuatro «letras» —una por cada tipo de nucleobase.

El equipo de Benner ha logrado crear moléculas de ADN sintético —con cuatro nucleobases artificiales además de las cuatro naturales— que es capaz de replicarse y de transferir información a secuencias de ARN formadas también con ocho tipos de bases. Floyd Romesberg, un pionero en el desarrollo de organismos sintéticos [2], afirma que el desarrollo de hachimoji abre la posibilidad de crear organismos vivientes completamente diferentes de los naturales. Asimismo, científicos de la NASA han señalado que el nuevo desarrollo demuestra la posibilidad de que existan formas de vida extraterrestre con códigos genéticos diferentes a los que conocemos en nuestro planeta [3].

Una de las características del nuevo ADN, al contar con ocho tipos de nucleobases en lugar de cuatro, es que es capaz de almacenar una mayor cantidad de información en menos espacio que el ADN natural. Para entender este punto, veamos primero cómo funciona el lenguaje molecular de la vida.

El código natural

La información en la molécula de ADN está codificada con cuatro «letras», cuyo orden en una secuencia dada determina las «palabras» que el ADN puede transferir para dar las instrucciones de ensamblaje de las proteínas. Esas cuatro letras son las bases adenina (A), citosina (C), guanina (G) y timina (T). En el ARN, que es la molécula que transfiere la información del ADN a los centros de síntesis de las proteínas, el uracilo (U) sustituye a la timina, pero la información sigue codificada en cuatro «letras».

Secuencia de las letras ACGT. Parque jurásico (1993)

Las «palabras» que se pueden crear con las cuatro bases son los llamados codones, que son grupos de tres bases que determinan la adición de un aminoácido en particular para formar una proteína (las proteínas son largas moléculas formadas por cadenas de aminoácidos). Así, por ejemplo, la secuencia AAA corresponde con el aminoácido lisina y CGC con la arginina. Es fácil constatar que con cuatro elementos es posible producir sesenta y cuatro palabras diferentes de tres letras. Para empezar, veamos cuántas palabras de dos letras podemos crear con las cuatro bases del ADN:

AA

AC

AG

AT

CA

CC

CG

CT

GA

GC

GG

GT

TA

TC

TG

TT

Existen 16 (4×4) posibles pares formados a partir de cuatro elementos. Como a cada uno de estos pares le podemos añadir uno de cuatro posibles elementos para crear una palabra con tres letras, vemos que existen 4×4×4 = 64 posibles tríos:

AAA

ACA

AGA

ATA

CAA

CCA

CGA

CTA

GAA

GCA

GGA

GTA

TAA

TCA

TGA

TTA

AAC

ACC

AGC

ATC

CAC

CCC

CGC

CTC

GAC

GCC

GGC

GTC

TAC

TCC

TGC

TTC

AAG

ACG

AGG

ATG

CAG

CCG

CGG

CTG

GAG

GCG

GGG

GTG

TAG

TCG

TGG

TTG

AAT

ACT

AGT

ATT

CAT

CCT

CGT

CTT

GAT

GCT

GGT

GTT

TAT

TCT

TGT

TTT

Existe una veintena de aminoácidos fundamentales, de manera que con un código formado por cuatro letras en grupos de tres tenemos información de sobra para usar una o más palabras para cada aminoácido. Por el contrario, con las dieciséis palabras de dos letras no tendríamos suficiente capacidad para hacerlo [4]. De hecho, existen codones que dan instrucciones especiales, como «iniciar» o «terminar», y el código genético es redundante en el sentido de que dos secuencias diferentes pueden determinar el mismo aminoácido. Por ejemplo, cualquiera de las secuencias que empiezan con CG, independientemente de la base que se encuentre en la tercera posición, produce arginina.

Un código sintético con ocho letras

Al sintetizar cuatro tipos de bases que no existen en forma natural e incorporarlos a moléculas de ADN, Benner y su equipo han añadido cuatro nuevas letras al abecedario genético y de esa manera han creado un sistema de almacenamiento y transmisión de información de mayor capacidad, que es justo a lo que han llamado hachimoji. Han llamado a las nuevas bases S, B, P y Z. ¿Cuántos posible tríos podemos formar con ocho letras? Como existen ocho alternativas para llenar cada uno de los tres espacios, el total de combinaciones es de 8×8×8 = 512, que es mucho más de lo que necesitamos para nombrar e identificar veinte aminoácidos. De hecho, nos bastaría con usar pares de esas ocho letras, pues es posible formar 64 (8×8) de ellos:

AA	AC	AG	AT	AS	AB	AP	AZ
CA	CC	CG	CT	CS	CB	CP	CZ
GA	GC	GG	GT	GS	GB	GP	GZ
TA	TC	TG	TT	TS	TB	TP	TZ
SA	SC	SG	ST	SS	SB	SP	SZ
BA	BC	BG	BT	BS	BB	BP	BZ
PA	PC	PG	PT	PS	PB	PP	PZ
ZA	ZC	ZG	ZT	ZS	ZB	ZP	ZZ

Vemos que con ocho letras se puede construir un sistema de palabras de dos elementos que tendría la misma capacidad de información que el código natural, basado en tríos de cuatro posibles letras. Planteado de otra manera, con tríos de ocho posibles letras es en teoría posible codificar muchos más aminoácidos que los que existen en forma natural, o que existen pero que no son utilizados por los seres vivos. Además del ADN sintético podríamos imaginar un gran conjunto de aminoácidos artificiales que podrían formar tipos de proteínas que no existen, por lo pronto, mas que en teoría.

Más allá de la capacidad para codificar aminoácidos, hachimoji tiene horizontes de aplicación mucho más amplios en tecnologías futurísticas, como la de usar ADN sintético como medio de almacenamiento de información. Es posible que en el futuro resguardemos nuestra información no en chips de silicio o en medios electromagnéticos, como lo hacemos actualmente, sino en aparatos que almacenen y transmitan información a través de cadenas de ADN sintético. El año pasado se anunció que un grupo de investigación había logrado no solo almacenar información —imágenes, videos y otros documentos— en cadenas de ADN, sino que había sido capaz de copiar y acceder a esa información en puntos particulares de la secuencia, sin necesidad de leer toda la secuencia cada vez. En otras palabras, se logró emular la función de memoria de acceso aleatorio (RAM) que es la base del funcionamiento de los dispositivos de almacenamiento de información actuales. [5]

DNA

Si a estos avances tecnológicos le añadimos ahora el hachimoji, un lenguaje con una mucho mayor capacidad de almacenamiento de información, vemos que no es tan descabellada la idea de ver pronto centros de almacenamiento e intercambio de información guardada en moléculas de ADN.

Por supuesto, como sucede con casi cualquier avance tecnológico, hachimoji abre al mismo tiempo ventanas de oportunidad y grandes portales de grave riesgo. Los propios investigadores se pusieron un límite ético al no intentar poner a prueba la capacidad del ADN sintético de ocho bases de replicarse en células vivas. Es difícil predecir las posibles consecuencias de incorporar moléculas sintéticas en seres vivos fuera del laboratorio. Este es un tema que habrá de discutirse a profundidad antes de explorar todo el nuevo mundo de información que promete el hachimoji.

Notas y referencias

[1] Hoshika, S. et al. (2019). Hachimoji DNA and RNA: A genetic system with eight building blocks. Science, 363:884-887.

[2] El equipo de Romesberg logró en 2014 insertar ADN sintético, con dos bases no naturales, en células vivas.
Malyshev, D. A., et al. (2014). A semi-synthetic organism with an expanded genetic alphabet. Nature, 509(7500), 385-388.

[3] Curiosamente, la entrada Hachimoji en la Wikipedia recalca que el financiamiento para el estudio provino de la NASA y ni siquiera menciona a los investigadores involucrados (excepto en las referencias). [consultado el 22 de febrero de 2019 a las 18:00, tiempo del centro de México].

[4] Poco después del descubrimiento de la estructura del ADN en 1953, el físico George Gamow estableció que se necesitaban grupos de al menos tres bases para poder codificar los veinte aminoácidos fundamentales. Francis Crick y sus colaboradores siguieron la sugerencia de Gamov y dieron los primeros pasos para descifrar el lenguaje molecular de la vida.

[5] El reporte del logro tecnológico se publicó en
Organick, L., et al. (2018). Random access in large-scale DNA data storage. Nature Biotechnology, 36(3):242-248

AA	AC	AG	AT	AS	AB	AP	AZ
CA	CC	CG	CT	CS	CB	CP	CZ
GA	GC	GG	GT	GS	GB	GP	GZ
TA	TC	TG	TT	TS	TB	TP	TZ
SA	SC	SG	ST	SS	SB	SP	SZ
BA	BC	BG	BT	BS	BB	BP	BZ
PA	PC	PG	PT	PS	PB	PP	PZ
ZA	ZC	ZG	ZT	ZS	ZB	ZP	ZZ

AA	AC	AG	AT	AS	AB	AP	AZ
CA	CC	CG	CT	CS	CB	CP	CZ
GA	GC	GG	GT	GS	GB	GP	GZ
TA	TC	TG	TT	TS	TB	TP	TZ
SA	SC	SG	ST	SS	SB	SP	SZ
BA	BC	BG	BT	BS	BB	BP	BZ
PA	PC	PG	PT	PS	PB	PP	PZ
ZA	ZC	ZG	ZT	ZS	ZB	ZP	ZZ

Hachimoji: Las ocho letras del ADN artificial

AAA

ACA

AGA

ATA

CAA

CCA

CGA

CTA

GAA

GCA

GGA

GTA

TAA

TCA

TGA

TTA

AAC

ACC

AGC

ATC

CAC

CCC

CGC

CTC

GAC

GCC

GGC

GTC

TAC

TCC

TGC

TTC

AAG

ACG

AGG

ATG

CAG

CCG

CGG

CTG

GAG

GCG

GGG

GTG

TAG

TCG

TGG

TTG

AAT

ACT

AGT

ATT

CAT

CCT

CGT

CTT

GAT

GCT

GGT

GTT

TAT

TCT

TGT

TTT

Comparte esto:

Deja un comentario Cancelar la respuesta

AA	AC	AG	AT	AS	AB	AP	AZ
CA	CC	CG	CT	CS	CB	CP	CZ
GA	GC	GG	GT	GS	GB	GP	GZ
TA	TC	TG	TT	TS	TB	TP	TZ
SA	SC	SG	ST	SS	SB	SP	SZ
BA	BC	BG	BT	BS	BB	BP	BZ
PA	PC	PG	PT	PS	PB	PP	PZ
ZA	ZC	ZG	ZT	ZS	ZB	ZP	ZZ