01 diciembre, 2011

Tu bacteria no te entiende

-                 ¿Qué te pasa Pelagico?
-                  Pues nada en especial Mesangio, tuve un mal día en el laboratorio
-                   ¡Y eso! ¿Tu jefe te volvió a dar la lata?
-          ¡Que va! Esta vez me las traigo con mis cultivos. Mis genes no se expresan. Hago la transformación y todo va perfecto, incluso yo diría que me salen unas transformaciones maravillosas, sin apenas colonias azules en mi placa. Pero cuando voy a purificar mi proteína… No sale.
-          Bueno seguro que son falsos positivos en la transformación o tu protocolo de purificación de la proteína no está depurado, eso a veces pasa. Ve variando condiciones hasta ponerlo apunto.
-          Que va, seguro que no es nada de eso. Las PCRs me dan muy bien, súper-específicas y con unas bandas de la hostia. Y el método de purificación de la proteína está más que puesto a punto.
-          Tío no se que estas haciendo exactamente, pero te veo preocupado. No se, cuéntame algo más a ver si te puedo echar una mano.
-          Verás, quiero expresar en mis bacterias una proteína antioxidante de una planta. Hay una empresa que está interesada en producir esta proteína a gran escala y para purificarla desde la planta se hace muy costoso. De modo que nosotros intentamos expresarla en bacteria para reducir los costes de purificación.
-          Ya, ¿Y habéis hecho una buena adaptación de codones?
-          Hemmmmm… ¿Cómo?, ¿Qué es eso?
-          ¡¡¡Ya se lo que te pasa!!! TU BACTERIA NO TE ENTIENDE
-          Que ¿Qué?, pero si no lo les hablo a las bacterias…
-          Tu calla y escucha

En cierto modo, Pelágico puede tener muchos problemas. De hecho, me arriesgo a decir que está haciendo una tesis doctoral y aún le queda mucho por descubrir, pero hay ciertas cosas que debería saber y una de ellas es que no todos los organismos hablamos el mismo idioma. O mejor dicho, si hablamos el mismo idioma, pero no decimos todas las palabras con la misma frecuencia. Eso quiere decir que nuestra maquinaria metabólica y de lectura del ADN lee el mismo lenguaje, pero lo que para mi suele significar “A”, para una bacteria suele significar “B”.

Como todo el mundo sabe, el ADN es una cadena muy larga que contiene información. Esa información que contiene no es ni más ni menos que el libro de instrucciones que dicta como es cada organismo. 


Pues bien, ese libro de instrucciones resulta que se escribe con la combinación de tan solo 4 letras, y con eso debe codificar miles de proteínas con miles de funciones distintas, en diferentes tiempos, a diversos niveles y todo con una regulación exquisita (la prueba es que no somos masas deformes de células sin más misión en la vida que sobrevivir…bueno…. Digamos que no somos deformes). Para ello se requiere un lenguaje o código que en este caso se denomina el Código genético.

Las 4 letras famosas son la A “Adenina” que ES complementaria de la T “Timina” y la G “Guanina” que es complementaria de la C “Citosina”. Con estas 4 letras tenemos que escribir un código tal que, seamos capaces de codificar para los 20 aminoácidos que componen nuestras proteínas. Si el código fuese de una letra, no sería válido porque la A sería igual al aminoácido Aspártico, la T al aminoácido Triptófano, la G sería igual a Glicina y la C sería Cisteína… ¿y los 16 aminoácidos restantes?

Bueno cabe entonces la posibilidad de hablar de un código escrito con dos letras. Las combinaciones que tendríamos serían entonces:
AA, AT, AC, AG, TT, TA, TC, TG, GG, GA, GC, GT, CC, CT, CA y CG, muy bien, ya tenemos un total de 16 combinaciones, aún así se nos quedan 4 aminoácidos desconsolados sin correspondencia a nuestro código.
De modo que efectivamente nos vamos a un código de 3 letras. Aquí si estamos hablando de una combinatoria abundante. 3 lugares a ocupar por 4 nucleótidos disponibles. La cuenta sería 4x4x4=64 combinaciones diferentes y a cada combinación la llamaremos Codón. Genial.


Pero…tenemos un problema. Si solo tenemos 20 aminoácidos, y 64 combinaciones para codificarlos, algunos aminoácidos, sino la mayoría, estarán codificados por varias combinaciones o codones. En efecto así es y por ejemplo el aminoácido Arginina, está codificado por CGU, CGC, CGA, CGG, AGA y AGG.

A este código debemos añadir una palabra que indique que el código debe ser empezado a leer. Algo así como una mayúscula al principio del texto, pero esto no nos quita combinatoria puesto que nuestra primera letra ya codifica un aminoácido que es siempre la Metionina. Lo que si debemos es indicar cuando dejar de leer, porque sino tendríamos proteínas tremendamente largas sin función alguna. A esto se le denomina Codón de Stop, y son 3. UAA, UGA y UAG. Debemos añadir además un par de aminoácidos que, aunque son raros, existen y se dan en algunos organismos y son la Selenocisteina que aparece en eucariotas y procariotas y la Pirrolisina que aparece en Arqueas (Arqueobacterias).

Dicho esto, el esquema de código genético quedaría como en el siguiente cuadro donde se pone las iniciales de 3 letras de cada aminoácido los 3 nucleótidos que lo codifican a continuación. En azul el codón de inicio Metionina y en rojo los codones de Stop.

En la imagen aparecen la letra U porque se refiere a la codificación en ARN donde el nucleótido T se cambia por U “Uracilo”

Con tal cacao de combinaciones, nuestras proteínas traductoras de ADN a proteína no se equivocan y cada vez que leen AUG ellas saben que se refiere a Metionina. En este sentido no hay error. Lo curioso de este código es que en ciertos organismos, es más común encontrar unas combinaciones que otras, es decir, hay más abundancia de unos codones que de otros. Además la abundancia de aminoácidos no es la misma. Por ejemplo, CCC es una combinación que está prácticamente ausente en los genes de las bacterias.

Esto no dejaría de ser simplemente una curiosidad biológica si dejásemos trabajar en paz a los genes y las maquinarias de los organismos, pero claro, la ingeniería genética requiere de expresar genes de unos organismo en otros. Por ejemplo, la hormona del crecimiento que se inyecta a las personas que lo necesitan, antiguamente se extraía de la médula ósea de un cadáver. En la actualidad, lo que se ha hecho es expresar el gen de la hormona del crecimiento en una bacteria y esta bacteria la produce por kilos cada vez que la necesitemos para inyectarla a una persona.

En ese sentido si debemos tener en cuenta el fenómeno conocido como “Codon Bias”. Cuando la traducción a proteína es ineficientes de un gen en un sistema heterólogo (por ejemplo, de un mamífero en células de bacterias) debido a que el gen contiene codones sinónimos que codifican aminoácidos poco abundantes en el sistema celular en que se ha de traducir. Los codones sinónimos no se utilizan con igual frecuencia en todas las bacterias.

Por eso, para poder expresar una proteína de mamífero en una bacteria, o una de bacteria en una planta o las combinaciones que se nos ocurran, debemos hacer lo que se denomina un proceso de adaptación codónica, que como bien dice arriba Mesangio, debemos tener muy en cuenta. Esto no es más que modificar nuestro gen a expresar en un sistema heterólogo de forma que tenga los codones que más habitualmente se dan en el organismo en el que queremos expresar nuestra proteína.