If you're seeing this message, it means we're having trouble loading external resources on our website.

Si estás detrás de un filtro de páginas web, por favor asegúrate de que los dominios *.kastatic.org y *.kasandbox.org estén desbloqueados.

Contenido principal

El código genético

¿Cómo se decodifica la información en una secuencia de ARNm para formar un polipéptido? Aprende cómo grupos de tres nucelótidos, llamados codones, especifican los animoácidos (así como las señales de inicio y terminación para la traducción).

Introducción

¿Alguna vez le has escrito un mensaje secreto a alguno de tus amigos? Si es así, tal vez hayas usado algún tipo de código para mantener el mensaje oculto. Por ejemplo, tal vez hayas reemplazado letras de las palabras con números o símbolos siguiendo un conjunto particular de reglas. Para que el amigo que recibe el mensaje pueda entenderlo, es necesario que conozca el código y aplique el mismo conjunto de reglas, en reversa, para decodificar lo que hayas escrito.
Resulta que la decodificación de mensajes también es un paso clave en la expresión génica, el proceso a través del cual se utiliza la información de un gen para construir una proteína (u otro producto funcional). ¿Cómo están codificadas las instrucciones para generar una proteína en el ADN y cómo las descifra la célula? En este artículo revisaremos con más detalle el código genético, que permite que las secuencias de nucleótidos del ADN y ARN se traduzcan en los aminoácidos que representan.

Resumen: expresión génica y el código genético

Los genes que contienen instrucciones para generar proteínas se expresan en un proceso de dos pasos.
  • En la transcripción, la secuencia de ADN de un gen se "vuelve a escribir" con nucleótidos de ARN. En eucariontes, el ARN debe someterse a pasos de procesamiento adicionales para convertirse en ARN mensajero, o ARNm.
  • En la traducción, la secuencia de nucleótidos del ARNm se "traduce" en la secuencia de aminoácidos de un polipéptido (proteína o subunidad de proteína).
Las células decodifican el ARNm cuando leen sus nucleótidos en grupos de tres, llamados codones. Cada codón indica un aminoácido en particular o, en algunos casos, proporciona una señal de terminación que finaliza la traducción. Además, el codón AUG tiene un papel especial: sirve como codón de inicio en el que comienza la traducción. El conjunto completo de correspondencias entre codones y aminoácidos (o señales de terminación) se conoce como código genético.
La secuencia del ARNm es:
5'-AUGAUCUCGUAA-5'
La traducción implica leer los nucleótidos del ARNm en grupos de tres, cada uno de los cuales especifica un aminoácido (o proporciona una señal de terminación que indica que ha finalizado la traducción).
3'-AUG AUC UCG UAA-5'
AUG right arrow metionina AUC right arrow isoleucina UCG right arrow serina UAA right arrow "alto"
Secuencia del polipéptido: (extremo-N) metionina-isoleucina-serina (extremo-C)
En el resto de este artículo, examinaremos más de cerca el código genético. Primero veremos cómo se descubrió. Luego veremos con más detalle sus propiedades y cómo se puede utilizar para predecir el polipéptido codificado por un ARNm.

Descifrando códigos: cómo se descubrió el código genético

Para descifrar el código genético, los investigadores necesitaban averiguar cómo las secuencias de nucleótidos de una molécula de ADN o ARN podían codificar la secuencia de aminoácidos de un polipéptido.
¿Por qué era un problema difícil? En uno de los códigos posibles más simples, cada nucleótido de una moléculas de ARN o ADN podía corresponder a un aminoácido de un polipéptido. Sin embargo, este código en realidad no funciona, puesto que en las proteínas normalmente hay 20 aminoácidos y solo 4 bases nucleotídicas en el ARN o ADN. Por lo tanto, los investigadores sabían que el código debía estar compuesto de algo más complejo que una relación uno a uno entre los nucleótidos y los aminoácidos.

La hipótesis del triplete

A mediados de la década de 1950, el físico George Gamow profundizó en estas ideas para deducir que el códgio genético probablemente estaba compuesto de tripletes de nucleótidos. Es decir, propuso que un grupo de 3 nucleótidos sucesivos en un gen podría codificar un aminoácido en un polipéptido.
El razonamiento de Gamow era que incluso un código de dobletes (2 nucelótidos por aminoácido) tampoco funcionaría, puesto que solo permitiría 16 grupos ordenados de nucleótidos (4, squared), insuficientes para representar los 20 aminoácidos que normalmente se usan para generar proteínas. No obstante, un código basado en tripletes parecía prometedor: dicho código permite 64 secuencias únicas de nucleótidos (4, cubed), más que suficientes para cubrir los 20 aminoácidos.

Nirenberg, Khorana y la identificación de codones

La hipótesis de tripletes de Gamow parecía lógica y se aceptó ampliamente. Sin embargo, no se había probado experimentalmente y los investigadores seguían sin saber cuales eran los tripletes de nucleótidos correspondientes a cada aminoácido.
En 1961 se comenzó a descifrar el código genético con el trabajo del bioquímico estadounidense Marshall Nirenberg. Por primera vez, Nirenberg y sus colegas fueron capaces de identificar los tripletes específicos de nucleótidos que correspondían a aminoácidos en particular. Su éxito se debió a dos innovaciones experimentales:
  • Una manera de generar moléculas de ARNm artificial con secuencias específicas y conocidas.
  • Un sistema para traducir ARNm en polipéptidos fuera de la célula (un sistema "libre de células"). El sistema de Nirenberg estaba compuesto de citoplasma de células lisadas de E. coli, las cuales contienen todos los materiales necesarios para la traducción.
Primero, Nirenberg sintetizó una molécula de ARNm compuesta únicamente del nucleótido uracilo (llamada poli-U). Al añadir ARNm de poli-U al sistema libre de células, encontró que los polipéptidos generados estaban compuestos exclusivamente del aminoácido fenilalanina. Dado que el único triplete en el ARNm de poli-U es UUU, Nirenberg concluyó que UUU podría codificar para fenilalanina. Mediante la misma técnica, demostró que el ARNm de poli-C se traducía en polipéptidos compuestos exclusivamente del aminoácido prolina, lo que sugería que el triplete CCC podría codificar para prolina.
Otros investigadores, como el bioquímico Har Gobind Khorana en la Universidad de Wisconsin, amplió los experimentos de Nirenberg al sintetizar ARNm artificial con secuencias más complejas. Por ejemplo, en un experimento, Khorana generó un ARNm de poli-UC (UCUCUCUCUC…) y lo añadió a un sistema libre de células similar al de Nirenberg. El ARNm de poli-UC se tradujo en polipéptidos con un patrón alternante de los aminoácidos serina y leucina. Estos y otros resultados confirmaron sin ambigüedad alguna que el código genético estaba formado por tripletes, o codones. Hoy en día sabemos que el codón UCU codifica serina y que CUC codifica leucina.
En 1965, con ayuda del sistema libre de células y otras técnicas, Nirenberg, Khorana y sus colegas ya habían descifrado completamente el código genético. Esto es, ya habían identificado el aminoácido o señal de "alto" correspondiente a cada uno de los 64 codones de nucleótidos. Por sus contribuciones, Nirenberg y Khorana (junto con otro investigador del código genético, Robert Holley) recibieron el premio Nobel en 1968.
_Izquierda: imagen modificada de "Marshall Nirenberg y Heinrich Matthaei," de N. MacVicar (dominio público). Derecha: "Har Gobind Khorana" (dominio público)._

Propiedades del código genético

Como vimos anteriormente, el código genético se basa en tripletes de nucleótidos llamados codones, los cuales especifican aminoácidos individuales en un polipéptido (o señales de "terminación" al final). Los codones de un ARNm se "leen" uno por uno dentro de estructuras de ARN y proteína llamadas ribosomas; se comienza por el extremo 5' del gen y se avanza hacia el extremo 3'. Vamos a revisar el código genético con más atención en el contexto de la traducción.

Tipos de codones (inicio, terminación y "normales")

Tabla del código genético. Cada secuencia de tres letras de nucleótidos de ARNm corresponde a un aminoácido en específico o a un codón de terminación. UGA, UAG y UAA son codones de terminación. AUG es el codón de metionina además de ser el codón de inicio.
_Crédito de la imagen: "The genetic code", de OpenStax College, Biología (CC BY 3.0)_
La traducción siempre comienza en el codón de inicio, el cual tiene la secuencia AUG y codifica el aminoácido metionina (Met) en la mayoría de los organismos. Por lo tanto, todos los polipéptidos suelen comenzar con metionina, aunque la metionina inicial puede ser cortada en etapas posteriores de procesamiento. Se necesita de un codón de inicio para comenzar la traducción, pero el codón AUG también puede aparecer después en la secuencia codificante de un ARNm y simplemente especificará el aminoácido metionina.
Una vez que la traducción ha comenzado en el codón de inicio, los siguientes codones del ARNm se leerán uno por uno en dirección 5' a 3'. Conforme se lee cada codón, el aminoácido correspondiente se añade al extremo carboxilo del polipéptido. La mayoría de los codones del código genético especifican aminoácidos y se leen durante esta fase de la traducción.
La traducción continúa hasta llegar a un codón de paro. Hay tres codones de paro en el código genético: UAA, UAG y UGA. A diferencia del codón de inicio, los codones de paro no codifican aminoácidos. En cambio, funcionan como señales de "alto": indican que el polipéptido está completo y causan que se libere del ribosoma. Pueden haber más nucleótidos después del codón de paro en el ARNm, pero no se traducirán como parte del polipéptido.

Marco de lectura

El codón de inicio es crítico debido a que determina el lugar en el que comenzará la traducción del ARNm. Aún más importante, la posición del codón de inicio determina el marco de lectura, o sea, la manera en que la secuencia del ARNm se divide en grupos de tres nucleótidos dentro del ribosoma. Como se muestra en el siguiente diagrama, la misma secuencia de nucleótidos puede codificar polipétidos completamente diferentes según el marco con el que se lea. El codón de inicio determina el marco de lectura elegido y así asegura que se produzca el polipéptido correcto.
Para entender qué es el marco de lectura, podría ayudar considerar una analogía en la que utilizamos palabras y letras. El siguiente mensaje tiene sentido para nosotros porque lo leemos en el marco correcto (lo dividimos correctamente en grupos de tres letras): HOY ANA FUE CON LEO. Si cambiamos el marco de lectura y agrupamos las letras en grupos de tres y comenzamos a leer una posición después obtenemos: OYA NAF UEC ONL EO. El desplazamiento en el marco provoca que el mensaje ya no tenga sentido.
Un punto importante que debemos resaltar aquí es que los nucleótidos de un gen no están organizados físicamente en grupos de tres. Por el contrario, lo que constituye un codon es simplemente una cuestión de dónde comienza a leer el ribosoma y qué secuencia de nucleótidos se encuentra después del codón de inicio. Las mutaciones que insertan o eliminan solo un nucleótido pueden alterar el marco de lectura, lo que resulta en la producción de una proteína "que no se entiende" similar a la oración revuelta del ejemplo anterior.

Un aminoácido, muchos codones

Como se mencionó antes, el código genético consta de 64 codones únicos. Pero si solo hay 20 aminoácidos, ¿para que son los otros 44 codones? Como ya vimos, hay unos cuantos codones de terminación, pero la mayoría no lo son. En vez de esto, el código genético resulta ser un código degenerado, lo que significa que algunos aminoácidos están especificados por más de un codón. Por ejemplo, prolina está representada por cuatro codones (CCU, CCC, CCA, y CCG). Si cualquiera de ellos aparece en un ARNm, causará que se agregue prolina a la cadena polipeptídica.
La mayoría de los aminoácidos del código genético se codifican por al menos dos codones. De hecho, la metionina y el triptófano son los únicos aminoácidos que se codifican solo por un codón. Es importante resaltar que lo contrario no es cierto: cada codón codifica solo un aminoácido o señal de terminación. Por lo tanto no hay ambigüedad (incertidumbre) en el código genético. Un codón en particular siempre se traducirá de manera predecible en un aminoácido en particular o en una señal de terminación.

El código genético es (casi) universal

Con unas cuantas excepciones, todos los seres vivos de la Tierra usan el mismo código genético. Esto significa que los codones que especifican los 20 aminoácidos en tus células son los mismos que utilizan las bacterias que habitan las fuentes hidrotermales al fondo del océano Pacífico. Incluso en los organismos que no utilizan el código "estándar", las diferencias son relativamente pequeñas, tales como un cambio en el aminoácido codificado por un codón en particular.
Un código genético compartido por tan diversos organismos proporciona una importante evidencia de un origen común de la vida en la Tierra. Esto es, las numerosas especies de la Tierra hoy en día probablemente evolucionaron de un organismo en el cual el código genético ya se encontraba presente. Debido a que el código es esencial para la función celular, debería tender a permanecer sin cambios en las especies a través de las generaciones, puesto que los individuos con cambios importantes serían incapaces de sobrevivir. Este tipo de proceso evolutivo puede explicar la notable similitud del código genético en los organismos presentes en la actualidad.

¿Quieres unirte a la conversación?

¿Sabes inglés? Haz clic aquí para ver más discusiones en el sitio en inglés de Khan Academy.