Cómo los genes del ADN proporcionan las instrucciones para hacer proteínas. El dogma central de la biología molecular: ADN → ARN → proteína.

Resumen: expresión génica

El ADN es el material genético de todos los organismos de la Tierra. Cuando se transmite de padres a hijos, el ADN puede determinar algunas de las características de los hijos (como el color de sus ojos o de su cabello). Pero, ¿cómo puede la secuencia de una molécula de ADN realmente tener efecto sobre las características de un ser humano o de cualquier otro organismo? Por ejemplo, ¿cómo puede la secuencia de nucléotidos (As, Ts, Cs y Gs) del ADN de las plantas de chícharos de Mendel determinar el color de sus flores?

Los genes especifican productos funcionales (como proteínas)

Una molécula de ADN no solo es una larga y aburrida cadena de nucleótidos. En realidad, se divide en unidades funcionales llamadas genes. Cada gen proporciona las instrucciones para formar un producto funcional, o sea, una molécula necesaria para desempeñar un trabajo en la célula. En muchos casos, el producto funcional es una proteína. Por ejemplo, en el experimento de Mendel, el gen del color de las flores tiene las instrucciones para hacer una proteína que ayuda a producir moléculas coloridas (pigmentos) en los pétalos de las flores.
Diagrama que muestra cómo un gen puede dictar un fenotipo (característica observable) de un organismo. El gen del color de las flores que estudió Mendel se compone de una tira de ADN que se encuentra en un cromosoma. El ADN tiene una secuencia particular; parte de esta se muestra en el diagrama y es 5'-GTAAATCG-3' (cadena superior), que está emparejada con la secuencia complementaria 3'-CATTTAGC-5' (cadena inferior). El ADN del gen especifica la producción de una proteína que ayuda a formar pigmentos. Cuando la proteína está presente y es funcional, se producen pigmentos y las flores de la planta tienen un color púrpura.
Imagen basada en los datos experimentales reportados por Hellens et al1^1 y en una figura similar de Reece et al2^2.
El producto funcional de la mayoría de los genes son proteínas, o para ser más exactos, polipéptidos. El término polipéptido es solo una palabra para designar una cadena de aminoácidos. Aunque muchas proteínas se conforman de un solo polipéptido, algunas están hechas de varios polipéptidos. Los genes que especifican polipéptidos se conocen como genes codificantes de proteínas.
No todos los genes codifican proteínas. Por el contrario, algunos proporcionan instrucciones para producir moléculas de ARN funcionales, como los ARN de transferencia y los ARN ribosomales que desempeñan papeles en la traducción.
Como se mencionó anteriormente, el ADN de un organismo puede dividirse en unidades funcionales llamadas genes. Cada gen está compuesto de una secuencia de ADN y la secuencia proporciona instrucciones para generar algún producto que necesite la célula. Algunos productos son polipéptidos, mientras que otros son ARN funcionales.
Ejemplos de diferentes productos funcionales que los genes pueden especificar.
En este ejemplo, hay una sección de ADN que contiene tres genes diferentes:
  • El gen 1 codifica un ARNm, que luego se traduce para formar un polipéptido (proteína o subunidad proteica).
  • El gen 2 codifica un ARN regulador. Este ARN no se transcribe en un polipéptido, sino que realiza una función en la célula misma (regula la expresión de otros genes).
  • El gen 3 codifica un ARN de transferencia (ARNt). Este ARN tampoco se transcribe en un polipéptido, sino que se pliega en una forma de trébol compleja y jugará un papel clave en la síntesis de proteínas.
_Imagen modificada de "Dogma central de la bioquímica molecular con enzimas", por Daniel Horspool (CC BY-SA 3.0). La imagen modificada se encuentra bajo una licencia CC BY-SA 3.0._
La idea de que los genes codifican polipéptidos lleva mucho años circulando (sus raíces se remontan a los experimentos de Beadle y Tatum en la década del 40).
La noción de que los genes regularmente producen ARN funcionales es más nueva. Ciertos tipos de ARN funcionales (como los ARN de transferencia y los ARN ribosomales) se conocen desde hace muchos años. Sin embargo, los científicos han descubierto en fechas recientes muchos otros genes que codifican ARN regulatorios, ARN no codificantes que cambian la expresión de otros genes. La manera como funcionan estos ARN es un área activa de investigación.

¿Cómo puede la secuencia de ADN de un gen especificar una proteína en particular?

Muchos genes proporcionan instrucciones para producir polipéptidos. ¿Cómo dirige exactamente el ADN la construcción de un polipéptido? Este proceso consta de dos pasos: transcripción y traducción.
  • En la transcripción, la secuencia de ADN de un gen se copia para obtener una molécula de ARN. Este proceso es llamado transcripción porque implica reescribir, o trancribir, la secuencia de ADN en un "alfabeto" de ARN similar. En eucariontes, la molécula de ARN debe someterse a un procesamiento para convertirse en un ARN mensajero (ARNm) maduro.
  • En la traducción, la secuencia de ARNm se decodifica para especificar la secuencia de aminoácidos de un polipéptido. El nombre traducción refleja que la secuencia de nucleótidos del ARNm se debe traducir al "idioma", completamente diferente, de los aminoácidos.
Esquema simplificado del dogma central que muestra las secuencias de las moléculas participantes.
Las dos cadenas de ADN tienen las siguientes secuencias:
5'-ATGATCTCGTAA-3' 3'-TACTAGAGCATT-5'
La transcripción de una de las cadenas de ADN produce un ARNm con una secuencia casi idéntica a la otra cadena de ADN. Sin embargo, debido a las diferencias bioquímicas entre el ADN y el ARN, las T del ADN se reemplazan con U en el ARNm. La secuencia de ARNm es:
5'-AUGAUCUCGUAA-5'
La traducción implica leer los nucleótidos del ARNm en grupos de tres, cada uno de los cuales especifica un aminoácido (o proporciona una señal de terminación que indica que ha finalizado la traducción).
3'-AUG AUC UCG UAA-5'
AUG \rightarrow metionina AUC \rightarrow isoleucina UCG \rightarrow serina UAA \rightarrow "alto"
Secuencia del polipéptido: (extremo-N) metionina-isoleucina-serina (extremo-C)
Por lo tanto, durante la expresión de un gen codificante de proteína, la información fluye de ADN \rightarrow ARN \rightarrow proteína. Este flujo de información se conoce como el dogma central de la biología molecular. Los genes no codificantes (genes que producen ARN funcionales) también se transcriben para producir ARN, pero este ARN no se traduce en un polipéptido. Para cualquier tipo de gen, el proceso de pasar de ADN a producto funcional se conoce como expresión génica.
Tal vez te preguntes por qué hay un paso de transcripción en la expresión génica. ¿Por qué no traducir directamente una secuencia de ADN en la secuencia de aminoácidos de un polipéptido?
Esa es una muy buena pregunta a la que no le podemos dar una respuesta definitiva. Hasta cierto punto, simplemente es así la manera en que evolucionó el sistema de expresión génica y cuando hablamos del "por qué" de la transcripción solo estamos especulando. Si encontráramos vida en otro planeta, es posible que expresara sus genes a través de un proceso diferente que no involucrara la transcripción.
En los organismos conocidos, no obstante, la transcripción es una parte esencial de la expresión génica. Incluso si las células tuvieran alguna manera (que no tienen) de leer directamente la secuencia de ADN y usarla para generar una proteína, existen ciertas razones por las que la transcripción seguiría siendo un paso necesario:
  • Una de las razones se relaciona con la localización. En la célula eucarionte, el ADN está encerrado en el núcleo, mientras que los ribosomas —las máquinas moleculares utilizadas para hacer proteínas— se encuentran en el citosol. Por lo tanto, se necesita de un "mensajero" que lleve esta información del ADN fuera del núcleo donde esperan los ribosomas. Los ARN mensajeros (ARNm) cumplen esta función.
  • La transcripción también proporciona un importante punto de control en el que las células pueden modular la cantidad que se produce de un polipéptido. Aunque también se pueden regular otras etapas de la expresión génica, el control de la transcripción es la forma de regulación genética más común. Si de alguna manera se eliminara la etapa de transcripción, las células perderían gran parte de su control sobre cuáles polipéptidos se producen y cuándo.

Transcripción

En la transcripción, una cadena del ADN que compone al gen, llamada cadena no codificante, funciona como molde para que una enzima llamada ARN polimerasa sintetice una cadena de ARN correspondiente (complementaria). Esta cadena de ARN se llama transcrito primario.
Las dos cadenas de ADN tienen las siguientes secuencias:
5'-ATGATCTCGTAA-3' 3'-TACTAGAGCATT-5'
El ADN se abre para formar una burbuja y la cadena inferior sirve como molde para la síntesis de una cadena de ARN complementaria. Esta es llamada cadena molde. La transcripción de la cadena molde produce un ARNm que es casi idéntico en secuencia a la otra cadena (cadena codificante) de ADN. Sin embargo, debido a una diferencia bioquímica entre el ADN y el ARN, las T del ADN se reemplazan con U en el ARNm. La secuencia de ARNm es:
5'-AUGAUCUCGUAA-5'
El transcrito primario tiene la misma secuencia de información que la cadena de ADN que no se transcribió, generalmente llamada cadena codificante. Sin embargo, el transcrito primario y la cadena codificante no son idénticos debido a ciertas diferencias bioquímicas entre el ADN y el ARN. Una diferencia importante es que las moléculas de ARN no contienen la base timina (T). En lugar de timina, las moléculas de ARN utilizan una base similar llamada uracilo (U). El uracilo, al igual que la timina, forma pareja con la adenina.
Identidad de los azúcares. El azúcar en un nucleótido de ARN es ribosa, mientras que en el ADN es desoxirribosa. Ambos son muy similares, pero la ribosa tiene un grupo hidroxilo (OH-\text{OH}) que no se encuentra en la desoxirribosa.
Nucleótido de ADN: carece de un grupo hidroxilo en el carbono 2' del azúcar (es decir, el azúcar es una desoxirribosa). Contiene una base timina que tiene un grupo metilo unido a su anillo.
Nucleótido de ARN: tiene un grupo hidroxilo en el carbono 2' del azúcar (es decir, el azúcar es una ribosa). Contiene una base uracilo que es muy similar en estructura a la timina, pero no tiene un grupo metilo unido a su anillo.
Imagen que se basa en una imagen similar de CyberBridge 3^3.
Número de cadenas. La transcripción produce una cadena sencilla de ARN, mientras que la molécula inicial de ADN es de doble cadena.
A pesar de que los transcritos de ARN no están compuestos de dos cadenas separadas, a veces el ARN se puede doblar sobre sí mismo y formar regiones de doble cadena y complicadas estructuras tridimensionales. Veremos ejemplos de plegamiento de ARN cuando revisemos el ARN de transferencia (ARNt) y la traducción de proteínas. Además, algunos virus tienen genomas de ARN de doble cadena.
Consulta el artículo de ácidos nucleicos para más información sobre el ADN y el ARN.

Transcripción y procesamiento de ARN: eucariontes frente a bacterias

En bacterias, el transcrito primario puede servir directamente como ARN mensajero o ARNm. El ARN mensajero obtiene su nombre por el hecho de actuar como mensajero entre el ADN y los ribosomas. Los ribosomas son las estructuras de ARN y proteínas en el citosol donde se forman las proteínas.
En eucariontes (como los seres humanos), el transcrito primario debe someterse a algunos pasos extra para convertirse en un ARNm maduro. Durante el procesamiento, se añaden casquetes en ambos extremos del ARN y se eliminan cuidadosamente algunas de sus porciones en un proceso conocido como empalme. Estos pasos no ocurren en bacterias.
Célula eucarionte: la transcripción ocurre en el núcleo. El transcrito primario se somete a pasos de procesamiento adicionales en el núcleo para convertirse en ARNm maduro. Luego, se exporta al citosol, donde se puede juntar con un ribosoma y dirigir la síntesis de un polipéptido en el proceso de traducción.
Bacteria: la transcripción ocurre en el citosol. Debido a esto, el ARNm no necesita viajar a ningún otro lado antes de poder ser traducido por un ribosoma. De hecho, un ribosoma puede comenzar a traducir un ARNm incluso antes de que se transcriba completamente (mientras la transcripción sigue en proceso).
El lugar donde ocurre la transcripción también es diferente entre procariontes y eucariontes. La transcripción eucarionte ocurre en el núcleo, donde se almacena el ADN, mientras que la síntesis de proteínas ocurre en el citosol. Debido a esto, el ARNm eucarionte debe ser exportado del núcleo antes de que pueda traducirse en un polipéptido. Las células procariontes, por otra parte, no tienen núcleo, por lo que la transcripción y la traducción se llevan a cabo en el citosol.

Traducción

Después de la transcripción (y de algunos pasos de procesamiento en eucariontes), la molécula de ARNm está lista para dirigir la síntesis de proteínas. El proceso de usar información de un ARNm para producir un polipéptido se llama traducción.

El código genético

Durante la traducción, la secuencia de nucleótidos de un ARNm se traduce en la secuencia de aminoácidos de un polipéptido. Específicamente, los nucleótidos del ARNm se leen en tripletes (grupos de tres) llamados codones. Existen 6161 codones que especifican aminoácidos. Uno de esos codones es un codón de "inicio" que señala dónde comienza la traducción. El codón de inicio codifica para el aminoácido metionina, por lo que la mayoría de los polipéptidos comienzan con este aminoácido. Otros tres codones de "terminación" indican el final de un polipéptido. Estas relaciones se llaman código genético.
Tabla del código genético. Cada secuencia de tres letras de nucleótidos de ARNm corresponde a un aminoácido en específico o a un codón de terminación. UGA, UAG y UAA son codones de terminación. AUG es el codón de metionina además de ser el codón de inicio.
_Crédito de la imagen: "The genetic code", de OpenStax College, Biología (CC BY 3.0)_
La secuencia del ARNm es:
5'-AUGAUCUCGUAA-5'
La traducción implica leer los nucleótidos del ARNm en grupos de tres, cada uno de los cuales especifica un aminoácido (o proporciona una señal de terminación que indica que ha finalizado la traducción).
3'-AUG AUC UCG UAA-5'
AUG \rightarrow metionina AUC \rightarrow isoleucina UCG \rightarrow serina UAA \rightarrow "alto"
Secuencia del polipéptido: (extremo-N) metionina-isoleucina-serina (extremo-C)

Los pasos de la traducción

La traducción ocurre dentro de estructuras conocidas como ribosomas. Los ribosomas son máquinas moleculares cuya función es construir polipéptidos. Una vez que un ribosoma se monta sobre un ARNm y encuentra el codón de "inicio", se desplazará rápidamente por el ARNm un codón a la vez. Al avanzar, construirá poco a poco una cadena de aminoácidos que refleja exactamente la secuencia de codones en el ARNm.
¿Cómo "sabe" el ribosoma qué aminoácido insertar para cada codón? Pues resulta que esta correspondencia no la hace el ribosoma por sí mismo. En realidad, depende de un grupo de moléculas de ARN especializadas llamadas ARN de transferencia (ARNt). Cada ARNt tiene tres nucleótidos que sobresalen en un extremo y pueden reconocer (complementar sus bases con) uno o unos cuantos codones en particular. En el otro extremo, el ARNt transporta un aminoácido: específicamente, el aminoácido que corresponde con esos codones.
La traducción ocurre en el ribosoma. El ARNm se une al ribosoma, donde puede interactuar con moléculas de ARNt.
En esta imagen, la secuencia del ARNm es:
3'-...AUG UAC AUC UCG GAU...-5'
El ARNt unido al tercer codón (5'-AUC-3') tiene la secuencia complementaria 3'-UAG-5'. Lleva una cadena de polipéptido compuesta por metionina e isoleucina, la cual se une al ARNt mediante la isoleucina. A la derecha de este ARNt hay otro ARNt que se une al siguiente codón (5'-UCG-3'). Dicho ARNt también tiene una secuencia de nucleótidos complementaria (3'-AGC-3') y lleva al aminoácido serina, que es el aminoácido especificado por el codón del ARNm. La serina que transporta el ARNt será añadida a la creciente cadena de polipéptido.
Otros ARNt que transportan otros aminoácidos están flotando alrededor. Uno lleva Glu (ácido glutámico) y la secuencia de nucleótidos en su extremo es 3'-CUU-5'. El otro transporta Asp (ácido aspártico) y la secuencia de nucleótidos en su extremo es 3'-CUA-5'.
Hay muchos ARNt flotando en una célula, pero solo el ARNt que coincide (cuyas bases se complementan) con el codón que se lee en ese momento puede unirse y suministrar su carga de aminoácido. Una vez que el ARNt está perfectamente unido a su codón correspondiente en el ribosoma, su aminoácido se añadirá al final de la cadena polipeptídica.
  1. El RNAt correspondiente se une al codón expuesto en la ranura que está en la extrema derecha del ribosoma.
  2. La cadena de aminoácidos se transfiere del ARNt en la ranura central del ribosoma al aminoácido del ARNt en la ranura de la derecha. Con esto, el aminoácido se agrega al final de la cadena de aminoácidos.
  3. El ribosoma se desplaza un codón. El ARNt que antes estaba en la ranura del centro se mueve a la ranura de la izquierda y sale del ribosoma. El ARNt que antes estaba en la ranura de la derecha se mueve a la ranura del centro y sigue unido a la cadena de aminoácidos. Un nuevo codón queda expuesto en la ranura de extrema derecha para que se una ahí un nuevo ARNt.
Este proceso se repite muchas veces y el ribosoma se mueve sobre el ARNm un codón a la vez. La cadena de aminoácidos se construye pieza por pieza con una secuencia de aminoácidos que coincide con la secuencia de codones en el ARNm. La traducción termina cuando el ribosoma alcanza un codón de terminación y libera el polipéptido.

¿Qué sucede después?

Una vez terminado el polipéptido, este puede ser procesado, modificado, combinado con otros polipéptidos o enviado a algún destino en específico dentro o fuera de la célula. En última instancia, este polipéptido realizará un trabajo específico para la célula o el organismo, tal vez como molécula de señalización, algún elemento estructural o una enzima.

Recapitulación:

  • El ADN se divide en unidades funcionales llamadas genes, los cuales pueden especificar polipéptidos (proteínas y subunidades proteicas) o ARN funcionales (como los ARNt y ARNr).
  • La información de un gen se utiliza para construir un producto funcional en un proceso llamado expresión génica.
  • Los genes que codifican polipéptidos se expresan en dos pasos. En este proceso, la información fluye de ADN \rightarrow ARN \rightarrow proteína, lo que constituye una relación direccional conocida como el dogma central de la biología molecular.
    • Transcripción: una cadena del ADN del gen se copia en ARN. En eucariontes, el transcrito de ARN se debe someter a pasos adicionales de procesamiento para convertirse en un ARN mensajero maduro (ARNm).
    • Traducción: la secuencia de nucleótidos del ARNm se decodifica para especificar la secuencia de aminoácidos de un polipéptido. Este proceso ocurre dentro de un ribosoma y requiere de moléculas adaptadoras llamadas ARNt.
  • Durante la traducción, los nucleótidos del ARNm se leen en grupos de tres llamados codones. Cada codón especifica un aminoácido en particular o una señal de alto. Este conjunto de relaciones se conoce como código genético.
Este artículo está autorizado bajo una licencia CC BY-NC-SA 4.0.

Referencias citadas:

  1. Hellens, R. P., Moreau, C., Lin-Wang, K., Schwinn, K. E., Thomson, S. J., Fiers, M. W. E. J., . . . Noel Ellis, T. H. (11 de octubre de 2010). Identification of Mendel's white flower character. (Identificación del carácter de flores blancas observado por Mendel) PLOS ONE. http://dx.doi.org/10.1371/journal.pone.0013230.
  2. Reece, J. B., Urry, L. A., Cain, M. L., Wasserman, S. A., Minorsky, P. V. y Jackson, R. B. (2011). Figure 14.4. Alleles, alternative versions of a gene (Figura 14.4. Alelos, versiones alternativas de un gen). En Campbell biology (Biología de Campbell) (10° ed., pág. 271). San Francisco, CA: Pearson.
  3. CyberBridge. (2007). RNA structure (Estructura del ARN). En Structure of DNA. Consultado en http://cyberbridge.mcb.harvard.edu/dna_3.html.

Referencias:

Hellens, R. P., Moreau, C., Lin-Wang, K., Schwinn, K. E., Thomson, S. J., Fiers, M. W. E. J., . . . Noel Ellis, T. H. (11 de octubre de 2010). Identification of Mendel's white flower character. (Identificación del carácter de flores blancas observado por Mendel) PLOS ONE. http://dx.doi.org/10.1371/journal.pone.0013230.
OpenStax College, Biología. (29 de diciembre de 2015). The genetic code (El código genético). En OpenStax CNX. Consultado en http://cnx.org/contents/GFy_h8cu@9.87:QEibhJMi@8/The-Genetic-Code.
Purves, W. K., Sadava, D. E., Orians, G. H. y Heller, H.C. (2004). DNA, RNA, and the flow of information (ADN, ARN y el flujo de la información). En Life: the science of biology (Vida: la ciencia de la biología) (7° ed., págs. 236-237). Sunderland, MA: Sinauer Associates.
Reece, J. B., Urry, L. A., Cain, M. L., Wasserman, S. A., Minorsky, P. V. y Jackson, R. B. (2011). Genes specify proteins via transcription and translation (Los genes especifican proteínas mediante la transcripción y la traducción). En Campbell biology (Biología de Campbell) (10° ed., págs. 334-340). San Francisco, CA: Pearson.

Agradecimientos:

Agradecemos a Willy McAllister por sus valiosos comentarios sobre este artículo.
Cargando