miércoles, 20 de diciembre de 2006

El ADN (Segunda parte)

Ya hemos visto cómo es el ADN y cuánta información puede llegar a contener. Sin embargo, hay que hacer una precisión: la mayor parte del ADN (más del 90%) no codifica para proteínas y no parece tener función. Se le denomina ADN basura, aunque los últimos descubrimientos indican que quizá tenga una función estructural o de regulación de la expresión de los genes. Y hablando de genes, ¿qué es esa información que contiene el ADN y como se expresa? Pues bien, la información del ADN pasa a convertirse en una proteína a traves de dos procesos: transcripción y traducción.



Pero antes de ver estos dos procesos tenemos que explicar cómo se organiza la información en nuestro ADN. Como hemos dicho antes, en el ADN hay 4 letras. Mediante diversos experimentos (realizados por Nirenberg, Ochoa y Khorana; y sus respectivos equipos de laboratorio) se demostró que esas letras se agrupan de tres en tres en lo que se llaman tripletes o codones. Haciendo los cálculos oportunos concluímos que con cuatro letras en grupos de tres obtenemos 64 combinaciones posibles. Con estas 64 combinaciones o tripletes distintos se codifican los 20 aminoácidos que usamos para sintetizar nuestras proteínas.




Como hay aminoácidos que pueden ser codificados por más de un codón decimos que nuestro código genético es degenerado, ya que un código genético no degenerado implicaría una relación un aminoácido-un triplete; y no varios tripletes como es nuestro caso. Esta degeneración del código, lejos de ser un defecto, es en realidad una ventaja ya que permite una cierta plasticidad o margen de error a la hora de transcribir y traducir la información a proteínas.

El código genético está formado por tripletes, como ya hemos dicho, pero estos tripletes van uno detrás de otro y nunca se superponen. Además, si tuviéramos que leer el código genético, observaríamos que no hay "comas": no existen pausas ni espacios en blanco, debe leerse todo seguido de forma continua. Por último, este código genético, es decir, la relación entre tripletes y aminoácidos, es universal. Esto significa que en cualquier organismo el mismo triplete codifica para el mismo aminoácido. Todos los organismos del planeta compartimos la misma codificación del ADN. La excepción principal a esta universalidad del código genético es el código genético mitocondrial, cuya relación entre codones y aminoácidos varía un poco.

miércoles, 6 de diciembre de 2006

El ADN (Primera Parte)

El ácido desoxirribonucleico o ADN es una macromolécula que se encuentra en el núcleo de nuestras células, y la más importante, pues porta toda la información necesaria para el buen funcionamiento de cualquier organismo unicelular o pluricelular. La estructura física del ADN podríamos visualizarla como dos larguísimas tiras finas de papel que se enrollan una alrededor de otra (como si hiciésemos una trenza con sólo dos hilos).





En esas tiras de papel hay escritas letras, pero el abecedario del ADN sólo incluye cuatro: A, G, T y C; que corresponden a cuatro bases (unas moléculas más pequeñas que el ADN) llamadas adenina, guanina, timina y citosina; respectivamente. Además, cuando en una tira de papel encontramos una A, en la otra encontramos una T (y viceversa), mientras que si encontramos una C, en la otra encontramos una G (y viceversa). Decimos por tanto que las bases aparean con sus complementarias y esto significa que la información en el ADN se encuentra doblada, es decir, tenemos dos copias de la misma información.


Las letras en el ADN no siguen un orden monótono, sino que se pueden encontrar secuencias de todo tipo. En total, nuestro ADN cuenta con unos 3000 millones de pares de bases o letras, que visualmente sería considerar una tira de papel con 3000 millones de letras (y la otra tira de papel con los 3000 millones de letras complementarias). Es difícil imaginarse estas cifras, por ello vamos a hacer unos pequeños cálculos informáticos. Como el ADN sólo hace uso de cuatro letras, la información puede ser expresada como un grupo de dos bits; por ejemplo A=00; T=01; G=10; y C=11. Por tanto, si para codificar cada letra necesitamos dos bits, para codificar 3000 millones de letras harían falta 6000 millones de bits. Esto significa un total de 750 millones de bytes, que son 732421 kilobytes o más sencillamente 715,26 megabytes. Es decir, la información de nuestro ADN en bruto ocuparía un poco más de un CD-ROM. Si quisiéramos expresar la información almacenada en las dos tiras de papel tendríamos que hacer uso de 2 CD-ROMs y parte de otro; pero como ya hemos dicho que ambas contienen la misma información, con grabar un sólo disco y un poquito de otro tendríamos suficiente.

El ejemplo del CD-ROM quizá no sea todo lo gráfico que pretende: un disco de música suele ocupar un CD-ROM entero y uno podría pensar que tampoco es mucha información (tan sólo serían ¿cuántas? ¿15 canciones?). Por ello vamos a llevar nuestros cálculos un poco más lejos. Si abrimos un procesador de textos, y llenamos sólo una página con una combinación cualquier de A, T, G y C, al guardarla en formato .txt ocupará unos 2552 bytes. Como hemos visto antes, el ADN representa 750 millones de bytes. Haciendo una sencilla división obtenemos un total de 293887 páginas tamaño folio. Los libros que normalmente leemos son más pequeños que un folio (libros de bolsillo en rústica o incluso en tapa dura) de tal manera que harían falta 3 páginas de uno de estos libros para contener la información de un folio. Por tanto necesitaríamos un total de 881661 páginas para contener la información del ADN. Además, estos libros suelen tener de media unas 300 páginas. Teniendo en cuenta este último dato, obtenemos que harían falta nada menos que 2939 libros de bolsillo para almacenar toda la información contenida en el ADN.