Search

√Ārboles, arbustos o bosques de la vida

Autor
Categoría
Biología
Ciencia
Tecnología
Fecha de Publicación
2017/10/05
7 more properties
ūüď∑
Portada: ¬ęSlime Mould¬Ľ, un tipo de protozoo que se alimenta de bacterias y materia org√°nica.

Peras con manzanas

Si tuvi√©semos unos lentes que permitieran amplificar al menos mil veces lo que vemos, ver√≠amos peque√Īos puntos en todas las superficies, en el aire, en los l√≠quidos.
Esos puntos son microorganismos. Como no podemos verlos a simple vista, vivimos nuestro día a día como si no existieran... Hasta que en la cita médica nos enteramos de la infección a la faringe y tenemos que suspender el pisco sour y tomar antibióticos.
Pero aunque no los veamos ni nos produzcan una infección, esos organismos microscópicos siempre están ahí y surgieron en este planeta muchísimo antes que cualquier otra criatura con orejas o patas.
Los seres vivos se parecen entre s√≠. Todo depende del car√°cter que usemos para esas comparaciones. Podr√≠amos agrupar a todos los organismos que tienen escamas o aquellos que tienen ojos y formar grupos espec√≠ficos y los clasificamos de acuerdo a esos caracteres. Es de esta clasificaci√≥n que surge el cl√°sico ¬ę√°rbol de la vida¬Ľ, donde se puede ver c√≥mo est√°n emparentados todos los seres vivos que conocemos en el planeta.
Pero, ¬Ņc√≥mo hacemos para discernir entre una especie y otra? Actualmente, lo que m√°s se usa son sus diferencias gen√©ticas. Es decir, qu√© tan distinto es el alfabeto que nos escribe a cada uno. Sin ir m√°s lejos, uno de nuestros etilmercurianos encontr√≥ un gen del piure (esa cosa que parece una roca ensangrentada y que hay gente que ‚ÄĒgu√°cala‚ÄĒ se come) que es un 95,5% similar a un gen humano y... Momento. ¬ŅA qui√©n le importan los piures?

Filo filo, filo contigo

¬ęEl √°rbol de la vida crece otra vez¬Ľ;¬†l√©alo cantando¬†si quiere :D
Hace unos d√≠as, investigadores del Australian Center for Ecogenomics publicaron el trabajo ¬ęRecovery of nearly 8,000 metagenome-assembled genomes substantially expands the tree of life¬Ľ (1). Como dice el t√≠tulo, usando bases de datos p√ļblicas y potentes herramientas computacionales, el equipo de investigaci√≥n consigui√≥ ¬ęensamblar¬Ľ casi 8 mil genomas [conjunto de genes de todo el organismos, los cuales a su vez est√°n formados de ADN] de microorganismos (Archaea y Bacteria). De ellos, 20 corresponden a organismos que no estaban descritos anteriormente a nivel de filo (o phylum en lat√≠n). En taxonom√≠a, filo es un nivel superior de clasificaci√≥n de organismos; luego (y si ignoramos categor√≠as intermedias m√°s espec√≠ficas) vienen clase, familia, g√©nero y especie.
Es decir, cada nuevo genoma descubierto por este grupo representa un nuevo filo bacteriano; en este filo pueden existir cientos de ¬ęespecies¬Ľ distintas, desconocidas hasta ahora (as√≠ que imag√≠nese todo lo que falta por descubrir). Solo este estudio contribuy√≥ a aumentar en un 30% el n√ļmero de filos existentes en el √°rbol de la vida.
Pero, ¬Ņde d√≥nde sac√≥ el grupo de investigaci√≥n los datos para ¬ęensamblar¬Ľ genomas? ¬ŅY c√≥mo se puede recuperar la informaci√≥n gen√©tica de organismos tan peque√Īos?

Bring me the data

Como los microorganismos son criaturas unicelulares, dif√≠ciles de analizar, el uso de caracteres taxon√≥micos (escamas, ojos, esqueleto... o sea, las caracter√≠sticas ¬ęobservables¬Ľ que nos permiten diferenciar un organismo de otro) no es suficiente para discriminar entre grupos. Por esto, se hace necesario obtener la informaci√≥n gen√©tica de estos organismos junto con otro tipo de informaci√≥n (bioqu√≠mica, fisiolog√≠a).
El otro problema que tenemos es que, como dijimos anteriormente, la mayor√≠a de los microorganismos no son cultivables. Eso significa que la √ļnica forma de acceder a ellos es ¬ęrecoger¬Ľ los genes que est√°n en el ambiente. Sin embargo, los microorganismos que pueden ser cultivados siguen siendo √ļtiles, ya que se les ha secuenciado su genoma (todos sus genes) y as√≠ se convierten en los ¬ęgenomas de referencia¬Ľ para aquellos organismos no cultivables (si quiere saber m√°s sobre esto, puede visitar nuestro post sobre cu√°nto pesa su genoma).
¬ŅQu√© es una especie? ¬ŅDe d√≥nde venimos? ¬ŅPara d√≥nde vamos? ¬ŅD√≥nde est√° el quinto dedo en los perros? ¬ŅPor qu√© le estoy revisando las patas a mi perro ahora?¬†Imagen: Sergio Melnick
Definir qu√© es una especie en organismos ¬ęsuperiores¬Ľ es complejo y a√ļn es objeto de debate. De hecho, hay m√°s de 40 definiciones (ac√°, un blog amigo recopila al menos 26 definiciones distintas). Ahora, pensando en microorganismos donde es complejo establecer diferencias, esto se torna a√ļn peor. Incluso la existencia del concepto de ¬ęespecie¬Ľ es dif√≠cil de delimitar. Por este motivo se habla de ¬ęfilotipo¬Ľ o ¬ęunidad taxon√≥mica operacional¬Ľ (OTU, por su sigla en ingl√©s), lo cual est√° basado en la similitud de la secuencia del gen en estudio con la informaci√≥n que existe de otros organismos.
La informaci√≥n gen√©tica (secuencias) que se obtiene mediante distintas t√©cnicas como clonamiento y secuenciaci√≥n directa masiva es almacenada en bases de datos p√ļblicas y abiertas como NCBI-GenBank, EMBL-EBI y otras como Sequence Read Archive (SRA) para datos masivos. Entre los a√Īos 1990 y la primera d√©cada del 2000, la t√©cnica m√°s usada era la clonaci√≥n, mediante la cual se obtiene por ¬ęcorrida¬Ľ miles de secuencias de ADN, lo que equivale a cerca de 700 Mb de datos. Es una cifra no menor si tomamos en cuenta que esos ~700 Mb de datos son ¬ęsolamente¬Ľ 4 letras (¬°no sea ordinario!) empalmadas una detr√°s de la otra en distinto orden. No hay otro tipo de informaci√≥n contenida en estas secuencias de ADN.
Actualmente, las técnicas de secuenciación masiva producen entre 10-1000 Gb por corrida. Por ello, gran parte del trabajo que se hace en biología y genética consiste básicamente en bucear en estas enormes bases de datos.
Dentro del estudio de las comunidades microbianas en el ambiente, son frecuentes los trabajos sobre diversidad microbiana usando uno o algunos genes marcadores. Es decir, genes que sean informativos. Dependiendo de la pregunta es que definimos qu√© significa informativo. Para este tipo de estudios, generalmente se utilizan aquellos que son conservados a trav√©s del tiempo, o que tienen una baja tasa de mutaci√≥n al azar. Esto nos permite evaluar aquellas diferencias a las que llamamos ¬ęprofundas¬Ľ, que nos ayudar√°n a trazar l√≠mites (gen√©ticos) entre un grupo y otro. Para esto, el gen m√°s com√ļn es uno que se encuentra dentro de los ribosomas llamado 16S. O simplemente el gen ribosomal 16S.

¬ŅCu√°ntos genes hay en mi patio?

Gracias al avance tecnol√≥gico de secuenciaci√≥n masiva de √ļltima generaci√≥n (NGS para los amigos), cada vez es m√°s frecuente analizar todos los genes presentes en una muestra ambiental o, como le llamamos en ciencia, todo el ADN metagen√≥mico. Ya no nos referimos solo a un gen como lo hac√≠amos en el pasado. Esto se puede hacer de forma muy simple: si nos interesa, por ejemplo, estudiar los genes que hay en el suelo del patio de la casa (si vive en departamento, imagine el macetero de su cactus), se toma una muestra y, literalmente, extrae su ADN. Existen kits comerciales que nos ayudan en este trabajo: se trata de un set de reactivos que rompen la pared de las c√©lulas y liberan el ADN al medio: este ADN puede ser purificado y analizado. El ADN puede secuenciado directamente en distintas plataformas de secuenciaci√≥n generando decenas de Gb de informaci√≥n. Es decir, el ADN es ¬†le√≠do y organizado de acuerdo a sus genes. El ADN obtenido debe analizarse cuidadosamente usando herramientas y software especializados (la mayor√≠a son de acceso y c√≥digo libre, compa√Īero).
Lo primero que se hace es clasificar las secuencias, es decir, saber a qué se parecen. Dependiendo de su similitud, se le asocia un gen que ya haya sido descrito (esto no siempre es posible: todo depende de la cantidad de información que otros grupos de investigación hayan generado). Si logramos esto, podríamos saber que en el suelo del patio hay genes relacionados a la fijación de dióxido de carbono, por ejemplo, o a la resistencia a antibióticos. Para que esto ocurra es necesario acceder a bases de datos actualizadas sobre clasificación taxonómica de microorganismos, y existen muchas de ellas. Entre las más usadas actualmente están SILVA, Greengenes (no, no tiene que ver con Greenpeace), Ribosomal Database Project (RDP), entre otras.
¬°TODO NI√ĎO TIENE DERECHO A QUE LA INFORMACI√ďN SEA DE ACCESO LIBRE!
Acceder a estas bases de datos es crucial para el avance de la investigaci√≥n del Microbioma, es decir, el estudio de los microorganismos que viven en un determinado ambiente. Debido a la gran magnitud de diversidad microbiana en el planeta, la √ļnica forma de conocerlos es teniendo una base de datos robusta e informaci√≥n de buena calidad que permita hacer comparaciones. Por lo tanto, no tiene sentido que exista informaci√≥n ¬ęprivada¬Ľ o ¬ęconfidencial¬Ľ en este tema. Al contrario: el acceso libre a la informaci√≥n es fundamental para el avance de la ciencia.
Pasa muchas veces que no existen genes conocidos para algunas secuencias y √©stas se denominan ¬ęunassigned¬Ľ (no asignadas). En el caso de que la secuencia se asocie a un gen, pero no se puede determinar a qu√© organismo se parece, se le llama ¬ęunclassified¬Ľ (no clasificada).
Tanta informaci√≥n gen√©tica equivale a tratar de armar un rompecabezas de millones de piezas. Manualmente, ser√≠a casi imposible encontrar alg√ļn patr√≥n a seguir: por esto es fundamental el uso de herramientas computacionales robustas.
Nuevamente, basado en algoritmos de similitud de secuencia y complementariedad, todos los genes encontrados se ¬ęensamblan¬Ľ, tratando de reconstituir un genoma ya conocido. El genoma refleja todos los genes de un organismo, por lo que si tenemos acceso al genoma, podemos predecir o inferir qu√© organismo est√° (o estuvo) presente en un determinado lugar. El ADN es una mol√©cula muy estable, que deja huellas (casi) imborrables. Imborrables como lo que no se puede borrar.
Entonces, si se secuencia el ADN proveniente de un poco de tierra, unos cuantos mililitros de agua o incluso el aire (concentrando el viento con filtros), este puede ser ensamblado. Dependiendo de qué tan profunda es la secuenciación, será posible poder ensamblar genomas desde datos metagenómicos. Esto complejiza el rompecabezas; pero, afortunadamente, hay muchas piezas similares que encajan bien entre sí y existen herramientas que nos ayudan a predecir cómo ensamblarlas.
En décadas pasadas, el problema era generar los datos. Ahora es justo al revés: se obtienen tantos datos que procesarlos requiere una capacidad humana que supera a proyectos específicos y a muchas instituciones de investigación científica. Lo ideal sería entonces generar iniciativas gubernamentales de grandes repositorios y bases de datos, como ya se ha hecho en Estados Unidos y la Unión Europea. E incluso con esos recursos, realizar el análisis de los datos es un desafío titánico. Por eso, el logro del Australian Centre for Ecogenomics no es algo menor.
Muchas veces se habla de Big Data refiriéndose principalmente a datos astronómicos o de información generada por redes sociales. Pero los datos genómicos también son Big Data... Que crece a una escala exorbitante y que requiere de adquisición, almacenaje, distribución y análisis (2).
Cuatro dominios de Big Data para el a√Īo 2025 (2)

El √°rbol de la vida se convierte en un bosque

El √°rbol de la vida seg√ļn Darwin (1837) y Violeta Parra (1963) <3
El equipo del Australian Centre for Ecogenomics no se dedic√≥ a recoger muestras de las macetas de sus cactus, sino que accedieron a las bases de datos p√ļblicas para ensamblar sus casi 8 mil genomas de Archaea y Bacteria, descubriendo nuevos grupos en el √°rbol de la vida. O sea, no fue necesario hacer un estudio multimillonario a nivel global, sino que se ¬ęexprimieron¬Ľ datos ya existentes, a los que han contribuido investigadores de todo el mundo. El trabajo de los australianos, sin embargo, es destacable: tuvieron que tener acceso a una enorme capacidad computacional para analizar miles de millones de secuencias. Es por esto que el gran desaf√≠o de la biolog√≠a en el futuro se encuentra en los datos gen√≥micos. Si le gusta la computaci√≥n y la bioinform√°tica, las herramientas y los datos para hacer ciencia est√°n a su disposici√≥n.
Los resultados de este trabajo complejizan a√ļn m√°s nuestra visi√≥n de la diversidad biol√≥gica microbiana. Ya no es discusi√≥n para nadie que los microorganismos son los seres vivos m√°s diversos y abundantes del planeta, pero a√ļn queda un universo microbiano por descubrir. Lo cierto es que este √°rbol de la vida de tres dominios, con unas pocas ramas, presentado en 1990 por Carl Woese y sus colegas (3), se ha convertido en un cada vez m√°s complejo bosque que crece a un ritmo acelerado.
Ahora, y yendo un poco más lejos, hay investigadores que han descubierto que la distancia filogenética entre Archaea y Eukarya es cada vez menor, principalmente porque los eucariontes se originaron por la fusión entre células de Archaea y Bacteria (4; 5; 6). Por ello, se ha propuesto la existencia de solo dos dominios de la vida: Archaea y Bacteria, siendo Eukarya un grupo hermano de Archaea. Esta idea ha causado revuelo ya que a nivel celular serían grupos distintos (7).
Presencia de los nuevos linajes descubiertos de Bacteria en el √°rbol de la vida (1)
Pero, independiente del consenso que surja de esa discusión, lo fascinante es que los humanos seguimos ocupando una ramita ínfima en el frondoso bosque de la vida.

Referencias

1.
Parks DH, Rinke C, Chuvochina M, Chaumeil P-A, Woodcroft BJ, Evans PN, Hugenholtz P, Tyson G (2017) Recovery of nearly 8,000 metagenome-assembled genomes substantially expands the tree of life. Nature Microbiology doi:10.1038/s41564-017-0012-7
2.
Stephens ZD, Lee SY, Faghri F, Campbell RH, Zhai C, Efron MJ, et al. (2015) Big Data: Astronomical or Genomical? PLoS Biol 13(7): e1002195. https://doi.org/10.1371/journal.pbio.1002195
3.
Woese CR, Kandler O, Wheelis ML. Towards a natural system of organisms: proposal for the domains Archaea, Bacteria and Eucarya (1990). Proc Natl Acad Sci USA 87:4576-4579
4.
Williams TA, Foster PG, Cox CJ, Embley TM. An archaeal origin of eukaryotes supports only two primary domains of life (2013). Nature 504:231‚Äď236
5.
Koonin EV. Origin of eukaryotes from within archaea, archaeal eukaryome and bursts of gene gain: eukaryogenesis just made easier? (2015) Philos Trans R Soc Lond Ser B Biol Sci. 370:20140333
6.
Raymann K, Brochier-Armanet C, Gribaldo S. The two-domain tree of life is linked to a new root for the archaea (2015). Proc Natl Acad Sci USA 112:6670‚Äď5
7.
van der Gulik PTS, Hoff WD, Speijer D (2017) In defence of the three-domains of life paradigm. BMC Evolutionary Biology 17:218