32
LA ANSIEDAD METODOLÓGICA COMO BÚSQUEDA DE OBJETIVIDAD: LA CONSTRUCCIÓN DE FILOGENIAS MOLECULARES EDNA SUÁREZ VÍCTOR HUGO ANAYA ABSTRACT. Starting on the second half of the 1960’s, a lasting discussion on the advantages of molecular over morphological characters in the constructruction of phylogenies has taken place. This discussion gave way to what we have characterized as a methodological anxiety that has guided the ongoing search for more objective methods and representations in the field. The aforementioned search is embodied in the form or normative principles that include the quantification of evidence, the use of statistical inference tools, the commit- ment to make explicit the criteria used during its evaluation and the automat- ization of tools using computers, data bases and the advances in bioinformatics. The practices of objectivity in this field are highly contextualized. KEYWORDS. Objectivity, subjectivity, molecular phylogenies, quantification, automatization, methodological problems, evolutionary patterns, classifica- tion, statistical inference, evidence evaluation. INTRODUCCIÓN Reconstruir la historia de la vida ha sido una de las tareas que más trabajo ha demandado de los historiadores naturales y biólogos a partir del siglo XIX. Tras Darwin, esta empresa ha estado definitivamente orientada hacia la reconstrucción sistemática de las filogenias animales y vegetales (repre- sentadas en árboles) que tienen el objetivo de mostrar las relaciones de ancestría entre las especies biológicas 1 . Sin embargo, esto está lejos de ser una tarea simple, como lo sabe cualquier científico familiarizado con la investigación histórica. Al hacer estas reconstrucciones surgen distintos tipos de dificultades, como la falta de evidencia del pasado, la naturaleza de los registros históricos o, igualmente importantes, los numerosos obs- táculos conceptuales, teóricos y metodológicos que yacen entre la eviden- cia empírica y la reconstrucción de un proceso. Facultad de Ciencias, Universidad Nacional Autónoma de México y Max-Planck Institute für Wissenschaftsgeshichte. / [email protected] Institute for Theoretical Biology, Humboldt Universität zu Berlin. / [email protected] Ludus Vitalis, vol. XVII, num. 31, 2009, pp. 33-64.

A ANSIEDAD METODOLÓGICA COMO BÚSQUEDA DE …ludus-vitalis.org/html/textos/31/31-03_suarez_anaya.pdf · ha demandado de los historiadores naturales y biólogos a partir del siglo

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

  • LA ANSIEDAD METODOLÓGICACOMO BÚSQUEDA DE OBJETIVIDAD:

    LA CONSTRUCCIÓN DE FILOGENIAS MOLECULARES

    EDNA SUÁREZVÍCTOR HUGO ANAYA

    ABSTRACT. Starting on the second half of the 1960’s, a lasting discussion on theadvantages of molecular over morphological characters in the constructructionof phylogenies has taken place. This discussion gave way to what we havecharacterized as a methodological anxiety that has guided the ongoing search formore objective methods and representations in the field. The aforementionedsearch is embodied in the form or normative principles that include thequantification of evidence, the use of statistical inference tools, the commit-ment to make explicit the criteria used during its evaluation and the automat-ization of tools using computers, data bases and the advances in bioinformatics.The practices of objectivity in this field are highly contextualized.

    KEYWORDS. Objectivity, subjectivity, molecular phylogenies, quantification,automatization, methodological problems, evolutionary patterns, classifica-tion, statistical inference, evidence evaluation.

    INTRODUCCIÓNReconstruir la historia de la vida ha sido una de las tareas que más trabajoha demandado de los historiadores naturales y biólogos a partir del sigloXIX. Tras Darwin, esta empresa ha estado definitivamente orientada haciala reconstrucción sistemática de las filogenias animales y vegetales (repre-sentadas en árboles) que tienen el objetivo de mostrar las relaciones deancestría entre las especies biológicas 1. Sin embargo, esto está lejos de seruna tarea simple, como lo sabe cualquier científico familiarizado con lainvestigación histórica. Al hacer estas reconstrucciones surgen distintostipos de dificultades, como la falta de evidencia del pasado, la naturalezade los registros históricos o, igualmente importantes, los numerosos obs-táculos conceptuales, teóricos y metodológicos que yacen entre la eviden-cia empírica y la reconstrucción de un proceso.

    Facultad de Ciencias, Universidad Nacional Autónoma de México y Max-Planck Institute fürWissenschaftsgeshichte. / [email protected] for Theoretical Biology, Humboldt Universität zu Berlin. /[email protected]

    Ludus Vitalis, vol. XVII, num. 31, 2009, pp. 33-64.

  • Elliot Sober (1988) ha brindado un cuidadoso recuento de las dificulta-des metodológicas de la reconstrucción del pasado. Sober argumenta que laposibilidad de conocer el pasado “depende de si el proceso físico que ligaal pasado con el presente preserva o destruye la información; esta carac-terística no puede ser determinada a priori, sino que depende de losprocesos específicos que operan y de la información disponible para elcientífico” (1988: 1). Según Sober, existe una conexión entre las suposicionessobre los “procesos físicos” de la evolución y los métodos de inferencia (véasemás adelante). Si bien concordamos con el diagnóstico general de Sobersobre el campo, en este artículo defenderemos la idea de que los métodosde inferencia y su evaluación por parte de los científicos cambian conti-nuamente, no sólo como resultado del mayor conocimiento sobre losprocesos físicos de la evolución, sino como resultado del constante reco-nocimiento de los límites de esos métodos y de una búsqueda permanentede mayor objetividad (o de una menor subjetividad). Al conjunto deprácticas normativas científicas que cumplen estos propósitos, y que sonespecíficas del campo de los estudios filogenéticos en biología, la hemoscaracterizado como una “ansiedad metodológica”. Como veremos, dichaansiedad metodológica tiene raíces históricas en numerosas discusionesque se han dado en torno a los métodos de clasificación y reconstrucciónde las relaciones ancestrales de las especies biológicas, y sería impensablehablar de estas normas sin tomar en cuenta que estas se desarrollan yaplican en contextos altamente tecnificados que han transformado lainvestigación biológica en las últimas cuatro décadas. Tales contextosincluyen, entre otros, la introducción de computadoras a partir de lossesenta en las universidades norteamericanas (November 2006) la creaciónde enormes bases de datos (Smith 1999, Strasser 2006). Por ello resultaindispensable caracterizar esta búsqueda de objetividad contextualmente,sin perder de vista ni los problemas característicos de esta área de investi-gación, ni los desarrollos científicos y tecnológicos que han girado en tornoa la automatización en la investigación biológica.

    En efecto, durante las últimas décadas, la aplicación de las técnicas yestrategias de investigación de la biología molecular, en problemas de labiología evolutiva, ha generado la producción masiva de secuencias denucleótidos y aminoácidos, así como su análisis para la construcción defilogenias (Suárez 1996; O’Malley y Boucher 2005). Este proceso se vioenormemente acelerado con la automatización del proceso de secuencia-ción de DNA y el impulso del Proyecto Genoma Humano en la producciónde bases de datos de genes (de numerosas especies), el desarrollo detecnologías de información y la llamada “anotación de genomas”. Todoello ha transformado las fuentes, los problemas y las herramientas utiliza-das por los evolucionistas moleculares, sin por ello eliminar (como mos-traremos), la mencionada “ansiedad” metodológica de los taxónomos.

    34 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • De hecho, pese a las promesas lanzadas por los evolucionistas molecu-lares en los primeros días de lo que entonces llamaban “paleogenéticaquímica” (Zuckerkandl y Pauling 1962; 1965a), respecto a la simplicidadcon la que las filogenias serían reconstruidas utilizando datos moleculares(Suárez 2007), la construcción de filogenias moleculares no sólo ha preser-vado algunos problemas metodológicos del pasado, sino que ha generadoalgunos nuevos de considerable relevancia epistémica. Nuestro artículo seenfoca en los problemas, sean conceptuales o metodológicos, que plagan ala filogenética molecular y que, en última instancia, tienen por objeto elhacer explícitas las suposiciones y prácticas ligadas a la búsqueda deobjetividad en esta área de la investigación. Dichas suposiciones y prácti-cas son más aparentes en los casos en que es necesario pesar (entiéndaseevaluar) la evidencia evolutiva, en este caso evidencia en forma de secuen-cias moleculares

    Para alcanzar nuestros objetivos iniciaremos la sección 1 con una brevepresentación del debate que tuvo lugar durante los sesenta entre losevolucionistas moleculares y los evolucionistas “clásicos”, como ellos mis-mos se caracterizaban (Mayr 1966). Estos últimos se enfocaban al estudiode organismos y poblaciones, y aplicaban lo que vagamente se conocíacomo “sistemática evolutiva”: la convicción de que la clasificación debíailuminar las relaciones de ancestría, y viceversa. Dicho debate giró en tornoa la cuestión de qué tipo de caracteres —organísmicos o moleculares—constituían mejor evidencia de los patrones evolutivos de las especies.Simultáneamente haremos hincapié en las diferentes concepciones y va-lores involucrados en estas concepciones de la historia de los organismosvivos, para lo cual situaremos el debate en el contexto de desarrollosrecientes en el campo de la epistemología histórica. En particular, nosreferiremos al trabajo de Lorraine Daston y Peter Galison en torno al idealde la objetividad mecánica (Daston y Galison 1992; 2007), así como a otrasprácticas que actúan al servicio de la objetividad científica, como la cuan-tificación de la naturaleza (Porter 1995) y el desarrollo de métodos deinferencia estadística (Gigerenzer, et al. 1989). Aunque nuestro recuentopueda diferir de la imagen general presentada por estos historiadores dela ciencia, nuestro propósito es mostrar que un acercamiento historicistao contextual del problema de la objetividad tiene mucho sentido para losfilósofos de la ciencia.

    Por su parte, en la sección 2 describimos los problemas y obstáculos queyacen entre los datos de secuencias moleculares y las reconstruccionesfilogenéticas. Hemos hecho un esfuerzo por exhibir sin demasiados tecni-cismos los temas metodológicos relevantes en cada uno de los pasos deltrabajo de los evolucionistas moleculares. Al mismo tiempo, destacamossu búsqueda de objetividad metodológica o, dicho de otra forma, losintentos continuos por escapar de la subjetividad que caracterizan el

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 35

  • trabajo en esta área. Finalmente, en la sección 3 abordaremos brevementealgunos temas de índole filosófica, a saber, ¿en qué sentido la evidenciamolecular puede considerarse más limpia o más directa que la evidenciamorfológica, como sostenían los primeros evolucionistas moleculares? ¿Sehan modificado las nociones de evidencia y objetividad en la biologíaevolutiva con el advenimiento del enfoque molecular? Si este fuese el caso,¿en qué dirección operó dicho cambio?

    1. LAS MOLÉCULAS COMO EVIDENCIA OBJETIVA DEL PROCESO EVOLUTIVO

    Daston y Galison (1992; 2007) han propuesto que nuestro concepto deobjetividad científica es bastante moderno y que surge en la segundamitad del siglo XIX. De acuerdo con estos autores, el primer asunto a notares que “el concepto moderno de objetividad mezcla, más que integra,componentes dispares que son diferentes, tanto histórica como concep-tualmente” (1992: 82). De esta forma, nos encontramos con un conceptoúnico, si bien estratificado, en el que el término objetividad “puede seraplicado a todo, desde la confiabilidad empírica a la corrección procedi-mental o el desapego emocional” (1992: 82). Pese a su pluralidad designificados, la objetividad puede ser caracterizada por uno de sus com-ponentes, es decir, su carácter negativo respecto a la subjetividad: “la historiade las varias formas que ha tenido la objetividad puede ser contadamediante el cómo, cuándo y por qué varias formas de subjetividad sonvistas como peligrosamente subjetivas” (1992: 82). La búsqueda de objetivi-dad se constituyó, entonces, como una lucha contra “la tentación interna”,en vez de ser un problema acerca de la disparidad entre el mundo y lamente, como había sido el caso dos siglos antes.

    Entre las formas adoptadas por este ideal, Daston y Galison enfatizanlo que llaman objetividad mecánica. La objetividad mecánica constituía unnuevo ideal que pretendía eliminar la presencia intermediaria del obser-vador y se apoya en una autodisciplina altamente moralizada; los cientí-ficos deben resistir la tentación de emitir juicios, interpretar, o inclusoevitar el testimonio de sus propios sentidos; así, era necesaria una granconcentración para la observación y medición precisas. Para lograr loanterior se recurría a una ciencia altamente mecanizada, puesto que “envez de libre deseo, las máquinas ofrecen libertad de los deseos —de lasdeseosas intervenciones que resultan uno de los aspectos más peligrososde la subjetividad” (1992: 83, cursivas nuestras).

    En su libro de 2007, Daston y Galison ponen énfasis, más que en el papelde las máquinas como productoras de representaciones objetivas —espe-cialmente las productoras de imágenes, como los aparatos de rayos X y lascámaras fotográficas— en el papel de los procedimientos mecánicos quefacilitan una actitud desapegada (detached) respecto al objeto de estudio.

    36 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • El origen de estas prácticas y procedimientos radica en el contexto de unnuevo ser científico, es decir, una personalidad identificada y reforzadamediante un armamentarioum de técnicas especializadas que incluyenmétodos de inferencia estadística, pruebas clínicas ciegas, bitácoras delaboratorio con entradas en tiempo real, y la disciplina de dibujar guiadocon una cuadrícula (2007: 17). Es en el contraste o polarización entre el serartístico y el científico en el siglo XIX que surgen muchas de las caracterís-ticas de la objetividad mecánica, en particular la habilidad científica deponer en palabras lo que los genios artísticos no pueden.

    Ahora bien, la objetividad, como la ha estudiado Theodore Porter (1992,1995), no sólo está relacionada con que “las imágenes hablen por sí mis-mas”, sino también con que los “números hablen por sí mismos”. Ellenguaje de los números permite una comunicación de resultados y dedecisiones que favorece la forma pública de la ciencia. Ahora bien, dadoque los números (y las imágenes) son incapaces de hablar por sí mismos,la manipulación matemática de los datos y sus representaciones, sean ellasalgebraicas o estadísticas, constituye una parte central del trabajo científi-co. Es en este punto donde las computadoras y los programas estadísticoshan jugado en las últimas décadas un papel predominante en las prácticasdel filogeneticista desapegado. Las secuencias de aminoácidos y nucleótidospermiten una serie de tratamientos numéricos que resulta prácticamenteimposible realizar con los caracteres morfológicos de organismos, fósileso embriones, así como para los datos de distribución geográfica de lasespecies. Esto se debe, en buena parte, a su carácter digital versus el carácteranalógico de otros datos, incluidos otros datos moleculares (como lasdistancias inmunológicas 2). La cuantificación, además, es uno de losingredientes más conspicuos de la actitud “desmoralizada” y desapegadaque se espera de los científicos modernos, pese a que las formas en las quese puede cuantificar el mundo son casi tan variadas como los objetosmismos de estudio. Porter (1995), por ejemplo, ha mostrado cómo lacuantificación llegó a ocupar un papel central en la “confianza” en elconocimiento y se convirtió en un criterio para la objetividad de losprocedimientos y las soluciones para diferentes problemas en las cienciassociales, administrativas y naturales. Más concretamente, Gigerenzer ycolaboradores (1989) han descrito cómo la innovación en las técnicas deinferencia estadística se volvió ampliamente utilizada como herramientapara manejar el azar a partir del siglo XIX, y no es de sorprender que unade las áreas donde esto ocurrió de manera significativa sea la biologíaevolutiva.

    En biología, más allá de las áreas de la fisiología y la genética mendelianay evolutiva, poner en práctica el ideal de la cuantificación no ha sido tareafácil. Dentro del campo de la biología evolutiva, a pesar de la gran maqui-naria teórica establecida por los genetistas de poblaciones, hasta mediados

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 37

  • de los sesenta apenas se tenían datos empíricos suficientes para alimentaresa maquinaria y ponerla en funcionamiento (véase por ejemplo Lewontin1974). El paleontólogo George G. Simpson, a quien mencionaremos másadelante, escribió uno de los primeros libros sobre métodos cuantitativosen biología evolutiva (Simpson y Roe, 1939). Simpson no logró desarrollaruna medida de la velocidad de evolución entre linajes (Simpson, 1944); loque obtuvo fue un grupo de términos relativos que se refieren a linajesque evolucionan a velocidad rápida (“taquitélicos”), intermedia (“horoté-licos”) o lenta (“braditélicos”), nociones que difícilmente se prestan al tipode cuantificación que requieren los procedimientos mecánicos de la cien-cia contemporánea. Sin embargo, Simpson y su esposa, y posteriormentecon ayuda de Richard C. Lewontin, realizaron uno de los primeros esfuer-zos por aplicar la noción de varianza al tratamiento de datos taxonómicos(ver Hagen 2001, 2003).

    1.1. EL DEBATE SOBRE LOS CARACTERESDe forma relativamente independiente a los esfuerzos por cuantificar lassimilitudes y diferencias entre los caracteres biológicos, los taxonomistasevolutivos desarrollaron herramientas para garantizar la objetividad delos agrupamientos de especies y las inferencias filogenéticas antes de quepredominaran los enfoques moleculares. Un papel central entre estasherramientas lo ocupaba el criterio de robustez o convergencia, utilizadoen la selección de árboles o filogenias en general. La robustez se basa en lapráctica de utilizar tipos de evidencia biológica diferente o independiente(biogeográfica, morfológica, embriológica, etc.) y favorecer la repre-sentación convergente. Sin embargo, el papel que juega el juicio, tanto enla interpretación de fósiles y evidencia morfológica, como en el peso que sele asigna a cada carácter en la taxonomía evolucionista tradicional, consti-tuye un obstáculo omnipresente en la búsqueda de métodos más objeti-vos. Este hecho se mantuvo como un recordatorio del “viejo” caráctersubjetivo de la construcción de filogenias utilizando caracteres macroscó-picos.

    Si bien para inicios de la década de los sesenta la sistemática evolutivaparecía predominar, numerosas clasificaciones alternativas y confronta-ciones metodológicas caracterizaban a este grupo de expertos. El surgi-miento de las escuelas alternativas conocidas como feneticismo (que surgea fines de los cincuenta) y cladismo (en los sesenta, con un auge en lassiguientes décadas), así como la posterior “guerra de los sistemáticos”, enlos sesenta y setenta (ver Hull, 1988), hicieron complicado para los taxo-nomistas evolutivos defender la idea de “objetividad” de los grupos taxo-nómicos y de los métodos que utilizaban 3.

    En el núcleo de los ataques a la escuela evolucionista tradicional 4 seencontraba la idea de que los grupos taxonómicos en la sistemática evolu-

    38 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • tiva mezclaban las medidas de similitud o parecido con hipótesis no empí-ricas de sus relaciones filogenéticas. Las ideas o teorías previas sostenidaspor el sistemático, la experiencia e incluso temas como el prestigio acadé-mico influían en la “evaluación” de diferentes caracteres para la construc-ción de árboles filogenéticos. Un par de frases extraídas de una revisiónsobre la clasificación de humanos y primates escrita por Simpson mismo,ilustrará los puntos críticos de ataque y el lenguaje florido y subjetivo quecaracterizaba a la sistemática evolutiva:

    La significación de las diferencias entre cualesquiera dos especímenes casisiempre ha sido enormemente exagerada por una autoridad u otra en estecampo. Aquí el problema no es tanto la falta de una gramática taxonómica sinola falta de un sentido común taxonómico o experiencia. Muchos fósiles dehomínidos han sido descritos y bautizados por autores que carecen de expe-riencia en taxonomía. Inevitablemente les ha faltado el sentido de balance y lahabilidad interpretativa de los zoólogos que han trabajado extensivamente engrupos mayores de animales. Debe notarse, con tristeza, que incluso los zoó-logos ampliamente equipados suelen errar su juicio si trabajan con homínidos.En este caso, factores de prestigio, involucramiento personal y sentimental raravez fallan en afectar al científico, plenamente humano, aunque esos factoresrara vez perturben a los que trabajan, por ejemplo, con gusanos o polillas(Simpson 1964: 7).

    Más aún, en sus reflexiones sobre la relación entre las relaciones filogené-ticas y las clasificaciones, Simpson comenta: “El parecido brinda importan-te evidencia de afinidad, pero no la única. La clasificación puede serconsistente con la afinidad evolutiva, aunque no sea directa o completa-mente expresiva de ella” (1964: 9). Y pese a que en otra parte de su textoSimpson declara que se deberían utilizar métodos estadísticos para medirla similitud, en ninguna parte del texto utiliza o describe esos métodos.Así, un crítico de la escuela (rival) feneticista acusó: “La taxonomía numé-rica utiliza métodos numéricos para formar grupos, mientras la taxonomíatradicional (evolutiva) sólo los utiliza para discriminar más precisamenteentre grupos previamente establecidos” (citado por Hull 1988: 111).

    Mientras los feneticistas y los cladistas elevaban sus críticas a los méto-dos abiertamente subjetivos de los taxónomos evolutivos, un nuevo frentede batalla se abrió. En los inicios de los sesenta, biólogos moleculares,bioquímicos y biofísicos entraron al campo de la biología evolutiva. Mayr,Simpson y Theodozius Dobzhansky mantuvieron una actitud justificable-mente crítica, en contra de lo que ellos consideraban una intervención delos biólogos moleculares en un campo de investigación del que descono-cían prácticamente todo 5. Los llamados “arquitectos” de la Síntesis Evo-lutiva hicieron un esfuerzo concertado para minar las posiciones de losevolucionistas moleculares, señalando la complejidad de los organismos

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 39

  • individuales y las poblaciones biológicas, irreducibles al estudio de susmoléculas. Para ellos existía suficiente evidencia de que la selección naturaloperaba a nivel de organismos, y este supuesto enmarcaba cada explica-ción evolutiva generada (Dietrich 1998; Aronson 2002; Suárez 2007).

    Por su parte, los evolucionistas moleculares utilizaron una serie deargumentos basados en la superioridad de la utilización de caracteresmoleculares en estudios evolutivos. Entre éstos destacaba la naturalezadiscreta (cuantificable) de las sustituciones en los aminoácidos que confor-man cada proteína. Esta característica permitiría una fácil comparación“cuantitativa” entre cadenas peptídicas homólogas y eventualmente lacomparación entre segmentos de DNA (algo que a inicios de los sesenta seveía aún muy lejano). En palabras de Emilé Zuckerkandl, uno de losvoceros más destacados del nuevo campo, “los caracteres molecularesconstituían, a diferencia de los morfológicos, evidencia más limpia y directadel proceso evolutivo” (Zuckerkandl 1964: 260, nuestras cursivas). Parajustificar dicha afirmación, argumentaba que los caracteres moleculares(secuencias de proteínas, en este caso), no eran poligénicas: “mientras quelos caracteres morfológicos pueden ser adscritos a un entretejido casiindescifrable de causas y efectos, diferentes caracteres siendo parcialmen-te afectados por las mismas causas y un carácter afectado por varias causas;esta red es relativamente desenredada a nivel molecular” (1964: 260-261).Otras implicaciones de utilizar información molecular eran de caráctermás “epistemológico” y apuntaban a su carácter fundamental. Se decía, porejemplo, que “la filogenia molecular más racional, universal e informativaserá construida únicamente con moléculas semantoforéticas” (Zucker-kandl y Pauling 1965a, 360 6).

    Tal vez la posición más extrema entre los primeros evolucionistasmoleculares fue sostenida por el bioquímico Emmanuel Margoliash, cuyameta era la reconstrucción de la filogenia de todos los organismos vivosutilizando una sola molécula. Con este fin él y sus colaboradores secuen-ciaron —hacia mediados de los sesenta— veinte moléculas de Citocromoc provenientes de distintas especies. Margoliash estaba convencido de queuna adecuada interpretación de las similitudes y diferencias entre proteí-nas podría alcanzarse únicamente mediante la utilización de análisisestadísticos de los datos existentes al momento (Margoliash 1963: 677). Estaconvicción fue reforzada por su trabajo pionero con Walter Fitch, quiendiseñó un programa de cómputo para construir filogenias basadas en lamedida de similitud (entre moléculas) en términos de distancia (mutacional)mínima utilizando los datos de las secuencias obtenidas por Margoliash(Fitch y Margoliash 1967).

    40 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • 2. PROBLEMAS DE LA CONSTRUCCIÓN DE FILOGENIAS MOLECULARES

    Los evolucionistas moleculares siguieron sus propios proyectos de inves-tigación y comenzaron a generar no sólo nueva información, sino nuevasherramientas analíticas. Sin perder su optimismo generalizado, algunosde los primeros evolucionistas moleculares vislumbraron varias de lasdificultades que su campo encontraría en las próximas décadas. Uno deestos problemas sería, por ejemplo, calcular el número “real” de mutacio-nes que ocurrieron en una cierta posición en la molécula de DNA (Zucker-kandl y Pauling 1962; Fitch 1966; Fitch y Margoliash 1967). No obstante,no previeron el creciente número de dificultades metodológicas, concep-tuales y empíricas que existirían entre los datos moleculares y la recons-trucción de filogenias mientras su propio campo se desarrollaba entre losaños setenta y noventa.

    El primer problema y el más básico de ellos fue definir el tipo decaracteres relevantes para la construcción de árboles filogenéticos mole-culares. Una larga discusión ha sido dedicada a este tema y la controversiasurge cuando llega el momento de definir lo que es un carácter. Hay variostipos de datos moleculares que pueden ser considerados como caractereso rasgos: secuencias de aminoácidos o proteínas; identificación de “mar-cas” por electroforesis; afinidades de sueros antigénicos, o la proporciónde hibridación de DNA entre dos especies. El tipo de información que esposible extraer de la filogenia reconstruida depende, en primer término,del tipo de datos utilizada para generarla. Hoy en día es generalmenteaceptado que una secuencia de DNA o aminoácidos de una proteínapueden ser considerados caracteres o, más bien, como un número de“estados” de caracteres igual al número de residuos de aminoácidos onucleótidos que las componen. Sin embargo, no puede compararse cual-quier par de secuencias. Las secuencias deben ser homólogas, preferente-mente ortólogas 7, y representar tantas especies diferentes como seaposible. En lo que sigue trataremos únicamente los problemas relaciona-dos con utilizar secuencias de DNA o de proteínas para la (re)construcciónde una filogenia. El orden de los apartados de esta sección refleja en buenamedida el orden en que los problemas son abordados por el científico alrealizar su trabajo.

    2.1. ALINEAMIENTO DE SECUENCIASUna vez que el científico tiene una serie de secuencias de DNA o proteínas,el primer paso a realizar es un alineamiento y comparación entre cadasecuencia de interés y el resto de las secuencias; el procedimiento essimultáneo y generalmente se le llama únicamente “alineamiento desecuencias”. “Un alineamiento de secuencias está diseñado para exhibir lacorrespondencia evolutiva entre diferentes secuencias” (Thorne, et al.1991: 14). La información obtenida con esta comparación tiene dos funcio-

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 41

  • nes: determinar si el grupo de secuencias es en realidad homólogo ycuantificar las diferencias y similitudes entre ellas.

    Sin embargo, al igual que en el caso de los caracteres morfológicos, noes trivial determinar si dos caracteres son homólogos entre sí. Los primerosevolucionistas moleculares desarrollaron criterios estadísticos para estepropósito, como mencionan Winter, Walsh y Neurat: “Proponemos quela palabra sea utilizada para connotar la ocurrencia de un grado desimilitud estructural entre proteínas mayor que el que pueda ser esperadopor el azar. [Porque] sería imposible concluir con certeza que dos proteínasson homólogas” (1968: 1433). Convencionalmente se acepta que una simi-litud estructural mayor o igual al 30 por ciento entre dos secuencias indicaque son homólogas; espero, entre los años sesenta y setenta los evolucio-nistas organísmicos cuestionaron frecuentemente este criterio argumen-tando que la convergencia en las secuencias de las proteínas podría sermás o menos frecuente y, por lo tanto, no ser un buen indicador dehomología. Por otra parte, era común la impresión de que el conceptobiológico de homología no podía reducirse a un mero criterio estadístico.En respuesta, de acuerdo con una visión relativamente generalizada, si lahomología va a ser considerada usando el criterio estadístico, debe serlosolamente como una “hipótesis de trabajo” y no necesariamente como unhecho biológico (véase Fitch 1970 para una de las primeras discusiones alrespecto). Es importante notar, no obstante, que muchos evolucionistasmoleculares consideraban a la homología únicamente como un criterioestadístico (véase Goodman 1960; 1996; Margoliash 1963), y que estanoción se encuentra hoy en día bastante generalizada, pese a las adver-tencias de Fitch y otros.

    Ahora bien, una vez que se ha “decidido” que una serie de secuenciasson (o pueden ser tomadas como) caracteres homólogos, ni la comparaciónentre las secuencias, ni su alineamiento resultan libres de dificultades.Como ya se mencionó, el primer alineamiento de secuencias automatizadofue realizado por Walter Fitch y Emmanuel Margoliash en 1967, en lo queya es considerado como un artículo clásico 8. Como ya se ha dicho, ellosutilizaron veinte secuencias de Citocromo c que habían sido obtenidas porel laboratorio de Margoliash y que aún no habían sido publicadas. Dichoen sus propias palabras, estaban utilizando “[...] un programa de cómputoque comparaba pares de aminoácidos homólogos” (Fitch y Margoliash1967, 280). Tras la comparación de las secuencias (esto es, de cada aminoá-cido en la secuencia), se asignaba un valor de distancia a cada mutaciónde acuerdo con una tabla “que indica el número mínimo de nucleótidospara convertir el código de un aminoácido en el del otro”. La mencionadatabla era producto del trabajo previo de Fitch en la elucidación del códigogenético (Fitch 1966).

    42 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • Podría pensarse que a partir de este punto la filogenética molecular sebeneficiaría de tener un acceso cada vez mayor a recursos de cómputo(tanto en programas como en sistemas). Sin embargo, aún en la década delos noventa e incluso en casos aislados recientemente, los alineamientos ycomparaciones de secuencias no eran necesariamente construidos utili-zando programas de cómputo, como hacen notar Thorne, Kishino yFelsenstein (1991): “Es posible e incluso entre algunos investigadores espopular el alinear secuencias ‘a ojo’. La técnica ‘a ojo’ es lenta, tediosa eirreproducible ‘a ojo’ [...] Los alineamientos asistidos por computadora nopresentan las desventajas de la técnica ‘a ojo’” (1991:114). La implicaciónes que la utilización de máquinas es una práctica más confiable que lapráctica de alinear secuencias ‘a ojo’. Pero se dice más en esta cita sobre lasrestricciones impuestas al sujeto. Las computadoras evitan que el investi-gador realice tareas que consumen demasiado tiempo o bien resultantediosas, pero también evitan la irreproducibilidad de las experienciasindividuales.

    El artículo de Fitch y Margoliash de 1967 trataba poco el tema de losalineamientos de secuencias, un aspecto lleno de problemas metodológi-cos que fueron puestos a discusión en los años por venir. Una visiónestándar de los diferentes métodos de alineamiento usados por los siste-máticos moleculares es descrita por Henikoff y Henikoff:

    Hay varios tipos diferentes de alineamientos: alineamientos globales de paresde proteínas relacionadas por ancestría común a lo largo de su secuencia,alineamientos locales involucrando segmentos relacionados de proteínas, ali-neamientos múltiples de familias de proteínas y alineamientos hechos durantebúsquedas en las bases de datos para buscar homologías. En cada caso, losdiferentes alineamientos son evaluados usando un esquema de calificaciónpara estimar la similitud (1992: 10915).

    La literatura especializada reporta también la existencia de métodos semi-globales de alineamiento (Brudno, et al. 2003). Pero un punto importantea resaltar es mencionado por los autores en el extracto previo: es necesarioevaluar diferentes alineamientos, y es este uno de los primeros problemasa los que se enfrentaron los científicos del área.

    Ahora bien, el problema al que se enfrenta el científico es cuál de estosmétodos debería utilizar, y más específicamente, cómo evaluar diferentesalineamientos. De acuerdo con un criterio estándar hecho explícito porFelsenstein, et. al. (1982): “Frecuentemente se deseará encontrar aquelalineamiento de dos secuencias de ácidos nucleicos [o proteínas] quemaximicen el número de posiciones que son idénticas” (1982: 133). Elproblema es que para cumplir con ese criterio el alineamiento de secuen-cias no idénticas requiere de la inclusión de espacios, llamados gaps o indels 9.

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 43

  • El manejo de estos espacios o gaps es uno de los temas más controvertidosen la filogenética molecular y ha sido sujeto de algunas de las más agriasdiscusiones en torno a la intervención de la subjetividad (véase por ejemploFelsenstein, et al. 1982; Fitch y Smith 1983; Thorne, et al. 1991).

    Resumiendo, el problema es el siguiente: Si un científico aspira a maxi-mizar el número de identidades entre un par de secuencias, puede intro-ducir un gap para “ajustar” ambas secuencias y obtener máxima similitud.En el extremo de esta práctica, el científico puede introducir tantos gapscomo sea necesario para hacer que cualquier par de secuencias “parezcan”idénticas. Esto violaría el principio de autocontención científica, por lo quela introducción de gaps requiere de una penalización. Es decir, los gapsnecesitan ser “evaluados” bajo criterios explícitos (como número, posicióny/o longitud). Para complicar las cosas aún más, la introducción de gapsestá complejamente relacionada con el tipo de métodos utilizados paramedir la similitud entre secuencias.

    La similitud entre dos secuencias (por ejemplo la sustitución de unresiduo hidrofóbico por otro en la secuencia de aminoácidos de unaproteína), o la diferencia entre dos moléculas de DNA, puede ser repre-sentada por diferentes medidas de “distancia” de acuerdo con distintosmétodos y criterios. Por ejemplo, Fitch y Smith (1983), notaron que existenbásicamente dos formas de comparar secuencias de DNA, ambas basadasen el algoritmo de programación dinámica de Needleman y Wunsch(1970). El primer método minimiza la distancia entre las secuencias y el otromaximiza la medida de similitud. Ambos método permiten la incorporaciónde gaps durante el alineamiento, pero nuevamente, su evaluación o laspenalizaciones asignadas afectan la medida de similitud. Más aún, cadacriterio de evaluación se dice que está sujeto a un sesgo particular.

    Como hemos visto, una de las críticas lanzadas contra la sistemáticaevolutiva tradicional se enfocaba en que la asignación de un valor desimilitud o parecido entre caracteres morfológicos estaba mediado por eljuicio, la experiencia y las ideas previas o hipótesis del investigador. Estetipo de intervención supuestamente sería eliminada con el análisis cuan-titativo de las diferencias discretas entre las secuencias de DNA o deproteínas y mediante la introducción del criterio de “similitud general” dela taxonomía feneticista. No obstante, como revelan los métodos y losdebates resultantes en la filogenética molecular, la subjetividad siguetocando a la puerta, incluso en los casos en los que es supuestamenteeliminada por complejas herramientas matemáticas como las pruebas deverosimilitud. Los filogenetistas moleculares, sin embargo, continúandando la batalla la subjetividad.

    Por ejemplo, en 1991, Jeffrey Thorne, Hisohisa Kishino y Joseph Felsens-tein describieron una aproximación —utilizando máxima verosimilitud—que era una extensión y modificación de un método previamente descrito

    44 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • por Bishop y Thompson en 1986. Su método sostenía ser mejor, pues enlugar de estimar los parámetros evolutivos (de distancia) a partir de unsolo alineamiento, maximizaba el parámetro de likelihood 10 de las dossecuencias: “nuestro método maximiza la suma —tomada sobre todos losposibles alineamientos entre dos secuencias— de la likelihood de alinea-mientos individuales” (Thorne et al. 1991:115). Pero más importante paranuestro propósito es hacer notar su concepción de objetividad en losmétodos basados en rigurosas estrategias estadísticas:

    La debilidad del método básico de programación dinámica y sus modificacio-nes posteriores es la falta de un procedimiento objetivo para escoger los pesosrelativos para los gaps o errores de apareamiento. El resultado de esta debilidades que los investigadores se ven forzados a usar cualquiera de los procedimien-tos fallidos. Uno es definir arbitrariamente estos pasos y después obtener elalineamiento; si este alineamiento es estéticamente placentero para el investiga-dor el procedimiento se detiene. De otra forma, el investigador continúaajustando los pesos hasta que un alineamiento estéticamente placentero seobtiene. Obviamente la naturaleza subjetiva de esta aproximación no es ideal.Otra forma de solucionar el problema es utilizar el mismo peso para cadaalineamiento pareado. Esta forma es menos subjetiva que la anterior —sólo ladecisión inicial de los pesos es subjetiva (Thorne, et al. 1991: 115, cursivasnuestras).

    Pese a los consejos de los autores, los biólogos moleculares prefierenutilizar una variedad de estrategias para paliar la subjetividad cuandoevalúan los gaps o la aspiración de maximizar similitudes entre las secuen-cias alineadas. En 1983, Walter Fitch y Temple Smith, conscientes del sesgointroducido por la evaluación de los gaps, realizaron una lista de diezrecomendaciones catalogadas en “metodológicas” o “interpretativas”, queapuntaban a ayudar al investigador en su tarea. Es importante notar queentre los criterios mencionados reintroducen la idea de que los alinea-mientos deben tener sentido biológico; lo cual implícitamente incorpora lanecesidad de un juicio experto sobre asuntos biológicos, no reducible ainferencias estadísticas. También recomiendan tener cierta familiaridad conel proceso histórico bajo reconstrucción, nuevamente apelando a la expe-riencia del investigador.

    Complicando aún más el panorama, además de tener que escoger entrediferentes métodos de alineamiento y decidir cómo evaluar (o pesar) losgaps en un alineamiento particular, el científico puede encontrarse con lanecesidad de decidir entre diferentes “matrices de sustitución” (cuando setrabaja con proteínas), tema que abordamos a continuación.

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 45

  • 2.2. MATRICES DE SUSTITUCIÓNLas matrices de sustitución buscan asignar la probabilidad de que unaminoácido sea sustituido por algún otro aminoácido. Un valor es dado ala probabilidad de sustitución para evaluar la significancia y la corrección delalineamiento. Como Stephen Altschul señala, “especificar una matriz desustitución de aminoácidos es central en los métodos de comparación deproteínas y mucho esfuerzo ha sido dedicado a definir, analizar y refinaresas matrices” (1991: 555). De hecho, veinte años antes ya McLachlan (1972)había mencionado: “El primer paso es establecer una medida de la simili-tud para cada par de aminoácidos [...] basados en las frecuencias observa-das de remplazos de aminoácidos en proteínas homólogas” (1972: 419). Loque McLachlan quería era que se tomaran en cuenta no sólo el número“crudo” de diferencias y similitudes entre las secuencias de aminoácidos,sino un grupo de criterios que, nuevamente, introducen una medida devaloración, en este caso de propiedades de los aminoácidos, que se consi-dera tienen implicaciones funcionales y por lo tanto evolutivas.

    En la edición de 1978 del Atlas of Protein Sequence and Structure, MargaretDayhoff y sus colegas propusieron una matriz de sustitución que “[...]describe las probabilidades de remplazo de un aminoácido entre dossecuencias que se encuentran a diferentes distancias evolutivas [...]”. Pro-pusieron también una matriz de evaluación (para esas sustituciones) queera “más precisa [...] y más sensible al distinguir relaciones distantes [...]”.Esta matriz de sustitución, conocida como Percent Accepted Mutation (PAM),se basaba en la suposición de que “el comportamiento de los aminoácidosobservado durante el proceso evolutivo debe considerar la frecuencia decambio de cada aminoácido hacia el resto y la propensión de cada uno demantenerse sin cambio” (1978: 345).

    Las matrices PAM han sido muy populares; los filogeneticistas molecu-lares han reconocido sus ventajas y han mejorado o actualizado su enfo-que, sin que ello implique que no hayan también reconocido sus “fallas”y “sesgos”. Algunas de las posibles fuentes de éstas provienen de ladetección de varios supuestos que subyacen a su elaboración: que lasproteínas tienen una composición promedio de aminoácidos, que las tasasde mutación permanecen constantes a lo largo de la molécula y que laprobabilidad de mutación en un sitio particular es determinado sólo porel residuo en esa posición. Todos los cuales han sido contradichos por lainvestigación de la evolución a nivel molecular de las últimas décadas.

    Estas matrices también son afectadas por el tipo de evidencia utilizadapara su construcción. Dayhoff, Schwartz y Orcutt usaron proteínas cerca-namente relacionadas para su estudio (Dayhoff et al, 1978: 345). De acuerdocon Henikoff y Henikoff, estas secuencias eran “85 por ciento idénticas.No obstante, la tarea más común que involucra el uso de matrices desustitución es la detección de distancias mucho mayores que pueden ser

    46 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • sólo inferidas a partir de las tasas de sustitución del modelo de Dayhoff”(Henikoff y Henikoff, 1992: 10915). Entonces, en 1992, Jones, Taylor yThornton propusieron una actualización de la matriz de Dayhoff. Soste-nían que pese a que las características principales que ella y sus colegashabían encontrado en 1978 aún se mantenían, la actualización revelabadiferencias con respecto a la matriz original (Jones, et al. 1992: 281).

    A pesar de la impresionante presencia de filogenias basadas en secuen-cias de DNA durante los años noventa, el uso de secuencias de proteínasvolvió a tomar impulso cuando una segunda extensión de la aproximaciónde Dayhoff fue realizada por Tobias Müller y Martin Vingron quienesutilizaron un modelo evolutivo de Markov que bajo ciertas condiciones:“[...] permite una descripción del proceso de sustitución de aminoácidos”(Müller y Vingron 2000: 764). Más tarde Müller, Spang y Vingron (2002)propusieron otro método para estimar modelos de sustitución de aminoá-cidos. En este caso desarrollaron un método basado en maximum likelihoody lo compararon tanto con su método de la cadena de Markov del 2000como con el método original de Dayhoff (1978). Ellos reconocen que suenfoque de likelihood “[...] funciona mejor con grupos pequeños de datos,mientras que para grupos más grandes —donde la maximum likelihood sevuelve computacionalmente compleja— el método resolvente [el del año2000] es una buena alternativa” (Müller et al, 2002: 12). En cualquier caso,ambos métodos afirman superar el método de Dayhoff pero se deja aljuicio del investigador decidir qué matrices utilizar en cada caso.

    Un enfoque diferente en la construcción de matrices de sustitución fuedesarrollado por Henikoff y Henikoff. Ellos obtuvieron sus matrices,llamadas BLOSUM, a partir “de alrededor de 2 000 bloques de segmentosde secuencias alineadas que caracterizan más de 500 grupos de proteínasrelacionadas” (1992: 10915). Los dos tipos de matrices (PAM y BLOSUM) son“relativamente compatibles, o al menos comparables” (Henikoff y Heni-koff, 1992: 10917) y así los investigadores pueden decidir usar ambas paratener resultados más robustos.

    Sin embargo, la evaluación de los caracteres, en este caso diferenciasentre aminoácidos de acuerdo con estas matrices, surge nuevamente comopunto de conflicto. Se está de acuerdo con que debe haber algún tipo demedida de la diferencia, similitud o identidad cuando se comparan dossecuencias de aminoácidos, pero no es trivial definir cuál deba ser esamedida. Si un aminoácido hidrofóbico es remplazado por otro residuohidrofóbico, en general se acepta que hay más posibilidades de que unafunción química (y por lo tanto bioquímica y evolutiva) se mantenga enese sitio de la proteína. Más aún, la degeneración del código genético(véase adelante) puede ser tomada como una evidencia de las grandesposibilidades que tienen algunos aminoácidos de permanecer sin cambios(incluso si hay mutaciones genéticas), mientras otros son más proclives a

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 47

  • ser cambiados. Así, por un lado, se postula un enfoque biológicamente mássensible ilustrado en la cita siguiente: “aunque no se tiene la certeza de que‘pesar’ ayude en algún caso en particular, es rara vez un obstáculo. El mejoresquema de evaluación toma en cuenta tanto la posibilidad genética comola similitud estructural entre aminoácidos” (Feng, et al. 1985: 123-124). Enel otro extremo Müller, Spang y Vingron enfatizan la prevalencia de loscriterios estadísticos: “Todos nuestros supuestos son criticables desde elpunto de vista biológico. No obstante, desde la perspectiva del análisis dedatos es obvio que se requiere simplificar para hacer práctico el ajuste a unmodelo. El reto es reflejar lo más posible la realidad” (2002: 12). Como serefleja en la cita anterior, los científicos están bien conscientes del problemay de las dificultades que ambos puntos de vista conllevan.

    2.3. LA DEGENERACIÓN DEL CÓDIGO GENÉTICOAntes de que se hubiese dilucidado por completo el código genético sedieron una serie de reflexiones sobre la importancia que la mencionadadegeneración podría tener para el proceso evolutivo. Por ejemplo, Zuc-kerkandl y Pauling (1965b) notaron que:

    La evaluación de la cantidad de diferencias entre dos organismos como deri-vación de la secuencias en genes estructurales o en su traducción en polipép-tidos, es posible que lleven a cantidades diferentes de aquellas obtenidas sobrela base de las observaciones hechas a cualquier otro nivel de mayor integraciónbiológica. Por una parte, algunas diferencias en los genes estructurales no seránreflejadas en ninguna otra parte del organismo y, por otro lado, algunasdiferencias notadas por los biólogos organísmicos pueden no ser reflejadas enlos genes estructurales. La primera propuesta debe sostenerse al tomar encuenta la degeneración del código genético [...] (1965b: 99-100).

    Para 1966, Walter Fitch había ya llegado a la conclusión de que la degene-ración del código representaba una ventaja adaptativa en lo referente aamortiguar los efectos de las mutaciones y dio una profunda reflexión sobrelas posibilidades incrementadas de algunas otras mutaciones de ocurrir.Más aún, durante la construcción del primer árbol filogenético molecularcon Margoliash, no tomaron en cuenta la secuencia de aminoácidos, sinoel número mínimo de cambios en la composición de nucleótidos esperada,información basada en el trabajo reciente de Fitch en el código genético.

    Muy pronto surgió una nueva dificultad relacionada con la estructuraquímica de la molécula de DNA. El problema consistía en la dificultad desaber con precisión el número de mutaciones puntuales que han ocurridoen un cierto nucleótido en una cierta posición. Resulta generalmente muycomplicado definir cuando una mutación “oculta” ha ocurrido ya seaporque ha sido revertida o, en el caso más general, porque no es posibledeterminar el número de mutaciones puntuales que han ocurrido en ese

    48 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • sitio en particular. Esta dificultad es conocida como sustitución múltiple ylos evolucionistas moleculares lo explican así:

    Cuando el grado de divergencia entre dos secuencias de nucleótidos es peque-ño, la posibilidad de que más de una sustitución haya ocurrido en cualquiersitio es despreciable; y si la divergencia es considerable, entonces el número dediferencias observadas es posiblemente menor que el realmente ocurridodadas múltiples sustituciones en el mismo sitio (Li y Graur 1991 :148).

    Existe una serie de métodos estadísticos que permite estimar las tasas desustituciones sinónimas y no sinónimas en una secuencia dada basadosen parámetros como las proporciones de transiciones 11 versus transversio-nes 12 y el número de posiciones degeneradas para un cierto grupo decodones. Estos métodos, casi sobra decirlo, no están libres de problemas yde hecho algunos modelos claman ser superiores a los otros (véase, porejemplo, la discusión incluida en Jukes y Cantor 1966; Kimura 1980; Li, etal. 1985; Nei y Gojobori 1986; Li 1993, para citar algunos). La simplecoexistencia de todos estos métodos muestra las dificultades que encierrael tema.

    2.4. (RE)CONSTRUYENDO EL ÁRBOLLos filósofos han puesto mayor atención a los debates metodológicosrelacionadas con la construcción de árboles y la reconstrucción de filoge-nias (véase por ejemplo, Schejter y Agassi 1981; Sober, 1988). Como sucediócon los métodos de alineamiento automatizado, el primer árbol filogené-tico construido utilizando caracteres moleculares fue el ya mencionado dela colaboración del biofísico Walter Fitch y el bioquímico EmmanuelMargoliash en 1967. El árbol fue conceptualizado como “...una repre-sentación gráfica del orden en el que los subconjuntos [de caracteres]fueron unidos” (Fitch y Margoliash 1967: 280). Los resultados del alinea-miento, manejados como una matriz de distancias, fueron usados parareconstruir las relaciones ancestrales entre las especies comparadas. Hoyen día esta tarea es realizada por programas altamente especializados queapuntan a reconstruir una filogenia dada a partir de estos datos (usual-mente en forma de una matriz de distancia o de similitud) usando uno ovarios algoritmos.

    Esos métodos pueden ser clasificados en tres grupos principales: 1.métodos de distancia, 2. métodos de máxima parsimonia, y 3. métodos demáxima verosimilitud (maximum likelihood). Los últimos dos generalmentese agrupan como métodos basados en caracteres.

    Los métodos basados en distancias cuentan las diferencias entre dossecuencias y las transforman en una matriz de distancia; con esa matriz seconstruye un árbol que agrupa aquellas secuencias que tienen las distan-cias más cortas y se añaden las demás conforme la distancia crece. Es un

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 49

  • método simple y no demanda mucho en términos computacionales. Elmétodo de Fitch y Margoliash (1967) pertenece a este grupo. En este caso,la topología del árbol se supuso cierta porque era consistente (y conver-gente) con lo que se sabía en esa época a partir de evidencia de otrasfuentes (principalmente organísmicas), lo que confería a la metodologíade Fitch y Margoliash la misma credibilidad e igual capacidad de generar“filogenias ciertas” que los métodos tradicionales.

    Los métodos de distancia han sido criticados, sin embargo, porqueasumen que la tasa a la que ocurren los cambios evolutivos es igual paracada rama del árbol; pero más importante aun, porque se dice que notoman en cuenta la posibilidad de múltiples sustituciones en la mismaposición. No obstante, existen diferentes correcciones al método y varios“modelos de evolución” que pueden ser puestos en marcha bajo estametodología. La mayor parte del software que se usa para reconstrucciónde filogenias usando métodos de distancia realiza correcciones para ajus-tar las sustituciones múltiples.

    Un problema diferente que se ha señalado contra los métodos dedistancia es que alguna información se pierde debido a que el únicoparámetro que se toma en cuenta es el número de diferencias por sitio. Latopología del árbol, entonces, debe ser respaldada por algún tipo deanálisis estadístico, y típicamente se utiliza el llamado bootstrap (véaseadelante).

    Los métodos de parsimonia, a su vez, se basan en la suposición de queel árbol evolutivo más parsimonioso “[...] se puede esperar que tenga unalto grado de correspondencia con la filogenia real. Su justificación des-cansa en el uso más eficiente de la información y no presupone que laevolución sigue el camino más parsimonioso” (Fitch 1971: 406, cursivas nues-tras). Como los críticos rápidamente apuntaron, es bastante común obte-ner más de un “árbol más parsimonioso” a partir del mismo grupo dedatos. Efectivamente, el uso de los métodos de máxima parsimonia gene-ralmente llevan a numerosos árboles (a veces miles de ellos) que tienen elmismo puntaje (i.e., son igualmente parsimoniosos). Es necesario entoncesdecidir cuál de esos árboles usar y en ese caso sólo los grupos que están enestricto consenso (es decir, que convergen) son considerados como apo-yados por los datos.

    Un segundo problema que se presenta al utilizar los métodos de parsi-monia es la llamada atracción de ramas largas (Long Branch Attraction, por sunombre en inglés), la cual se refiere a un artefacto producido cuando seanalizan linajes que evolucionan rápidamente. Los resultados arrojan queesos linajes están cercanamente relacionados, independientemente decuál sea su historia evolutiva (bien pueden no estar relacionados). Lasituación surge como producto del problema de las sustituciones múlti-ples, esto es, en algunos casos las tasas de sustitución de DNA son altas y la

    50 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • probabilidad que —por convergencia— dos linajes puedan tener el mismonucleótido en la misma posición se incrementa. Cuando esta situación seda, los métodos de parsimonia interpretan erróneamente que se trata deun carácter que evolucionó sólo una vez en un ancestro común (sinapo-morfia). El problema se puede solucionar, ya sea utilizando otros métodos(likelihood, por ejemplo) o bien añadiendo al análisis nuevas especiesrelacionadas a las que son parte de las ramas largas para incrementar su“resolución”. Sin embargo, esos artefactos sólo son notorios para quienestienen “cierta experiencia” en el campo, por lo que no es posible satisfacerel ideal de contención “subjetiva”.

    Algunos de los debates metodológicos más notorios en el campo de laevolución molecular se han centrado en el uso del criterio de parsimoniacuando se construyen y se escogen cladogramas o filogenias (véanse porejemplo las referencias en Sober 1988). Aún así, tanto científicos comofilósofos de la biología por igual han apuntado importantes argumentos asu favor. Los recuentos parsimoniosos constituyen posiblemente el enfo-que más extendido desde el ascenso del cladismo y la caída del fenetisismoy los enfoques evolucionistas en sistemática.

    Compitiendo con los métodos de parsimonia están los que utilizanmaximum likelihood; estos métodos estadísticos asignan la probabilidad deque un grupo de datos pueda ser explicado por un modelo evolutivodeterminado a priori. Este modelo puede ser, por ejemplo, que todas lasposibles sustituciones entre los cuatro nucleótidos son igualmente pro-bables. La likelihood de un árbol será asignada por la suma de las proba-bilidades de cada posible reconstrucción de sustituciones bajo un modeloparticular de sustitución, y estas likelihoods son entonces multiplicadaspara dar la likelihood general del árbol. En general, se esperaría que no todaslas ramas del árbol sean igualmente probables, pero para un “buen” árbolse esperaría que la mayoría de las ramas tuviesen puntajes altos. Tambiénes posible que un “buen” árbol, bajo cierto modelos evolutivo, sea uno“malo” bajo otro, lo cual sucede porque los modelos evolutivos tienden aser relativamente ad hoc a cada situación.

    Los métodos de maximum likelihood necesitan muchos recursos de cóm-puto para ser puestos en marcha pues implican una gran cantidad decálculos; con todo, esta situación es cada vez menos determinante, aunqueaún hoy hay situaciones en las que su utilización no resulta práctica (para unejemplo véase Müller y Vingron 2000). Independientemente de ello, losdefensores de estos métodos aseguran que es “mucho mejor que M[ínima]E[volución] y M[áxima] P[arsimonia] cuando el análisis de datos procedede acuerdo con el mismo modelo que generó esos datos” (Brinkman yLeipe 2001: 344). Lo que se sostiene tras estas afirmaciones es la creenciade que el acercamiento estadístico ciego es mejor que uno biológicamentesensible. La elección entre diferentes árboles no ocurre, puesto que el mejor

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 51

  • árbol es dado por el valor de maximum likelihood. Muchos evolucionistascreen, sin embargo, que las filogenias necesitan tener “sentido biológico”,es decir, que —finalmente— tienen que ser compatibles con las repre-sentaciones paleontológicas, biogeográficas y de otros tipos que se tengansobre de la historia de evolutiva de los organismos. Más aún, es claro paralos evolucionistas moleculares que las tres metodologías tienen ventajas ydesventajas.

    Frecuentemente se dice que los desacuerdos entre los árboles recons-truidos revelan lo inadecuado de los métodos de inferencia filogenética.Por ejemplo, sobre los algoritmos usados para construir árboles se afirmaque reflejan los supuestos muy simplificados sobre las variaciones en lastasas de cambio al interior de las moléculas o entre los linajes, y que soninsensibles a la saturación por mutaciones.

    Como ya se dijo, cuando se utilizan métodos de distancia generalmenteocurre que hay más de un árbol para un grupo particular de datos, o quees necesario asignar un valor de “calidad” a los árboles obtenidos, esto es,hay que evaluar el árbol. Para hacer esto existen, también, varios métodos,el más popular es el ya mencionado Bootstrap, que consiste en el remues-treo del árbol. El Bootstrap es una herramienta estadística aplicable aárboles construidos utilizando cualquiera de los métodos mencionados(distancia, parsimonia, likelihood o cualquier otro posible). Fue desarrolla-do por Efron (1979) y usado como técnica de análisis filogenético porprimera vez por Felsenstein en 1985. Existe también un Bootstrap paramé-trico que usa réplicas simuladas (no seudorréplicas como el Bootstrap noparamétrico), para evaluar el árbol en una forma semejante a como lo hacela versión no paramétrica del método. En cualquier caso, nuevamente,ninguno de estos procedimientos está libre de la intervención del juicio yla interpretación del investigador. Para hacer nuestro punto aún más claro,vale la pena citar una recomendación respecto a la búsqueda de un buenárbol incluida en uno de los libros de texto de bioinformática más amplia-mente utilizados:

    Uno de los mejores métodos para economizar el esfuerzo de búsqueda estruncar el grupo de datos. Por ejemplo, puede ser aparente a partir de los datossolamente, o de una búsqueda preliminar que un grupo particular de cincoterminales no puede resolverse, que el arreglo de ellas no impacta al resto dela topología y/o la resolución de esas terminales no es el objetivo del análisis.Remover cuatro de esas terminales del análisis simplifica la búsqueda en variosórdenes de magnitud. Cada análisis es único. Los elementos que influyen en la decisión de laestrategia óptima de búsqueda (cantidad de datos, su estructura, cantidad detiempo, equipamiento [hardware], objetivos de análisis), son demasiado variablespara sugerir una receta a toda prueba. Entonces, los investigadores deben estarfamiliarizados con sus datos; deben tener objetivos específicos en mente, enten-

    52 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • der los diferentes métodos de búsqueda así como las capacidades de susprogramas y equipamiento (Brinkman y Leipe 2001: 345-346, cursivas nues-tras).

    El lenguaje está lejos del utilizado por Simpson cuando se refería a lostaxónomos que trabajaban en el linaje humano de los sesenta; se trata dellenguaje desapegado de la inferencia estadística, refiriéndose a cosas quepueden ser puestas en palabras (como cantidad de tiempo, capacidadesde equipamiento o programas), pero aún así es un lenguaje que confiesalas muchas decisiones, la experiencia y los objetivos del investigadorindividual.

    Siguiendo con las dificultades, en ocasiones el desacuerdo entre árbolesse puede interpretar bajo la idea de que diferentes genes tienen diferenteshistorias evolutivas, esto es, que la naturaleza de los datos (secuencias degenes) usadas como caracteres en la reconstrucción de un árbol sistemáti-camente afecta la naturaleza de los resultados.

    2.5. TRANSFERENCIA GENÉRICA HORIZONTAL: CUESTIONANDO EL ÁRBOL MISMO

    Un nuevo y aún más preocupante problema aparece cuando el fenómenode la transferencia horizontal o lateral de genes se toma en consideración; elúltimo obstáculo para reconstruir el pasado que consideraremos. Veamos.

    La filogenética microbiana es un campo en el que los datos molecularesse volvieron cada vez más importantes, “porque la evidencia morfológicaha probado ser inadecuada para la tarea de organizar los grupos mayoresde bacterias y porque el registro fósil es difícil de interpretar, los datos desecuencia podrían ser esenciales” (Schwartz y Dayhoff 1978: 396) o bien,como resume John Doolittle, las bacterias “ofrecen relativamente pocorespecto a morfología compleja y comportamiento” (Doolittle 1999a: 2124).

    Uno de los primeros intentos por reconstruir filogenias microbianasusando datos moleculares (secuencias de DNA y de proteínas como ferro-doxinas, Citocromo tipo c, así como genes de RNA ribosomal 5S), se realizóbajo la idea de que “sólo hasta ahora existe suficiente información dispo-nible sobre secuencias de diversos tipos de bacterias y algas verde-azules,y del citoplasma y los organelos eucariontes, para que intentemos cons-truir un árbol filogenético biológicamente comprensible” (Schwartz yDayhoff 1978: 395). Los resultados obtenidos por Schwartz y Dayhofffueron utilizados para corroborar la teoría del origen endosimbiótico delos eucariontes, esto es, la hipótesis que sostiene que las células eucariontesderivan de la relación simbiótica entre diferentes especies de bacterias,dando cuenta de las funciones respiratoria (mitocondrias) y fotosintética(cloroplastos) (Sagan 1967; Margulis 1981).

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 53

  • Casi al mismo tiempo, en 1977, Woese y Fox usaron la subunidadpequeña del RNA ribosomal (SSU rRNA) con la intención de establecer lafilogenia básica para los sistemas vivos procariontes. De acuerdo con ellos,esta molécula tenía las características que la hacían un muy buen marcadorpara este propósito:

    Para determinar las relaciones que cubren el espectro completo de los seresvivos extintos, se requiere, óptimamente, una molécula de amplia distribución.Ninguna de las proteínas hasta el momento caracterizadas llena este requisito.Sin embargo, el RNA ribosomal aislado lo hace. Es un componente de todoslos sistemas autorreplicativos; es fácilmente aislable, su secuencia cambia len-tamente con el tiempo —permitiendo la detección de relaciones entre especiesmuy distantes [...]. Hasta el día de hoy, la estructura del RNA ribosomal 16s(18s) ha sido caracterizada en una relativamente amplia colección de organis-mos y organelos, y la estructura filogenética general del dominio procariontecomienza a emerger (Woese y Fox, 1977: 5088).

    La filogenia que resultó de esas secuencias tuvo un extraordinario impactoen el escenario biológico de la diversidad de sistemas vivientes. De acuerdocon Woese y Fox (1977), la mayor división entre los organismos vivos noera entre procariontes y eucariontes, sino en tres dominios mayores:Eukaria, Archea y Eubacteria. El primero comprende a todos los eucariontes,mientras que los otros dos incluyen a todos los procariontes; Eubacteriaincluye a todas las bacterias verdaderas, y los organismos agrupados enArchea “parecen recordar más cercanamente a los eucariontes en sumaquinaria para manejar la información genética (replicación, transcrip-ción y traducción), pero recuerdan más a Eubacteria en sus mecanismosmetabólicos y de conversión de energía” (Alberts, et al. 2002: 7).

    Los trabajos de Schwartz y Dayhoff (1978), y el de Woese y Fox (1977),apuntan a otro conflicto metodológico. Estos ejemplos muestran cómo, enlas filogenias moleculares, la respuesta obtenida depende en buena medi-da de la molécula usada. Las investigaciones realizadas por Dayhoff y porWoese revelan diferentes reconstrucciones filogenéticas, bien soportadaspor sus respectivos supuestos teóricos y filosóficos; más aún, ambos hacenimportantes llamados de atención a diferentes puntos de inflexión en lahistoria evolutiva, tanto de los eucariontes como de los procariontes.

    Paradójicamente, estos grandes descubrimientos también arrojaronalgunos hechos inesperados que han amenazado a la empresa completade construir el árbol universal de la vida, en particular hicieron notar laimportancia de la transferencia horizontal de genes. La posibilidad de que estefenómeno ocurriera durante la evolución había sido ya notada en 1978 porSchwartz y Dayhoff, pero fue considerado poco relevante.

    Conforme se acumularon resultados conflictivos y contradictorios du-rante los noventa, y más ejemplos de filogenias incompatibles, se planteó

    54 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • que una posible explicación podía encontrarse en el hecho de que latransferencia horizontal fuera más frecuente de lo esperado. Así, emergióuna visión pesimista de los avances que podrían alcanzarse en las filoge-nias microbianas. Como Ford Doolittle dijera:

    Si la transferencia horizontal puede afectar todos los genes y ha afectadoalguna fracción sustancial de genes en los últimos 3.8 mil millones de años(desde el origen de la vida), entonces mucho de lo que los filogenetistasmoleculares se han planteado alcanzar está en riesgo, especialmente en el áreade evolución de procariontes. [...] Los esfuerzos para deducir la constitucióngenética del último ancestro común de todos los seres vivos parece ahoraperdida. No hay garantía de que un gen actualmente presente en algunaBacteria, Archea o Eucharia estuviese presente en su ancestro común —podríahaber surgido más recientemente en un dominio y haberse extendido a losotros (Doolittle 1999b: M6).

    De forma más radical aún Doolittle señaló: “los filogenetistas moleculareshabrán fallado al encontrar el árbol ’verdadero’, no porque sus métodossean inadecuados o porque hayan escogido los genes erróneos, sinoporque la historia de la vida no puede ser representada adecuadamentecomo un árbol” (Doolittle 1999a: 2124). En la base de este nebuloso esce-nario se encuentra un profundo cuestionamiento sobre la pertinencia deutilizar la información molecular para reconstruir patrones evolutivos:

    [...] debe admitirse que (i) no es lógico equiparar la filogenia de un gen con lade un organismo y (ii) que, a menos que los organismos sean construidos, yasea como más o como menos que la suma de sus genes, no existe una filogeniaorganísmica única. Existe, entonces, un problema en las bases mismas de laclasificación filogenética (Doolittle, 1999b: 2125).

    La serpiente se muerde su propia cola. Los biólogos moleculares confron-tan ahora los límites de su enfoque reduccionista en el campo de lafilogenética evolutiva. Aunque esta visión no es compartida por todos(siendo el mismo Carl Woese su máximo opositor), se ha abierto unimportante debate en este campo de investigación. O’Malley y Boucher(2005) han publicado una detallada reconstrucción del debate que amena-za con modificar el escenario completo de la biología evolutiva.

    Una vez más surge el problema de cómo sopesar la importancia relativade un fenómeno evolutivo, tal como ha ocurrido con la sustitución múlti-ple. Pero más importante, por sus implicaciones conceptuales, o inclusoteóricas, es el reconocimiento de que probablemente la estrategia decomparar genes individuales (o proteínas individuales) ha fallado del todo.Así, los más recientes acercamientos en filogenética molecular se basan enla comparación de genomas completos, no de genes individuales. Sólo en

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 55

  • esta forma, el ideal de construir el árbol de la vida parece posible paraalgunos evolucionistas. Martijn Huynen, Berend Snel y Peer Bork, porejemplo, señalan: “Sostenemos que la tasa de este procesos [la transferen-cia horizontal de genes] no es tan grande como para evitar una visiónfilogenética de la evolución del genoma. Las filogenias genómicas basadasen contenido de genes ignoran la historia evolutiva de los genes” (Huynen,et al. 1999: 1443a).

    3. CONCLUSIONES: ¿HACIA UN NUEVO IDEAL DE OBJETIVIDAD?

    Iniciamos este artículo haciéndonos una serie de preguntas filosóficasdentro de una perspectiva histórico y conceptual. Al igual que Elliot Sober,creemos que los problemas filosóficos “se benefician de tener contacto conlos detalles de las controversias científicas particulares” (1988). De igualmanera, antes de definir si un enfoque particular, un conjunto de métodoso una representación científica merece ser llamada “objetiva”, o másprecisamente, “más objetiva (o menos subjetiva) que otra”, creemos quees de la mayor importancia definir cómo es usado el concepto y cuál es sudesarrolla en trayectorias particulares, dentro de un campo particular dela ciencia, para enfrentar problemas concretos por sus practicantes.

    Desde el principio de los sesenta los biólogos moleculares sostienen quelos caracteres moleculares son mejores que los morfológicos como eviden-cia de los patrones evolutivos de las especies. En la primera mitad del sigloXX ya se habían utilizado evidencias inmunológicas y bioquímicas en lareconstrucción de filogenias, pero este tipo de datos no se considerabasuperior sino complementario a los de tipo morfológico. Las secuencias deaminoácidos y posteriormente de nucleótidos, en cambio, fueron defini-das en los sesenta como evidencia más limpia y directa que los caracteresmorfológicos. En la discusión se encontraba la posibilidad de cuantificar lasdiferencias y similitudes y darles un tratamiento estadístico explícito queno era accesible para los caracteres más complejos de la paleontología, laembriología o la biogeografía. Es más, en las décadas siguientes el credode los biólogos moleculares se vio amenazado por los esfuerzos, tanto delos cladistas como de los feneticistas, de poner en palabras lo que lossistemáticos evolutivos tradicionales no eran capaces de expresar. Cosascomo “experiencia”, “interpretación”, o incluso “prestigio” (como en elsermón del paleontólogo G. G. Simpson) no funcionarían dentro delnuevo código de valores de los evolucionistas moleculares, quienes hablanel idioma de la estadística y se encontraban en capacidad de cuantificar yobjetivar cosas como capacidades de cómputo, y de realizar numerosasoperaciones estadísticas sobre bases de datos enormes, lo que ningúnbiólogo clásico podría aspirar a controlar. No obstante, aun los más desta-cados filogenetistas moleculares inevitablemente regresan a conceptos y

    56 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • preceptos como el “significado biológico” y la “familiaridad con los datos”en la elaboración de una filogenia.

    Las herramientas diseñadas para obtener representaciones más objeti-vas de las relaciones filogenéticas son variadas. Incluyen la definiciónexacta y la cuantificación de valores (de distancia, de similitud), el desa-rrollo y aplicación de métodos estadísticos de inferencia, la recurrencia aprácticas que apuntan a lograr convergencia estadística (o robustez) y unamplio grupo de técnicas de autocontención de la subjetividad, dentro delas que destacan la confianza en las máquinas (computadoras) y en losprocedimientos automatizados (en software estadístico o que elabora rep-resentaciones), así como en la constante tendencia a hacer explícitos loscriterios de evaluación. Esto último es muy notorio en el caso de laevaluación y “pesado” de la inserción de gaps y en la sustitución deaminoácidos similares en la construcción de matrices, como ya se vio. Entérminos más prácticos, incluyen la aplicación de métodos alternativospara el mismo grupo de datos, o incluso la utilización de una mezcla deenfoques, retornando al criterio de robustez o convergencia, e inde-pendientemente de los compromisos metodológicos y conceptuales decada metodología, lo cual muestra que, algunas veces, los compromisosmetodológicos y conceptuales de cada escuela no son siempre decisivosen las prácticas cotidianas de la investigación, o bien que para la mayorparte de los practicantes de un campo científico el dominio de criteriospragmáticos, como la obtención de resultados relativamente robustos, sonmás importantes que tales compromisos.

    En el camino de ir haciendo explícito lo que está “detrás” de susmétodos, criterios y decisiones, más y más problemas metodológicossurgieron. Al mismo tiempo, mientras más evidencia empírica se acumu-laba y modificaba las ideas anteriores sobre los procesos físicos de laevolución biológica (por ejemplo, exponer los posibles efectos de la dege-neración del código genético o indicar la presencia de la transferenciahorizontal de genes), los problemas metodológicos se diversificaron, asícomo las respuestas y métodos alternativos, en una carrera ansiosa quedetermina, en buena parte, la actividad de los filogenetistas moleculares.A la par, observamos una historia de las luchas de estos filogenetistasmoleculares por mantener la subjetividad fuera de sus métodos y decisio-nes. Experiencia y familiaridad, así como preferencias, han continuadotocando a sus puertas y, de hecho, han sido parte de lo que cada bandoquiere evitar en los debates cotidianos que constituyen el trabajo deinvestigación más demandante en este campo.

    El remedio de los sistemáticos moleculares, su búsqueda ansiosa deobjetividad, se ha centrado en el desarrollo de métodos estadísticos cadavez más complejos y en hacer explícito todo lo que pueda estar implícito,poniendo en palabras y en criterios numéricos (y en la forma de progra-

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 57

  • mas) sus compromisos y decisiones; corriendo el peligro de, al final,transformar lo que es esencialmente un proceso biológico en una “mera”aproximación estadística y arriesgándose a perder contacto con sus sujetosde estudio, los seres vivos. La creciente popularidad de las comparacionesde genomas completos y el reconocimiento de que otras fuentes de evi-dencia son importantes (como la paleontología, la biología del desarrolloy la biogeografía) opera, no obstante, en contracorriente a este impulso“estadístico”.

    Si bien hay muchas diferencias entre los métodos y el código de normasde los sistemáticos evolucionistas tradicionales y los de sus contrapartesmoleculares (tanto cladistas como feneticistas), es relativamente claro,desde la perspectiva dada por la evidencia histórica presentada, que losnuevos sistemáticos tienen una relación más cercana con el ideal modernode la objetividad mecánica. ¿Significa esto que la perspectiva molecular haprobado ser superior que la perspectiva organísmica? La mencionadatendencia a comparar genomas completos y a utilizar otras fuentes deevidencia no molecular contradicen esta conclusión.

    Lo más probable, creemos, es que esta no sea la pregunta correcta aformular en un artículo orientado históricamente (aunque también epis-temológicamente). Lo que parece más interesante es averiguar si las no-ciones de evidencia y de objetividad en la biología evolutiva se hantransformado con el advenimiento del enfoque molecular. Nuestra res-puesta es claramente sí. La dirección de la transformación apunta a losideales de la objetividad mecánica y la cuantificación de la naturaleza. Perolas respuestas particulares que han dado los sistemáticos moleculares handependido, no sólo del acceso a cantidades enormes de secuencias deproteínas y ácidos nucleicos presentes en las bases de datos y del desarrollode la bioinformática y los métodos de inferencia estadística. Ha dependidoen mucho, de los obstáculos específicos que presenta la reconstrucción deun proceso histórico. En muchos sentidos, por ejemplo, en la importanciaque tiene la interpretación y la evaluación (el peso) de la evidencia, lossistemáticos moleculares comparten los mismos problemas metodológicosde cualquier investigador (sea un paleontólogo, un arqueólogo o unhistoriador social) interesado en reconstruir el pasado. Quizás sean esasdificultades inherentes a la comprensión de los fenómenos históricos lasque han alimentado de manera más singular la ansiedad metodológicaque caracteriza a las prácticas de los filogenetistas moleculares.

    58 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • AGRADECIMIENTOSDeseamos agradecer al Max Planck Institute für Wissenschaftsgeschichte, y enespecial a los miembros del Departamento III por la enriquecedora discusiónde la primera versión del presente ensayo en octubre de 2006. Este artículo fueposible gracias a una estancia de investigación apoyada por la UniversidadNacional Autónoma de México y el proyecto de investigación PAPIIT númeroIN308208, así como al apoyo otorgado por el Max Planck Institute für Wissens-chaftsgeschichte (Edna Suárez) y a una beca para estudios doctorales otorgadapor el Deutscher Akademischer Austausch Dienst (DAAD) y el Institute forTheoretical Biology de la Humboldt Universität zu Berlin (Víctor Hugo Anaya).Asimismo, queremos agradecer a Hans-Jörg Rheinberger, Lorraine Daston,Hannes Lutz, Rasmus Winther, Maureen O’Malley, Skulli Siggurdson, RamusWinther y a Sergio Martínez sus valiosos comentarios a versiones previas.Deseamos asimismo agradecer a un revisor anónimo por sus sugerencias paramejorar el presente artículo.

    NOTAS

    1 Las filogenias pretenden representar relaciones de ancestría-descendencia. Larepresentación típica de una filogenia es el árbol ramificado de Darwin. Sinembargo, algunas representaciones taxonómicas no pretenden reconstruirrelaciones filéticas, pese a que “tengan la apariencia” de así hacerlo. Porejemplo, los cladogramas son diagramas ramificados, cuyo único propósitoes el mostrar grupos monofiléticos. Un grupo se considera monofilético cuando“está constituido por una especie, todos los descendientes de esa especie yninguna otra cosa” (Sober, 1988: 16). La terminología cladista se caracterizapor sus casi impronunciables términos (como “sinapomorfias” y “simplesio-morfias”) que afortunadamente no tenemos que abordar en este ensayo.

    2 Un residuo de aminoácido está presente en un par de cadenas homólogas, ono está. En el caso de las secuencias de nucleótidos del DNA, el lenguaje enbase 4 de los cuatro nucleótidos es la base sobre la cual se pueden realizarmuchos análisis estadísticos sin las complicaciones que plagan otros tipos dedatos. Como veremos, esto no quiere decir, sin embargo, que la elaboraciónde comparaciones de secuencias no sea problemática.

    3 Una descripción cuidadosa de este debate está más allá de los objetivos de esteartículo. Sin embargo, como es parte de muchas discusiones metodológicascon las que sí nos involucraremos, algunas aclaraciones básicas resultan

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 59

  • necesarias. El problema es cómo relacionar la recuperación de relacionesgenealógicas (relaciones de ancestría-descendencia) con las clasificaciones delos seres vivos. Los cladistas sostienen que la genealogía por sí misma deberíainfluir la clasificación: los feneticistas, en cambio, defienden que la similitudgeneral debería determinar la clasificación (y así se podrían proponer hipó-tesis genealógicas a partir de esos datos); mientras que los taxónomos evolu-cionistas dicen que la clasificación debe reflejar, tanto la genealogía como lasimilitud adaptativa. Cada escuela ha desarrollado sus propios y distintivosmétodos de inferencia filogenética: el cladismo es asociado con los métodosde parsimonia, el feneticismo con los de máxima verosimilitud (maximumlikelihood) y la taxonomía evolutiva (que ha sido desplazada por las escuelasrivales en los mayores centros de clasificación e historia natural en el mundo),con una mezcla de metodologías, tanto explícitas como implícitas (es esta faltade claridad el origen de las rivalidades entre las escuelas). Actualmente,muchos filogenetistas moleculares utilizan una mezcla de métodos inde-pendientemente de los compromisos metodológicos y conceptuales en losque se basan. Véase Sober 1988 y Hull 1988 para un tratamiento detallado deestos temas.

    4 Representada principalmente por el sistemático Ernst Mayr y el paleontólogoGeorge G. Simpson, ampliamente reconocidos por su papel durante loscuarenta en la llamada Síntesis Evolutiva.

    5 La conexión entre este frente de batalla y la lucha entre feneticismo y cladismose mantiene como un problema histórico-filosófico no abordado en el presen-te artículo. Sin embargo, es creíble que muchas de las aproximaciones delnaciente campo de la evolución molecular se originaron independientementedel feneticismo (Zuckerkandl llamó al primer proyecto de investigación“paleogenética química”). No es del todo claro que debamos creer todo lo quelos científicos dicen: por ejemplo, Fitch sostiene que su desarrollo de losprimeros programas de computadora en el campo procede completamenteindependiente de los desarrollos ocurriendo en el feneticismo y luego en elcladismo (comunicación personal). Felsenstein (1994, capítulo 10) mencionaciertas conexiones entre el desarrollo del enfoque molecular de la evolucióny el desarrollo de las escuelas rivales de sistemática.

    6 En este artículo (significativamente titulado “Molecules as documents ofevolutionary history”), Emilé Zuckerkandl introdujo una clasificación demoléculas dependiendo de la cantidad de información que portaban. Lasmoléculas semantoforéticas o semantidas (literalmente moléculas con signifi-cado), incluían a los ácidos nucléicos y las proteínas, y se decía que concen-traban la mayor cantidad de información sobre la historia de los seres vivos.Véase Suárez 2007.

    7 Ortología es la relación entre cualesquiera dos caracteres que comparten unancestro común y que han divergido por descendencia, es decir, que sean“verdaderos” homólogos (véase Fitch 1970; 1971; 2000).

    8 Véase Fitch, 1988. La nota incluye los recuerdos del autor sobre su trabajo y sucolaboración con Margoliash.

    9 Conocidos como gaps o indels en la jerga especializada, vale la pena destacarque el inglés gap se refiere a lo que podemos traducir como un “espacio” o“hueco”, sin embargo indel resulta de la unión de las palabras insertions ydeletions, luego indel y ambos se refieren a la ganancia o pérdida de un ciertonúmero de residuos o bases y a la incorporación de espacios en un alinea-miento para aumentar la cantidad de identidades o similitudes. Se utiliza el

    60 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • término ambiguo respecto al proceso pues es difícil saber si el “espacio”resultó de la ganancia o de la pérdida de una parte de la secuencia. Porcomodidad utilizaremos indistintamente alguno de estos dos términos enlugar de su traducción al castellano.

    10 La traducción más adecuada de likelihood o maximum likelihood sería “verosi-militud” y “máxima verosimilitud”, sin embargo, a lo largo de este artículoutilizaremos el término en inglés debido a su uso generalizado entre losfilogenetistas moleculares.

    11 El cambio de una purina (adenina o guanina) por otra purina, o bien de unapirimidina (timina o citosina) por otra pirimidina.

    12 El cambio de una pirimidina por una purina o viceversa.

    SUÁREZ; ANAYA / ANSIEDAD METODOLÓGICA / 61

  • BIBLIOGRAFÍA

    Alberts, B., Johnson, A., Lewis, J., Raff, M., Roberts, K., y Walter, P. (2002),Molecular Biology of the Cell (4th ed.) London, UK: Garland Science.

    Altschul, S. F. (1991), “Amino acid substitution matrices from information theo-retic perspective,” J. Mol. Biol. 219: 555-565.

    Aronson, J.D. (2002), “’Molecules and monkeys: George Gaylord Simpson andthe challenge of molecular evolution,” History and Philosophy of the Life Sciences24: 441-465.

    Beatty, J. (1990), “Evolutionary anti-reductionism: Historical reflections,” Biologyand Philosophy 5: 199-210.

    Bishop, M.J., y Thompson, E.A. (1986), “Maximum likelihood alignment of DNAsequences,” J. Mol. Biol. 190: 159-165.

    Bolton, E. y Britten, R. (1961), Yearly Report to the Carnegie Institution of Washington.Brinkman, F. S. L., y Leipe, D. D. (2001), “Phylogenetic analysis,” in A. D.

    Baxenasis & B. F. F. Ouellete (Eds.), Bioinformatics: A Practical Guide to theAnalysis of Genes and Proteins (2a ed.). New York: J. Wiley & Sons.

    Brudno, M., Malde, S., Poliakov, A., Do, C.B. Couronne, O., Dubchak, I., Batzo-glou, S. (2003), “Glocal alignment: finding rearrangements during align-ment,” Bioinformatics 19 (Suppl. 1): i54-i62.

    Daston, L. y Galison, P. (1992), “The image of objectivity,” Representations 40:81-128.

    Daston, L. y Galison, P. (2007), Objectivity. Brooklyn, N.Y: Zone Books.Dayhoff, M.O., Schwartz, R.M., Orcutt, B.C. (1978), “A model of evolutionary

    change in proteins,” in Dayhoff, M.O. y Schwartz, R.M. (Eds.), Atlas of ProteinSequence and Structure 5: 345-352.

    Dietrich, M.R. (1998), “Paradox and persuasion: Negotiating the place of mole-cular evolution within evolutionary biology,” Journal of the History of Biology31: 85-111.

    Doolittle, W.F. (1999a), “Phylogenetic classification and the universal tree,”Science 284 (5423): 2124-2129.

    Doolittle, W.F. (1999b), “Lateral genomics,” TIG 15(12): M5-M8.Efron, B. (1979), “Bootstrap methods: Another look at the jackknife,” The Annals

    of Statistics 7(1): 1–26.Felsenstein, J. (1985), “Confidence limits on phylogenies: An approach using the

    bootstrap,” Evolution 39(4): 783-791.Felsenstein, J. (2004), Inferring Phylogenies. USA: Sinauer Press.Felsenstein, J., Sawyer, S., Kochin, R. (1982), “An efficient method for matching

    nucleic acid sequences,” Nucleic Acids Research 10(1): 133-139.Feng, D.F., Johnson, M.S., Doolittle, R.F. (1985), “Aligning amino acid sequences;

    Comparison of commonly used methods,” J. Mol. Biol. 21: 112-125.Fitch, W. (1966), “The relation between frequencies of amino acids and ordered

    trinucleotides,” J. Mol. Biol. 16: 1-8.Fitch, W. (1970), “Distinguishing homologous from analogous proteins,” Syst.

    Zool. 19, 99-113.Fitch, W. (1971), “Toward defining the course of evolution: minimum change for

    a specific tree topology,” Syst. Zool. 20(4): 406-416.Fitch, W. (1988), “This Weeks Citation Classic,” Current Contents 27: 16.Fitch, W. (2000), “Homology, a personal view on some of the problems,” TIG

    16(5): 227-231. Fitch, W. M., y Margoliash, E. (1967), “Construction of phylogenetic trees,”

    Science 155(3760): 279-284.

    62 / LUDUS VITALIS / vol. XVII / num. 31 / 2009

  • Fitch, W., y Smith, T. (1983), “Optimal sequence alignments,” PNAS 80: 1382-1386.

    Gigerenzer, G., Z. Swijtink, T. Porter, L. Daston, J. Beatty y Kruger., L. (1989), TheEmpire of Chance: How Probability Changed Science and Everyday Life. Cambridge:Cambridge University Press.

    Goodman, M. (1960), “On the emergence of intraspecific differences in theprotein antigens of human beings,” The American naturalist 94(875): 153-166.

    Goodman, M. (1996), “Epilogue: A personal account of the origins of a newparadigm,” Molecular Phylogenetics and Evolution 5(1): 269–285.

    Hagen, J. (2001), “The introduction of computers into systematic research in theUnited States during the 1960’s,” Studies in the History and Philosophy ofBiological and