65
INSTITUTO POLITÉCNICO NACIONAL ESCUELA NACIONAL DE CIENCIAS BIOLÓGICAS SECCION DE ESTUDIOS DE POSGRADO E INVESTIGACIÓN DEPARTAMENTO DE MICROBIOLOGÍA Determinación parcial de la secuencia genómica del Brucellafago Tb Tesis Para obtener el grado de Maestría en Ciencias Presenta Q.B.P. Victor Missael Flores López Director Dra. Rosa María Ahidé López Merino México, D.F. Junio, 2009.

INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

  • Upload
    haliem

  • View
    212

  • Download
    0

Embed Size (px)

Citation preview

Page 1: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

INSTITUTO POLITÉCNICO NACIONAL

ESCUELA NACIONAL DE CIENCIAS BIOLÓGICAS

SECCION DE ESTUDIOS DE POSGRADO E INVESTIGACIÓN

DEPARTAMENTO DE MICROBIOLOGÍA

Determinación parcial de la secuencia genómica del Brucellafago Tb

Tesis

Para obtener el grado de Maestría en Ciencias

Presenta

Q.B.P. Victor Missael Flores López

Director

Dra. Rosa María Ahidé López Merino

México, D.F. Junio, 2009.

Page 2: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA
Page 3: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

1. Introduccion ........................................................................................................................................ 6

1.1 Los bacteriófagos .............................................................................................................................. 7

1.2 Importancia de los fagos ................................................................................................................... 8

1.3 El género Brucella. ............................................................................................................................ 9

1.4 Los fagos de Brucella ....................................................................................................................... 10

1.5 Secuenciación de genomas. ............................................................................................................ 10

2. Antecedentes .................................................................................................................................... 12

2.1 Utilidad de los fagos ........................................................................................................................ 13

2.2 Brucellafagos .................................................................................................................................. 13

3. Justificacion ...................................................................................................................................... 15

3.1 Justificacion .................................................................................................................................... 16

4. Objetivos........................................................................................................................................... 17

4.1 Objetivo general ............................................................................................................................. 18

4.2 Objetivos particulares. .................................................................................................................... 18

5. Material y Metodos .......................................................................................................................... 19

5.1 Cepas bacterianas y brucellafagos .................................................................................................. 20

5.2 Propagación del fago Tb (Corbel & Thomas, 1980).......................................................................... 20

5.3 Determinación del título de la suspensión fágica (Corbel & Thomas, 1980). ................................... 20

5.4 Obtención de DNA fágico (Modificado de Rigbyet al., 1989)........................................................... 20

5.5 Fragmentación aleatoria del DNA fágico (Modificado de Rohwer et al., 2000). .............................. 21

5.6 Construcción de las librerías genómicas (Chen 2002). ..................................................................... 21

5.7 Obtención de clonas recombinantes (Sambrook & Russel, 2001). .................................................. 22

5.8 Transformación de células con vectores recombinantes pBluescript (Sambrook & Russel, 2001). . 22

5.9Transformación de células con vectores recombinantes m13mp19 (Sambrook & Russel, 2001). .... 23

5.10 Transformación de células con vectores recombinantes pJET 1.2 ................................................. 23

5.11 Obtención de DNA plasmídico a partir de las clonas recombinantes. (Sambrook & Russel, 2001)............................................................................................................................................................... 24

5.12 Confirmación de los insertos presentes en las clonas recombinantes. (Sambrook & Russel, 2001)............................................................................................................................................................... 24

5.13 Purificación de los productos de PCR de las clonas recombinantes............................................... 25

5.14 Secuenciación de los insertos presentes en las clonas recombinantes. ......................................... 25

5.15 Análisis de las secuencias obtenidas en la secuenciación. ............................................................. 25

Page 4: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

5.16 Ensamblaje de las secuencias curadas........................................................................................... 25

5.17 Determinación de marcos abiertos de lectura (Modificado de Rohwer et al., 2000). ................... 25

5.18 Búsqueda tipo BLAST de secuencias similares a los ORFs detectados (Altschul et al., 1990). ........ 26

5.19 Corrección de los marcos abiertos de lectura. ............................................................................... 26

5.20 Búsqueda de promotores transcripcionales .................................................................................. 26

5.21 Búsqueda de terminadores transcripcionales ............................................................................... 26

5.22 Análisis de frecuencia de uso de codones de los ORFs predichos (Supek & Vlahoviček, 2004). ..... 26

5.23 Análisis de motivos estructurales presentes en los ORFs predichos. ............................................. 27

5.24 Determinación de los ORFs verdaderos ........................................................................................ 27

5.25 Asignación de funciones a los ORFs encontrados. ......................................................................... 27

5.26 Organización del genoma del fago Tb. .......................................................................................... 27

5.27 Comparacion del genoma del fago Tb con el genoma de Mesorhizobium sp. BNC1 ...................... 27

6. Resultados ........................................................................................................................................ 28

6.1 Obtención de DNA fágico ................................................................................................................ 29

6.2 Construcción de las librerías genómicas. ......................................................................................... 29

6.3 Obtención de clonas recombinantes ............................................................................................... 30

6.4 Obtención de DNA plasmídico a partir de las clonas recombinantes. ............................................. 30

6.5 Confirmación de los insertos presentes en las clonas recombinantes. ............................................ 31

6.6 Secuenciación de los insertos presentes en las clonas recombinantes............................................ 31

6.7 Ensamblaje de las secuencias curadas. ........................................................................................... 32

6.8 Determinación de marcos abiertos de lectura ................................................................................ 33

6.9 Búsqueda tipo BLAST ...................................................................................................................... 33

6.10 Búsqueda de promotores transcripcionales .................................................................................. 33

6.11 Búsqueda de terminadores transcripcionales ............................................................................... 33

6.12 Análisis de frecuencia de uso de codones sinonimos .................................................................... 33

6.13 Búsqueda de dominios conservados en las proteínas hipotéticas predichas. ............................... 40

6.14 Designación de los genes verdaderos y asignación de funciones. ................................................. 44

6.15 Propiedades de los productos de los genes encontrados en el genoma del fago Tb. .................... 44

6.16 Descripción de los genes encontrados .......................................................................................... 46

6.17 Organización de los genes encontrados. ....................................................................................... 48

6.18 Comparacion de genomas. ............................................................................................................ 49

7. Discusion ........................................................................................................................................... 50

Page 5: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

7.1 Obtención del DNA fágico y construcción de las librerías. .............................................................. 51

7.2 Ensamblaje de las secuencias obtenidas. ........................................................................................ 52

7.3 Predicción de marcos abiertos de lectura ....................................................................................... 52

7.4 Frecuencia de uso de codones ........................................................................................................ 52

7.5 Búsqueda de promotores transcripcionales .................................................................................... 53

7.6 Búsqueda de terminadores transcripcionales ................................................................................. 54

7.7 Búsqueda tipo BLAST y búsqueda de dominios conservados. ......................................................... 54

7.8 Asignación de funciones a los genes encontrados ........................................................................... 55

7.9 Descripción de los genes encontrados. ........................................................................................... 55

7.10 Organización de los genes encontrados ........................................................................................ 57

8. Conclusiones ..................................................................................................................................... 59

8.1 Conclusiones. .................................................................................................................................. 60

9. Referencias ....................................................................................................................................... 61

9.1 Referencias citadas ......................................................................................................................... 62

Page 6: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

1. Introducción

Page 7: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

1.1 Los bacteriófagos

Los bacteriófagos, también llamados fagos, son virus que infectan células procarióticas. Se consideran las entidades biológicas más abundantes y diversas en el planeta; se estima que existen aproximadamente 1031 partículas fágicas en la biosfera, superando en cantidad a los procariotes en por lo menos un orden de magnitud. Algunos autores mencionan que la diversidad biológica de los fagos comprende aproximadamente 108 especies (Wommack & Colwell, 2000; Rohwer & Edwards, 2002).

Los fagos, al igual que otros virus, son estructuras proteicas, que envuelven un ácido nucleico que puede ser DNA o RNA, de cadena doble o sencilla, esta molécula de ácido nucleico puede encontrarse de forma circular, o lineal.

Los fagos se replican en la bacteria hospedera mediante distintos mecanismos, que dependen de factores inherentes al hospedero, factores propios del virus e incluso factores ambientales. Con base en los fenómenos que ocurren en la infección fágica, los ciclos replicativos se han clasificado en lítico y lisogénico.

Existen diferencias muy claras entre ambos fenómenos, en el ciclo lítico se lleva a cabo la producción de partículas virales y la subsecuente lisis celular. En el ciclo lisogénico, el material genético del fago se integra en el genoma bacteriano, por lo que no ocurre la producción de partículas virales (Canchaya et al., 2003).

Ambos procesos inician cuando algunas proteínas estructurales del fago reconocen estructuras superficiales de la bacteria. Después se establece una interaccion entre la célula y el virus, de tal forma que la partícula viral se adsorbe a la superficie bacteriana. Posteriormente, otras proteínas estructurales-funcionales, degradan parte de las envolturas bacterianas para que el fago inyecte su material genético al citoplasma del hospedero. Las proteínas que llevan a cabo este proceso, forman poros y canales en la membrana y pared celular, sin embargo, se ha especulado que existen otras fuerzas involucradas en la inyección del material genético a la célula. (Grayson & Molineaux, 2008).

Una vez dentro de la célula, el DNA fágico es procesado por la maquinaria enzimática de la célula, dando lugar a la expresión de proteínas funcionales y estructurales.

En el ciclo lítico, las proteínas sintetizadas se encargarán de la replicación del material genético del virus, así como de la producción y ensamblaje de partículas virales. En este proceso, el virus puede inducir la degradación del DNA y RNA bacteriano, para sintetizar su propio material genético y dirigiendo el metabolismo celular hacia la expresión de las proteínas fágicas.

En el ciclo lisogénico, se expresan enzimas que integran el genoma viral al cromosoma de la célula hospedera, entre estas enzimas se encuentran integrasas, ligasas, recombinasas, entre otras. Al fago integrado se le denomina profago y la célula se denomina lisogénica. Posterior a la integración del genoma fágico, la bacteria puede replicarse normalmente, sin embargo, bajo el estimulo adecuado, el material genético del fago es capaz de escindirse del cromosoma bacteriano, empleando para ello, enzimas como resolvasas, excisionasas, etc. Este hecho da lugar a la producción de partículas virales que pueden lisar la célula. En esta etapa del ciclo, el profago al escindirse puede adquirir DNA de la bacteria, y las partículas virales ensambladas contendrán este material genético el que pueden transferir a una nueva célula en la que también pueden insertar su genoma. Este proceso constituye un mecanismo muy importante de transferencia horizontal de material genético y se denomina transducción. En la figura 1 se esquematizan los ciclos replicativos de un fago.

Page 8: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

1.2 Importancia de los fagos

Los fagos y las bacterias son las entidades biológicas más abundantes en la biosfera, y se sabe que los fagos tienen una influencia importante en la diversidad y abundancia bacteriana. Se ha observado que los fagos líticos pueden limitar las poblaciones bacterianas, mientras que los fagos lisogénicos pueden transferir material genético de una célula a otra, contribuyendo de manera importante con la diversidad y evolución de los procariotes (Canchaya et al., 2003). Ejemplo de ello es la cepa Sakai de E. coli O157:H7 en la que se han encontrado 18 profagos, que representan aproximadamente el 16% del total de su genoma (5.5 Mbp) (Bossi et al., 2003; Perna et al., 2001).

A lo largo de la historia, los fagos así como los productos de sus genes han sido empleados para el desarrollo de herramientas bacteriológicas y biotecnológicas, así como para la implementación de agentes terapéuticos y de control de bacterias patógenas (Petty et al., 2006).

En este sentido, podemos mencionar algunas aplicaciones tales como la fagotipificación de agentes patógenos tales como Salmonella, Staphylococcus y Streptococcus (Anderson & Williams, 1956). La fagotipificación nos permite identificar y tipificar bacterias mediante la lisis por fagos específicos, asimismo, este método ha sido utilizado desde hace casi 70 años, debido a que ofrece ventajas como rapidez y reproducibilidad.

Otra de las áreas en las que los fagos constituyen una herramienta útil, es la biotecnología y la biología molecular. Desde su descubrimiento, los fagos han sido utilizados para la demostración de fenómenos que han sido parte aguas en la historia de la biología molecular. Entre los eventos relevantes

Figura 1 Ciclos replicativos de los fagos, en flechas rojas esta representado el ciclo lítico, y en flechas azules el ciclo lisogénico. La leyenda indica las etapas de cada ciclo y las enzimas involucradas en cada proceso. La bacteria hospedera silvestre esta esquematizada en café, mientras que la bacteria lisogenizada en rojo. El segmento amarillo corresponde al material genético del bacteriófago y el segmento verde el genoma del hospedero.

Page 9: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

en los que los fagos han tomado parte, podemos mencionar, la demostración de que el material genético esta codificado en el DNA (Hershey & Chase, 1956), el descubrimiento del RNA (Volkin & Astrachan, 1956) y la evidencia microbiológica de las teorías evolutivas propuestas por Darwin (Delbruck & Luria, 1943). Por otro lado, los fagos han sido utilizados como vectores de clonación, tales como el fago λ, el fago m13 y el fago p1, estos vectores son capaces de incorporar hasta 100 kbp (Chauthaiwale et al., 1992).

Otro de los usos más comunes de los fagos en la biotecnología es la técnica denominada “Phage-display”, en la que se utiliza el fago m13 como vector de clonación y se insertan segmentos de DNA que codifican para péptidos potencialmente inmunogénicos. Dichos péptidos son expresados y expuestos en la superficie de la partícula viral, por lo que posteriormente se pueden seleccionar aquellos que reaccionen de manera específica con anticuerpos de interés.

A pesar de las ventajas que ofrecen los fagos en biotecnología y bacteriología, los fagos representan un problema en el sector industrial, principalmente en la producción de alimentos fermentados, ya que la lisis celular de los cultivos empleados en dichos procesos, disminuye considerablemente el rendimiento y la calidad del producto final (Moineau et al., 2002).

1.3 El género Brucella.

El género Brucella descubierto por David Bruce y descrito por Shaw en 1920, comprende bacterias intracelulares facultativas que ocasionan aborto epizoótico en diferentes animales y es el agente causal de brucelosis humana (Godfroid et al., 2005). Este género se ubica en una rama monofilética del subgrupo 2 de las α-Proteobacterias (Chain et al., 2005). Las bacterias de este género son bacilos cortos Gram negativos no esporulados, con metabolismo oxidativo, agrupados actualmente en 9 especies las cuales infectan preferencialmente a algún hospedero animal, aunque todas son patógenas humanas. En la figura 2 se muestran los hospederos preferenciales de las 9 especies de Brucella.

Figura 2 Las nueve especies del género Brucella y los hospederos animales que infectan preferencialmente, el humano es susceptible a la infección por cualquiera de las especies de Brucella

Page 10: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

La brucelosis es una enfermedad ampliamente distribuida en México y el mundo, y representa un serio problema de salud pública y economía al generar cuantiosas pérdidas en el sector ganadero así como los daños en personas enfermas (Luna-Martínez 2002).

1.4 Los fagos de Brucella

Los fagos de Brucella (brucellafagos) son un grupo homogéneo de virus líticos que infectan únicamente bacterias del genero Brucella, y se ha observado que infectan selectivamente ciertas especies de Brucella. Este último rasgo ha permitido la clasificación de estos fagos en 7 grupos con base en la especie de Brucella que infectan. En la tabla 1 se muestran los 7 grupos de brucellafagos, así como un fago representativo de cada grupo y las especies que infectan. (Corbel & Thomas, 1980).

Tabla 1 Los siete grupos de Brucellafagos y las especies de Brucella que infectan preferencialmente

Grupo brucellafago

representativo Especies que infecta

preferentemente Especies que infecta con menor

eficiencia I Tblisi (Tb). Brucella abortus Brucella suis II Firenze (Fi). Brucella neotomae Brucella suis III Weybridge (Wb). Brucella suis Brucella neotomae

IV Berkeley (Bk). Brucella melitensis Brucella abortus

Brucella neotomae Brucella suis

V R/O R/C Brucella canis Brucella ovis Cepas rugosas de Brucella VI Izatnagar (Iz). Brucella abortus Brucella melitensis Brucella suis VII Nepean (Np). Brucella abortus -

Los brucellafagos han sido parcialmente caracterizados y se sabe que presentan una cápside

icosaédrica de aproximadamente 60 nm, así como una cola corta, lo que los ubica morfológicamente en la familia Podoviridae. Su genoma consta de DNA de doble cadena de entre 38 y 43 kbp, sensible a endonucleasas de restricción comúnmente utilizadas (Segondy et al., 1988; Rigby et al., 1989).

Se ha observado que los brucellafagos pueden infectar de manera diferencial las cepas de Brucella, sin embargo, los mecanismos por los cuales está dada la especificidad de estos virus, no han sido determinados (Segondy et al., 1988).

La especificidad mostrada por estos fagos ha permitido establecer un sistema de fagotipificación de aislamientos clínicos y ambientales de Brucella, que ha sido ampliamente utilizado desde hace casi cuatro décadas, facilitando la identificación y tipificación de estos aislados (Corbel & Thomas, 1980).

Pese a esto, no se conocen muchas de las características moleculares de los brucellafagos, ni los mecanismos mediante los cuales interactúan con su hospedero.

1.5 Secuenciación de genomas.

En los años 70 se lograron desarrollar algunas metodologías para la determinación de la secuencia genómica de los seres vivos, y a partir de estas secuencias nucleotídicas, inferir algunas de sus propiedades biológicas y moleculares.

Page 11: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

El primer genoma secuenciado corresponde al RNA del fago MS2 en 1976. Asimismo, el primer genoma de DNA corresponde al fago phiX174 en 1977 (Hatfull, 2008).

En 1995 fue completado el primer genoma bacteriano, a partir de entonces se han completado las secuencias genómicas de más de 180 bacterias. El estudio de las secuencias genómicas bacterianas y virales, han aportado información acerca de las propiedades biológicas de los mismos, así como de las relaciones que presentan con otros organismos y de la interaccion con su medio ambiente (Koonin & Wolf, 2008).

Page 12: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

2. Antecedentes

Page 13: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

2.1 Utilidad de los fagos

Los fagos han sido utilizados desde su descubrimiento como herramientas bacteriológicas, permitiendo identificar y tipificar bacterias de interés medico, veterinario e industrial. Por otro lado, los fagos han jugado un papel muy importante en aéreas tales como la biotecnología y la biología molecular, siendo estos, una herramienta muy útil en técnicas como la clonación y la selección de péptidos antigénicos (Petty, 2006).

Los fagos han sido utilizados incluso en nanotecnología, como pequeñas maquinarias de producción de nanofibras y nanocables para la fabricación de microcircuitos (Petty, 2006).

Los fagos así como en otras áreas de la biología, han sido parte aguas en la biología molecular y celular. La primera secuencia nucleotídica obtenida corresponde al genoma del fago MS2, y la primera molécula de DNA secuenciada, corresponde al fago phiX174. La información genómica de los fagos ha ido creciendo drásticamente en los últimos años y actualmente se encuentran depositados en el GenBank más de 500 genomas fágicos (Hatfull, 2008).

2.2 Brucellafagos

Los fagos de Brucella, fueron descubiertos hace mas de 80 años, en ese entonces poco se sabía de estos virus. Tiempo después, fueron realizados numerosos reportes, describiendo fenómenos posiblemente atribuidos a estos virus. No fue sino hasta los años 50 que se alcanzo un progreso notable cuando se obtuvieron brucellafagos estables a partir de muestras naturales (Corbel & Thomas, 1980).

Posteriormente se reportaron diversos aislamientos de brucellafagos a partir de diversas muestras, tales como aguas de desecho, sangre, fetos abortados, y diversos tejidos animales y humanos.

Debido a la falta de criterios para la identificación y tipificación de aislamientos de Brucella, así como a la falta de metodologías para el estudio de los brucellafagos, en los años 50 y 60 existían discrepancias en la amplitud de hospederos reportados para los brucellafagos aislados.

No fue sino hasta finales de la década de 1960 y principios de los años 70, que se instauraron metodologías para aislar brucellafagos y determinar su amplitud de hospederos. De esta forma, se lograron aislar brucellafagos que infectaban un intervalo definido de cepas de Brucella, permitiendo así, clasificar los fagos con un criterio definido, de manera que se establecieron siete grupos de brucellafagos.

En los años 60 y 70 los brucellafagos aislados a partir de fuentes naturales mostraban una similitud notable en cuanto a su amplitud de hospederos. Sin embargo, se logro el aislamiento de brucellafagos capaces de replicarse activamente en Brucella melitensis y Brucella suis.

Posteriormente, algunos brucellafagos fueron desarrollados en condiciones de laboratorio a partir de cepas de origen natural. Así, el brucellafago Berkeley fue obtenido inoculando cultivos de Brucella melitensis con el brucellafago Weybridge, el brucellafago R fue obtenido inoculando Brucella abortus 45/20 con una mezcla de brucellafago Weybridge y MC/75 (un posible derivado del fago Tb) en presencia de N-metil N-nitro N-nitrosoguanidina (Corbel & Thomas, 1980).

Una vez que se obtuvieron los fagos derivados de las cepas de origen ambiental, se procedió a instaurar un sistema de fago tipificación, y desde entonces, los brucellafagos han sido utilizados ampliamente en las regiones en donde la brucelosis es una enfermedad prevalente.

Page 14: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

A pesar de su utilidad, los estudios de los brucellafagos, realizados a finales de los años 70 y en la década de 1980 no aportaron mucha información con respecto a la biología de estos virus. No fue sino hasta 1989 cuando se realizo un estudio extenso acerca de las propiedades moleculares de estos virus. En este trabajo se estudio el DNA de algunos brucellafagos, determinando su tamaño aproximado, contenido de Guanina-Citocina, sus perfiles electroforéticos ante endonucleasas de restricción y su grado de similitud mediante hibridación tipo southern blot.

Rigby y Cerqueira-Campos concluyeron que los brucellafagos eran un grupo homogéneo de fagos líticos, los cuales infectaban de forma específica diferentes cepas de Brucella.

Segondy y colaboradores, llegaron a la misma conclusión empleando técnicas similares, y especularon que las diferencias observadas en los fenotipos de los brucellafagos, eran debidos a cambios puntuales en su secuencia genómica. Esta hipótesis no ha sido probada, ya que desde 1989 no se ha publicado ningún trabajo en donde se investigue a los brucellafagos. Esta falta de información contrasta la gran utilidad que los brucellafagos representan hasta el momento.

En los últimos años se han logrado completar la mayoría de los genomas fágicos existentes, sin embargo, la información obtenida es muy limitada, debido principalmente a la abundancia y diversidad de los fagos. Este hecho ha traído como consecuencia que los genomas fágicos secuenciados hasta el momento, representen solo una pequeña proporción del viroma de la biosfera (Hatfull, 2008).

En la mayoría de los casos, los fagos secuenciados corresponden a aquellos de importancia industrial, ambiental o de salud pública y animal. Una proporción reducida corresponde a fagos ambientales. Los fagos empleados como herramientas bacteriológicas no han sido estudiados a fondo, pese a su utilidad. Algunos ejemplos notables de fagos empleados en bacteriología que han sido secuenciados, son algunos de los fagos de Mycobacterium (Hatfull, 2006), fagos de Salmonella (Waldor et al., 2005), Streptococcus (Nelson et al., 2003) y Bacillus (Fouts et al., 2006) El genoma de estos fagos fue determinado en años recientes, mientras que los fagos fueron aislados hace por lo menos 30 años. En el caso de los brucellafagos ocurre el mismo fenómeno, ya que aunque estos fagos son ampliamente utilizados, no se conocen secuencias nucleotídicas que permitan investigar a fondo las características moleculares de estos virus.

Page 15: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

3. Justificación

Page 16: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

3.1 Justificación

La determinación de secuencias genómicas ha ampliado en los últimos años el estudio de los organismos y de los virus. Actualmente la investigación de los fagos ha revelado hallazgos tales como la transferencia horizontal de genes ribosomales (Beumer & Robinson, 2005), genes involucrados en fotosíntesis (Mann et al., 2005), genes codificantes de factores de virulencia (Wagner & Waldor, 2002), incluso genes que permiten la infección del hospedero por otros fagos (Lindqvist et al., 1993).

A pesar de que los brucellafagos han sido empleados durante mucho tiempo como herramientas bacteriológicas, poco se sabe acerca de su organización genética, o las funciones biológicas que pueden llevar a cabo además de su ciclo lítico. Entre dichas actividades, podría investigarse un posible ciclo lisogénico, los mecanismos por los cuales los brucellafagos lisan específicamente algunas cepas de Brucella, presencia de genes nuevos, relaciones filogenéticas con otros fagos, aportación de genes al hospedero que infectan, etc.

Los estudios moleculares realizados hasta la fecha en estos fagos han aportado poca información acerca de los fenómenos anteriormente descritos.

Se sabe que los fagos de distintas especies bacterianas juegan un papel muy importante en la diversificación y evolución de dichas especies, sin embargo, en el caso del genero Brucella el papel de los fagos no ha sido estudiado. Por lo anterior, en este trabajo se pretende dilucidar la secuencia genómica del brucellafago Tb, el cual ha sido empleado como fago de referencia durante más de 50 años. La información obtenida en este trabajo, será de utilidad para el estudio de la diversidad y evolución del género Brucella y sus fagos y además permitirá conocer y estudiar aspectos importantes del ciclo replicativo de estos virus.

Page 17: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

4. Objetivos

Page 18: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

4.1 Objetivo general

Determinar la secuencia genómica del brucellafago Tb.

4.2 Objetivos particulares.

Construir una librería genómica con fragmentos de DNA del brucellafago Tb.

Secuenciar los insertos presentes en los vectores recombinantes

Ensamblar las secuencias obtenidas para formar una secuencia contigua.

Analizar las secuencias generada, buscando propiedades de interés tales como marcos abiertos de lectura, regiones reguladoras etc.

Page 19: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

5. Material y Métodos

Page 20: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

5.1 Cepas bacterianas y brucellafagos

Se empleó Brucella abortus biovar 1 544 (ATCC 23448) como cepa propagadora del brucellafago Tb. Esta fue sembrada en medio Agar Brucella Casaminoácidos a partir de viales conservados a -20 °C, e incubada por 48 h a 37 °C bajo una atmosfera parcial de CO2 hasta su uso posterior.

Las cepas DH5α, DH10b y JM107 K12 de Escheria coli, fueron utilizadas en la construcción de las librerías genómicas del fago Tb. Las cepas DH5α y DH10b fueron cultivadas en medio LB, mientras que las colonias recombinantes fueron cultivadas en medio Luria Bertani (LB) suplementado con Ampicilina 100 µg/ml. Por otro lado, la cepa JM107 fue cultivada en medio M9 sin antibióticos

5.2 Propagación del fago Tb (Corbel & Thomas, 1980).

El fago Tb fue inoculado junto con Brucella abortus 544 en 5 ml de caldo soya tripticaseína con extracto de levadura (TSB-EL) con una multiplicidad de infección (MOI) de 0.1, esta mezcla se incubó durante 48 h a 37 °C con agitación orbital de 140 rpm. Una vez concluido el tiempo de propagación, éste se centrifugó a 10,000 × g durante 15 min, separando el sobrenadante, el cual fue filtrado a través de una membrana de 0.22 µm de diámetro de poro.

El filtrado anterior se empleo para inocular un volumen de 50 mL y éste último se inoculó en un volumen de 1 L. Una vez terminada la incubación de la última propagación, se agregaron 100 µl de RNAsa-A 10 mg/mL y 100 µL de DNAsa I 10 mg/mL, se incubó 1 h a 37°C con la finalidad de eliminar DNA y RNA bacteriano.

Al término de la incubación, la propagación se centrifugó 15 min a 10,000 × g y el sobrenadante se filtró a través de un dispositivo SteriCup de 500 ml (Millipore®). Al filtrado anterior se adicionó polietilenglicol 8000 sólido hasta una concentración final de 10% y NaCl sólido hasta una concentración de 1M. Esta mezcla se mantuvo a 4°C durante 24 h, luego se centrifugó a 10,000 × g durante 20 min, descartando el sobrenadante.

El sedimento anterior fue resuspendido en 5 mL de imidazol 10 mM y se adicionaron 5 mL de cloroformo, la suspensión se agitó vigorosamente hasta emulsificarla, posteriormente se centrifugó a 11,000 × g durante 20 min, colocando la fase acuosa, que contenía las partículas fágicas, en un tubo nuevo y estéril.

5.3 Determinación del título de la suspensión fágica (Corbel & Thomas, 1980).

A un tubo con 5 mL de medio TSA semisólido fundido, se agregaron 100 µL de diluciones seriales de la suspensión fágica obtenida anteriormente, desde 10-1 hasta 10-15, y 100 µL de una suspensión de Brucella abortus 544 ajustada al tubo 3 del nefelómetro de McFarland. Estas mezclas se vaciaron en placas con TSA, y se incubaron 24 h a 37°C.

Una vez concluido el tiempo de incubación, se cuantificaron las placas líticas y titulo de la suspensión fágica se determinó multiplicando el número de placas observadas, por el inverso de la dilución empleada y el inverso de la alícuota.

5.4 Obtención de DNA fágico (Modificado de Rigby et al., 1989).

Se tomó 1 mL de una suspensión fágica de título elevado (1014 ufp/ml)., se adicionó proteinasa K hasta una concentración de 625 µg/mL se incubó 1h a 37°C y posteriormente se adicionaron 500 µL de regulador TE y 500 L de SDS 24%, esta mezcla se incubó durante 10 min a 80 °C, luego de lo cual se

Page 21: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

adicionaron 2 mL de fenol : cloroformo : alcohol isoamílico (25:24:1) se agitó vigorosamente y se centrifugó a 6,000 × g durante 5 min, se tomó la fase acuosa, a la cual se le realizaron una extracción con fenol : cloroformo : alcohol isoamílico y una extracción con cloroformo : alcohol isoamílico (24:1).

A la fase acuosa de la última extracción se le adicionaron 5 mL de etanol absoluto, y el DNA se dejó precipitando toda la noche a -20 °C, posteriormente se centrifugó 10 min a 6,000 x g y se descartó el sobrenadante. Al sedimento se adicionó 1 mL de Etanol 70% frio, se agitó por inversión y se centrifugó 5 min a 6,000 × g. El DNA se llevó a sequedad al aire y fue resuspendido en 1 mL de agua desionizada estéril. El DNA obtenido se cuantificó espectrofotométricamente, y posteriormente, fue utilizado para la construcción de las librerías genómicas.

5.5 Fragmentación aleatoria del DNA fágico (Modificado de Rohwer et al., 2000).

5.5.1 Se digirieron parcialmente 100 ng de DNA fágico con 0.25 unidades de la enzima Sau3 A1, durante 1, 2, 3, 4, 5, 10, 15, 20, 25 y 30 min con la finalidad de obtener fragmentos de entre 1,000 y 1,500 bp, los cuales serían ligados en los vectores pBluescript II y m13 mp19.

5.5.2 Para el método de fragmentación aleatoria del DNA fágico se empleó un disgregador Gene Machines Hydroshear®, el cual hace pasar el DNA a alta presión a través de una ranura delgada de rubidio.

Se hicieron pasar 5 µg de DNA a través de la ranura, con un programa de presurización precargado en el software del aparato, para obtener en dos corridas independientes fragmentos de entre 1,500 a 3,000 pb y de 3,000 a 5,000 bp.

5.6 Construcción de las librerías genómicas (Chen 2002).

5.6.1 Los productos de la digestión del DNA fágico obtenidos en el punto 5.5.1 fueron ligados en el vector pBluescript y en el vector m13 mp19 empleando 5 unidades de la enzima, 10 ng de DNA y 3 ng de vector.

5.6.2 Los fragmentos obtenidos en el punto 5.5.2 fueron reparados empleando el fragmento Klenow de la DNA polimerasa I y la DNA polimerasa del fago T4; en la tabla 2 se muestran las cantidades agregadas para obtener fragmentos de DNA con extremos romos.

Tabla 2 Reactivos y cantidades empleados en la reacción de reparación de extremos cohesivos

Reactivo Cantidad React ® 2 13 µL

dNTPs 10 µL T4 polimerasa (1u/µL) 1 µL

Fragmento Klenow de la DNA polimerasa I (1 u/µL) 6 µL Fragmentos de DNA 100 µL

Volumen final 130 µL

Page 22: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Una vez terminada la reacción, los fragmentos del DNA fueron visualizados en un gel de agarosa 1% teñido con Bromuro de Etidio 0.01%. Este gel se cortó y se extrajeron los segmentos correspondientes a un tamaño molecular de entre 1,500 a 3,000 bp y de entre 3,000 a 5,000 bp.

Cada segmento del gel fue depositado en un dispositivo de filtración montado en un microtubo de 1,500 µL, se llevó a congelación a -80°C y se mantuvo a esa temperatura por 20 min. Inmediatamente se centrifugó a 18,000 × g durante 10 min, colectando el filtrado. Al filtrado se adicionó 1 mL de etanol absoluto, y se mantuvo en nitrógeno liquido durante 15 min, luego se centrifugó a 18,000 × g por 5 min, se eliminó el sobrenadante y el sedimento se resuspendió en 20 µL de agua.

Los fragmentos reparados, fueron cuantificados espectrofotométricamente y se ajustaron a una concentración final de 50 ng/µl.

Los fragmentos romos obtenidos en el punto 5.5, fueron insertados en el vector pJET 1.2 mediante una ligación con T4 ligasa. En la tabla 3 se muestran las cantidades empleadas para llevar a cabo la reacción.

Tabla 3Reactivos y cantidades empleadas en la construcción de las librerías genómicas

Reactivo Cantidad

Librería S (1.5-3.0 kbp) Librería L (3.0-5.0 kbp) Librería 1 Librería 2 Librería 3 Librería 4

Regulador de ligación 2.5 µl 2.5 µl 2.5 µl 2.5 µl T4 ligasa (5 u/µl). 1 µl 1 µl 1 µl 1 µl

Vector 0.5 µl 0.5 µl 0.5µl 0.5µl Inserto 1.5 µl 0.5 µl 1.5 µl 0.5 µl

Agua desionizada 0 µl 1 µl 0 µl 1 µl Volumen final 5 µl 5 µl 5 µl 5 µl

La reacción se llevó a cabo toda la noche a 16 °C y los productos de ligación fueron dializados a

través de una membrana de 0.02 µm de diámetro de poro para su posterior uso en la transformación de células competentes One Shot TOP 10®.

5.7 Obtención de clonas recombinantes (Sambrook & Russel, 2001).

Los productos de ligación de obtenidos con los vectores pBluescript II y m13mp19 fueron utilizados para transformar células químicamente competentes de Escherichia coli DH10b y JM107 respectivamente.

Los productos de ligación del vector pJET 1.2 fueron insertados por electroporación en células electrocompetentes One Shot TOP 10 ®.

5.8 Transformación de células con vectores recombinantes pBluescript (Sambrook & Russel, 2001).

Se agregaron 3 µL del producto de ligación a un vial con células químicamente competentes de E. coli DH10b, éste se incubó en hielo durante 30 min. Posteriormente el vial se sometió a un choque térmico de 4°C a 42°C durante 45 segundos y nuevamente a 4 °C. Después del choque térmico se agregaron 500 µL de medio LB y se incubó 30 min a 37°C. Para la obtención de clonas recombinantes se extendieron 50 µL de esta suspensión en placas de agar LB con ampicilina 100 µg/mL, IPTG 20 mM y

Page 23: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

XGal 80 µg/mL. Estas placas fueron incubadas 24 h a 37°C y al término del tiempo de incubación, se seleccionaron las colonias que no presentaran coloración azul.

5.9Transformación de células con vectores recombinantes m13mp19 (Sambrook & Russel, 2001).

Se agregaron 3 µL del producto de ligación a un vial que contenía células químicamente competentes de E. coli JM107, el vial fue incubado en hielo durante 30 min. Posteriormente se sometió a un choque térmico de 4°C a 42°C durante 45 segundos y nuevamente a 4°C. Después se agregaron 500 µL de medio M9 y se incubaron 30 min a 37°C.

A un tubo con agar LB fundido a 45 °C se agregaron 50 µL Del producto de transformación, 100 µl de una suspensión de E. coli JM107 en fase logarítmica de crecimiento, 80 µg/ml de XGal y 20 mM de IPTG.

Esta mezcla se homogeneizó por agitación suave y se vació en placas de agar LB sin antibiótico. Las placas fueron incubadas por 24 h a 37°C, luego de lo cual se seleccionaron las placas turbias que no presentaran coloración azul.

5.10 Transformación de células con vectores recombinantes pJET 1.2

Los producto de ligación del plásmido pJET1.2 dializados fueron utilizados para transformar células One Shot TOP 10 ® electrocompetentes (Invitrogen) mediante un pulso eléctrico de 2000 V durante 10 ms. A la celda de electroporación se agregaron 500 µL de medio LB, y se incubaron en hielo durante 30 min. Luego las células fueron transferidas a tubos estériles a los cuales se agregó 1 mL de medio LB y se incubaron durante 30 min a 37 °C.

Una vez completado el proceso de transformación, la suspensión celular fue extendida en placas de agar LB adicionado de ampicilina, y se incubaron 24 h a 37°C. Posteriormente se tomaron las colonias presentes en el medio.

Para realizar un control de calidad y explorar la proporción de clonas recombinantes se seleccionaron 10 clonas de cada placa que fueron sometidas a un Colony-PCR. En la tabla 4 se muestran las cantidades empleadas para la reacción, así como las condiciones del PCR.

Tabla 4 Reactivos y condiciones de la reacción de PCR para el control de calidad de la transformación de E. coli con vectores recombinantes pJET 1.2

Reactivo Cantidad Condiciones de PCR Regulador de PCR (10 X) 2 µL Desnaturalización Inicial 94 °C 5 min

dNTPs 10 mM 2 µL Desnaturalización 96 °C 1 min 30

ciclos MgCl2 2.5mM 1 µL Alineamiento 60 °C 30 s

Oligonucleótido sentido 10 pm 0.4 µL Extensión 72 °C 5 min Oligonucleótido reverso 10 pm 0.4 µL Extensión final 72 °C 10 min Colonia presente en el medio 1

Una vez confirmada la presencia de inserto en más del 70 % de las clonas analizadas, se

procedió a propagar las colonias restantes en medio LB liquido adicionado de ampicilina 100 µg/ml incubado a 37°C durante 24 h con agitación orbital a 180 rpm.

Page 24: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

5.11 Obtención de DNA plasmídico a partir de las clonas recombinantes. (Sambrook & Russel, 2001).

Las clonas recombinantes de las librerías del fagémido pBluescript II, así como aquellas de las librerías del plásmido pJET 1.2 con insertos de 1,500 a 3,000 bp, fueron cultivadas en medio LB líquido adicionado de ampicilina 100 µg/mL. Las clonas obtenidas con el vector m13mp19 fueron propagadas en medio LB sin dextrosa y sin antibiótico. Se cosechó la biomasa de estos cultivos por centrifugación y se procedió a extraer DNA plasmídico mediante la técnica de lisis alcalina.

La biomasa de las clonas recombinantes fue resuspendida en 100 µL de la solución I de lisis alcalina (Apéndice xx), y se agitó vigorosamente hasta su total resuspensión. Se adicionaron 200 µL de Solución II de lisis alcalina (Apéndice xx) y se mezcló por inversión, luego de este paso se adicionaron 150 µL de Solución III de lisis alcalina (Apéndice xx), mezclando nuevamente por inversión.

Las mezclas resultantes se centrifugaron 5 min a 18,000 × g y el sobrenadante fue transferido a un tubo con 500 µL de fenol: cloroformo: alcohol isoamílico (25:24:1), este tubo se agitó en vortex hasta emulsificar y se centrifugó 5 min a 18,000 × g, luego se tomó la fase acuosa y se transfirió a un tubo con 1 mL de etanol absoluto. Este tubo se llevó a -20 °C y se incubó a esa temperatura toda la noche.

El DNA fue sedimentado mediante centrifugación a 18,000 × g durante 10 min, se eliminó el sobrenadante y se adicionó 1 mL de etanol 70% frío, se mezcló por inversión y se centrifugó 5 min a 18,000 × g, nuevamente se descartó el sobrenadante y el DNA se llevó a sequedad al aire. Finalmente, el DNA se resuspendió en 50 µL de agua desionizada estéril.

Los plásmidos de las clonas recombinantes provenientes de la librería del vector pJET 1.2 con insertos de 3,000 a 5,000 bp, fueron purificados empleando el kit QIAPREP mini de QIAGEN®, siguiendo las instrucciones del fabricante.

Los plásmidos provenientes de las librerías construidas, fueron separados en un gel de agarosa 1% teñido con bromuro de etidio 0.01%.

5.12 Confirmación de los insertos presentes en las clonas recombinantes. (Sambrook & Russel, 2001).

5.12.1 Los plásmidos provenientes de las clonas obtenidas con los vectores pBluescript y m13mp19 fueron analizadas mediante restricción enzimática con la finalidad de liberar los insertos presentes en el vector. Se empleó la enzima Eco RI para los plásmidos de la librería construida con pBluescript II y la enzima Hin DIII para m13mp19. Los productos de la restricción enzimática fueron visualizados en un gel de agarosa 1% teñido con bromuro de etidio 0.01%

5.12.2 Los plásmidos provenientes de las clonas obtenidas con el vector pJET 1.2 fueron analizados mediante PCR empleando los iniciadores incluidos en el kit de clonación, bajo las condiciones de PCR descritas en el punto 5.10, cambiando únicamente el DNA molde, ya que en este caso se emplearon 2 µL de DNA plasmídico obtenido de las clonas recombinantes.

Page 25: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

5.13 Purificación de los productos de PCR de las clonas recombinantes.

Los productos de PCR obtenidos de las clonas recombinantes del vector pJET 1.2 fueron purificados empleando el kit Zymo® clean and concentrator 5, de acuerdo a las instrucciones del fabricante.

5.14 Secuenciación de los insertos presentes en las clonas recombinantes.

Algunos de los plásmidos purificados con el kit QIAPREP, así como los productos de PCR purificados con el kit Zymo clean and concentrator, fueron secuenciados empleando el kit DTCS de Beckman, bajo las instrucciones del fabricante. En la tabla se muestran los reactivos para la mezcla de reacción, así como las condiciones de la reacción.

Los productos de secuenciación fueron purificados mediante precipitación con Etanol 95% y glucógeno. Estos productos fueron separados en un equipo Beckman CEQ 2000. El resto de los plásmidos o productos de PCR fueron secuenciados empleando el kit BigDye terminator de Applied biosystems, y separados en un equipo ABI3730XL.

Tabla 5 Reactivos y condiciones de las reacciones de secuenciación

Reactivo Cantidad Condiciones de reacción DTCS Master mix 8 µL Desnaturalización Inicial 95 °C 5 min

DNA molde 1 µL Desnaturalización 95 °C 30 s 30 ciclos Oligonucleótido 10 pm 1 µL Alineamiento 56 °C 30 s

Extensión 62 °C 2 min Extensión final 62 °C 5 min

5.15 Análisis de las secuencias obtenidas en la secuenciación.

Los cromatogramas y las secuencias obtenidas en las reacciones de secuenciación fueron visualizados empleando el programa Chromas versión 2.13. Las secuencias correspondientes a los iniciadores y al vector utilizado fueron removidas manualmente.

5.16 Ensamblaje de las secuencias curadas.

Las secuencias nucleotídicas libres de vector y de iniciadores fueron ensambladas dentro de una misma secuencia contigua (contig) empleando el programa DNA baser versión 2.16. Los parámetros de este programa se ajustaron para detectar regiones traslapadas de por lo menos 20 bases, con una similitud de por lo menos 80%.

Las secuencias de los contigs ensamblados fueron guardados en archivos individuales, a los cuales se les asigno una clave C (contig) y un numero. Así, la secuencia del primer contig ensamblado, es el archivo C01.fasta.

5.17 Determinación de marcos abiertos de lectura (Modificado de Rohwer et al., 2000).

Una vez ensambladas las secuencias, se procedió a determinar la presencia de Marcos abiertos de lectura (ORFs por sus siglas en ingles) Para lograr este objetivo se utilizó el programa Artemis versión 11.0 empleando el código genético universal, la longitud de los marcos de lectura se ajustó a un mínimo de 30 aminoácidos, precedidos de un codón de paro.

Page 26: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Las secuencias de los ORFs obtenidos fueron guardadas en archivos individuales nombrados considerando el contig al que pertenecen, la pauta de la secuencia y la posición que ocupan, así, el archivo del primer ORF del contig 1 en la primera pauta de la cadena positiva fue nombrado C01 F01 O01.fasta (Contig 01, Forward frame 01, ORF 01).

5.18 Búsqueda tipo BLAST de secuencias similares a los ORFs detectados (Altschul et al., 1990).

Las secuencias aminoacídicas y nucleotídicas de los ORFs detectados fueron comparadas contra las bases de datos del NCBI, empleando los algoritmos BLASTn, BLASTx y BLASTp en el servidor del NCBI (http://blast.ncbi.nlm.nih.gov/Blast.cgi) Una vez completada la búsqueda se guardaron los resultados como páginas web para su posterior análisis.

5.19 Corrección de los marcos abiertos de lectura.

Las secuencias nucleotídicas y aminoacidicas de los ORFs obtenidos, fueron editadas con base en el resultado obtenido de alinear dichas secuencias con las secuencias obtenidas en la búsqueda tipo BLAST.

5.20 Búsqueda de promotores transcripcionales

Las secuencias nucleotídicas de los contigs ensamblados, fueron analizadas buscando la presencia de promotores de expresión, empleando diferentes programas, en la tabla 6 se muestran los programas empleados, su servidor web y el fundamento de la búsqueda realizada.

Tabla 6Programas y servidores empleados en la predicción de promotores transcripcionales.

Programa Servidor Algoritmo

BDGP http://www.fruitfly.org/seq_tools/promoter.ht

ml Red neural

Prokaryotic Promoter Prediction http://bioinformatics.biol.rug.nl/websoftware/p

pp/ppp_start.php Modelos Ocultos

de Marcov

Virtual footprinter http://www.prodoric.de/vfp/vfp_promoter.php Matriz posición

ponderada

BPROM http://linux1.softberry.com/berry.phtml?topic=

bprom&group=programs&subgroup=gfindb Alineamientos

locales 5.21 Búsqueda de terminadores transcripcionales

Para definir si un conjunto de ORFs pudieran presentar un arreglo del tipo de un operón, se llevó a cabo la búsqueda de terminadores transcripcionales empleando el programa FindTerm en el servidor softberry. El software del servidor busca una secuencia característica que da lugar a una estructura secundaria de tipo tallo-asa, seguida de una región rica en timina.

5.22 Análisis de frecuencia de uso de codones de los ORFs predichos (Supek & Vlahoviček, 2004).

Para determinar la similitud entre el uso preferencial de codones entre el fago Tb y su hospedero, se llevo a cabo el análisis de la frecuencia de uso de codones sinónimos. Para lo cual, se descargaron del servidor FTP del NCBI, las secuencias nucleotídicas de 29,407 genes de Brucella abortus, Brucella canis, Brucella melitensis, Brucella ovis, Brucella suis y Mesorhizobium BNC 1. Inicialmente, se analizaron gráficamente las frecuencias absolutas de uso de codones en empleando el programa INCA

Page 27: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

versión 2.0. Posteriormente se llevó a cabo el cálculo del número de codones efectivos (ENC por sus siglas en ingles) de dichos genes y de los ORFs encontrados en los contigs ensamblados.

5.23 Análisis de motivos estructurales presentes en los ORFs predichos.

Las secuencias aminoacídicas de los ORFs detectados fueron comparadas con las bases de datos de NCBI, InterProScan y SBASE mediante sus servidores en línea, los motivos predichos por los servidores mencionados fueron evaluados mediante la puntuación asignada a la secuencia detectada y al alineamiento de esta con respecto a la secuencia depositada en cada base de datos. En la tabla 7 se muestran los servidores empleados, así como la dirección electrónica de sus servidores web, el intervalo de la puntuación asignada y la puntuación optima para determinar si los motivos estructurales son correctos.

Tabla 7 Servidores empleados en la detección de dominios conservados

Base de datos Dirección electrónica Puntuación

Intervalo Optimo NCBI http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml ∞ a 0 0

InterProScan http://www.ebi.ac.uk/Tools/InterProScan / ∞ a 0 0 SBASE http://hydra.icgeb.trieste.it/sbase/ 0 a 100 100

5.24 Determinación de los ORFs verdaderos

Una vez completado el análisis bioinformático de las secuencias nucleotídicas de los contigs ensamblados, se procedió a determinar cuáles de los ORFs obtenidos correspondían a genes verdaderos, con base en los resultados obtenidos en cada análisis.

5.25 Asignación de funciones a los ORFs encontrados.

Para definir las funciones de los productos de los ORFs encontrados, se integraron los resultados obtenidos en la búsqueda tipo BLAST, así como la búsqueda de motivos estructurales. Por otro lado las secuencias aminoacídicas fueron analizadas en el servidor SBASE function, el cual integra los resultados del servidor SBASE motif scan, y asigna una función a la proteína, con una puntuación porcentual.

5.26 Organización del genoma del fago Tb.

Con base en la función asignada a los genes encontrados, así como a los resultados obtenidos en la búsqueda tipo BLAST, se determino el acomodo de los contigs ensamblados en el genoma del fago TB.

5.27 Comparación del genoma del fago Tb con el genoma de Mesorhizobium sp. BNC1

La secuencia nucleotídica del fago Tb fue comparada con la secuencia nucleotídica cromosomal de Mesorhizobium sp. BNC1 comenzando en el nucleótido 250838, y terminando en el nucleótido 280000 en la cadena positiva, mediante la opción “Compare two sequences” en el servidor BLASTx. La tabla de similitudes obtenida, fue cargada en el programa Artemis Comparison Tool versión 8.0 y los resultados visualizados fueron exportados en una imagen donde se muestra el grado de similitud entre las dos secuencias y el grado de cobertura.

Page 28: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

6. Resultados

Page 29: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

6.1 Obtención de DNA fágico

Con el fin de verificar la integridad del DNA fágico obtenido se realizó una electroforesis en gel de agarosa al 1%. No se incluyó marcador de tamaño molecular. En la figura 2 se muestra la imagen obtenida.

6.2 Construcción de las librerías genómicas.

Con la finalidad de obtener fragmentos de entre 1000 y 1500 bp se digirió parcialmente el DNA fágico con la enzima Sau3 a diferentes tiempos. En la figura 4 se muestra un gel de agarosa 1% en el que se puede visualizar la restricción parcial obtenida. Se observó que entre 3 y 4 minutos se obtenían los fragmentos del tamaño esperado, sin embargo con la finalidad de obtener mayor cantidad producto se incluyeron los productos de los demás tiempos

Al emplear el disgregador Gene Machines Hydroshear se obtuvo una mayor calidad en los fragmentos generados ya que no hubo tanta dispersión en el tamaño de éstos en comparación con los fragmentos generados por vía enzimática.

1 2 3

Figura 3 Electroforesis en gel de agarosa del DNA obtenido, carril 1: dilucion 1:100; carril 2: dilución 1:100; carril 3: sin dilución .

1 2 3 4 5 6 7 8

Figura 4 Figura 3. Electroforesis en gel de agarosa 1% de las restricciones del DNA fágico con Sau3 a diferentes tiempos, carril 1 DNA ladder 1 kb plus, carril 2, 1’, carril 3, 2’ carril 4, 3’, carril 5, 4’ carril 6, 5’, carril 7, 10’ y carril 8 15’. En el recuadro se muestra el intervalo de 1000 a 1500 bp

Page 30: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

La librería construida con el vector pJET 1.2 e insertos de entre 1.5 y 3 kbp se nombró Librería S. La librería construida con el vector pJET 1.2 e insertos de entre 3 y 5 kbp se nombró Librería L

6.3 Obtención de clonas recombinantes

A partir de las librerías construidas, se aislaron y propagaron clonas recombinantes, en el caso de la librería construida con el vector pBluescript II se propagaron 200 clonas; para el vector m13mp19 se aislaron y propagaron 100 clonas y finalmente se obtuvieron 488 clonas con el vector pJET 1.2.

6.4 Obtención de DNA plasmídico a partir de las clonas recombinantes.

Se obtuvieron 100 plásmidos a partir de las clonas de la librería construida con pBluescript II; 100 plásmidos mas a partir de la librería construida con m13mp19 y 488 plásmidos a partir de la librería del vector pJET 1.2. Los productos de la extracción fueron visualizados en geles de agarosa 1% como se muestra en la figura 5.

Figura 7 a Electroforesis en gel de agarosa del DNA plasmídico obtenido a partir de las clonas provenientes de la librería construida con pBluescriptII. Carril 1 DNA ladder 1kb plus, carriles 2 a 14 clonas 1 a 13.

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Figura 5b Electroforesis en gel de agarosa 1% del DNA plasmídico obtenido a partir de las clonas provenientes de la librería construida con m13mp19. Carriles 1 y 40 DNA ladder 1kb plus, carriles 2 a 39 clonas 1 a 38

Figura 5c Electroforesis en gel de agarosa al1% del DNA plasmídico obtenido a partir de las clonas provenientes de la librería S. Carriles 1 a 40 clonas 1 a 40

Figura 6d Electroforesis en gel de azarosa al1% del DNA plasmídico obtenido a partir de las clonas provenientes de la librería L Carriles 1 a 40 clonas 1 a 40

1 2 3 4 5 6 7 8 9 10 11 1213 1415 161718 19 20 2122 23 24 2526 27 2829 30 31 3233 3435 3637 38 3940

1 2 3 4 5 6 7 8 9 10 11 1213 1415 161718 19 20 2122 23 24 2526 27 2829 30 31 3233 3435 3637 38 3940

1 2 3 4 5 6 7 8 9 10 11 1213 1415 161718 19 20 2122 23 24 2526 27 2829 30 31 3233 3435 3637 38 3940

Page 31: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

6.5 Confirmación de los insertos presentes en las clonas recombinantes.

Los plásmidos obtenidos de la librería construida con pBluescript II no pudieron ser digeridos con la enzima Hin DIII, por lo que se intentó digerir los plásmidos con Eco R1. Esta digestión no tuvo éxito tampoco, por lo que se intento digerir el plásmido sin inserto a partir del cual se habían hecho las construcciones, sin embargo el DNA de este plásmido permaneció refractivo a la digestión con estas enzimas.

En el caso del plásmido m13mp19 se logró verificar la presencia de insertos mediante restricción enzimática con Hin DIII, en la figura 6 se muestran algunos productos de restricción de las clonas obtenidas a partir de la librería construida con el vector m13mp19.

Las clonas obtenidas a partir de la librería construidas con pJET 1.2 fueron sometidos a un PCR para confirmar la presencia de insertos en los vectores. En la figura 7 se muestran algunos de los productos de PCR obtenidos. Como puede observarse algunos de los amplificados no correspondieron al tamaño esperado (1500-3000 bp).

6.6 Secuenciación de los insertos presentes en las clonas recombinantes.

Los insertos fueron secuenciados generando secuencias de entre 40 y 1,500 bp. Los plásmidos de la librería L generaron un total de 42 secuencias, mientras que a partir de la librería S, se obtuvieron 152.

Al concluir las reacciones de secuenciación y la separación de los productos de las reacciones, los electroferogramas obtenidos fueron renombrados considerando la clona de la cual provenían, así

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

Figura 6 Electroforesis en gel de agarosa 1% de las restricciones del DNA plasmídico obtenido a partir de las clonas provenientes de la librería construida con m13mp19. Carril 1 DNA ladder 1 kb plus, carriles 2 a 22, clonas 1 a 21. En los recuadros se muestran los insertos liberados.

1 2 3 4 5 6 7 8 9 10 11 12 131415 16 1718 19 20 2122 23 24 252627 282930 31 32 33 34 353637 383940

Figura 7 Electroforesis en gel de agarosa al 1% de los productos de PCR obtenidos con los iniciadores del vector pJET 1.2 a partir de las clonas de la librería S. Carriles 1 y 40 DNA ladder 1 kb plus, en los carriles 2 a 39, se muestran los productos de las clonas 1 a 38

Page 32: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

como el iniciador empleado en la reacción de secuenciación. De tal forma que la clona número tres, de la librería L generó 2 secuencias, la secuencia 03 F y la secuencia 03 R. y de la misma manera, la clona de 3 de la librería S genero dos secuencias, la secuencia 003 F y la secuencia 003 R.

Para determinar el número de clonas a secuenciar con la finalidad de cubrir el mayor porcentaje posible del genoma fágico, se empleó la siguiente ecuación

Donde p, es el porcentaje de cobertura, i es el tamaño promedio de los insertos de las librerías y g el tamaño en bp del genoma. Sustituyendo p con 0.999, i con 2,250 y 4,000, y g con 43,500, se tiene que para las librerías construidas con insertos de 1,500 a 3,000 bp se requiere secuenciar 130 clonas, mientras que con las librerías de 3,000 a 5,000 bp únicamente se requiere secuenciar 72 clonas.

6.7 Ensamblaje de las secuencias curadas.

Las secuencias nucleotídicas libres de vector y de iniciadores fueron ensambladas dentro de secuencias contiguas (contigs) empleando el programa DNA baser versión 2.16.

Se lograron ensamblar 167 secuencias en 15 contigs, las secuencias restantes no pudieron ser ensambladas en ningún contig ni consigo mismas. En la tabla 8 se muestran los contigs construidos, su tamaño, las secuencias que los conforman y el porcentaje de cobertura con respecto al tamaño esperado del DNA del brucellafago Tb

Tabla 8 Ensamblaje de las secuencias curadas, en la columna tres se indican las secuencias individuales que conforman cada contig.

Contig Tamaño

(bp). Secuencias que lo conforman

Porcentaje de cobertura

C01 2622 04 F, 061 R, 089 R, 10 F, 10 R, 11 F, 11 R, 112 R,

137 F, 137 R, 144 F, 144 R, 17 F, 17 R, 173 F, 173 R, 231 F, 231 R, 24 F, 24 R

6.03

C02 4735

003 R, 004 F, 005 F, 030 R, 05 F, 05 R, 056 R, 071 R, 072 F, 072 R, 090 R, 105 F, 105 R, 109 R, 123 F, 123 R, 125 F, 125 R, 128 F, 128 R, 135 F, 135 R, 140 F,

140 R, 143 F, 143 R, 176 F, 176 R, 179 R, 18 F, 18 R, 22 F, 22 R, 225 F, 225 R, 23 F, 23 R, 13 F

10.89

C03 2184 091 F, 091 R, 119 F, 119 R, 12 F, 12 R, 169 F, 169 R,

217 F, 217 R, 227 F, 227 R 5.02

C04 1664 02 F, 02 R, 131 F, 131 R, 205 F, 205 R, 236 F, 236 R,

268 3.83

C05 1711 080 R, 097 F, 097 R, 118 F, 118 R, 129 R, 130 F, 130

R, 142 F, 142 R, 16 F, 16 R, 214 F, 214 R 3.93

C06 1595 181 F, 181 R, 21 F, 21 R 3.67

C07 4037 055 R, 070 R, 09 F, 09 R, 095 F, 095 R, 122 F, 122 R, 15 F, 15 R, 154 F, 154 R, 162 F, 162 R, 163 F, 163 R,

180 F, 180 R, 25 F, 255 F, 255 R, 274 F, 274 R 9.28

C08 2165 054 R, 066 R, 078 R, 081 R, 093 R, 215 F, 215 R, 216 F, 216 R, 218 F, 218 R, 219 R, 254 F, 254 R, 26 F, 26

R 4.98

C09 530 156 F, 156 R, 229 F, 229 R 1.22

Page 33: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Tabla 8 Continuación

Contig Tamaño

(bp). Secuencias que lo conforman

Porcentaje de cobertura

C10 669 04 R, 12 F 1.54 C11 778 003 F, 005 R, 006 F, 079 R, 094 F, 094 R, 106 R 1.79 C12 456 167 F, 167 R, 209 F, 209 R, 210 F, 210 R 1.05 C13 1103 07 F, 117 F, 117 R, 171 F, 171 R 2.54 C14 362 031 F, 031 R, 134 F, 134 R 0.83 C15 939 044 F, 044 R, 059 R 2.16

Secuencias no ensambladas

4119

007 F, 007 R, 032 F, 032 R, 053 F, 053 R, 057 F, 058 F, 104 R, 164 F, 164 R, 175 F, 175 R, 183 F, 183 R,

200 F, 200 R, 204 F, 204 R, 206 R, 207 F, 207 R, 212 F, 212 R, 253 F, 253 R

9.47

Total 29669 68.2 6.8 Determinación de marcos abiertos de lectura

La determinación de marcos abiertos de lectura (ORFs por sus siglas en ingles), se llevo a cabo empleando el programa Artemis versión 10.0. En total se encontraron 115 marcos de lectura abiertos, los cuales fueron posteriormente analizados.

6.9 Búsqueda tipo BLAST

Las secuencias de los ORFs obtenidas mostraron una similitud muy baja con respecto de las secuencias depositadas en bases de datos. Se observó que únicamente 13 de 115 secuencias mostraron una puntuación mayor a 50 en la búsqueda tipo BLASTn mientras que con los algoritmos BLASTx y BLASTp se obtuvieron 20 secuencias con una puntuación mayor a 50

6.10 Búsqueda de promotores transcripcionales

Al realizar la búsqueda de promotores empleando el servidor Virtual footprinter se descartaron los resultados debido a que el programa detectaba un número elevado de promotores en las secuencias analizadas, de tal forma que el numero de falsos positivos podría ser muy alto. Con los servidores BPROM, Prokaryotic Promoter Prediction y DBGP se lograron identificar algunas regiones que contenían más de una secuencia promotora. Se determinó que dichas regiones no se encontraban adyacentes al extremo 5’ de cualquiera de los ORFs, por lo que probablemente ninguno de los promotores predichos correspondía a algún promotor real.

6.11 Búsqueda de terminadores transcripcionales

En total se lograron detectar 5 terminadores transcripcionales, sin embargo, estos no se encontraron adyacentes al extremo 3’ de los ORFs, por lo que, al igual que los promotores transcripcionales encontrados, pudiera no tratarse de terminadores reales.

6.12 Análisis de frecuencia de uso de codones sinónimos

Bajo la suposición de que los genes presentes en el genoma del fago Tb deben ser expresados de manera eficiente por la maquinaria celular, se infirió que estos genes presentaran la misma distribución en la frecuencia de uso de codones sinónimos, que la distribución observada en genes de Brucella abortus. Mediante el uso del programa INCA, se logro determinar si existía alguna distribución

Page 34: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

especifica de codones sinónimos en Brucella. En la figura xxx se observa que efectivamente existe preferencia por algunos codones. En términos biológicos podría representar un uso muy eficiente de la maquinaria traduccional por parte de la bacteria debido a la falta de algún tRNA de algún codón sinónimo, o la relativa abundancia de alguno de ellos.

Una vez obtenidos los marcos de lectura del fago Tb, se analizó la frecuencia de uso de codones de cada ORF, y se determino el numero efectivo de codones (ENC por sus siglas en ingles) Esta medida fue comparada con el ENC de xxxxx genes de Brucella abortus que es hospedero natural del fago Tb; y con Mesorhizobium sp. BNC1 debido al porcentaje de similitud e identidad que guardan las secuencias aminoacidicas de los genes presentes en ambos genomas.

El estimador ENC nos permite inferir el grado de expresividad de los ORFs analizados con base en el uso eficiente de codones en el proceso de traducción. El valor mínimo de ENC es de 21, lo que representa el uso de un solo codón para cada aminoácido. El valor máximo de ENC es de 61 y corresponde a un gen que haga uso de todos los codones sinónimos para los aminoácidos que contengan. En términos de la fisiología de los organismos, un gen con un ENC de 21 mostraría una expresividad elevada, debido al uso eficiente de RNAs de transferencia, mientras que un ENC de 61 implicaría que el gen analizado, probablemente no presenta una expresividad muy alta (Wright, 1990).

Para determinar la posible expresividad de los ORFs encontrados en el genoma del fago Tb, se compararon los ENC de de algunas proteínas ribosomales presentes en los genomas anotados de Brucella abortus, Brucella canis, Brucella melitensis, Brucella ovis, Brucella suis y Mesorhizobium BNC1, las cuales corresponden a genes de alta expresividad; y se determino también el ENC de algunas proteínas presentes en los genomas anteriormente descritos relacionadas con fagos. En la tabla xx se muestran los resultados obtenidos, y en la figura xx la representación de los mismos.

Figura 8 Distribucion de las frecuencias de uso de codones en los genes de Brucella abortus (barras rojas)., Brucella melitensis (barras verdes) y Brucella suis (barras amarillas) En los recuadros morados se muestran los codones de uso poco frecuente.

Page 35: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

0

50

100

150

200

0

2000

4000

6000

8000

10000

24 27.9 31.8 35.7 39.6 43.5 47.4 51.3 55.2 59.1

Total ORFs Tb Proteínas Ribosomales Proteínas relacionadas con fagos

Tabla 9 Numero de genes presentes en cada clase del histograma. Las clases fueron construidas a partir del valor medio de ENC.

Clase 1 2 3 4 5 6 7 8 9 10

ENC promedio 24 27.9 31.8 35.7 39.6 43.5 47.4 51.3 55.2 59.1 Número de Genes 7 76 436 2460 6885 8076 5480 2798 1412 1777 Genes ribosomales 1 29 78 184 86 83 21 11 1 0

ORFs del fago Tb 0 0 1 7 11 4 16 14 14 37 Genes relacionados

con fagos 0 0 0 4 12 23 16 9 5 11

Debido a que los brucellafagos son virus líticos, se consideraron como posibles genes verdaderos aquellos ORFs que tuvieran un potencial de expresión cercano al de algunos genes de proteínas ribosomales de Brucella. Una vez concluidos los análisis bioinformáticos descritos anteriormente, se integraron estos resultados para determinar que ORFs podrían ser considerados genes verdaderos. En la tabla se muestran los resultados obtenidos para los ORFs en cada caso. Estos resultados, sin embargo, incluían ORFs que podrían no ser genes verdaderos, o en caso contrario, excluir ORFs correspondientes a genes verdaderos.

Figura 9 Distribucion de los genes de Brucella y Mesorhizobium sp. BNC1 con base en su ENC, el eje primario corresponde al total de genes en los genomas bacterianos, el eje secundario corresponde al número de genes encontrados en cada categoria.

Page 36: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Tabla 10 Descripción de los ORFs encontrados mediante herramientas bioinformáticas, como se describió en material y métodos.

ORF Cadena Inicio Termino Promotor Terminador ENC Tamaño (aa) BLASTp BLASTn C01F01O01 + 1 858 Ausente Ausente 53.9 286 5E-11 2.00E-41 9.6 2.00E-07 C01F01O02 + 1801 1968 Ausente Ausente 55.24 56 No significativo No significativo C01F01O03 + 2149 2268 Presente Ausente 49.63 40 No significativo 3.7 1.1 C01F02O01 + 776 1804 Presente Ausente 58.02 343 8.5 0.008 3 6.00E-09 C01F02O02 + 1841 1960 Ausente Ausente 61 40 No significativo No significativo C01F02O03 + 2261 2572 Presente Ausente 51.48 104 9.7 3.00E-10 3.4 3.00E-14 C01F03O01 + 309 443 Ausente Ausente 55.68 45 No significativo No significativo C01F03O02 + 1578 1697 Presente Ausente 38.1 40 No significativo No significativo C01F03O03 + 1965 2114 Ausente Ausente 61 50 1.1 1.1 4.9 1.00E-08 C01F03O04 + 2370 2528 Ausente Ausente 61 53 No significativo 5.3 1.00E-08 C01R01O01 - 2239 2445 Presente Ausente 61 69 No significativo No significativo C01R01O02 - 832 1005 Presente Ausente 60.07 58 No significativo No significativo C01R01O03 - 394 588 Ausente Ausente 61 65 No significativo No significativo C01R02O01 - 2073 2168 Ausente Ausente NAN 32 No significativo No significativo C01R02O02 - 1575 1712 Ausente Ausente 42.31 46 No significativo No significativo C01R02O03 - 1 242 Presente Ausente 61 80 No significativo No significativo C01R03O01 - 1472 1741 Ausente Ausente 61 90 No significativo No significativo C02F01O01 + 604 1005 Presente Ausente 51.91 134 No significativo No significativo C02F01O02 + 1249 2106 Ausente Ausente 56.15 286 1 1.00E-41 10 0.23 C02F01O03 + 3220 3432 Ausente Ausente 34.79 71 No significativo No significativo C02F01O04 + 3565 3756 Ausente Ausente 46.64 64 No significativo No significativo C02F01O05 + 4282 4389 Presente Ausente 48.78 36 No significativo No significativo C02F02O01 + 1466 1603 Ausente Ausente 52.86 46 No significativo No significativo C02F03O01 + 3 1247 Ausente Ausente 53.28 415 3.5 5.00E-24 4.2 1.2 C02F03O02 + 2106 3074 Ausente Ausente 54.32 323 1.6 3.00E-10 3.2 3.2 C02F03O03 + 3102 4634 Ausente Ausente 55.66 511 5.7 2.00E-05 5.2 1.5 C02R01O01 - 4463 4585 Ausente Ausente 61 41 No significativo No significativo C02R01O02 - 4103 4258 Presente Ausente 59.84 52 No significativo No significativo C02R01O03 - 3035 3166 Presente Ausente 61 44 No significativo No significativo C02R01O04 - 2381 2479 Presente Ausente NAN 33 No significativo No significativo

Page 37: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Tabla 10 Continuación

ORF Cadena Inicio Termino Promotor Terminador ENC Tamaño (aa) BLASTp BLASTn C02R01O05 - 725 1003 Presente Ausente 57.85 93 No significativo No significativo C02R01O06 - 365 478 Presente Ausente NAN 38 No significativo No significativo C02R02O01 - 2389 2523 Ausente Ausente 59.47 45 No significativo No significativo C02R02O02 - 55 168 Ausente Ausente 38.59 38 No significativo No significativo C02R03O01 - 1611 1757 Presente Ausente 40.62 49 No significativo No significativo C03F02O01 + 1592 1717 Ausente Ausente 57.28 42 No significativo No significativo C03F03O01 + 603 698 Presente Ausente 55.49 32 No significativo No significativo C03R01O01 - 1429 2022 Presente Ausente 46.58 198 8.3 1.00E-64 6.8 4.00E-28 C03R02O01 - 1977 2183 Ausente Ausente NAN 69 No significativo 7.3 7.00E-13 C03R02O02 - 1 1013 Ausente Ausente 47.74 337 9.3 2.00E-09 3.4 0.97 C03R03O01 - 1013 1429 Ausente Ausente 53.3 139 10 0.005 4.6 0.38 C03R03O02 - 626 802 Ausente Ausente 37.7 59 No significativo No significativo C03R03O03 - 20 208 Ausente Ausente 61 63 No significativo No significativo C04F03O01 + 3 1616 Ausente Ausente 52.96 538 9.7 2.00E-62 5.5 0.13 C04R01O01 - 1071 1319 Ausente Ausente 52.69 83 No significativo No significativo C04R01O02 - 462 824 Ausente Ausente 40.14 121 No significativo No significativo C04R02O01 - 1193 1381 Presente Ausente 61 63 No significativo No significativo C04R02O02 - 827 943 Ausente Ausente 61 39 No significativo No significativo C04R02O03 - 1 85 Presente Ausente NAN 28 No significativo No significativo C04R03O01 - 1423 1524 Ausente Ausente 61 34 No significativo No significativo C04R03O02 - 691 888 Ausente Ausente 46.74 66 No significativo No significativo C05F01O01 + 1 345 Ausente Ausente 61 115 6.9 3.8 1.1 1.1 C05F01O02 + 1195 1353 Presente Ausente 39.75 53 No significativo No significativo C05F02O01 + 527 925 Ausente Ausente 42.79 133 9.6 1.00E-23 4.4 1.3 C05F03O01 + 771 884 Ausente Ausente 40.83 38 No significativo No significativo C05F03O02 + 1158 1711 Ausente Ausente 51.67 184 0.025 8.00E-15 9 0.21 C05R01O01 - 1361 1501 Ausente Ausente 45.55 47 No significativo No significativo C05R01O02 - 689 937 Ausente Ausente 46.88 83 No significativo No significativo C05R02O01 - 454 579 Ausente Ausente 36.86 42 No significativo No significativo C06F01O01 + 1 237 Ausente Ausente 51.82 79 9.6 6.00E-05 8.6 0.7

Page 38: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Tabla 1011 Continuación

ORF Cadena Inicio Termino Promotor Terminador ENC Tamaño (aa) BLASTp BLASTn C06F01O02 + 1237 1581 Ausente Ausente 60.94 115 9.2 1.8 3.8 1.1 C06F03O01 + 3 1274 Ausente Ausente 50.58 424 1.00E-104 2.00E-05 4.3 6.00E-36 C06R01O01 - 405 587 Ausente Ausente 36.76 61 No significativo No significativo C06R01O02 - 234 392 Ausente Ausente 61 53 No significativo No significativo C06R03O01 - 1396 1542 Ausente Ausente 43.53 49 No significativo No significativo C06R03O02 - 703 837 Ausente Ausente 40.39 45 No significativo No significativo C06R03O03 - 481 615 Ausente Ausente 56.46 45 No significativo No significativo C07F01O01 + 364 462 Ausente Ausente 46.68 33 No significativo No significativo C07F01O02 + 727 831 Ausente Ausente 44.45 35 No significativo 3 3 C07F01O03 + 850 1533 Ausente Ausente 49.48 228 9.4 4.00E-48 8.1 0.19 C07F01O04 + 1537 3921 Ausente Ausente 51.52 795 1.4 4.00E-96 8.1 2.3 C07F02O01 + 1223 1393 Ausente Ausente 61 57 No significativo No significativo C07F02O02 + 1604 1753 Ausente Ausente 40.04 50 No significativo No significativo C07F02O03 + 3101 3226 Ausente Ausente NAN 42 No significativo No significativo C07F02O04 + 3374 3514 Ausente Ausente 61 47 No significativo No significativo C07F02O05 + 3644 3802 Ausente Ausente 46.16 53 No significativo No significativo C07F03O01 + 171 620 Ausente Ausente 47.76 150 9.9 1.00E-47 5 9.00E-10 C07F03O02 + 3930 4037 Ausente Ausente 32.57 36 No significativo No significativo C07R01O01 - 3834 3926 Ausente Ausente NAN 31 No significativo No significativo C07R01O02 - 2112 2294 Ausente Ausente 58.76 61 No significativo No significativo C07R01O03 - 294 656 Ausente Ausente 53.23 121 No significativo No significativo C07R02O01 - 128 256 Ausente Ausente 61 43 No significativo No significativo C07R03O01 - 2980 3147 Ausente Ausente 40.77 56 No significativo No significativo C07R03O02 - 1390 1506 Ausente Ausente 46.36 39 No significativo No significativo C08F01O01 + 1360 1611 Ausente Ausente 61 84 No significativo No significativo C08F01O02 + 2023 2165 Ausente Ausente 34.87 47 No significativo No significativo C08F02O01 + 1919 2080 Ausente Ausente 61 54 No significativo No significativo C08F03O01 + 1644 1739 Ausente Ausente NAN 32 No significativo No significativo C08R01O01 - 183 2165 Ausente Ausente 48.42 661 3.00E-07 0 6.7 9.00E-49 C08R01O02 - 1 167 Ausente Ausente 51.33 55 No significativo 5.7 0.47

Page 39: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Tabla 10 Continuación

ORF Cadena Inicio Termino Promotor Terminador ENC Tamaño (aa) BLASTp BLASTn C08R02O01 - 1172 1270 Ausente Ausente 45.95 33 No significativo No significativo C08R02O02 - 869 988 Ausente Ausente 35.06 40 No significativo No significativo C08R02O03 - 338 703 Ausente Ausente 60.55 122 No significativo No significativo C08R03O01 - 1 183 Ausente Ausente 46.64 61 No significativo 6.3 0.52 C09F02O01 + 188 277 Presente Ausente NAN 30 No significativo No significativo C09F03O01 + 348 530 Ausente Ausente 61 61 No significativo No significativo C09R01O01 - 1 385 Ausente Ausente 54.08 128 No significativo No significativo C09R02O01 - 103 327 Ausente Ausente 56.27 75 9.6 2.00E-08 4.2 1.2 C10F01O01 + 139 423 Presente Ausente 61 95 8.6 6 No significativo C10F02O01 + 350 484 Ausente Ausente 38.36 45 No significativo No significativo C10R01O01 - 361 537 Ausente Ausente 50.88 59 No significativo No significativo C10R02O01 - 201 428 Ausente Ausente 61 76 No significativo 8.2 3.00E-81 C10R02O02 - 3 194 Ausente Ausente 34.16 64 9.9 0.086 6.7 1.9 C11F01O01 + 520 693 Ausente Ausente 50.7 58 No significativo No significativo C11F03O01 + 6 778 Ausente Ausente 58.3 257 9.9 0.29 8.9 3.00E-06 C11R01O01 - 374 547 Ausente Ausente 45.84 58 No significativo No significativo C12R01O01 - 1 456 Ausente Ausente 58.63 152 9.9 6.00E-06 5.1 0.42 C13F01O01 + 160 387 Ausente Ausente 61 76 No significativo No significativo C13R01O01 - 1 1103 Ausente Ausente 54.88 367 1.00E-54 2.00E-85 3.7 0.087 C14F01O01 + 295 362 Ausente Ausente NAN 23 272 8 5.3 0.44 C14F02O01 + 2 190 Ausente Ausente 37.42 63 No significativo 6.6 1.9 C14F03O01 + 174 362 Presente Ausente 61 63 No significativo 6.6 1.9 C14R01O01 - 1 164 Ausente Ausente 61 54 No significativo 5.5 1.6 C15F01O01 + 1 Ausente Ausente 58.08 129 0.1 0.1 4.3 0.1 C15R03O01 - 308 631 Presente Ausente 45.96 108 No significativo 3.5 0.083

Page 40: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

6.13 Búsqueda de dominios conservados en las proteínas hipotéticas predichas.

Las secuencias aminoacídicas de los ORFs analizados, mostraron 158 señales de dominios conservados y motivos estructurales, los cuales se encontraban presentes en 37 de los 115 ORFs predichos. En la tabla xx se muestran los ORFs encontrados, su posición y la puntuación asignada.

Tabla 11 Dominios encontrados en los ORFs analizados

ORF Dominio

conservado Inicio Termino Puntuación Servidor

C01 F01 O01 G3DSA:3.40.50.150 16 253 1.7E-39 InterProScan C01 F01 O01 SSF53335 2 252 4.4E-38 InterProScan C01 F01 O01 PF01555 183 245 6.2E-25 InterProScan C01 F01 O01 PR00508 31 45 6.10E-24 InterProScan C01 F01 O01 PR00508 186 203 6.10E-24 InterProScan C01 F01 O01 PR00508 205 223 6.10E-24 InterProScan C01 F01 O01 PS00092 35 41 6.21E-24 InterProScan C01 F01 O01 COG0863 1 275 2E-19 NCBI CDD C01 F01 O01 PR00506 32 44 3.5E-16 InterProScan C01 F01 O01 PR00506 186 208 3.5E-16 InterProScan C01 F01 O01 PR00506 209 223 3.5E-16 InterProScan C01 F01 O01 PRK13699 14 269 1E-11 InterProScan C01 F01 O01 PRK11524 185 275 1E-10 InterProScan C01 F01 O01 COG2189 85 245 0.001 NCBI CDD C01 F01 O01 UPF0020 203 275 0.001 SBASE C01 F01 O01 N6/N4_Mtase 32 245 99 SBASE C01 F01 O01 PR00508 228 248 InterProScan

C01 F01 O01 NADB_Rossmann

superfamily NCBI CDD

C01 F01 O03 DUF125_TM 3 37 2 SBASE C01 F01 O03 TMHMM 9 31 InterProScan C01 F02 O01 AbfB 7 44 0 SBASE C01 F02 O01 NMD3 59 118 0 SBASE C01 F02 O01 SMC_N 116 304 0.0006 NCBI CDD C01 F02 O01 Smc 144 304 0.0009 NCBI CDD C01 F02 O01 Macoilin 118 304 0.002 NCBI CDD C01 F02 O01 Myosin_tail 143 243 99 SBASE C01 F02 O03 ICL_KPHMT 1 68 0.008 NCBI CDD C01 F02 O03 Cys_Trna-synt_1a 3 92 94 SBASE C01 F03 O03 RuvA_C 1 43 0 SBASE C01 F03 O04 C2 1 43 0 SBASE C02 F01 O02 PYR_CT 14 47 0 SBASE C02 F01 O02 SSF88874 73 283 6.3E-27 InterProScan C02 F01 O02 MdpB 82 285 5.9E-09 NCBI CDD C02 F01 O02 PF07484 87 164 0.000013 InterProScan C02 F01 O02 Collar superfamily 87 164 0.002 NCBI CDD C02 F01 O02 Ribosomal_L2 69 104 3 SBASE

Page 41: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Tabla 11 Continuación

ORF Dominio

conservado Inicio Termino Puntuación Servidor

C02 F01 O02 AlaD_dehydratase 109 147 6 SBASE C02 F01 O02 Harpin 161 251 93 SBASE C02 F03 O01 DUF894_DitE 80 110 0 SBASE C02 F03 O01 Helicase_C 374 413 0 SBASE C02 F03 O01 TGFb_N 278 322 0 SBASE C02 F03 O01 Tetrpept_transpt 126 234 81 SBASE C02 F03 O02 Chmtaxis_transd 109 219 0 SBASE C02 F03 O02 Dhdropt_synth 21 105 16 SBASE C02 F03 O02 Gelsolin 227 312 90 SBASE C02 F03 O03 FMN_bd 12 43 0 SBASE C02 F03 O03 GGT_peptidase 461 510 0 SBASE C02 F03 O03 HrcA 129 189 0 SBASE C02 F03 O03 LGT 232 295 0 SBASE C02 F03 O03 Ribosomal_L1 346 380 0 SBASE C02 F03 O03 Pectin lyase like 25 475 6.4E-10 InterProScan C02 F03 O03 NTP_transferase 62 122 37 SBASE C02 F03 O03 Peptidase S60 304 342 37 SBASE C03 R01O01 PriB_PriC 23 122 63 SBASE C03 R01O01 CitG 5 26 0 SBASE C03 R01O01 E1_E2_ATPase_reg 32 77 0 SBASE C03 R01O01 RecC 160 184 0 SBASE C03 R01O01 Thiol_cytolysin 79 153 77 SBASE C03 R02 O01 Signal IP 1 38 InterProScan C03 R02 O01 TMHMM 21 39 InterProScan C03 R02 O02 Peptidase S58 1 59 4 SBASE C03 R02 O02 UPF0261 92 297 43 SBASE C03 R03 O01 FAD_bind2_N 9 60 2 SBASE C04 F03 O01 AAA_ATPase_centr 170 217 0 SBASE C04 F03 O01 DUF155 333 354 0 SBASE C04 F03 O01 DUF442 355 386 0 SBASE C04 F03 O01 Guanylt/Ca 148 168 0 SBASE C04 F03 O01 Peptidase S10 21 47 0 SBASE C04 F03 O01 PF08707 1 35 2.9E-14 InterProScan C04 F03 O01 PriCT_2 1 35 0.000001 NCBI CDD C04 F03 O01 Response_reg 58 138 16 SBASE C04 F03 O01 HEPN 227 298 69 SBASE C04 F03 O01 Elp3/MiaB/NifB 404 500 81 SBASE C04 F03 O01 TMHMM 115 135 InterProScan C05 F01 O01 DUF1013 12 55 0 SBASE C05 F01 O01 Corona_6B_7B 66 90 2 SBASE C05 F02 O01 SSF46689 4 44 0.0000041 InterProScan C05 F02 O01 PF02796 4 41 0.00028 InterProScan

Page 42: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Tabla 11 Continuación

ORF Dominio

conservado Inicio Termino Puntuación Servidor

C05 F02 O01 HTH_Hin_like superfamily

4 41 0.005 NCBI CDD

C05 F02 O01 Frigida 83 130 11 SBASE C05 F02 O01 AAA_ATPase 8 61 18 SBASE C05 F03 O02 AAA_ATPase 50 71 0 SBASE C05 F03 O02 CcdA 1 31 0 SBASE C05 F03 O02 cNMP_bd 202 249 0 SBASE C05 F03 O02 COG5410 49 260 1E-15 NCBI CDD C05 F03 O02 Terminase 80 186 99 SBASE C06 F01 O01 PF01844 1 41 0.0001 InterProScan C06 F01 O01 COG3183 8 61 0.0005 NCBI CDD C06 F01 O01 HNHc superfamily 9 41 0.001 NCBI CDD C06 F01 O01 SM00507 1 35 19 InterProScan C06 F01 O01 HNH 9 38 99 SBASE C06 F01 O02 DEAD/DEAH_N 1 19 0 SBASE C06 F01 O02 RVTse 30 51 0 SBASE C06 F01 O02 Prot_kinase 52 109 77 SBASE C06 F01 O02 Signal IP InterProScan C06 F03 O01 DUF869_pln 1 34 0 SBASE C06 F03 O01 HintC superfam 50 87 2E-19 NCBI CDD C06 F03 O01 COG5410 82 237 0.00000003 NCBI CDD C06 F03 O01 COG5362 212 402 0.00000007 NCBI CDD C06 F03 O01 Hedgehog_hint_c 42 82 99 SBASE C06 F03 O01 Terminase 83 384 SBASE C06 F03 O01 COG1372 NCBI CDD C06 F03 O01 PRK07773 InterProScan C06 F03 O01 PS50818 InterProScan C06 F03 O01 SM00305 InterProScan C06 F03 O01 Terminase like SBASE C06 F03 O01 TIG301630 InterProScan C06 F03 O01 TIGR01443 InterProScan C06 F03 O01 TMHMM NCBI CDD C07 F01 O02 Topo_IA_DNA_bd InterProScan C07 F01 O03 RasGRF_CDC25 183 228 0 SBASE C07 F01 O03 Initr_RepB 23 96 1 SBASE C07 F01 O03 Calponin_act_bd 97 180 7 SBASE C07 F01 O04 Carboxyl_trans 630 671 0 SBASE C07 F01 O04 Chal_sti_synt_C 568 596 0 SBASE C07 F01 O04 Cyt_c_ox_2 743 784 0 SBASE C07 F01 O04 Filamin 253 285 0 SBASE C07 F01 O04 GGT_peptidase 401 493 0 SBASE C07 F01 O04 NAPRTase 36 78 0 SBASE C07 F01 O04 Peptidase_S10 162 240 0 SBASE

Page 43: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Tabla 11 Continuación

ORF Dominio

conservado Inicio Termino Puntuación Servidor

C07 F01 O04 Aldolase_II_N 495 537 8 SBASE C07 F01 O04 Porin_Gram-ve 80 139 8 SBASE C07 F01 O04 DUF296 352 399 14 SBASE C07 F01 O04 PSS00178 466 476 19 InterProScan C07 F01 O04 Aconitase_N 679 717 84 SBASE C07 F03 O01 ArfGAP 41 74 0 SBASE C07 F03 O01 TrbI 6 27 0 SBASE C07 F03 O01 Periplasmic_BP 89 137 5 SBASE C07 F03 O01 PSS00228 1 4 19 InterProScan C08 R01 O01 AAA_ATPase 264 323 0 SBASE C08 R01 O01 DUF724 21 62 0 SBASE C08 R01 O01 DEAD/DEAH_N 203 245 1 SBASE C08 R01 O01 Beta_elim_lyase 70 197 57 SBASE C08 R01 O01 HrpZ 375 509 77 SBASE C08 R01 O01 TolA 542 660 82 SBASE C08 R01 O02 Glyco_trans_35 25 55 0 SBASE C08 R01 O02 Signal IP InterProScan C08 R01 O02 TMHMM InterProScan C08 R03 O01 RDD 4 33 0 SBASE C08 R03 O01 Signal IP InterProScan C08 R03 O01 TMHMM InterProScan C09 R02 O01 PH 103 124 0 SBASE C09 R02 O01 WSC_carb_bd 28 38 0 SBASE C09 R02 O01 DUF427 40 99 18 SBASE C10 R01 O01 AAA_ATPase 1 40 0 SBASE C10 R01 O01 PEMT 42 55 0 SBASE C10 R02 O01 DHO_DH 4 69 27 SBASE C10 R02 O02 SSF48295 5 59 0.0000028 InterProScan C10 R02 O02 DnaA_C 9 54 27 SBASE C11 F03 O01 Ferredoxin 218 250 0 SBASE C11 F03 O01 Glyco_hyd_98_cbd 84 113 0 SBASE C11 F03 O01 RNA_pol_birna 130 204 0 SBASE C11 F03 O01 M-pesterase 36 79 2 SBASE C12 R01 O01 EF_TS 27 66 2 SBASE C12 R01 O01 Snf7 70 139 11 SBASE C13 R01 O01 Endo_3c 127 161 0 SBASE C13 R01 O01 PurO_cyclohidro 271 333 0 SBASE C13 R01 O01 SSL2 1 271 5E-27 InterProScan C13 R01 O01 SSF52540 137 313 6.5E-19 InterProScan C13 R01 O01 G3DSA:3.40.50.300 155 291 2.3E-15 InterProScan C13 R01 O01 SSF52540 5 65 3.8E-09 InterProScan C13 R01 O01 PF00271 187 258 0.000000081 InterProScan C13 R01 O01 HsdR 58 271 0.0000007 NCBI CDD

Page 44: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Tabla 11 Continuación

ORF Dominio

conservado Inicio Termino Puntuación Servidor

C13 R01 O01 SM00490 178 258 0.0000069 InterProScan C13 R01 O01 DEXDc 1 103 0.001 NCBI CDD C13 R01 O01 HelicC 134 266 0.001 NCBI CDD C13 R01 O01 Helicase_C 183 258 0.002 NCBI CDD C13 R01 O01 DEXDc 1 65 0.004 NCBI CDD C13 R01 O01 COG1204 7 257 0.007 NCBI CDD C13 R01 O01 DEAD 1 73 0.008 NCBI CDD C13 R01 O01 PS51194 156 299 9.638 InterProScan C13 R01 O01 PS51192 1 83 10.798 InterProScan C13 R01 O01 DEAD/DEAH_N 1 100 99 SBASE C13 R01 O01 Helicase_C 178 258 99 SBASE C13 R01 O01 DEXDc superfamily NCBI CDD C14 F01 O01 NA/solut simport 18 56 27 SBASE C14 F03 O01 PAC 35 59 0 SBASE C15 F01 O01 Neuromodulin 63 94 0 SBASE C15 F01 O01 GPCR secretin 98 126 0 SBASE C15 R03 O01 gp37_gp68 2 21 0 SBASE C15 R03 O01 Herpes_alk_exo 83 107 0 SBASE

6.14 Designación de los genes verdaderos y asignación de funciones.

Debido a la ausencia de marcadores ab initio que nos permitan identificar los genes del fago Tb, únicamente fueron considerados aquellos ORFs cuya secuencia aminoacídica o nucleotídica arrojara resultados significativos en la búsqueda tipo BLAST (E≤10) En total se lograron identificar 40 secuencias aminoacidicas y nucleotídicas.

Mediante la búsqueda de dominios conservados y motivos estructurales en los genes encontrados, así como los resultados obtenidos en la búsqueda tipo BLASTp, se asignaron funciones a los genes encontrados.

6.15 Propiedades de los productos de los genes encontrados en el genoma del fago Tb.

Una vez identificados los genes presentes en el genoma del fago Tb, los productos de dichos genes fueron caracterizados mediante herramientas bioinformáticas. Las propiedades fisicoquímicas de las proteínas putativas fueron determinadas con el programa winpep 3.01. En la tabla xx se muestran algunas de las propiedades fisicoquímicas de las proteínas predichas, su posible función y la secuencia más cercana obtenida en la búsqueda tipo BLAST, indicando la similitud e identidad que existe entre las dos secuencias comparadas.

Page 45: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Tabla 12 Propiedades fisicoquímicas y posible función de los productos de los genes encontrados. En la última columna se muestra la secuencia mas semejante al producto, señalando el porcentaje de similitud (primer número entre paréntesis) y el porcentaje de identidad (segundo numero) que existe entre las dos secuencias.

GEN Tamaño

(aa). Punto

isoeléctrico Peso molecular

(Da). Posible función Secuencia más cercana

C01 F01 O01 275 5.25 30836 DNA metil transferasa BF2801

(36.2, 54.2). C01 F01 O03 39 5.96 3936 Función desconocida NS

C01 F02 O01 304 4.28 32959 ATPasa de segregación

cromosomal Oant_0207 (23.8, 38.2).

C01 F02 O02 39 10.5 4175 Función desconocida NS

C01 F02 O03 103 4.5 11179 Cisteinil tRNA sintetasa Oant_0204 (45.7, 54.4).

C01 F03 O03 49 4.62 5515 Función desconocida Oant_0205 (19.4, 23.7).

C01 F03 O04 52 11 5800 Función desconocida NS

C02 F01 O02 285 4.6 29535 Proteína estructural Meso_0240 (39.6, 59.3).

C02 F03 O01 414 4.74 42039 Proteína estructural Pden_4824 (27.7, 43.9).

C02 F03 O02 322 4.46 32468 Proteína estructural de interaccion con actina

Clostridium butiricum gp134 (24.5, 33.2).

C02 F03 O03 510 4.33 53698 Proteína estructural con

actividad de glicosil hidrolasa

Aspergillus niger rhgE (22.6, 39.4).

C03 R01 O01 251 4.28 27744 Replicación de

primosoma NS

C03 R02 O01 68 12.3 7769 Función desconocida NS

C03 R02 O02 337 4.24 34983 Proteína estructural B. abortus S19 flgJ

(23.6, 36.5).

C03 R03 O01 138 6.1 14970 Proteína estructural LELG00204

(16.8, 28.6).

C04 F03 O01 537 5.26 59852 Primasa LPPPV gp44 (21.7, 37.3).

C05 F01 O01 114 9.01 13126 Función desconocida Haur_0826 (12.2, 18.7).

C05 F02 O01 132 5.1 14873 Terminasa, Subunidad

menor OA307_933 (39.1, 55.7).

C05 F03 O02 260 6.04 28527 Terminasa, subunidad

mayor Meso_0224 (38.8, 52.1).

C06 F01 O01 78 8.9 8847 Endonucleasa de

restricción NS

C06 F01 O02 114 4.57 12726 Protein cinasa NS

C06 F03 O01 537 4.46 60634 Terminasa, subunidad

mayor Meso_0224 (38.8, 52.1).

C07 F01 O02 34 6.96 3688 Proteína estructural NS

Page 46: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Tabla 12 Continuación

GEN Tamaño

(aa). Punto

isoeléctrico Peso molecular

(Da). Posible función Secuencia más cercana

C07 F01 O03 233 4.46 27021 Proteína estructural Meso_0233 (40.3, 58.1).

C07 F01 O04 794 4.09 83946 Proteína estructural Meso_0234 (39.6, 52.4).

C07 F03 O01 149 6.26 16987 Proteína estructural Meso_0231 (38.2, 45.6).

C08 R01 O01 660 4.57 74725 Proteína estructural, unión a membranas

lipídicas

Meso_0225 (45.3, 60.6).

C08 R01 O02 55 9 6536 Proteína estructural unión a membranas

lipídicas NS

C08 R03 O01 61 4.64 6541 Proteína estructural NS

C09 R02 O01 128 4.58 15190 Función desconocida RSL1_gp077 (32.7, 53.5).

C10 R02 O01 75 8.32 8565 Función desconocida NS

C10 R02 O02 63 9.83 7253 Unión a DNA, participa

en replicación RSP_6202

(22.9, 36.8). C11 F03 O01 257 4.99 28545 Función desconocida NS

C12 R01 O01 152 4.31 16422 Proteína estructural, probable función de

peptidoglican hidrolasa

B. abortus S19 flgJ (23.6, 36.5).

C13 R01 O01 367 6.27 41013 Helicasa PROSTU_03006

(24.0, 37.2). C14 F01 O01 57 4.33 5421 Proteína estructural NS C14 F03 O01 63 10.1 7114 Proteína estructural NS

C15 F01 O01 128 5.75 14513 Proteína estructural Meso_0228 (12.3, 17.5).

6.16 Descripción de los genes encontrados

6.16.1 Replicación. Mediante la búsqueda de dominios conservados se pudieron detectar 3 genes que podrían codificar proteínas involucradas en la replicación viral, en primer lugar encontramos una primasa codificada en el contig C04, esta enzima se encarga de sintetizar iniciadores para la replicación del material genético. Con base en la puntuación asignada por los servidores empleados, se infiere que la probabilidad de que esta proteína putativa cumpla con la función predicha es alta. Dicha proteína muestra similitud con el producto del ORF 47 del fago phiHSIC que infecta de forma selectiva a Listonella pelagia. También fue posible identificar un gen que codifica para una posible helicasa, dicha enzima está involucrada en la replicación de material genético mediante la separación de las cadenas de DNA o RNA, esta enzima usualmente se encuentra adyacente a la primasa y a la DNA polimerasa. En este caso solo se ha logrado identificar el gen que codifica para una primasa. Aunado a esto, el gen de la helicasa presenta cierta similitud del gen con el gen de una helicasa del fago phiHSIC (ORF 42) Por lo que se infiere que el gen de la primasa y el gen de la helicasa están muy cercanos uno de otro.

Page 47: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Finalmente se logro identificar un dominio conservado en el gen C10 R02 O02 que corresponde a una proteína iniciadora de la replicación. En este caso, su función indicaría que se ubica adyacente a los genes anteriormente descritos, sin embargo, al no presentar una similitud clara con algún gen del fago phiHSIC o de algún otro organismo no podemos determinar la posición exacta de este gen

6.16.2 Modificación y metabolismo de ácidos nucleicos. Uno de los dominios más ampliamente encontrados en genomas fágicos es aquel correspondiente a la unión y modificación de ácidos nucleicos, en este sentido, se logro identificar la región del genoma correspondiente a la modificación y metabolismo de ácidos nucleicos.

En primer lugar se identifico un gen que codifica para una DNA metil transferasa (gen C01 F01 O01), esta enzima participa en la modificación del DNA fágico recién sintetizado para que este no sea reconocido y digerido por las nucleasas producidas por su hospedero. Al realizar una búsqueda tipo BLASTx con una de las secuencias no ensambladas, se encontró que en el fago Tb también podría existir una Metil Adenina glicosil transferasa, por lo que se infiere que la modificación del material genético por parte del fago, es un proceso muy importante en el ciclo replicativo del mismo.

Dentro del mismo contig también se logro identificar una proteína cuya función no es muy clara ya que la mayoría de los miembros que conforman la familia de ATPasas de segregación cromosomal, son eucariotes. Estas enzimas son responsables de que posterior a la replicación los cromosomas sean repartidos de manera uniforme en ambas células hijas, sin embargo, esta función en fagos es llevada a cabo por el complejo de terminasas.

El siguiente gen en este contig corresponde a una probable Cysteinil tRNA sintetasa (C01 F02 O03), la cual podría jugar un papel importante en la expresión temprana de genes fágicos.

6.16.3 Empaquetamiento de DNA. La siguiente región en el genoma del fago corresponde a la degradación de ácidos nucleicos del hospedero, y el empaquetamiento del DNA fágico. Esta región está básicamente constituida por los contigs C05 y C06, en los cuales se lograron identificar tres genes que podrían participar en dichos procesos. El primer gen no mostro ningún dominio conservado, por lo que no se le asigno una función definida. Seguido de este gen se identificaron los genes codificantes de las subunidades de la terminasa, la cual es responsable del empaquetamiento del DNA fágico en las pre cápsides ensambladas.

Con la búsqueda tipo BLAST se pudo observar que la secuencia de la subunidad menor presentaba similitud con la subunidad menor de la terminasa del fago phiHSIC, mientras que el producto del gen codificante de la subunidad mayor, mostraba similitud con el producto del gen Meso_0224 de Mesorhizobium sp. BNC 1. Este hecho permitió localizar el complejo de terminasas adyacentes a la región estructural, ya que en el genoma del fago phiHSIC el gen de la subunidad menor de la terminasa se encuentra corriente arriba de los genes que codifican para las proteínas estructurales de este virus. Aunado a esto, en el fago Tb los genes designados como estructurales muestran similitud con los genes del genoma de Mesorhizobium BNC1, a partir del gen Meso_0225, justo después del gen más cercano al de la subunidad mayor de la terminasa.

6.16.4 Proteínas estructurales. Esta región está conformada por los contigs C08, C14, C15, C07, C03, C12 y C02. Inicialmente se infirió que los genes encontrados en estos contigs podrían codificar para proteínas estructurales debido al dominio conservado presente en el gen C02 F01 O02. El arreglo de los

Page 48: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

genes adyacentes a este, fue inferido mediante la similitud de dichos genes con genes de Mesorhizobium BNC1, Paracoccus denitrificans 1222 y el fago MX8 de Myxococcus xanthus.

6.16.5 Lisis celular. En las secuencias nucleotídicas analizadas, únicamente se ha logrado identificar un contig que podría contener un gen que codifique para una proteína relacionada con lisis celular. Esta proteína fue identificada por un posible dominio transmembranal presente en la secuencia aminoacídica. Se sabe que las proteínas de lisis celular contienen una región altamente hidrofóbica que les permite anclarse a la membrana celular, llevando a cabo la lisis desde dentro de la célula

6.17 Organización de los genes encontrados.

Una vez que se llevo a cabo el análisis individual de cada gen, se procedió a determinar el arreglo de dichos genes. Para cumplir este objetivo, se emplearon dos estrategias, en la primera, se intento reconstruir la organización de los genes del fago Tb con base en su función, tomando como modelo la organización encontrada en algunos fagos.

En la otra estrategia se intento reconstruir el orden de los genes mediante la comparación de regiones similares del fago Tb con otros genomas (bacterianos y virales) Los genomas que se emplearon para llevar a cabo la comparación fueron seleccionados con base en la similitud que presentaran algunos de sus ORFs con aquellos del fago Tb.

Al tratar de llevar a cabo estas estrategias, notamos que ninguna de las dos era absolutamente confiable, por lo que para la región correspondiente al metabolismo de ácidos nucleicos, los contigs fueron ensamblados con base en su función, mientras que en la región correspondiente a empaquetamiento de DNA y región estructural, los contigs fueron ensamblados con base en el genoma de Mesorhizobium BNC 1 y del fago de Listonella pelagia phiHSIC. En la tabla xxx se muestran los genes seleccionados para determinar el orden de los contigs ensamblados en el genoma del fago Tb y el arreglo de los genes del fago Tb se muestra de forma grafica en la figura xxx.

Tabla 13 Secuencias empleadas para determinar el orden de los contigs en el genoma fágico

Contig Región Genes del fago Tb Genes utilizados para ensamblar*

Seq 007 Inicio de

replicación Posible RNA polimerasa -

Seq 207 Replicación - LPPPV gp44 (ORF 047). C04 Replicación C04 F03 O01 LPPPV gp44 (ORF 047) (21.7, 37.3).

Seq 183 Replicación - LPPPV ORF 046 C13 Replicación C13 R01 O01 LPPPV ORF042 (18.3, 25.7). C10 Replicación C10 R02 O02 -

Seq 200 Replicación Posible DNA polimerasa - C01

Metabolismo de ácidos nucleicos

C01 F02 O03 Oant_0204 Seq 104 Posible DNA metil glicosilasa - Seq 204 Proteína hipotética -

C05 C05 F03 O02 Meso_0224 (38.8, 52.1). C06 C06 F03 O01 Meso_0224 (38.8, 52.1). C08

Estructural C08 R01 O01 Meso_0225 (45.3, 60.6).

C14 C14 F03 O01 Meso_0227 C15 C15 F01 O01 Meso_0228 (12.3, 17.5).

Page 49: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Tabla 13 Continuación

Contig Región Genes del fago Tb Genes utilizados para ensamblar* 164

Estructural

- Meso_0229 C07 C07 F01 O04 Meso_0234 (39.6, 52.5). C03 C03 R01 O01 Meso_0237 (50.9, 61.2). C03 C03 R02 O02 B. abortus S19 flgJ (23.6, 36.5). C12 C12 R01 O01 B. abortus S19 flgJ (23.6, 36.5). C02 C02 F01 O02 Meso_0240 (39.6, 59.3).

Seq 206 Lisis Posible proteína de lisis celular - 6.18 Comparación de genomas.

El arreglo de los genes encontrados fue verificado empleando el programa Artemis comparison tool versión 8.0. Mediante el uso de este programa se lograron detectar regiones altamente similares entre las secuencias comparadas, las cuales estan representadas en la figura xx.

Figura 10 Organización de los genes encontrados en el genoma del fago Tb. Las líneas en gris claro, corresponden a las pautas de la secuencia nucleotidica (de arriba hacia abajo, pauta +1, +2, +3, -1, -2, -3) las flechas coloreadas corresponden a los genes encontrados. Los genes coloreados en rosa, corresponden a genes involucrados en replicación viral. Los genes en azul marino, corresponden a genes de modificación de acidos nucleicos. Los genes en azul claro codifican para enzimas responsables del empaquetamiento de DNA en la capside. Los productos de los genes en verde, probablemente correspondan a proteínas estructurales, y finalmente el producto del gen en rojo, participe en la lisis celular.

Figura 12 Comparación entre el genoma del fago Tb con el genoma de Mesorhizobium sp BNC1 empleando el programa Artemis Comparison Tool. En la parte superior se muestra la organización de los genes de Mesorhizobium, en la parte inferior se muestran los genes del fago Tb, las líneas que conectan una secuencia con otra indican similitud entre ellas. La amplitud de las líneas indica la extensión de similitud entre las secuencias, y finalmente la intensidad del color de la línea indica el nivel de identidad entre ellas.

Page 50: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

7. Discusión

Page 51: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

7.1 Obtención del DNA fágico y construcción de las librerías.

Existen muchas estrategias en la construcción de librerías genómicas tipo Shotgun. En este caso se probaron dos metodologías diferentes, en la primera, se intentó restringir el DNA fágico con una enzima de alta frecuencia de corte (Sau3 A1) a diferentes tiempos, para posteriormente separar los fragmentos obtenidos en un gel de agarosa y escindir aquellos correspondientes a un tamaño entre 1000 y 1500 bp. Esta no resultó satisfactoria ya que en la estandarización de la reacción de restricción se consumió mucho tiempo. Las reacciones se llevaron a cabo durante 5, 10, 15, 20, 25, 30, 45 y 60 minutos, sin embargo se observaba una restricción total del DNA a los 30 minutos. Se cambiaron los tiempos de reacción y finalmente se establecieron las condiciones de reacción en 1, 2, 3, 4, 5, 10, 15, 20, 25 y 30 minutos empleando 0.025 unidades de enzima y 100 ng de DNA fágico.

Una vez estandarizada la reacción se procedió a ligar los fragmentos purificados a partir de gel de agarosa en el vector pBluescript II. En un primer ensayo de transformación se obtuvieron 200 clonas, pero el DNA plasmídico que se obtuvo, se mostró refractivo a la restricción con Eco RI, así como con Hin DIII. Aparentemente el problema residió en el stock del vector empleado, que igualmente fue resistente a la restricción enzimática.

Al verificar que este vector no fue útil en la construcción de las librerías genómicas, se cambió el vector a emplear por m13mp19 en su forma replicativa. Con este vector se lograron obtener 100 clonas recombinantes de las cuales se logró verificar la presencia de los insertos ligados por medio de una restricción enzimática con Hin DIII. Las clonas obtenidas fueron purificadas empleando el kit QIAPREP mini de QIAGEN y los productos fueron secuenciados. Al analizar las secuencias nos percatamos de que estas correspondían a la secuencia del vector, por lo que llegamos a la conclusión de que los productos de restricción del DNA del fago Tb no habían sido ligados en el vector, y que los fragmentos de DNA observados al restringir las supuestas clonas recombinantes eran únicamente artefactos.

Una vez más cambiamos la estrategia a emplear, en esta ocasión se cambió la metodología para generar los fragmentos aleatorios, así como el vector empleado. Se utilizó el disgregador GeneMachines Hydroshear para generar fragmentos aleatorios, mismos que fueron reparados usando T4 DNA polimerasa y Fragmento Klenow de la DNA polimerasa I.

Se eligió emplear fragmentos de DNA de entre 3 y 5 kbp, con la finalidad de cubrir la totalidad del genoma fágico en pocos pasos de secuenciación, mientras que las secuencias de las librerías construidas con insertos de 1.5 a 3 kbp incrementarían la redundancia de la secuencia obtenida.

En esta ocasión se logaron obtener 488 clonas, de las cuales se comprobó la presencia de insertos en el vector por PCR. Teóricamente este número de clonas sería suficiente para cubrir el genoma del fago Tb por lo menos en un 99.9 % de acuerdo a la ecuación mencionada en material y métodos.

Una vez que se logró corroborar la presencia de insertos en las clonas recombinantes, se procedió a purificar y secuenciar el DNA plasmídico de las clonas con inserto de 3-5 kbp. A la par se llevaron a cabo las reacciones de PCR de las clonas con inserto de 1.5-3 kbp.

Al analizar el corrimiento electroforético de los productos de PCR nos dimos cuenta que presentaban un tamaño menor al esperado, esto pudo haberse debido a la degradación de los fragmentos obtenidos en el disgregador después de haber sido purificados a partir de gel.

Page 52: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Considerando que el tamaño promedio de los insertos observados en dichas librerías fue de aproximadamente 600 bp, el numero de clonas a secuenciar aumentó a un total de 500 clonas, por lo que, con las clonas secuenciadas, únicamente se logro cubrir aproximadamente 68% del genoma.

7.2 Ensamblaje de las secuencias obtenidas.

Con las 167 secuencias ensambladas, se lograron obtener 15 contigs, con aproximadamente 68% de cobertura del genoma. Pese a que no se ha completado la secuencia genómica del fago Tb, se cuenta con información suficiente para tratar de completar dicha secuencia mediante reacciones de PCR. Por otro lado, aun se cuentan con clonas no secuenciadas, por lo que completar el genoma del fago Tb será únicamente cuestión de tiempo.

7.3 Predicción de marcos abiertos de lectura

El genoma del fago Tb, aporta información relevante en el estudio del genero Brucella y de los fagos en general. Como se observo en los resultados obtenidos en la búsqueda tipo BLAST las secuencias nucleotídicas no son muy similares a aquellas depositadas en bases de datos. En este sentido, es necesario contar con las herramientas adecuadas para el análisis de secuencias nucleotídicas con la finalidad de identificar secuencias relevantes ab initio.

Actualmente existen muchos métodos para detectar marcos abiertos de lectura. Los programas y servidores más ampliamente utilizados en la detección de genes en genomas recientemente secuenciados hacen uso de genes ya descritos y predicen en las secuencias analizadas los posibles ORFs codificantes. Las secuencias que se han empleados para entrenar a estos programas son obtenidas principalmente de genes de Escherichia coli y de Bacillus subtilis. Este hecho ha derivado en que los programas actuales, aunque utilicen tecnologías de reciente desarrollo, cometan errores al detectar posibles genes en genomas de organismos filogenéticamente lejanos de Escherichia coli o Bacillus subtilis. El género Brucella no es muy cercano filogenéticamente a Escherichia coli ni a Bacillus subtilis, por lo que la predicción de marcos abiertos de lectura y promotores transcripcionales arrojo datos que podrían no ser reales. En la predicción de marcos abiertos de lectura se intentó utilizar el servidor Glimmer (Salzberg et al., 1998; Miller et al., 2003; Rolain et al., 2009), sin embargo mediante esta aproximación no se lograron detectar algunos ORFs que probablemente si correspondan a genes verdaderos. Lo mismo ocurrió al tratar de predecir los posibles genes en los contigs ensamblados empleando el servidor ORFinder del NCBI (Vander Byl et al., 2000; Goudi et al., 2008). Finalmente se opto por anotar manualmente las secuencias nucleotídicas generadas (Pajunen et al., 2001; & Rohwer et al.,2000).

El primer paso en el análisis del genoma del fago Tb fue determinar la presencia de posibles marcos abiertos de lectura empleando la metodología descrita por Rohwer et al. y los criterios de inclusión de Pajunen. El programa Artemis, facilitó la búsqueda de dichos marcos, sin embargo este programa detecta únicamente secuencias nucleotídicas flanqueadas por codones de paro, por lo que los ORFs predichos inicialmente fueron manualmente examinados para verificar que existieran codones de inicio (ATG, TTG o GTG).

7.4 Frecuencia de uso de codones

Los genes de alta expresividad, tales como algunas proteínas ribosomales, muestran un ENC cercano a 21 (Uso de un solo codón por cada aminoácido) Por tal motivo se consideró que los genes encontrados en el genoma fágico tendrían un ENC cercano a 21 ya que el fago lleva a cabo un ciclo replicativo lítico.

Page 53: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Para poder llevar a cabo una comparación minuciosa, además de los genes de proteínas ribosomales de Brucella y Mesorhizobium, se analizaron los genes codificantes de proteínas relacionadas con fagos (genes putativos de profagos, integrasas, resolvasas, etc.) y se observó que el ENC de los ORFs del fago Tb y las proteínas relacionadas con fagos, se alejaban del valor correspondiente al de las proteínas ribosomales, y por lo tanto estos genes podrían ser de mediana o baja expresividad.

Los ORFs que fueron identificados como genes verdaderos mediante la presencia de dominios conservados y su similitud con secuencias aminoacidicas depositadas en bases de datos, mostraron valores de ENC de entre 34 y 61 y aproximadamente el 50 % de los genes encontrados presentaba un ENC de entre 39 y 54, que corresponde con el valor promedio de los genes relacionados con fagos en los genomas bacterianos analizados. Este hecho, podría contrastar la suposición inicial de que los genes de alta expresividad tendrían que tener un ENC cercano a 21.

Las diferencias observadas en el ENC de los genes del fago Tb y de Brucella, podrían ser explicadas por la presencia de un gen codificante de algún tRNA, o de una sintetasa de tRNA. En los ORFs analizados se encontró un gen putativo codificante de una cisteinil tRNA sintetasa, sin embargo, la frecuencia de uso de codones para la cisteína (UGU, UGC) es muy similar en los dos genomas comparados, por lo que el papel de la cisteinil tRNA sintetasa putativa aun no es muy claro.

Resulta interesante encontrar estos valores ya que podrían indicar un posible origen del fago Tb o de sus genes, ajeno al linaje de los Rhizobiales tal como un proceso de transferencia horizontal de material genético (Rohwer, 2002; Supek & Vlahoviček, 2005).

7.5 Búsqueda de promotores transcripcionales

La predicción de promotores transcripcionales se llevo a cabo empleando tres distintos programas con la finalidad de disminuir la probabilidad de ignorar alguna región promotora. En total se encontraron 6 promotores transcripcionales putativos, los cuales se encontraban dentro de los primeros 150 bp corriente arriba del inicio de transcripción de algunos genes. En la mayoría de los genes observados, no se encontró una señal transcripcional significativa, debida principalmente a que las bases de datos realizan predicciones a partir de un modelo biológico secuenciado y anotado. En el caso de Brucella, aunque se cuenta con algunas secuencias genómicas, estas no se encuentran debidamente anotadas por lo que se desconocen las secuencias promotoras de transcripción. De tal forma que muchos de los promotores encontrados en la secuencia del fago Tb, no corresponden a verdaderos promotores, mientras que los verdaderos promotores no fueron detectados por los programas utilizados.

Una estrategia empleada para resolver este problema, es la construcción de librerías de promotores, en donde el DNA a analizar se somete a una fragmentación aleatoria donde se obtienen fragmentos de entre 100 y 300 bp. Estos fragmentos son clonados en vectores que contengan el gen de Galactosidasa, pero que no contengan un promotor para esta enzima. De tal forma que al transformar células competentes de E. coli que no puedan emplear lactosa como fuente de carbono con los vectores recombinantes se obtendrán colonias blancas y azules, siendo las colonias azules aquellas que puedan tener un promotor. Estas colonias se seleccionan y los insertos presentes se secuencian, para posteriormente ser ubicados en el genoma estudiado. De esta manera se puede demostrar experimentalmente la presencia de promotores en un genoma (Naryshkina 2006) Esta estrategia, aunque útil, requiere de la secuencia genómica completa, por lo que hasta el momento no se puede llevar a cabo.

Page 54: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Al igual que con la frecuencia de uso de codones, la búsqueda de promotores transcripcionales, no fue de utilidad para discriminar los genes verdaderos, de entre los ORFs encontrados.

7.6 Búsqueda de terminadores transcripcionales

Debido a que muchos de los ORFs observados no presentaban una señal transcripcional clara, y que además se observo que algunos de ellos presentaban un arreglo del tipo de un operón, se llevo a cabo la búsqueda de terminadores transcripcionales. En el caso de que un grupo de marcos abiertos de lectura se organice como un operón, no deberá haber terminadores transcripcionales entre cada marco. En caso de que un ORF se encuentre al final de un operón, o de que dicho ORF no esté precedido por otro marco, deberá haber un terminador transcripcional en las primeras 50 bp corriente abajo del codón de terminación. En el caso de que un ORF que no esté precedido por otro ORF en no más de 36 bp y no presente un terminador transcripcional, este ORF podría ser descartado ya que la probabilidad de que realmente sea un gen es muy baja.

Para llevar a cabo dicha predicción se empleo el software FindTerm del servidor de softberry, este servidor busca secuencias características, que puedan adquirir una estructura secundaria de tipo Tallo-Asa seguida de una región rica en Timina.

La predicción de terminadores transcripcionales es más robusta que la predicción de promotores ya que la búsqueda de terminadores está basada en propiedades fisicoquímicas de la secuencia del RNA sintetizado a partir del gen a evaluar. En este sentido, no existen secuencias características de terminadores transcripcionales asociados a un grupo taxonómico especifico, por lo que la predicción ab initio resulta conveniente ya que el software empleado no requiere de un entrenamiento previo.

Únicamente se lograron identificar 5 terminadores, los cuales no se encontraban 50 bp corriente abajo de los ORFs predichos. Con este hallazgo pudieron descartarse muchos de los ORFs encontrados y únicamente fueron considerados aquellos ORFs contiguos que aparentemente formaran parte de un operón. Sin embargo para no descartar la posibilidad de ignorar genes verdaderos, todos los ORFs fueron sometidos a los análisis subsecuentes.

7.7 Búsqueda tipo BLAST y búsqueda de dominios conservados.

Para dilucidar si los ORFs presentes en el genoma del fago Tb, correspondían a genes verdaderos se llevó a cabo la búsqueda de dominios conservados en las secuencias aminoacídicas de cada ORF, asimismo, esta búsqueda fue útil en la asignación de funciones a cada gen putativo. En algunos casos, los dominios encontrados presentaban una puntuación alta, por lo que la identificación de genes verdaderos y la asignación de funciones, resulto una tarea sencilla. Aun así, algunos ORFs presentaban motivos que no podían ser interpretados muy fácilmente. Algunos de estos dominios, correspondían a motifs de proteínas que se ubican únicamente en células eucarióticas, otros mostraban relación con proteínas características de metabolismos central, cuya presencia en un genoma fágico no es fácilmente explicada (Fortier 2006).

Sin embargo tal como ocurre con el ORF C02F02O03, pueden existir proteínas con dominios conservados que no necesariamente cumplan la función predicha. En el caso del ORF mencionado, se encontró un dominio correspondiente a una pectin liasa, la cual funge como un factor de virulencia, en algunas bacterias pero la estructura de este tipo de enzimas es similar a la de la espícula caudal del fago P22. Este hallazgo resulta interesante por dos razones, en primer lugar, el fago P22 y el fago Tb se

Page 55: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

ubican morfológicamente en la familia Podoviridae, segundo, ambas proteínas se ubican en el clúster de proteínas estructurales del genoma de ambos virus.

Por otro lado ocurrió con cierta frecuencia que la búsqueda de dominios conservados no arrojo ningún resultado, esto puede ser consecuencia de que las bases de datos de dominios conservados en proteínas abarca una pequeña proporción y diversidad de organismos, aunado a este hecho, estas bases de datos presentan cierto sesgo hacia las secuencias aminoacidicas de eucariotes. Asimismo, los fagos siendo las entidades más abundantes y diversas de la biosfera pueden presentar dominios y motifs que aun no están descritos (Wommack & Colwell, 2000; Rohwer, 2002; Casas & Rohwer, 2007).

No se logro establecer un criterio para la discriminación de genes basado en la predicción de promotores y terminadores, asimismo el ENC de los ORFs observados, es muy diverso, por lo que la determinación de los genes presentes en los contigs ensamblados se llevo a cabo con base en la organización de los marcos, la búsqueda tipo BLAST y la predicción de dominios estructurales encontrándose así 38 genes que podrían codificar para proteínas funcionales y estructurales del fago Tb.

7.8 Asignación de funciones a los genes encontrados

La asignación de funciones a los genes detectados se llevó a cabo empleando prioritariamente los resultados de la búsqueda tipo BLAST, así como aquellos de la búsqueda de dominios conservados. En este sentido, habría sido más conveniente realizar dicha tarea mediante una aproximación filogenética, sin embargo, la mayoría de las secuencias analizadas mostraban un grado de similitud muy bajo con respecto de las secuencias depositadas en bases de datos.

Debido a que las secuencias nucleotídicas que se lograron ensamblar no cubrían el 100 % del genoma del fago Tb, la asignación de funciones tampoco podía llevarse a cabo mediante comparación de genomas fágicos o profágicos similares. Del mismo modo, el acomodo de los contigs no podía llevarse a cabo siguiendo la topología de genes presentes en otros genomas fágicos. Aunado a este problema, el genoma más cercano en cuanto a la organización de los genes y a la similitud e identidad de las secuencias aminoacidicas, no está completamente anotado

Aunado al problema anterior, muchas de las secuencias de los genes predichos no están completas, por lo que estas, no se pueden analizar exhaustivamente. De modo tal que la información obtenida a partir de estas secuencias aunque no es poca, no es tan informativa como aquella que se podría obtener si las secuencias estuvieran completas.

7.9 Descripción de los genes encontrados.

7.9.1 Replicación. Las primasas y helicasas juegan un papel muy importante en la replicación de material genético de los organismos. Las helicasas, son enzimas que abren la doble cadena de DNA formando la horquilla de replicación, para dar lugar a las primasas que son enzimas encargadas de sintetizar los iniciadores de replicación, para que posteriormente la DNA polimerasa comience la síntesis de la cadena hija de DNA (Ha, 2007; Kornberg, 2000; Tuteja &Tuteja, 2004; Weigel &Seitz, 2006).

En el genoma del fago Tb se lograron identificar algunas secuencias nucleotídicas correspondientes a genes que codifican para proteínas involucradas en la replicación viral. Estas proteínas corresponden a una primasa, una helicasa, y en una secuencia no ensamblada se encontró una probable DNA polimerasa.

Page 56: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Las proteínas involucradas en la replicación nos permiten conocer parte de la organización del los genes encontrados en el genoma fágico ya que en muchos modelos, estos genes se encuentran en cualquiera de las dos regiones terminales del cromosoma lineal. Existen modelos en donde estos se encuentran en regiones intermedias, sin embargo estos modelos no son muy frecuentes.

Se ha observado que los genes de replicación exhiben una modularidad mayor a la de otros grupos de genes. Con base en estas observaciones, se podría formular una hipótesis acerca del arreglo de los genes del fago Tb, sin embargo, existen diversos factores que podrían influenciar el arreglo de estos genes. En primer lugar los genomas fágicos muestran un elevado nivel de mosaicismo, por lo que la similitud con otros genomas fágicos podría no resultar útil en la predicción de la organización genómica (Summer et al., 2006; Aziz et al., 2005; Glazko et al., 2007; Lima-Mendez et al., 2008).

En el genoma del fago Tb proponemos que los genes de la helicasa y de la primasa, estén localizados al principio del genoma lineal. Sin embargo por el momento no contamos con evidencia experimental necesaria, para establecer el orden correcto de los contigs C13 y C04.

7.9.2 Modificación y metabolismo de ácidos nucleicos. En la región correspondiente al metabolismo de ácidos nucleicos se encontraron genes de interés debido a que se lograron detectar actividades relacionadas con estos procesos, que podrían ser de importancia en el ciclo biológico del fago Tb.

Se observo un gen que codifica para una posible DNA metil transferasa, que junto con una metil DNA glicosil transferasa y una endonucleasa de restricción podrían jugar un papel crítico en la degradación de ácidos nucleicos del hospedero y la protección del DNA fágico. El mecanismo de acción de las metiltransferasas ha sido ampliamente estudiado, sin embargo el papel que estas enzimas juegan, no solamente reside en el marcaje de DNA para su protección. En otros modelos se ha observado que la metilación de DNA puede regular la expresión de algunos genes. En el caso de Salmonella entérica sv typhimurium se ha reportado que la presencia y actividad de DNA metil transferasas que están involucradas en la expresión de genes que codifican para factores de virulencia (Balbontin et al., 2006).

En el género Streptococcus se ha descrito un sistema por el cual la expresión de genes que codifican para una bomba de flujo asociada a la resistencia de macrólidos están regulados por metilación de los promotores de dichos genes por DNA metiltransferasas encontradas en elementos parecidos a profagos (Figuereido et al., 2006).

En este sentido, la presencia de una enzima de este tipo en el genoma de un virus asociado a un microorganismo patógeno resulta interesante debido a la importancia del patógeno en la salud pública y veterinaria. Hasta la fecha no se ha logrado demostrar lisogenia en Brucella, sin embargo, se ha descrito un ciclo en donde el fago persiste en la célula hospedera de forma episomal. Este hecho podría propiciar que se desarrolle una cepa de Brucella que podría ser resistente a un mayor número de antibióticos que una cepa normal.

Por lo anteriormente descrito, resulta interesante seguir caracterizando esta enzima, para determinar además de sus propiedades bioquímicas, su función en el ciclo biológico del fago, así como en la biología celular del hospedero.

7.9.3 Empaquetamiento del DNA fágico. El empaquetamiento de DNA fágico en las pre cápsides es uno de los puntos centrales en el estudio de los fagos, los mecanismos por los cuales el DNA fágico es procesado para ser posteriormente insertado en las cápsides están dados por el complejo de enzimas

Page 57: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

conformado por las dos subunidades de la terminasa, una proteína portal y en ocasiones alguna proteína accesoria (Serwer, 2002).

Se sabe que los fagos muestran un arreglo genético muy diverso, y que a diferencia de organismos celulares, no presentan ningún marcador filogenético que permitan reconstruir la historia evolutiva de estas entidades biológicas. Sin embargo en recientes fechas se ha logrado establecer una aproximación filogenética para inferir el mecanismo de empaquetamiento del material genético con base en la topología de filogenias construidas con las secuencias aminoacidicas de la subunidad mayor de la terminasa (Casjens et al., 2005).

En el presente trabajo se lograron identificar 683 aminoácidos de la subunidad mayor de la terminasa. Y se construyo una filogenia parcial con las secuencias encontradas en bases de datos. El fago filogenéticamente más cercano al fago Tb es el fago Aaphi23 que infecta de forma natural a Actinobacillus actinomycetemcomitans, este fago presenta un arreglo genético similar al propuesto en este trabajo. Su mecanismo de replicación corresponde a un modelo de replicación por circulo rodante, y el empaquetamiento del DNA inicia en un sitio pac (Resch et al., 2004).

Con base en lo anterior podría decirse que el fago Tb presentar un mecanismo de empaquetamiento similar al del fago Aaphi23. Esta aseveración deberá ser comprobada experimentalmente ya que aun no se ha cubierto el genoma del fago Tb y no se sabe aun si este presenta sitios cos o pac, para su replicación y empaquetamiento.

7.9.4 Proteínas estructurales. Los productos de los genes designados como estructurales fueron identificados con base en su similitud con otras proteínas fágicas que cumplen la misma función. Aunque existe cierta divergencia en las secuencias analizadas,

7.9.5 Lisis celular. En las secuencias nucleotídicas analizadas, únicamente se ha logrado identificar un contig que podría contener un gen que codifique para una proteína relacionada con lisis celular.

7.10 Organización de los genes encontrados

Los alineamientos construidos con las secuencias depositadas en GenBank. Se encontró que existía un grupo de proteínas con las que las proteínas putativas del fago Tb presentaba una similitud muy alta. Los genes que codifican para estas proteínas corresponden a una región del genoma de Mesorhizobium BNC1.

Al analizar dicha región se encontró que los genes localizados entre el nucleótido 246494 y el nucleótido 266653 del cromosoma de Mesorhizobium sp. BNC1 corresponden a un profago en el genoma de Mesorhizobium. Las proteínas putativas de este profago presentan un grado de similitud muy alto con las del fago Tb, sin embargo, la secuencia nucleotídicas de dichos genes no son similares. Tal como se mostro en Resultados, el arreglo de los genes de Mesorhizobium sirvió como guía para determinar el orden de los contigs ensamblados.

En este sentido, a partir del grado de similitud existente entre las secuencias de Mesorhizobium y el fago Tb, así como del posible acomodo de los genes de ambos, puede inferirse una relación de ancestría entre el fago Tb y el profago de Mesorhizobium. Principalmente por la relación que existe entre los hospederos bacterianos (Brucella y Mesorhizobium) ya que ambos pertenecen al orden de los Rhizobiales.

Page 58: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

En otros modelos se ha visto que un fago puede infectar múltiples hospederos relacionados filogenéticamente. En el caso del fago p22, este virus puede infectar distintas especies de Salmonella e incluso especies de otros géneros pertenecientes a la familia Enterobacteriaceae (Pendulla 2003).

En el caso de los brucellafagos se ha observado una alta especificidad por su hospedero, por lo que la posibilidad de que el fago Tb infecte lisogenicamente a Mesorhizobium, mientras que en Brucella lleve a cabo una infección lítica, es muy remota.

Por otro lado, la información acerca de la frecuencia de uso de codones, y la diferencia en las secuencias nucleotídicas de los genes que codifican dichas proteínas, indican que la integración del fago en el genoma de Mesorhizobium no es un evento reciente.

La similitud observada en las secuencias de estas proteínas puede deberse a alguna relación de ancestría, en la que algún ancestro del profago de Mesorhizobium y del fago Tb coexistía con un ancestro común a Mesorhizobium y Brucella, posteriormente al momento de ocurrir algún fenómeno de especiación, el ancestro del fago se pudo haber adaptado de forma diferente a cada uno de sus hospederos, por un lado el ancestro que dio lugar al linaje de Brucella y por otro al ancestro que dio lugar al linaje de Mesorhizobium.

Otra hipótesis es que un ancestro común al profago y al fago Tb en algún momento fue capaz de infectar tanto a algún miembro del linaje de Mesorhizobium como a algún miembro de linaje de Brucella. Adaptándose diferencialmente a cada hospedero mientras estos dos linajes evolucionaban de forma independiente.

La similitud existente en las secuencias de las proteínas putativas del fago Tb y del profago de Mesorhizobium nos ha permitido establecer el posible arreglo que presentan los genes del fago Tb.

El arreglo esperado para este virus corresponde al tipo Terminasa-Cápside-Cola. Esta información será empleada para el diseño de oligonucleótidos que nos permitirán amplificar las regiones faltantes en el genoma fágico, y así poder completar la secuencia genómica del brucellafago Tb.

Page 59: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

8. Conclusiones

Page 60: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

8.1 Conclusiones.

La información obtenida en la secuenciación parcial de brucellafago Tb ha permitido establecer las relaciones filogenéticas de algunos de sus genes con genes de otros fagos, así como de algunas bacterias. El rasgo más relevante es la similitud del brucellafago con un profago de Mesorhizobium sp.

Este hallazgo nos permite inferir algunas relaciones de ancestría entre estas dos entidades, considerando la similitud en las secuencias de los dos fagos, y la cercanía filogenética de sus hospederos.

Por otro lado, la secuencia del brucellafago aportara información valiosa en cuanto a las funciones, evolución y propiedades del propio fago, así como en cuanto a la historia evolutiva de su hospedero.

Page 61: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

9. Referencias

Page 62: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

9.1 Referencias citadas

1. Altschul, S F, W Gish, W Miller, E W Myers, and D J Lipman. "Basic local alignment search tool." Journal of Molecular Biology 215, no. 3: 403-410.

2. Aziz, Ramy K, Robert A Edwards, William W Taylor, Donald E Low, and Allison Mcgeer. "Mosaic Prophages with Horizontally Acquired Genes Account for the Emergence and Diversification of the Globally Disseminated M1T1 Clone of Streptococcus pyogenes." Journal of Bacteriology 187, no. 10 (2005): 3311-3318.

3. Beumer, Amy, and Jayne B Robinson. "A Broad-Host-Range, Generalized Transducing Phage (SN-T) Acquires 16S rRNA Genes from Different Genera of Bacteria." Applied and Environmental Microbiology 71, no. 12 (2005): 8301-8304.

4. Bossi, Lionello, Juan A Fuentes, Guido Mora, and Nara Figueroa-bossi. "Prophage Contribution to Bacterial Population Dynamics." Journal of Bacteriology 185, no. 21 (2003): 6467-6471.

5. Canchaya, Carlos, Caroline Proux, Ghislain Fournous, Anne Bruttin, and Harald Brussow. "Prophage Genomics." Microbiology and Molecular Biology Reviews 67, no. 2 (2003): 238-276.

6. Chain, Patrick S G, Diego J Comerci, Marcelo E Tolmasky, Frank W Larimer, Stephanie A Malfatti, Lisa M Vergez, Fernan Aguero, Miriam L Land, Rodolfo A Ugalde, and Emilio García. "Whole-Genome Analyses of Speciation Events in Pathogenic Brucellae." Infection and Immunity 73, no. 12 (2005): 8353-8361.

7. Chen, Feng, and Jingrang Lu. "Genomic Sequence and Evolution of Marine Cyanophage P60: a New Insight on Lytic and Lysogenic Phages." Applied and Environmental Microbiology 68, no. 5 (2002): 2589-2594.

8. Corbel, M J, and E L Thomas. The Brucella-phages; their properties characterisation and applications. 1 ed. Weybridge: Ministry of Agriculture, Fisheries and Food, 1980.

9. Fortier, L C. "Genome Sequence and Global Gene Expression of Q54, a New Phage Species Linking the 936 and c2 Phage Species of Lactococcus lactis." Journal of Bacteriology 188, no. 17 (2006): 6101-6114.

10. Fouts, Derrick E, David A Rasko, Regina Z Cer, Lingxia Jiang, Nadia B Fedorova, Alla Shvartsbeyn, Jessica J Vamathevan, et al. "Sequencing Bacillus anthracis Typing Phages Gamma and Cherry Reveals a Common Ancestry." Journal of Bacteriology 188, no. 9 (2006): 3402-3408.

11. Glazko, Galina, Vladimir Makarenkov, Jing Liu, and Arcady Mushegian. "Evolutionary history of bacteriophages with double-stranded DNA genomes." Biology Direct 2, no. 36 (2007).

12. Godfroid, Jacques, Axel Cloeckaert, Jean-pierre Liautard, Stephan Köhler, David Fretin, Karl Walravens, Bruno Garin-Bastuji, and Jean-jacques Letesson. "From the discovery of the Malta fever’s agent to the discovery of a marine mammal reservoir, brucellosis has continuously been a re-emerging zoonosis." Veterinary Research 36 (2005): 313-326.

13. Goudie, Amanda D, Karlene H Lynch, Kimberley D Seed, Paul Stothard, Savita Shrivastava, David S Wishart, and Jonathan J Dennis. "Genomic sequence and activity of KS10, a transposable phage of the Burkholderia cepacia complex." BMC Genomics 9, no. 615 (2008).

14. Grayson, Paul, and Ian J Molineux. "Is phage DNA "injected" into cells? - biologists and physicist can agree." Current Opinion in Microbiology 10, no. 4 (2008): 401-409.

15. HATFULL, G. "Bacteriophage genomics." Current Opinion in Microbiology 11 (2008): 447-453. 16. Ha, Taekjip. "Need for Speed: Mechanical Regulation of a Replicative Helicase." Cell 129, no. 7

(2007): 1249-1250. 17. Koonin, Eugene V, and Yuri I Wolf. "Genomics of bacteria and archaea: the emerging dynamic

view of the prokaryotic world.." Nucleic acids research 36, no. 21 (2008): 6688-719. 18. Kornberg, Arthur. "Ten Commandments: Lessons from the enzymology of DNA replication."

Journal of Bacteriology 182, no. 13 (2000): 3613-3618.

Page 63: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

19. Lima-Mendez, Gipsi, Jacques van Helden, Ariane Toussaint, and Raphael Leplae. "Reticulate Representation of Evolutionary and Functional Relationships between Phage Genomes." Molecular Biology and Evolution 25, no. 4 (2008): 762-777.

20. Lindqvist, Bjorn H, Gianni Dehò, and Richard Calendar. "Mechanisms of Genome Propagation and Helper Exploitation by Satellite Phage P4." Microbiological Reviews 57, no. 3 (1993): 683-702.

21. Luna-Martinez, J E, and C Mejia-Teran. "Brucellosis in Mexico: Current status and trends." Veterinary Microbiology 90, no. 1-4 (2002): 19-30.

22. Mann, Nicholas H, Martha R J Clokie, Andrew Millard, Annabel Cook, William H Wilson, Peter J Wheatley, Andrey Letarov, and H M Krisch. "The Genome of S-PM2, a “Photosynthetic” T4-Type Bacteriophage That Infects Marine Synechococcus Strains." Journal of Bacteriology 187, no. 9 (2005): 3188-3200.

23. Miller, Eric S, John F Heidelberg, Jonathan A Eisen, William C Nelson, A Scott Durkin, Ann Ciecko, Tamara V Feldblyum, et al. "Complete Genome Sequence of the Broad-Host-Range Vibriophage KVP40: Comparative Genomics of a T4-Related Bacteriophage." Journal of Bacteriology 185, no. 17 (2003): 5220-5233.

24. Moineau, Sylvain, Denise Tremblay, and Steve Labrie. "Phages of lactic acid bacteria: from genomics to industrial applications." ASM News 68 (2002): 388-393.

25. Naryshkina, Tatyana, Jing Liu, Laurence Florens, Selene K Swanson, Andrey R Pavlov, Nadejda V Pavlova, Ross Inman, et al. "Thermus thermophilus bacteriophage phiYS40 genome and proteomic characterization of virions." Journal of Molecular Biology 8, no. 36 (2007): 667-677.

26. Nelson, Daniel, Raymond Schuch, Shiwei Zhu, Donna M Tscherne, and Vincent A Fischetti. "Genomic Sequence of C 1 , the First Streptococcal Phage." Journal of Bacteriology 185, no. 11 (2003): 3325-3332.

27. Pajunen, Maria, Saija Kiljunen, and Mikael Skurnik. "Bacteriophage phiYeO3-12, Specific for Yersinia enterocolitica Serotype O:3, Is related to Coliphages T3 and T7." Journal of Bacteriology 182, no. 18 (2000): 5114-5120.

28. Pedulla, Marisa L, Michael E Ford, Tharun Karthikeyan, Jennifer M Houtz, Roger W Hendrix, Graham F Hatfull, Anthony R Poteete, Eddie B Gilcrease, Danella Winn-Stapley, and Sherwood R Casjens. "Corrected Sequence of the Bacteriophage P22 Genome." Journal of Bacteriology 185, no. 4 (2003): 1475-1477.

29. Perna, NT, G 3rd Plunkett, V Burland, B Mau, JD Glasner, DJ Rose, GF Mayhew, et al. "Genome sequence of enterohaemorrhagic Escherichia coli O157:H7.." Nature 409, no. 6819 (2001): 529-533.

30. Petty, Nicola K, Terry J Evans, Peter C Fineran, and George P C Salmond. "Biotechnological exploitation of bacteriophage research." ScienceDirect (2006).

31. Rigby, Charlotte E, Maria-Lucia Cerqueira-Campos, Hilary A Kelly, and Om P Surujballi. "Properties and Partial Genetic Characterization of Nepean Phage and Other Lytic Phages of Brucella Species." Canadian Journal of Veterinary Research 53 (1989): 319-325.

32. Rohwer, Forest, Anca M Segall, Grieg Steward, Victor Seguritan, Mya Breitbart, Felise Wolven, and Farooq Azam. "The complete genomic sequence of the marine phage Roseophage SIO1 shares homology with nonmarine phages." Limnology and Oceanography 45, no. 2 (2000): 408-418.

33. Rohwer, Forest, and Rob Edwards. "The Phage Proteomic Tree: a Genome-Based Taxonomy for Phage." Journal of Bacteriology 184, no. 16 (2002): 4529-4535.

34. Rolain, Jean-Marc, Patrice Francois, David Hernandez, Fadi Bittar, Herve Richet, Ghislain Fournous, Yves Mattenberger, et al. "Genomic analysis of an emerging multiresistant

Page 64: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA

Staphylococcus aureus strain rapidly spreading in cystic fibrosis patients revealed the presence of an antibiotic inducible bacteriophage." Biology Direct 4, no. 1 (2009).

35. Salzberg, S L, A L Delcher, S Kasif, and O White. "Microbial gene identification using interpolated Markov models." Nucleic Acids Research 26, no. 2 (1998): 544-548.

36. Sambrook, Joseph, and David Russel. Molecular cloning: A laboratory manual. Third. New York: Cold Spring Harbor Laboratory Press, 2001.

37. Segondy, Michel, Annick Allardet-servent, René Caravano, and Michel Ramuz. "Common physical map of four Brucella bacteriophage genomes." FEMS Microbiology Letters 56, no. 2 (1988): 177-181.

38. Summer, Elizabeth J, Carlos F Gonzalez, Morgan Bomer, Thomas Carlile, Addie Embry, Amalie M Kucherka, Jonte Lee, et al. "Divergence and Mosaicism among Virulent Soil Phages of the Burkholderia cepacia Complex." Journal of Bacteriology 188, no. 1 (2006): 255-268.

39. Summers, William, Richard Calendar, Ross Inman, John W Little, Roger W Hendrix, Mya Breitbart, Forest Rohwer, et al. Phages. Their role in bacterial pathogenesis and biotechnology. Matthew Waldor, David I Friedman, and Sankar Adhya. 1 ed. Washington DC: American Society for Microbiology Press, 2005.

40. Supek, Fran, and Kristian Vlahoviček. "Comparison of codon usage measures and their applicability in prediction of microbial gene expressivity." BMC Bioinformatics 6, no. 182 (2005).

41. Supek, Fran, and Kristian Vlahoviček. "INCA: synonymous codon usage analysis and clustering by means of self-organizing map." Bioinformatics 20, no. 14 (2004): 2329-2330.

42. Tanaka, Kiyoshi, Kei Nishimori, Sou-ichi Makino, Tomoko Nishimori, Toru Kanno, Ryoko Ishihara, Toshiya Sameshima, et al. "Molecular Characterization of a Prophage of Salmonella enterica Serotype Typhimurium DT104." Journal of Clinical Microbiology 42, no. 4 (2004): 1807-1812.

43. Vander Byl, Carolyn, and Andrew M Kropinski. "Sequence of the Genome of Salmonella Bacteriophage P22." Journal of Bacteriology 182, no. 22 (2000): 6472-6481.

44. Wagner, Patrick L, and Matthew K Waldor. "Bacteriophage Control of Bacterial Virulence." Infection and Immunity 70, no. 8 (2002): 3985-3993.

45. Weigel, Christoph, and Harald Seitz. "Bacteriophage replication modules." FEMS Microbiology Reviews 30, no. 3 (2006): 321-381.

46. Wommack, K Eric, and Rita R Colwell. "Virioplankton: Viruses in Aquatic Ecosystems†." Microbiology and Molecular Biology Reviews 64, no. 1 (2000): 69-114.

47. Wright, F. "The "effective number of codons" used in a gene." Gene 87, no. 1 (1990): 23-29.

Page 65: INSTITUTO POLITÉCNICO NACIONAL ESCUELA …tesis.ipn.mx/jspui/bitstream/123456789/5892/1/1357_Escuela Nacional... · que puede ser DNA o RNA, de ... inducir la degradación del DNA