1/2 (sI UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO POSGRADO EN CIENCIAS BIOM¡;DICAS INSTITUTO DE ECOLOGíA lución molecular y genética de poblaciones la isla patogénica LEE en Escherichia coli T E S I S E PARA OBTENER EL GRADO ACADtMICO DE DOCTORA EN CIENCIAS PRESENTA, AMANDA CASTILLO COBIAN DIRECTORA DE TESIS: ORA. VAlERIA SOUZA SAlO!VAR M~ICO D. F. OCTUBRE 2005 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. AutorUo I la Dfraccl6n Geaaral de Bibliotecas de UNAM • difundir en formato eIect~ 8 Impreso coAtlnldo de mi trabajo recepcion~. NOMBRE: .f\x dS, se analiza como una prueba de una cola con un infinito número de grados de libertad. La varianza de D también puede ser calculada a partir de una prueba de bootstrap, en donde se toma como unidad de muestreo sucesivo los codones en lugar de los nuc1eótidos de la secuencia y se procede a realizar múltiples repeticiones de los parámetros Psb, Pnb, dsb, dnb de PS, PN, dS, dN y se obtienen las varianzas de estos valores. También podemos calcular el error estandar de D mediante el bootstrap y luego usar una prueba de Z (si la muestra es grande) (Efron y Tibshirani, 1993). Una fonna más adecuada en el caso de que la secuencia de nucleótidos sea pequeña es calcular directamente dS y dN Y sus varianzas y usar la hipótesis nula de que ambas son iguales dN = dS con una prueba de Z. Otra fonna es construir una tabla de contingencia para las sustituciones sinónimas y no sinónimas calculadas directamente de la 34 secuencia y realizar una prueba de Fisher (Zhang y col. 1997). Si el valor de P es menor a 0.05, entonces la hipótesis nula de evolución neutral es rechazada. 3.4.3.1. 2 Método modificado de Nei-Gojobori Al realizar el cálculo del número de sitios sinónimos y no sinónimos el método de Nei-Gojobori asume que la sustitución de los 4 nucleótidos sucede de forma azarosa, es decir con la misma probabilidad para cada uno (Nei y Gojobori, 1986). En la práctica esto no es necesariamente cierto, ya que pueden existir un mayor número de sustituciones de un tipo de nucleótido u otro. El cociente de transiciones (cambio de purina por purina o pirimidina por pirimidina) es usualmente mayor que el de transversiones (cambio de purina por pirimidina y viceversa). En este caso se espera que el número de sitios potenciales que producen sustituciones sinónimas sea mayor que el determinado por el método de Nei- Gojobori, ya que las transiciones en la tercera posición son en su gran mayoría sinónimas y serán más frecuentes. Para corregir este detalle se propuso modificarlo utilizando como base el modelo de dos parámetros de Kimura (Kimura-2) (Kimura, 1980; Ina, 1995), en este modelo la proporción de transiciones del total de cambios es dada por la siguiente relación: a R ---= a + 2{3 1 + R a = transiciones, cada nucleótido puede tener un cambio transicional, por ejemplo A (purina) a G (purina). P = transversiones, 2p tomando en cuenta que cada nucleótido puede tener dos cambios transversionales, por ejemplo, A (purina) puede cambiar a T (pirimidina) ó e (pirimidina). R = cociente de transiciónltransversión, que es igual a 0.5 cuando las transiciones y las tranversiones se producen con la misma probabilidad. Teóricamente la modificación al método de Nei-Gojobori es mejor al ser un modelo que se apega más a la realidad de la naturaleza del proceso de sustituciones en una secuencia de DNA. Sin embargo, en la práctica la determinación del cociente de transiciones/transversiones (R) en los sitios sinónimos o no sinónimos es complicada y usualmente cae en sobreestimaciones de cambios sinónimos. Por otra parte, cuando se 35 sobreestima este cociente se puede concluir que las sustituciones no sinónimas son significativamente mayores a las sinónimas cuando no es el caso. Hay que señalar que la mayor parte de las veces los patrones de sustitución son más complicados que los descritos por el modelo de Kimura-2, y bajo ciertas condiciones tanto el método de Nei-Gojobori como su modificación pueden sobreestimar las sustituciones sinónimas sobre las no sinónimas, haciendo dificil la detección correcta de selección positiva. Lo recomendable es usar ambos métodos, si ambas versiones detectan la presencia de selección positiva se tiene una mayor seguridad acerca de las conclusiones derivadas de este análisis y un fuerte indicio de selección positiva. 3.4.3.2 Métodos basados en el modelo de dos parámetros de Kimura Además de la modificación al modelo de Nei-Gojobori, existen otros métodos que intentan detectar la selección basados en el modelo de Kimura-2 (Kimura, 1980). Entre los más importantes encontramos el método de Li-Wu-Luo (Li y col., 1985), Pamilo-Bianchi- Li (Pamilo y Bianchi, 1993 y Li, 1993) y el de Comeron y Kumar (Nei y Kumar, 2000). 3.4.3.2.1 Li-Wu-Luo Li y sus colaboradores (1985) desarrollaron otro método considerando la degeneración del código genético. Los sitios en los codones pueden ser clasificados en 4- veces degenerados, 2-veces degenerados, y 0- veces degenerados. Un sitio es reconocido como 4- veces degenerado si todos los cambios posibles en ese sitio son sinónimos, 2-veces degenerado si uno de tres cambios o dos de tres cambios es sinónimo y O-veces degenerado si todos los cambios son no sinónimos o se refieren a mutaciones sin sentido que generan codones de término. Por ejemplo, la mayoría de los cambios en la tercera posición son 4- veces degenerados, mientras que todos los cambios en la segunda posición son 0- veces degenerados. Bajo esta regla podemos calcular los tres tipos de cambios LO, L2, y L4 (0- veces, 2-veces y 4-veces degenerados, respectivamente) para dos secuencias que quieran ser comparadas. Se comparan las dos secuencias codón por codón y se clasifica cada diferente nucleótido según sea una transición ó transversión. Entonces se calcula la proporción de transiciones (Pi) y transversiones (Qi) en cada clase (i) de nucleótido (i= O, 2 ó 4) tomando en cuenta la probabilidad de verosimilitud de ocurrencia de cada aminoácido (se denomina 36 en inglés "Iikelihood occurrence", es un parámetro de probabilidad de que se encuentre presente un detenninado aminoácido). Ellos estiman la proporción de cambios transicionales y de transversiones con la siguiente relación: 1 1 A = -ln(a)--ln(b) I 2 I 4 I Donde, Pi = número de transiciones tomando en cuenta la clase de sitio (O, 2 ó 4) Qi = número de transversiones tomando en cuenta la clase de sitio (O, 2 ó 4) a¡ = 1/(1 - 2p¡ - Q¡) b¡ = 1/(1-2Q¡) Sabemos que la mayoría de las sustituciones en los sitios 4-veces degenerados son sinónimas y todas las sustituciones en los sitios O-veces degenerados son no sinónimas. Sin embargo, para los sitios 2-veces degenerados las transiciones (A2) son en su mayoría sinónimos, mientras que las transversiones (B2) son en su mayoría no sinónimas. Si suponemos que la probabilidad de sustitución de cada uno de los 4 nucleótidos (A, G, e y T) se lleva a cabo con la misma frecuencia, los autores de este método sugirieron que 1 /3 de los cambios en los sitios 2-veces degenerados son potencialmente sinónimos y 2/3 son potencialmente no sinónimos. Bajo estas ideas, propusieron que dN y dS pueden ser estimados con la siguiente relación: 37 A su vez, estas fórmulas se basan en ciertos supuestos, el primero y más evidente es que el tipo de sitio en una determinada secuencia puede no corresponder al mismo sitio o sitio homólogo en la secuencia contra la cual se está comparando. Es decir, en una secuencia puede tratarse de un sitio 4-veces degenerado, mientras que en su equivalente este sitio puede ser un sitio 2-veces degenerado. Esto último sucede con frecuencia, sobre todo si trabajamos con secuencias muy divergentes entre sí. En este caso en particular la mitad de los sitios son considerados 2-veces degenerados y la otra mitad 4-veces degenerados. El segundo supuesto es que los cambios sin sentido son considerados cambios no sinónimos (lo que es totalmente incorrecto). Se sabe que este tipo de cambios suceden con una probabilidad de 4%. Por lo tanto se espera que el método de Li-Wu-Luo sobreestime las sustituciones no sinónimas (dN). Aunado a esto tenemos casos específicos de ciertos aminoácidos, donde surgen problemas en las determinaciones. Tal es el caso de la leucina donde en la tercera posición de sus tres codones (2-veces degenerados), algunas transversiones son sinónimas. Otro caso es el de la arginina, en donde las transiciones en las primeras posiciones de 4 de sus codones (2-veces degenerados) son no sinónimas con excepción de un codón en donde el cambio genera una mutación sin sentido. A pesar de estos detalles, éste método proporciona estimados parecidos al de Nei- Gojobori con precisión, siempre y cuando se trate del análisis de muchos codones (> 1 00) Y secuencias poco divergentes entre sí. 3.4.3.2.2 Pamilo-Bianchi-Li Este método es en realidad una extensión del anterior. Los autores notaron que las transiciones que resultan en cambios sinónimos suceden sólo en los sitios 2-veces y 4-veces degenerados, como las transversiones en los sitios 4-veces degenerados son también sinónimas, el número total de sustituciones sinónimas (por sitios sinónimos) se estima de la siguiente manera: Por lo tanto las sustituciones no sinónimas, 38 3.4.3.2.3 Comeron y Kumar Ninguno de los métodos anteriores toma en cuenta casos específicos como la arginina, aunque en primera instancia esto no parece tener importancia pues se trata de sólo aminoácido, para algunos genes de los mamíferos (como la protamina) es un problema real. ya que sus proteínas son ricas en arginina precisamente. Utilizando las mismas fórmulas del método de Pamilo-Bianchi-Li (Pamilo y Bianchi, 1993 y Li, 1993), Cameron (1995) y Kumar y col. (2000) dividieron los sitios 2-veces degenerados en sitios 2-veces degenerados simples y complejos. Los sitios simples se refieren a sitios en que· las transiciones dan lugar a un cambio sinónimo y dos transversiones generan sustituciones no sinónimas o sin sentido. Todos los casos restantes se incluyen en los sitios 2-veces degenerados complejos. 3.4.3.3 Métodos de verosimilitud con modelos de sustitución de codones Como alternativa a los métodos descritos anteriormente, surgen los modelos basados en la aproximación de máxima verosimilitud. En estos modelos se pretende incluir algunos detalles que los demás no incluían, como es el caso de que una clase de sitio (O-veces degenerado, por ejemplo) haya cambiado en el tiempo, además de la inclusión de múltiples tasas de sustitución para un sitio determinado (Muse y Gaut, 1994 y Goldman y Yang, 1994). Dos modelos surgieron al mismo tiempo utilizando esta aproximación. Uno de ellos es el trabajo llevado a cabo por Muse y Gaut (1994), utilizando como modelo el genoma del cloroplasto, y el segundo fue desarrollado por Goldman y Yang (1994). Ambas propuestas se basan en un modelo específico de sustitución de codones y la determinación de la mayoría de los parámetros del modelo por el método de Máxima Verosimilitud descrito por Felsenstein (1981). En estos trabajos se supone que cada sitio en la secuencia evoluciona de manera independiente de sus sitios vecinos y de los sitios homólogos en las otras secuencias. De esta forma el parámetro de máxima verosimilitud de cada sitio (algo así como la probabilidad de observar dicho nucleótido en un lugar específico de la secuencia) es el producto de la máxima verosimilitud de cada uno de los sitios. Comenzaremos por detallar el funcionamiento de estos modelos analizando los trabajos desarrollados por Goldman y Yang (1994), Nielsen y Yang (1998) y Yang y 39 Nielsen (2000), entre algunos, ya que son los más desarrollados y sobre los cuales se basan en la actualidad la mayoría de los trabajos de estudio de adaptación molecular con el método de máxima verosimilitud. Los autores definen el parámetro ro como el cociente de las tasas de substituciones no sinónimas y sinónimas (dN/dS), que al igual que en los demás modelos mide la relación entre los dos tipos de tasas de substituciones. Si un cambio en un aminoácido es neutral se fijará con la misma probabilidad que una mutación sinónima y ro = l. Si el cambio en el aminoácido es deletéreo la selección negativa o purificadora reducirá su probabilidad de fijación y ro < l. Sólo cuando el cambio de un aminoácido tiene una ventaja selectiva se fija con una mayor probabilidad que una mutación sinónima y ro > l. Por lo tanto, un valor de ro significativamente mayor a uno es una evidencia de selección positiva. Desarrollan el modelo de sustitución de codones con el cual detenninan la tasa de sustitución del codo n i alj (i;rj) y que está dado por las siguientes condiciones: O, si i y j difieren en una posición nj, para transversiones sinónimas qij K1tj, para transiciones sinónimas ro1tj, para transversiones no sinónimas roK1tj, para transiciones no sinónimas 1tj - frecuencia del codonj en equilibrio (tomado de la frecuencia del codón en la muestra en estudio) K - cociente de transiciones y transversiones detenninado a partir de la muestra ro - dN/dS Si se quiere considerar la sustitución a través de un tiempo t la probabilidad de transición está dada por: P(t) = {Pu (t)} = e 1, con otro modelo donde no existan esos sitios; el segundo paso implica la aplicación del teorema de Bayes para identificar los sitios donde realmente existe selección positiva (Goldman y Yang, 1994, Nielsen y Yang, 1998, Yang y Nielsen, 2000 y Yang y Bielawski, 2000). Para poder tener una mayor comprensión del método, haremos un paréntesis para explicar con un modelo cómo funcionan estas pruebas (tomado de Yang y Bielawski, 2000). Supongamos que tenemos una población hipotética dividida en dos grupos 1 y 11 que corresponden al 600/0 y 400/0 de la población total, respectivamente. En el grupo 1 ocurre un tipo de enfermedad en una proporción de 1 % yen el grupo II de 0.01 %. Supongamos ahora 41 que hacemos un muestreo al azar de 100 individuos de la población total (incluyendo grupo 1 y 11), ¿cuál es la probabilidad de que 3 de ellos estén enfermos? Esta probabilidad (O) es un promedio entre los dos grupos G 1 y G2, y está definida por: p = P(O) = P(G1) x P(O I G1) + P(G2) x P(O I G2) = 0.6 x 0.01 + 0.4 x 0.001 = 0.0064 De igual manera la probabilidad de que el individuo no e~té enfermo es: P(02)= P(G1) x p(D2 1 GI) + P(G2) x p(D2 1 G2) = 0.6 x 0.99 + 0.4 x 0.999 = 0.9936 lo que es lo mismo que 1 - p (de la primera ecuación). La probabilidad de que 3 de cada 100 individuos posean la enfermedad está dada por la probabilidad: p=100!p3(l-p)97 =0.0227 3! x97! Si ésta última ecuación involucra un parámetro desconocido tal como la probabilidad de aparición de la enfermedad en el grupo 1, por ejemplo, éste parámetro puede ser estimado maximizando esta fórmula. En este caso, la ecuación nos da la probabilidad de observar el dato de la muestra y se le denomina la función de verosimilitud. La segunda cuestión involucra realizar el razonamiento de forma inversa, es decir, calcular la probabilidad de que un individuo de la muestra tomada al azar que se encuentre enfermo pertenezca al grupo 1. Es aquí que usamos el teorema de Bayes: p(Gll D) = P(GI) x P(D I GI)/P(D) = 0.6 x 0.0110.0064 = 0.94 Por lo tanto, la probabilidad de que un individuo enfermo pertenezca al grupo 1 es mayor, de la misma forma la probabilidad de que un individuo sano pertenezca a este grupo es mayor. Para el caso del estudio de la selección positiva, la D del ejemplo corresponde a un sitio de la secuencia y Gi es la clase de sitio i a la que pertenece con un determinado valor de Wi. La probabilidad de observar un dato determinado en un sitio es un promedio de las clases de sitios. Entonces, el producto de las probabilidades de clases de esos sitios constituye la verosimilitud a partir de las cual se estiman los parámetros desconocidos, tal 42 como la distribución de O) sobre los sitios y la longitud de las ramas de los árboles filogenéticos o genealogías. Después de que éstos parámetros son estimados, se utiliza el teorema de Bayes para el cálculo de la probabilidad posterior de que cualquier sitio pertenece a una clase determinada de valores de 0), y dentro de ellos se encuentre el modelo de selección positiva cuyos valores serán mayores a uno. Una de las ventajas de los modelos basados en máxima verosimilitud es que no necesitan de las reconstrucciones filogenéticas, además de que pueden incluir ciertos parámetros característicos del proceso evolutivo del DNA, tales como el cociente de transiciones/transversiones y el uso de codones. 3.4.3.4 Métodos basados en reconstrucciones filogenéticas Dentro de los métodos que intentan determinar la selección a nivel intragénico llaman la atención los trabajos que incluyen una reconstrucción de los posibles ancestros basándose en una filogenia o genealogía determinada. Uno de los trabajos más sistemáticos es realizado por Suzuki y Gojobori (1999). Los autores calculan el número de sitios sinónimos y no sinónimos a lo largo de un árbol filogenético construido a partir del modelo de distancia del vecino más cercano (Neighbor joining), y luego prueban si la proporción de sustituciones no sinónimas difieren del modelo neutral (O) = 1). Las tasas de sustitución las calculan a partir del modelo de Nei-Gojobori y para cada sitio en el codón se infiere su secuencia ancestral a partir de cada nodo del árbol. Otro trabajo basado en reconstrucciones genealógicas es el realizado por Fitch y colaboradores (1997), donde básicamente usan el modelo de máxima parsimonia para la reconstrucción de una genealogía y a partir de ella calculan los cambios en cada sitio de cada codón a lo largo de las ramas de las genealogías obtenidas asumiendo que las tasas de sustitución son constantes en todos los sitios de los codones (lo que en general no es cierto). Estos métodos necesitan de muestras grandes para ser eficientes y no tener varianzas muy grandes, recordando que a partir de las reconstrucciones fi logenéticas ya existen errores dependiendo del modelo evolutivo usado, así es que hay que tener cuidado en su implementación. En conclusión, la mayoría de los métodos presentados aquí son vigentes en la literatura de investigación de los procesos evolutivos moleculares. Todos son efectivos dependiendo del tipo de datos y las características de la muestra a usar, sobre todo si 43 trabajamos con secuencias muy conservadas y poco divergentes entre sí a través del tiempo. Sin embargo, lo que sí es claro es que cuando trabajamos con secuencias poco conservadas y divergentes entre sí, los métodos de máxima verosimilitud y las reconstrucciones basadas en modelos de distancia resultan ser más efectivas que los demás (Zhang y Nei, 1997). Los métodos de verosimilitud y con uso de un modelo de codones no se ven afectados por los procesos demográficos y son los únicos que determinan de manera directa la participación de la selección (Nielsen, 2001). Por otra parte, se ha visto que la probabilidad de reconstrucción correcta de las secuencias ancestrales, utilizando como modelo la secuencia de la lisozima C, es de 98.7% para el método de máxima verosimilitud contra 91.30/0 para los métodos de máxima parsimonia (Yang y col., 1995). A continuación en la tabla 2 se comparan las tasas de sustitución obtenidas por varios métodos descritos en este trabajo determinados a partir del estudio de la subunidad a2 de las globinas entre humanos y orangutanes (142 codones) (tomado de Yang y Bielawski, 2000) y el gen mitocondrial para la NADH deshidrogenasa de humanos y chimpancés (603 codones) (Modificado de Nei y Kumar, 2000). Tabla 3.2. Tasas de sustitución de nucleótidos de la subunidad al de las globinas y de la NADH deshidrogenasa determinadas por los distintos métodos descritos en el presente capítulo. Método dN dS dN/dS Referencia globinas a2 Nei-Gojobori 0.0095 0.0569 0.168 (Nei y Gojobori, 1986) Li 0.0104 0.0517 0.20] (Li, 1993) lna 0.0101 0.0523 0.193 (Ina,1995) Yang y Nielsen 0.0083 0.1065 0.078 (Yang y Nielsen, 2000) NADH deshidrogensasa Nei-Gojobori 0.0379 0.4151 --- (Nei y Kumar, 2000) Li-Wu-Luo 0.0378 0.4277 --- (Nei y Kumar, 2000) Modificación a Nei- 0.0438 0.2730 --- (Nei y Kumar, 2000) Gojobori 44 Ina 0.0438 0.303 1 --- (Nei y Kumar, 2000) -- Pamilo-Bianchi-Li 0.0438 0.3018 --- (Nei y Kumar, 2000) Comeron-Kumar 0.0438 0.3018 --- (Nei y Kumar, 2000) Goldman-Yang 0.0442 0.2872 --- (Nei y Kumar, 2000) Como podemos observar no existe una diferencia importante entre los distintos modelos para estos genes. 3.5 Genes donde se ha detectado selección positiva Hemos intentado dar un panorama de los diferentes métodos utilizados en la actualidad para el estudio de la selección positiva a nivel molecular. No existe un consenso dentro de la comunidad científica acerca de cuál es el mejor método a usar para la detenninación de la participación de la selección. En general existe una amplia gama de trabajos y autores que usan indistintamente todos los métodos descritos en el presente trabajo con resultados muy parecidos. Lo más importante es conocer la muestra de datos que vamos a utilizar y todas las peculiaridades que exhibe, tal como, el cociente de transversiones/transiciones y el uso de codones. También es importante tener una reconstrucción filogenética adecuada. De esta fonna aseguraremos que el modelo que escojamos para determinar las tasa de sustitución y calcular la relación de dS/dN es el que más se ajusta a nuestros datos. Otra sugerencia es la comparación de resultados utilizando varios métodos y hacer acopio de toda la información de evolución molecular y biológica a la que tengamos acceso lo que siempre garantizará la obtención de mejores resultados. En la tabla 3.3 se resume la mayoría de los ejemplos registrados en los que se ha detectado la participación de la selección positiva mediante la determinación del cociente dN/dS y los autores respectivos (modificado de Yang y Bielawski, 2000). 45 Tabla 3.3. Genes de diversos organismos involucrados en actividades celulares de varias clases que se encuentran bajo selección positiva determinado por diferentes métodos moleculares donde el parámetro dN/dS > l. GEN ORGANISMO REFERENCIA MÉTODO Genes involucrados con sistema inmune Quitinasas clase 1 Arabis y Bishop y col., 2000. Li-Wu-Luo Arabidopsis Colicinas Escherichia coli Riley MA, 1993. Nei-Gojobori Defensinas Roedores Hughes y Yeager, Nei-Gojobori 1997. Inmunoglobulinas V H Mamíferos Tanaka y Nei, 1989. Nei-Gojobori Genes del Complejo Mayor Mamíferos Hughes y Nei, 1988. Nei-Gojobori de Histocompatibilidad Inhibidor de la Dicotiledóneas y Stotz y col., 2000. --- poligalacturonasa legumbres Genes de grupo sanguíneo Primates y roedores Kitano y col., 1998. Nei-Gojobori RH (RH50) Ribonucleasas Primates Zhang y col., 1998. Nei-Gojobori Gen de la transferrina Salmones Ford y col., 1999. Nei-Gojobori Interferon-ro tipo 1 Mamíferos Hughes, 1995. Nei-Gojobori Inhibidor de la proteinasa Roedores Goodwin y col., 1996. Nei-Gojobori a-l Genes involucrados en la evasión de la respuesta a sistema inmune Gen de la cápside Virus de la fiebre Haydon y col., 2001. ML* aftosa Genes CSP, TRAP, MSA-2 Plasmodium Hughes y Hughes, Nei-Gojobori y PF83 falciparum 1995. 46 Región codificadora del Virus de la hepatitis Wu y col., 1999. Comeron antígeno delta D Gen de la envoltura de la Virus HIV Yamaguchi-Kabata y lna cápside Gojobori, 2000. Glicoproteína gH Virus de la Endo y col., 1996. Nei-Gojobori pseudorabia Genes del antígeno de la Shigella Endo y col., 1996. Nei-Gojobori invasión del plásmido Antígeno-l de la superficie Plasmodium Hughes, 1992. Nei-Gojobori del merozoito (MSA-l) falciparum --- Proteína de la membrana Chlamydia Endo y col., 1996. Nei-Gojobori externa Porina 1 (porB) Neisseria Smith y col., 1995. Nei-Gojobori gonhorreae y N. meningitidis Glicoproteínas S y HE Coronavirus del Baric y col., 1997. Nei-Gojobori ratón Sigma 1 Reovirus Endo y col., 1996. Nei-Gojobori Gen determinante de la Yersinia Endo y col., 1996. Nei-Gojobori virulencia Genes involucrados en la reproducción Proteína involucrada en la Haliotis (Abulón) Vacquier y col., 1997. Nei-Gojobori fertilización 18 kDa Gen Acp26Aa Drosophila Tsaur y Wu, 1997. Li-Wu-Luo Proteína que une al Roedores Karn y Nachman, Li andrógeno 1999. Hormona de puesta de Aplysia californica Endo y col., 1996. Nei-Gojobori huevos Gen de caja homeótica Ods Drosophila Ting y col., 1998. --- 47 Gen de caja homeótica Pem Roedores Sutton y Wilkinson, Li 1997. Protamina PI Primates Rooney y Zhang, Nei-Gojohori 1999. Lisina del espenna Haliotis (Abalone) Vacquier y col., 1997. Nei-Gojohori RNAsa S Rosaceae Ishimizu y col., 1998. Nei-Gojohori Gen de la diferenciación Primates Pamilo y O'Neill, Pamilo- testicular Sry 1997. Bianchi-Li Genes involucrados en la digestión . Caseína K Bovinos Ward y col., 1997. --- Lisozima Primates Messier y . Stewart, --- 1997. Toxinas Conotoxina Gástropodo Conos Duda y Palumbi, lna 1999. Fosfolipasa A2 Serpientes crotalinas Nakashima y col., Miyata y 1995. Yasunaga Genes relacionados a transporte de electrones y síntesis de A TP Suhunidad Fo de la ATP E. coli Endo y col., 1996. Nei-Gojobori sintetasa lsofonna COX7 A Primates Schmidt y col., 1999. --- COX4 Primates Wu y col., 1997. --- Citoquinas SF de Granulocito- Roedores Shields y col., 1996. --- macrófago Interleucina-3 Primates Shields y col., 1996. --- Interleucina-4 Primates Shields y col., 1996. --- 48 Misceláneos CDC6 Saccharomyces Endo y col., 1996. Nei-Gojobori cerevisiae Honnona de crecimiento Vertebrados Wallis, 1996. Nei-Gojobori Cadena p de la Peces antárticos Bargelloni y col., ML hemoglobina 1998. Gen Jingwei Drosophila Long y Langley, --- 1993. Péptido C3 de la prostateína Rata Endo y col., 1996. Nei-Gojobori *ML : Método de Máxima verosimilitud De esta tabla es evidente que existen pocos ejemplos a nivel molecular de genes que se encuentren sujetos a selección positiva. En la literatura la mayoría de los trabajos indican que la mayor parte de la evolución molecular está dominada por los procesos neutros y la selección negativa o purificadora, como Kimura (1983) y otros autores (Ohta, 1992; Li, 1997) han discutido. Pero ¿qué sucede cuando estudiamos los genomas completos? ¿acaso la selección actúa de la misma fonna que a nivel génico e intragénico? 3.6 La selección a nivel genómico La gran cantidad de secuencias almacenadas en las bases de datos (GenBank, EMBL) representan tanto un reto como una oportunidad para la genética de poblaciones y la genómica en cuanto al desciframiento de la historia evolutiva que contienen, así como, para entender los mecanismos evolutivos que han moldeado la diversidad molecular observada. De la misma fonna han implicado la necesidad del desarrollo de nuevos métodos de análisis que puedan manejar esta gran cantidad de datos y que nos pennitan llevar a cabo interpretaciones efectivas acerca de los procesos evolutivos. Esta tarea es especialmente dificil si tomamos en consideración que muchos procesos evolutivos nos pueden llevar a observaciones similares. El advenimiento de la era de la genómica ha generado la disponibilidad de una gran cantidad de genomas completos, lo que se ha convertido en una herramienta poderosa para el estudio de la actuación de las distintas fuerzas evolutivas a gran escala. Este hecho nos 49 brinda la posibilidad de hacer comparaciones de alta resolución y poder estadístico debido al número de genes involucrados en el estudio. Se han descrito hasta la fecha dos trabajos importantes que parecen describir los papeles que tiene la selección a nivel genómico, curiosamente ambos trabajos implican el estudio de dos dominios diferentes, el de las bacterias y el eucarionte. Y de esta misma forma los resultados parecen ser antagónicos. El primer estudio corresponde a la comparación entre las tasas de sustitución de los denominados genes esenciales y no esenciales de tres especies bacterianas: E. coli, Helicobacter pylori y Neisseria meningitidis (Jordan y col., 2002) (Tabla 4). En este trabajo los autores asignan la categoría de genes esenciales apoyados en los datos experimentales (sobre todo de mutantes) que existen de E. coli, extrapolándolos a los genes homólogos en las otras especies bacterianas. Las tasas de sustitución fueron obtenidas mediante el método de Pamilo-Bianchi-Li (Li, 1993 Y Pamilo y Bianchi, 1993). Mostramos a continuación una modificación de la tabla descrita en el trabajo de Jordan (Jordan y col., 2002) (Tabla 4), donde podemos ver la comparación entre las distintas tasas de sustitución y el cociente de relación entre ambas Ka/Ks (equivalente a dN/dS). Tabla 3.4. Comparación de las distintas tasas de sustitución de nucleótidos y el cociente (Ks/Ka) entre genes esenciales y no esenciales de tres especies bacterianas, obtenidas mediante el método de Pamilo-Bianchi-Li (Pamilo y Bianchi, 1993 y Li, 1993). Ks (±se) Ka (±se) KalKs (±se) Escherichia coli Genes esenciales 0.02699 ±0.0021 0.00111 ±0.0010 0.0450 ±0.007 No esenciales 0.051 ±O.OO 1 O 0.00360 ±0.0002 0.0840 ±0.002 Helicobacter pylori Genes esenciales 0.11133 ±0.0041 0.01289 ±0.0011 0.1132 ±0.009 No esenciales 0.03524 ±0.0031 0.02164 ±O.OO 14 0.1614 ±0.008 Neisseria meningitidis Genes esenciales 0.06537 ±0.0069 0.00476 ±0.0007 0.0732 ±0.010 No esenciales 0.09156 ±0.0059 0.00960 ±O. 0009 0.1765 ±0.019 50 Como podemos observar, al parecer existe una diferencia significativa entre los genes esenciales y no esenciales dentro del genoma de E. coli (Tabla 4). De igual manera observamos que este patrón se repite para H. pylori y N. meningitidis. Además, al parecer las tasas de sustitución son mayores en éstos dos últimos patógenos en comparación con las observadas para E. coli, lo que parece indicar que estos organismos evolucionan más rápidamente (Tabla 4). Uno de los resultados más importantes de este estudio es el hecho de que los autores no detectan selección positiva en todo el análisis. Aunque no descartan la posibilidad de que en algunas regiones específicas de algunos genes exista este tipo de selección. Concluyen que, en el caso particular de las bacterias, la selección negativa o purificadora es casi la regla en la evolución a nivel proteínas. Es decir, que la tasa evolutiva es detenninada por la proporción de sitios en la proteína que poseen altos coeficientes selectivos contra las mutaciones deletéreas (lordan et al, 2002). En otras palabras, estos resultados sugieren que la selección purificadora es. la principal fuerza moldeando la historia bacteriana a nivel genómico. El segundo trabajo analiza el papel que juega la adaptación a nivel genómico dentro del género Drosophila (Smith y Eyre-Walker, 2002). Se basan en la detenninación de la proporción de aminoácidos que se sustituyen debido a selección positiva durante la divergencia de las especies D. simulans y D. yakuba utilizando todos los genes homólogos existentes para ambas especies. Los valores de las sustituciones sinónimas y no sinónimas son calculados a partir del modelo de máxima verosimilitud desarrollado por Yang y colaboradores (Goldman y Yang, 1994, Nielsen y Yang, 1998, Yang y Nielsen, 2000 y Yang y Bielawski, 2000), que ya han sido descritos ampliamente. Se correlacionan estos parámetros con el polimorfismo de tipo sinónimo o no sinónimo a 10 largo de la secuencia de los distintos genes. Las conclusiones de este trabajo muestran que aproximadamente un 24% de las sustituciones de aminoácidos entre ambas especies de mosca de la fruta son producto de la selección positiva. Finalmente, detenninan que existen aproximadamente 270,000 sustituciones de aminoácidos seleccionadas positivamente durante la divergencia de las dos especies. Lo que implica (tomando el tiempo de divergencia entre ambas que es de 6 millones de años) que estas dos especies han sufrido en promedio una sustitución del tipo adaptativo cada 45 años ó cada 450 generaciones (si contamos 10 generaciones por 51 año). Este último resultado es consistente con lo que Haldane describe como el costo de la selección positiva de tipo Darwiniano. Lo que indicaría que para el caso de este grupo de eucariontes la selección natural de tipo darwiniano posee el papel principal dentro de la evolución molecular, a diferencia de su contraparte procarionte. 3. 7. Discusión La selección natural ha sido, desde la propuesta inicial hecha por Darwin que la centraba como fuerza evolutiva principal dentro del proceso evolutivo y el origen de nuevas especies, centro de continuo debate. Existe hoy en día un interés especial en el estudio de la selección positiva ya que es la que nos brinda evidencias directas acerca del proceso adaptativo a nivel molecular, lo que nos ayuda en la comprensión de las relaciones entre genotipo-fenotipo. El papel que juega ha sido discutido desde la perspectiva macroevolutiva, donde al parecer es más clara su acción, hasta la microevolutiva donde los postulados de la teoría neutra parecen gobernar la evolución molecular. Sin embargo, esto no necesariamente la ubica en un segundo plano dentro de los procesos de especiación y polimorfismo a nivel molecular. Sólo es hasta el presente que se han desarrollado nuevas herramientas metodológicas que nos permiten cuantificar la selección incluso hacia dentro de los mismos genes. Esto cambia las unidades en estudio y nos invita a reflexionar en las unidades mínimas evolutivas o de selección que tenemos que utilizar con fines de detectar la selección a nivel molecular. Los métodos clásicos suponen que la mínima unidad evolutiva es el gen. Por lo tanto, la cuantificación de la selección se lleva a cabo como un promedio de todos los sitios dentro del mismo, sin distinción alguna entre ellos. Los métodos más novedosos basados en sustitución de codones y máxima verosimilitud toman como unidad evolutiva el codón lo que nos permite registrar detalladamente si existen presiones de selección distintas dentro de un gen lo que nos brinda una mayor resolución. Es por esta razón, que se han convertido en herramientas indispensables para el análisis molecular, ya que no sólo nos permiten cuantificar la selección sino además el cálculo mismo de las tasas de sustitución molecular puede ser aplicable a estudios de reloj molecular y tasas de especiación, 10 que nos estaría abriendo un puente entre los procesos macroevolutivos y microevolutivos, en lo que creemos será la segunda gran síntesis dentro de la biología moderna. Por otra parte, el hecho de contar con la descripción de cada uno de 52 los sitios y el tipo de selección bajo la cual están sujetos, serán la base de futuros experimentos de mutación dirigida, terapias génicas, diseño de proteínas, predicción de estructura secundaria y terciaria, así como, de evolución experimental. El debate continúa sobre todo en el sentido de la metodología, sin embargo, las evidencias acerca del papel que la selección positiva tipo Darwiniana juega dentro del proceso de evolución molecular apuntan a que éste es más importante de lo que se ha pensado pero que ha sido relevante en sitios muy específicos dentro de las proteínas. Estos resultados arrojan nuevas discusiones acerca de las unidades mínimas de selección que al parecer pueden ser tan pequeñas como un sitio dentro de un codón. * Se anexa una descripción detallada de los programas más utilizados para el cálculo de las tasas de substitución molecular y selección, además de otros paquetes útiles para el estudio de evolución molecular, en el Apéndice 1. 53 the pathogenic enterocyte e A > — ” A - id del E — HA effacement island in Escherichia coli: the search for the unit of selection. Resumen El estudio de la genómica comparada ha resultado ser una herramienta poderosa para la comprensión de la evolución y la organización de los genomas, Las herramientas matemáticas y el marco teórico de la genética de poblaciones, en conjunto con el análisis genómico, nos brindan una poderosa aproximación al estudio de las heterogeneidades dentro de la evolución del genoma. En este trabajo se presenta un análisis jerárquico de la ista LEE (Locus of enterocyte and effacement) (35kb), que se encuentra presente en las cepas enteropatogénica y enterohemorrágica de Escherichia coli y Citrobacter rodentium. Esta isla en E. coli se considera una unidad clonal dentro de un organismo clonal y se espera que evolucione como una unidad genética. El análisis del presente estudio prueba la hipótesis clonal mediante la determinación de la diversidad genética, el contenido de GC, así como, las tasas de substitución nucleotídica en varios niveles funcionales de organización: (1) la isla genómica, (11) los cinco operones en los que la isla se encuentra organizada y (111) cada uno de los 41 genes que comprenden la isla. Se encontró que existe una región conservada que se compone de los genes pertenecientes a un sistema de secreción tipo HI y que son producto de transferencia horizontal. Una región más diversa comprende genes de proteínas secretoras y genes que al parecer son originales del genoma de E. coli. Este mosaico genético parece estar moldeado de manera diferencial por la mutación y la selección. Nuestros resultados sugieren que tanto la recombinación como la selección pueden estar rompiendo la estructura clonal de la isla por lo que la mayoría de sus elementos se encontrarán débilmente ligados en su evolución. Estas observaciones sugieren que las unidades de selección no son las islas genómicas, sino unidades mucho más pequeñas dentro de los genes que la integran. * Se anexa la parte que corresponde a Supporting Materials and Methods en el Apéndice 11. 54 Capítulo 4. genomic population genetics analysis ~f e t genic t r cyte ff ent d scherichia li: e rch r e nit f l ction. es en l t dio e ó ica parada a lt o r a r ienta derosa ra prensión e l ción nización e s o as. as r ientas atemáticas l arco ri o e enética e blaciones, j nto n l álisis ómico, s an a derosa r i ación l t dio e s t ei ades ntro e l ción el a. n ste ajo r senta álisis ico e l E cus f t r cyte d ent) kb), e cuentra sente s as t at génica t orrágica e seheriehia e li it baeter enti . sta la . e li nsidera a i ad nal ntro e n i o l nal era e l cione o a i ad nética. l álisis el r sente t dio r eba i ótesis l nal ediante t inación e i rsi ad enética, l tenido e C, sí o, s as e stit ci n cleotídica rios i eles ci nales e anización: i) la ómica, ii) s i co erones s e l cuentra r anizada iii) da o e s nes e prenden l . e contró e iste a i n servada e pone e s nes rt ecientes a e r ción nI e n r ducto e r ncia rizontal. na i n ás i ersa prende nes e r teí as retoras nes e l recer n ri i ales el a e . e lio ste osaico enético arece star oldeado e anera i r ncial r utación l ción. uestros lt os ieren e t binación o (>n eden tar piendo t ctura l nal e la or e ayoría e s entos contrarán il ente ig os olución. stas ser aciones ieren e s i ades e ci n n s s ómicas, o i ades ucho ás ueñas ntro e s nes e ran. e exa arte e r nde pporting aterials d ethods l péndice . 4 A genomic population genetics analysis of the pathogenic enterocyte effacement island in Escherichia coli: The search for the unit of selection Amanda Castillo, Luis E. Eguiarte, and Valeria Souza* Departamento de Ecolagia Evolutiva, Instituto de Ecología. Universidad Nacional Autónoma de México. Ap. 75-275. Coyoacan, 04510. Mexico Communicated by M. T. Clegg. University ot California, Irvine, CA, November 29,2004 (received tar review March 17,2004) Comparative genomic analysis is a powerful tool for understanding the history and organization of complete genomes. The mathe- matical tools of population genetícs combined with genomíc anal- ysis provide a powerful approach to dissect heterogeneities in genome evolution. This study presents a hierarchical analysis of the enterocyte and effacement island (35 kb), which is found in the enteropathogeníc and enterohemorrhagic strains in Escheríchía colí and in Citrobacter rodentíum. The locus of enterocyte and effacement in E. coli is considered to be a clonal unit inside a clonal organism and is expected to evolve as a single unit. This analysis examines the clonal assumption by determining genetic diversity, GC content, and the substitution rates at the different functional levels of (i) the complete pathogenic island, cm the five operons in whích the ¡sland is organized, and (í;,) for each of the individual 41 genes that comprise the locus. We find that there is a conserved region that is composed of genes that belong to the type 111 secretion system and that may be products of horizontal transfer. A more diverse regíon is composed of genes tor secreted proteins and genes that we infer to be original components of the E. colí genome. This genetic mosaic seems to be differentially aftected by selection and mutation. Our results suggest that recombination and selection may be breaking this structure so that different elements are, at best, weakly coupled in their evolution. These observations suggest that the units of selection are not the complete island. but rather. much smaller units that comprise the island. natural selection I pathogenicity ¡sland ¡ positive Darwinian selection i mutation I GC content E scherichil1 ('olí is a divcrse bacterial specícs living in multiple habitats. induding the intestine of mammals and other verte- brates as a frce org~nism, commensal organismo or pathogenic organ ism (J). Thc comparative analysi of complete genorne se- qucllces of four E. coli serotypcs, the cnterohcmorrhagic E. coli. (El lEC) pathogcns EHEC 0157:H7 strain EDL933 (2) and 0157 Sakai (3), the uropathogcnic strain CFf073 (4), and the nonpatho ... geníc lahOTatory K-12 MG1655 strain (5), reveals that this bacteria exhibits substantial genomc diversity, where only 3Q.2% of proteins are shared betwcen the four strains (4). This result strongly suggcsts that the ~enomc is él mosaic that incJudcs él conscrved backbone considcrcd to be the COTe E. mli genome, togethcr with gcnomic islands comprised of groups of genes interleaved throughout the genome (2). Numcrous stlldies of population genetics of human- rclatcd Ji. coli have strongly suggested that this cntcric bacteria is a don al organism (6. 7). where pcriodic selcction is the cohesíve evolutiol1ary force. Yet, when viewed at the wholc-genome level, E. coli is a mosaic characterized by differcnt unirs (islands. opcrons. and genes) with different evollltionary histories. Gcnomic islands and opcrons are cOl1sidcred units whcre groups of genes are transcribed togethcr and whosc products contribute to él spccific function (8). Typical examplcs of gcnomic islands are the pathogenic islanus (PAIs) prescnt in pathogenic bacteria that form the principal molecular component responsiblc for the dt.'Velop- mcnt of a specifíc discasc (9- 11). Evidencc SUPIX)lts the idea thar 1542-1547 I PNAS I February 1,2005 vol. 102 I no. S PAls are considrred genctic unit'l horizontally tr~m.;f('rrl'd through bacterial spccies duringevollltion (.I 1). PAls have CvTllIllOn katurc. including a preferrncl! for in~crtion at tRNA sites and atypícal GC content (9. JO). On the other hand. ir h:.ls hecn . ug:gestcd tllar opcron~ are also mobi\c dcment~ originarcdby horizontal transfcr events (8). These gcnctic lInits (PA [s and opcwns), whcrc g:Clll,~ are acting in conccrt. are l'xpI!ctcd to evolve at homog~ncous ratcs owing to tht:ir mutual intcrdepcndcncc in produóng a phcnotypc (~). Thus. cvolutionary parametcrs uf thesc gcnctic unit~ such as GC contento genetic diversity. codon usage. and substitution mtes are expccted to be humogcncous. Howcver, if selcction i~ suffi- cicntlv weak and if tlle magnitude of recombination is sufficicntlv large: thc PAIs may bCCO;lC decouplcd in thcir cvolution (~) . 1\ sccond important fea tu re oí' genomic islands is their hiemrchieal organization bccausc isbnds are themsclves composed of groups of operons. which are in turn ~omposed 01' groups of genes that are interdepcndcm in thcir regulation. Thc goal of this study is to ask whether an important PAI evolvcs in a homogeneous fashion, amI if not, whcther patterns of evolution are homogeneous within the 0p'~rons and/or within the genes thm comprise the PAL A P Al 01' interest is lile locus nf entcrocyte and cffacemcllt (LEE) that is likdy to encode almost all of the genes neccssary to produce an intestinal attaching/cffaC'ing (A/E) Icsion (12); tlle acquisition vf this PAI probably transforms nonpathogcníc E. coli strains into pathogenic strains (13).TI1C average size of LEE is =35 kb with a GC content of 38 ~'é. (14, 15), which Ís vcry differel1t from the housekeeping genes of E. coli (GC contcnt =. 50<:';) (4). The IOCllS comprises 41 genes that incIudc a typc 1Il sccrctiol1 ~ystcm (TTSS) (16). an adhesin-denominateu intimin (cae) (17), it~ recep- tor (tir) (18), scveral sccreted protcins (e.\p.4, espD, ('.\1'8. and t'.,pl-'), and their chaperones t J I}). The ITSS apparatus directs the transfcr of spccifíc pmteins acwss the bactcri:.ll envdopc, \vhcre thc sc- cretcd protcins function to transfer cffl!ctor proteins ínto host cells (16). lhe adhc.(jin receptor (ir is transfcrred into h()st cells. where it is moditico by host kina~. ano bccomes insertcd jnto the plasma membranc to orchcstrale cvtoskcletal rcarrangcmcnt'i: this activity depend'\ on its intcractivñ with the adhcsi; «('(le) ami tyrosinc phosphorylation (18). TIle secrcted protcins are rcquired fOl' the translocation of other proteins into the host ccll: in the spccífic Ca.'\c of espA, this protein fonns a filamcntolIs conduit along which secreted proteins travcJ bcfore they arrivc at the lransloc¡¡tion pore in the plasma mcmbrane of the host eell, compriscd (lf espB and cspD (1 Y. 20). Many secreted proteins bcfore sccrctÍLm :.Irc maill - taincd in the bacterial cytoplasm by association with a spccífic chapcronc (19-21). Thc 4.1 genes are organízed in fíve ptllycys- tronic opcrons kn()\\11 as LEEl. LEE2, LEE3. TIR. and LEE4. al! of them positivcly regulatcd by ler (.12). which is localized at LEEJ . Abbreviations: EPEC, enteropathogen ic fscheflchia col:; EtiEC. enterohemorrhagic E. col!; TTSS. type 111 secretion system; PAI. pathogenidty 'sland; LEE. lo1,PDS isinferred, whercas if this ratio is < 1, purifying selection is inferred (35, 36). To assess the role of selection among LEE, we used two methuds, First, we performed a peneral estimation of the dS and dN, respectively, far the whole-sequence sample: in this case. we used the analysis developed by Nei-Gajobori (37) implemented by using the DNASP package (25), Second, we used the inteurativo approach for detecting selection at specific amino acid sites in- cluded at HYPHY 09018, which can be accessed at www.hyphy.org (38) from the site www.datamonkey,org developed by Kosukovski- Pond and Frost (39). The integrative analysis for detecting selection includes three different analyses called single likelihood-derived ancestor counting, approximate likelihood ratio ata site. and (ul likelihood (see refs. 39-41 for more detuiled information on the methodology). All of the analyses start with a given estimate of the gencalogy (described above), and, fitting a codon substitution model, the number of changes occurred along cach gencalogy ure estimated with different methodology, We present Ihe average dN/dS ratio und the sites for cach LEE gene that are inferred to be under PDS and/or purfying selection. Results General Analysis of LEE Islands. A total of 32,148 bp comprises the core sequence shared by the six LEE islands, including coding and noncoding sites. From the general aligenment. itís uvident that the core region of LEE is conserved among A/E pathogens in seguence and structure. The variable parts include the flanking regions. the insertion sites, some intergenic regions af genes such 4s the intimin (eae), rorf!, and espG, and insertions between the operons TIR and LJEEA, which is especially evident in C. rodenticon (data not shown). From the core sequence df the six islands. 78% (25, (167) corre- sponds to conserved sites, and 22% (7,051) are polymorphue sites. Although there is high degree of conservation o structure, the genetic diversity is relatively hieh (77 = 0.10), The GC content is low at 38.6% (+ 0146 SE), which is congruent with previous reports (38%) (14, 15), The complete gencalogy for the six islunds was in agreement with the pathotypes relations described (42) (Table 1 and Fig. 1), where the EHEC-1 und enteropalbogenic E, coli (EPEC?-1 groups are more divergent and more related between cuch other, and the EHEC-2 group is more conserved and less divergent (42). LEE Operons. The number of genes varies among LEE operons. From Table 2, which is published as supportine information on the PNAS | February 1,2005 | vol 102 | no.5 | 1543 E V O L U T I O N Addit ionally. reccnt cvídcncc suggests that there are two more regula tors insidc LEE: 01'1'/0 secm to cncodl' a negative regulator and O/pI scelll to encoJe a positive regulator (22). However, nearly half oI' LEE genes (with the l'xceptíon 01' the TTSS) seem ro have no homol~)gs tller acteria d él'VC 110 nt ifi d nction. E s a s n he nd í rse ge f lE t gens Íth i c rc nt st cificity a d c luti nary i t ry. hese at gcns Í c . li i s at re atural m.¡ f i als, ch as bits, i s. G ls. gs. d ir crer <:'ntium. a ouse :Hhogen. \Ve resent él parativc hí i f r atil' alysis f e E l d m i i c ic athogenic ins 01' . li at e es scriptíons 01' e g nctíc turcs f e ds d t r i- tí !1 01' e le 01' selection é1nd utation n e r sent t re f E. ethods uences. nr is y, e lIsed i plete ences r E l at re a il ble t cnBank: y rr ond lO l e l E alho- ns c..l\Crihed ablc , hich lIblis ed s lIpporting r- at io!1 n e AS eb t . e a ried ut rce if crent ales f nalysis: i c lI d e plete E s nit, ii) e i ccted E t erons d nalyzed arately. d iü) e icd e ch f e 1 nes l at prise lle d ividually. t tisti al alysis f VA nd ukey's st ere l r cd st r ifi nt i c c ces f C ntent a d bstit ti ll mtes t cn emns mi enes. li ent. lI L ) as lIs d uce ult iple l n- cnt of e E sla ds. he r nding li itation f e ding d ncod ing i ns as r ed si g 10EDlT 4) e o plete ig ent ail ble n e.st ). 80th E sla s f EC l i s re ortcd i e erse OIientati n pared i th e t er t ins, e d-co r cted e e e i cti n. h iga ox gen ic . li rr nd'i E us n, hich ntains E s encrally scribed. mi i n f , 86 p at rric. ... cliti nal c1 ents f at ogencsis aracteristic f is LIl. ut at e i r ed r is dy. cial se 01f at ot siclcrcd e I sent n EC t in EC-I d higa i en ic E. !i t i s ca llse a utation f [O e t e t odon rr pts e itial e thionine: ever, ause e st f e llence ains anged d ologous e t er ds, e n cd ur e y s diti nal a live s. e cntillm as rsi n f r e o st nes f e a el rfl nd ), d y re li ed t e c d f EE. Por l e rpnsc f is dy. e a lYled c s they ere r e c rder as l e st f e trains. Por e F ene. e d ed nly ( e artia l ucncc 6 p ) causc e st ase airs í e ne re ervariable ata ot S O\\11). enetic iversity. hc netic i e rsity f E as c sed y t e i ati n f i 1T). hich as l ulaled m l e tal ber f i s d t ined ith N/\ SP 5). C ont ento he C ntent tcr ination as arried ut y si g EGA .1 8). \Ve r sented e rage C ntent r e r plele L E. r ch 01' e perons, d r ery ene. e l o cd e i t ti n f C n ten( t t t. ond. d ird siti n 01' E enes. odon daptat ion I ex. he on d t ti n ex r r e nes f E as l l ted si g DONW, hich as ri ten h . cden l stitut asteur, aris), a d n e cssed t ·\\:w.bioweb.pastcur.fr/seqana l!intcrfa esi onw.html, scd 011 e nr : f Lke ura 7). yl genetic na lyses. \Ve COl1structed e ealogy f e i a ds y i g e a e nt eseri ed oye at .'iponds asti lo l l. e plete eme sensus cgucncc u ologou:-. Cl ccn lk' . i g ding d coding it s y i ng l\'ll.< i.,\ .1 { h). he enetic i t ccs ere nerated li del' llcí hhor in ing 1:\) ith arnura- Nei i ce ) ata t shown). hl' rne I11l'thod as llsed f r ' e calogy str cti ll (lf cvcry i i ual E gene. haral'ter lI port ór e cncalogies \Vas csscd y . 0 Ollt- t p c plings f e ata .loO). i l e se 01' E enes, lld Hl.{")O c ti ns f r e plete islalld~ . dítion Üh.' nealogy nstruction, grllcnce l' cl'1l g l1l's \vas \ ssed y llsi g e n ruence Ic gth i cc IL ) st l. hich i ~ ai l hle lIP VAJUh J2). 111C as cr nned bincd ata atrices uf e c (;tcd enes. mi e st as pe rt ~)fInl'd n l atrices it h 0 ata arl íti ns hy í g hr ch ... N O » 2 ddn ful E A e a Ny PHEC 11M a" STA IS 2 A Related to EMEC-1 group FHEC-2 group a iraaor o lr ir Fig. 1. Genealogy of the six LEE islands used in the study. The genealogy was constructed by using the 32,148 bp that comprise the core consensts of the six islands (including coding and noncoding sites), under the neighbor-joining method with Tamura-Nei distance, and 10,000 bootstrap resamplings. STEC, 5higa toxigenic E. coll. PNAS web site, we observe that the first three operons (LEEJ, LEE2. and LEE3) have similar number of genes, genetic diversity, und GO content. These three operons comprise almost the entire TTSS of the LEE locus. On the other hand, the last two operons (TIR and LEE4) exbibit more variation in gene number and sequence size. LEE1 comprises nine genes (from ler to escU) with un average genetic diversity of = 0.060, This operon has the lowest GC content (33.1%) of the group, which is significantly lower (P < 0.0001) than the average of the complete LEE locus (38.6%). This operan contains the main regulator recognized for LEE (/er). LEE2 includes six genes (fromcesD to sepZ) with a genetic diversity of 7 = 0.000 and a GC content of 37.8% close to the average of the complete island, This operon includes the gene that contains the highest genetic polymorphism (sepZ 7 = 0.24) and has not been functionally studied yet. LEE3 includes six genes (from orf/2 to espH) with an average genetic variation of 7 = 0.073 that, with the exception of espH (* = 0.18), ís conserved among the genes that integrate the operon. The average GC content is 39,2% (including espH). YIR comprises only three genes (Tir, ces'T, and cae) that have the highest genetic variation observed for the LEE locus (7 = (1.133). The average GC content (43.3%.) is also significantly higher (P-< 0.0001) thin the average of the LEE locus. This operon includes the adhesin denominated intimin (eae) and its receptor (tir) that together are fundamental for the development of the A/E lesión, eiving the close attachment to the host membrane that charactevize the A/E pathogens. LEE4 includes eight genes (from sepL toespF) with a genetic diversity similar to TIR (7 = 0,129) and a GC content of 41.9%. This operon contains several secreted proteins as espa. espD, espB, and espF that are responsible for the signal transductión system and for the melting of the microtubules of the host cell, The ANOVA and Tukey's tests show thar GC content between the five operons is significantly different (P < 0.0001). Genetic Diversity of LEE. Thc 41 penes of LEE have an average genetic diversity distribution that ranges from 7 = 0,03 (orf/ / SE + 0.008) to 0,24 (sepZ SE + 0,027) (Table 3, which is published «s supporting information on the PNAS web site), This distribution characterizes the broad range of genetic variation contained within the island. A comparison of the diversity of LEE genes with genes that are part of the conserved backbone of E. coli like md (m = 0.01: n = 46), puip (7 = 002, n = 12),fmA (7 = 0.06; n = 7), and "pA (m = 0.03, n = 25) (43) reveals the high genetic diversity characteristic of the pathogenic genes. This finding is especially evident ifwe consider the sample size of the present study (n = 6), 1544 | www.pnas.org/cgi/dol/10.1073/pnas.0408633102 LECI LENA LIPA 14M LEE q. —_—_—_— —>—_— ”—_——r AB ml Fig. 2. GC content, genetic diversity, and dN/dS ratio distribution for the 41 genes of LEE. and thal all of the strains used belong to epidemic clones. [will be of future interest to explore this variation in nonepidemic strains from a broad range of E. coli natural hosts (A.C. unpublished work). GC Content of LEE Genes and Codon Adaptation Index. The wwerage GC content of LEE genes also exhibits a broad distribution from 28.3% SE + 0.33 (ror/3) to 53.1% SE = 0.22 for espFF (Fig, 2). To describe in more detail how this GC content is distributed among the different coding positions of the penes, we divided it in first, second, and third positions. The GC content is significantly differ- ent (P < 0.0001) at the first position (45.09%), as compared with the second (34.47%) and third (33.5%) positions that are similar to each other. lt has been proposed that sequences mtroduced hy horizontal transfer, as suspected for the complete LEE locus. will be affected by the same mututional processes us the recipicnt genome and eventually, will converge to the base composition and codon usage of the resident genome (44), This process should occur most rapidly al sites with lítdle or no functional constraint, purtic- ularly the third position, where most changes are synonymous. Accordinglvy, we expect the third position to have a higher GC content. However, in this case, the first position is the most símilar to the resident genome in GC content. Perhaps more interesting is the observation that the dird position has an even a lower average GC content than the second position. lí mutational processes und selection affect all genes homogencously, we might expect GC content to have increased toward the E. coli uverage (55.4% for the third position. 40,7% for the second position. and 58.8%, for the first position) (45), instead, we observe a very low average GC content (33.5%). These results establish a high codon bias for LEE penes. This result could be interpreted as a signal of conservation from its original source, even when the island has been horizontally trans- ferred in multiple occasions for a considerable time (11, 13), or it could be a signal of regulation, because LEE ¡5 only expressed on the logarithanc growth phase during infection to the host (17). We calculated the codon udaptation index (0.200 + (0.0016) for the genes of the LEE locus (excludiag C. rodentiin) and found tbat they were considerably lower than for the average present in E. coli genes (0.485 + 0.051) (4). This index indicates the use of rare codons when it has lowwvalues. In this case, isshowing that the genes of LEE are biased and difler from the reminder of the E. coli genome. of LEE Genes. The phylogenetic study of LEE island genes highlighted differences in the evolutionar y historics af some of ¡ls members. Almost all of the 41 genes give the same branch order berween each strain in congruence with the described for the Castillo el al, L:I'EC-I gmup 11'1( ' l ~¡4~ f.lJ \ -----~ - - -- 111 ( HII ""_------- ' I It \ \)1. ' ll EC- I p Klll e ·) . ...:.,::..------- "TH ~" ~ '! · I (itr . ,.~l\r T~Md,-INt;¡ clatcd l [II C-2 group ig. . G al gy ft si E i la s d i t e t dy. he nealogy as nstr cted y í g t . 48 p t at príse t ( re nsus f t e i isla s (í l i g di g d ntoding it s), der t e í hbor-joining ethod it ura-Neí i t ce. d , 00 otstrap r plings, EC, Shi a i nic . olí, S eb il'c, \Ve serve t at t c í . t t ree erons El , f.2. d E3) ll ve i ilar bcr f nes, cnetic i ersity, a d e ntcnt. 111cse e erons prise ost e tire rsS f t t: E l us. n t t cr nd, t e l st t o c!rons I d E4) hibit ore ariati n ne ber d scqucn~ i e. E1 príses i e gen~ l r t ) ith a rage lletic i ersity f ir . 0. his eron as e est e ment ( .1 t;f) f t e r up, hich i i ifiCc1ntly l er ( OJX)O 1) t t e erage f t plete E l s . ). his u cron ntains t ain ulator c nized f r E I r). E2 ind udes síx enes (f u cesD t Z) i t h cnetic di ersi ty of 1T OJI9O mi C ntent f 37.8(:~ l se e erage f e plete bla o his eron i l es t ne t at ntains t e i c.'it nc[Íc l orphis ( ro . 4) d as ot een cti nally r died et. E3 i l es i enes m rf12 t I! pHj ith :ln erage enctic ri ti n f 'Ti . 3 t at, ith t e ceptiun of ,' (1T . 8), i served ong t e nes t at i t rate t e eron. he erage e ntent i .2(";1, (i l i g c~pH). TI u prises ly t rce nes ( ír. s , d e) t at ve t e i hest nctil: ri ti n scrved r t e E l s ('Ti O.J 3). he r .e C ntcnt . t;fo) l if tJy i hcr O.O<.XIl) r a er ge f e E us. his cron 1 dcs e hcsill o inated in c e) d eptor ) at ether re a ental r e el ent f e lE íon, gi i g e l sc tach el1t ost embranc at ar:lctelize t e jE t ogcns. E4 i l es ci ht nes (fr L spl') ith netic rsity ilar I 7T n. 9) d e ntent üf UV;i·. his cron ntains eral reted r teins c A. .' J), , d c t at re nsible r t e i al tra ction t d f r t e elli g f t e icrotubules f r st cll. he OVA mI ukey's t le; t at C l' t<:nt ct een e crons iti ntly i rent . 01). enetic iversity f E. he 1 g nes f E ve erage enctic i ersity i t ti n r at cs ;; . I11 :!: OJK)8) . 4 S( Z ::!:: . 7) able , hich publi~hed as sup~x)rting ation n e AS eb it ). his i t ti n aracterizes e mad ge f cnetic ari ti n ntaí cd ithin d. parison f e i crsity f E enes ith nes at re art 01' e ser ed bonc f . li e h 7T .= 0 : 46), rp 1T O'(l2; 1l .fi A ir OJX> ), d li A 7T . 3; ) ) eals e i gcneti i crsity aractcristic (lf t t genic nes. his tin i g i c..~pccially í ent if e nsider t e ple i e f t e r .<;cnt t y ( ), 44 I w.pnas,org/ cgi/doi / l0.1073/ pnas.04086 3102 , I ,¡, '1t ~ 'l. ~ I . . i . . C nt nto netic i ersity, d / dS r ti i tri ti n f r t e nes f E, d t at ll f t e t i s sed l'longt i ic d es. It will b~ f t re t rcst 10 plore is ri ti n epi(k ic i s él ad ge f . li atural sts . . published ork). C ontent f E enes d odon daptation ex. he av r .e C ntent f E nes l c hibits él r ad di~tribllti()n m . E ± . 3 m jJ) :t: .1 r '" ig. ). o scri e ore etail is C ntent di~tributcd él ong t e iff rent ding siti ns f t e g nes, \Ve i i cd it i tir t, c ond. d t i siti ns. he e ntent i i ifi antly ifrer- t 1' O.O(XH) l c í t ositi n . ). s u parcd ith .. e c nd . ) d t ir . ) siti [}s t at re i ilar t eh t er. It as een r osed at cnl'es introduceJ by rizontal sfer, s ected r l e plete E us. \ViII e f t d y e utational r ce ses as l e i ient e d c entualIy, i l verge e ase posítion J e on lls ge f e i ent e 4). his r ce s buuld cur ost i ly t i s ith iu r o cti nal nstraint, artir- l rl e ir ositi ll, h re ost angcs re ymous. cordingly. e p ct e ir siti n ave i her C ntellt. owever, is se. t siti n i e ost i ilar e i ent genom~ C ntent. r :lps ore cstí g e servati n at c third siti n as c cn cr r ge C ntrnt t n t mI siti n. [f utational pmccs~('s a d l ti n ffect l nes ogeneously. \Ve íght p 't e ntent :lve sed \Vard e . li a erage t . (;{· r e t ir ositi n. . f j() f r t e nd osition. d 5KS( ~ ;, f r l e i t siti n) 5). t ad, \Ve serve ery erage C t:cnt .Y-;(;). hesc c ults t lish i h u on i s r E g nc",;. his sult uld e rct d s al f l"onservation m it~ Oli inal urce, en hen t i l d s l'1l ri omally t s- f rr i ultiple casions f r si ef:lble ti e ( , 13), r it uld h~ i al ()f c ulation, bcc~)Use E is ly resscd e ri mic th ase ri g et i n c st J 7). \Ve l lated r e on a aptati n i t:x (O. (H) :: O.OOló) [(Ir t e nes f t c E l us l ding e r enliwn) d d thar y ere nsi erably er n r e er ge r sent h nes 5 2: .( 1) ). his ex icates e se f re ons hcn as alues.l is se, s ing at c nes f E re ia..'iCd d iffer o e imkr (lf l e . w!i rne. Genealogy f EE enes. he ylogenctic y f E t g.cne~ i li t d i ccs e l t i turies (lf e f it embers. l ost ll f t e nes i e t e e r ch r er t en c ch i gruence ith e d~~ribed nr e astill t l, A A Lo MA raro EDITA EDS Modo ENT THEC EMO UNE? ahi 01157 Sálcal 03157 Salad STO Ert EFEC EPOC ap Ez A EXA £ rd E l. c todentira redee rodean EMIA KERO Tie STRC TO 44157 Gabál Him 6 411:89.1 4 41/89.1 O] MIA > hblica me ROCA 0 A exc) escV escN escF ; ua STEC ADC AE . kei AU A o diia ENEC CET Malal P.. EM) Krue ENDE 01157 Sadal E dr y may a TEA " Ad DST salad EDLIIA Rio E cod esphi map fir eae espA Fig. 3. Genealogy of nine LEE genes used in the study. The genealogy of each gene was constructed under the neighbor-joinina method with Tamura-Nei distance and 5,000 bootstrap resamplings. The genes escl, escV, esc, and escF belong to the TTSS. The genes espH, map, and espa are secreted proteins, and tir is the receptor far the adhesin exe, genealogy based on the pooled LEE genes sequence data. Inter- esting exceptions are orf3, cesD, rorfó, rorf8, sepZ, orf16, espH. cesF, map. tír, ede, espA, and espB that give different branch orders and lengths (the genealogy of cach gene is uwvailable on request). In these genes, the EPEC strain E2348/69 is very divergent, not closely related to the EHEC-1 group as described before, but is grouped with C. rodentiun. We selected a sample of these genes (Table 4. which is published as supporting information on the PNAS web site) and constructed matrices in 4 paírwise manner by using some of the genes that presented a different genealogy with a sample of those that have the same consensus LEE genealogy for the ILD test, The ILD test statistically confirmed the topologíc incongruence that supports the ideu that some genes have a different phylogenetic history than the rest of LEE. Significant differences (P = 0.001) were observed when we compare some genes of the TTSS (esel. escR, esos, escU, escV”, eseN, escD, sepZ. and escF) with espH. map, tir, eqe, espa, and espB (Fig. 3). We also use these genes to test for the split decomposition analysis, and the incongruence, together with possible signals of recombination. We observed recombination for espH, map. tir, eac, espA, and espB (Fig. 4). This result suggests thar recombination may be breaking the linkuage betwcen these genes and allowing them to diverge. Nucleotide Substitutions of LEE Genes. We determined the dS and ¿N for the 41 penes of the LEE locus, The d$ is assumed to be primarily related to mutational processes because they do not alter the amino acid composition. The dS estimates range from 0.10 (SÉ = 0,02) far orf! 1 to 1.12 (SE + 0.20) for cesF (Fig. 2), From this analysis, we can vbserve that dS estimates are not uniform among the members of LEE. The dí describes the substitution rates at sites with amino acid changes, so they are an index of both selective and neutral events. The dN estimates for the LEE genes are more restricted in distribution than the dS, This result is especially true in the case of the TTSS, where we find values as low as dN = 0.011 SE + 0.00 (eses). indicating that most mutations at these positions are climinated. These genes have homologs in Salmonella and Yersinia (46) and are clearly a product of horizontal gene transfer. In Castillo et al contrast, dN estimates for some penes are high (Pable 3), suggesting that some LEE members may show a signal of PDS (sepZ, dN = (1,221, SE + 0.024; tir, d = 00,202, SE = 0,024; espH, di = 0.176, SE + 0.019; espB, dN = 0,165, SE + 0.020: esp", di = 0.121, SE + (0.016; map. dN = 0.108, SE + 0,013; ces. dN = 0.107, SE + (0.011; espD, dN = 0,107, SE = 0.015; cae, dN = 0.096, SE = 0.011; escfF. dN = 0,086, SE + 0,032: and espA, dN = 0.082. SE = 0.010). Some of these genes have direct interaction with the host. dN/dS ratios were averaged over all of the sites in the gene sequence and they are given for each site of the gene sequence. Thus, we obtained the average dN/dS and also an indication of sites that may be under purifying and/or PDS, For LEE, although there is high polymorphism, most members appear to be under purifying selection (4N/dS <1). whereas some genes are close to neutrality (dN/dS = 1), but none of tbe genes appear to be under PDS (dN/d$ >1) (Fig. 2). The gene that has the highest dN/dS ratio is espG (0.54). a secretion protein, this gene in € rodentiuni 1 localized at the end extreme of the island, possibly as 4 product of a rearrangement, Other genes with u high dN/dS ratio ure espf". espH, amd sepZ with 0.43, 0,41, and 0,39, respectively, The lowest ¿N/dS ratio is present at some members of the TTSS with values as low as 0.05 for esc$ or 0,07 for escT' and escC. The result from the site-by-site analysis shows that few penes have sites under PDS, These genes are espG (one site), map (one site). tir (one site), eae (three sites). esplD (one site), and espl" (one site) (Table 3); none of them are part of the TTSS. These ure interesting sites for the study of directed mutagenesis and gene therapy because they are genes that have an important role on the virulence of A/JE patbogens, especially the intimín (eoe) and its receptor (tir). Two of the regulators of LEE seem to be neutral (orf70 and orf11). with ono sites under adaptive or purifying selection. Most of the genes with the highest number of sites under purifying selection belong to the TTSS (orfA, or]. escR. excl, excl, escV, and escN) (Table 5, which is published us supporting information on the PNAS web site). TTSS are involved ín the development of a complex structure tl: crosses the membrane $0 maybe any change ut the sites is purged to preserve the structure. The receptor of the intimin (tí) is 4 special case. that, along with escW'(TTSS) and escC (TTSS), present the PNAS | February 1,2005 | vol.102 | mus | 1545 E V O L U T I O N ICHU' UlUlJ ~eJ ese V RO[(' , ' STf;C~ 413,,", . e wl'M"'" H':..-: ---+-- t:l't( ()'~1 S.ui I UJ4lI¡t.'1 ;,lin t;OU,'J !lcF Elite EDl..'H f :U\:(: nEt: II.DU:·' "I~' OI51Sakal ~it .¡~~ ... e·, ... c~J'U~. :~r' --;~ E81:(' STf.C O'51Sabí . .I:l:~ N I trr..<: U'FA: ----- C. r.1l4l1" &tJ4Ifl ~ [H&C UffC ' :IfH' f.DUH 0'$' . ....¡ ( U,'" espll IIIllp tir e roMwtti ... elle f' i . , enealogy f í e E nes d e t dy. e nealogy f ch ne as st t ed der e i hbor-joíníng ethod íth ura-Nei i ce d , 0 ootstrap plings. e nes scJ, e V, N, d eF l ng e nss. he es H, ap, d A r cret d r teins, d ptor tor e hesin ae. ealogy sed n e o led E nes ence ata. l ter- t g cpti ns re rj , . rf6, rf8, Z, rf 6, e~pH, cc.~F. ap. ¡i , cae, ~ p A, d at i e i r nt r ch r ers mI e ths e ealogy f e ch ne av le n ucst). se nes, e EC in 48í69 ery i ergem, ot 10sely t d r be EC-1 r up s r ed efore. ut ped íth e ntillm . e l t d él rnple f se nes able . hich hli ed s porting rnation n e AS web í ) d Ollstr cted atrices a ir ise a ner using s rne f e nes at r sented ifi r nt nealogy ith él ple f se at ve e Tlle sensus E ea logy r e st. he l O st ti ti a ly finned e oJogíc n r encc at pporlA, d ig. ). his t'Sult gcsts at bination ay e aking e í c t een se nes d ing i erge. ud tide ubstit ti ns f E enes. \Ve tc ined e d d ór e 1 g es f e E us. he S ed e r rnarily d tcd uta tional r ct.."i..'iCS ausc cy o ot lter e ino id position. he t a tes f3 gc . 0 E.::: .(2) or I/ ] ± . 0) r ig. ). is nalysis. \Ve n o serve at c."ti ates re ot í ong tle I ~ernbe rs f E. l e N escribes .. e bstit ti n t s t s ith ino id anges, y re cx f th l cti e d eutral cnts. he a tes r e E nes re ore c t d i ti n n ( e . his sult ecia ly c e se f l e T S. here e i l cs s s ::::; . 1 ± O.OOl(escS). í í ti g at ost utatíons t se ositi ns re di i ated. hese nes ave ologs / ol ella mI rsi ia ) d re lcarly r duct f riw ntal ne sfer. astillo t l. ntrast. t ates r e g nes re i h Table ). gesting at rne E embers ay al f OS Z, 0.2 ., ± . 4; , N :::· .2 , ::: . 4; , N .=: . 6. ::: . 9; , . 65. . .:!:: . 0; F, <.iN . 21. SE .·~: . 0 6; ap. . 8, ± . 3; F. ·::· . .07, E::!:. 1 1; c.~pD, . 7, E .::.: . .5; e e, (N6, E : ~. . l.; cse . · . 6. ± OJ132; des , · . 82. . ± . .0). c f se nes ve irect cti n íth e ost. /dS ti s ere r ged er ! f ( e s e ne ence d y re i en r ch t 01' e ne c ucnce . hus, e tai ed e erage /dS mI l i ati ll ofsitc~ at uy e der urif i g í or OS. or E, gh th(~re i b l orpbism, ost rnembers pear he der rif i g lc ti n d /dS 1). hereas rne nes re l se lO utrality /dS ), ut ne f he nes pear c der S /dS 1) ig. ). lne ene at as e i hcst idS ti . 4). reti n r tein, is ne C. elllium is ali d t e d t e f e m!, sibly s a UCE f e ent. ther c...¡ ith a i h / dS ti are /-'. !>pH, nd ith . 3. . 1, d . 9, ectively. he cst d / dS ti r sent t e emhcrs 01' e S ith al cs s s . r eS r . r seT mI e . he sult m e y-sítc alysis s at c g nes ve s de r S. hesc nes re .\lJ(J e itc), al' e it ). e t ), e ree s). !>p lle ít ), mI F l1e ) r abie ); nc f c re art í' e S. hese are sti g tc..'\ r e y í' i c ted utagcnesis d ne y hccausc y re ncs a t c portant le n e i cflcc r / athogens, c ecia ly e in lle ) d c cptor ). o f r e uJators 01' E c e eutral OIjl élnd rf /). ith n s der aptive r rif i g .l ction. ost f e nes ith e i hest ber 01' s der rif i g k·· ti n cl ng e f S 01.f4, j5. R. s C, .... ·cJ, , mi C/V) ahle , híl'h i blí ed as pportingintú ation n t e AS eb sj(~). S re l ed i c cl cnt f plex tllre hat <:ro ses t e rnembrane so aybe y nge at t e it s í r ed r erve e cture. he eptor f e in (~ir) a ecial se. at, J g ith t' V S) mI c S). rcscnt e AS I February 1, 2 05 I l 102 no. 5 I 45 z o ¡:: ::1 ....t o > I.U "nI kili .... . 4'-'~ · 1 RDr(·1 II( .11 ''''· 1 nlr (D"'U [Ht:' ~ Ol~ ~ Sal.al map t;/".C ~ > !.4&'" MIIH '· ' ¡: .ITI ~ 41~~ · 1 fUR ["111:(' rDI ' .H OI!t7I>abl tir ~lU IInrc., ·11.' ."'1 trie "I::I.~, tl.14'f14 tlfH Ol~ ', kiP t'seN ea#! (. ........ - ~II . ' NI>II. t'-':n ·. I.RI:( f .OI •. ~ ' nu: (1I~ 1 ......... uln .'H' tfl1 . ·~ . \ fl\.4~ ' ", 11tH (1I ~7 hi Fig.4, Split-decomposition analysis of eight LEE genes. highest numbcr of sitcs under purifying selcction with 102, 110. aoel J 15 sites. respcctivcly. Discussion 1'he pathogcnic LEE island has been the focus of numerous cpidcmiological and mol.ecular studies because 1t represents an excdlent modcl for the evollltion of pathogenesis. The élequisition of this PAI is thought to confer patbogenic characteristics upon a normal commensal E. ('oli strain (13), From the evolutionary point of vicw, LEE has becn considercd a genetic unit that has becn horiwntalty transferred through AíE pathogcns evolution (13), However, from the analysis (lf wild hosts of E. eoli. it has been suggcstcd that this island could be more d}11anlÍc. involving an ongoing process of construction and disruption (47). This PAI l'onfcrs differcnt fitnes..') to some pathogenic strains of E. eoli as in the case 01' the scrotype 0157:H7, a successful epidemic clone responsible of important epidemic outbreaks that have caused the death of adult\ and childrcn (15). From [he present study, we observe an increase of genetic divcrsíty and GC content along the LEE ísland as we analyze it from íts J' end through the 5' end (Fíg. 2).111e TTSS. Jargcly represcnted in the first three operons. is the group of genes with Jower levcls of gCIl\.!t'íc dívcrsity and GC contcnt. On (he other hand, genes such as nwp. fir, cae, e~pA, espD. e~pB, amI espF prescnt the híghest levels of gcnctíc diver~ity aoel GC content closcr lO the average of E. ('oh genes. From the GC content. substitution cates. and phylogenetic analyscs. \Ve infcr that th\.! TTSS travcl togethcr as a cluster of genes linkcd by functiun. l11C nonsynonymous substitution rate for these gene.,:; is lo\\' and purifying selcction i5 eliminating diversity. This group of genc.."i that have the lowest GC contents, gene tic diversities. and conscrveJ nllcleotide substitution rates may preserve the phylogenetic signal of the early formation of the isJ:md. These rcsults, togcthcr with the tinding of othcr rcgulators ofthe sccretion sysrem localízed oul-;íde the LEE island (22), strongly support the idea rhat the rrss may also be participating in oth~r processes not necC"sarily rclated to viru)cnce. The parallel acquisition of some other virulcn\,.'c factors as an invasin (me) by nonpathogenic E. coli ~trains that already havc a TTSS may ¡ncrease its virulence. compkting the molecular scenarjo for the appearance 01' a new 1546 I www.pnas.org/ cgi/ doi! 10.1073j pnas.0408633102 pathogen. \Ve suggcst that the TTSS coulcl be a good candídate for the calculation of the time of its intcgration to E. coli gellomc ~tnd compare itwirh the adhesin (elle) orsome sccretcd protcins ascspB. This result may reveal the time when the LEE island \Vas origin~tlly assembled. Otherwisc, bec3use the TTSS is involved in pathogcn- esis, this tinding may provide target'\ for futurc thcrapic~. 1'hc fact that genes Iike the adhesin and its receptor are more divergent. less conserved. aoel with diffcrent gencalngies than the- rest of the island, SlIpports the hypothcsis that virulence is a rceenl derived state that may be a reslIlt of the p3rallcl aequisitinn 01' virulcllce facturs. The prescnce of genes likc the adhcsin . which i ~ a mosaie product of rccombinatioll (48.49), suggcst;.; that thc origin and evolution of the LEE island is él c~)mplcx prucess. From the obscrved polymorphism prcsent at S(lmc LEE gcnes and the nuclcotide substitutions rcsults, we cxpectcd that sorne genes will have a dNjdS ratio > 1, a cIcar sign of thc particípati()ll of POS. However, nOlle of the loeí s("cm consistent with thi~ assumption, and again this ratio is highly variable across the genes 01' the island. The second part of the analysis highlíghtcd thc spccific sitcs under PDS or Pllrifying selection. Interestingly, it se~m$ tbat PDS had, at best. a minor role in shaping thc hio.;tory (lf the LEE island. but this doc....¡ not mean that was not an impnrtant role. A few sites of LEE genes élre undcr POS in genes that are fundamental fl Ir the correct dcvelopmcnt of the AlE lesiono su eh as map or the adhcsín and íts receptor. ll1cse sitcs are very important for dirccred mutagenesis analysis and antibiotíc treatment bccause th~se genes are key virulcnce factors in AJE Iesion. On the other side. rhe partícipatíon of purifying sdectíl)t1 ís evidcnt aoel important for several genes of LEE, líke some mcmbers nf the TTSS, whcrc any changc ís purged to prcs~rve the protein structurc ami function . Thus, purifying sclection scems to be delimítating ímpNtant re- gions for the protein structure. There are two differcnt types of gencalogy for LEE. 1'l1e 1'TSS has él dífferent genealogy than other genes lil\:e map, (ir. (Ir eac. indicating that at least two differcnt transfcr cvents origínatcd the ís)and nr that rccombination is weakcning lhe assemhlage. lf recombination is cornmon. wc might cxpect to rcconstruct many ctiffercnt gencalogíes within the island. Curiously, wc only hav~ two type.'i of rclatedncss inside LEE. the general cOllsensus LEE Castillo et al. gcncalogy and thc alternative genealogy wherc the EPEC stmin is more rclatcd to e mdelltium. Thc ILD test shows that there is congrucncc bctween l"he genes that bclong to thc 'rTSS, so it is clear that this group of genes have a sharcd ancestry and have bcen travc ling togcther sincc the origin of LEE. On the othcr hand. internal recombination is sh:.¡ping the gencalogies of genes slIch as map, tir, cae, cspA, and c.\jJB. aoel may be promoting the devclop- mcnt of ncw pathotypcs. Thus. the andent formation 01' the LEE island may be a product of two differ{'nt transfer events. the first was the acquisit ion of the r rss, amI the second thc acquisitioll of gcnes as the adhesín. Howcver, although they are not part of the con- scrved backbone of genes in E. coli, some uniquc genes in LEE (likc fir) may havc becn generated de nomo TIlis rcsult is possible, cspecially if we considered pathogenesis as a derived stat\;' in E. eoli. There i5 a high degree of lleterogeneity present among LEE island genes in genetic diversi ty, GC contento and nucleotidc substituti:)tl ra tes. We dissect these hcrerogeneities beginníng with the complete LEE island levcl on through its consti tuent operons and genes. A group of genes linked by function and coregulation might he expected lO cxperiencc common mutational and selcctive processes. Consequently. if the ¡sland is a genetic unit evolving in concen, this fact \ViII be rcflected in the conscrvation of a signature prescnt in GC content, genetic diversity, and nucleotide substitution rates. cspecially ii' thcy sharc common ancestry and are regulated in ~)'nchrony. In this study, we find that diversity, OC contcnt, ami nuclcotide substi tution rates are variable, suggcsting that mutation and selection are acting with different intensity wíthin the PAJ, 1. SOllza, v., RI1l'ha, M .. Valera. A. &. Eguiane, L. E. (1999) Appl . Ellvimn. Microhiol. 6S, 3J 73-·3JX5 . 2. Pana, N. T., PllInkelr, G., Burland. V., Mau. 13.0 Glasner, J. D., R.~lse, D. J.. Mayhcw, G. F., bans, P. S .. Gregor. J., Kirkpatri\:k, H. A .. d úl. (2001) Na/Uf(: 409. 5:!Y·-533. 3. Ha y a~hí, T., Makino, K .. O nl"hi. M., Kurokawa. K .. Ishii. K .• Yokoyama. K., Han, C. GoO Ohlsuht), E., Nakayama. K.. Murala. T., <,t al. (20tH) DiVA He.\'. 8. 11····22 . 4. Wdch, R . . 1\., Burland. V., Plullkelt. O .• 111, Redford, P .. ROI.."Sch. P., Rasko. D .. Buckl.:s, E. L , 1..i~IU. S. R .. Boulin. A., It:Kkdt, J., el al. (21.102, Proc Natl. ACjJ(!. Sci. USA 99, 17020--1702 ... 5. Blattné ~. F. R... Plun"-ett. \. (j ., Bloch, C. A., Perna, N . T.. Burland , V .. Rik y, M .. Collado-Vides. J., G lasner, J. D., Rod e, C. K .. Mayhcw, G . F .• el al. (IYlJ7) Sciel1ct' 277, 1.l5J-L.l62. 6. Sdandl'T. R. K. & l.evin, B.R. (191:10) Sciellce 210,545-547. 7. Sclander R. K .. C aug (l nt D. A. & Whiltam. T. S. (ltl87) in E.5c1lerichia col; lIIul So/m ol/ella typhimllrium: Genctic Stmcture l/mi VariaLiofl in NaturaL l'ol' /Ilntiow 01" I::sc/¡ericllin eoli., tc'ds. Neidhardt, F. L. Ingraham. J . L., 1 ..Alw, K.·R .. Schaet~r, M. M . &. Umbager, H. E. (Am . Soco Micro¡'iol., Washington . DC). Vol. 2. ~. Lawrem;\:. J. G . & Roth , J. R. (1 996) Gmetir.s 143, Ik43-IHfJO. l). Bl um. (j., Olt, M., Lischcwski, A., Ritlcr. A.lmrich. H .• TM.'hapc, H . & Hacker. J. (19<)4 ) II/rect. ¡mm/m. 62.606-614. 10. Hacker,1.. Bemkr, L, Olt. M., WingelHJer, J.. Lund. B .• Marre. R. & Go~.'bel, W . (l lJ90) MiCIT'!J. PutllOg. 8, 2IJ-225. 11. Omisman, l.: . A. & Ochman, H . ( 1996) Ce1l87. 791-794. 12. E ll iotl, S. J ., Sper andi~ ) , V .. Girón, J . A., Shin, S., Mdlics, J. L., Wainwrighl, 1.... H uil·h,:soll. S. \V. , McDan id. T. K. & Kaper, J. B. (2000) Inji'cl. Imnum. 68, 61 15-6126. 1.1. Rt:id. S. DoO lkrhdin. C. J .• Bumbaugh. A. C'.. Sclandcr, R. K. & Whit lam, T. S. " WOÜ) Narl//'t' 406, 6-t·_·67. /4. Elli l11 : S. J.. Waillw righ l, l.. A., McDall iel, T. K .. Jarvis. K. <:l., Deng, Y. K .. Lai. L. c.. Mad'~arna ra , B. P., Donn.:nbe rg, M. S. & Kapcr, .l.B. ( 1 YlJ8) Mol. ,~¡i('m h i (ll. 28. I- .. t 15 , P~' rl la, N. T .. Mayhl'w. G. F.. Po ~f ai, G .. E l1 íol. S .. Donn\: llbe rg, M. S .. Kapcr. J.B. & Btat ln <' !". F. R. (I1J9g) /J lfcer. Imml/Il. 66, 3~IU · ·-3RI7 . lb. Jarvi,;. K. G .. Oin'm , J. A., Jer,;c, A. E .. McDaníel. T. K., Donnenherg, M. S. & Karx: r, J. B. (1 995) ¡'roe. Natl. AcoJ. Sci. USA 92. 7 9()( )-~ ){) t) . L7. Jcrsc. A. E, Yu, LTall. B. D. & Kapcr,J. B. ( 19IJO) Proc. Nal/. Acm/. Sci. USA 87.7SJ9-·71:i'n, IX. K~ nny , B., DcVin ncy. R . Stcin. M .• Rc: inschcid, D. J .• Frcy. E. A. & Finlay. B. B. ( I aoel diffcrcnt sdection prcsslIl"cs ror different parts of LEE gcncrating a gcnetic mosaico which will create different coalescent times for diffcrcnt r('~ions of the PAr. The present study included only pathogl'nic ~lrain~ from epi- demic clones, where seIcction is believed tI.) he sufficicntly high [¡J maintain LEE as a ullit during horizontal transter. Howcver, ('ven in this group of strains, the phylogenctic signal po;nts t(l cvidcllCC fm different transfcr events in thc origin of the LEE islam!. Tlle results of this study suggcst that the origin and cvolution ~)r LE):' is él morc complcx process than prcviously thought. l11C unil (lf selection in this specific case, ís nor the whok island, bul ~ma l kr modules inside the island é1nd within its constítucnt gcnc~. This stlldy may aIso delimítate the minimal LEE unir nl~eded 1'nr AlE 10 became pathogens at the first instancc. Futurc wmk will necd to expl.me both atypical strains of EPEC and EHEC, amI also wíld strains of E. co/i not related to humans. to bettcr undcrstand l"he evolutiol1 of pathogcnc.,-,is. \Ve thank L. Martínez-Castilla for tcchnícal assistancc, C. Silva and L. Forney for carefully review ing the m:muscript. and tW\1 anonylllllus reviewers and Dr. Mike Clegg, who made intcrcsring suggestions thar cOI1!.íderaoly improved this stuJy. Thi~ w(}rk was supp<)rted by C)l1sejo Nacional de Cienda y Tecnología Gent\mic Project 002~ and Di r('ccion General de Asuntos del Personal AcademiC\l Grant [N-20~1101. 19. Crea,;ey, E. A ., Friedhcrg. D .. S h; tw, R. K., IJmansl.: i. T. , KnU I ((lIl. S .. Roscnshinc. L & frankel, G. (:!1l03) Micmhioloí,t), 149, :1(I}t) -J(H"l. 20. Clar"-c. S. c.. Haigh, R. D., Fr"cs[()nc. P. P. E. & Willíallls, r. 1 \. (2003) Clill . Alicrobiol. Rev. 16. J()5-3 78. 21. Franke. (j., Phillips. A. D., Roscnshine.l., Doug¡.n. (j .. Kaper, J. B. & Knutron , S. (1998) Mol. I"/icml,iol. 30. l JI1-921. 22. Deng. W .• Puente. J . L.. Grucnheid. S .. Lí . Y .. Va ll a nc(; , B. A ., V:ilquu, :\. . Barba, J., Ibarra, J. A., C}'Donnell, P., Mctalnikov. P .. el al. (2004) I'ro .. ·. Naif. A cad. Sci. USA 101, 3597-3602. 23. lllOmpso, J. D., Hig.f!ins. D. G. & Gihs()ll, T. J. (19l).~ ) Nlltlac Acid¡·!\c.l. 22. 4fl73-4ti80. 24. Hall. T. A. (1999) Nllc/eic ..4dds S\'Il1p. Ser. 41. 95-9!{. 25. Rozas. J . &. Rozas. R (l9Y<.I) lJioin!ormQtin 15, 174 ··-17.5. 2fl. Kuma, S .• TiJlllllriJ, K .• Jak\J~sen , l. B. & Nci, M. (2UOI ) ME(;'\~ : MtJkcul:lr Evolutionary Gen~tic~ Analysis software (Arízl1na Sl;!t{; Ulli\' .. Temre). 27. lkemur. T. (1985) Mol. moL E vol. 2, \3·34. 21t Saitou, N. & Neí, M. (19~7) ,'vlol. /Jiol. Evo/. 4,4()(i - 425. 29. TiJ lll ura. K. & Nei, M. (19. 30. Felscnstein, J. (1 YX5) EI'olufirm ( /..fI ",renCf:. KllllS. j J9, 7 1:i.~ - ··7l) 1. 31. Farris, J. S., Kallersjo. M. , Kluge, A. G. & Bult. C. (1 99.'\ ) Clndislin 111, ~ 15···3 1'l. 32. Swoft~ml. D. L. (11.)99) I'Al W': Ph)'lo~r.llct¡c Allalyfis USfIIg ('arsill/oJlY r' (//ul Orlu:r Ml'thodsj (Si n au~r. Sundc rJand, M;\). Vcrsíon 4mb. 33. Allard. M. W .• Farris. J. S. & Ca rrentef, J. ( 19<)1)) ClaJistic, 15. 75- X-t. 34. Hus(ln, D. H. (1998) IJioillformatics t~. 6~ - 73 . 35. Goldman, N. & Yang, Z. ( 1()1J4) Mol. lJiof. E."m i. ti. 725·7.\6. 36. Yang, Z oO Niehen, R , Goldmall. N. & Krahhe-Pe-de r.>e ll. A. M. ~2 () lll)) GCI10ics 1:;5. 431- 44Y. 37. Nei, M. 8: Gojoh.)ri , T. (19RLi) Mol. Biol. I.:'l'/}! . • '. 41~-426 . JS. Kosaklw:,kí-Pond. S. L. &. Mu~e . S. V. (2lM4) /I./t"Jl. Rio!. h-of., in pre,,~. 3tl. Kos:lkovsk i-Pond, S. l... & Frost, S. D . W. (2()(l4) Mol. Wol. El'o/., in prcss. 40. Suzuk i, Y. &. Gl)jobori. T . (L!)\j9) Mol. Biol. t."vo{. (ft. U I .s.U2~. 41. Felsenstc: in. J. (1 981) J. Alo!. Evo!. 17. 36~-3 7 6. 4 2. Donn("nherg, M. S. & WhiUam. T. S. (20tH) J. Oil/. In n 'sl . 107,5.1<) ·5J,7 . 43. B\lyd, E. F. & n;¡ rtl, D. 1.. (1 998) ./. :\tol. hol. 47. 25t{- 267. 44. Lawr\:ncc, J. G. & Ochman. H. ( 1997) J. "'101. El'ul. "4,3>\3- 397. 45 . Nakamura, Y .. (jojobori. T. &. Ik ~ m u !" il, T . (! 'llJt!) lVlldór .·kids Res. 26. 334. 46. C't)fneli ll:', G . L. (2000) PhihlS. ·fral/s. H. 4)0(". tondoll [J 355. 6XI - I)93. 47. Sandn(.'r. L.. Eguiarle, L. E., Na varn), A., C ravi~lI\), /\. & 50uz". V. DlOJ) Micmhiology 147, 3 14Y-·JI5H. 4>:1. McGraw, E. A .. Li, J., SelandCf, R. K. & WhiUam. T. S. (/ \)1)9) MI'!. /lip! f: ;·of. 16, 12- 22- 49. Tarr. C. L &. Whittam. T. S. (2002) J. Bac!t>ri"l. IR". 47lJ ---4!{7. PNAS February 1,2005 I voL 102 no. 5 I 1547 z o ¡:: :::1 .... g w Capítulo 5. Genética de poblaciones. 5. J Breve introducción a la genética de poblaciones Una de las mayores y más interesantes preguntas que se hacía la biología a principios del siglo XX era la reconciliación de la teoría evolutiva propuesta por Darwin- Wallace y las leyes de Mendel sobre la herencia. Es durante los años de 1920 a 1930 cuando Ronald Fisher, lB.S. Haldane y Sewall Wright demuestran que ambas teorías son compatibles dando origen a la disciplina denominada genética de poblaciones (Eguiarte, 1999), la cual se encarga del estudio de las bases genéticas de la evolución. Asimismo, la genética de poblaciones nos brinda una mejor comprensión del proceso adaptativo, así como del origen y mantenimiento de la diversidad genética en las poblaciones naturales. En consecuencia, determina los mecanismos mediante los cuales ocurre la evolución, interpretada como el cambio en las frecuencias alélicas. Esta conjunción de ideas se le conoce como la teoría sintética que marcó una de las etapas de mayor desarrollo y producción científica dentro de la biología. La teoría sintética en conjunto con la teoría neutra propuesta por Kimura (Kimura, 1968 y 1983), marcan un nuevo paradigma y brindan el marco teórico bajo el cual se desarrolla la biología moderna. En la actualidad, con el surgimiento del estudio de los geno mas completos y la gran acumulación de información genética, es aún más evidente la necesidad de aplicar el marco teórico de la genética de poblaciones a nivel genómico. De esta manera, abarcaremos desde los procesos macroevolutivos hasta los microevolutivos en lo que parece ser la segunda gran síntesis. 5.2 Estructura genética de las poblaciones de E. coli y el paradigma clonal En el caso de las bacterias, la reproducción no se encuentra ligada a la recombinación o sexualidad como en los eucariontes. Las bacterias se dividen por fisión binaria, lo que genera en principio individuos clonales, donde la variación únicamente es producida por la mutación. Sin embargo, existen diferentes procesos denominados parasexuales (conjugación, transformación y transducción) los cuales promueven la transferencia horizontal de información genética que, además de la mutación, van a generar variación en las poblaciones. Por lo tanto, una de las preguntas centrales para la genética de 55 poblaciones bacterianas, es acerca del grado de clonalidad que poseen sus poblaciones, así como la definición de la especie bacteriana. Si las poblaciones son clonales estarían constituidas por linajes evolutivos independientes. Siendo así difícil hablar de especies ya que no tendríamos una poza génica común. Para este caso es difícil aplicar la teoría clásica de la genética de poblaciones; además, la evolución estaría dada por sustituciones de linajes completos ya sea por selección periódica o deriva génica. Por el contrario, si las especies bacterianas presentan altos niveles de recombinación, se tienen estructuras cercanas a la panmixia y se pueden aplicar aproximadamente la teoría de genética de poblaciones que usamos en los organismos diploides. A pesar de que la existencia de la recombinación se demostró hace más de 50 años en E. coli (Lederberg y Tatum, 1946), el papel que tiene dentro de las poblaciones bacterianas no se encuentra totalmente establecido y se encuentra bajo continuo debate. El primer intento por detenninar cuál era la estructura de las poblaciones bacterianas y en específico de E. coli fue realizado mediante la técnica de electroforesis multilocus (M LEE, por sus siglas en inglés) (Milkman, 1973). Se utilizaron 829 aislados obtenidos principalmente a partir de humanos. En este estudio se detenninó que la diversidad genética de la especie era de 1t = 0.23 (Milkman, 1973). Estudios posteriores utilizando la misma técnica MLEE (Selander y Levin, 1980) además de demostrar la existencia de desequilibrio de ligamiento en numerosos loci (Selander y Whittam, 1983; Whittam y col., 1983), sugirieron que la estructura de las poblaciones de E. coli era clonal. Trabajos posteriores basados en polimorfismo de enzimas en la colección denominada ECOR (la colección de referencia que se compone de 72 aislados a partir de humanos y no humanos y que se considera representa la variación genética natural de E. coli) (Ochman y Selander, 1984), han mostrado que la diversidad genética de esta bacteria se encuentra organizada dentro de un número limitado de clonas diferentes, lo que sugiere que la recombinación es baja (Whittam y col., 1983b). A partir de estos resultados se llegó a establecer lo que se denominó el paradigma clonal para las poblaciones de E. coli. Sin embargo, las primeras sospechas acerca de este resultado provinieron de los estudios con secuencias de DNA, como es el caso de análisis realizados a partir de las genealogías de algunos loci que han demostrado la existencia de recombinación intragénica (Dykhuizen y Green, 1986; Guttman y Dykhuizen, 1994; Nelson y Selander, 1994). De acuerdo a los análisis anteriores, existe 56 una contradicción evidente entre la aparente diversidad que las poblaciones bacterianas exhiben y la clonalidad, reflejada en la recuperación del mismo haplotipo en repetidas ocasiones. Estas observaciones sólo podrían ser reconciliadas asumiendo que los tamaños efectivos de las poblaciones son extremadamente pequeños, lo cual resulta muy controversial (Maynard-Smith, 1991; Maynard-Smith y col., 1993). Una alternativa para la explicación de estos resultados contradictorios puede ser que las poblaciones bacterianas poseen una estructura ecológica, es decir, que las diferentes cepas dentro de la misma especie se encuentran adaptadas a nichos ecológicos específicos (Souza y col., 1992; Gordon y Lee, 1999; Souza y col., 1999; Maynard-Smith y col., 2000), como es el caso de E. coli. La estructura ecológica en las especies bacterianas tendría consecuencias significativas para dos procesos fundamentales como son la selección periódica y la recombinación (Souza y col., 1992; Gordon y Lee, 1999; Souza y col., 1999; Maynard- Smith y col., 2000). La selección periódica purga la variación genética pennitiendo que, en el caso de las clonas bacterianas, una mutación en una de ellas pueda hacer que un mismo haplotipo desplace o sustituya a todos los demás (Levin, 1981). Es entonces que, la estructura ecológica de las especies limitaría el proceso de la selección periódica al nicho ecológico específico (Maynard-Smith, 1981). Si una especie consiste en numerosas poblaciones con múltiples nichos ecológicos distintos es muy poco probable que una sola mutación altere a todas las poblaciones y sean desplazados todos los haplotipos, o que esta mutación en sí tenga el mismo significado adaptativo para todos los casos, es decir, no va a afectar a toda la especie en su conjunto (Maynard-Smith, 1981; Cohan, 1994). De igual manera, la estructura ecológica va a limitar las asociaciones aleatorias generadas por recombinación. Si las distintas cepas se encuentran adaptadas a nichos específicos, entonces es posible que exista una tasa de recombinación alta intrapoblacional pero no necesariamente entre poblaciones de diferentes nichos (Gordon y Lee, 1999). Bajo este escenario los estudios de simulación indican que el desequilibrio de ligamiento será mantenido incluso aunque exista recombinación a una tasa mucho mayor que la tasa de mutación (Guttman, 1997). Por lo tanto, la existencia de estructura ecológica tendrá impacto en la estructura genética y la evolución de las especies bacterianas. Es entonces, que a luz de estas nuevas propuestas, existe la necesidad de reevaluar el paradigma clonal en E. coli, pues al parecer se ha subestimado el papel de la 57 recombinacion y el intercambio genético en esta bacteria, ya que no se ha tomado en cuenta su estructura ecológica y el mosaicismo presente al interior de su genoma. Existen varios trabajos que han profundizado en la ecología de E. coli más allá de la colección ECOR (Whittam y col., 1983; Whittam, 1989; Boyd y col., 1994; Souza y col., 1999; Gordon y Lee, 1999). La mayor parte coincide en que esta bacteria presenta una mayor diversidad que la sugerida con anterioridad, y que al parecer el grupo de las entero bacterias si posee una estructura ecológica (Gordon y Lee, 1999). Por lo tanto, E. coli no es tan clonal como se había supuesto. De hecho, se ha encontrado que la mayoría de las bacterias poseen un amplio espectro de estructura poblacional que va desde altamente clonales como Salmonella (Maynard-Smith y col., 1993) y Borrelia (Maynard-Snlith y col., 2000), hasta casi panmícticas como Helicobacter (Go y col., 1996) y Neisseria (O'Rourke y Spratt, 1994). En la literatura existen cuatro tipos de evidencia que han sido usados para demostrar la participación de la recombinación: 1) la presencia de desequilibrio de ligamiento entre alelos de diferentes loci dentro de una población (Dykhuizen y Green, 1986; Souza y col., 1992; Haubold y col., 1998); 2) la distribución de los sitios polimórficos en la secuencia de un gen (Maynard-Smith, 1992; Maynard-Smith y Smith, 1998); 3) la existencia de incongruencias filogenéticas entre genealogías de genes (Dykhuizen y Green, 1991 ; Lecointre y col., 1998; Brown y col., 2002); 4) la construcción de relaciones filogenéticas permitiendo que se construyan a manera de red y no necesariamente con estructura de árbol usando el test denominado Split-Decomposition (Huson, 1998; Reid y col., 2000; Brown y col., 2002). 5.3 Estructura epidémica en las poblaciones patógenas Al investigar las relaciones entre las poblaciones de las cepas comensales y patógenas de distintas especies bacterianas que conviven en el mismo nicho ecológico, como puede ser el tracto digestivo de los mamíferos en el caso de E. coli, se ha observado que éstas últimas presentan lo que se denomina estructura epidémica (Maynard-Smith y col., 1993). Esta estructura se refiere a que ocasionalmente un genotipo patógeno es selectivamente favorecido incrementando su frecuencia en la población y desplazando a los demás, con la consecuencia de que se recupera el mismo genotipo en numerosas ocasiones 58 (Maynard-Smith y col., 1993). Existen abundantes ejemplos de bacterias patógenas que presentan ésta estructura poblacional como es el caso de Neisseria (Maynard-Smith y col., 1993) y la cepa de E. coli EDL933 y 0157 Sakai serotipo 0157:H7, responsable de numerosos brotes epidémicos en Estados Unidos y Japón, respectivamente. El descubrimiento de este tipo de estructura en las cepas patógenas ha generado cierta confusión en relación al paradigma clonal pues se ha sugerido que, el hecho de que existan poblaciones patógenas con estructura epidémica en donde se recupera un mismo serotipo, apoya fuertemente la hipótesis clonal para las poblaciones de E. coli. Sin embargo, este fenómeno se encontraría igualmente explicado si consideramos que E. coli posee estructura ecológica, como se había mencionado con anterioridad. Además, se ha propuesto que en las especies medianamente clonales (que parece ser el caso de E. coli), la recombinación dominará la evolución a largo plazo pero no previene el surgimiento rápido de las clonas epidémicas (Maynard-Smith y col., 2000). Por otra parte, la mayoría de los estudios acerca de poblaciones patógenas en E. coli no realizan comparaciones entre genes relacionados al desarrollo de la patogénesis y genes no relacionados a patogénesis, en especial acerca de la contribución de los factores de virulencia a la historia de la especie y no sólo acerca de la diversificación de las cepas patógenas. Las comparaciones genéticas entre estas poblaciones ayudarán a explicar el origen y aparición de nuevas cepas patógenas e identificar las diferencias involucradas en su desarrollo. Asimismo, la evaluación de la participación de la selección y la mutación, nos demostrará cuales son las principales fuerzas evolutivas que moldean la historia de las cepas patógenas en comparación con las no patógenas. 5.4 Marcadores moleculares en el estudio de genética de poblaciones de E. coli Durante la historia del estudio de la genética de poblaciones en E. coli se han utilizado diversos marcadores moleculares, en su mayoría de genes metabólicos, que han resultado ser útiles para entender las relaciones filogenéticas entre las distintas cepas así como para cuantificar la diversidad existente. En el presente estudio utilizamos para el análisis poblacional cinco marcadores moleculares pertenecientes a genes metabólicos (mdh y gapA), transportadores (puIP), genes que participan en el desarrollo de estructuras que promueven la adhesión al 59 hospedero denominadas fimbrias (limA) y un gen que participa en el mecanIsmo de reparación del ONA (mutS). Estos marcadores cubren un amplio rango de actividades celulares en E. coli por lo que en su conjunto nos brindan la posibilidad de entender con mayor detalle la historia evolutiva de esta bacteria. Además, se usaron paralelamente tres genes pertenecientes a la isla patogénica LEE (tir, eae, espB) como marcadores de la virulencia, con el objetivo de llevar a acabo un estudio comparativo entre genes cromosomales y genes localizados en una isla patogénica, lo que cubriría un amplio espectro de la ecología de E. coli. 5.4.1 Malato deshidrogenasa (mdh) Esta proteína cataliza la oxidación reversible del malato a oxalacetato (involucrados en el ciclo de Krebs). Es un homodímero y se encuentran bien identificados dos dominios funcionales, el dominio de unión al NAO+ que comprende los amino ácidos 1 al 150, y el dominio catalítico que consiste en los amino ácidos 151-313. Esta enzima ha sido el marcador molecular más utilizado en los estudios de genética de poblaciones de E. coli y es uno de los marcadores responsables del establecimiento del paradigma clonal, debido a su bajo polimorfismo y tasas de sustitución molecular, además de que se han reconocido pocos haplotipos (Boyd y col., 1994). Los dos dominios funcionales de este gen poseen tasas de sustitución diferentes como se puede ver a continuación (Boyd y col., 1994): Dominio Dominio Ambos -¡ unión al Catalítico dominios I NAO+ dS dN dS dN dS dN mdh 1.88±0.65 0.09±0.09 5.53±1.18 0.20±0.15 18.53±1.61 0.15±0.09 A partir de estos resultados podemos observar que el dominio catalítico es más susceptible de aceptar sustituciones sinónimas en comparación con el de unión al NAO+, lo que sugiere que al interior de este gen existen diferentes presiones selectivas. 60 I 5.4.2 Gliceraldehído 3-fosfato deshidrogenasa (gapA) Esta proteína cataliza la fonnación del D-glicerol-3-fosfato durante el primer paso de la segunda fase de la glucólisis y su localización celular es en el citoplasma. Posee una región codificante de 330 aminoácidos a partir de la cual se han identificado dos dominios estructurales, el dominio de unión al NADH+ (aminoácidos 5-148) y el catalítico (aminoácidos 149-313). Ambos dominios exhiben diferencias en cuanto a sus tasas de sustitución molecular (Nelson y col., 1991): Dominio Dominio Ambos unión al Catalítico dominios NAD+ dS dN dS dN dS dN gapA 0.46±0.26 0.09±0.07 1.01±0.47 0.08±0.05 0.78±0.28 0.09±0.04 Se ha propuesto que el ancestro de E.coli adquirió este gen a partir de un eucarionte (Doolittle y col., 1990). Sin embargo, diversos estudios indican que los genes gapA de Salmonella, E. coli y Klebsiella poseen un ancestro en común (Nelson y col., 1991). Este gen ha sido ampliamente utilizado para la detenninación de tiempos de divergencia entre E. coli y Salmonella, así como para sus homólogos eucariontes (Nelson y col., 1991). Otras evidencias sugieren que la baja diversidad que este gen posee se debe a un evento de cambio selectivo reciente (Guttman y Dykhuizen, 1994b). 5.4.3 Prolina-permeasa (putP) Esta es una proteína transportadora que cataliza la transferencia activa dependiente de sodio de la L-prolina, que es degrada a glutamato para ser utilizada como fuente de carbono y nitrógeno; también es capaz de transportar litio de manera alternativa. Es una proteína transmembranal localizada principalmente en la cara interna en donde se pueden distinguir dos regiones, una corresponde a la que se encuentra completamente inmersa en la membrana y la segunda corresponde a una estructura de tipo asa y la cola del péptido. Al igual que para los marcadores moleculares descritos con anterioridad, se ha registrado 61 o, Selander, 1992): Dominio Dominio Ambos transmembranal asa y cola dominios dS dN dS dN ds dN putp 9.18+1.76 0.03+0,03 | 9,84+2,52 | 0,340.25 | 9.04+1.46 | 0.15+0.11 Los estudios comparativos de genética de poblaciones de este gen en conjunto con gapA, han indicado que existe baja recombinación intragénica, sugiriendo que este mecanismo es más importante de lo que se había supuesto con anterioridad. Además, las reconstrucciones filogenéticas con ambos genes demostraron ser congruentes con las propuestas utilizando otros marcadores como mdh (Nelson y Selander, 1992), 5.4.4 Fimbria tipo | cadena A (fimA) Esta proteína es una fimbria cuya función principal es permitir la colonización del epitelio del hospedero, así que juegan un papel muy importante para el desarrollo de la patogénesis. Se compone de filamentos polares que salen de la superficie de la membrana de la bacteria con un tamaño aproximado de 0.5-1.5 micras y en números de 100 a 300 por célula, Los estudios de genética de poblaciones han demostrado que las tasas de sustitución sinónimas son mayores para este gen que para los marcadores metabólicos (dS- 0.157+0.025), mientras que las tasas no sinónimas (dN- 0.034+0.007) si son equiparables a las de los genes metabólicos (Boyd y Hartl, 1998b). Otros estudios utilizando un mayor número de haplotipos han demostrado que el polimorfismo de este gen es más alto que el de los genes metabólicos. Además, la recombinación es más frecuente y diferencial en distintas regiones de la proteína y la diversidad del gen parece estar mantenida por selección diversificadora (Positiva del tipo Darwiniano) (Peek y col., 2001). 5.4.5 Proteina reparadora del DNA (mutS) Este gen se encuentra involucrado en la reparación de errores en el apareamiento de las bases del DNA en el momento de la replicación, lo más probable es que lleve a cabo la variabil idad en las tasas de sustitución molecular hacia dentro del gen (Nelson y Selander ~ 92): ominio ominio bos ran em branal sa la inios S utp ±1.76 ±0.03 . ±2.52 .3 ±0.25 . ±1.46 ±0. 1 os ios parativos e enética e blaci nes e ste n junto n pA, n i do e iste aja binación énica, ir o e te ecanis o s ás portante e e bía uesto n t ri ri ad. demás, s st ci nes lo éticas n bos nes ostraron r gruentes n s r puestas iz o tr s arcadores o dh elson elander, 92). . .4 i bria 1 ena i ) sta r t í a s a i bria ya ción ri cipal s r itir l nización el iteli el spedero, sí e gan n pel uy portante ara l sa ro lo e t génesis. e pone e la entos lares e l n e perficie e embrana e cteria n a año i ado e . -1.5 icras eros e 0 0 or lula. os t ios e enética e blaciones n ostrado e s s e sti i n i as n ayores ra te n e ara s arcadores etabólicos - . ±0.025), ientras e s as i as - ±0. 07) í n uiparables s e s nes etabólicos oyd artl, 98b). tros t ios t iz o ayor ero e loti os n ostrado e l l orfi o e ste n s ás lt e l e s nes etabólicos. demás, binación s ás ente i r ncial i ti tas i nes e r t ína i rsi ad el en rece tar antenida r l ci n ersif ora ositi a el ar iniano) ek ol., 01). . .5 roteína r dora el NA utS) ste n cuentra l cr do ración e r res l r iento e s ases el A l omento e li ción, nlás r able s e e o 62 fase de reconocimiento del error, posee baja actividad de ATPasa. Ha sido involucrada en el proceso de la recombinación mitótica y meiótica en sus homólogos eucariontes y en la inhibición del intercambio genético ente especies (Yang, 2000). Homólogos de mutS han sido reconocidos tanto en procariontes como en eucariontes lo que nos habla de que son parte de un mecanismo celular muy conservado en los tres dominios. Las deficiencias en esta proteína interrumpen la reparación generando un fenotipo mutante con altas tasas de mutación y recombinación. Se ha propuesto que esto es lo que sucede en las cepas patógenas y provoca su rápida expansión y divergencia (LeClerc y col., 1996). Esta aparición de alelos mutantes en las poblaciones naturales implica que tienen un papel muy importante en la emergencia de nuevos patógenos (LeClerc y col., 1996~ Li y col., 2003). Se ha propuesto que mutS ha sido transferido horizontalmente en múltiples ocasiones en distintos patógenos de E. coli, y que el sitio de su localización cromosómica se encuentra bajo recombinación constante ('hot-spot'), ya que sus reconstrucciones filogenéticas son incongruentes con las de otros marcadores como mdh (Brown y col., 2001). A continuación se señalan los sitios de localización dentro del genoma de E. coli de cada uno de los marcadores usados en el presente estudio: espB elll! liT LEE 61.5 ftmA o 97.9 50 Fig. 5.1. Localización de los distintos marcadores en estudio dentro del genoma de E. coli. 63 5.5. Metodología Para el análisis comparativo de genética de poblaciones se determinaron parámetros clásicos como es la diversidad representada tanto por 1t como por e, ambos son dos parámetros poblacionales importantes que nos describen la distribución del polimorfismo en las poblaciones y funcionan bajo diferentes supuestos que en su conjunto nos permiten reconocer si los marcadores utilizados se encuentran bajo algún tipo de presión selectiva o bajo el modelo neutro (ver capítulo 3, prueba de Tajima). Además se determinó el contenido promedio de GC y para cada una de las posiciones codificantes (primera, segunda y tercera). De igual manera, se calculó el CAl y las tasas de sustitución molecular sinónimas (dS) y no sinónimas (dN), así como el cociente entre ambas (dN/dS). La determinación de estos parámetros se realizó bajo la misma metodología descrita en Castillo y col.(2005) (capítulo 4) Y utilizando los mismos programas computacionales. A continuación se presentan los resultados preliminares obtenidos. 5.6 Resultados En la tabla 5.1 se encuentran los resultados de la determinación de los principales parámetros evolutivos obtenidos a partir de las muestras completas de genes para cada marcador molecular que se encuentran descritas en el GenBank hasta marzo 2005 (ver Apéndice 111). Como se puede observar esta muestra no es equivalente para cada marcador y refleja el sesgo que existe en los estudios de genética de poblaciones de E. eolio Los marcadores más pobremente representados son los que están relacionados con la virulencia y desarrollo de la patogénesis (eae, (ir y espB) y el más representado es el gen metabólico mdh. Este sesgo limitó un poco las comparaciones entre los distintos marcadores pero no fue impedimento para la determinación de la determinación de las tasas de substitución molecular y el test de neutralidad (D de Tajima). 64 Genes putp gapA mutS mdh fimA tir eae espB N Seco H* Sitios Sitios 1t 8 D %GC %GC la %GC2a %GC3a CAl dS dN dN/dS Sitios bajo (bp) Cons. polim. (±se) (±se) Tajima (±se) pos pos pos (±se) (±se) selección/ (p) (±se) (±se) (±se) adaptativa (+) o Purificadora (-) (p 47 696 26 629 67 0.023 0.021 0.19 53.2 44.1 63.8 51.6 0.330 0.096 0.0009 0.0320 No+ (0.0002) (0.0009) No sig (0.005) {0.011 2 {0.186) {0.052) (0.0020) (0.006) {0.00032 43 - 67 663 20 508 155 0.013 0.048 -2.54 51.4 58.8 43 33.1 0.828 0.051 0.0036 0.1162 No+ ..... ................. _ ....... _~ . . ............................. " ...... .. . (º . ~ . ººº . ~1 .... . (º . ~º . º} . ~1 ......... (p.~º . :ººD ........... (º . :º~)} .............. (º . :º.~ .. D . (º:º}~) ....... {º . :..9~J t . (.9. . ~º.9.~~l .'<º.:..9J?l .... J9:ºº.I?.2 .... ... ....... .............. 50 - 29 453 19 341 III 0.009 0.029 -2.53 53.1 54.4 40.9 65.1 0.194 0.014 0.0046 0.0893 No+ (0.0003) (0.0018) (p 50) 45/- 1/+ 1 / - 19/- 12/- None 29/- 27/- 35/- None 7/- 5/- 7/- None None 5/- 115/- 2/- 25/- 3/- Predicted function Unknown Secreted protein Positive regulator TTSS Putative chaperone of espA and espB TTSS TTSS TTSS TTSS TTSS TTSS Putative assembly of TTSS Putative negative regulator (grl R) Putative positive regulator (gr/A) Secretion of espD TTSS Secretion of trans1ocators TTSS TTSS sepZ 297 0.247 47. 2 40.5 55.6 30.3 0.54 0.221 0.39 16 / - Unknown (0.027 ) (0.64) (\.99) (0.65 ) (1.72) (0.06) (0.024) crf/2 354 0.061 30.2 38.4 24. I 28.1 0.29 0.020 0.12 22/- rTSS (0.006) (0.09) (0.43 ) (0.37) (0.56) (004) {0.003) escV 2028 0.052 40.1 48.8 32.8 38.9 0.22 0.013 0.08 110/- TTSS (0. 004) (0.22) (0.07) (0.10) (0.65 ) (0.04) (0.002) escN 134 I 0.059 44.6 54.7 4\.2 37.8 0.24 0.0 16 0.08 84/- TTSS (0.003) (033) (0.05) (0.21 ) (0.87) (0.04) (0.002) orf/5 378 0.068 35.4 40.6 27.9 37.8 0.30 0.028 0.17 2/ - TTSS (0. 008) (0.49) (0.73) (0.14) (0.74) (0.08) (0.007) orf/6 417 0.110 3\.9 36.8 33.8 29.4 0.34 0.071 0.23 1 / - Secretjon of (0.011) (0.31) (0.34) (0.91 ) (0.18) (0.05) (0010) translocators sepQ 918 0.099 37 45.2 33.2 32.4 0.32 0.059 0.24 8/ - TTSS (0.008) (0.54) (0.62) (0.32) ( 1.19) (0.04) (0.008) espH 498 0.187 39.5 43.8 41.7 33.1 0.57 0.176 0.41 1 / - Secreted protejn (0.017) (0.64) (1.51 ) (0.78) (0.78) (0.08) (0.019) cesF 360 0.179 32.1 50.6 26.1 27.2 1.12 0.107 0.21 30/- Chaperone for espF (0.015) (0.48) ( 1.33) (1.10) ( 1.29) (0.26) (0.011) map 612 0.152 43 47.2 38.2 43.7 0.47 0.108 0.33 1/+ Secreted protejn (0.009) (0.50) (0.22) (0.65) (0.87) (0.05) (0.013) 5 /- tir 1593 0.236 49 59. 7 50.9 36.4 0.59 0.202 0.3 1 1/+ Intjmjn receptor, (0.011) (0.33) (0.74) (0.32) ( 1.52) (0.11) (0.024) 102/- secreted protejn cesT 471 0.046 47.7 42.6 31.2 29.7 0.19 0.013 0.11 2/- Chaperone for tir (0.003) (0.46) (0.20) (0.36) (0.79) (0.02) (0.002) eae 2784 0.138 42.3 47.6 41 38.4 0.39 0.096 0.26 3 / + Adhesin (intjmin) (0.015) (0.39) (0.46) (0.23) (0.69) (0.04) (0.011 ) 17/ - escD 1221 0.059 39.2 45.7 33.3 38.5 0.24 0.018 0.12 2/ - TTSS (0.003) (0.20) (0.08) (0.27) (0.65) (0.04) (0.003) sepL 1056 0.077 34.6 42.6 28.5 32.7 0.31 0.030 0.13 68/- Secretion (0.005) (0.35) (0.22) (0.18) (1.00) (0.04) (0.003) of translocators espA 579 0.120 39.9 46.4 39.3 34 0.35 0.082 0.26 6/- Secreted protein (0.010) (0.40) (0.56) (0.69) (0.95) (0.04) (0.010) espD 1125 0.144 46.6 54.9 44.8 40 0.37 0.107 0.34 1 /+ Secreted protejn (0.012) (0.38) (0.22) (0.40) ( 1.46) (0.05) (0.015) 67 / - espB 930 0.213 46.7 53.8 46.6 39.8 0.74 0.165 0.3D 50 / - Secreted protejn (0.011 ) (0.32) (0.53) (1 .07) ( 1.55) (0.11 ) (0.020) orj27 408 0.045 39.2 45.9 31.1 40.8 0.13 0.021 0.24 2 /- Putatjve chaperone (0.006) (0.31 ) (0.19) (0.30) (0.69) (0.02) (0.005) ofespD escF 222 0.097 36.8 44.3 30.1 35.8 0.26 0.086 0.39 None TTSS (0.003) (0.41 ) (0.97) (0.57) ( 1.34) (0.06) (0.032) orj29 279 0.107 37.4 68 29 35.1 0.32 0.081 0.37 4/- TTSS (0.031 ) (0.34) (0.55) (0.57) (0.97) (0.06) (0.013) espF 606 0.156 53.1 59.1 61.7 38.6 0.34 0.121 0.43 1 / + Secreted protejn (0.008) (0.22) (1 .40) (0.94) (1 .02) (0.04) (0.016) 16 / - Table 4. ILD analysis resu lts. Pairwise p values among LEE genes. eseR eseS ese U ese V eseN eseD eseF escJ I 1 1 1 1 1 1 sepZ 1 1 1 1 1 1 1 espH 0.001 0.001 0.001 0.001 0.001 0.001 0.011 map 0.001 0.007 0.001 0.001 0.003 0.001 0.006 tir 0.020 0.159 0.001 0.001 0.001 0.001 0.124 eae 0.033 0.173 0.008 0.015 0.001 0.007 0.096 espA 0.001 0.194 0.001 0.001 0.001 0.002 0.114 espB 0.001 0.00 1 0.001 0.001 0.001 0.001 0.001 • Values represent p val ues for 1,000 ILD partitions using the partition homogeneity test and branch and bound search option available in PAUP v.403b (34). p values of 1 indicates complete congruence while small p values indicates incongruence between genes. 116 Table 5. POS test-results. Gene Codon SLAC dN/dS ARS dN/dS Ful\ Likelihood (p) (p) dN/dS (Bayes factor) rORFl Negative sites 10 -2.72 (0.241) -2.49 (0.038) -3.49 (2947.9) 11 -2.29 (0.287) -6.14 (0.023) -3.47 (66099.3) 12 -1.97 (0.333) -1.29 (0.059) -3.53 (2.9x 1 06 ) 33 -1.97(0.333) -4.17 (0.033) -3.50 (161003) 34 -5.44 (0.10 1) -2.56 (0.064) -3.40 (2467.6) 41 -4.73 (0.139) -3.44 (0.031) -3.48 (181.8) 50 -2.60 (0.293) -1.48 (0.080) -3.39 (4484.9) 52 -1.97 (0.337) -2.20 (0.053) -3.50 (1432.6) 54 -3.95 (0.111) -3.45 (0.037) -3.50 (6903.9) 57 -2.72 (0.253) -1.77 (0.079) -3.45 (813.5) 64 -1.97 (0.333) -1.05 (0.081) -3.53 (21613.4) 67 -2.72 (0.241) -1.78 (0.074) -3.46 (887) 70 -1.97 (0.333) -0.96 (0.090) -3.53 (2.6x 1 06 ) 78 -2.72 (0.241) -1.78 (0.054) -3.54 (1107) 84 -5.77 (0.060) -3.98 (0.011) -3.50 (63715.8) 95 -3.95 (0.111) -3.34 (0.039) -3.50 (89663.8) 97 -5.44 (0.064) -2.56 (0.038) -3.49 (3033.6) 105 -1.97 (0.333) -2.20 (0.046) -3.53 (31715.7) 117 -2.72 (0.241) -1.78 (0.066) -3.49 (922.3) 120 -1.97 (0.333) -0.93 (0.098) -3.50 (1186) 129 -2.72 (0.241) -1.78 (0.074) -3.46 (887) 138 -2.72 (0.253) -1.77 (0.079) -3.45 (813.5) 139 -2.72 (0.253) -2.54 (0.046) -3.45 (2596.5) 142 -1.97 (0.333) -1.08 (0.078) -3.53 (794.2) 145 -3.95 (0.117) -0.98 (0.088) -3.53 (2.2x 1 06 ) 158 -3.95 (0.111) -4.22 (0.028) -3.53 (180119) 160 -2.72 (0.253) -1.77 (0.067) -3.48 (934.8) 163 -1.97JO.333) -4.21 (0.032) -3.50 (164233) 169 -2.72 (0.266) -1.78 (0.087) -3.43 (412510) 172 -1.97 (0.337) -2.20 (0.053) -3.50 (1432.6) 174 -2.72 (0.241) -2.49 (0.037) -3.50 (3075) 179 -5.44 (0.064) -2.20 (0.073) -3.45 (1940.6) 182 -3.95 (0.111) -3.45 (0.037) -3.50 (6903.9) 204 -2.72 (0.241) -1.78(0.054) -3.54 (1107) 211 -2.72 (0.253) -1.77 (0.067) -3.48 (934.8) 214 -2.72 (0.253) -2.17 (0.075) -3.45 (1867) 222 -2.72 (0.253) -2.54 (0.039) -3.49 (2909) 232 -1.97 (0.333) -0.93 (0.098) -3.50 (1186) 247 -3.95 (0.112) -3.42 (0.009) -3.54 (459595) 255 -5.44 (0.058) -9.80 (0.005) -3.54 (3.1 x 1 06 ) 258 -2.15 (0.386) -15.17 (0.075) -2.17 (934.4) 259 -1.97 (0.407) -15.3 (0.051) -2.27 (6992.5) 266 -1.97 (0.333) -98.07 (0.010) -3.53 (1.1xl06 ) 270 -3.95 (0.111) -609.5 (0.001) -3.50 (887201) 272 -3.34 (0.283) -21.2 (0.028) -1.62 (152.3) espG Positive sites 166 3.39 (0.387) 2.49 (0.097) 5.52 (139.7) Negative sites 72 -6 (0.075) -2.09 (0.026) -2.18(4) ter 117 Negative sites 13 -3.69 (0.135) -7.41 (0.078) -4.12 (30119.9) 17 -5.76 (0.045) -34 (0.025) -4.12 (4935.1) 22 -1.51 (0.406) -5.70 (0.097) -4.1 1 (2436.7) 23 -6.76 (0.033) -55 (0.012) -4.11(769.1) 28 -3.69 (0.111) -34.2 (0.023) -4.1 1 (1 126.9) 30 -2.88 (0.271) -18.8 (0.039) -4.11 (1562.5) 40 -2.88 (0.227) -5 (0.089) -4.11 (1263.7) 49 -5.76 (0.073) -18.8 (0.042) -4.11 (1573.6) 61 -2.88 (0.227) -4.39 (0.096) -4.11 (1308.9) 72 -3.69 (0.111) -5.70 (0.080) -4.12 (5085.9) 80 -3.69 (0.111) -34.2 (0.005) -4.11 (1510.6) 81 -1.84 (0.333) -7.03 (0.062) -4.11 (2328.3) 83 -2.88 (0.242) -25.6 (0.031) -4.12 (14075.8) 92 -1.84 (0.347) -5.79 (0.074) -4.12 (15757.5) 93 -3.69 (0.1 16) -28.4 (0.018) -4.12 (3216.1) 94 -3.69 (0.111) -31.4 (0.008) -4.11 (486.1) 119 -3.69 (0.111) -14.6 (0.009) -4.11 (1843.4) 128 -2.88 (0.213) -10.2 (0.048) -4.11 (11 1 1) ort2 Negative sites 6 -7.03 (0.125) -18.6 (0.020) -4.68 (368.2) 9 -5.70 (0.075) -477.1 (0.012) -4.74 (407946) 13 -7.03 (0.125) -8.25 (0.055) -4.59 (108.5) 21 -5.70 (0.075) -3.67 (0.021) -4.92 (19542.6) 29 -7.03 (0.073) -5.28 (0.073) -4.59 (103.9) 39 -4.68 ( 0.111) -1.58 (0.034) -4.94 (1.6x 109 ) 42 -7.03 (0.125) -8.25 (0.055) -4.59 (1 08.5) 54 -4.68 (0.111) -10.3 (0.002) -4.90 (2.20x 1 06 ) 55 -2.85 (0.282) -3.60 (0.088) -4.86 (4450.9) 59 -5.14 (0.092) -1.89 (0.092) -4.74 (30484.1) 62 -3. 12 (0.249) -4.66 (0.049) -4.73 (266) 68 -3.51 (0.244) -13.3 (0.029) -4.71 (379.2) orf4 - Negative sites 2 -2.0910.333) -4.06 (0.051) -5.90 (160065) 11 -6.01 (0.066) -696.3 (0.002) -5.87 (2.1 x 1 0 16 ) 16 -3 (0.232) -5.21 (0.062) -5.89 ( 1004.8) 18 -2.09 (0.333) -4.93 (0.045) -5.91 (90714.4) 47 -2.09 (0.333) -5.60 (0.043) -5.90 (58754.8) 52 -3 (0.232) -15 (0.019) -5.89 (6471.9) 54 -4.30 (0.162) -7.04 (0.041) -5.88 (301.2) 58 -2.05 (0.422) -7193.5 (0.009) -5.02 (21496.1) 59 -4.30 (0.1 62) -7.04 (0.04 1) -5.88 (301.2) 63 -3.15 (0.22 1) -7.41 (0.046) -5 .87 (292.8) 65 -2.09 (0.334) -19.8 (0.012) -5.92 (46312.4) 69 -2.09 (0.345) -5.61(0.046) -5.89 (8827.2) 82 -2.09 (0.333) -2.63 (0.069) -5.92 (21 50.9) 98 -3 (0.244) -1.96 (0.099) -5.91 (2705.33) 100 -3 (0.232) -1 5 (0.01 5) -5.91 (6678) 103 -3 (0.232) -8.08 (0.024) -5.89 (8576.8) 109 -3 (0.244) -3.87 (0.070) -5.90 (1014.8) 112 -2.46 (0.282) -5.27 (0.050) -5.87 (17937.2) 141 -3 (0.232) -5.21 (0.066) -5.89 (971.4) 144 -3 (0.244) -8.19 (0.050) -5.90 (3951 .7) 145 -2.51 (0.31 4) -9.78 (0.030) -5.83 (1.5x 1 06 ) 153 -2.60 (0.290) -19.7 (0.01 6) -5.84 (44444.1) 118 154 -3 (0.244) -8.38 (0.022) -5.90 (8391.9) 157 -3 (0.232) -5.21 (0.066) -5.89 (971.4) 161 -4.19 (0.111) -8.73 (0.006) -5.91 (1.6x 1 0 1°) 164 I -4.19 (0.111) -7.16 (0.010) -5.90 (6.7x 1 09 ) 170 -1.50 (0.516) -43.5 (0.059) -5.83 (20145.6) 173 -3 (0.232) -5.21 (0.048) -5.93 (1063.9) 177 -3 (0.244) -3.87 (0.082) -3.87 (956) orf5 Negative sites 12 -2.88 (0.262) -1.61 (0.091) -3.16 (96648.1) 31 -4.10 (0.111) -1.09 (0.098) -3.31 (9252.6) 37 -5.77 (0.061) -2.62 (0.027) -3.32 (1782.4) 40 -2.69 (0.289) -1.21 (0.091) -3.11 (972.3) 49 -2.49 (0.274) -8.52 (0.012) -3.21 (346.3) 51 -2.88 (0.248) -3.60 (0.033) -3.19 (2566.6) 67 -2.88 (0.248) -3.60 (0.033) -3.19 (2566.6) 75 -2.05 (0.344) -0.83 (0.085) -3.29 (678.8) 79 -2.40 (0.285) -1.79 (0.048) -3.21 (6539.4) 80 -2.05 (0.333) -0.83 (0.060) -3.43 (8942.8) 91 -1.87 (0.431) -0.91 (0.082) -3.28 (861.1) 101 -2.88 (0.035) -2.61 (0.035) -3.32 (2100.5) 122 -2.88 (0.238) -0.73 (0.085) -3.36 (255.6) 139 -2.88 (0.236) -5.15 (0.011) -3.36 (2723.6) 156 -2.88 (0.248) -1.07 (0.077) -3.32 (330.8) 159 -2.05 (0.333) -1.41 (0.040) -3.32 (2.4x 107 ) 164 -4.10 (0.111) -2.51 (0.009) -3.31 (2.3x 107 ) 165 -2.05 (0.344) -0.61 (0.082) -3.45 (42543.5) 178 -2.88 (0.236) -1.61 (0.051) -3.36 (295.9) 180 -4.10 (0.111) -4.32 (0.004) -3.46 (211396) 194 -4.10 (0.111) -1.25 (0.052) -3.35 (1.IxI08 ) 198 -6.53 (0.043) -8.45 (0.014) -3.25 (221.4) 210 -5.77 (0.056) -3.13 (0.018) -3.36 (1602.8) 211 -4.10 (0.111) -1.09 (0.092) -3.35 (7.7xI07 ) 213 -2.88 (0.248) -2.61 (0.035) -3.32 (2100.5) 215 -4.22 (0.161) -2.58 (0.039) -3.22 (67.1) 228 -2.88 (0.236) -0.73 (0.075) -3.41 (278.3) escR Negative sites 17 -2.48 (0.333) -5.01 (0.067) -5.35 (170.3) 19 -3.91 (0.211) -6.16 (0.064) -5.37 (373.8) 25 -2.48 (0.333) -25.5 (0.009) -5.41 (934) 31 -2.48 (0.341) -5.40 (0.050) -5.39 (17833.3) 34 -3.91 (0.211) -3.66 (0.087) -5.37 (522.3) 38 -2.48 (0.353) -27.7 (0.020) -5.37 (294.4) 49 -2.48 (0.333) -8.22 (0.039) -5.40 (15955.8) 56 -3.91 (0.211) -19. i 7 (0.024) -5.39 (767.7) 62 -2.48 (0.333) -9.15 (0.049) -5.35 (99) 67 -2.48 (0.333) -5.01 (0.052) -5.39 (624.3) 68 0.869 (0.048) 0.770 (0.848) -2.86 (61.8) 78 -4.54 (0.181) -8.36 (0.046) -5.35 (107) 82 -3.89 (0.212) -7.28 (0.055) -5.34 (86.9) 85 -3.91 (0.224) -4.14 (0.083) -5.37 (2408.8) 86 -2.48 (0.333) -2.33 (0.095) -5.41 (5058.1) 87 -3.89 (0.214) -4.44 (0.080) -5.34 (107.5) 88 -3.91 (0.211) -6.16 (0.062) -5.39 (1415.5) 89 -3.91 (0.240) -29.9 (0.013) -5.33 (437.9) 119 106 -3.91 (0.240) -29.9 (0.031) -5.33 (1 107.8) 113 -3.91 (0.211) -6. 16 (0.062) -5.39 (1415.5) 114 -2.48 (0.333) -5.01 (0.052) -5.39 (624.3) 126 -2.48 (0.333) -2.52 (0.087) -5.41 (3104.5) 140 -2.48 (0.350) -5.40 (0.052) -5.38 (913.8) 146 -2.48 (0.333) -9.14 (0.040) -5.41 (2869.6) 149 -2.48 (0.333) -3.95 (0.063) -5.39 (937.2) 155 -2.48 (0.333) -2.52 (0.087) -5.41 (3104.5) 157 -3.9 1 (0.211) -3 .66 (0.087) -5.37 (522.3) 160 -2.48 (0.341) -5.40 (0.050) -5.39 (17833.3) 164 -3.91 (0.240) -6.16 (0.079) -5.33 (1098) 166 -2.48 (0.333) -7.42 (0.071) -5.41 (7577.5) 169 -2.48 (0.333) -3.95 (0.055) -5.41 (2132.9) 193 -3.89 (0.212) -7.28 (0.055) -5.34 (86.9) 198 -1.95 (0.450) -61.9 (0.059) -5.31 (209.9) 204 -2.48 (0.346) -5.01 (0.346) -5.39 ( 12493.7) 210 -3.91 (0.2 11) -3.66 (0.087) -5.37 (522.3) eseS No sites escT Negative sites 3 -4.93 (0.072) -14.4 (0.032) -4.34 (O) 24 -4.32 (0.088) -8.1 6 (0.064) -4.34 (O) 38 -6.12 (0.044) -73.9 (0.014) -4.34 (O) 65 -4.32 (0.088) -8.16 (0.064) -4.34 (O) 78 -6.12 (0.044) -73.9 (0.0 14) -4.34 (O) 193 -7.77 (0.082) -63.9 (0.006) -4.34 (O) 249 -4.93 (0.067) -22.6 (0.050) -4.34 (O) escU Negative sites 135 -5.22 (0.060) -13.1 (0.015) -4.35 (11.5) - 154 -5.22 (0.072) -17.3 (0.056) -4.13 (4) 259 -4.43 (0.084) -7.42 (0.096) -4.09 (4.9) 31 8 -5.22 (0.060) -17.3 (0.043) -4.15 (5.8) 342 -5.22 (0.060) -13.1 (0.020) -4.33 (6.9) rorO Negative sites 7 -4.46 (0.080) -1.74 (0.005) -3.13 (O) 8 -4.48 (0.076) -4.63 (0.010) -3.13 (O) 32 -4.48 (0.076) -0.72 (0.085) -3.13 (O) 42 -4.48 (0.076) -0.72 (0.099) -3.12(0) 107 -5.59 (0.054) -5.45 (0.054) -3.12 (O) 142 -4.48 (0.086) -0.72 (0.089) -3.12 (O) 147 -4.48 (0.076) -0.72 (0.099) -3.12(0) orflO No sites orfll No sites cesO Negative sites 24 -3.88 (0.2 14) -7.74 (0.045) -12.3 (1261.3) 107 -5.19{0.1 1l) -14.6 (0.003) -12.5 (1 975.8) 112 -3.77 (0.269) - 16.6 (0.0 17) -12.9 (1340.4) 127 -3.39 (0.289) -6.11 (0.068) -12.3 (1 144.1) 146 -3.90 (0.209) -4.44 (0.072) -12.2 (951.9) escC Negative sites 5 -2.62 (0.267) -7.93 (0.047) -6.44 (6723.7) 17 -1.05 (0.555) -24.8 (0.079) -4.1 4 (47212.9) 19 -2. 10 (0.333) -20.5 (0.020) -6.44 (288269) 32 -2.62 (0.277) -8.88 (0.064) -6.43 (65553.4) 37 -2.10 (0.333) -24.7 (0.020) -6.42 (326249) 120 39 -2.62 (0.267) -8.79 (0.040) -6.44 (8551.4) 41 -2.) 0(0.333) -4.4) (0.074) -6.42 (1.65x 1 08 ) 46 -2.10 (0.333) -4.24 (0.089) -6.40 (2.17x 107 ) 48 -2.62 (0.267) -4.46 (0.090) -6.43 (5629.6) 50 -2.10(0.333) -3.25 (0.093) -6.44 (5.48x 1 08 ) 55 -2.33 (0.300) -4.94 (0.072) -6.41 (22081.2) 62 -2.10 (0.333) -4.33 (0.075) -6.41 (1.6x 1 07 ) 76 -2.10 (0.333) -24.7 (0.021) -6.42 (577217) 81 -2.62 (0.277) -9.34 (0.045) -6.43 (5702.9) 86 -4.19 (0.112) -9788.5 (0.002) -6.40 (9.6x 10 17 ) 95 -2.62 (0.277) -4.09 (0.089} -6.43 (4233.5) 109 -2.62 (0.267) -7.63 (0.066) -6.44 (7607.1) 112 -2.10(0.333) -4.41 (0.069) -6.42 (10922.1) 128 -2.10 (0.333) -4.07 (0.077) -6.42 (7621.7) 130 -2.10 (0.351) -18.3 (0.033) -6.40 (7452.6) 136 -2.62 (0.277) -7.43 (0.046) -6.42 (31271) 137 -2.62 (0.267) -8.79 (0.054) -6.41 (7373.4) 143 -2.10(0.333) -4.07 (0.077) -6.42 (7621.7) 146 -2.10 (0.342) -13.3 (0.083) -6.41 (5658.5) 151 -2.10 (0.333) -3.25 (0.090) -6.45 (5.8x 1 06 ) 153 -2.10 (0.333) -20.5 (0.025) -6.42 (276586) 155 -2.62 (0.277) -8.79 (0.047) -6.42 (24424.1) 158 -2.62 (0.286) -8.79 (0.069) -6.39 (1.4xI07 ) 163 -4.21 (0.122) -21.6 (0.010) -6.41 (3.5x 1 06 ) 165 -2.62 (0.267) -7.93 (0.047) -6.44 (6723.7) 167 -2.62 JO.267) -7.9310.052) -6.43 (6378.6) 169 -2.62 (0.277) -8.68 (0.037) -6.43 (9155.5) 174 -4.21 (0.111) -16.6 (0.007) -6.44 (7 .07x 1 08 ) 182 -2.10 (0.333) -16.6 (0.051) -6.43 (110549) 185 -2.56 (0.335) -7.71 (0.046) -6.37 (63140.2) 188 -4.21 (0.111) -14.3(0.007) -6.44 (6.2x 1 08 ) 194 -2.10 (0.333) -4.41 (0.069) -6.42 (10922.1) 204 -2.10(0.333) -17.1 (0.052) -6.43 (6888.2) 205 -2.10 (0.333) -25.8 (0.018) -6.42 (584407) 206 -2.10 (0.333) -3.25 (0.090) -6.45 (5.8x 1 06 ) 213 -2.10 (0.333) -4.41 (0.069) -6.42 (10922.1) 218 -2.10 (0.333) -4.30 (0.059) -6.45 (5.03x 1 06 ) 219 -2.10 (0.356) -89.9 (0.028) -6.40 (1.8xIO IO ) 222 -2.62 (0.267) -8.79 (0.040) -6.44 (8551.4) 223 -2.10 (0.333) -16.6 _(0.053) -6.42 (156674) 224 -2.10{0.333) -4.30 (0.059) -6.45 (5.03x 1 06 ) 227 -4.21 (0.111) -15.08 (0.007) -6.44 (8.6x 1 08 ) 228 -4.21 (0.111) -16.6 (0.009) -6.43 (7.1 x 107) 229 -2.62 (0.277) -8.68 (0.037) -6.43 (9155.5) 230 -2.25 (0.336) -25.2 (0.024) -6.42 (303.8) 232 -2.10 (0.333) -4.30 (0.059) -6.45 (5.03x 106 ) 235 -2.62 (0.267) -7.93 (0.062) -6.41 (5704.6) 243 -2.10 (0.333) -23.5 (0.017) -6.44 (457221) 249 -2.10 (0.333) -18.3 (0.023) -6.44 (319138) 252 -2.10 (0.333) -18.3 (0.026) -6.43 (107011) 254 -2.62 (0.267) -4.46 (0.090) -6.43 (5629.6) 255 -2.10 (0.333) -4.31 (0.069) -6.42 (2.1 x 1 07) 258 -4.21 (0.111) -18.8 (0.009) -6.42 (3.1 x 1 06 ) 260 -2.62 (0.267) -8.79 (0.045) -6.43 (8114.4) 121 261 -6.66 (0.105) -17.16 (0.020) -6.43 (788) 270 -2.62 (0.267) -7.93 (0.052) -6.43 (6378.6) 272 -2.62 (0.277) -10.34 (0.038) -6.43 (7204.2) 277 -2.62 (0.277) -10.34 (0.038) -6.43 (7204.2) 279 -2.10(0.333) -3.95 (0.089) -6.41 (5. 7x 1 06 ) 280 -2.10 (0.333) -4.33 (0.065) -6.43 (3 .2x 1 07 ) 293 -2.52 (0.308) -20.6 (0.043) -6.38 (7.7xI07 ) 294 -4.21 (0.112) -16.6 (0.007) -6.45 (1.6x 1 06 ) 300 -2.10(0.333) -4.48 (0.064) -6.42 (15580.6) 304 -2.10 (0.335) -3.28 (0.087) -6.44 (5.08x 1 06 ) 311 -2.62 (0.267) -8.79 (0.054) -6.41 (7373.4) 313 -2.10 (0.336) -23.5 (0.023) -6.41 (10612.3) 314 -3 .1 5 (0.259) -16.04 (0.090) -4.14 (81576.3) 315 -2. 10 (0.333) -4.41 (0.059) -6.44 (5.03x 1 06 ) 317 -1.05 (0.555) -85.2 (0.081) -4.14 (3.9x 108 ) 320 -2.62 (0.267) -7.43 (0.039) -6.44 (10919.8) 321 -2.1 0 (0.333) -3.95 (0.089) -6.41 (5.7x 1 06 ) 325 -2.62 (0.267) -8.79 (0.040) -6.44 (8551.4) 326 -2.62 (0.267) -7.63 (0.085) -6.41 (6561.8) 330 -2.62 (0.267) -7.63 (0.085) -6.41 (6496) 332 -2.33 (0.300) -4.94 (0.072) -6.4 1 (22081.2) 333 -2.33 (0.309) -6.50 (0.042) -6.44 (8844) 338 -2.62 (0.366) -9.34 (0.084) -6.37 (4548.4) 343 -4.21 (O. ll l) -23.5 (0.006) -6.44 (7.2x 108 ) 349 -4.21 (O.lll) -3141 (0.0004) -6.42( 1.09x 1 0 11 ) 365 -2.10 (0.333) -18.3 (0.026) -6.43 (107011) 371 -2.10 (0.333) -4.33 (0.065) -6.43 (3.3x 1 07 ) 373 -2.10 (0.342) -18.3 (0.023) -6.44 (3992.7) 377 -2.1 0 (0.333) -4.48 (0.054) -6.44 (9.6x 1 06 ) 378 -2.1 0 (0.335) -20.5 (0.027) -6.41 (7719.2) 382 -2.74 (0.256) -26.4 (0.020) -6.41 (556.4) 383 -2.10 (0.333) -25.8 (0.033) -6.42 (23093 1 ) 384 -2.62 (0.267) -3.55 (0.092) -6.44 (4836.2) 385 -2.10 (0.342) -4.07 (0.064) -6.44 (2.4x 1 06 ) 401 -2.62 (0.267) -5032.1 (0.001) -6.44 (288800) 404 -2.10 (0.342) -4.07 (0.064) -6.44 (2.4x 1 06 ) 420 -2.62 JO.267) -7.93 (0.062) -6.41 (5793.6) 421 -2.62 (0.366) -9.34 (0.084) -6.37 (4548.4) 426 -2.62 (0.267) -4.4610.083) -6.44 (5933.2) 436 -2.10 (0.333) -3.95 (0.086) -6.42 (2.1 x 1 08 ) 438 -2.1 0 (0.333) -18.3 (0.026) -6.43 (10701 1) 450 -2.62 (0.267) -7.63 (0.066) -6.44 (7607.1) 451 . -2.1 0 (0.333) -21.6 (0.020) -6.44 (455959) 455 -2.37 (0.355) -7.65 (0.064) -6.37 (37601) 456 -2.37 (0.356) -8.28 (0.050) -6.37 (1.5x 1 06 ) 459 -2.10 (0.342) -4.07 (0.064) -6.44 (2.4x 1 06 ) 460 -2.62 (0.267) -7.93 (0.062) -6.41 (5704.6) 465 -2.62 JO.277) -1 0.3 (0.038) -6.43 (7204.2) 476 -2.62 (0.267) -4.46 (0.083) -6.44 (5933.2) 477 -2.62 (0.267) -7.43 (0.043) -6.43 (10363.6) 484 -2.56 (0.333) -7.17 (0.056) -6.37 (36173.4) 492 -2.62 (0.277) -9.34 (0.055) -6.41 (5068.3) 493 -2.62 (0.267) -8.79 (0.058) -6.41 (7087.3) 494 -2.62 (0.267) -8.79 (0.040) -6.44 (8551.4) 122 503 -2.10(0.333) -3.28 (0.089) -6.44 (6.7x 1 06 ) 508 -2.10 (0.336) -23.5 (0.023) -6.41 (1 0612.3) rorf6 Negative sites 73 -5.60 (0.079) -3.07 (0.069) -4.16 (O) 122 -6.82 (0.053) -24.09 (0.005) -4.16 (O) escJ Negative sites 18 -2.73 (0.333) -8.10 (0.089) -6.65 (4786.8) 29 -2.73 (0.333) -4.21 (0.063) -6.74 (2376.8) 47 -2.73 (0.333) -18.4 (0.015) -6.65 (910 12.4) 48 -2.73 (0.333) -2.30 (0.091) -6.77 (8.9x 106 ) 58 -2.73 (0.333) -7.46 (0.036) -6.74 (3448.2) 69 -2.73 (0.333) -4.21 {0.059) -6.76 (900641) 71 -5.47 (0.111) -10.2 (0.011) -6.74 (4.04x 106 ) 78 -3.36 (0.271) -3.43 (0.099) -6.72 (47139.3) 79 -2.73 (0.333) -4.12 (0.047) -6.79 (3. 9x 106 ) 87 -5.66 (0.192) -14.8 (0.057) -6.61 (20145.9) 90 -3.36 (0.271) -3.95 (0.083) -6.71 (44633.4) 91 -2.73 (0.333) -4.21 (0.046) -6.79 (2.5xl06 ) 92 -5.47(0.111 ) -37.1 (0.00 1) -6.79 (1.2x I 0 13 ) 98 -2.73 (0.354) -4.12(0.061) -6.72 (4.lxI06 ) 104 -2.73 (0.333) -9.49 (0.046) -6.76 (25604.7) 114 -4.33 (0.210) -5.93 (0.081) -6.65 (16626.5) 121 -3.13 (0.291) -25.7 (0.087) -6.63 (10877.2) 122 -5.47 (0.111) -37.1 (0.00 1) -6.79 (1.2x 10 13) 137 -5.66 (0.192) -11.3 (0.067) -6.61 (14266.3) 140 -2.73 (0.333) -8.39 (0.028) -6.79 (1.8x 106 ) 143 -2.73 (0.333) -8.38 (0.029) -6.76 (3.4xI06 ) 158 -5.47 (0.122) -17.0 I (0.002) -6.73 (1.2x 1 06 ) 165 -3.85 (0.247) -349.8 (0.006) -6.61 (7.6x 1 07 ) 169 -3.36 (0.271) -5.51 (0.089) -6.69 (68162) 170 -5.47 (0.111) -35.09 (0.007) -6.65 (1.2x 10 11) r- rorf8 Negative sites 73 -5.69 (0.046) -13.3 (0.020) -5.69(13) 78 -5.69 (0.046) -116.2 (0.006) -8.90 (21.4) 120 -5.69 (0.040) -186.3 (0.006) -8.95 (23.9) sepZ Negative sites 7 -1.25 (0.193) -5.22 (0.020) -0.90 (1070.3) 14 -1.45 (0.111) -1.63 (0.028) -0.86 (1654.3) 16 -1.45 (0.111) -1.63 (0.032) -0.85 (170.2) 27 -1.25 (0.207) -0.92 (0.092) -0.88 (565.2) 37 -1.45 (0.114) -1.60 (0.036) -0.84 (373.1) 56 -2.18 (0.037) -6.76 (0.003) -0.85 (152.7) 57 -0.72 (0.333) -1.17 (0.090) -0.85 (164.7) 61 -0.72 (0.336) -1.17 (0.095) -0.85 (205.2) 62 -1.84 (0.069) -1.86 (0.015) -0.89 (1391.2) 66 -2.51 (0.043) -2.75 (0.031) -0.86 (2693.3) 78 -1.21 (0.208) -3.73 (0.009) -0.85 (488.1) 79 -1.45 (0.115) -3.71 (0.044) -0.84 (187.9) 80 -1.84 (0.069) -1.21 (0.056) -0.89 (1 190) 84 -0.72 (0.333) -1.45 (0.076) -0.86 (246.8) 85 -0.60 (0.458) -1.48 (0.080) -0.85 (232.9) 93 -1.45 (0.111) -1.54 (0.035) -0.85 (449.3) orfl2 Negative sites 8 -5.72 (0.078) -17.0 I (0.025) -5.30 (1979.7) 123 -- 9 -2.39 (0.333) -11.6 (0.044) -5.29 (265.7) 10 - -2.86 (0.287) -4.60 (0.066) -5.31 (6298.3) 11 -2.86 (0.287) -3.87 (0.077) -5.31 (7555.3) 25 -2.86 (0.279) -3.90 (0.070) -5.30 (1803.6) 27 -2.39 (0.333) -16.08 (0.017) -5.29 (105.9) 33 -2.39 (0.333) -14.2 (0.014) -5.35 (7455.3) 39 -2.86 (0.287) -4.60 (0.066) -5.31 (6298.3) 48 -2.39 (0.333) -2.24 (0.078) -5.36 (120499) 50 -4.79 (0.111) -3.002 (0.044) -5.38 (84654.1) 56 -2.86 (0.279) -3.90 (0.070) -5.30 (1803.6) 57 -2.39 (0.333) -3.17 (0.048) -5.38 (102728) 59 -2.86 (0.279) -3.90 (0.099) -5.26 (599.5) 68 -2.86 (0.287) -6.0 I (0.049) -5.31 (4848.3) 69 -2.25 (0.355) -5.90 (0.059) -5.34 (99677.9) 72 -2.39 (0.340) -2.47 (0.079) -5.34 (77421.6) 77 -2.61 (0.306) -3.39 (0.092) -5.28 (653) 82 -5.72 (0.078) -4.14 (0.060) -5.30 (1619.3) 95 -2.39 (0.333) -10.9 (0.054) -5.29 (318) 103 -2.86 (0.388) -6.21 (0.085) -5.25 (10488) 110 -2.86 (0.287) -6.01 (0.049) -5.31 (4848.3) 111 -2.25 (0.459) -4.44 (0.088) -5.28 (44749.5) ese V Negative sites 34 -4.79 (0. 159) -13 (0.037) -7.13 (6248.9) 47 -9.71 (0.030) -42.8 (0.006) -7.18 (9800.4) 50 -5.05 (0.111) -29.4 (0.013) -7.21 (672508) 65 -3.43 (0.256) -16.5 (0.029) -7.19 (851 1.8) 69 -3.43 (0.244) -12.2 (0.036) -7.18 (11291.6) 70 -5.05 (0.111) -1 3.6 (0.008) -7. 19 (1 .9x 1 06 ) 87 -2.52 (0.333) -7.16 (0.052) -7.20 (95822.8) 112 -3.43 (0.244) -6.48 (0.076) -7.19 (2714.4) 121 -5.05 (0.111) -14.8 (0.007) -7.20 (735292) 126 -2.52 (0.333) -28.8 (0.030) -7. I 7 (174123) 135 -2.52 (0.333) -6.12 (0.046) -7.21 (2.5xI06 ) 145 -3.43 (0.244) -6.48 (0.083) -7.18 (2590.5) 147 -2.06 (0.407) -8.05 (0.090) -7.15 (46111.3) 153 -3.43 (0.256) -16.5 (0.030) -7.18 (8374.1) 167 -3.43 (0.244) -12.2 (0.031) -7.19 (11818.5) f- 180 -3.43 (0.256) -5.76 (0.079) -7.18 (2122.4) 184 -3.43 (0.244) -6.48 (0.083) -7.18 (2590.5) 201 -5.05 (0.111) -6.44 (0.044) -7.21 (2.5xI06 ) 204 -2.91 (0.289) -7.50 (0.085) -7.18 (15344.6) 210 -3.22 (0.280) -31.02 (0.022) -7.13 (67944.1) 214 -2.52 (0.333) -7.10(0.070) -7.17 (6590.7) 217 -5.05 (0. 116) -29.4 (0.014) -7. 19 (57160.4) 236 -2.52 (0.337) -11.9 (0.040) -7.19 (1 1047.8) 240 -2.52 (0.333) -3 .57 (0.089) -7.21 (2.2x 1 06 ) 241 -3.25 (0.284) -126.7 (0.026) -7.13 (218312) 251 -5.05 (0. 11 1) -6.44 (0.049) -7.19 (5.2x 106 ) 252 -2.52 (0.333) -4.85 (0.095) -7.17 (36913.4) 253 -2.52 (0.333) -6.12 (0.047) -7.20 (2.2x I 06 ) 254 -2.52 (0.333) -4.65 (0.086) -7.21 (3.9x 106 ) 255 -2.52 (0.333) -21.5 (0.032) -7. 1 9 (47964.3) 256 -5.05 (0.111) -26 (0.032) -7.17 (4621 1.3) 26 1 -2.52 (0.333) -26.5 (0.019) -7.17 (4403.1) 124 273 -2.52 (0.333) -11.9 (0.040) -7.19 (6016. I ) 285 -2.52 (0.333) -11.9 (0.039) -7.19 (184639) 292 -2.65 (0.372) -23.5 (0.021) -7.12(31691.4) 300 -2.52 (0.333) -26.5 (0.015) -7.19 (1.2 x106 ) 311 -2.52 (0.333) -7.10 (0.051) -7.21 (155706) 316 -2.52 (0.333) -26.5 (0.016) -7.19 (54092.7) 317 -6.34 (0.070) -38.5 (0.006) -7.18 (9945.4) 322 -6.87 (0.105) -16.5 (0.044) -7.15 (8003.8) 323 -3.43 (0.256) -5.76 (0.079) -7.18 (2122.4) 333 -3.43 (0.256) -5.76 (0.079) -7.18 (2122.4) 334 -6.87 (0.059) -14.4 (0.028) -7.19(12168.1) 341 -2.52 (0.337) -11.9 (0.040) -7.19 (1 1047.8) 343 -6.87 (0.059) -1 1.8 (0.049) -7.21 (9379.7) 345 -3.43 (0.244) -12.2 (0.032) -7.19 (11672.9) 347 -2.52 (0.355) -7.16 (0.061) -7.18 (10465.4) 349 -5.05 (0.111) -7.19 (0.095) -7.19 (3.8 xl06 ) 350 -2.52 (0.333) -4.84 (0.083) -7.21 (2.7 x106 ) 352 -5.05 (0.111) -5.6 (0.063) -7.19 (3.9 xl06 ) 363 -6.87 (0.059) -14.3 (0.023) -7.21 (12884.3) 365 -3.43 (0.244) -12.2 (0.031) -7.19 (11818.5) 369 -6.87 (0.105) -16.5 (0.044) -7.15 (8024.3) 372 -2.52 (0.333) -6.12 (0.065) -7.17 (505414) 379 -3.43 (0.256) -5.76 (0.076) -7.19 (2194.7) 392 -5.05 (0.111) -5.67 (0.064) -7.19 (4.2 xl06 ) 398 -3.43 (0.244) -3.39 (0.099) -7.21 (2529.7) 413 -2.52 (0.333) -11.9 (0.036) -7.20 (99349.3) 414 -2.06 (0.407) -8.05 (0.090) -7.15 (46111.3) 419 -2.52 (0.333) -6.12 (0.065) -7.17 (505414) 422 -3.43 (0.256) -5.76 (0.076) -7. 19 (2 194.7) 423 -2.52 (0.333) -3.57 (0.089) -7.21 (2.2 xl06 ) 425 -3.43 (0.244) -6.48 (0.084) -7.18 (2630.9) 430 -3.43 (0.244) -12.2 (0.036) -7.18 (11291.6) 431 -3.43 (0.256) -5.81 (0.076) -7.19 (2197.3) 436 -3.43 (0.256) -5.76 (0.079) -7.18 (2122.4) 443 -5.05 (0.111) -5.69 (0.078) -7.17 (54577.4) 445 -3.43 (0.256) -16.5 (0.030) -7.18 (8374.1) 450 -3.43 (0.244) -14.1 (0.054) -7.19 (8673.5) 452 -6.87 (0.105) -160.7 (0.003) -7.15 (1.4 X 106 ) 461 -2.52 (0.333) -11.9 (0.049) -7.17 (6877.7) 467 -6.87 (0.059) -14.4 (0.028) -7.19 (12168.1) 470 -2.52 (0.333) -3.20 (0.098) -7.20 (9704.4) 480 -3.43 (0.244) -6.48 (0.076) -7.19 (2714.4) 490 -2.52 (0.333) -7.10(0.052) -7.20 (10436.9) 499 -5.82 (0.086) -9.35 (0.039) -7.20 (8379.3) 503 -6.87 (0.065) -16.5 (0.029) -7.19 (8686.5) 507 -3.43 (0.256) -5.76 (0.076) -7.19 (2194.7) 508 -4.64 (0.131) -12.9 (0.030) -7.15 (272992) 516 -6.87 (0.065) -16.5 (0.030) -7.18 (8547.7) 518 -5.05 (0.111) -29.4 (0.010) -7.17 (98017.2) 519 -6.87 (0.059) -11.8 (0.056) -7.19 (8884.7) 520 -2.91 (0.289) -114.9 (0.011) -7. 18 (1 02464) 521 -2.32 (0.362) -12.8 (0.052) -7.15 (299477) 522 -3.43 (0.324) -16.5 (0.045) -7.15 (7842.4) 523 -3.43 (0.346) -8.5 (0.058) -7.18 (11367.8) 125 533 -3.43 (0.244) -164.2 (0.004) -7.19 (67312.2) 534 -3.34 (0.253) -9.75 (0.050) -7. 14 (1 74475) 537 -5.82 (0.083) -6.87 (0.087) -7.18 (15532.1) 539 -6.87 (0.065) -16.5 (0.029) -7.19 (8686.5) 540 -2.52 (0.333) -3.20 (0.098) -7.20 (9704.4) 545 -5.05 (0.119) -24.1 (0.030) -7.18 (93871.8) 549 -3.43 (0.256) -16.5 (0.030) -7.18 (8374.1) 1-- 560 -5.82 (0.083) -84.7 (0.083) -7.18 (488981) 571 -3.43 (0.244) -3.39 (0.099) -7.21 (2529.7) 575 -2.52 (0.333) -7.16 (0.052) -7.20 (95822.8) 578 -3.43 (0.244) -12.2 (0.032) -7.19 (11672.9) 579 -5.05 (0.111) -6.44 (0.062) -7.17 (505190) 582 -3.69 (0.227) -19.4 (0.033) -7.18 (472.2) 590 -4.79 (0.169) -7.97 (0.072) -7.12 (57247.9) 606 -2.52 (0.355) -7. 16 (0.061) -7.18 (10465.4) 608 -3.43 (0.256) -5.76 (0.076) -7.19 (2194.7) 613 -8.25 (0.04 1) -41.1 (0.015) -7.20 (1559.8) 620 -5.82 (0.083) -6.87 (0.087) -7.18 (15532.1) 626 -11 .8 (0.059) -11.8 (0.058) -7.19 (8782.7) 650 -2.52 (0.333) -4.85 (0.095) -7.17 (36913.4) 657 -3.43 (0.256) -16.5 (0.029) -7.19 (8533.7) 659 -2.52 (0.333) -7.10 (0.058) -7.19 (5697.5) 664 -2.06 (0.059) -8.05 (0.063) -7.15 (46 111.3) 673 -6.87 (0.059) -11.85 (0.063) -7.18 (8500) e3cN Negative sites 22 -2.33 (0.333) -3 .88 (0.085) -6.52 (4.17xl07 ) 31 -2.33 (0.333) -3.88 (0.096) -6.51 (2.05xl07 ) 32 -2.33 (0.333) -5.19 (0.080) -6.52 (397875) 48 -2.33 (0.333) -8.77 (0.060) -6.51 (8294 14) 53 -2.33 (0.333) -8.77 (0.060) -6.51 (829414) 56 -2.33 (0.333) -4.28 (0.096) -6.51 (1.17x 1 08 ) 59 -6.14 (0.075) -93.31 (0.003) -6.51 (1.58x 1 0 16 ) 68 -2.33 (0.333) -4.79 (0.072) -6.51 (2.84x 1 09 ) 81 -2.72 (0.332) -6.58 fO.072) -6.50 (7 .69x 1 06 ) \ 90 -3.07 (0.275) -9.02 (0.055) -6.51 (1.26x 1 08 ) 92 -4.67 (0.111) -15.59 (0.010) -6.51 (2.97x 1 07 ) 99 -4.67 (0.113) -7 1.05 (0.0 10) -6.51 (1.89x 10 15) 107 -4.67 (0.112) -14.06 (0.01 0) -6.51 (3.01 x 1 07 ) 110 -2.76 (0.31 6) -19.79 -<0.035) -6.50 (4.43xI07 ) 114 -2.17 (0.357) -17.20 (0.040) -6.50 (2.69x 1 06 ) 11 7 -2.33 (0.333) -4.28 (0.096) -6.51 (1.17x 1 08 ) 120 -2.65 (0.302) -4.66 (0.074) -6.52 (7573.2) r- -3.07 (0.253) -8.29 (0.071) -6.52 (14786.3) 124 128 -3.50 (0.259) -14.41 (0.092) -5.99 (6.43x 1 07 ) 136 -3.07 (0.253) -8.91 (0.050) -6.52 (25542.9) 139 -2.33 (0.333) -15.08 (0.035) -6.51 (907006) 141 -2.33 (0.333) -22.50 (0.027) -6.51 (6.15x I 06 ) 142 -2.33 (0.333) -22.50 (0.027) -6.51 (6.15x 1 06 ) 157 -2.33 . (0.333) -5.19 (0.090} -6.51 (15181) 161 -2.85 (0.273) -38.73 (0.008) -6.51 (2921) 163 -2.33 (0.333) -19.85 (0.027) -6.51 (47979.5) 164 -2.98 (0.3051 -6.64 (0.068) -6.50 (3.91 xl 06 ) 165 -2.04 (0.379) -10.50 (0.064) -6.50 (1.61 x 1 06 ) 171 -3.07 (0.339) -12.13 (0.052) -6.50 (23655.9) 126 176 -3.07 (0.253) -8.29 (0.087) -6.51 (13934.5) 177 -2.33 (0.333) -26.83 (0.014) -6.51 (7 .14x 106 ) 178 -2.33 (0.333) -26.83 (0.015) -6.51 (105912) 179 -2.33 (0.338) -19.84 (0.015) -6.5 1 (1 05912) 188 -2.33 (0.334) -5.21 (0.069) -6.51 (1.17x 1 08 ) 195 -2.33 (0.339) -5.19 (0.092) -6.51 (32743.7) 196 -2.33 (0.333) -4.19 (0.088) -6.51 (9.14x107 ) 206 -3.07 (0.264) -11.15 (0.052) -6.51 (14011.9) 217 -2.33 (0.333) -15.40 (0.036) -6.50(5.34x 1 0 11 ) 226 -3.07 (0.264) -7.60 (0.063) -6.51 (20291.4) 227 -2.33 (0.333) -72.51 (0.043) -6.51 (1. 19x 1 07 ) 232 -2.33 (0.333) -8.77 (0.055) -6.51 (36423.5) 235 -2.33 (0.333) -4.76 (0.084) -6.51 (1.04x 1 08 ) 237 -2.33 (0.333) -8.77 (0.060) -6.51 (829414) 240 -2.65 (0.303) -6.58 (0.055) -6.52 (13955.9) 242 -3.07 (0.264) -12.61 (0.029) -6.51 (26781.1) 248 -2.33 (0.333) -4.43 (0.076) -6.52 (10 1 061) 251 -2.33 (0.333) -10.23 (0.053) -6.51 (895735) 255 -2.12 (0.365) -8.30 (0.093) -6.51 (69540.8) 257 -3.07 (0.339) -11.15 (0.074) -6.50 (13251.6) 258 -4.67 (0.111) -15.59 (0.010) -6.51 (2.9x 1 07 ) 266 -3.07 (0.253) -7.60 (0.065) -6.51 (9622.8) 274 -2.33 (0.333) -5.19 (0.086) -6.51 (793265) 275 -4.67 (0.111) -71.05 (0.009) -6.51 (1.62x 1 0 16 ) 284 -6.14 (0.069) -124.86 (0.001) -6.51 (1.51 x 1 08 ) 285 -2.33 (0.333) -15.08 (0.039) -6.51 (915450) 288 -2.65 (0.294) -7.55 (0.041) -6.52 (24344) 297 -4.67 (0.111) -5.76 (0.054) -6.51 (4.07xl08 ) 305 -2.28 (0.357) -13.28 (0.042) -6.51 (140103) 307 -4.67 (0.116) -13.80 (0.011) -6.51 (3.01 xl 07 ) 312 -2.33 (0.333) -15.08 (0.036) -6.51 (18289.6) 315 -2.33 (0.333) -4.79 (0.066) -6.52 (2.1 Ox 1 08 ) 321 -3.05 (0.264) -16.98 (0.031). -6.50 (1.89x 1 06 ) 325 -3.07 (0.253) -7.60 (0.065) -6.51 (9622.8) 327 -2.33 (0.333) -26.83 (0.017) -6.51 (142604) 330 -4.67 (0.111) -5.76 (0.057) -6.51 (1.29x 1 0 10 ) 331 -5.30 (0.86) -7.28 (0.041) -6.51 (70702.1) 332 -2.33 (0.333) -4.79 (0.075) -6.51 (4.66xI07 ) 335 -2.33 (0.333) -4.79 (0.084) -6.51 (1.25x 1 08 ) 341 -2.33 (0.334) -5.21 (0.069) -6.51 (1.17xl08 ) 342 -3.07 (0.253) -9.02 (0.052) -6.51 (17908) 343 -6.45 (0.058) -17.40 (0.008) -6.51 (42167.7) 346 -2.33 (0.333) -5.19 (0.080) -6.52 (397875) 363 -6.14 (0.064) -11. 72 (0.024) -6.52 (37010.1) 375 -3.07 (0.264) -11.10 (0.047) -6.51 (14516.5) 379 -2.33 (0.333) -5.21 (0.066) -6.51 (3.87x 1 08 ) 381 -2.33 (0.333) -23.51 (0.023) -6.51 (6.39x 1 06 ) 391 -3.07 (0.264) -12.61 (0.029) -6.51 (26781.1) 394 -3.07 (0.264) -12.13 (0.035) -6.51 (25060.3) 410 -2.33 (0.333) -4.19 (0.088) -6.51 (9.14xl07 ) 413 -2.33 (0.333) -10.23 (0.053) -6.51 (895735) 416 -6.14 (0.064) -11.72 (0.028) -6.52 (36033.3) 417 -2.65 (0.296) -4.28 (0.078) -6.52 (7423.1) 420 -2.65 (0.293) -4.83 (0.079) -6.51 (19506.9) 127 427 -3.07 (0.253) -3.41 (0.095) -6.52 (8278.7) orfl5 Negative sites 66 -5.27 (0.075) -15.14 (0.023) -3.87 (O) 113 -5.27 (0.068) -10.69 (0.024) -3.87 (O) orfl6 Negative sites 131 -5 .05 (0.043) -6.36 (0.018) -2.68 (7.8) sepQ Negative sites 13 -4.47 (0.060) -3.37 (0.042) -4.25 (3.5) 62 -4.47 (0.060) -3.37 (0.049) -4.24 (3.3) 200 -4.47 (0.66) -3.37 (0.038) -4.24 (3.7) 237 -4.97 (0.037) -26.81 (0.007) -5.61 (8.5) 248 -5.66 (0.055) -40.04 (0.026) -5.87 (4.9) 262 -4.47 (0.060) -1386.65 (0.001) -5.66 (9.6) 264 -4.45 (0.061) -11.88 (0.009) -5.33 (6.6) 284 -5.94 (0.092) -44.81 (0.015) -4.11 (3.4) espH Negative sites 58 -0.001 (0.065) -8.94 (0.083) -0.0005 (6.5) cesF Negative sites 3 -1.92 (0. 164) -0.74 (0.020) -1.42 (150.4) 8 -1.08 (0.275) -0.22 (0.048) -1.42 J 171.2) 13 -1.08 (0.274) -0.22 (0.048) -1.43 (176) 19 -1.39 (0.226) -0.12 (0.092) -1.42 (113.6) 21 -0.89 (0.333) -0.98 (0.015) -1.45 (110 1 ) 24 -1.65 (0.129) -O. 14{0.034) -1.43 (294.9) 26 -1.18(0.251) -0.074 (0.097) -1.43 (212.6) 27 -2.20 (0.073) -0.39 (0.009) -1.44 (858) 28 -1.07 (0.276) -0.36 (0.047) -1.42 (172.8) 30 -1.07 (0.276) -0.36 (0.047) -1 .42 (172.8) 33 -1.63 (0.193) -0.20 (0.054) -1.42 (129.1) 37 -1.37 (0.229) -0.14 (0.087) -1.42 (116.4 ) 42 -0.89 (0.350) -0.22 (0.022) -1.44 (516.2) 43 -1.90 (0.166) -0.60 (0.025) -1.42 (148.8) 55 -1.93 (0.162) -0.98 (0.016) -1.42 (152.7) 66 -1.08 (0.275) -0.36 (0.051) -1.42 (192) 77 -1.08 (0.302) -0.29 (0.036) -1.41 (62.7) 87 -1.08 (0.275) -0.36 (0.051) -1.42 (192) 90 -2.53 (0.055) -0.33 (0.0 12) -1.43 (237.8) 91 -0.89 (0.333) -0.04 (0.085) -1.46 (5198.9) 94 -1.90 (0.1 62) -0.60 (0.023) -1.42 (165.9) 97 -1.18 (0.250) -0.31 (0.025) -1.42 (1 13.5) 98 -0.89 (0.333) -0.09 (0.052) -1.45 (958.5) 99 -1.58 (0.1 99) -0.20 (0.059) -1.42 (127.5) 100 -1.08 (0.275) -0.36 (0.039) -1.43 (117) 106 -1.08 (0.275) -0.36 (0.051) -1.42 (192) 107 -0.89 (0.342) -0.22 (0.045) -1 .42 (207.5) 111 -1.58 (0.195) -0.20 (0.055) -1.42 (141.7) 11 3 -1.92 (0.164) -0.74 (0.020) -1.42 (150.4) 115 -1.18 (0.250) -0.3 I (0.025) -1.42 (1 13.5) map Positive sites 181 3.61 (0.080) 3.77 (0.100) 1.48 (155.7) Negative sites 24 -3.78 (0.037) - I 0.65 (0.010) -2.13 (32.8) 125 -3.67 (0.052) -45.08 (0.008) -2.12 (25.5) 134 -3.67 (0.052) -4.87 (0.042) -2.13 (39.7) 136 -3.67 (0.052) -4.83 (0.064) -2.09 (16.2) 128 149 -3.67 (0.058) -230.9 (0.005) -2.15 (49.1) tir Positive sites 441 1.73 (0.094) , 0.81 (0.060) -0.32 (0.8) Negative sites 5 -1.13 (0.181) -5.51 (0.013) -0.95 (3098) 7 -0.71 (0.333) -0.71 (0.061) -0.91 (1674.7) 8 -1.01 (0.329) -2.68 (0.093) -0.50 (54) 17 -2.13 (0.037) -5.67 (0.002) -0.90 (555.5) 23 -0.71 (0.333) -5.68 (0.053) -0.90 (1400.9) 37 -1.36 (0.120) -0.90 (0.027) -0.91 (3742.5) 40 -0.71 (0.336) -2.02 (0.042) -0.091 (4747.1) 42 -1.42 (0.125) -1.40 (0.017) -0.91 (493.8) 45 -0.71 (0.3589 -0.54 (0.091) -0.91 (1735.8) 49 -1.79 (0.089) -1.22 (0.024) -0.90 (1878.6) 54 -0.91 (0.265) -0.61 (0.063) -0.95 (10594.6) "- 62 -1.30 (0.181) -2.12 (0.032) -0.93 (1334.4) 64 -2.16 (0.047) -4.38 (0.007) -0.089 (242.4) 69 -1.42 (0.111) -1.23 (0.021) -0.90 (1065.2) 81 -1.42 (0.111) -5.92 (0.005) -0.089 (105.7) 83 -1.42 (0.113) -5.09 (0.004) -0.91 (3820.6) 92 -1.30 (0.096) -5.70 (0.024) -0.93 (1570.6) 94 -0.71 (0.333) -0.65 (0.073) -0.92 (9414.1) 98 -1.42 (0.112) -2.13 (0.010) -0.91 (6 19.4) 100 -0.71 (0.333) -0.48 (0.095) -0.92 (9237.4) 103 -2.04 (0.041) -1.43 (0.014) -0.91 (3397.6) 104 -1.30 (0.181) -0.84 (0.051) -0.95 (4723.1) 112 -1.30 (0.181) -2.85 (0.012) -0.96 (62530.2) 113 -0.68 (0.354) -0.60 (0.087) -0.91 (5327.3) 120 -0.71 (0.333) -0.71 (0.061) -0.91 (1674.1) 126 -1.42 (0.112) -2.14 (0.009) -0.91 (614.7) 130 -0.71 (0.333) -0.71 (0.061) -0.91 (1674.1) 141 -1.30 (0.196) -1.17 (0.045) -0.93 (1899.4) 146 -1.30 (0.221) -1.17 (0.048) -0.92 (10773.1) 149 -1.30 (0.181) -5.51 (0.015) -0.93 (1142.9) 151 -1.30 (0.196) -5.71 (0.024) -0.93 (1553) 157 -0.71 (0.333) -0.64 (0.083) -0.92 (772.5) 158 -1.30 (0.181) -5.50 (0.013) -0.96 (65108.7) 162 -0.71 (0.333) -0.68 (0.062) -0.92 (10107.8) 163 -0.71 (0.333) -0.68 (0.073) -0.91 (1814.8) 164 -0.71 (0.333) -0.71 (0.061) -0.91 (1674.) 171 -1.42 (0.111) -2.08 (0.012) -0.92 (374.6) 172 -0.71 (0.333) -0.68 (0.072) -0.92 (1521.3) 173 -0.71 (0.333) -0.68 (0.087) -0.90 (2 1 7.7) 180 -0.71 (0.333) -0.48 (0.096) -0.92 (11277.1) 232 -1.42 (0.113) -5.69 (0.006) -0.91 (4289.4) 233 -1.30 (0.181) -0.56 (0.068) -0.96 (14208.9) 235 -0.71 (0.333) -0.66 (0.074) -0.92 (1 1 127. 1 ) 251 -1.79 (0.083) -0.90 (0.032) -0.90 (2302.4) 255 -1.42 (0.111) -3.09 (0.006) -0.89 (136.1) 256 -1.42 (0.111 ) -5.23 (0.019) -0.90 (192) f-- 257 -1.42 (0.111) -5.24 (0.015) -0.92 (507.4) 258 -0.71 (0.333) -2.01 (0.333) -0.91 (591.2) 264 -1.42 (0.111) -1.54 (0.017) -0.90 (1 55. 1 ) 266 -1.42 (0.111) -1.41 (0.015) -0.92 (393.9) 267 -1.42 (0.111) -1.07 (0.024) -0.90 (1953.8) 129 272 -0.71 (0.333) -0.64 (0.093) -0.90 (1376.7) 274 -1.42 (0.111) -0.93 (0.022) -0.92 (503.5) 276 -1.30 (0. 18 1) -0.84 (0.057) -0.93 (1661.9) 280 -1.42 (0.111) -1.02 (0.027) -0.90 (16 1. 5) 282 -1.01 (0.329) -2.68 (0.078) -0.50 (92.4) 295 -1.30 (0. 196) -5.70 (0.024) -0.93 (1570.6) 296 -1.42 (0.111) -1.07 (0.025) -0.90 (310.3) 299 -1.30 (0. 181) -0.56 (0.073) -0.95 (5482.3) 300 -0.71 (0.333) -0.64 (0.093) -0.90 (1376.7) 302 -2.61 (0.032) -4.76 (0.004) -0.95 (2389.7) -- 303 -1.30 (0.221) -0.87 (0.062) -0.92 (12407.2) 306 -2.61 (0.032) -0.90 (0.044) -0.95 (4520) -- 313 -1.42 (0.11 1) -5.37 (0.010) -0.90 (172.7) 316 -2.13 (0.040) -5.38 (0.002) -0.90 (1959.8) 319 -1.26 (0.1 83) -1.01 (0.024) -0.90 (2596.7) 330 -2.61 (0.048) -5.86 (0.003) -0.92 (5055.6) 334 -1.42 (0.111) -5.26 (0.01 1) -0.90 (174.8) 335 -0.71 (0.333) -0.49 (0.096) -0.91 (1882) 336 -1.30 (0.1 96) -5.71 (0.024) -0.93 (1553) 345 -2.32 (0.086) -0.77 (0.214) -0.51 (227.9) 350 -1.30 (0.22 1) -0.87 (0.062) -0.92 (12407.2) 356 -1.30 (0.221) -0.87 (0.062) -0.92 (12407.2) 358 -0.71 (0.333) -0.68 (0.081) -0.90 (460.2) 363 -1.30 (0.196) -1.18 (0.047) -0.93 (1811.2) 369 -0.71 (0.333) -0.56 (0.091) -0.91 (939) 375 -1.30 (0.1 81 ) -5.51 (0.012) -0.96 (8588.1) 377 -0.71 (0.333) -0.54 (0.096) -0.90 (374) 388 -1.42 (0.111) -5.69 (0.006) -0.92 (544.2) 389 -1.42 (0.111) -1.14 (0.018) -0.92 (518.9) 394 -1.37 (0.154) -1.68 (0.014) -0.91 (839.9) 396 -1.30 (0.1 81) -2.85 (0.013) -0.95 (3031 .6) 40 1 -1.30 (0.221) -1.17 (0.047) -0.92 (1 0832.3) 4 12 -1.42 (0.111) -5.93 (0.003) -0.92 (299.9) 424 -1.30 (0.1 81) -2.85 (0.013) -0.95 (3031.6) 427 -0.71 (0.333) -0.54 (0.096) -0.90 (374) 428 -1.30 (0.221) -1.17 (0.048) -0.92 (10773.1) 432 -2.61 (0.032) -4.77 (0.005) -0.93 (877.7) 449 -1.30 (0.181 ) -0.84 (0.047) -0.96 (12112.7) 457 -1.30 (0.1 81) -0.84 (0.057) -0.93 (1661.9) 464 -0.71 (0.333) -0.4 7 (0.098) -0.92 (1506.4) 503 -0.94 (0.249) -7.42 (0.018) -0.95 (2426.3) 504 -1.30 (0.22 1) -1. 17 (0.047) -0.92 (1 0832.3) 514 -1 .42 (0.125) -2. 17 (0.009) -0.91 (596.6) 516 -1.6 1 (0.085) -1.13 (0.025) -0.92 (232.3) 524 -0.7 1 (0.333) -0.73 (0.075) -0.91 (855 .8) 527 -2.61 (0.032) -5.58 (0.002) -0.96 (6125.1) 535 -1.30 (0.181) -0.49 (0.072) -0.96 (14641.4) 536 -1.42 (0. 111) -0.95 (0.025) -0.91 (1548.1) 539 -1.39 (0.118) -1.56 (0.011) -0.91 (3106.2) 548 -1.42 (0.117) -5.24 (0.016) -0.91 (571.9) 554 -1.01 (0.329) -5.16 (0.068) ~0.51 (172.6) cesT Negative sites 26 -7.31 (0.087) -17.53 (0.053) -6.98 (5.3) 83 -7.31 (0.094) -4.89 (0.096) -6.96 (4.8) 130 "k\.f: e.1e Positive sites 858 2.21 (0.225) 1.27 (0.098) 2.11(128.6) 869 . 1.51 (0.428) , 1.11 (0.083) 1.17 (106.2) 884 1.72 (0.315) 0.71 (0.083) 1.21 (458.4) Negative sites 141 -3.92 (0.037) -4.05 (0.005) -5.28 (15.4) 509 -4.20 (0.32) -3.46 (0.007) -4.80 (1 1.8) 553 -3.92 (0.55) -5.04 (0.003) -6.18 (16) 607 -1.02 (0.437) -11.72 (0.0003) -9.89 (61.5) 625 -3.92 (0.042) -5.04 (0.003) -6.19 (17) 667 -4.20 (0.036) -5.01 (0.003) -6.16 (17) 680 -3.92 (0.050) -4.05 (0.008) -5.25 (9.5) 682 -3.42 (0.037) -3.48 (0.005) -5.71 (12.1 ) 690 -3.42 (0.037) -3.48 (0.003) -5.73 (16.4) 694 -3.92 (0.055) -5.04 (0.003) -6.18 (16) 698 -3.92 (0.036) -4.05 (0.005) -5.27 (12.9) 731 -3.42 (0.037) -3.49 (0.004) -5.73 (13.7) 748 -3.42 (0.037) -2.52 (0.0028) -6.73 (21.1) 791 -3.42 (0.038) -2.78 (0.005) -5.28 (11.2) 793 -3.44 (0.098) -4.006 (0.050) -4.81 (1) 837 -4.20 (0.045) -3.46 (0.011) -4.78 (8.4) 917 -3.74(0.086) -4.44 (0.045) -4.44 (1.1) escD Negative sites 214 -6.29 (0.062) -27.21 (0.006) -5.16 (O) 382 -8.43 (0.093) -13.21 (0.029) -5.17 (O) sepL Negative sites 24 -2.40 (0.265) -230.50 (0.010) -5.14 (248542) 27 -4.80 (0.10 1) -8.54 (0.057) -5.15 (13052.7) 39 -3.48 (0.123) -16.73 (0.020) -5.17 (804219) 49 -1.74 (0.333) -3.41 (0.079) -5.20 (2.9x 1 06 ) 53 -1.63(0.425) -21.85 (0.058) -4.29 (2159.7) 70 -1.74 (0.333) -4.44 (0.052) -5.21 (6.4x 1 06 ) 71 -2.40 (0.241) -2.40 (0.092) -5.23 (2920.2) 73 -2.02 (0.290) -2.56 (0.090) -5.22 (1457.3) 78 -3.48 (0.111) -3.67 (0.047) -5.21 (8.4x 1 06 ) 94 -1.61 (0.360) -5.11 (0.075) -5.18 (203813) 99 -2.40 (0.253) -4.08 (0.094) -5.17 (1563.1) 106 -2.40 (0.253) -9.71 (0.055) -5.17 (3860.2) 113 -2.40 (0.318) -9.71 (0.079) -5.15 (3709.9) 119 -1.74 (0.333) -3.30 (0.093) -5.20 (426628) 123 -4.80 (0.058) -6.32 (0.036) -5.19 (14284.1) 126 -4.80 (0.064) -8.54 (0.037) -5.18 (13685.7) 128 -2.40 (0.253) -9.71 (0.052) -5.18 (3947.2) 131 -3.48 (0.111) -8.85 (0.010) -5.20 (2.5x 1 06 ) 137 -2.40 (0.275) -5.73 (0.067) -5.14 (190517) 140 -2.40 (0.253) -15.81 (0.063) -5.17 (5004.1) 141 -2.40 (0.241) -22.89 (0.016) -5.19 (7339.4) 150 -4.80 (0.070) -9.42 (0.034) -5.15 (467582) 160 -2.40 (0.253) -4.08 (0.090) -5 .18 (1616.5) 161 -2.40 (0.241) -22.89 (0.015) -5.19 (7516.3) 166 -1.74 (0.333) -3.17 (0.079) -5.20 (3x 1 06 ) 174 -1.74 (0.333) -6.73 (0.042) -5.21 (6992.8) 177 -2.40 (0.241) -22.89 (0.015) -5.19 (7424.5) 180 -1.74 (0.333) -3.17 (0.075) -5.21 (1.6x 1 06 ) 185 -2.40 (0.253) -5.53 (0.089) -5.17 (3286.6) 131 191 -1.74 (0.333) -4.44 (0.055) -5.20 (3.3x 1 06 ) 199 -1.74 (0.343) -7.06 (0.056) -5.20 (122191) 209 -2.02 (0.287) -4.08 (0.079) -5.18 (3553.5) 213 -3 .48 (0.111) -18.74 (0.003) -5.20 (6.7x 106 ) 216 -2.40 (0.253) -15.81 (0.061) -5.18 (5097.9) 220 -4.80 (0.064) -14.76 (0.016) -5.18 (436679) 221 -1.74 (0.333) -5.05 (0.066) -5.18 (862646) 223 -2.36 (0.246) -13.45 (0.036) -5.1 8 (389.3) 234 -2.61 (0.259) -209.50 (0.043) -4.28 (28284.6) 238 -4.80 (0.058) -6.32 (0.034) -5.19 (14480.3) 239 -4.80 (0.064) -14.76 (0.016) -5.1 8 (436679) 240 -1.74 (0.333) -3.41 (0.098) -5.18 (32943 .9) 245 -2.02 (0.287) -4.08 (0.079) -5.1 8 (3553.5) 247 -2.40 (0.24 1) -11.28 (0.028) -5.23 (11772.6) 251 -3.30 JO. 1231 -56.13 (0.017) -5.20 (9627.1) 261 -2.40 (0.266) -8.15 (0.075) -5.15 (416233) 264 -2.02 (0.287) -4.08 (0.079) -5.18 (3553.5) 268 -1.74 (0.333) -5.82 (0.051) -5.19 (2.5x 1 06 ) 269 -2.36 (0.246) -13.45 (0.036) -5.18 (389.3) 28 1 -3.42 {O. I 59) -12.32 (0.021) -5.1 4 (107896) 282 -1.74 (0.334) -33.17 (0.039) -5.19 (83021.3) 287 -1.74 (0.333) -29.08 (0.067) -5.18 (178682) 289 -2.27 (0.298) -5.49 (0.083) -5. 14 (97100.7) 290 -1.74 (0.333) -4.27 (0.069) -5.20 (84751.1) 294 -3.22{0.160) -32.71 (0.006) -5.15 (194426) 296 -2.40 (0.253) -5.53 (0.085) -5.18 (3559.7) 297 -4.80 (0.058) -9.42 (0.010) -5.23 (1.9x 106 ) 303 -2.36 (0.246) -13.45 (0.036) -5.18 (389.3) 3 13 -2.40 (0.241) -12.71 (0.027) -5.19 (4654.2) 323 -3.48 (0.111) -36.36 (0.001) -5.20 (5.4x I 06 ) 324 -2.40 (0.241) -12.71 (0.026) -5 .19 (4667.8) 326 -2.40 (0.253) -22.27 (0.017) -5.20 (12612.4) 331 -4.80 (0.064) -8.54 (0.035) -5. 18 (13964) 333 -2.02 (0.300) -8.93 (0.038) -5.21 (6104.5) 340 -2.02 (0.287) -4.08 (0.079) -5.1 8 (3553.5) 341 -1.74 (0.336) -6.73 (0.042) -5.21 (7342) 343 -3.48 (0.1 11) -29.13 (0.007) -5.18 (527227) 344 -4.22 (0.075) -52.35 (0.004) -5.19 (30 1627) 345 -2.40 (0.241) -22.27 (0.020) -5.19 (5222.8) espA Negative sites 23 -4. 17 (0.04 1) -4.51 (0.026) -3.18 (8.9) 25 -3.81 (0.038) -303.98 (0.001) -3.92 (65.9) 94 -4. 17 (0.041) -1 91 .02 (0.004) -3.64 (24.2) 140 -3.8 1 (0.037) -1 303 .1 (0.001) -3.91 (63.5) 148 -4. 17 (0.04 11 -4.51 (0.029) -3 .17 (8.2) 182 -4.17 (0.054) -42.68 (0.015) -3.48 (12.7) espD Positive sites 349 3.24 (0.165) 8.8 1 (0.005) 3.84 (191.6) Negative sites 2 -1.26 (0.358) -2.44 (0.083) -2.45 (143.7) 3 -2.08 (0.216) -3.37 (0.052) -2.48 (159.6) 14 -1.35 (0.334) -1.77 (0.095) -2.46 (173.8) 16 -5.67 (0.034) -1 1.85 (0.054) -1.84 (25) 34 -2.08 (0.2 16) -1 2.80 (0.030) -2.47 (144.3) 59 -2.71 (0.111) -704.49 (0.003) -2.46 (178.9) 132 72 -1.85 (0.241) -3.26 (0.034) -2.42 (91.1) 73 -2.08 (0.216) -12.80 (0.023) -2.52 (325.1) 74 -2.08 (0.230) -15.14 (0.024) -2.48 (188.2) 75 -1.81 (0.255) -3.37 (0.040) -2.42 (83.3) 76 -2.08 (0.216) -12.80 (0.027) -2.49 (238.8) 80 -2.08 (0.216) -12.80 (0.023) -2.52 (325.1) 86 -2.43 (0.188) -5.75 (0.017) -2.42 (106.2) 87 -2.71 (0.11 1) -15.91 (0.004) -2.47 (160.4) 91 -2.08 (0.230) -2.19 (0.079) -2.45 (104.7) 96 -2.71 (0.111) -17.14 (0.003) -2.47 (160.4) 122 -2.71 (0.111) -3.12 (0.022) -2.47 (164.6) 137 -2.08 (0.230) -8.29 (0.052) -2.48 (167) 146 -1.35 (0.334) -1.77 (0.095) -2.46 (173.8) 155 -1.35 (0.333) -1.65 (0.096) -2.47(155.1) 160 -4.17 (0.053) -9.96 (0.007) -2.48 (188) 166 -2.08 (0.276) -14.99 (0.036) -2.42 (107) 183 -1.35 (0.333) -10.91 (0.064) -2.46 (158.5) 186 -2.71(0.111) -21.62 (0.010) -2.46 (172.7) 187 -2.71 (0.111) -1.59 (0.098) -2.46 (137.8) 188 -2.71 (0.111) -3.49 (0.022) -2.45 (115.5) 190 -1.35 (0.333) -2.44 (0.066) -2.47 (156) 193 -1.35 (0.333) -1.76 (0.093) -2.44 (112.8) 198 -2.71 (0.111) -2.92 (0.030) -2.44 (129.3) 215 -1.35 (0.333) -2.44 (0.066) -2.47 (136.8) 219 -2.71 (0.111) -17.23 (0.049) -2.46 (137) 225 -2.71(0.111) -6.18 (0.009) -2.44 (129.2) 229 -4.17 (0.053) -11.97 (0.031) -2.48 (185.1) 230 -1.35 (0.333) -1.76 (0.084) -2.47 (155.7) 232 -2.71 (0.111) -2.92 (0.028) -2.45 (115.4) 233 -2.08 (0.276) -2.19 (0.097) -2.42 (84.6) 237 -2.71 (0.122) -17.23 (0.049) -2.46 (149.2) - 255 -1.18 (0.382) -2.005 (0.090) -2.44 (132) 262 -2.71 (0.111) -3.62 (0.022) -2.46 (133.6) 271 -4.07 (0.037) -2.41 (0.064) -2.46(132.1) 274 -1.35 (0.333) -1.73 (0.087) -2.46 (137.7) 284 -4.17 (0.047) -12.05 (0.036) -2.49 (213.9) 293 -1.35 (0.333) -1.76 (0.093) -2.44 (112.8) 295 -4.07 (0.041 ) -18.78 (0.006) -2.46 (162.5) 297 -2.71(0.111) -17.08 (0.049) -2.47 (159.1) 301 -1.35 (0.333) -1.71 (0.090 ) -2.46 (200) 304 -2.71 (0.111) -17.08 (0.050) -2.46 (162.1) 308 -1.81 (0.255) -3.37 (0.040) -2.42 (83.3) 326 -4.07 (0.037) -2.32 (0.068) -2.46 (133.8) 328 -4.17 (0.047) -12.05 (0.036) -2.49 (213.9) 332 -4.17 (0.076) -11.97 (0.043) -2.42 (105.2) 334 -2.08 (0.230) -15.14 (0.027) -2.46 (136.2) 336 " -5.38 (0.020) -6.01 (0.010) -2.42 (86.6) 343 -2.08 (0.230) -6.40 (0.063) -2.45 (124.1) 347 -2.71 (0.111) -5.50 (0.011) -2.45 (114.5) 350 -2.08 (0.230) -6.40 (0.063) -2.45(124.1) 351 -2.99 (0.112) -2.67 (0.043) -2.42 (86) 353 -2.08 (0.216) -1.47 (0.093) -2.48 (146.3) 355 -4.07 (0.037) -12.56 (0.005) -2.45 (115.5) 359 -4.17 (0.076) -11.72 (0.043) -2.42 (104.6) 133 364 -4.71 (0.035) -9.21 (0.005) -2.4 1 (79.3) 367 -4.17 (0.047) -1 3.59 (0.007) -2.47 (158.8) 368 -2.71 (0. 136) -17.23 (0.057) -2.43 (105.6) 369 -2.71 (0.111) -1.78 (0.092) -2.45 (1 15.8) 371 -2.71 (0.1 1 1) -1.78 (0.088) -2.46(131) 376 -1.35 (0.333) -1.73 (0.087) -2.46 (137.7) 377 -2.08 (0.2 16) -1 5.92 (O. O 1 1) -2.52 (382.4) espB Negative sites 4 -1.03 (0.272) -0.22 (0.073) -1.26 (228.7) 20 -0.85 (0.333) -0.59 (0.057) -1.23 (64) 38 -1.28 (0.227) -0.38 (0.030) -1 .23 (73) 40 -0.85 (0.333) -0.30 (0.056) -1.23 (73.8) 44 -1.70 (0. 111) -0.53 (0.014) -1.24 (82.5) 48 -1.33 (0.225) -0.43 (0.053) -1.25 (156.1) 52 -1 .33 (0.225) -0.36 (0.063) -1.24 (103.2) 61 -0.85 (0.333) -0.21 (0.091) -1.24 (88) 65 -1.33 (0.268) -0.37 (0.076) -1.22 (138) 69 -1.33 (0.268) -0.47 (0.065) -1.22 (139.9) 71 -1.33 (0.268) -0.65 (0.039) -1.22 (130.6) 74 -1.33 (0.268) -0.65 (0.039) -1.22 (130.6) 79 -1.33 (0.268) -0.43 (0.070) -1.22(135.1) 86 -1.33 (0.268) -0.37 (0.076) -1.22 (138) 92 -1.33 (0.225) -0.36 (0.063) -1.24 (l03.2) 94 -2.67 (0.050) -2.59 (0.002) -1 .25 (134. 1 ) 98 -0.85 (0.333) -0.24 (0.091-) -1.23 (67.5) 103 -0.85 (0.333) -0.23 (0.082) -1 .24 (221 . 1 ) 104 -0.85 (0.333) -0.28 (0.075) -1.25 (1 43.1) 106 -1.03 (0.272) -0.22 (0.073) -1.26 (228.7) 112 -1.03 (0.272) -0. 18 (0.089) -1.26 (232.1) 120 -1.33 (0.211) -0.25 (0.079) -1.25 (166.5) 125 -1.70 (0. 11 1) -3.01 (0.002) -1.25 (135) 185 -1. 70 (0.112) -3.01 (0.011) -1.22 (106.8) 190 -1.33 (0.211) -0.75 (0.023) -1.24 (98.4) 207 -2.67 (0.044) -2.23 (0.004) -1.24 (94.3) 233 -0.85 (0.333) -0.28 (0.073) -1.23 (69.6) 238 -1.70 (0.1 1 1) -29.6 (0.0003) -1.24 (84.7) 240 -1.33 (0.21 1) -0.31 (0.051) -1.27 (634.9) 244 -0.85 (0.333) -0.30 (0.052) -1.25 (219.2) 246 -1.33 (0.225) -0.65 (0.029) -1.25 (1 48.2) 254 -1.33 (0.225) -0.43 (0.057) -1.24 (104.2) 255 -1.70 (0.1 13) -0.89 (0.0 15) -1.22 (79.4) 257 -1.33 (0.225) -0.36 (0.058) -1.25 (154.4) 258 -1.70 (0. 11 3) -0.46 (0.025) -1.22 (88.2) 264 -1.33 (0.225) -0.36 (0.063) -1.24 (1 03.2) 265 -1.33 (0.268) -0.47 (0.065) -1.22 (139.9) 268 -1 .33 (0.225) -0.37 (0.057) -1.25 (155.3) 269 -1.70 (0.124) -3.36 (0.002) -1.22 (75.9) 271 -1.33 (0.225) -0.65 (0.031) -1.24 (99.6) 272 -1.33 (0.2 111 -0.25 (0.079) -1.25 (166.5) 278 -1.28 (0.227) -0.38 (0.030) -1.23 (73) 281 -1.33 (0.241) -0.31 (0.082) -1.22 (137) 282 -1.33 (0.225) -0.65 (0.029) -1.25 (148.2) 283 -1.33 (0.265) -0.36 (0.077) -1.22 (135) 295 -0.85 (0.333) -0.31 (0.073) -1.24 (468.8) 134 299 -0.28 (0.018) -0.04 (0.870) -1.12 (76.9) 305 -1.33(0.211) -2.42 (0.018) -1.24 (1 09.4 ) 312 -0.85 (0.333) -0.41 (0.041) -1.24 (464.5) 314 -0.85 (0.333) -0.59 (0.054) -1.25 (145.8) orf27 Negative sites 42 -11.16 (0.056) -10.94 (0.033) -14.50 (O) 81 -11.16 (0.069) -10.94 (0.040) -14.45 (O) escF No sites orf29 Negative sites 20 -4.96 (0.051) -3.15 (0.040) -2.15 (23) 51 -4.02 (0.078) -1.90 (0.063) -2.15 (21.8) 74 -2.48 (0.227) -1.60 (0.068) -2.22 (99.1) 79 -2.48 (0.227) -3.14 (0.037) -2.22 (92.6) espF Positive sites 136 2.13 (0.247) 1.67 (0.049) 4.34 (57.4) Negative sites 21 -4.17 (0.038) -2.32 (0.018) -1.42 (413.3) 23 -2.45 (0.111) -0.73 (0.083) -1.39 (197.3) 33 -2.45 (0.111) -1.51 (0.015) -1.39 (163.8) 37 -3.68 (0.037) -2.35 (0.011) -1.34 (38.7) 38 -2.45 (0.111) -3.73 (0.005) -1.39 (173.6) 59 -1.54 (0.283) -0.82 (0.088) -1.38 (168.7) 65 -2.08 (0.196) -1.51 (0.035) -1.42 (428.8) 69 -1.22 (0.333) -0.90 (0.088) -1.36 (56) 103 -4.17 (0.038) -4.07 (0.014) -1.39 (215.2) 104 -2.08 (0.198) -0.96 (0.042) -1.37 (97) 122 -2.45 (0.111) -0.85 (0.084) -1.36 (94.7) 150 -2.23 (0.196) -416.68 (0.001) -1.38 (158.7) 167 -2.45 (0.111) -2.52 (0.012) -1.36 (106.7) 197 -4.17 (0.038) -4.07 (0.014) -1.39 (215.2) 198 -2.08 (0.198) -0.96 (0.042) -1.37 (97) 202 -2.08 (0.210) -3.19 (0.041) -1.38 (152.7) APÉNDICE 111. Tabla 4.4. Resultados del test de SPD para cada marcador utilizado en el estudio. Gen Codon SLAC (P) FEL (p) REL (Bayes Factor) mdh Positive sites 207 - 2.8781 (0.7514) 83.7293 (0.0001) 14.8531 (1.8317xlO") Negative sites 9 -1.4591 (0.1289) -9.0446 (0.0080) -0.7359 (3.1180x 106 ) 10 -1.3633 (0.1909) -5.9458 (0.0514) -0.7291 (3.4074xlO lo) 12 -1.3633 (0.2297) -6.8092 (0.0596) -0.7490 (3.4047x 1 09 ) 20 -1.4390 (0.1127) -6.3639 (0.0105) -0.7153 (9.1551 x 1 O") 24 -0.8449 (0.2838) -2.6899 (0.0964) -0.7038 (5.7687x 1 09 ) 26 -0.7195 (0.3333) -3.0561 (0.0843) -0.6977 (1.431 x 1 09 ) 28 -0.7195 (0.3333) -2.7433 (0.0791) -0.7001 (2.9120xI09 ) 29 -2.1586(0.0370) -9.1433 (0.0039) -0.7297 (7.1879x 1 07 ) 32 -2.8781 (0.0123) -30.6251 (0.0002) -6.3902 (3.5367x 1 07 ) 135 34 -1.0232 (0.2343) -4.4494 (0.0697) -0.7398 ( 1 .8644x 108 ) 35 -0.9228 (0.2724) -5.3316 (0.0311) -0.6980 (1.0298x 1 07 ) 37 -1.0232 (0.2343) -4.4492 (0.0603) -0.7405 (3.0697x 1 09 ) 39 -0.71 95 (0.3333) -4.6348 (0.0695) -0.7052 (3 .2136x 108 ) 40 -2.1 586 (0.0370) -9.37 14 (0.0037) -0.7499 (2.5667x 1 08 ) 42 -1.4390 (0.1111) -8.01 09 (0.0 150) -0.7095 (4. 7815x 1 06 ) 47 -1.0232 (0.2343) -2.9560 (0.0787) 0.7291 (1.9827x 1 0" ) 48 -1.4390 (0.1114) -5.3141 (0.0205) -0.7462 (2.0508x 1010) 52 -2.1 586 (0.0370) -10.81 6 (0.0039) -0.7479 (6.217IxI06 ) 54 -0.71 95 (0.3333) -5.2480 (0.0635) -0.7064 (2.9797x 1 08 ) 55 -0.71 95 (0.3333) -3.2160 (0.0907) -0.7002 (4.1162x 10 7) 56 -0.9345 (0.2634) -6.7722 (0.0209) -0.7010 (8.2167x 1 06 ) 59 -1.4390 (0.1111) -8. 1866 (0.0 120) -0.7107 (1.4420xI07 ) 61 -1.4390 (0.1111) -7.9626 (0.0127) -0.7122 (2.0477x 1 06 ) 66 -1 .4390 (0.1111) -9.3459 (0.0 11 8) -0.7234 (8.2619x 1 06 ) 67 -1.4390 (0. 1111) -1 0.5728 (0.0286) ·0.9030 (5.8108x 1 08 ) 68 -1 .4390 (0.1111) -8.1 865 (0.0138) -0.7099 (4.3021 x 106 ) 69 -0.71 95 (0.3333) -2.9787 (0.0960) -0.6972 (9.9726x 1 07 ) 71 -2.7266 (0.0364) -15.8105 (0.0042) -0.9352 (6.721 x 109 ) 72 -0.7195 (0.3333) -2.7953 (0.09 11) -0.697 1 (1.5051 x 1 09 ) 73 -1.4390 (0.1111) -3.9063 (0.06 17) -0.70 13 (1 .8928x 1 08 ) 79 -0.8809 (0.3038) -4.1 538 (0.0459) -0.6947 (2.7563x 1 07 ) 80 -1 .0232 (0.2343) -4.4494 (0.0383) -0.7424 (1.4571 x 10 11 ) 82 -1.4390 (0.1111) -6.2370 (0.0240) -0.7153 (3.6780x 1 06 ) 87 -0.7195 (0.3333) -3.1857 (0.0973) -0.6988 (1.4934x 1 07 ) 89 -2.0465 (0.0549) -6.7188 (0.0263) -0.8505 (1.1258xI0 1o) 91 - 1.8286 (0.1074) -11.5407 (0.0494) -0.5639 (4605.7) 93 -2.7266 (0.0528) -15.8105 (0.0064) -0.9332 (9.4794xI08 ) 95 -1 .0791 (0.2593) -9.6093 (0.0664) -0.5218 (5487.7) 99 -0.7 195 (0.3333) -2.7834 (0.09 10) -0.7005 (6.2877x 1 09 ) 101 -1.4390 (0.1111) -9.8951 (0.0 105) -0.7159 (1.0287xI07 ) 103 -1.6898 (0.0805) -4.8 176 (0.0236) -0.7213 (2.6030x 1 09 ) 105 -0.8449 (0.2838) -3.4745 (0.0609) -0.7100 (3.8569xI09 ) 106 -1.6898 (0.0805) -4.62 14 (0.0275) -0.7421 (7.9275x 1 09 ) 110 -1.4390 (0.1111) -8.3632 (0.01 6 1) -0.7264 (2.1782x 1 06 ) 112 -1.4390 (0.1111) -6.7300 (0.0190) -0.7226 (1.8652x 1 09 ) 113 -2.1586 (0.0370) -16.7126 (0.0009) -1.0059 (5 .4708x 1 08 ) 114 -1.4390 (0.1111) -6.3638 (0.020 1) -0.7128 (4.6384x I06 ) 115 -1.4390 (0.1 111) -17.5873 (0.0077) -0.8220 (2.2537x 1 07 ) 116 -0.8449 (0.2888) -3.4745 (0.0609) -0.71 00 (3.8569x 1 09 ) 117 -1.4390 (0.1 111) -7.8924 (0;0 128) -0.7216 (1.0291 x 107 ) 11 8 -1.4390 (0.1 111) -7.4643 (0.0 148) -0.7187 (1.13xI07 ) 125 -1.4390 (0. 11 11) -3.851 4 (0.0625) -0.70 10 (1.9084x 108 ) 127 -2.0465 (0.0676) -6.3040 (0.02 19) -0.7832 (8 .1 170x 1 09 ) 128 -2.0465 (0.0549) -5.6554 (0.0342) -0.7443 (1.5726x 108 ) 129 -1 .3633 (0.1 909) -9.981 4 (0.0335) -0.7757 (1.9436x 10 10) 131 -1.3633 (0.1 909) -5.9458 (0.0514) -0.7291 (3 .4074xl0 1o) 133 -2.0465 (0.0549) -5.4305 (0.0148) -0.7429 (1.3579xI0 11) 135 -2. t 586 (0.0370) -9.3716 (0.0066) -0.7463 (1.6507xI06 ) 136 -1 .4390 (0. 1111) -4.5806 (0.0308) -0.7 185 (3.3983x 109) 137 -0.7195 (0.3333) -2.7834 (0.0879) -0.701 6 (1.5099xlO lo) 142 -1.4390 (0.1 111) -3.840 1 (0.050) -0.6984 (3.1347x 1 09 ) 145 -1.4390 (0.1111) -3.7902 (0.0382) -0.7450 (9.5167x 109 ) 146 -1.0232 (0.2343) -4.7252 (0.0567) -0.7477 (1.5250xI0 11 ) '--- 136 147 -2.1586 (0.0370) -9.3716 (0.0066) -0.7463 (1.6507x 106 ) 148 -1 .4390 (O. 1 1 1 1) -10.5178 (0.0098) -0.7278 (7.8312x 1 06 ) 149 -1.3633 (0.1909) -5.9459 (0.0616) -0.7273 (6.7449x I 08 ) 152 -1.4390 (0.1111) -3.6796 (0.0662) -0.6977 (1.9335x I 08 ) 160 -0.7195 (0.3333) -3.1857 (0.0973) -0.6988 (1.4934x 107 ) 163 -0.8449 (0.2838) -3.4745 (0.0609) -0.7100 (3.8569x 1 09 ) 164 -2.1586 (0.0370) -22.048 (0.0066) -1.5916 (5.8423x 1 08 ) 165 -1.4390 (0.1 111) -3.8514 (0.0625) -0.7010 (1.9084xIOH ) 168 -1.4390 (0.1 111) -3.8514 (0.0625) -0.7010 (1.9084x 1 08 ) 169 -1.4390 (0.1111) -6.3961 (0.0228) -0.7159 (3.6822x 1 06 ) 173 -1.4390 (0.1111) -8.8127 (0.0097) -0.7208 (1.9121 x 1 08 ) 174 -0.8809 (0.3038) -4.1538 (0.0459) -0.6947 (2.7563x 107 ) 176 -1.4390 (0.1111) -7.7751 (0.0101) -0.7121 (8.1077xI08 ) 181 -1.4390 (0.1111) -9.2683 (0.0120) -0.7332 (1. 7830x 1 06 ) 182 -3.0697 (0.0128) -31.5276 (0.0006) -4.7464 (1.8431 x 1 0 11 ) 183 -1.0232 (0.0787) -2.9560 (0.0787) -0.7291 (1.9827xl0 11 ) 185 -1.363310.1909) -7.7091 (0.0494) -0.7637 (9.4469xl08 ) 186 -1.3633 (0.2297) -7.7088 (0.0513) -0.7634 (6.1276x 1 09 ) 187 -1.3633 (0.1909) -5.9459 (0.0616) -0.7273 (6.7449x 1 08 ) f-- -0.7195 (0.3333) -3.1857 (0.0973) -0.6981 (1.61 09x 10 7) 188 193 -1.3633 (0.1909) -6.8104 (0.481) -0.7511 (2.5379 xl 0 1°) 194 -1.4390 (0.1111) -5.6612 (0.0259) -0.7187 (4.4408xI09 ) 195 -1.6898 (0.0805) -4.3905 (0.0268) -0.7101 (3.6950xl09 ) 196 -2.7266 (0.0528) -17.3104 (0.0056) -1.0325 (1 .5333x 1 09 ) 198 -2.1586 (0.0370) -21.2539 (0.0020) -1.1528 (6.5646x 1 07 ) 201 -6.8165 (0.0002) -308.59(3.6169x 1 08 ) -10.5962 (1.0066x 1 09 ) 202 -0.7195 (0.3333) -3.3075 (0.0928) -0.6963 (2.2834x 1 07 ) 203 -0.7195 (0.3333) -4.6349 (0.0826) -0.7037 (6.0240x 1 06 ) 204 -1.3633 . (0.1909) -5.9459 (0.6162) -0.7273 (6.7449x 108 ) 205 -0.7195 (0.3333) -3.3074 (0.0663) -0.6971 (6.9636x 107 ) 206 -2.7266 (0.0364) -29.7064 (0.0011) -1.9673 (8.8863xl09 ) 210 -2.1586 (0.0383) -10.8157 (0.0077) -0.7475 (2.6208 X 107 ) 211 -1.4390 (0.1129) -9.1257 (0.1129) -0.7688 (9.5816xI09 ) 214 -0.9345 (0.2624) -6.5254 (0.0245) -0.6994 (9.7393x 1 06 ) 219 -2.1586 (0.0370) -17.1178 (0.0013) -1.0614 (1.0506x 1 07 ) 220 -1.4390 (0.1111) -8.0136 (0.0125) -0.7227 (9.8716xI06 ) 223 -2.0465 (0.0549) -6.1422 (0.0125) -0.7818 (9.6295xl0 10 ) 224 -2.1586 (0.0370) -10.6978 (0.0134) -1.0509 (3.4288x 1 08 ) 226 -1.4390 (0.1142) -9.7123 (0.0083) -0.7435 (3.2944x 1 09 ) 228 -3.5976 (0.0041) -40.4244 (6.31 xl 05 ) -9.0649 (7.9002x 1 06 ) 229 -1.4390{0.llll ) -5.1715 (0.0151) -0.7086 (5.7391xl09 ) 230 -1.4390 (0.1111) -7.1907 (0.0154) -0.7089 (1.5219 X 107 ) 232 -1.3633 (0.2297) -9.3215 (0.0478) -0.9147 (1.1398xI0 Io ) 234 -1.3633 (0.1909) -9.9815 (0.0403) -0.7739 (4.0446x 108 ) 237 -1.4390 (0.1111) -8.3437 (0.0261) -0.7246 (2.1862x 1 06 ) 238 -1.4390 (0.1111) -8.2129 (0.0110) -0.7144 (1.9185x 106 ) 240 -2.0465 (0.0608) -6.3038 (0.0169) -0.7859 (5.5498x 10 11 ) 241 -0.7195 (0.3333) -3.6013 (0.0995) -0.6983 (2.3166x 1 07 ) 242 -3.0697 (0.0176) -11.7132 (0.0042) -1.3617 (8.6127x 1 09 ) 250 -4.3171 (0.0013) -46.7899 (5 .36x 1 06 ) -10.0772 (3.1409xl07 ) 251 -1.4390 (0.1111) -3.8401 (0.0508) -0.6984 (3.1347x I 09 ) 254 -0.7195 (0.3383) -2.4095 (0.0946) -0.7008 (1.982IxI0 IO ) 255 -2.7266 (0.0528) -29.9327 (0.0075) -1.7283 (1.1387x 1 09 ) 257 -1.2999 (0.1712) -9.4587 (0.0073) -0.7522 (1.4766x 1 07 ) - 137 266 -1.3633 (0.1909) -13.4422 (0.02 15) -0.8373 (5.4823x 1 08 ) 269 - 1.0626 (0.2788) -7.5974 (0.0697) -0.5201 (3 .9677x 10(,) 270 -1.6898 (0.0805) -4.5395 (0.0256) -0.7113 (3.5706xI09 ) 271 -1.4390 (0.1111 ) -5.1 579 (0.0497) -0.7368 (3.6083 x 10R) 272 -3.3539 (0.0 158) -3 1.3969 (0.0007) -8.6447 (776006) 275 -0.7 195 (0.3333) -3.0561 (0.0937) -0.6970 (8.9578x 1 07 ) ~a pA Negative sites 3 -2.2081 (0.1 906) -6.3967 (0.0214) -2.9057 (3327.09) 6 -4.1 348 (0.0962) -8.2450 (0.2317) -2.1778 (487.011) 9 -2.5982 (0. 1111) -14.9395 (0.0075) -2.8792 (6.2448x 1 09 ) 13 -2.2263 (0.2270) -29.0646 (0.0206) -2.9173 (2389.04) 14 -1.7774 (0.2674) -4.5192 (0.0673) -2.9089 (1.8906x 1 07 ) 27 -1.2979 (0.3333) -5.8744 (0.0565) -2.8972 (2560.45) 31 -1.7774 (0.2433) -4.5202 (0.0804) -2.9004 (2568.28) 44 -2.8437 (0.1625) -12.8605 (0.0328) -2.9204 (934.66) 47 -1.2979 (0.3333) -4.5195 (0.0837) -2.8731 (3.3634x 1 06 ) 51 -2.92 1 (0. 1730) -1 9.871 1 (0.0259) -2.9203 (2172.73) 60 -2.5958 (0.11 11) -8.8028 (0.01 73) -2.8973 (8.4277x 1 08 ) 69 -2.5958 (0.1111) -5.8506 (0.0400) -2.899 1 (4.6679xlO lJ ) 73 -2.5958 (0.1111) -7.6953 (0.0316) -2.8792 (1.1503x 1 07 ) 75 -2.8262 (0.1788) -12. 1984 (0.0310) -2.9286 (877.93) 78 -3.2447 (0.1 111) -9.8478 (0.09 11) -2.1785 (2.0963x 1 023 ) 80 -2.5958 (0.1111) -9.8365 (0.0434) -2.8854 (1.773 5x 10 16 ) 81 -1.2979 (0.3333) -5 .8744 (0.0700) -2.8792 (29861.6) 82 -8.1562 (0.0064) -175 .28(9.4415x I 06 ) -2.9263 (5.7744x I 0 10 ) 84 -2.5958 (0.1 111) -23.1505 (0.0075) -2.8973 (7.4086x 108 ) 89 -2.2979 (0.3333) -1 3.2044 (0.03 16) -2.873 1 (268806) 94 -2.2979 (0.3333) -3.2 159 (0.0959) -2.8991 (9.6225x 1 07 ) 95 -2.5958 (0.111 1) -12.8433 (0.01 72) -2.873 1 (1.2818 xl 08 ) 97 -1 .6625 (0.260 1) -5.5863 (0.0675) -2.9 180 (1 694.88) 106 -3.8705 (0.0630) -7. 1098 (0.0268) -2.9089 (1.2598xlO") 109 -2.2035 (0.2665) -13 .8267 (0.0401 ) -2.8966 (640.07) 115 -2.5958 (0.1 111) -5.6140 (0.0409) -2.8791 (5.8956x 10 12 ) 119 -2.5958 (0.1111) -5. 1198 (0.0407) -2.8991 (3.2164xI0 12 ) 123 -3 .8937 (0.0370) -14.4506 (0.0084) -2.8792 (3.1225xI0 15 ) 124 -1.2979 (0.3333) -4.461 1 (0.0848) -2.8731 (2.3263x 1 06 ) 134 -2.5958 (0.11 11) -7.6733 (0.0500) -2.8854 (2.0988x 1 0 14 ) 141 -1.2979 (0.3333) -3.4761 (0.09 16) -2.8991 (9.6540xI07 ) 144 -3.3791 (0.0655) -1 7.8689 (0.02 18) -2.8977 (9.8751 x 106 ) 146 -2.5958 (0.111 1) -8.5427 (0.0197) -2.899 1 (1.6085xlO 17 ) 148 -2.5958 (0.11 11) -7.0480 (0.0306) -2.8792 (1 .1951 x 1 0 10 ) 152 -2.5958 (0.1111) -6.9888 (0.0309) -2.899 1 (2.1258x I0 18 ) 154 -3.91 86 (0.0487) -15.3284 (0.0200) -2.9073 (2.5575x 1 06 ) 165 -2.5958 (0.11 11) -7.833 I (0.040 1) -2.8796 (3.3742x I 0 15 ) 167 -3.8937 (0.0370) -14.7757 (0.0065) -2.8792 (9.7122xI021 ) 169 -2.1 093 (0.2784) -15.9798 (0.04 15) -2.8935 (4 1496.4) 173 -2.5958 (0.11 11) - 10.8917 (0.0132) -2.8732 (4.2527x 1 07 ) 174 -2.5958 (0. 11 11) -14.2269 (0.0069) -2.8944 (2.7343x 1 0 15 ) 178 -2.5958 (0.11 11) -11 .4992 (0.0362) -2.8792 (3 .3646x 1 0 11 ) 20 1 -2.5958 (0.11 11) -19.601 8 (0.0050) -2.8732 (4.4733x 1 08 ) 202 -2.5958 (0. 1111) -5.1290 (0.0407) -2.899 1 (3.2449 XIO I2 ) 203 - 1.2979 (0.3333) -1 3.2044 (0.03 16) -2.873 1 (268806) 206 -2.5958 (0.1 1 1 1) -6.5348 (0.0249) -2.8960 (3 .1663x 1 0 17 ) 21 5 -2.8262 (0.1 635) -12. 1984 (0.0341) -2.9201 (821.21) 138 216 -2.8262 (0.1788) -12.1984 (0.0310) -2.9286 (877.93) 218 -3.8937 (0.0370) -23.3828 (0.0053) -2.8792 (1.2765x 1 0 16 ) 220 -3.4100 (0.0760) -7.4021 (0.0257) -2.9089 (1.2745x 1 0") fimA Positive sites 19 1.3900 (0.2962) 3.3100 (0.0410) 2.5925 (466.20) 89 2.1756 (0.1803) 3.8480 (0.0680) 2.2362 (65.50) 134 2.6215 (0.1248) 5.6681 (0.0287) 2.2617 (70.57) Negative sites 8 -2.1522 (0.0824) -3.1341 (0.0224) -3.7820 (939.64) 18 -1.8534 (0.1111) -2.8042 (0.0346) -3.4403 (174.86) 23 -1.8534 (0.1111) -2.5092 (0.0597) -3.2319 (119.29) 30 -3.7068 (0.0123) -5.8484 (0.0036) -4.4142 (4699) 43 -3.4805 (0.0315) -3.4688 (0.0181) -3.9348 (2168.58) 59 -3.1197 (0.4271) -6.4875 (0.0025) -4.3621 (2627.28) 60 -2.7801 (0.0459) -3.9647 (0.0316) -4.1247 (527.38) 65 -2.7801 (0.0370) -5.3484 (0.0108) -4.3166 (1099.34) 69 -1.7272 (0.2174) -6.3927 (0.0297) -3.1629 (131.39) 72 -1.8534 (0.1111) -2.5840 (0.0567) -2.8201 (88.98) 74 -1.7402 (0.1775) -2.0856 (0.0916) -2.688 (97.81) 76 -1.8534 (0.1111) -3.8475 (0.0338) -3.8723 (252.03) 82 -3.7576 (0.0399) -12.6292 (0.0021) -4.2003 (2569.85) 84 -1.7402 (0.1775) -2.9930 (0.0561) -3.0415 (127.30) 87 -1.7402 (0.1775) -2.9928 (0.0675) -3.0381 (101.55) 94 -1.8534 (0.1111) -2.5066 (0.0597) -3 .1795 (113.93) 98 -1.7402 (0.1775) -1.7999 (0.0827) -2.4816 (75.23) 99 -1.4455 (0.2876) -6.7185 (0.0055) -4.3538 (97.66) 100 -1.8534 (0.1111) -4.0707 (0.0413) -3.9807 (388.93) 101 -3.7068 (0.0123) -10.6845 (0.0004) -4.4449 (22527.1) 104 -3.4805 (0.0315) -5.3275 (0.0126) -5.3275 (1233.75) 110 -2.780 I (0.0370) -4.2103 (0.0123) -4.1836 (702.73) III -1.2749 (0.2437) -3.4516 (0.0259) -3.4947 (165.32) 113 -1.2553 (0.2488) -3.7933 (0.0227) -3.6776 (247.31) 114 -1.7862 (0.2102) -5.8575 (0.0318) -3.1019 (123.34) 116 -2.7801 (0.0554) -4.1194 (0.0149) -4.1559 (279.06) 118 -1.8534 (0.1111) -4.5011 (0.0244) -3.6942 (192.6) 120 -3.4805 (0.0315) -3.7909 (0.0210) -3.9833 (2021.98) 125 -1.8534 (0.1111) -3.6467 (0.0478) -3.8503 (309.11) 127 -1.7266 (0.2175) -6.0196 (0.0316) -3.1199 (126.59) 128 -3.2679 (0.0228) -4.4019 (0.0061) -4.3309 (4764.77) 132 -3.7068 (0.0123) -7.5697 (0.0014) -4.4346 (13559.6) 133 -3.7068 (0.0123) -13.2932 (0.0012) -4.4179 (27438.5) 139 -5.2208 (0.0055) -6.1436 (0.0044) -4.391 1 (7258.7) 143 -1.7402 (0.1775) -3.2698 (0.0479) -3.0898 (107.08) 152 -3.7068 (0.0145) -9.3342 (0.0029) -4.4440 (17614.7) 153 -2.7801 (0.0370) -3.8800 (0.0125) -4.2195 (1423.78) 154 1.7402 (0.1775) -1.6002 (0.0997) -2.3107 (82.14) 166 -3.2435 (0.0452) -9.0119 (0.0310) -3.8849 (342.70) 170 -5.0965 (0.0068) -19.334 (0.000 1) -4.0561 (28344.8) 171 -2.7801 (0.0370) -5.7671 (0.0147) -4.3603 (2032.18) 172 -3.7068 (0.0123) -9.5563 (0.0020) -4.4382 (10856) 182 -3.4559 (0.0472) -13.5843 (0.0021) -4.2032 (2601.83) pulP Negative sites 1 -5.8740 (0.0633) -36.1012 (0.0109) -16.0588 (2.3649x 1 08 ) 2 -2.9370 (0.2516) -12.4832 (0.0922) -16.0683 (427082) 139 A AA AA AAA m] — ro. r- e .) -2.2177 (0.3469) -15.8761 (0.0768) E -16.0577 (3.5054x 10% 34 4,4354 (0.1111) -33.9802 (0,0098) -16.0628 (8.9571x10*) 36 -6.6531 (0,0370) -47.6252 (0.0021) -16.0657 (1.6663x 10?) 45 -5.8740 (0.0633) -28.0715 (0.0150) -16.0692 (4,4569x 10%) 57 -7.5815 (0.0250) -48.6477 (0,0026) -16.0663 (1.8593x 107) 60 -2.9370 (0.2624) -42.826 (0.0313) -16.0707 (7.0369x10*) 79 -2.8762 (0.2851) -23.8318 (0.0455) -16.0507 (3.3387x 10”) 98 -4,4354 (0.1111) -21.3472 (0.0254) -16.0609 (5.2838x 10") 101 4,4354 (0.1111) -26.5737 (0.0230) -16.0612 (7.2674x10”) 112 -2.2177 (0.3480) -18.3008 (0,0650) -16.0575 (1.8731x10%) 135 -2.2177 (0.3333) -20.5298 (0,0475) -16.0657 (1.6059x10?) 136 -6.6531 (0.0381) -52.5213 (0.0025) -16.063 (4,3458x10*) 156 -2,9370 (0.2516) -1 1.9839 (0,0958) -16.0684 (808208) 161 -2.9370 (0,2516) -12.747 (0.0891) -16.0689 (536610) 170 -2.2177 (0.3333) -15.1658 (0.0651) -16.0687 (6.0212x10*) 171 2.2177 (0.3333) -18.301 (0.0587) -16.0628 (9.1481x10*) 174 -4,4354 (0.1111) -24,2758 (0.0254) -16.0612 (2.4148x10*) 175 -5.0543 (0.0855) -21.9106 (0.0217) -16.0673 (8,4536x10*) 176 -5.0543 (0.0855) -24,2749 (0.0186) -16,0662 (6,7268x10*) 177 -5.8740 (0.0633) -23.617 (0.0193) -16.0695 (2.9236x10*) 178 -4,4354 (0.1111) -18.6261 (0.0374) -16.0612 (2.9236x 10") 182 -4,4354 (0.1111) -17.7774 (0.0410) -16.0639 (7.7859x 10") 187 -2.2177 (0.3333) -18.301 (0.0726) -16.0611 (558598) 188 -2.5271 (0,2925) -11.5541 (0,0974) -16.0658 (628086) 193 -5.2243 (0,0800) -27.7509 (0,0159) -16.0663 (501293) 196 6.6531 (0.0370) -112.622 (0.0009) -16.0612 (2.7130x10") 201 -2.2177 (0.3333) -14.8929 (0.0934) -16.0639 (1.7151x10") 203 -2.9370 (0.2516) -12,747 (0,0831) -16.0709 (661611) 205 4,4354 (0.1111) -19,7416 (0.0342) -16.0612 (2.9387x 10") 209 -6.6531 (0.0444) -36.9363 (0.0036) -16.0573 (1.8785x 10") 210 -2.5617 (0,3357) -15.6624 (0.0908) -16.048 (2.0899x10”) 212 -8.8708 (0.0123) -45.5942 (0.0027) -16.0639 (7.0964x 10") 214 -2,2177 (0.3335) -20.5288 (0.0627) -16.0638 (6.5582x 10") 219 -2.2177 (0.3333) -15,4143 (0.0903) -16.0638 (889952) 220 -2.9370 (0,3363) -36.332 (0.0519) -16.0615 (371178) 221 -2,2177 (0.3333) -15.4143 (0.0719) -16.0628 (2.2199x 10”) 222 -2.9370 (0.2516) -12.0192 (0.0988) -16.0661 (646770) 223 -2,5271 (0,2925) -12,3915 (0,0944) -16.0663 (1.9450x 10%) 230 -4,4354 (0.1111) -29.5263 (0.0089) -16.0657 (1.6803x10”) muls Negative sites 2 -2.2948 (0.0748) -10.5423 (0.0129) -4.3120 (7914.98) 3 6.5992 (0.0002) -50.68 (7.7048x10*) -4.7339 (9.5208x10'') 7 -2.2763 (0.0599) -6.1332 (0.0708) -3.0836 (70,59) 17 -1.1824 (0.2933) -10,4886 (0.0624) -3,4829 (86,24) 19 -5.9645 (0.0054) -11.6354 (0.1633) -4.2856 (1,5247x 10") 26 -7.6552 (0.0003) -25.2459 (0.0021) -4.6911 (4.2376x 10") 30 -6.3117 (0.0013) -14.6308 (0.0136) -4,4837 (14005.4) 33 -3.7915 (0.0089) -4.9978 (0.0873) -2.1125 (39.96) 39 4.6914 (0.0019) -9.9061 (0.0169) -4.0881 (5497.77) 40 -5.1699 (0,0016) -19.9239 (0.0024) 4.6681 (1.9124x10") 42 -5,2217 (0.0055) -14.5614 (0.0105) 4,4872 (14422.9) 43 -4.7670 (0.0015) -13.9797 (0.0053) -4.6391 (1.2271x10%) 140 10 -5.8740 (0.0633) -29.1273 (0.0154) -16.0695 (2.5747x 1 01) 22 -2.2177 (0.3333) -15.2999 (0.0699) -16.0657 (4.9691 x 108 ) 23 ~ _ .. 77 ( . 469) . 61 68) . 77 4x 6 ) 4 -4.4354 1 1) . 02 . 98) . 28 .9 x 1 08 ) 6 - . 1 ( . 70) . 52 . 21 ) . 57 3x 9 ) - . 40 ( . 33) . 15 . 50) . 92 . 69x 1 08 ) 7 . 15 . 50) . 77 . 26) . 63 3x 1 09 ) 0 . 70 . 24) . 6 . 13) . 07 9x 1 06 ) . 62 . 51) . 18 ( . 55) . 07 . 7x 107 ) 8 . 54 . 1 1) . 72 . 54) . 09 8x 1 08 ) 1 -4.4354 . 11) . 37 . 30) . 12 x 107 ) 2 . 77 . 80) . 08 . 0) . 75 x IOR ) 5 - . 77 ( . 3) . 98 . 75) . 57 9x 1 09 ) 6 . 31 . 81) . 13 . 25) . 63 . x 1 08 ) 6 . 70 . 16) 1 9 . 58) . 84 208) 1 70 . 16) . 47 . 91) . 89 610) 0 77 33) 58 . 51) . 87 x 1 06 ) 1 -2.21 7 . 33) . 01 . 87) . 28 . 8IxI08 ) 4 . 54 . 1) . 58 . 54) . 12 48xI08 ) 5 . 43 . 55) . 06 . 17) . 673 . 6x 1 08 ) 6 . 43 . 55) . 49 . 186) . 62 . 8x 1 08 ) 7 0 . 33) . 17 . 93) . 95 x 1 08 ) 8 . 54 . 11) . 26 1 . 74) . 12 6x 8 ) 2 . 54 . 11) . 74 . 10) . 39 9x 1 08 ) 7 2 77 . 33) .30 1 . 26) . 6 1 598) 8 71 . 25) . 41 . 74) . 58 086) 3 43 . 00) . 09 . 159) . 63 293) 6 -6.6531 . 70) 2. 2 09) . 12 0x 1 08 ) 01 77 . 3) . 29 . 34) . 39 . 15Ixl06 ) 03 . 70 . 16) . 47 . 31) 1 . 09 6 1) 05 -4.4354 11) . 16 . 42) . 12 7x I 08 ) 09 31 44) . 63 36) . 73 85x 108 ) 0 . 17 . 57) . 24 . 08) . 48 9x 1 07 ) 2 08 . 123) . 42 . 27) . 39 . 64xI 8 ) 4 .2177 (0.3335) . 8 . 27) . 38 82x 8 ) 9 . 77 . 3) . 143 . 03) . 38 952) 0 70 . 63) . 2 . 19) . 15 178) 1 . 77 . 3) . 143 19) . 28 9x 7 ) 2 70 16) . 92 . 8) . 61 770) 3 . 71. . 25) . 5 . 44) . 63 l 0x 6 ) 0 . 54 1 1) . 63 . 89) . 57 3x 1 09 ) uts egative it s . 48 . 48) . 23 . 29) . 20 14.98) -6.5 92 . 02) . 8 . 8x 1 06 ) 39 8xlO ll ) . 63 . 99) 32 08) 6 . 9) 24 . 3) . 86 . 24) . 29 . 4) . 45 54) . 54 . 33) 56 . 7x 6 ) 6 52 . 03) . 59 . 21) . 11 . 76xI06 ) 0 11 7 . 13) . 08 36) . 37 005.4) 15 . 89) . 78 73) 25 .96) 9 -4.6914 . 19) . 6 1 . 169) . 81 97. 7) 0 99 . 16) . 39 . 24) -4.6681 . 24xI06 ) 2 . 17 . 5) . 14 . 05) -4.4872 4 2.9) 3 70 . 15) . 97 . 53) . 9 1 2 x 1 06 ) "' 49 -6.7716 (0.0002) -40.2759 (0.0001) -4 .7312 (1.0014xI09 ) 50 -4.2566 (0.0231) -32.7361 (0.0061) -4.3038 (1.6666x 1 07 ) 51 -5.5258 (0.0004) -28.85 (8.0339x 1 05 ) -4.7319(3.0513 xIO") 53 -6.0293 (0.0036) -28.6978 (0.0061) -4.2894 (1.0617x 1 06 ) 55 -3.2884 (0.0137) -12.5802 (0.0053) -4.6473 (1.3795x 106 ) 58 -3.4443 (0.0486) -18.8298 (0.0381) -4.2991 (4.5555xI07 ) 64 -1.2144 (0.2443) -17.0474 (0.0225) -3.9669 (176.27) 66 -6.1638 (0.0004) -27.2205 (0.0001) -4.7328 (1.5694x 10") 72 -1.3629 (0.2436) -4.8746 (0.0852) -2.5372 (0.0852) 77 -6.6049 (0.0011) -17.6073 (0.0027) -4.6794 (2.1707x 1 06 ) 78 -4.0894 (0.0162) -17.1729 (0.0108) -4.5121 (16199.9) 82 -3.9528 (0.0172) -24.5725 (0.0009) -4.7106 (1.1802x 10") 85 -1.1572 (0.2390) -9.7150 (0.0493) -3.4306 (89.05) 86 -3.3907 (0.0243) -15.4436 (0.0222) -4.2578 (326439) 88 -3.6453 (0.0122) -7.5765 (0.0306) -3.8037 (3512.27) 90 -2.4213 (0.0384) -5.8041 (0.0721) -2.1837 (42) 92 -2.3845 (0.0377) -4.9496 (0.0829) -2.2819 (44.63) 101 -3.0389 (0.0214) -4.5755 (0.0951) -1.7691 (33.78) 102 -3.4522 (0.0152) -15.5572 (0.0063) -4.5462 (22783) 103 -2.0287 (0.0913) -13.7772 (0.0102) -4.2033 (6641.29) 110 -1.5773 (0.1706) -4.7008 (0.0865) -2.6705 (52.76) 111 -5.5345 (0.0028) -47.8257 (0.0002) -4.7183 (8.5588x 1 06 ) 112 -4.0115 (0.0201) -10.7788 (0.1085) -4.2150 (182755) 115 -1.9829 (0.0963) -14.2771 (0.0067) -4.6843 (8.1902x 1 07 ) 117 -3.3084 (0.0432) -13.1131 (0.0811) -4.2444 (280646) 119 -1.1572 (0.2261) -5.7520 (0.0880) -2.9734 (60.12) 124 -4.5973 (0.0030) -18.0553 (0.0009) -4.7217 (3.2157xI08 ) 125 -1.1824 (0.2933) -10.3486 (0.0628) -3.4773 (83.22) 126 -1.7229 (0.1515) -7.5361 (0.0356) -4.3040 (135023) 133 -1.6483 (0.1127) -8.2072 (0.0255) -3.8907 (3616.86) 134 -2.0287 (0.0913) -9.0859 (0.0192) -4.0226 (4785.62) 136 -1.6851 (0.1128) -11.5489 (0.0142) -4.1128 (5171.84) 140 -2.5031 (0.0395) -9.5782 (0.0092) -4.4874 (417255) 146 -1. 7792 (0.1108) -8.8280 (0.0181) -4.0349 (4979.32) 147 -2.9581 (0.0241) -13.779 (0.0034) -4.6820 (2.1170x 1 06 ) tir Positive sites 73 1.6328 (0.1393) 5.2922 (0.0151) 1.7156 (105.97) 116 1.6183 (0.2253) 10.6655 (0.0541) 1. 9067 (151.26) 143 2.6744 (0.0659) 19.2092 (0.2180) 2.4510 (2187.19) 560 0.9818 (0.3540) 27.4443 (0.0767) 1.4540 (65.85) 566 1.5419 (0.2484) 5.4677 (0.0664) 1.5444 (79.51) Negative sites 5 -3.5275 (0.0064) -845.963 (4.81 x 1006 ) -1.0005 (5338.64) 7 -0.6575 (0.3333) -1.7783 (0.0686) -0.9563 (991.234) 17 -1.9726 (0.0370) -7.001 1 (0.0037) -0.9552 (842.10 1) 23 -0.6575 (0.3333) -1.9109 (0.0913) -0.9549 (1023.67) 32 -1.3201 (0.1181) -4.2737 (0.0184) -0.8984 (81.74) 37 -1.1867 (0.1364) -2.0810(0.0347) -0.9597 (1671.39) 40 -0.6575 (0.3378) -2.5989 (0.0638) -0.9562 (1260.97) 42 -1.3151 (0.1248) -2.7148 (0.0231) -0.9504 (481.96) 45 -0.6575 (0.3571) -1.3918 (0.0978) -0.9476 (731.11) 49 -0.9728.(0.2273) -2.6610 (0.0287) -0.9421 (489.43) 54 -0.8434 (0.2691) -1.5889 (0.0694) -0.9916 (4704.6) 141 62 -1.1758 (0.1864) -3.5133 (0.0390) -0.9779 (1451.6) 64 -0.4027 (0.5250) -5.6776 (0.0157) -0.9368 (232.41) 69 -1.3151 (0.1 111) -2.6241 (0.0277) -0.9550 (888.91) 81 -1.3151 (0.1111) -5.9 179 (0.0100) -0.9467 (334.59) 83 -1.9726 (0.0443) -7.6419 (0.0029) -0.9464 (787.14) 92 -1.1758 (0.20 11) -3.9076 (0.0421) -0.9737 (1408.74) 94 -0.6575 (0.3333) -1.6017 (0.0820) -0.9662 (2448.8) 98 -1.9726 (0.0404) -5.37 14 (0.0037) -0.9532 (564.73) 100 -0.6575 (0.3333) -1.3277 (0.0996) -0.9662 (2424.46) 103 -1.9071 (0.0409) -5.7059 (0.0035) -0.9640 (2056.5 1 ) 104 -1.1758 (0.1 864) -2.069 1 (0.0569) -1.0002 (5419.12) 112 -1. 1758 (0.1864) -4.4214 (0.0179) -1.0015 (12630.6) 113 -0.6384 (0.3522) -1.5532 (0.3522) -0.9568 (1608.69) 120 -0.6575 (0.3333) -1.7783 (0.0686) -0.9563 (991.23) 126 -1.3151 (0.1143) -3.6955 (0.0128) -0.9538 (580.85) 130 -0.6575 (0.3333) -1.7783 (0.0686) -0.9563 (991.23) 14 1 -1.1 758 (0.201 1) -2.4897 (0.0542) -0.9741 (1411.84) 146 -1.1758 (0.2291) -2.4897 (0.0598) -0.9684 (2216.69) 149 -1. 1 758 (0.1864) -6.6008 (0.1 864) -0.9780 (1478.58) 151 -1.1758 (0.2011 ) -4.3508 (0.0339) -0.9740 (1408.4) 157 -0.6575 (0.3333) -1.4996 (0.0922) -0.9586 (796.17) 158 -1.1758 (0.1864) -6.6015. (0.0 189) -1.00 13 (13527.7) 162 -0.6575 (0.3333) -1.7577 (0.0701 ) -0.9639 (2505.74) 163 -0.6575 (0.3333) -1.7855 (0.0838) -0.9563 (1036.88) 164 -0.6575 (0.3333) -1.7783 (0.0686) -0.9563 (99 1.23) 171 -1.3 151 (0.1111) -3.2960 (0.0167) -0.9719 (906.22) 188 -2.0687 (0.0982) -4.6061 (0.0982) -0.5524 (45.58) 233 -1.1 785 (0.1864) -1.3366 (0.0775) -1.0 104 (13529.1) 235 -0.6575 (0.3333) -1.7622 (0.0853) -0.9641 (2596.59) 251 -0.9728 (0.2329) -2.1727 (0.0387) -0.9384 (415.04) 255 -1.3 151 (0.1 111) -4.413 1 (0.01 17) -0.9466 (346.98) 256 -1.31 51 (0. 1 111) -6.5530 (0.0 105) -0.9467 (351.02) 257 -1.315 1 (0.1111) -3.1 044 (0.0 194) -0.9718 (1037.69) 258 -0.6575 (0.3333) -5.7874 (0.0668) -0.9564 (926.01) 264 -1.315 1 (0. 1111) -3.1303 (0.0215) -0.9466 (331.75) 266 -1.315 1 (0.1111) -2.8238 (0.0201) -0.9719 (901.55) 267 1.3 151 (0. 11 11) -2.5676 (0.0284) -0.9549 (937.76) 274 -1.3151 (0.1111) -2.2376 (0.0270) -0.9719 (954.01) 276 -2.3516 (0.0347) -38.6 13 1 (0.0026) -0.9802 (1603.76) 280 -1.9726 (0.0370) -5.0853 (0.0059) -0.9468 (345.84) 295 -2.35 16 (0.0404) -42.041 7 (0.0011) -0.9738 (1323.76) 296 -1.3151 (0.11 11 ) -2.5463 (0.0286) -0.9465 (381.91) 299 -3.2581 (0.0222) -22.5848 (0.0028) -0.5993 (123.48) 302 -2.0820 (0.91 4) -4.2 162 (0.061 1) -0.5990 (119.42) 303 -2.3516 (0.0524) -9.3769 (0.0069) -0.9689 (2224.69) 307 -1.6868 (0.0675) -2.7085 (0.01 69) -0.9947 (483 1.22) 31 6 -1.9726 (0.0502) -1 5.5879 (0.0009) -0.9397 (703.33) 31 9 -1 .1720 (0.1872) -2.7169 (0.0265) -0.9403 (775.87) ~ 330 -3.5275 (0.0120) -199.578 (0.0001) -0.9678 (1735.95) 334 -1.3 151 (0.1 1 11) -2.8250 (0.0283) -0.9465 (387.71) 335 1.3151 (0.1111) -3.8534 (0.0148) -0.9565 (950.22) 336 -1.1758 (0.20 11) -4.3508 (0.0334) -0.9740 (1 408.4) 350 -1.1758 (0.229 1) -2.0841 (0.0701 ) -0.9690 (2361.28) 356 -1.1758 (0.229 1) -2.0841 (0.0701) -0.9690 (2361.28) 142 358 -0.6575 (0.3333) -1.6169 (0.0907) -0.9465 (408.91) 363 -1.1758 (0.2011) -2.4855 (0.0545) -0.9733 (1331.01) 369 -0.6575 (0.3333) -1.3960 (0.0988) -0.9564 (664.22) 275 -1.1785 (0.1864) -4.1367 (0.0217) -1.0067 (9530.06) 376 -1.3613 (0.1725) -41.8312 (0.0245) -0.5617 (120.77) 388 -1.3151 (0.1111) -4.2017 (0.0106) -0.9588 (843.73) 389 -1.3151 (0.1111) -2.5619 (0.0226) -0.9719 (958.21) 392 -1.3151 (0.1111) -2.5490 (0.0232) -0.9663 (2433.47) 394 -1.2982 (0.1459) -3.2891 (0.0175) -0.9506 (586.01) 396 -1.1758 (0.1864) -4.4213 (0.0190) -0.9982 (4314.73) 401 -2.3516 (0.0524) -10.6157 (0.0046) -0.9681 (1948.22) 412 -1.3151 (0.1111) -5.2932 (0.0086) -0.9719 (972.87) 424 -1.1758 (0.1864) -4.4213 (0.0190) -0.9982 (4314.73) 428 -1.1758 (0.2291) -2.4897 (0.0598) -0.9684 (2216.69) 432 -2.3516 (0.0347) -6.3975 (0.0058) -0.9803 (1408.01) 443 -0.8434 (0.2802) -1. 7203 (0.0692) -0.9886 (4946) 444 -0.6575 (0.3333) -1.5895 (0.0921) -0.9641 (2599.01) 449 -1.1758 (0.1864) -2.0691 (0.0526) -1.0079 (10536.6) 457 -2.3516 (0.0347) -38.6131 (0.0026) -0.9802 (1603.76) 488 -1. 7953 (0.1412) -22.6794 (0.0161) -0.5433 (84.97) 503 -0.8438 (0.2597) -2.2556 (0.0568) -0.9960 (5429.08) 504 -2.3519 JO.0524) -10.6157 (0.0046) -0.9681 (1948.22) 514 -1.3151 (0.1254) -3.5752 (0.0151) -0.9490 (527.92) 516 -1.5175 (0.0834) -2.6597 (0.0231) -0.9714 (442.26) 524 -1.3151 (0.1111) -5.7211 (0.0084) -0.9568 (675.27) 527 -2.3516 (0.0347) -7.6563 (0.0029) -1.0069 (8059.29) 540 -1.2975 (0.1168) -3.5680 (0.0144) -0.9595 (1777.6) eae Positive sites 8 1.3667 (0.0877) 2.6851 (0.0105) 0.5131 (4214.5) 145 0.7956 (0.1878) 1.2862 (0.0957) 0.4631 (133.7) 152 1.1309 (0.1364) 1.9267 (0.0415) 0.5005 (1087.4) 467 0.5792 (0.4866) 1.3844 (0.0901) 0.4622 (121.1) 491 1.2512 (0.1120) 2.7197 (0.0155) 0.5288 (4032.5) 574 1.8327 (0.1378) 3.8645 (0.0444) 0.6789 (51.05) 597 0.8531 (0.2333) 1.4501 (0.0681) 0.4935 (359.7) 606 0.9095 (0.1989) 1.5620 (0.0896) 0.4743 (180.4) 616 1.0928 (0.1619) 2.0171 (0.0675) 0.4690 (146) 849 1.9930 (0.1499) 13.196 (0.0716) 2.5429 (4589.9) 851 2.3748 (0.0928) 13.5336 (0.01479) 2.6799 (59335.9) 854 2.7976 (0.0407) 7.2511 (0.0548) 2.6186 (635.7) 862 1.0189 (0.3242) 4.0909 (0.0788) 0.4626 (52.9) 863 2.5015 (0.0568) 14.3566 (0.0228) 2.6621 (2146.1) Negative sites 34 -3.7949 (0.0006) -12.6735 (3.27x 1 0°5) -1.3978 (79508.8) 36 -2.8491 (0.0040) -1 0.9146 (0.0004) -1.3326 (1024.4) 49 -1.5523 (0.0672) -3.2596 (0.0316) -1.1455 (28.1) 79 -2.2779 (0.0074) -4.5916 (0.0009) -1.3569 (2643.3) 80 -1. 9191 (0.0369) -3.8226 (0.0067) -1.0487 (102.4) 82 -2.4168 (0.0039) -6.2374 (0.0002) -1.3754 (19713.2) 89 -1.3667 (0.0525) -2.4347 (0.0125) -0.8208 (112.5) 90 -1.6459 (0.0248) -3.7205 (0.0018) -1.2673 (1208.3) 92 -2.6272 (0.0068) -7.8735 (0.0004) -1.3297 (2946.1) 96 -1.9287 (0.0247) -6.3061 (0.0024) -1.2236 (268) 143 97 -1.3667 (0.0370) -3.1 343 (0.0045) -1.1389 (502.6) 99 -1.7346 (0.0306) -1.9306 (0.0151) -0.7361 (46.7) 104 -2.7335 (0.0013) -5.2285 (0.0002) -1.3953 (39753) 117 -1.2582 (0.0474) -3.0634 (0.0052) -1.1427 (491.6) 121 -3.52 14 (0.00 17) -4.9788 (0.0007) -1.3596 (6763.2) 123 -2.0501 (0.0 178) -4.4389 (0.0070) -1.3047 (298.7) 124 -2.0452 (0.01 09) -5.3952 (0.0004) -1.3800 (6308.7) 125 -1.8223 (0.0123) -3.5497 (0.0020) -1.2037 (1618.4) 138 -2.7335 (0.0013) -7.8513 (2.89x 1 0°5) -1.4052 (189223) 141 -5.3353 (2.48 10°5) - 146.928 (6.69x 1 0°5) - 1 .4075 (644004) 142 -1.8223 (0.0 123) -3.5740 (0.00 18) - 1.2404 (2397.7) 151 -1.7331 (0.0307) -1.9333 (0.0187) -0.7383 (44) 162 -1.8223 (0.0 123) -3 .571 9 (0.0019) -1.2018 (1636.9) 170 - 1.8223 (0.0123) -4.6965 (0.0008) -1 .3170 (4025 .7) 172 -3.7949 (0.0006) -12.6739 (2.23x 1 0°5) - 1.3984 (1 17061) 173 -1.3667 (0.0307) -2.061 2 (0.0 1 10) -0.6866 (138.5) 180 -2.1831 (0.0057) -3.8963 (0.0009) - 1.3159 (5766.9) 181 -1.3667 (0.0400) -3.2938 (0.0048) -1.1391 (444.7) 195 -1.3667 (0.0370) -3 .2470 (0.0049) -1.1608 (563.5) 205 -1.3667 (0.0370) - 1.9794 (0.0130) -0.628 1 (123.8) 261 -1.3667 (0.0370) -2.5992 (0.0073) -0.9628 (273.9) 270 -4.41 58 (0.0001) -7.9833 (6.84 xl005) -1.3995 (133058) 303 -3.4743 (0.0009) -6.0199 (0.0002) -1.3654 (25437.3) 326 -1.3667 (0.0370) -2. 1743 (0.0109) -0.6284 (120.1) 329 -1.3667 (0.0370) -2.0339 _(0.0 105) -0.6706 (151.8) 330 -1.7424 (0.0303) -1.9979 (0.0 144) -0.7675 (47) 333 -1.8223 (0.0123) -4. 1637 (0.0009) -1.3255 (6415.1) 337 -1.9347 (0.0363) -9.3495 (0.0021) -1.2716 (332) 338 -1.9049 (0.0 141) -4.0271 (0.00 10) -1.3628 (3682.5) 341 -3.51 69 (0.001 7) -5.2 195 (0.0007) -1.3623 (7187.4) 345 -1.3667 (0.0370) -2.2930 (0.008 1) -0.8322 (219.1) 350 -1.91 91 (0.0368) -6.0841 (0.0046) -1.2135 (206.3) 351 -1.7424 (0.0375) -4. 1812 (0.0053) -1.0861 (119.8) 363 -1.5945 (0.0452) -3. 1585 (0.0210) -1.2083 (88.7) 379 -2.8623 (0.0071) -9.8857 JO.0005) -1.3526 (3169.8) 419 -1.2222 (0.061 7) -2.7987 (0.0098) -0.9742 (78.7) 493 -1.8223 (0.0 123) -4.061 1 (0.001 1) -1 .3063 (4962.9) 494 -4.0481 (0.0009) -7.9082 (0.0005) -1.3651 (6763.1) 497 -2.2779 (0.004 1) -5.72 13 (0.0002) -1.3867 (29655) 509 -3.6420 (0.0007) -12.6561 (4.01 xl 0°5) -1.3963 (62152.7) 520 -1 .3667 (0.0370) -2.9609 (0.0049) -1.1007 (496.4) 521 -1.8223 (0.0 123) -5.2570 (0.0005) -1.3571 ( 10987) 528 -1.3667 (0.0370) -2.8698 (0.0054) -0.9828 (310.6) 536 -1.3667 (0.0375) -2.092 (0.0100) -0.6885 (157) 538 -1.7424 (0.0303) -1.9979 (0.0 142) -0.7686 (50.2) 540 -1.7424 (0.0303) -1 .9978 (0.0 170) -0.7679 (48) 544 -1.3667 (0.0046) -3.1 011 (0.0046) -1.1325 (500.4) 549 -1.2477. (0.0607) -2.4087 (0.0086) -0.8756 (248.2) 553 -4.5502 (0.0003) -25.8282(2.1 8 x l 0 (6 ) -1.4058 (228408) 554 -2.2779 (0.004 1) -9.0308 (7.94 xl 005 ) -1.3973 (45208.9) 565 -1.8223 (0.01 23) -4.8453 JO.0009) -1.3406 (5485.7) 568 -1.8223 (0.01 23) -6.1954 (0.0006) -1.3486 (7402.8) 579 -1.3667 (0.0370) -4.09 1 1 (0.0027) -1.2368 (945.6) 584 -1.8223 (0.0123) -5.1 873 (0.0007) -1.3406 (5468.2) 144 596 -1.3667 (0.0370) -3.6760 (0.0035) -1.1849 (636.3) 601 -1.3667 (0.0370) -3.6760 (0.0035) -1.1849 (636.3) 602 -1.3667 (0.0567) -2.2973 (0.0144) -0.6945 (83.6) 603 -1.3667 (0.0484) -2.2260 (0.0107) -0.6673 (133.3) 607 -0.9010 (0.2344) -8.1549 (0.0003) -1.3964 (1547.8) 614 -1.8223 (0.0123) -4.0491 (0.0013) -1.2969 (3767) 621 -1.3667 (0.0370) -2.6274 (0.0067) -0.9850 (311.6) 625 -1.8075 (0.0340) -4.8818 (0.0038) -1.1386 (155.5) 630 -2.2779 (0.0053) -5.4027 (0.0003) -1.3729 (17650) 639 -1.3667 (0.0370) -2.5912 (0.0076) -0.9276 (239.5) 659 -4.7251 (0.0001) -43.6819(7.42 xlOo7 ) -1.4080 (856126) 667 -2.8313 (0.0055) -7.4009 (0.0004) -1.3326 (3296.5) 669 -2.0990 (0.0162) -6.3546 (0.0029) -1.3347 (729.9) 670 -1.3667 (0.0370) -2.4543 (0.0083) -0.8224 (187.7) 677 -1.1389 (0.1111) -3.6044 (0.0338) -1.1664 (68.6) 680 -3.7108 (0.0015) -11.3022 (0.000 1) -1.3909 (15710.7) 682 -1.3667 (0.0370) -3.8336 (0.0032) -1.2069 (728.1 ) 684 -1.3667 (0.0370) -2.8489 (0.0052) -1.0255 (344.3) 686 -2.7798 (0.0058) -1 1.509 (0.000 1) -1.3533 (4753.3) 690 -1.8223 (0.0123) -4.4282 (0.00 11) -1.3181 (3999.8) 691 -1.8390 (0.0664) -4.4531 (0.0429) -0.8628 (20) 698 -2.6788 (0.0049) -4.3806 (0.0016) -1.2603 (611.4) 705 -1.1977 (0.1104) -3.8195 (0.0213) -1.2234 (65.9) 730 -1.7886 (0.0851) -8.8787 (0.0235) -0.8346 (225.4) 733 -2.4423 (0.0625) -8.9931 (0.0243) -0.8204 (30.2) 734 -1.5945 (0.0452) -4.1337 (0.0129) -1.2758 (174.8) 742 -2.7326 (0.0189) -13.886 (0.0025) -1.2226 (106.5) 749 -2.6897 (0.0244) -12.3167 (0.0037) -0.9075 (95.7) 754 -1.8551 (0.0615) -7.5285 (0.0138) -0.8788 (62.4) 780 -2.0345 (0.0885) -9.5869 (0.0451) -0.8280 (97.9) 786 -1.8647 (0.0999) -7.1381 (0.0543) -0.8250 (57.5) espb Negative sites 4 -1.8262 (0.0739) -2.6135 (0.0192) -1.1357 (1687.99) 20 -0.7448 (0.3333) -1.9671 (0.0889) -1.0937 (242.39) 38 -1.1364 (0.2259) -2.7252 (0.0268) -1.0775 (339) 40 -0.7448 (0.3333) -2.0099 (0.0609) -1.0937 (288.91) 44 -1.4897 (0.1111) -2.9406 (0.0174) -1.1093 (460.45) 52 -1.1796 (0.2242) -2.3249 (0.0645) -1.1142 (771.90) 65 -1.1796 (0.2665) -2.3186 (0.0793) -1.0929 (1733.33) 69 -1.1796 (0.2665) -2.4290 (0.0768) -1.0958 (1973.96) 71 -1.1796 (0.2665) -3.8804 (0.0410) -1.0902 (1464.69) 74 -1.1796 (0.2665) -3.8804 (0.0410) -1.0902 (1464.69) 79 -1.1796 (0.2665) -2.7162 (0.0698) -1.0899 (1503.36) 86 -1.1796 (0.2665) 2.3186 (0.0793) -1.0929 (1733.33) 89 -0.7448 (0.3333) -2.0101 (0.0657) -1.0853 (195.49) 92 -1.1762 (0.2242) -2.3249 (0.0654) -1.1114 (771.90) 94 -2.3592 (0.0502) -10.3893 (0.0027) -1.1198 (900.82) 98 -0.7448 (0.3333) -1.5036 (0.0985) -1.0937 (248.69) 99 -1.4897 (0.1111) -2.1693 (0.0404) -1.0855 (198.61) 103 -0.7448 (0.3333) -1.5576 (0.0853) -1.1291 (2555.58) 104 -0.7448 (0.3333) -1.6474 (0.0850) -1.1296 (1518.03) 106 -0.9131 (0.2719) -1.376 (0.0809) -1.1335 (1556.67) 112 -0.9131 (0.2719) -1.2826 (0.0890) -1.1339 (1559.4) 117 -0.7448 (0.3333) -1.7551 (0.0936) -1.0853 (165.71) 145 120 -1.1762 (0.2104) -1.7437 (0.0789) -1.1245 (1192.98) 122 -1.4897 (0.1111) -3.3822 (0.0213) - 1.0854 (156.68) 125 -2.2345 (0.3753) -16.183 (0.0004) - 1. 1 290 (1 1 14.74) - 155 -0.7448 (0.3333) -3.9572 (0.0470) -1.0853 (170.96) 160 -1.4897 (0.1111) -5.091 8 (0.0122) -1.0855 (164.86) 171 -1.1796 (0.2665) -2.3896 (0.0847) -1.0971 (2321.89) 180 -1 .4897 (0.1111) -3.1816 (0.0238) -1 .0853 (186.39) 194 -0.7462 (0.3335) -20.6478 (0.0122) -1.0129 (59.36) 198 -0.7448 (0.0976) -1.5576 (0.0976) -1.0852 (195.89) 206 -0.7448 (0.3333) -1.7551 (0.0936) -1.0853 (165.71) 209 -0.7448 (0.3333) -1.5576 (0.0976) -1.0852 (195.89) 233 -1 .4897 (0.1111) -2.2308 (0.0499) -1 .0938 (264.67) 238 -1.4897 (0.1111) -45.5799 (0.0035) -1.1093 (457) 240 -1.1796 (0.2104) -1.8300 (0.0607) -1.1647 (9740.82) 242 -0.7448 (0.3333) -2.010 1 (0.0657) -1 .0853 (195.49) 244 -1 .4897 (0.1111) -28.8899 (0.0043) -1.1293 (2473) 246 -1.1796 (0.2242) -3.8800 (0.0307) -1.1 187 (985.38) 254 -1.1796 (0.2242) -2.7 162 (0.0572) -1.1090 (689.66) 255 -1 .4897 (0.1236) -4.2649 (0.0206) -1.0548 (220.97) 257 -1.1 796 (0.2442) -2.3249 (0.0605) -1.1207 (1160.02) 258 -1 .4897 (0.1129) -2.5523 (0.0349) -1 .0583 (256.68) 264 -1.1796 (0.2242) -2.3249 (0.0645) -1 . 1 1 14 (771 .90) 265 -1.1 796 (0.2665) -2.4290 (0.0768) -1.0958 (1973.96) Lista parcial de las secuencias obtenidas y su número de acceso en el GenBank de cada marcador usado en los estudios de selección y de reconstrucción fi logenética. putp EC02 AF230602 Escherichia coli 2 putP gene, partial cds EC0 45 AF230630 Escherichia coli 45 putP gene, partial cds Eco78 AF230620 Escherichia coli 78 putP gene, partial cds Eco 161 AF230614 Escherichía coli 161 putP gene, partíal cds Eco268 AF230603 Escherichia coli 268 putP gene, partial cds Eco270 AF230604 Escherichia coli 270 putP gene, partial cds Eco288 AF230623 Escherichia coli 288 putP gene, partial cds Eco820 AF230616 Escherichia coli 820 putP gene, partial cds Eco 1668 AF230625 Escherichia coli 1668 putP gene, partial cds Eco 1684 AF230605 Escherichia coli 1684 putP gene, partial cds Eco 1698 AF230606 Escherichia coli 1698 putP gene, partial cds Eco 1930 AF230626 Escherichia coli 1930 putP gene, partial cds Eco21 65 AF230607 Escherichia coli 2165 putP gene, partial cds Eco2374 AF230624 Escherichia coli 2374 putP gene, partial cds Eco5026 AF2306 11 Escherichia coli 5026 putP gene, partial cds Eco 5074 AF230633 Escherichia coli 5074 putP gene, partial cds Eco T A002 AF230634 Escherichia coli T A002 putP gene, partial cds EcoK 12 AE000203 E.coli K 12 from human ECORI0 L01 150 ECORI0 from human 06:HI0 ECOR32 L0 11 52 ECOR32 from giraffe 07:H21 146 ECOR52 LOl154 ECOR52 from orangutan 025:Hl ECOR58 LOl155 ECOR58 from lion 0112:H8 ECOR70 LOl158 ECOR70 from gorilla 078:NM E8305-87 LOl157 E8305-87 from horse 0157:NM E851819 LOl159 E851819 from pig 0157:NM gapa Ecol2 AF230542 Eco145 AF230562 Ecol46 AF230563 Ecol47 AF230564 EcoI55 AF230540 Ecol78 AF230547 Eco1161 AF230555 EcoI268 AF230551 Ecol270 AF230552 Eco1271 AF230548 EcoI287 AF230549 Eco1288 AF230550 EcoI298 AF230541 EcoI820 AF230543 EI1668 AF230557 E 1684 AF230553 E1698 AF230554 E1930 AF230558 E2026 AF230559 E2165 AF230534 E2274 AF230535 E2314 AF230544 E2339 AF230545 E2355 AF230560 E2357 AF230561 E2374 AF230556 E2382 AF230536 E4981 AF230546 E4999 AF230537 E5026 AF230538 F.5028 AF230535 E5074 AF230565 ET A002 AF230566 ET A243 AF230567 ESou57 AF230652 ESou207 AF230653 ESou273 AF230654 EcoIK 12 AE000273 Ecor 10 M66870 147 Ecor 14 M66871 Ecor32 M66872 Ecor40 M66873 Ecor52 M66874 Ecor58 M66875 Ecor64 M66876 Ecor70 M66877 E3406 M66878 E266674 M66879 E830587 M666880 E851819 M666881 A8190M8 M666882 Ecor4 U07773 Ecor8 U07754 Ecor 16 U 07772 Ecor39 U07771 Ecor65 U07768 Ecor68 U07765 Ecor38 U07752 Ecor49 U07770 Ecor50 U07769 E0157H7 AE005401 EcolUTEC AE016761 ETA79 AY301113 ETA57 AY301112 ETA157 A Y30 1109 ETA479 AY301111 ETA234 AY301110 mdh Ecol45 AF230596 Eco178 AF230582 Ecol268 AF230586 Eco1271 AF230583 Ecol287 AF230584 E820 AF230578 E1684 AF230588 E2026 AF230593 E2165 AF230568 E2274 AF230569 E5026 AF230572 E5074 AF230599 ET A002 AF230600 Esou57 AF230656 Esou207 AF230657 Esou273 AF230658 148 EcoIKl2 AE000403 ECORIO U04742 ECOR40 U04770 ECOR58 U04753 E830587 U04757 ECOR49 U04750 ECOR5 AF004204 ECOR37 AF00420 E234869 AF071 028 E0157H7 AF071027 EM501 AF004171 EA8190 U04759 ERT030A AF091767 ERT008A AF91762 E851819 U04758 Ecor70 U04755 ERT272 AF091775 ERT082 AF091770 Ecor6 AF004209 ERT213 AF091774 ERTI04 AF091772 Ecor50 U04751 EC5458 AF071030 fima 013186 pathogenic 078 M27603 J96 from human U208150157:H7 y 10902 562 uropathogenic Z37500 MT78 avian strain AF206642 Souza 2 dog AF206639 55 golden eagle AF206643 78 painted spiny pocket mouse AF206644 161 Souza AF206645 268 Souza AF206646 270 Souza AF206647 271 Souza AF206648 287 Souza AF206640 288 Souza AF206649 298 Souza AF206650 820 Souza AF206651 1684 Souza AF206641 1698 Souza AF206652 2165 Souza AF206653 2274 Souza AF206654 2314 Souza 149 AF206655 2339 Souza AF206656 4981 Souza AF206657 4999 Souza AF206658 5026 Souza AF206659 5028 Souza EcolK12 Ecol0157H7 EcolUTEC CFT073 EAPEC56 AF490880 Estruis AF 490890 EAPEC7 AF490886 EAPEC5 AF 490883 EAPEC16 AF490876 EAPEC15 AF490875 EAPEC 133 AF490872 EAPEC60 AF490884 EAPEC57 AF490881 EAPEC53 AF490878 EAPEC137 AF490873 EAPEC54 AF490879 EAPEC13 AF490874 EAPEC6 AF490885 EAPEC128 AF490871 EAPEC58 AF490882 EAPEC121 AF490869 EcolMT203 AF490888 EcolLF82 AF286465 EAPEC125 AF490870 EcolMT512 AF490889 EAPEC21 AF490877 EAPEC 115 AF490868 !ir Ecol 0157:H45 AB036053 Ecol 0111:H AF025311 Ecol 562 murine AB026719 Ecol 0103:H2 AFl13597 Ecol RPEC 84 U59502 Ecol STEC AF070068 Ecol E65/56 AF 132728 Ecol E83/39 RPEC U59504 Ecol EPEC 87a AF070069 Ecol 95SF2 AF070067 Ecol 86/24 AF 125993 150 eae AF530556 EAE562beta intiminbeta Bovine A Y22351 O EAE562zeta intimin zeta AF081185 ECOR37 gamma intimin isolated from marmoset AF081184 EPECDEC5d gamma intimin AF530554 EAESTE~ ovine 02 related H19 intimin epsilon Af530557 EAElambda non STEC bovine AF449418 EAEDEC8a theta intimin 0111:NNM 2198/77 AY186750 EAEepsilon 0121:H19 AF081187 EAEDEC12a beta intimin EPEC AF530555 EAEalpha2 from healthy H.sapiens baby espb AF254455 EcolCL617 AF254454 EcolCL559 AJ287422 EcolIHIT3669 AJ28741 EcolIHIT3000 AJ287419 EcolIHIT1190 AJ287420 EcolIHIT1968 AJ287418 EcolIHIT0067 AF059713 Eco185/150 U65681 Ecol4221dog AF144010 Eco1E65/56 AF144009 Eco183/39 AF 144008 Eco184111 0-1 AF054421 EcolBlO AF064683 Ecol1390 151