UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Maestría y Doctorado en Ciencias Bioquímicas ELIMINACIÓN DE SECUENCIAS VIRALES DE Sf-RHABDOVIRUS EN CÉLULAS DE Spodoptera frugiperda Sf9 MEDIANTE EL SISTEMA DE CRISPR-Cas13a. TESIS QUE PARA OPTAR POR EL GRADO DE: Maestro en Ciencias PRESENTA: ALONSO ULISES PÉREZ HERNÁNDEZ Tutor principal DRA. LAURA ALICIA PALOMARES AGUILERA INSTITUTO DE BIOTECNOLOGÍA-UNAM Miembros del comité tutor DRA. MABEL RODRÍGUEZ GONZÁLEZ DR. CARLOS FEDERICO ARIAS ORTIZ Programa de Maestría y Doctorado en Ciencias Bioquímicas CUERNAVACA, MORELOS. NOVIEMBRE DE 2023 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. II CONTENIDO Abreviaturas IV Resumen V 1. Introducción 1 1.1 Sistema de expresión de células de insecto-baculovirus 1 1.2 Descubrimiento de un nuevo virus adventicio en células de insecto por el sistema IC-BES 1 1.3 Ciclo de replicación viral de Sf-rhabdovirus 6 1.4 Sistema CRISPR-Cas13 9 1.5 Sistema CRISPR-Cas13a como estrategia de eliminación de ARN viral 13 2. Justificación 16 3. Hipótesis 17 4. Objetivos 17 4.1 Objetivo general 17 4.2 Objetivo específico 17 5. Metodología 18 5.1 Líneas celulares 18 5.2 Determinación de la concentración celular, diámetro y % de viabilidad 18 5.3 Extracción de ARN 18 5.4 Síntesis de cDNA 18 5.5 PCR 18 5.6 Diseño de CRISPR-ARN (crARN) 20 5.7 RT-qPCR 21 5.8 Microscopía electrónica de transmisión 23 5.9 Clonación de LwaCas13a-P2A-GFP 23 5.10 Síntesis del ARNm de LwaCas13a 25 5.11 Transfección de ARNm y crARNs en células Sf9 25 5.12 SDS-PAGE y Western blot 26 6. Resultados y discusión 27 6.1 Identificación de SfRV en líneas celulares derivadas de S. frugiperda 27 6.2 Diseño de crARNs para LwaCas13a 28 6.3 Estandarización de la RT-qPCR 31 6.4 Transcripción in vitro 33 6.5 Estandarización de las condiciones de transfección de células Sf9 34 6.6 Evaluación de ARN Cas13a-msfGFP y crARNs sintéticos en células Sf9 36 7. Conclusión 40 8. Perspectivas 41 III 9. Referencias 42 Anexo 1 45 Anexo 2 50 Anexo 3 51 Anexo 4 53 Anexo 5 54 IV ABREVIATURAS ADN: Ácido desoxiribunocleico ARN: Ácido ribonucleico ARNm: Ácido ribonucleico mensajero ATCC: American Type Culture Collection cDNA: ADN complementario crARN: CRISPR ARN CRISPR-Cas: Clustered Regularly Interspaced Short Palindromic Repeats – CRISPR Associated Sequences DR: Direct-Repeat HEPN: Higher Eukaryotes and Prokaryotes Nucleotide-binding IC-BES: Insect Cells-Baculovirus Expression System MPS: Massive Parallel Sequencing ORF: Open Reading Frame PFS: Protospacer Flanking Site RdRp: RNA-dependent RNA polymerase SfRV: Spodoptera frugiperda Rhabdovirus TEM: Transmission electron microscopy V RESUMEN Las células del insecto Spodoptera frugiperda se utilizan ampliamente como huéspedes del sistema IC-BES (por las siglas en inglés, Insect Cells-Baculovirus Expression System) para la expresión de proteínas recombinantes. Sin embargo, se descubrió que las líneas celulares Sf9, Sf21 y aquellas derivadas de las primeras están contaminadas con un virus conocido como Sf-rhabdovirus o SfRV. La presencia de este virus en una línea celular de alto interés industrial es una preocupación para aquellos dedicados a la fabricación de productos biológicos de uso humano y veterinario a través de esta plataforma. La eliminación exitosa de los virus de las células de insecto garantiza la bioseguridad del sistema IC-BES. Con el fin de dar solución a este desafío, el presente trabajo se enfocó en desarrollar un método basado en el sistema CRISPR-Cas9 para la obtención de líneas celulares Sf9 libres de SfRV aptas para su uso dentro del sistema IC-BES, a partir de células Sf9 infectadas con este virus y de herramientas de evaluación para identificar cultivos infectados de los no infectados. Se ha reportado por otros grupos el uso exitoso del sistema CRISPR-Cas9 en células de S. frugiperda para el mejoramiento de la plataforma IC-BES, aunque en general las herramientas disponibles para la biología molecular de células de insecto son limitadas. En el presente estudio se confirmó la presencia de SfRV variedad X- en cultivos de células Sf9. Además, los datos de RT-qPCR sugieren que existe una replicación del genoma rhabdoviral durante el cultivo de células Sf9, con una concentración máxima a las 120 h de cultivo, sin señales de un efecto citopático evidente en las células infectadas, y cuya población es diluida al realizar el pase celular. Estudios recientes han demostrado que los efectores LwaCas13a pueden interferir en la replicación de los virus con genoma de ARN monocatenario, mediante la eliminación selectiva de su genoma y sus transcritos virales. Por lo tanto, se abordó una estrategia antiviral a través de la expresión transitoria del sistema CRISPR-LwaCas13a basada en ARNs mensajeros, con el gen de la proteína verde fluorescente (EGFP) como reportero. Se identificaron 56 secuencias de nucleótidos que teóricamente CRISPR-Cas13a puede cortar en el gen codificante de la polimerasa de SfRV (RdRp), gen esencial para la replicación de SfRV. Se establecieron con éxito las condiciones experimentales para la transfección de células Sf9 con ARNm sintetizado in vitro, con base en la presencia de la EGFP. Utilizando esas condiciones, no se observó expresión de la EGFP cuando se transfectó con ARNm codificante de la proteína efectora Cas13 fusionada a la EGFP. Este resultado puede ser debido a degradación del ARNm por la falta de elementos estabilizadores, como UTRs, en sus extremos 3’. Aunque este trabajo no llegó a la fase de evaluación del sistema CRISPR-Cas13a, la información recolectada y generada aporta al planteamiento de este tipo de estrategias en células Sf9. Por ejemplo, añadir secuencias tipo UTR a los nuevos diseños de ARNm de Cas13a, o utilizar plásmidos portadores del transgén bajo el potenciador hr5 y el promotor ie1, ambos elementos derivados del AcMNPV para la expresión directa en células de insectos Sf9, podría resolver el problema y resultar en la expresión del gen de interés. 1 1. INTRODUCCIÓN 1.1 Sistema de expresión células de insecto-baculovirus. El sistema de expresión de proteínas recombinantes en células de insecto-baculovirus (IC-BES) consiste en la infección de células de insecto con un baculovirus recombinante que posee el gen de interés. Fue desarrollado por Gale Smith y Max Summers en 1983 (Smith & Summers, 1983) ganando de inmediato reconocimiento. Hoy en día es ampliamente utilizado por su versatilidad, velocidad, simplicidad y capacidad de producción de proteínas con modificaciones postraduccionales y de múltiples subunidades. Desde su creación, el IC-BES surgió como un sistema para su uso en laboratorios académicos e industriales, aunque más recientemente ha resurgido como una plataforma para la producción de varios productos biológicos, como vacunas o inmunomoduladores de uso humano (Cervarix®, Provenge®, y Flublok®) o veterinario (Bayovac® CFS, Porcilis® Pesti, Porcilis® PCV, Ingelvac Circoflex® y Best-H5®) (Palomares et al., 2015). Las líneas celulares más comúnmente utilizadas como hospederas del sistema IC-BES se derivan de Trichoplusia ni o de Spodoptera frugiperda, y la mayoría de los productos biológicos son fabricados con células derivadas del segundo (Smith & Summers, 1983). Originalmente se desarrolló el sistema IC- BES utilizando como hospedero a la línea celular Sf21, aislada del tejido de pupa de ovario de S. frugiperda. Posteriormente fueron aisladas la línea celular Sf9, y sus clonas hijas, incluyendo Super 9 y expresSF+® (SF+), como líneas celulares más productoras (Palomares et al., 2015). 1.2 Descubrimiento de un nuevo virus adventicio en células de insecto utilizadas por el sistema IC-BES. Las células de Spodoptera frugiperda Sf9 son comúnmente analizadas bajo una estrategia integral para mitigar el riesgo de contaminación por algún agente adventicio viral durante la fabricación de productos biológicos. Esto incluye pruebas exhaustivas a los materiales de partida, como líneas celulares y reactivos del cultivo celular, utilizando ensayos que demuestren la presencia o ausencia de agentes conocidos en varias etapas de la producción. Sin embargo, para detectar la presencia de nuevos virus, es necesario a recurrir a técnicas más recientes y avanzadas, como secuenciación masiva en paralelo o MPS (por las siglas en inglés Massive Parallel Sequencing), microarrays de virus o PCR de largo alcance. En el 2014, Ma et al. del Centro de Investigación y Evaluación de Biológicos de la Administración de Alimentos y Medicamentos (FDA) en Estados Unidos, identificaron inicialmente la presencia de un virus adventicio en células Sf9, el Sf-rhabdovirus (SfRV), mediante la relación de una secuencia de nucleótidos perteneciente a fragmentos obtenidos por PCR degenerada de células Sf9 que fueron ensambladas utilizando datos de MPS. Se identificó el gen de la proteína L a través de identificar dominios altamente conservados. El gen de la proteína L codifica la ARN polimerasa dependiente de ARN de los Mononagavirales, y se usa generalmente para determinar relaciones evolucionarias entre virus ARN que contienen esta proteína (Poch et al., 1990). El resto del genoma del virus se 2 determinó mediante el ensamblaje gradual de contigs superpuestos y lecturas (No. de acceso en el Genbank KF947078.1). Este consiste en una cadena de ARN no segmentada de polaridad negativa, característica típica del orden de los Mononegavirales, con una longitud de 13,534 nt. El análisis de su genoma reveló que contiene 6 marcos abiertos de lectura u ORF (por las siglas en inglés Open Reading Frame) (Figura 1), comunes entre los miembros de la familia Rhabdoviridae. Figura 1. A) Organización del genoma y B) estructura de viriones de Rhabdovirus. Los ORF codifican para la nucleoproteína (N), la fosfoproteína (P), la proteína matriz (M), la glicoproteína (G), y la polimerasa viral (L). El sexto ORF, designado como X, es un gen común entre los miembros del género Cytorhabdovirus y Nucleorhabdovirus. y continua en estudio de su posible función (Ma et al., 2014; Knipe, 2013). Mediante análisis molecular filogenético de la proteína L, se determinó la historia evolutiva del virus utilizando el método de máxima probabilidad basado en el modelo de sustitución Whelan y Goldman (WAG) (Whelan & Goldman, 2001). Los resultados mostraron que SfRV tiene un alto grado de identidad con el virus Taastrup (aún sin clasificar), transmitido por el saltamontes, y con otros virus de plantas del género Cytorhabdovirus, más que con rhabdovirus de vertebrados o invertebrados. Esto es de especial importancia, pues ciertos rhabdovirus de mamíferos han representado importantes problemas de salud pública, como es el caso del virus de la rabia (RABV) o el virus de la estomatitis vesicular (VSV), por lo que es relevante identificar aquellos rhabdovirus que tengan similitudes con estos (Knipe, 2013). Adicionalmente, para confirmar la presencia del virus intacto, se analizó el sobrenadante filtrado de un cultivo de Sf9 mediante microscopia electrónica de transmisión (TEM), que reveló la presencia de virus una morfología balar o bacilar típica de rhabdovirus (Figura 2). Finalmente, a través análisis de infectividad, Ma et al. (2014) determinaron que líneas celulares de S. frugiperda, incluidas Sf21 y Sf9, obtenidas de dos fuentes comerciales acreditadas (ATCC e Invitrogen), están contaminadas con SfRV y que se trata de una infección con un rango de huéspedes relativamente estrecho, limitado a algunas especies de insectos lepidópteros, como las líneas celulares de insecto Heliothis subflexa HsAM1 y A) B) 3 Bombyx mori Bm-N, pero ausente en otras, como las células de Trichoplusia ni High Five® o células de Drosophila S2 (Ma et al., 2014; Maghodia et al., 2016). Dicho hallazgo fue confirmado independientemente por Takeda Vaccines, Inc, y otros investigadores (Haynes, 2015; Geisler & Jarvis, 2016; Schroeder et al., 2019), que reconocieron a Sf-rhabdovirus como un contaminante frecuente de estas líneas celulares. Figura 2. Microscopia (TEM) del SfRV concentrado a partir del sobrenadante de células Sf9. Tinción negativa del pellet después de la fijación con 2% de paraformaldehído y teñido con 2% de molibdato de amonio (Ma et al., 2014). Como parte del esfuerzo por encontrar otros rhabdovirus, Geisler & Jarvis (2016) descubrieron secuencias tipo rhabdovirus presentes en el genoma y transcriptoma de células Sf9 (Figura 3). Estos elementos virales endógenos (EVEs) son ORFs tipo SfRV intactos de los genes N, P y ORFs parciales de los genes G y L, que resultaron de la integración parcial de material genético viral al genoma de la célula huésped. Es teóricamente imposible que estos ORFs por sí solos produzcan una partícula viral activa porque: 1) están diseminados en 4 loci, 2) los ORFs G y L están incompletos y 3) faltan los ORFs M y X. Sin embargo, el hallazgo de este tipo de secuencias sugiere que, para la búsqueda de nuevos virus o la adecuada detección de los ya conocidos en células utilizadas para la fabricación de productos biológicos, se debe tener en cuenta tanto las secuencias genómicas como las transcritas para identificar los EVEs y evitar falsos positivos en la detección de virus adventicios capaces de llevar a cabo la replicación. Figura 3. Secuencias tipo rhabdovirus presentes en el genoma de células Sf9. Posiciones y tamaños relativos de secuencias tipo rhabdovirus comparadas sus homólogos en el genoma de SfRV (Geisler & Jarvis, 2016). 4 Hasta la fecha se tienen reportadas dos variantes del SfRV (Hashimoto et al., 2017). Una de estas se distingue por carecer de 320 nt en su genoma, correspondiente a unos 120 nt del extremo 5’ del gen X y unos 200 nt de la región intergénica entre el gen X y el gen L. A esta variante se le conoce como Sf-rhabdovirus X-; y a la que tiene el gen X completo se le conoce como Sf-rhabdovirus X+ (Figura 4). Figura 4. Variantes de SfRV en células Sf9. El nuevo codón de paro del gen X está marcado por un asterisco (Hashimoto et al., 2017). Con esta información, Ma et al. (2019) decidieron hacer un estudio más profundo. Ellos encontraron que las células Sf21 tienen la variante SfRV X- y que las células Sf9 tienen la variante X+ o X-, dependiendo del banco celular del que provienen. Y no solo eso, sino que algunas células X+ perdían el fragmento de 320 nt conforme se realizaban los pases celulares por dilución limitante, pero sin que el virus perdiera su capacidad infecciosa. En contraste, este fragmento se encuentra presente en todos los SfRV aislados de poblaciones salvajes de S. frugiperda, sugiriendo que este gen es importante en el contexto de las infecciones a insectos. Análisis más recientes han mostrado que el gen X podría codificar para una viroporina. Estas proteínas son altamente hidrofóbicas, formando agregados que se integran en las membranas celulares, dando lugar a la formación de poros hidrofóbicos. La formación de estos poros altera un gran número de funciones celulares, participando en la citopatogénesis viral. Las viroporinas son necesarias para la replicación y la formación de nuevos virus y pueden participar en distintos pasos del ciclo viral, tales como la entrada, la replicación del genoma viral o la salida de nuevas partículas infecciosas (Hashimoto et al. 2017). Gracias a una línea celular Sf9 rhabdovirus negativo (Sf-RVN) desarrollada por Maghodia et al. (2017), se sabe que SfRV no afecta la capacidad de síntesis de proteínas recombinantes a través del sistema IC-BES, y que no hay un efecto citopático evidente en las células infectadas. Por otro lado, los análisis de infectividad revelaron que no existe un riesgo manifiesto para humanos por la exposición a Sf-rhabdovirus (Schroeder et al., 2019). Sin embargo, es importante evaluar con precaución el impacto de este agente adventicio en la bioseguridad de esta plataforma, y de cómo esta infección podría afectar a las investigaciones realizadas con células de S. frugiperda. El descubrimiento de SfRV se suma al extenso antecedente de las líneas celulares de insecto productoras de proteínas recombinantes reportadas como contaminadas con virus adventicios, como es el caso de líneas derivadas de T. ni (High Five® infectadas con TnCLV), B. mori (Bm-N infectadas con BmMLV) y D. melanogaster (S2 infectadas con DAV, DBV, DXV, etc.) y a las soluciones o avances con 5 las que se cuentan para tratar dicho problema (Tabla 1) (Katsuma et al., 2005; Li et al., 2007, Merkling et al. 2015; Geisler & Jarvis, 2018). Es importante mencionar que otras líneas celulares de mamíferos que se utilizan para la fabricación de medicamentos contienen también partículas virales (Duroy et al., 2020). Tabla 1. Resumen de eliminación de virus en células de insecto utilizadas para la expresión heteróloga de proteínas. Virus Tipo de genoma Línea celular Estrategia Resultados Referencia Otras líneas celulares susceptibles al virus SfRV -ssARN (monoparitita) Sf9 Tratamiento con antivirales inhibidores de la síntesis de purinas (azarudina-6) Línea celular libre de partículas virales. Rendimiento ≈ Sf9 Maghodia et al. 2017 (Patente) Sf21, HS-AM1, Bm- N TnCLV +ssARN (bipartita) HighFive™ Creación de una nueva línea celular a partir de tejido de embriones completos de T. ni Línea celular libre de partículas virales. Rendimiento < H5 Zhang et al. 2010 (Patente) Tn-368, Tn-PRO, S2 BmMVL +ssARN (monopartita) Bm-N Creación de una nueva línea celular a partir de tejido de embriones completos de B. mori Línea celular libre de partículas virales. Rendimiento ≈ Sf9 Iwanaga et al. 2012 (Patente) --- Spodoptera frugiperda rhabdovirus (SfRV); Trichoplusia ni cell line virus (TnCLV), alphanodavirus; Bombyx mori macula-like virus (BmMLV). Las nuevas tecnologías, como la secuenciación masiva en paralelo, han permitido a los investigadores identificar nuevos agentes adventicios. En el caso de las células de insecto, los virus con genoma de ARN recién descubiertos están tan bien adaptados que no parecen causar alguna patología al huésped, aumentando las poblaciones de células infectadas y a menudo transmitiéndose verticalmente (Longdon et al., 2017). Con esto en cuenta, es de esperarse que las líneas celulares recién aisladas de los tejidos primarios de insectos tengan una alta probabilidad de estar contaminadas con uno o más virus no identificados previamente. Por lo tanto, es necesario analizarlas minuciosamente para detectar virus potencialmente contaminantes, y desarrollar estrategias para su eliminación. La eliminación exitosa de los virus de las células de insecto garantiza la bioseguridad del sistema IC-BES, sin embargo, no es una tarea fácil. Cuando es aceptable el riesgo de obtener células con características inferiores a las originales, se ha propuesto crear nuevas líneas celulares a partir de tejidos primarios en lugar de resolver el problema de contaminación (Zhang et al. 2010; Iwanaga et al. 2012). Pero esto no siempre es posible, por ejemplo, para las líneas celulares derivadas de Spodoptera frugiperda que por sus características son de alto interés industrial (Palomares et al., 2015), es necesario eliminar los virus contaminantes. Afortunadamente, SfRV ha sido exitosamente removido de las células Sf9, conservando las características del huésped (Maghodia et al. 2017). Este hecho convierte 6 a las células Sf9 y SfRV en un modelo de estudio para el desarrollo de estrategias novedosas que permitan eliminación de virus adventicios de células de insecto. Sobre este campo, la recién descubierta familia de enzimas CRISPR-Cas13 (Abudayyeh et al., 2016) ha destacado por su actividad sobre ARN como una estrategia para detección y eliminación de virus adventicios en células de mamíferos (Abudayyeh et al., 2017; Gootenberg et al., 2017). Este hecho ha llamado la atención de varios investigadores que no han tardado en ver a los virus con genoma de ARN como un blanco potencial de estas enzimas (Bawage et al. 2017; Freije et al., 2019; Li et al., 2020). Ellos han reportado resultados favorables para la detección y eliminación de genomas virales, incluyendo al virus de la estomatitis vesicular (VSV), otro miembro de la familia Rhabdoviridae. Sin embargo, hasta la fecha, este sistema no ha sido probado en líneas celulares de Spodoptera frugiperda. Pero la evidencia sostiene que este sistema también se podría utilizar en células Sf9, en las que se ha podido expresar con éxito el sistema CRISPR-Cas9 con actividad sobre ADN para editar su genoma (Mabashi-Asazuma & Jarvis, 2017). 1.3 Ciclo de replicación viral de Sf-rhabdovirus. No se sabe mucho acerca del mecanismo de infección de Sf-rhabdovirus, pero con base en la información que se sabe de otros rhabdovirus de genomas similares, se puede proponer la estructura de su virión y su probable ciclo de replicación. Por lo tanto, tal y como se representa en la figura 5, su genoma debe estar asociado con las proteínas N, L y P, formando una ribonucleoproteína (RNP) que está condensada en una apretada estructura de bucle helicoidal dentro de la cápside viral. La matriz de proteínas M forma una cubierta entre la RNP y la doble capa lipídica que contiene a las glicoproteínas virales G, que constituyen las púas que sobresalen de la superficie viral y participan en el mecanismo de reconocimiento e internalización del virión dentro de la célula hospedera (Knipe, 2013). Se ha reportado en los rhabdovirus hasta ahora estudiados (RABV, VSV, BEFV, SVCV, IHNV) que la glicoproteína viral G se acopla a una variedad de receptores de membrana para que el virión ingrese al citoplasma (paso 1, Figura 5), mediante la ruta de endocitosis mediada por clatrina (CME) con apoyo de la polimerización de actina. Una vez que el virión es endocitado, el ambiente ácido del endosoma induce un cambio conformacional reversible en la proteína G, que pasa de su forma nativa (prefusión) a un estado desplegado. En este estado, se exhibe una región de aminoácidos hidrofóbicos de la proteína G, que se insertan en la membrana interna del endosoma, desatando una serie de rearreglos estructurales entre membranas, que permiten la fusión de la envoltura viral con la membrana del endosoma (paso 2, Figura 5), para finalmente liberar la RNP en el citoplasma del hospedero y dejarla disponible para los siguientes pasos de la infección (Belot et al., 2019). Una vez en el citoplasma, la proteína M que cubre a la RNP se disocia ,dejando libre a la nucleocápside. Se cree que el ambiente ácido del endosoma provoca esta reacción, por lo que al liberarse el contenido del virión al citoplasma la separación entre M y la nucleocápside ocurre de forma espontánea. Este paso es necesario para la síntesis de ARN, 7 ya que la proteína M inhibe la transcripción y una vez que esta ha sido removida, la ARN polimerasa dependiente de ARN, que viene empaquetada junto con su cofactor P y el complejo ARN-nucleoproteína, es totalmente competente para la transcripción primaria (paso 3, Figura 5) (Das et al., 2009; Ivanov et al., 2011). Figura 5. Ciclo de replicación viral de rhabdovirus (Knipe, 2013). La transcripción comienza en el extremo 3’ del genoma, y los ARNm virales se transcriben secuencialmente en el orden en el que aparecen en el genoma: N – P – M – G – L. El mecanismo de transcripción secuencial está gobernado por señales de acción en cis, que indican la acción del complejo transcriptasa. Con excepción del sitio de unión al gen N, cada una de las regiones intergénicas contienen una señal para el inicio de la transcripción, la protección y la metilación de ARNm rio abajo y también como una señal para la poliadenilación y la terminación del ARNm rio arriba (Knipe, 2013). Este mecanismo es una propiedad general de los virus de ARN de cadena negativa no segmentados, y aunque no se conoce el mecanismo por el cual estas secuencias modifican la acción del complejo transcriptasa, se tienen bien identificadas incluso para los rhabdovirus recién descubiertos (Ma et al. 2014). Los ARNm virales son protegidos contra la acción de exonucleasas celulares con una guanosina ligada desde su carbono 5’ al extremo 5’ del ARNm por un enlace trifosfato 5 'a 5' [m7G(5′)ppp(5′)ARNm] al igual como sucede con los ARNm del huésped, pero la reacción ocurre a través de un mecanismo distinto. Se ha propuesto que en esta reacción participa un inusual intermediario proteína L-ARNm y que la subunidad “a” de EF-1 del huésped desempeña un papel en la reacción de protección a través de su actividad de unión a nucleótidos de guanina (Galloway & Wertz, 2008). Además, el mecanismo de metilación de la posición 7 de la guanosina también es distinto al del huésped. Ambas reacciones utilizan como donante del grupo metilo a la S-adenosil metionina, pero en lugar de tener enzimas 8 separadas que catalicen a metilación de ribosa 2'-O (ARNm) y la metilación de guanina-N-7 (m7G), ambas actividades parecen residir en un solo dominio de la proteína L (Rahmeh et al., 2009). Un requisito fundamental para la replicación del genoma de ARN de un solo segmento de polaridad negativa viral es que la actividad de la ARN polimerasa depende de la síntesis de proteínas virales que puedan encapsidar el ARN recién sintetizado, específicamente del complejo de proteínas N-P. Además de funcionar como cofactor de L, la proteína P funciona como chaperona de la proteína N. Mientras que P se une a las moléculas nacientes de N, formando un complejo soluble N-P que mantiene el plegamiento adecuado de la proteína N para que el ARN naciente sintetizado pueda encapsidarse. Este recubrimiento parece constituir una señal para que la ARN polimerasa ignore las secuencias de inicio y paro de la transcripción, generando así un ARN encapsidado de longitud completa que es complementario al genoma, es decir un antigenoma (Ivanov et al., 2011). El uso de antigenomas como templado da como resultado la síntesis de genomas de la progenie (paso 4, Figura 5). El mecanismo de replicación de ARN parece ser el mismo, independientemente de si los genomas o los antigenomas se usan como templado, y en ambos casos el producto naciente debe ser encapsidado para generar productos completos. Una vez que las nucleocápsides que contienen el genoma de la progenie comienzan a acumularse en las células infectadas, estas son utilizadas para la transcripción secundaria y para ensamblar a los viriones de la progenie (paso 5, Figura 5). Aunque conceptualmente es el último paso en el ciclo de replicación del virus, el ensamblaje del virus comienza aproximadamente al mismo tiempo que la transcripción secundaria. Por ejemplo, para VSV alrededor de 2 a 3 horas después de la infección se pueden detectar partículas virales recién ensambladas. Para las 8 a 10 horas después de la infección, tanto la síntesis de proteínas como de partículas virales está en su máxima concentración. Y alrededor de las 16 a 20 horas, hacia el final de ciclo infeccioso, baja la síntesis de proteínas y partículas virales (Hastie et al., 2013). Los componentes de los virus de la progenie se fabrican de forma separada y solo se unen en la fase final de ensamble del virus, mientras que la nucleocápside se ensambla durante el proceso de replicación de ARN, tal como se describió previamente. La proteína G se ensambla en la vía secretora del hospedero, y la proteína M se sintetiza como una proteína soluble que luego se asocia con la superficie de la membrana plasmática del huésped (paso 6, Figura 5). La proteína G es sintetizada por los ribosomas unidos al retículo endoplasmático (ER) y es insertada en la membrana del organelo con el extremo N-terminal orientado al lumen del ER junto con la mayoría de la secuencia de la proteína, donde es debidamente plegada y organizados los monómeros en trímeros de proteína G por proteínas chaperonas presentes en el medio. Luego es transportada por vesículas de membrana al aparato de Golgi, en donde después de recibir ciertas modificaciones postraduccionales (por ejemplo, glicosilación, palmitolación, etc.) es trasladada a la membrana plasmática. En la membrana plasmática de las células infectadas, la proteína G tiende a formar grupos o microdominios de longitud 9 variable (100-150 nm) que se fusionan entre estos para formar los sitios de gemación de SfRV. No se sabe qué causa que los microdominios que contiene proteína G u otras glicoproteínas se agrupen en los sitios de gemación de virus, pero se ha propuesto un modelo en el que su agrupación es impulsada por la formación del complejo viral nucleocapside- proteína M (Brown & Lyles, 2003). A diferencia de la proteína G, la proteína M es sintetizada como una proteína soluble y se asocia con las membranas a través de una combinación de interacciones iónicas e hidrofóbicas, sin atravesar la bicapa lipídica de la membrana. En las células infectadas, la mayoría de la proteína M se encuentra comúnmente localizada en la fracción citosólica soluble con pequeñas cantidades asociada a la membrana plasmática en forma de microdominios. La proteína M se asocia espontáneamente con membranas que contienen fosfolípidos cargados negativamente, los cuales están enriquecidos en la cara citoplasmática de la membrana de las células huésped. De acuerdo con Swinteck & Lyles (2008), esta asociación es gracias a residuos de aminoácidos cargados positivamente en el extremo N- terminal de la proteína M, tal como se muestra en experimentos basados en sondas de membrana fotoactivables. Tanto la proteína M citosólica como la unida a la membrana celular se reclutan en complejos nucleocápside-proteína M en el sitio donde el virus brotará de las membranas plasmáticas del huésped (paso 7, Figura 5). Una vez que este complejo ha sido formado, el reclutamiento de otras proteínas M en el complejo parece ocurrir espontáneamente. Después del ensamblaje del complejo de nucleocápside-proteína M, el paso final es la liberación del virión (paso 8, Figura 5). Este proceso está mediado por la interacción de la proteína M con las proteínas del huésped involucradas en la formación de cuerpos multivesiculares. Una secuencia corta de péptidos en la proteína M (PPPY en VSV y PPEY en RABV) parece ser responsable de redirigir esta maquinaria celular a la membrana plasmática para la liberación del virus en un proceso que involucra la ubiquitinación de la proteína M (Wirblich et al., 2008). 1.4 Sistema CRISPR-Cas13 Los sistemas CRISPR-Cas (por las siglas en inglés, Clustered Regularly Interspaced Short Palindromic Repeats – CRISPR Associated Secuences) han revolucionado nuestra capacidad para editar genes y modular la expresión génica. Además, la precisión y eficiencia de su maquinaria molecular ha popularizado el desarrollo de tecnologías alrededor de esta (Abudayyeh et al., 2017; Cox et al., 2017; Pickar-Oliver & Gersbach, 2019). Estos sistemas evolucionaron en la naturaleza como el sistema inmune adaptativo de bacterias y arqueas, actuando contra la invasión de ácidos nucleicos extraños a sus hospederos, por ejemplo, de bacteriófagos y plásmidos. Los sistemas CRISPR-Cas actúan como nucleasas programables guiadas por un ARN para degradar ADN o ARN al aprovechar una memoria molecular genética de infecciones previas (Barrangou et al., 2007; Makarova et al., 2013). A nivel molecular, el montaje de esta respuesta requiere de tres pasos fundamentales: la adaptación (o adquisición), la biogénesis de crARN (CRISPR-ARN) y la interferencia (Figura 6). La 10 adaptación consiste en adquirir las secuencias de ácidos nucleicos exógenos para su integración a una matriz CRISPR. Este arreglo es una secuencia genómica que contiene múltiples copias de un solo fragmento de ADN que se compone de repetidos semi- palindrómicos (también llamados repetidos directos) que son alternados por secuencias “espaciadoras”, que se insertan en el genoma mediante proteínas Cas tipo integrasa (Cas1/Cas2 normalmente) (Sternberg et al., 2016). La biogénesis del crARN comienza con la transcripción de la matriz para generar un pre-crARN que luego es procesado nucleolíticamente por proteínas Cas y factores del huésped para generar crARNs maduros individuales. Finalmente, la interferencia sucede cuando estos crARNs se asocian a un subconjunto de las proteínas Cas para formar el complejo “efector” que permite la detección guiada del ácido nucleico exógeno presente en la célula (ADN o ARN dependiendo del tipo de CRISPR-Cas), y una vez que el crARN encuentra suficiente complementariedad entre bases de la secuencia espaciadora y el objetivo, el complejo efector de Cas es capaz de escindir y promover la degradación de la molécula de ácido nucleico identificado, ayudando a prevenir una infección adicional (Makarova et al., 2013; Shmakov et al., 2015; Abudayyeh et al., 2016). Figura 6. Mecanismo biológico básico de CRISPR-Cas13. Hay dos clases principales de sistemas CRISPR-Cas organizados de acuerdo con la naturaleza de la nucleasa efectora, y divididas en 6 tipos: Clase 1 (tipo I, III y IV), su actividad tipo nucleasa reside en un complejo multiproteíco, y clase 2 (tipo II, V y VI), una sola proteína funciona como la nucleasa efectora. Entre la clase 2, se encuentra el tipo VI, como Cas13, que poseen actividad dirigida al ARN lo que permite la defensa contra los patógenos con genoma de ARN (Shmakov et al., 2015). Los sistemas CRISPR-Cas tipo VI se pueden dividir en cuatro subtipos (a-d) basados en la filogenia de sus complejos efectores. En resumen, estos subtipos difieren entre sí por algunas proteínas "accesorias" adicionales que no son esenciales para la actividad de la 11 ARNasa Cas13 guiada por ARN, pero pueden modular la actividad de interferencia de ARN, ya sea positiva o negativamente (O’Connell, 2019). Todas las enzimas Cas13 tienen dos actividades tipo ribonucleasa, una ARNasa responsable del procesamiento previo del pre- crARN para ayudar a formar complejos efectores maduros, y otra proporcionada por dos dominios HEPN (por las siglas en inglés, Higher Eukaryotes and Prokaryotes Nucleotide- binding) necesarios para la degradación del ARN objetivo durante la interferencia viral (Figura 7). Figura 7. Características estructurales de Cas13a. A) Esquema de organización de dominios de LbaCas13a (PDB ID: 5W1H) y B) estructura cristalográfica; los sitios activos de la enzima son mostrados como esferas en la figura. Dominio N-terminal (NTD), lóbulo de reconocimiento (REC) y lóbulo tipo nucleasa (NUC) (Modificado de O’Connell, 2019). Recientes estudios han resaltado la capacidad de los subtipos Cas13a, Cas13b y Cas13d para reconocer y cortar ARN viral en varios sistemas modelo de células de mamífero (Freije et al., 2019; Abbott et al., 2020), entre estas la mejor caracterizada es Cas13a. Al igual que otras proteínas efectoras de la clase 2, las estructuras de alta resolución han revelado que Cas13a adopta una arquitectura bilobulada que consiste en un lóbulo de reconocimiento (REC) y otro tipo nucleasa (NUC). Además de la actividad de procesamiento del pre-crARN, el dominio REC también es el encargado de reconocer el tallo del repetido directo (DR) del crARN, mediante interacciones entre grupos 2'-hidroxilo del crRNA y las cadenas laterales de aminoácidos que se extienden por este dominio. Finalmente, la estructura es estabilizada en el tallo inferior con contactos no covalente adicionales aportados por el dominio HEPN1/2 (Liu et al., 2017). Las proteínas Cas reconoce un crARN con una arquitectura característica para cada subtipo de complejo efector, con una secuencia de nucleótidos única dependiendo de especie bacteriana de la que fue aislada la enzima (East-Seletsky, 2016). Los crARNs maduros del tipo VIa adoptan una estructura con un solo tallo-bucle, flanqueado por una secuencia espaciadora “guía” en el flanco 3’ de 20-30 nt de largo. En estructuras de alta resolución del complejo Cas13a:crARN, los DR forman un tallo de 5-6 pares de bases interrumpidas A) B) 12 invariablemente por un puente de 2 nt (AC o AA), y dependiendo del homólogo de Cas13a, un bucle de 7-9 nt. Hacia el extremo 5’ a 3-5 nt del tallo-bucle, se encuentra una región desapareada que se cree es requerida para la función de Cas13a (Figura 8) (O’Connell, 2019). Figura 8. Características generales del crARN tipo VIa. Se destacan los elementos importantes requeridos para la unión estable entre el crARN, Cas13a y la secuencia objetivo. Modificado de O’Conelle, 2019). Es bien sabido que los complejos Cas9 necesitan un motivo adyacente al protoespaciador (PAM) como requisito para detectar la secuencia objetivo de ADN, y a la vez evitar que los complejos rompan sus propios loci genómicos CRISPR, que tienen la misma secuencia codificada, pero sin el PAM. Para un sistema como Cas13 dirigido a ARNs, resulta innecesario un mecanismo de autodiscriminación de su propio locus. En su lugar, utilizan un “sitio de flaqueo del protoespaciador” o PFS (Abudayyeh et al., 2016). Este puede variar de posición y secuencia dependiendo del subtipo del complejo efector, pero para Lsh- Cas13a se trata de un solo nucleótido ubicado en el flanco 3’ de la secuencia objetivo, con preferencia por A, U o C (no G). Cuando se forma el complejo crARN:ARN-objetivo, este nucleótido forma un enlace de hidrógeno con la Lys47 que está en la hendidura formada entre los dominios NTD y Helica-1 (Liu et al., 2017). Su función no es del todo clara, pero se tiene reportado que ciertas modificaciones en el PFS pueden estar relacionadas con la caída de actividad tipo nucleasa de los dominios HEPN. Curiosamente, el requerimiento de un PFS varía para complejo efector, por ejemplo, para Lwa-Cas13a la sensibilidad a un PFS H parece depender del contexto de la secuencia objetivo y la sensibilidad del ensayo en el que se utiliza (Cox et al., 2017). Una característica distintiva de la mayoría de los complejos de direccionamiento guiados por ácidos nucleicos estudiados hasta la fecha es la presencia de una “secuencia semilla” dentro de su secuencia guía. Esta secuencia ayuda a dirigir el proceso de búsqueda de objetivos y estabilizar la hibridación inicial de cadena de guía con el ácido nucleico objetivo (Gorski et al., 2017). En estructuras de alta resolución del complejo Cas13a:crARN, a menudo se observa a la región semilla sobresaliendo del lóbulo NUC en una conformación helicoidal que se cree aumenta la sensibilidad a los desajustes durante la búsqueda de una secuencia objetivo. Esto se supone puesto que se ha demostrado en otros casos que el pre- ordenamiento de guías por parte de las proteínas argonautas aumenta la tasa de hibridación de ARN guía-ARN objetivo en relación con el ARN "desnudo", y también aumenta la 13 sensibilidad a los desajustes (particularmente en la región de la semilla), mejorando así la especificidad de la interacción molecular (Salomon et al., 2015). El complejo Cas13a:crARN sufre un gran cambio conformacional cuando reconoce a su secuencia objetivo, necesario para acomodar el dúplex crARN:ARN objetivo formado. Todos los dominios del complejo en general experimentan un movimiento significativo para llevar las dos mitades del sitio activo HEPN lo suficientemente juntas como para formar un catalizador competente activo, capaz de escindir a la secuencia objetivo. De tal modo que el producto final de este cambio de conformación es el dúplex crARN:ARN objetivo rodeado casi en su totalidad por el lóbulo NUC para que este realice la escisión del ARN objetivo (Liu et al., 2017). El producto de esta reacción son dos fragmentos (5'-hidroxilo y 2'– 3’ fosfato cíclico) con preferencia de escisión sobre un par de nucleótidos (AU o UU) ubicados en el flanco 3’ fuera de la secuencia objetivo para LwaCas13a (Gootenberg et al., 2018). Por último, se ha reportado un fenómeno de “escisión colateral” por parte de los efectores Cas13 hasta ahora caracterizados (Abudayyeh et al., 2016; East-Seletsky et al., 2016; Abudayyeh et al., 2017; Cox et al., 2017). Esto consiste en que una vez que el complejo Cas13:crARN se une al ARN diana (también conocido como ARN activador), la nucleasa HEPN se activa y es capaz de escindir no solo al ARN objetivo en cis sino también cualquier otro ARN presente en trans, incluidos los ARNs no complementarios no unidos o los otros ARN objetivo unidos a otros complejos Cas13:crARN. La mutación en cualquiera de los residuos de HEPN anuló esta actividad, confirmando que la nucleasa HEPN es la responsable tanto de la escisión en cis como en trans (Abudayyeh et al., 2016; East-Seletsky et al., 2016). Es interesante que, hasta ahora, este efecto de "escisión colateral" no se ha observado cuando Cas13 se ha utilizado para escindir al ARN en líneas celulares humanas o vegetales, lo que sugiere que hay algo fundamentalmente diferente en las bacterias con respecto al comportamiento de Cas13 dentro del contexto celular eucarionte (concentración de ARN, disponibilidad y/o protección de ARN por estructuras secundarias o proteínas unidas) o la respuesta reguladora al ARN objetivo inicial en cis por la célula (East-Seletsky et al., 2016; Abudayyeh et al., 2017; Ali et al., 2018 ). 1.5 Sistema CRISPR-Cas13a como estrategia de eliminación de ARN viral Estudios recientes han demostrado la eficiencia de la tecnología CRISPR-Cas13 para escindir el genoma de virus de ARN en varios sistemas modelo (Cox et al., 2017; Bawage et al., 2018; Freije et al., 2019; Abbott et al., 2020; Li et al., 2020). Por otro lado, su actividad de escisión colateral se ha aprovechado para aplicaciones de diagnóstico, como reportero enzimático de alta sensibilidad específica (SHERLOCK por las siglas en inglés Specific High-sensitivity Enzymatic Reporter Unlocking) (Gootenberg et al., 2017; De Puig et al. 2021). Afortunadamente, muchos ortólogos de Cas13 tienen efectos mínimos fuera del objetivo en el transcriptoma de células humanas o vegetales (Abudayyeh et al., 2017; Cox et al., 2017; Aman et al., 2018), lo que resalta su potencial como plataforma antiviral altamente específica para atacar y destruir eficientemente una amplia variedad de virus con genoma de ARN monocatenario (ssARN). 14 Los ortólogos de Cas13 aislados del género de bacterias Leptotrichia (LwaCas13a, LbuCas13a, LshCas13a) son los mejor caracterizados hasta la fecha, y se cuentan con múltiples reportes de su actividad antiviral (Abudayyeh et al., 2016; Aman et al., 2018; Bawage et al., 2018; O'Connell, 2019; Freije et al., 2019; Li et al., 2020). Por ejemplo, Freije et al. (2019) demostraron que Cas13a de Leptotrichia wadei (LwaCas13a) puede escindir ARN del virus de la coriomeningitis linfocítica (LCMV/WT) de forma específica. Mediante un análisis computacional de las secuencias del genoma viral, identificaron los sitios objetivo altamente conservados. Luego los dividieron en espaciadores de 28 nt y filtraron aquellos sitios para asegurar la presencia del PFS específico y de los nucleótidos de corte preferencial de LwaCas13a (uracilos). Curiosamente, la simplicidad del PFS de LwaCas13a (H) le da más sitios potenciales objetivo sobre otros ortólogos (Abudayyeh et al., 2016). En ese trabajo, LwaCas13a redujo eficientemente los niveles de ARN viral hasta en 14 veces en células HEK293FT (células embrionarias de riñón humano) infectadas con LCMV (MOI=5), según lo medido por RT-qPCR 48 h después de la infección (hpi). Fueron cinco crARN dirigidos a diferentes regiones del gen de la proteína L (RnRd) y S (nucleoproteína) los que mediaron el efecto antiviral, independientemente de la temporalidad de la infección (antes o después de la transfección de LwaCas13a). Por su parte Li et al. (2020) demostraron que LwaCas13a reduce los niveles de ARN viral hasta en un 95% en células Vero (células epiteliales de riñón del mono verde africano) infectadas con el virus del dengue DENV-2/16681 (MOI=0.1), según lo medido por RT- qPCR a las 72 hpi. La observación fue confirmada por ensayo en placa, donde se vio una reducción del 84% en el mismo periodo de tiempo. Esto quiere decir que LwaCas13a no solo inhibió la replicación viral del dengue, sino que también suprimió la formación de partículas virales infecciosas. Un solo crARN dirigido al gen DENV NS3 logró el efecto antiviral deseado, probablemente debido que el gen objetivo codifica para una proteína con funciones de proteasa, helicasa y ARN-trifosfatasa relevantes para completar el ciclo de replicación viral (Luo et al., 2015). La estrategia más sólida propuesta hasta ahora contra virus con genoma de ssARN de polaridad negativa consiste en dirigir simultáneamente el sistema CRISPR contra el genoma, el antigenoma viral intracelular y sus ARN mensajeros, para así eliminar las plantillas de la replicación y la expresión génica viral y en consecuencia limitar la replicación viral (Bawage et al., 2018; Freije et al., 2019; Abbott et al., 2020). Los componentes de CRISPR-Cas pueden administrarse como ADN, ARN, complejo crARN-Cas (RNP) o una combinación de estas macromoléculas (Figura 9). Su transporte al interior de la célula es mediado por vehículos de administración como vectores virales o métodos de administración físicos como lipofección (lípidos catiónicos). Pero para que las ARNasas dirigidas a ARN sean seguras y efectivas para uso terapéutico, se prefiere la expresión transitoria (Yin et al., 2014; Kaczmarek et al., 2017; Bawage et al., 2018). El ARNm tiene la ventaja de la traducción rápida de la proteína deseada, al tiempo que evita problemas de seguridad como la integración del genoma, la transmisión vertical y horizontal, y la persistencia a largo plazo en el organismo hospedero (Kaczmarek et al., 15 2017). El suministro de ARNm codificante de los componentes CRISPR-Cas es terapéuticamente atractivo debido a la naturaleza transitoria de la expresión de ARNm, sin riesgo de integración genómica y la actividad citoplasmática del ARNm retira la necesidad de superar la barrera nuclear en comparación con el ADN (Bawage et al., 2018; Li et al., 2020). Figura 9. Formas de entrega de los componentes del sistema CRISPR-Cas para su expresión heteróloga en la célula huésped. Bagawe et al. (2018) reportaron resultados positivos con el uso de ARNs mensajeros codificantes de LbuCas13a como formato de entrega del sistema CRISPR-Cas13a en células A549 (células humanas de epitelio alveolar basal) infectadas con el virus de la influenza A/WSN/1933-H1N1 (IAV). Los crARNs dirigidos al segmento del genoma viral PB1 y a su transcrito mediaron el efecto antiviral, reduciendo hasta 3.8 órdenes de magnitud los niveles de ARN viral en comparación con su control, de acuerdo con lo medido por RT-qPCR a las 72 hpi. Estos datos demuestran el prolongado efecto de Cas13a para interrumpir la replicación viral. De forma paralela, se comprobó que la actividad de escisión del ARN de IVA no dio lugar a escisiones de ARN detectables fuera del objetivo. Por último, el perfil del transcriptoma de las células transfectadas con ARNm Cas13a y crARNs (PB1) no mostraron cambios significativos en la expresión génica endógena. En el caso de células de insecto, como las derivadas de Spodoptera frugiperda, aún no se cuentan con reportes del uso de CRISPR-Cas13. Pero la expresión del sistema CRISPR- Cas9 en estas células ha colocado las bases técnicas y teóricas para el uso de este tipo de complejos enzimáticos (Mabashi-Asazuma & Jarvis, 2017; 2022), contra elementos virales adventicios recién descubiertos (Ma et al., 2014). Las razones para utilizar este sistema contra Sf-rhabdovirus, son varias, puesto que Cas13 ha demostrado tener la capacidad de combatir infecciones en las que el virus se está replicando y evolucionando activamente, y no parece afectar la integridad celular del huésped, ni inducir tasas de mutación en las secuencias diana que le confieran al virus algún tipo de resistencia (Freije et al. 2019). Además, a pesar de ser un complejo de reciente descubrimiento (Abudayyeh et al., 2016; East-Seletsky et al., 2016), pudiéndose decir que sus aplicaciones y caracterización están en su infancia, se han desarrollado estrategias bastante prometedoras basadas en 16 CRISPR. Por ejemplo, CARVER (por las siglas en inglés Cas13 Assisted Restriction of Viral Expression and Readout) es una estrategia de extremo a extremo que combina la escisión de ARN viral mediada por Cas13 con un diagnóstico rápido utilizando la plataforma SHERLOCK (Freije et al. 2019). Y PAC-MAN (por las siglas en inglés Prophylactic Antiviral CRISPR in human cells) que es un método similar a CARVER, pero que utiliza un ortólogo diferente de Cas13 de expresión estable como una estrategia profiláctica frente al coronavirus SARS-CoV-2 (Abbot et al., 2020). Finalmente, si esto no es suficiente para considerar Cas13 como una herramienta antiviral en células de insecto, Cas13 también puede usarse como una herramienta de investigación. Por ejemplo, las mutantes catalíticamente inactivas de Cas13 (dCas13) pueden utilizarse para estudios de localización celular de ARN y otras fusionadas a proteínas de edición de ARN podrían ser utilizarse para caracterizar polimorfismos virales específicos (Cox et al. 2017; Cui et al., 2022). Dichas herramientas permitirán a los investigadores visualizar y perturbar la replicación viral con un alto grado de precisión. 2. JUSTIFICACIÓN El presente proyecto está enfocado en desarrollar una estrategia para eliminar la polimerasa de Sf-rhabdovirus y así obtener células Sf9 libres del virus, aptas para ser utilizadas como plataforma celular del sistema IC-BES, mediante un enfoque antiviral novedoso utilizando el sistema CRISPR-Cas13a. Además de obtener líneas celulares más seguras para la fabricación de productos biológicos y libres de propiedad intelectual, se espera estandarizar el uso del sistema CRISPR-Cas13a en células de insecto. 17 3. HIPÓTESIS El complejo efector CRISPR-Cas13a de L. wadei tiene la capacidad de escindir y eliminar el genoma y los transcritos virales de Sf-rhabdovirus en la línea celular Sf9 de Spodoptera frugiperda. 4. OBJETIVOS 4.1 Objetivo general Dirigir la actividad del sistema CRISPR-Cas13 al genoma y transcritos de Sf- rhabdovirus en células de Spodoptera frugiperda (Sf9) y evaluar su efecto sobre los niveles de ARN rhabdovirales. 4.2 Objetivos específicos • Verificar la presencia de genomas de Sf-rhabodvirus en células Sf9 y estandarizar un método de cuantificación de los mismos. • Generar crARNs específicos contra SfRV y ARNs mensajeros codificantes de LwaCas13a. • Determinar el efecto del sistema CRISPR-Cas13 sobre los niveles de viabilidad y crecimiento de células Sf9 transfectadas. • Evaluar el efecto del sistema CRISPR-Cas13a sobre el número de copias del gen L de SfRV en células Sf9. 18 5. MATERIALES Y MÉTODOS 5.1 Líneas celulares. En este trabajo se utilizó la línea celular Sf9 de la ATCC (CRL-1711), entre los pases 20 a 30 para evitar el efecto de pase en los resultados. Su cultivo se realizó en medio de Grace, suplementado con 10% de suero fetal bovino (FBS). Y como control negativo se utilizó la línea celular High Five™ de la ATCC (CRL-10859) entre los pases 5 a 15, con medio PSFM. En ambos casos, se utilizaron matraces de 250 mL con 60 mL de su respectivo medio de cultivo, agitados a 110 rpm y mantenidos a 27°C. Además, se utilizaron a las células HEK293T, donadas por el Dr. Jesús Martínez Barnetche del Instituto Nacional de Salud Pública como control positivo de expresión de la proteína LwaCas13a, entre los pases 12 a 20. Sus cultivos fueron realizados en cajas T25 con 7 mL de medio DMEM (medio Eagle modificado de Dulbecco) con 10% FBS y mantenidos a 37°C. 5.2 Determinación de la concentración celular, diámetro y % de viabilidad. La concentración y tamaño celular se determinaron utilizando el contador electrónico de partículas Coulter Multisizer II (Coulter Electronics Inc.) con un tubo de apertura de 100 µm. La viabilidad celular se determinó con el hematocitómetro mediante la técnica de exclusión de azul de tripano (0.5% en PBS pH 7.4). 5.3 Extracción de ARN La extracción de ARN total se realizó con el kit RNeasy Mini Kit (Cat. 74104, QIAGEN) (Myhrvold et al. 2018) a partir de 1 x 107 células. El ARN obtenido se sometió a un tratamiento enzimático para la eliminación de ADN usando el Kit TURBO DNA-free (Cat. AM1907, Ambion). Finalmente, el ARN total se cuantificó mediante un espectrofotómetro Nano Drop 1000 (Thermo Scientific). 5.4 Síntesis de cDNA El cDNA se sintetizó por el método de síntesis de la primera cadena de ADN empleando oligonucleótidos hexaméricos aleatorios incluidos en el producto RevertAid First Strand cDNA Synthesis Kit (Cat. K1631, Thermo Scientific), de acuerdo con las instrucciones del fabricante. Se incluyó el control negativo de retrotranscripción (-RT) para descartar la contaminación por ADN genómico y el control positivo de GAPDH para confirmar la funcionalidad de los reactivos del kit. Para el control positivo el kit provee un templado de ARN de 1.3 Kb con el que se sintetiza un producto de RT-PCR de 496 pb. 5.5 PCR Para corroborar la presencia de SfRV, se realizó una PCR de acuerdo con el programa de la Tabla 2. Los oligonucleótidos se basaron en los reportados por Ma et al., 2019, y se verificó su diseño mediante la herramienta en línea “Oligo Analyzer” de IDT (Integrated 19 DNA Technologies) para asegurar que tuvieran las condiciones óptimas de Tm, % de CG, evitar hairpins en los extremos 5’ y 3’ y que no hubiera riesgo de autodimerización (Tabla 3 y Figura 10). Todos los oligonucleótidos en este trabajo fueron sintetizados en la Unidad de Síntesis y Secuenciación del IBt-UNAM. El producto de PCR fue analizado en geles de agarosa al 1 %; 10 µl en cada carril más 2 µl de buffer de carga (Thermo Scientific #R0611). La solución de corrida para la electroforesis fue TAE y se corrió cada gel a 110 V durante 30 min. Los geles se tiñeron con HydraGreen 4X, se revelaron en un fotodocumentador ChemiDoc™ XRS (Bio-Rad), y se visualizaron con el software Image Lab™ versión 6.0.1 (Bio-Rad) Tabla 2. Condiciones de reacción para análisis de PCR. Componente Volumen cDNA templado 1.0 µL (20-60 ng/µL) Taq Buffer 10X 2.5 µL Mezcla dNTP´s (10 mM) 1.0 µL Oligo Fw (10 μM) 0.5 µL Oligo Rv (10 μM) 0.2 µL Taq DNA polimerasa (2U/μL) (Thermo Scientific, #EP0401) 0.5 µL Agua libre de nucleasas Volumen para completar 25 µL Programa de amplificación 95 °C 3 min 1 ciclo 95 °C 30 s 58 °C 30 s 35 ciclos 72 °C 1 min 72 °C 10 min 1 ciclo Tabla 3. Secuencias de oligonucleótidos utilizados para la detección específica de SfRV por RT-PCR.1La posición está calculada con base en el gen de la proteína L de Sf-rhabdovirus reportada en el GeneBank (No. de acceso KF947078.1). Gen Nombre Secuencia (5’->3’) Posición1 Tm (°C) Tamaño del producto de PCR SfRV-X-L Sf-rhabdo-F7 TCACATCTAGAGCTTGAAGACC 6209-6230 53.9 1115 SfRV-L Sf-rhabdo-R7 TCTGCTCTTGACCACCAGGA 7304-7323 58.1 SfRV-L Sf-rhabdo-F8 AGCTAGGGGCATCAGCTACT 7170-7189 57.8 1147 SfRV-L Sf-rhabdo-R8 TCAGGAGGAAACCCTGAGGT 8297-8316 57.7 SfRV-L Sf-rhabdo-F9 CCATCTCCTTAGGTTTCCCAGA 8157-8178 55.9 1271 SfRV-L Sf-rhabdo-R9 TCCCAAAGTCCTCGGAGTC 9409-9427 56.3 SfRV-L Sf-rhabdo-F10 AGAACCTTCACAGTTGCTTC 9296-9315 52.8 1213 SfRV-L Sf-rhabdo-R10 CAGGACTGATTCCCCCATTGT 10488-10508 57.0 SfRV-L Sf-rhabdo-F11 TGCTCAGTTATCAAGGGGGT 10369-10388 55.9 1161 SfRV-L Sf-rhabdo-R11 GTAGGGCTCCCCCAAAAGTC 11510-11529 57.8 SfRV-L Sf-rhabdo-F12 TGCACCCTTACAGGGTCATAG 11370-11390 56.4 1297 SfRV-L Sf-rhabdo-R12 CCATCCTTGGATTCCCCGAT 12647-12666 56.9 20 SfRV-L Sf-rhabdo-F13 AGGTCAACTGCAAGAGCTACAA 12512-12535 56.4 941 SfRV-L Sf-rhabdo-R13 GAGGGTCCACCCTTGATGAC 13435 -13454 57.5 Figura 10. Esquema de la región amplificada del genoma de Sf-rhabdovirus y tamaño esperado de productos de PCR. *El tamaño de este producto de PCR puede variar dependiendo de la variedad de SfRV que infecta a la célula, puede ser de 1115 pb (X+) o de 795 pb (X-). 5.6 Diseño de CRISPR ARN (crARN) Freije et al. (2019) destacaron en su investigación la importancia del proceso de selección de la secuencia objetivo de CRISPR-Cas13 para lograr el efecto antiviral deseado. Para el caso de LwaCas13a, las secuencias deben ser de un tamaño de 28 nt, altamente conservadas (con 2 o menos posiciones con una frecuencia alélica <95%), ricas en uracilos en las inmediaciones del sitio de corte (Abudayyeh et al., 2017, Abudayyeh et al., 2016). No se tienen datos de preferencia de PFS en células de insecto, por lo que para un diseño inicial se consideró el mismo que en bacterias, es decir un PFS H (C, A, o U) en su flanco 3’. Este mismo grupo de investigadores descartó la correlación entre la formación de estructuras secundarias en la secuencia con la que hibrida el crARN guía y la actividad de Cas13, por lo tanto, no se considera un criterio para la selección de secuencias objetivo. Con el fin de encontrar secuencias relevantes para la replicación de SfRV, se realizó una búsqueda en BLAST® de NCBI del genoma viral reportado por Ma et al. (2014) disponible en el Genebank (No. de acceso KF947078.1). En este ejercicio, se identificaron las regiones altamente conservadas entre virus de la familia Rhabdoviriade. Una vez identificadas, se compararon estas secuencias con las de otros 5 genomas reportados hasta la fecha para SfRV (No. de acceso en Genebank MF536978.1, MF536979.1, MH926029.1, MH926030.1 y MH926031.1) para estimar el porcentaje de conservación de las secuencias, porcentaje de Us en ventanas de 50 y posición relativa en el genoma viral. Para validar las observaciones hechas, se secuenció en la USS del IBt-UNAM el genoma viral desde la posición 6209 a la 13454, que involucra gran parte del gen X, la región intergénica entre el gen X y L y el gen L de SfRV. En las regiones conservadas del gen L, se realizó la búsqueda de los PFS H en las secuencias “sentido” (gARN) y “antisentido” (cARN/ARNm). Con los programas Jalview (v2.11.1.0) y MEGA (v10.1.8), se realizaron alineamientos múltiples utilizando la herramienta de alineamiento Muscle con el modelo de sustitución de BLOSUM y el porcentaje de conservación fue calculado utilizando el método de AMAS (Livingstone & Barton, 1993). 21 Una vez seleccionados los espaciadores para Cas13, las secuencias de los crARNs fueron ensambladas y distribuidas utilizando SnapGene® Viewer (v5.06) de Insightful Science. La síntesis de los crARNs quedó a cargo de Synthego©. 5.7 RT-qPCR Se cuantificó la concentración del genoma viral utilizando el kit Power SYBR® Green RNA-to-CT 1-Step (Cat. 4389986, Applied Biosystems) y el sistema de qPCR QuantStudio™ 5 Real-Time PCR System (Applied Biosystems), para lo cual se utilizaron oligonucleótidos específicos que amplifican un gen de interés (tabla 4). Tabla 4. Secuencias de oligonucleótidos utilizados para la detección específica de SfRV por qPCR. Amplifican un fragmento de 89 pb. Tomados del estudio de Hashimoto et al. (2019). Gen Nombre Secuencia (5’->3’) Tm (°C) SfRV-L SfRV.6996F TGCAGAGACAACTTCAGATAACACC 64.6 SfRV-L SfRV.7084R GACTGGTACATTAAACACATTTAGG 60.2 La determinación del número de genomas virales se llevó a cabo mediante la cuantificación absoluta, empleando una curva estándar desarrollada utilizando como templado el plásmido pUC19:457 (Figura 11A). Este plásmido se construyó clonando el amplicón obtenido con los oligonucleótidos SfRV-F14-PstI y SfRV-R14-NdeI (tabla 5) en el plásmido pUC19 (Invitrogen™, Figura 11B) y se corroboró la presencia del inserto mediante un mapa de restricción. Tabla 5. Secuencias de oligonucleótidos utilizados para la amplificación de un fragmento del gen L de Sf- rhabdovirus. Se resalta en negritas los sitios de restricción añadidos a las secuencias para su posterior digestión. Nombre Secuencia (5’->3’) Tm (°C) Tamaño del producto de PCR SfRV-F14-PstI GACCGCATATGTCTGCTCTTGACCACCAGGA 61.0 457 pb SfRV-R14-NdeI GACGTCTGCAGTGTGACACCCCTCTCACCCT 67.0 Figura 11. Mapa del plásmido A) pUC19:457 y B) pUC19. A) B) 22 El fragmento clonado en el plásmido pUC19:457 contiene la región que reconocen los oligonucleótidos SfRV.6996F y SfRV.7084R utilizados en el análisis de RT-qPCR de Hashimoto et al. (2019), resaltada con rojo en la Figura 11A. La concentración de estos fue optimizada mediante un ensayo llamado “matriz de primers” (tabla 6) que consistió en combinar 3 concentraciones distintas de oligonucleótidos sentido y antisentido que permite disminuir o eliminar la amplificación de productos no específicos durante la reacción. Tabla 6. “Matriz de primers” empleada para optimizar la concentración de oligonucleótidos. nM SfRV.6996F Sf R V .7 08 4R 300/300 200/300 100/300 300/200 200/200 100/200 300/100 200/100 100/100 Para la elaboración de la curva estándar, se realizaron diluciones seriales en el rango de 1x108 a 1000 copias (cp) por reacción del plásmido pUC19:457. Además, se incluyó control negativo con ARN total extraído de células High Five ® (H5), para distinguir posibles amplificaciones no deseadas fuera del objetivo. También se trabajó un control de amplificación sin templado (NTC) para distinguir productos de amplificación no deseados, por ejemplo, debido a la formación de dímeros con los oligonucleótidos, y control negativo de retrotranscripción para descartar ruido de fondo proveniente de la muestra (-RT) (Bustin et al., 2009). Ya que el plásmido pUC19:457 es amplificado por los mismos oligonucleótidos, se puede considerar como un control positivo de amplificación y como no se le añaden reactivos de retrotrascripción, también es un segundo control negativo de la misma. Tabla 7. Condiciones de reacción para análisis de RT-qPCR. Componentes Muestra NTC Curva estándar Power SYBR® Green RT-PCR Mix (2✕) 10 µL (1X) 10 µL (1X) 10 µL (1X) Oligonucleótido SfRV.6996F (100, 200, o 450 nM final) Variable Variable Variable Oligonucleótido SfRV.7084R (100, 200, o 450 nM final) Variable Variable Variable RT Enzyme Mix (125✕) 0.16 µL (1X) 0.16 µL (1X) 0.16 µL (1X) ARN templado (0.01 a 20 ng final) Variable --- --- pUC19:457 (De 1x108 a 1000 cp/µL) --- --- Variable Agua libre de nucleasas Aforar a 20 µL Programa Temperatura Tiempo No. ciclos Retrotranscripción 48 °C 30 min 1 ciclo Activación de AmpliTaq Gold® DNA Polymerase UP. 95 °C 1 min 1 ciclo Desnaturalización 95 °C 15 s 40 ciclos Alineamiento/Extensión 60 °C* 30 s 23 Curva de disociación 95 °C 15 s 1 ciclo 60 °C* 15 s 95 °C 15 s *Adquisición de datos La preparación de todas las muestras se realizó en condiciones de esterilidad y por triplicado, siguiendo las recomendaciones del fabricante del kit de RT-qPCR (Tabla 7). Los datos obtenidos se analizaron utilizando el software de Applied Biosystems QuantStudio™ Design & Analysis Software v1.5.1 5.8 Microscopía electrónica de transmisión Las partículas virales de SfRV se visualizaron mediante microscopía electrónica de transmisión con apoyo de la M.C. Ruth Pastor. Para esto, las muestras del sobrenadante de Sf9 se fijaron en una rejilla de 200 mesh (con Formvar y carbón). Posteriormente las rejillas se lavaron con agua y se agregaron 10 μL de acetato de uranilo al 1% para la tinción negativa. Finalmente, se lavó la rejilla con agua y se dejó secar. Las muestras se observaron en un microscopio electrónico de transmisión Zeiss LIBRA 120. 5.9 Clonación de LwaCas13a Se utilizaron dos diseños de templado de ADN para la transcripción in vitro de LwaCas13a. En primer lugar, para la construcción PromotorT7-LwaCas13a-EGFP- TerminadorT7 (Figura 12), se utilizó el plásmido pVAX1-EGFP (Figura 13) como andamio. Figura 12. Esquema de la construcción para expresar LwaCas13a. Contiene la secuencia codificante de la EGFP y la LwaCas13a bajo el promotor de la ARN polimerasa T7. Figura 13. Esquema del plásmido pVAX1-EGFP. Contiene la secuencia codificante de EGFP bajo el promotor de la ARN polimerasa T7 y se señala el sitio de restricción XbaI utilizado para la linealización del plásmido previo a la transfección, como una estrategia para detener la transcripción en lugar de la secuencia terminadora T7. Por otro lado, se recuperó la secuencia del gen LwaCas13a silvestre y el terminador T7 de Addgene p2CT-His-MBP-Lwa_Cas13a_WT (plásmido #91865, East-Seletsky et al., 2017), a través de una estrategia basada en enzimas de restricción. La estrategia consistió en amplificar el gen LwaCas13a utilizando los oligonucleótidos FwCas13_BsrGI y RvCas13_PstI (Tabla 8), para añadir los sitios de restricción correspondientes. Se analizó el producto de PCR en un gel de agarosa al 1% y se purificó con el Kit PCR QIAquick®. 24 Luego se digirió el plásmido pVAX1-EGFP y el producto de PCR LwaCas13a-T7 terminador por separado, utilizando simultáneamente las enzimas de restricción BsrGI y PstI, para generar sitios cohesivos complementarios entre estos. Las digestiones se analizaron en un gel de agarosa al 1% y se purificaron con el Kit PCR QIAquick®. Las ligaciones se realizaron en presencia de una T4 ADN ligasa de acuerdo con el PNO correspondiente, utilizando una relación molar 9:1 de inserto respecto al vector linealizado. Tabla 8. Secuencias de oligonucleótidos utilizados para la amplificación de LwaCas13a y la secuenciación del plásmido completo pVAX1-EGFP-LwaCas13a. Se resalta en negritas los sitios de restricción, o secuencias especiales añadidas al producto de PCR. Nombre Secuencia (5'->3') Tm (°C) Tamaño del producto de PCR FwCas13_BsrGI GATCTGCAGCAAAAAACCCCTCAAGACCCGT 65.2 3762 pb RvCas13_PstI GCGCTGTACAATGCAATGTATATGAAGATTACAAAGATT 60.3 FCas13-pT7 CGAAATTAATACGACTCACTATAGGGGATCCATGAAAGTGACCAAGGTC 59.0 4273 pb RGFP-6xHis TTAATGGTGATGGTGATGGTGGGATCCCTTGTACAGCTCATCCAT 61.0 F15 EGFP GGGCACAAGCTGGAGTACAA 56.0 907 pb R15 Cas13 CGTTGGTCGGGTTAATTCCA 58.0 F16 Cas13 GAATCGTGAAAAGGTACGCAAG 56.0 1000 pb R16 Cas13 ATTGAAATGCCCGACTCCAT 57.0 F17 Cas13 TTCTGGGGACATTTTGGGGA 55.0 1038 pb R17 Cas13 TAAAGGTTCAGCGTCTTGCT 56.0 F18 Cas13 CGTGACTTTGTCGAAGAGATC 56.0 1002 pb R18 Cas13 CTTGGAGTTGTCCGGAGGAT 58.0 F19 Cas13 AGGAAGAGTTGCAGAACGTA 56.0 937 pb R19 Cas13 CTAGAAGGCACAGTCGAGGC 58.0 La mezcla de ligación se transformó en células de E. coli DH5-alpha quimiocompetentes. Estas se recuperaron en medio SOC, para luego plaquearlas en medio LB con kanamicina (50 μg/mL). Se seleccionaron aquellas clonas que demostraron tener la construcción completa mediante PCR de colonia utilizando los oligonucleótidos de la tabla 8. Las clonas positivas se incubaron en medio LB con antibiótico y finalmente se purificó el plásmido pVAX1-EGFP-LwaCas13a mediante el kit QIAprep spin miniprep de QIAGEN®. Por otro lado, se utilizó una construcción de Addgene pC034 - LwCas13a-msfGFP- 2A-Blast (#91924, Abudayyeh et al., 2017) con codones optimizados para la expresión de LwaCas13 en mamíferos, fusionada a msfGFP en el extremo C-terminal. La estrategia consistió en amplificar la secuencia antes descrita con ayuda de los oligonucleótidos FCas13- pT7 y RGFP-6xHis (Tabla 8) para añadir la secuencia de reconocimiento del promotor T7 y la secuencia del tag de polihistidina (Figura 14). Finalmente, se analizó el producto de PCR en un gel de agarosa al 1% y se purificó con el Kit PCR QIAquick®. 25 Figura 14. Esquema de la construcción para expresar LwaCas13a. El producto de PCR contiene la secuencia codificante de la de una msfGFP y la LwaCas13a bajo el promotor del fago T7 para la ARN polimerasa. 5.10 Síntesis del ARNm in vitro La síntesis del ARNm codificante se realizó mediante el producto mMESSAGE mMACHINE™ T7 ULTRA Transcription Kit (Thermo Scientific #AM1345) de acuerdo con las instrucciones del fabricante. La transcripción y capeo es realizada por la ARN polimerasa del fago T7. Para la purificación del mensajero, se utilizó el RNeasy® mini kit (Qiagen®). Finalmente, el producto final se analizó mediante electroforesis desnaturalizante de ARN, y se cuantificó con el espectrofotómetro Nano Drop 1000 (Thermo Scientific). Tabla 9. Condiciones de reacción para la transcripción y capeo del ARNm. Componente Muestra Control (+) Agua libre de nucleasas 1.0 µL 4.0 µL T7 2X NTP/ARCA 10.0 µL 10.0 µL 10X T7 Reaction Buffer 2.0 µL 2.0 µL ADN linealizado y purificado (1000 ng) --- Templado control pTRI-Xef --- 2.0 µL (1000 ng) T7 Enzyme Mix 2.0 µL 2.0 µL Volumen Total 20.0 µL 20.0 µL Se realizó la síntesis del mensajero ARNm-EGFP-Cas13 de 4606 nt y ARNm-EGFP de 1128 nt utilizando como templado los plásmidos pVAX1-EGFP-LwaCas13a y pVAX1- EGFP respectivamente, bajo las condiciones descritas en las tablas 9 y 10. Además, en un experimento independiente, se sintetizó el ARNm-Cas13a-msfGFP de 4239 nt utilizando como templado el producto de PCR LwaCas13a-msfGFP. Tabla 10. Condiciones de reacción para la poliadenilación del ARNm Componente Muestra Control (+) mMESSAGE mMACHINE T7 Ultra reaction 20.0 µL 20.0 µL Agua libre de nucleasas 36.0 µL 36.0 µL 5X E-PAP Buffer 20.0 µL 20.0 µL 25 mM MnCl2 10.0 µL 10.0 µL Solución de ATP 10.0 µL 10.0 µL E-PAP enzyme 4.0 µL 4.0 µL Vol. Total 100.0 µL 100.0 µL 26 El kit incluye como control positivo el plásmido linealizado TRIPLEscript™ pTRI- Xef que contiene el factor de elongación 1α de Xenopus sp. bajo el control transcripcional de los promotores SP6, T7 y T3. El ARN control consiste de un ARNm de 1890 pb y cuando es poliadenilado se extiende ≥50 pb. Su traducción produce una proteína de 50.2 kDa 5.11 Transfección de ARNm y crARN en células Sf9 Y HEK293T Para la transfección de células Sf9 se realizó el pase celular 24 h antes de la transfección, diluyendo las células a una concentración inicial 2.0×105 cel/mL, y una viabilidad ≥ 80%. Para la transfección de células HEK293T, se realizó el pase celular 48 h antes de la transfección con un inóculo inicial de 1.5×105 cel/mL para alcanzar una confluencia ≥70% y una viabilidad ≥ 90% al momento de la transfección. En ambos casos, el diseño de experimento se ejecutó siguiendo las condiciones iniciales recomendadas por el fabricante, descritas en las tablas 11 y 12 respectivamente. Tabla 11. Condiciones iniciales recomendadas para transfecciones de ARN en células Sf9 con TransIT-mRNA Transfection Kit en un pozo de una placa con 12 pozos (c/u de 3.8 cm2 de superficie). Los volúmenes se pueden escalar desde placas de 96 a 6 pozos, o cajas T. Componente Volumen Medio de crecimiento 1.0 mL Número total de células 2.0×105 Medio libre de suero 100 µL crARN (50 µM stock, 50 nM final) 2 µL Cas13 ARNm (1 µg/µL) 2 µL TransIT-mRNA reagent 4 µL mRNA Boost reagent 4 µL Tabla 12. Condiciones iniciales recomendadas para transfecciones de ADN en células HEK293T con FreeStyleTMMax Reagent en un pozo de una placa con 12 pozos (c/u de 3.8 cm2 de superficie). Los volúmenes se pueden escalar desde placas de 96 a 6 pozos, o cajas T. Componente Volumen Medio de crecimiento 1 mL (1 pozo) Número total de células 1.0x106 Cantidad de ADN 1.25 µg Volumen de dilución del ADN en OptiMEMTM SFM a 20 µL FreeStyleTMMax Reagent 1.25 µL Volumen de dilución de FreeStyleTMMax Reagent en OptiPROTM SFM a 20 µL Volumen del complejo Lípido:ADN 40 µL Shaker RPM 125 Se confirmó la expresión del gen reportero GFP a través de su fluorescencia en un microscopio invertido de fluorescencia Nikon Eclipse TE300 con lámpara de mercurio (Nikon) a una longitud de onda de emisión de 520 nm. 27 5.12 SDS-PAGE y Western blot Para su análisis, las células se despegaron cuidadosamente del fondo de la placa de cultivo con ayuda de una micropipeta y fueron centrifugadas a 1000 g/5 min. El sobrenadante se separó, y el concentrado celular se resuspendió con buffer de carga desnaturalizante y reductor a una concentración de 10,000 células/µL. Las muestras se analizaron en un gel SDS-PAGE al 10% de poliacrilamida en el gel separador, y 4% gel concentrador. Para el Western blot, las proteínas se transfirieron a una membrana de PVDF por transferencia húmeda, siguiendo el PNO interno correspondiente. Finalmente, para la inmunodetección de proteínas se utilizaron como anticuerpos primarios un anti-His-tag de conejo (Santa Cruz Biotechnology) o un anti-HA de cabra (Meridian), y como anticuerpo secundario un anti- conejo-HRP (Jackson Immunoresearch) o un anti-cabra-HRP, respectivamente (Santa Cruz Biotechnology). 28 6. RESULTADOS 6.1 Verificar la presencia de SfRV en líneas celulares derivadas de S. frugiperda Se realizaron ensayos para verificar la presencia del virus en un cultivo de la línea celular Sf9 de la ATCC (CRL-1711). Estas células fueron seleccionadas porque están reportadas como hospedero específico de SfRV (Ma et al., 2014). Con esta intención, se realizó la extracción de ARN total a partir del concentrado celular y la amplificación de su genoma por RT-PCR. Como control negativo se utilizó ARN total extraído de las células de insecto High Five® derivadas de Trichoplusia ni, que no están infectadas con SfRV y que también pueden ser utilizadas por el sistema IC-BES para la expresión de proteínas recombinantes. Figura 15. Análisis electroforético de los productos de RT-PCR obtenidos a partir de muestras de células A) Sf9 y B) High Five®: gen X y región intergénica X-L de SfRV posición 1) 6209-7323 nt, gen L 2) 7170-8316 nt, 3) 8157-9427 nt, 4) 9296-10508 nt, 5) 10369-11529 nt, 6) 11370-12666 nt y 7) 12512-13454 nt, 8) Control positivo GAPD humana, 9) Control negativo -RT y MPM) marcador de peso molecular Quick-Load® 1 kb Plus DNA Ladder (New England Biolabs). Gel de agarosa al 1% teñido con Hydragreen 4X. Como se puede observar en la figura 15A a partir de ARN total de células Sf9 se amplificaron exitosamente productos de RT-PCR que corresponden al gen L de SfRV y parte del gen X. El gen L codifica para la ARN polimerasa dependiente de ARN (RdRp), una proteína esencial para el ciclo de replicación de SfRV. La presencia de este gen señala que probablemente podríamos encontrar el genoma viral completo de SfRV en las células analizadas. Por otro lado, mediante técnicas de microscopía electrónica de transmisión se encontraron partículas virales con forma balar o bacilar típica de Rhabdovirus de 80x147 nm, y estructuras alargadas con una longitud <800 nm. Las partículas fueron halladas en el sobrenadante de cultivos de células Sf9 de 168 h, con un tamaño y forma similares a lo reportado por Ma et al. (2014), quienes sugieren que la heterogeneidad en la forma de las partículas tiene que ver con la preparación de la muestra para la tinción negativa. 29 Figura 16. Análisis de EM del sobrenadante de células Sf9 (A y B) Tinción negativa con acetato de uranilo al 1% Para determinar la variedad del virus encontrado, es decir si es X+ o X- (Hashimoto et al., 2017), se amplificó un fragmento del gen X de SfRV. Como se puede observar en la figura 15, el tamaño aproximado de la banda es de 795 pb (carril 1) en lugar de las 1115 pb del gen completo, lo que sugiere la pérdida de unas 320 pb, es decir, se tiene el gen X incompleto (X-). Hasta la fecha no existen reportes del gen X y L completos integrados en el transcriptoma o genoma celular de Sf9 como elemento viral endógeno (Hashimoto et al., 2017). Por lo tanto, el material amplificado debe corresponder a la variedad SfRV X- presente en los cultivos de células Sf9 analizados. 6.2 Diseño de crARNs para LwaCas13a Mediante una búsqueda y alineamiento en BLAST® de NCBI, se identificaron regiones relevantes y altamente conservadas del genoma de SfRV reportado por Ma et al. (2014) disponible en el Genebank (No. de acceso KF947078.1). Los resultados arrojaron pocas posiciones alineadas, agrupadas en una región de aproximadamente 612 nt que van de los nucleótidos 8274 a 8835, y que corresponde a un fragmento del gen L viral (Figura 17). Para dar mayor claridad respecto a la relevancia de esta secuencia del gen L, se realizó una búsqueda en UNIPROT de la proteína L (No. de acceso X2KV89_9RHAB). Se descargaron aquellas secuencias de virus parásitos de insectos que también pertenecieran a la familia Rhabdoviridae. El alineamiento de la secuencia de aminoácidos codificados en los 612 nt (Figura B, Anexo 2), reveló tres de las cuatro secuencias de aminoácidos en los que se cree reside la actividad catalítica de la RdRp de los virus de ARN de polaridad negativa (Poch et al., 1990; Ma et al., 2014). Por lo tanto, esta región se consideró relevante para seleccionar los crARNs que hibridarán con el genoma o antigenoma viral, ya que su eliminación impedirá le replicación del genoma viral. 30 Figura 17. Distribución de los alineamientos en BLAST®. Querry KF947078.1 Spodoptera frugiperda rhabdovirus A) 1-13534 nt y B) 8317-8928 nt. 1) KM817645.1Wuhan Ant Virus. 2) MH477288.1 Lasius neglectus virus 2. 3) KX884422.1 Hubei rhabdo-like virus. 4) MN661034.1 Atrato Rhabdo-like virus. 5) KP735609.1 Diachasmimorpha longicaudata rhabdovirus. 6) KX884456.1 Wenling crustacean virus. 7) NC_038379.1 Cacao swollen shoot Togo A virus. 8) MK432946.1 Trifolium pratense virus. Cabe resaltar que las secuencias del genoma de SfRV reportadas en el Genebank son secuencias en el sentido 5’ a 3’ y en lenguaje de ADN (p. ej. A, T, G, C). Es decir, sí sustituimos las timinas por uracilos, obtendremos la secuencia codificante de las proteínas, presente en el antigenoma y los ARNm virales (p. ej. 5’AUGC3’). Para tener la secuencia del genoma de SfRV, debemos sustituir las timinas por uracilos en las secuencias complementarias (p. ej. 3’UACG5’). Se realizó un análisis bioinformático alineando los genomas publicados de Sf- Rhabdovirus hasta la fecha (No. de acceso en Genebank KF947078.1 MF536978.1, MF536979.1, MH926029.1, MH926030.1 y MH926031.1). En la figura 18 se observa una serie de “claros conservados” distribuidos por todo el genoma de SfRV, divididos por regiones no conservadas entre las secuencias, la más grande corresponde al GAP de 320 nt que diferencia a SfRV X+ de SfRV- (Tabla A, Anexo 1). Además, algunos puntos no conservados son producidos por errores en la anotación de las secuencias cargadas, o por marcas evidencia del proceso de replicación viral, por lo que es necesario ver cada una para elucidar la posible razón de su cambio (Figura B, Anexo 2). La abundancia de uracilos en las secuencias servirá de referencia para focalizar el flanco 5’ del crARN durante su diseño. A) B) 31 Figura 18. Análisis de los sitios objetivo de CRISPR-Cas13a en el genoma de SfRV. Alineación de las 6 secuencias de genomas de SfRV disponibles en el Genebank (KF947078.1, MF536978.1, MF536979.1, MH926029.1, MH926030.1 y MH926031.1). En medio, anotación de genes de SfRV y ubicación de la región 612. Arriba, gráfica del porcentaje de conservación entre genomas virales alineados. Abajo, porcentaje de abundancia de uracilos calculada en ventanas de 30 nt para el genoma y antigenoma viral. Se decidió amplificar y secuenciar la región que involucra a gran parte del gen X, la región intergénica entre el gen X y L y el gen L de SfRV. Primero porque se ha demostrado en trabajos de estrategias antivirales mediados por CRISPR-Cas que el gen codificante de la ARN polimerasa dependiente de ARN es uno de mejores blancos para este sistema (Cox et al., 2017; Bawage et al., 2018; Freije et al., 2019; Abbott et al., 2020; Li et al., 2020, Zeng et al., 2022). Y segundo, para corroborar el tamaño del gap en el gen X. A partir de cDNA proveniente de células Sf9, se amplificó por RT-PCR el genoma viral desde la posición 6209 a la 13454 en 7 fragmentos sobrelapados (Figura 15), y se secuenció en la USS del IBt- UNAM. Los datos obtenidos se ensamblaron en un fragmento de 7248 nt y se alinearon contra los 6 genomas de SfRV disponibles (Tabla A, Anexo 1; Figura A, Anexo 1) para validar las conclusiones hasta ahora realizadas de esta región respecto al porcentaje de conservación y secuencia. Se detectaron 11 cambios puntuales de nucleótidos respecto a al genoma de SfRV KF947078.1 (datos no mostrados), de los cuales 5 generaron mutaciones silenciosas, sin cambiar el aminoácido codificante. Por otro lado, las otras 6 mutaciones generaron un cambio en el aminoácido codificante, sin embargo, este cambio ha sido previamente reportado en otros genomas secuenciados de Sf-RV, y de acuerdo con esos trabajos, se sabe que el virus conserva su capacidad infecciosa (Maghodia & Jarvis, 2017; Schroeder et al., 2019). Por último, se corroboró que el gap en el gen X es de 320 nt de longitud. Finalmente, se dio búsqueda a las secuencias blanco utilizando como templado al gen de la RdRp recién ensamblado bajo el siguiente criterio: se consideraron ventanas de 28 nt con un PFS H (no G) en su extremo 3’, y con un motivo rico en uracilos 10 nt rio abajo (Figura 19). Estas secuencias se capturaron utilizando formulas básicas en una hoja de Microsoft Excel y verificando la sensibilidad del método con el buscador de secuencias de SnapGene® Viewer (v5.06). 32 Figura 19. Características generales de los crARN tipo VIa. El espaciador del anti-crARN es complementario al genoma de SfRV (3’ a 5’), mientras que el espaciador de sen-crARN es complementario al antigenoma o sus ARNm virales (5’ a 3’). Se recopilaron 33 espaciadores para el genoma y 23 para el antigenoma/ARNm complementarios al gen de la RdRp de SfRV (Figura 20; Tabla B y C, Anexo 3), y se procedió a ensamblar la secuencia de los crARNs, utilizando como repetido directo la secuencia 5’GACCACCCCAAUAUCGAAGGGGACUAAAACUU3’ específica para los efectores LwaCas13a (East-Seletsky et al., 2017) (Tabla B y C, Anexo 3). Figura 20. Frecuencia pronosticada de crARNs que son capaces de hibridar con el genoma (3’ a 5’), o el antigenoma/ARNm (5’ a 3’) que codifica a la ARN polimerasa dependiente de ARN de Sf-Rhabdovirus. Finalmente, se seleccionaron 4 espaciadores complementarios al genoma de SfRV y 5 a su antigenoma (Tabla 8). Esto con base en su porcentaje de GC, además se analizaron mediante la herramienta “Oligo Analizer” de IDT (Integrated DNA Technologies) para asegurar la ausencia de hairpins en los extremos 5’ y 3’ con el fin de evitar riesgo de autodimerización. Tabla 8. Secuencias de crARNs para la detección específica de SfRV mediante el sistema CRISPR-Cas13a Nombre Secuencia (5'->3') %GC anti- crARN2 GACCACCCCAAUAUCGAAGGGGACUAAAACUUACCUGCACCCGGUCAAUUCAUACAUCCC 53.6 anti- crARN14 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUGUUGGCGACAUCAUCUUGGGGGAAUCG 53.6 anti- crARN22 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGUAGAUAGUGCCCCUCCUCAUGAGGUCU 53.6 anti- crARN29 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAGCUGAUGGAACAGGUGGAUUCACCAGA 50.0 sen-crARN3 GACCACCCCAAUAUCGAAGGGGACUAAAACUUCUGGGGCUCUCAUAUUGGUGUUCCACUU 50.0 sen-crARN6 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUCCAAGUUUCCUCCAACUUGAGAGGAGG 50.0 sen- crARN17 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGGGUGCAAUCAGGUGAGGUACUUUUCCU 50.0 33 sen- crARN21 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUGGUGCAGAGAGGGGUCUUCCGCAUCUC 60.7 sen- crARN23 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUCUCGCAGGUGGGACAACCCCCAGAUAG 60.7 La síntesis de los crARNs quedó a cargo de Synthego© y estos fueron recibidos en viales individuales con 5 nanomoles del ARN correspondiente liofilizado. 6.3 Estandarización de la RT-qPCR Para obtener un método sensible, robusto y reproducible, se tomó aquella combinación de oligonucleótidos con la que se obtuvo la mejor eficiencia (E) de amplificación de PCR para la curva estándar (Figura 21) probada de 1x108 a 1000 copias (#cv) por reacción del plásmido pUC19:457. Esta se calculó como E = 10-1/m - 1, donde la pendiente (m) es obtenida de la gráfica del logaritmo inicial de templado o “log(#cv)” vs el valor de Ct (número de ciclos de amplificación de ADN necesarios para que la señal fluorescente pueda ser detectada). El máximo teórico de eficiencia es de 1.00 (100%) e indica que la cantidad de producto es el doble con cada ciclo (Bustin et al., 2009). Figura 21. Graficas de log(cp) vs Ct de la curva estándar para cuantificar copias del gen L de SfRV evaluando diferentes concentraciones de primers Fw y Rv. [50 nM equimolar]f (m=-3.630), [100 nM equimolar]f (m=- 2.992), [100 nM Fw]f/[200 nM Rv]f (m=-3.484), [200 nM Fw]f/[100 nM Rv]f (m=-3.306) y [300 nM equimolar]f (m=-2.903). De acuerdo con los datos mostrados en la figura 21, la combinación más eficiente de oligonucleótidos fue [200 nM]f SfRV.6996F y [100 nM]f SfRV.7084R, con una eficiencia del 100.7%. Esta curva se repitió de forma conjunta para cada uno de los experimentos adelante descritos, junto con los controles negativos: ARN de células High Five ® libres de SfRV, control negativo de templado y control negativo de retrotranscripción. Se determinó la carga viral en un cultivo de células Sf9 en adherencia desde las cero hasta las 120 h, para tener una referencia del número de copias del gen L de SfRV (#cv) existente en cada etapa de un cultivo típico contra el que se retará la estrategia antiviral utilizando el sistema CRISPR-Cas13a. El ARN total se recolectó cada 24 h a partir de una 34 alícuota de 1 millón de células, y la RT-qPCR se realizó utilizando el mismo contenido de 400 ng de ARN total por muestra. El valor de Ct obtenido del análisis de las muestras por duplicado se convirtió a #cv mediante la ecuación 3, utilizando el valor de la pendiente (m) y la ordenada al origen (b) obtenidas de la curva estándar. Finalmente, este valor fue normalizado utilizando la ecuación 4 a #cv SfRV/célula Sf9. Ecuación 1. Ct = m(log#cv) + b Ecuación 2. log#cv = (Ct - b)/(m) Ecuación 3. #cv = 10[(Ct - b)/(m)] Ecuación 4. #cv/cel = (#cv)(ng de ARN total extraido de 1 millón de células400 ng de ARN total analizado )1 millón de células Figura 22. A y B) Cinética de crecimiento de células Sf9 y número de genomas virales de Sf-Rhabdovirus. N = 2, intervalo de confianza del 95%. De acuerdo con lo que se observa en la figura 22A, se cuantificaron de 2 a 15 copias virales en promedio por cada célula, dependiendo el tiempo de incubación del cultivo. Es importante considerar que la distribución de las partículas virales es heterogénea, esto quiere decir que habrá células con más partículas virales en unas células que en otras, e incluso habrá células sin ninguna partícula viral, tal y como reportan Ma et al. (2019) para células Sf9 SfRV- aisladas por dilución clonal. Rhabdovirus no cuentan con un mecanismo que induzca la replicación celular de forma forzada como otros virus (Knipe, 2013). Se hipotetiza que la disminución moderada del #cv/cel durante las primeras 24 h podría deberse al mecanismo que el virus utiliza para permanecer en estado latente en las células de insecto, pero sin integrarse al genoma celular (Geisler & Jarvis, 2016). Además, estudios recientes (De Malmanche et al., 2022) señalan a Dicer-2 y la ruta del ARN pequeño de interferencia (siRNA) de Sf9 como responsable de A) B) 35 restringir la replicación de SfRV a un nivel que no comprometa la viabilidad celular. Por otro lado, el aumento en el #cv de las 24 a las 120 h (Fig. 24B) responde probablemente a que cuando el cultivo atraviesa por la etapa exponencial de crecimiento, la maquinaria de transcripción celular también se encuentra más activa, por lo tanto, SfRV puede hacer uso de esta para aumentar su #cv, ensamblarse e infectar otras células. Es decir, gracias a la ruta antiviral de siRNA se mantiene la infección de SfRV en un estado latente, pero sin abatirlo por completo. El papel antiviral de siRNA contra SfRV sugiere que este virus es susceptible de escisión por ARN complementario, lo cual es un buen antecedente para utilizar Cas13. Sin embargo, la pregunta sería, ¿por qué la ruta del siRNA no es suficiente para abatir por completo la infección de SfRV? al respecto, se sabe que en general los siRNA no pueden silenciar completamente un ARNm y se encuentran asociados a daño fuera del objetivo u off- target. Además, gracias al trabajo de Karamipour y col. (2019) se sabe que la sobreestimulación de la ruta de los micro ARNs o miRNA, otra ruta de los RNAi a la que pertenecen los siRNA, disminuye la cantidad de progenie infecciosa en aquellas células que fueron infectadas con un baculovirus recombinante (rAcMNPV), afectando de manera negativa al uso del sistema IC-BES. Por lo tanto, Cas13, al ser una enzima exógena a la célula Sf9 con alta capacidad de silenciamiento, probablemente pueda abatir a SfRV sin afectar a la futura infección de baculovirus en células Sf9. 6.4 Transcripción in vitro Se lograron transcribir con éxito los mensajeros sintéticos ARNm EGFP-LwaCas13a, ARNm LwCas13a-msfGFP y ARNm EGFP. Se comprobó su pureza mediante la determinación de las relaciones de absorbancia 260/280 y 260/230 (tabla 9). Tabla 9. Datos de absorbancia de ARNm sintetizados utilizando el espectrofotómetro Nano Drop 1000 (Thermo Scientific). Parámetro Control (+) ARNm-Xef ARNm EGFP- LwaCas13a ARNm LwCas13a- msfGFP ARNm EGFP A260/280 2.56 2.40 2.63 2.48 A260/230 2.48 2.57 2.64 2.05 ng/uL 679.8 1374.2 1549.16 842 ng de ARNm 20,394 41,226 46,474.8 25,260 ng de ADN templado 1,000 1013 966 732 YARNm/ADN 20.4 40.6 48.1 34.5 Se aprecia que el rendimiento obtenido por cada síntesis varía de acuerdo con el templado de ADN utilizado. El fabricante del kit especifica que, para el caso del control, se pueden esperar rendimientos de 20 a 30 ng de ARNm por cada ng de ADN utilizado. Por lo tanto, se puede decir que se obtuvo un buen rendimiento para los mensajeros de interés. Además, se verificó el tamaño e integridad de los mensajeros sintéticos a través de un gel de agarosa al 1% desnaturalizante (Figura 23). 36 Figura 23. Análisis electroforético de los ARNm sintetizados. MPM) Marcador de peso molecular ARN RiboRuler High Range 1) ARNm Xef, 2) ARNm EGFPLwaCas13. MPM) Marcador de peso molecular ARN Ambion® Millennium™ 3) ARNm LwCas13msfGFP y 4) ARNm EGFP. Gel de agarosa desnaturalizante al 1% teñido con Hydragreen 4X. De acuerdo con el fabricante del kit de transcripción in vitro, el barrido en todos los carriles es un rastro de colas de poliA de distintos tamaños que la polimerasa E-PAP añadió en el extremo 3’ de los ARNm. Pero también se puede tratar de degradación del ARN mensajero recién sintetizado. En el carril de ARNm LwCas13msfGFP se aprecia una banda extra de muy bajo peso molecular. Se hipotetiza que pueden ser ARNm cortos, de menos de 500 nt, producto de la hibridación de la cadena 3’ del ADN templado con el primer 5’ FCas13-pT7 que no se pudo purificar completamente del producto de PCR templado de la transcripción. Estas hebras emparejadas forman la plantilla de ADN dúplex con la secuencia de su promotor necesaria para que la ARN polimerasa T7 inicie la transcripción. Esta transcripción no puede progresar más allá de la secuencia que comparten estas cadenas, dado que el resto de la cadena 5’ del ADN no-templado que hibrida con el resto de la cadena 3’ impide el avance de la burbuja de transcripción. En este caso, porque el dominio N-terminal de la polimerasa T7 encargado de separar la doble cadena está ocupado con la cadena del primer 5’ FCas13-pT7. No se observa este problema con los otros ARNm, ya que su templado es un ADN plasmídico con la secuencia de terminación T7 incluida rio abajo de la CDS de LwaCas13a. 6.5 Estandarización de las condiciones de transfección de células Sf9 Para obtener las mejores condiciones de transfección, se realizó la titulación del ARNm vs el reactivo de transfección. Se probaron las condiciones recomendadas por el fabricante; proporción v/v 1:2 y 1:3 ARNm:TransIT-Boost para transfectar 80,000 células/mL. Se incluyó el ARNm-EGFP como control de transfección positivo, el plásmido pVAX1-EGFP para verificar que solo se transfecta ARN en las condiciones del experimento, NTC para verificar que el reactivo de transfección no sea la fuente de fluorescencia, y un control sin tratamiento para verificar la citotoxicidad de las condiciones experimentales. Se capturaron imágenes de las células transfectadas, utilizando el microscopio Nikon Eclipse TE300 tanto en campo claro como en fluorescencia, y se calculó la eficiencia de 37 transfección obteniendo el cociente del número de células que emiten fluorescencia sobre las que no. El análisis reveló que la condición que cuenta con la mayor eficiencia de transfección es la proporción v/v 1:3 ARNm:TrasnIT-Boost. En todos los casos, el reactivo de transfección demostró tener un efecto negativo sobre la viabilidad y confluencia celular, y funcionó solo para transfectar ARNm y no ADN plasmídico. Tabla 10. Resumen de resultados de titulación del reactivo de transfección TransIT-mRNA® en células Sf9 a las72 h post-transfección. Condición experimental Densidad celular final (cel/mL) Viabilidad Viabilidad respecto al blanco Confluencia Eficiencia de transfección 1:2:2 ARNm EGFP 177,500 85.8% 90.1% 60.0% 18% 1:2:2 pVAX1-EGFP 86,500 77.0% 80.9% 30.0% --- 1:2:2 ARNm EGFP-LwaCas13a 155,000 78.2% 82.1% 40.0% --- 1:3:3 ARNm EGFP 139,500 82.4% 86.6% 40.0% 40% 1:3:3 pVAX1-EGFP 77,000 80.3% 84.3% 30.0% --- 1:3:3 ARNm EGFP-LwaCas13a 92,000 76.0% 79.8% 40.0% --- 1:2:2 NTC 105,000 76.4% 80.2% 50.0% --- 1:3:3 NTC 130,000 85.9% 90.2% 40 --- Blanco 211,000 95.2% 100.0% 80 --- Inesperadamente las células transfectadas con ARNm EGFP-LwaCas13a no generaron una señal fluorescente, mientras que el control positivo ARNm EGFP funcionó adecuadamente. Se aprovecharon los ARNm EGFP para estandarizar la densidad adecuada de células Sf9 necesarias para transfectar, sin saturar el fondo de las placas de 12 pozos. Se manejaron 3 densidades iniciales 1x105, 2x105 y 3x105 células/mL (Anexo 4), de las cuales se observó la mejor confluencia a 200,000 células/mL transfectadas con 1 µg de ARNm EGFP (2.68x10­12 mol) sobre mL de cultivo, sin llegar a saturar el fondo del pozo (Figura 24). Figura 24. Imágenes representativas de células Sf9 transfectadas con ARNm-EGFP a las 24 h post- transfección, es decir, 48 h después del pase celular a 200,000 cel/mL en placas de 12 pozos, a 1 mL de cultivo, relación v/v 1:3 ARNm:TransIT-Boost. A) Fluorescencia y B) campo claro. Las imágenes fueron capturadas en el microscopio Nikon Eclipse TE300, objetivo 10X. A) B) 38 6.6 Evaluación de ARNm Cas13amsfGFP y crARNs sintéticos en células Sf9. Además del ARNm EGFPLwaCas13a, también se probó el ARNm Cas13msfGFP, transcrito obtenido a partir del plásmido pC034-LwCas13a-msfGFP-2A-Blast (Addgene #91924, Abudayyeh et al., 2017) siguiendo la metodología del punto 5.9 y 5.10 de este documento. Este plásmido está diseñado para la expresión de la proteína LwCas13a-msfGFP en células HEK293T (Figura 28). Para evaluar este ARNm, se tomó de referencia las condiciones estandarizadas en el punto 6.5, y se transfectaron células Sf9 con el ARNm LwCas13amsfGFP y los CRISPR- ARN (crARN) adquiridos con Synthego© (Tabla 11). Antes de su uso, estos fueron resuspendidos a 50 µM y analizado su integridad con ayuda del Nanodrop y un gel de agarosa al 1% desnaturalizante (Tabla 12, Figura 25). Tabla 11. Resumen de experimento de transfección de células Sf9 con ARNm y crARN Pozo ARNm crARN TransIT- Boost Medio OptiMEM Señal fluorescente detectada 1 Cas13-msfGFP anti-crARN2 Si Si --- 2 Cas13-msfGFP anti-crARN14 Si Si --- 3 Cas13-msfGFP anti-crARN22 Si Si --- 4 Cas13-msfGFP anti-crARN29 Si Si --- 5 Cas13-msfGFP sen-crARN3 Si Si --- 6 Cas13-msfGFP sen-crARN6 Si Si --- 7 Cas13-msfGFP sen-crARN17 Si Si --- 8 Cas13-msfGFP sen-crARN21 Si Si --- 9 Cas13-msfGFP sen-crARN23 Si Si --- 10 Cas13-msfGFP --- Si Si --- 11 EGFP --- Si Si Si 12 --- --- Si Si --- 13 --- --- --- Si --- 14 --- --- --- --- --- Tabla 12. Datos de absorbancia de crARNs sintéticos utilizando el espectrofotómetro Nano Drop 1000 (Thermo Scientific). Pozo crARN ng/µL 260/280 260/230 ng cargados 1 anti-crARN2 1384.60 1.86 2.23 1384.60 2 anti-crARN14 3313.75 1.90 2.09 3313.75 3 anti-crARN22 1955.45 2.01 2.37 1955.45 4 anti-crARN29 1965.20 2.11 2.47 1965.20 5 sen-crARN3 1831.40 1.96 2.39 1831.40 6 sen-crARN6 1484.70 2.00 2.38 1484.70 7 sen-crARN17 1898.70 1.91 2.44 1898.70 8 sen-crARN21 1480.00 2.02 2.27 1480.00 9 sen-crARN23 1552.70 1.99 2.29 1552.70 39 Figura 25. Análisis electroforético de crARNs sintéticos. MPM) Marcador de peso molecular ARN Ambion® Millennium™ 1-9) crARNs descritos en la tabla 11. Gel de agarosa desnaturalizante al 1% teñido con Hydragreen 4X. El análisis de los crRNASs por electroforesis en gel de agarosa desnaturalizante mostró que los crARNs se mantuvieron íntegros después de ser resuspendidos, mientras que los datos de absorbancia 260/280 y 260/230 indican una alta pureza, con ausencia de sales, solventes, proteínas, etc. Las bandas de mayor peso molecular en los carriles 2 y 5 puede ser debido a que el crARN no fue completamente desnaturalizado, dada que se analizó una considerable cantidad de RNA en el gel. Una vez transfectadas las células Sf9 con el ARNm LwCas13msfGFP, monitoreó la expresión del gen reportero GFP vía microscopía de fluorescencia cada 24 h durante 3 días. En este periodo solo el control positivo EGFP produjo una señal fluorescente (Anexo 5). Pasadas las 72 h, el cultivo fue recolectado, centrifugado, se recuperó el concentrado celular para lisarlo y se analizó el extracto de proteínas mediante un SDS-PAGE y Western blot. No se encontró señal de la proteína LwCas13-msfGFP con tag de His. Figura 26. Análisis tipo A) SDS-PAGE y B) Western Blot de concentrado de proteínas de células Sf9 (200,000) transfectadas con crARNs y mARNs codificantes de LwCas13msfGFP (167.1 kD) y EFGP(35.6 KDa). Anticuerpo primario anti-His tag, Anticuerpo secundario anti-conejo HRP. En la figura 26 podemos observar que el MPM, que también es el control positivo para el anti-His-tag, es la única muestra detectada en el WB. La ausencia de señal 40 fluorescente y el resultado negativo en el WB indican la ausencia de la proteína LwCas13msfGFP en este experimento. Para elucidar el origen del problema, se decidió verificar la funcionalidad del templado del ARNm LwCas13-msfGFP reproduciendo las condiciones del trabajo de Abudayyeh et al., 2017, creadores del pC034-LwCas13a-msfGFP-2A-Blast para la expresión de la proteína quimera LwCas13a-msfGFP en células HEK293T (Figura27). Figura 27. Micrografías representativas de células HEK293 transfectadas con ADN plasmídico y ARNm. P1:pC034-LwCas13msfGFP, P2:pVAX1-EGFP, P3: ARNm LwCas13-msfGFP, P4: ARNm EGFP, P5: NTC, control sin templado. Imágenes fueron capturadas en el microscopio Nikon Eclipse TE300, campo claro 10X. Figura 28. Análisis Tipo A) SDS-PAGE y B) Western blot del concentrado de proteínas de células HEK293T (60,000 células/pozo) transfectadas con ARNm codificantes de Cas13msfGFP (167.1 Kd) y EFGP(35.6 Kda). Ab primario anti-HA Tag, Ab secundario anti-cabra HRP. Se detectó una fuerte señal fluorescente tanto en las células transfectadas con el plásmido de la LwCas13a-msfGFP (Fig. 27, P1) como en aquellas transfectadas con el control positivo pVAX1-EGFP (Fig. 27, P2) y ARNm EGFP (Fig. 27, P4). Únicamente no se observó fluorescencia en las células con el ARNm LwCas13a-msfGFP (Fig. 27, P3) y el control negativo (Fig. 27, P5). El análisis de electroforesis de ARN desnaturalizante (Figura 23) muestra a las bandas correspondientes a los ARNm de EGFP-LwaCas13a y LwCas13a-msfGFP acompañadas de barridos a lo largo de los carriles que sugieren degradación del ARN mensajero. Este barrido, se puede confundir con la actividad de la polimerasa E-PAP, que añade colas de poliA a los 41 ARNm y en el proceso deja residuos de adeninas no incorporadas, que también lucen como un barrido a lo largo del carril. Suponiendo degradación, ¿por qué los ARNm EGFP funcionan si se encuentran en las mismas condiciones? Aquí una posible razón: aunque el CAP y la cola de poliA protegen al ARNm en los extremos 5 y 3’, no son mecanismos infranqueables, por lo tanto, quizá también estén parcialmente degradados. Sin embargo, además de estos dos elementos, los ARNm de EGFP flanquean al ORF con secuencias de 100-200 nt que no serán traducidas o UTR. Según Koh et al. (2019) las secuencias UTR pueden afectar de forma positiva o negativa la estabilidad de la transcripción del ARNm que flanquean. Esto da explicación a porqué los ARNm EGFP que son transcritos directamente desde un plásmido junto estos UTR, son estables. Por otro lado, para el diseño del plásmido (Figura 12) y ADN de PCR (Figura 14) para transcribir los ARNm EGFP-LwaCas13a y LwCas13a- msfGFP, se crearon construcciones muy estrechas entre los extremos 5 y 3’ y el ORF de la proteína de interés, de 5-10 nt. Por lo tanto, es de probable que dichas estrategias fallaran y que al reproducir el experimento de Abbudaye et al. (2017) con el plásmido completo si se lograra la expresión, ya que el plásmido cuenta con todos los elementos regulatorios necesarios. 42 7. CONCLUSIÓN En el presente trabajo se verificó la presencia del virus SfRV(X-) en células Sf9 de la ATCC a través de la amplificación de regiones importantes del genoma SfRV (genes L y X) y la presencia de partículas virales en el sobrenadante de cultivos de células Sf9. Estas regiones no están reportadas como parte de los elementos endógenos virales (secuencias incompletas de genes de SfRv) descubiertos por Gesiler & Jarvis (2018). Por lo tanto, las secuencias amplificadas provienen del transcriptoma o genoma viral. Además, se cumplió con la estandarización de un método de cuantificación del genoma de SfRV, específicamente del gen de la RdRp viral. Los datos de RT-qPCR sugieren que existe una replicación del virus que coincide con el crecimiento del cultivo de células Sf9, con un máximo a las 120 h de cultivo. Respecto al diseño de los componentes del sistema CRISPR-Cas13a, se determinó la secuencia de 56 crARNs específicos hipotéticamente capaces de hibridar con el gen de la ARN polimerasa dependiente de ARN, con base en los requerimientos específicos que el complejo efector LwaCas13a necesita para realizar correctamente el reconocimiento y corte de la secuencia objetivo. La información obtenida generó datos útiles para crear otros crARNs que hipotéticamente hibriden en distintas regiones del genoma viral. Solo es necesario secuenciar la región de interés para asegurar que los espaciadores sean complementarios. Aunque el proyecto no llegó a la etapa de evaluación del efecto del sistema CRISPR- Cas13, es de vital importancia tomar en cuenta que la hibridación efectiva del complejo crARN-Cas13 a su secuencia objetivo en general, es un proceso multifactorial que depende de la longitud, la secuencia, la presencia de factores de transcripción, etc. Y que el mejor método de selección de crARNs sigue siendo probando su eficacia de forma experimental. También se demostró que los ARNm EGFP de síntesis in vitro de este trabajo son compatibles para la expresión heteróloga de EGFP en dos líneas celulares diferentes entre sí como son Sf9 y HEK293. Estos funcionarán como control positivo de transfección de ARN y de expresión de EGFP en dichas células. Finalmente, la ausencia de evidencia que indique la expresión de la proteína quimera Cas13-GFP en células Sf9 a partir de los ARNm sintéticos aquí diseñados, abre la necesidad de replantear la estrategia de expresión del sistema CRISPR-Cas13 en células Sf9. Y una opción que parece acertada es expresar la proteína Cas13 utilizando plásmidos en lugar de ARNm, tal y como se realizó en células HEK293T con la construcción de Abudayyeh et al. (2017) cuya secuencia se encuentra optimizada para su expresión en células eucariontes. El desarrollo de estrategias antivirales para eliminar virus adventicios de células en cultivo productoras de proteínas recombinantes de interés industrial sigue siendo un tema altamente atractivo. Además, estandarizar el sistema CRISPR-Cas13a es de interés no solo por el potencial antiviral del sistema, sino también por otras aplicaciones como de uso diagnóstico, terapia génica contra el cáncer, como herramienta de biología molecular para 43 seguimiento de transcritos in vivo, e incluso silenciamiento el ARN nuclear con bajo o nulo off-target, etc. (De Puig et al., 2021; Fan et al. 2022; Abudayyeh et al., 2017). 44 8. PERSPECTIVAS Con el fin de lograr la expresión de la proteína Cas13, se propone utilizar plásmidos portadores del transgen bajo el potenciador hr5 (región homóloga 5) y el promotor ie1 (inmediato temprano), ambos elementos derivados del nucleopoliedrovirus múltiple de Autographa califórnica (AcMNPV) para la expresión directa en células de insectos Sf9 (Mabashi-Asazuma & Jarvis, 2017 y 2022). Una vez lograda la expresión de la proteína efectora, es deseable probar la efectividad de los crARNs diseñados in silico y ya sintetizados en combinaciones de expresión plásmido-Cas13 + ARN-crARN y plásmido-Cas13 + plásmido-crARN. Para probar la importancia de las secuencias UTR en los diseños aquí planteados, se propone realizar una traducción in vitro con los ARNm de EGFP-LwaCas13a y LwCas13a- msfGFP, además de realizar diseños que incluyan secuencias UTR en el extremo 3’ o 3’ y 5’ del ARNm, y verificar la estabilidad de los mismos, realizando cDNA a partir de los ARNm sintetizados. También es importante medir el efecto del sistema CRISPR-Cas13 sobre los parámetros cinéticos y estequiométricos de la clona celular tratada, y sobre la producción y calidad de una proteína modelo. Esto porque de acuerdo con el trabajo de Mabashi-Asazuma & Jarvis (2017) las células Sf9 libres de SfRV (Sf-RVN) y aquellas células Sf9 infectadas tienen las mismas propiedades generales, como velocidad de crecimiento, morfología y viabilidad, a excepción de que las SfRVN, una vez que estas han sido infectadas con un baculovirus recombinante, producen de 5 a 10 veces más progenie infecciosa que las Sf9. Asimismo, en caso de ser posible la eliminación de SfRV mediante la metodología propuesta, se recomienda demostrar que la infección permanece ausente en las células Sf9, durante un periodo equivalente al tiempo que dura una clona celular en cultivo en el laboratorio, es decir unos 60 pases en cultivo continuo (Maghodia et al., 2017). Finalmente, para caracterizar más la variedad de SfRV que está infectando a los cultivos de células Sf9 del laboratorio, se puede amplificar y secuenciar el genoma completo de SfRV (genes N, P, M y G) y compararlo con la información ya disponible en NCBI. Y también se le puede dar seguimiento a cómo cambia la secuencia del genoma del virus a través de la vida de la clona celular en los 60 pases de cultivo continuo. Se sabe que las clonas SfRV con el gen X completo pierden la secuencia de 320 nt en clonas con alto número de pases celulares. Sería interesante elucidar que provoca la pérdida de estos 320 nt, sí se puede inducir en condiciones de laboratorio y que otros cambios sufre el genoma viral a través del tiempo y si estos cambios tienen que ver supresión activa de la infección de SfRV por Dicer- 2 y la ruta del siRNA recientemente descrita por Mabashi-Asazuma & Jarvis (2022). 45 9. REFERENCIAS Abbott, T. R., Dhamdhere, G., Liu, Y., Lin, X., Goudy, L., Zeng, L. (2020). Development of CRISPR as an Antiviral Strategy to Combat SARS-CoV-2 and Influenza. Cell, 181(4), 865-876.e12. Abudayyeh, O. O., Gootenberg, J. S., Essletzbichler, P. (2017). RNA targeting with CRISPR–Cas13. Nature, 550: 280-284. Abudayyeh, O. O., Gootenberg, J. S., et al. (2016). C2c2 is a single-component programmable RNA-guided RNA- targeting CRISPR effector. Science, 353: 557. Ali, Z., Mahas, A., & Mahfouz, M. (2018). CRISPR/Cas13 as a Tool for RNA Interference. Trends in Plant Science, 23(5), 374–378. Aman, R., Ali, Z., Butt, H., Mahas, A., Mahfouz, M. (2018). RNA virus interference via CRISPR/Cas13a system in plants. Genome Biology, 19(1), 1–9. Barrangou, R. Fremaux C., Deveau H., Richards M., Boyaval P., Moineau S., Romero D.A., Horvath P. (2007). CRISPR provides acquired resistance against viruses in prokaryotes. Science, 315:1709–1712 Bawage, S. S., Tiwari, P. M., & Santangelo, P. J. (2018). Synthetic mRNA expressed Cas13a mitigates RNA virus infections. BioRxiv, 370460. Belot, L., Albertini, A., & Gaudin, Y. (2019). Structural and cellular biology of rhabdovirus entry. Advances in Virus Research, 104, 147–183. Bustin, S. A., Benes, V., Garson, J. A., Hellemans, J., Huggett, J., Kubista, M., Wittwer, C. T. (2009). The MIQE guidelines: Minimum information for publication of quantitative real-time PCR experiments. Clinical Chemistry, 55(4), 611–622. Brown, E. L., & Lyles, D. S. (2003). A novel method for analysis of membrane microdomains: Vesicular stomatitis virus glycoprotein microdomains change in size during infection, and those outside of budding sites resemble sites of virus budding. Virology, Vol. 310, pp. 343–358. Cox, D. B. T., Gootenberg, J. S., Abudayyeh, O. O., Franklin, B., Kellner, M. J., Joung, J., & Zhang, F. (2017). RNA editing with CRISPR-Cas13. Science, 358(6366):1019–1027. Cui, Z., Zeng, C., Huang, F. et al (2022). Cas13d knockdown of lung protease Ctsl prevents and treats SARS-CoV- 2 infection. Nat Chem Biol 18, 1056–1064. Das, S. C., Panda, D., Nayak, D., & Pattnaik, A. K. (2009). Biarsenical Labeling of Vesicular Stomatitis Virus Encoding Tetracysteine-Tagged M Protein Allows Dynamic Imaging of M Protein and Virus Uncoating in Infected Cells. Journal of Virology, 83(6), 2611–2622. De Malmanche H, Hussain M, Marcellin E, Reid S, Asgari S (2022). Knockout of Dicer-2 in the Sf9 cell line enhances the replication of Spodoptera frugiperda rhabdovirus and conditionally increases baculovirus replication. J Gen Virol. Aug;103(8). De Puig H, Lee RA, Najjar D, Tan X, Soeknsen LR, Angenent-Mari NM, Donghia NM, Weckman NE, Ory A, Ng CF, Nguyen PQ, Mao AS, Ferrante TC, Lansberry G, Sallum H, Niemi J, Collins JJ (2021). Minimally instrumented SHERLOCK (miSHERLOCK) for CRISPR-based point-of-care diagnosis of SARS-CoV-2 and emerging variants. Sci Adv. Aug 6;7(32). Duroy P.O., Bosshard S., Schmid-Siegert E., Neuenschwander S., Arib G., Lemercier P., Masternak J., Roesch L., Buron F., Girod P.A., Xenarios I., Mermod N. Characterization and mutagenesis of Chinese hamster ovary cells endogenous retroviruses to inactivate viral particle release. Biotechnol Bioeng. 2020 Feb;117(2):466-485. Epub 2019 Nov 12. PMID: 31631325; PMCID: PMC7003738. East-Seletsky A, O'Connell MR, Burstein D, Knott GJ, Doudna JA (2017). RNA Targeting by Functionally Orthogonal Type VI-A CRISPR-Cas Enzymes Mol Cell; 66(3):373-383. East-Seletsky, A., O’Connell, M. R., Knight, S. C., Burstein, D., Cate, J. H. D., Tjian, R., & Doudna, J. A. (2016). Two distinct RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection. Nature, 538(7624), 270–273. Fan N, Bian X, Li M, Chen J, Wu H, Peng Q, Bai H, Cheng W, Kong L, Ding S, Li S, Cheng W. (2022). Hierarchical self-uncloaking CRISPR-Cas13a-customized RNA nanococoons for spatial-controlled genome editing and precise cancer therapy. Sci Adv. May 20;8(20):eabn7382. Freije, C. A., Myhrvold, C., Boehm, C. K., Lin, A. E., Welch, N. L., Carter, A., Sabeti, P. C. (2019). Programmable Inhibition and Detection of RNA Viruses Using Cas13. Molecular Cell, 1–12. Food and Drug Administration (2010). Guidance for industry - characterization and qualification of cell substrates and other biological materials used in the production of viral vaccines for infectious disease indications Research, C.f.B.E.a. (Ed.), Office of Communication, Outreach and Development, Rockville, MD 46 Galloway, S. E., & Wertz, G. W. (2008). S-Adenosyl Homocysteine-Induced Hyperpolyadenylation of Vesicular Stomatitis Virus mRNA Requires the Methyltransferase Activity of L Protein. Journal of Virology, 82(24), 12280–12290. Geisler, C., & Jarvis, D. L. (2016). Rhabdovirus-like endogenous viral elements in the genome of Spodoptera frugiperda insect cells are actively transcribed: Implications for adventitious virus detection. Biologicals, 44(4), 219–225. Geisler, C., & Jarvis, D. L. (2018). Adventitious viruses in insect cell lines used for recombinant protein expression. Protein Expression and Purification, 144, 25–32. Gootenberg, J. S., Abudayyeh, O. O., Zhang, F. (2018). Multiplexed and portable nucleic acid detection platform with Cas13, Cas12a and Csm6. Science, 360(6387), 439–444. Gootenberg, J. S., Abudayyeh, O. O., Lee, J. W., Zhang, F. (2017). Nucleic acid detection with CRISPR- Cas13a/C2c2. Science, 356(6336), 438–442. Gorski, S. A., Vogel, J., & Doudna, J. A. (2017). RNA-based recognition and targeting: sowing the seeds of specificity. Nature Reviews Molecular Cell Biology, 18(4), 215–228. Hameed, A., Shan-e-Ali Zaidi, S., Sattar, M. N., Iqbal, Z., & Tahir, M. N. (2019). CRISPR technology to combat plant RNA viruses: A theoretical model for Potato virus Y (PVY)resistance. Microbial Pathogenesis, 133(May), 103551. Hashimoto, Y., Macri, D., Srivastava, I., Cox, M. (2017). Complete study demonstrating the absence of rhabdovirus in a distinct Sf9 cell line. PLoS ONE, 12(4), 1–17. Hastie, E., Cataldi, M., Marriott, I., & Grdzelishvili, V. Z. (2013). Understanding and altering cell tropism of vesicular stomatitis virus. Virus Research, 176(1–2), 16–32. Haynes J. (2015). Methods of detection and removal of rhabdovirus from cell lines. World Intellectual Property Organization WO2015051255. Takeda Vaccines, Inc. Ivanov, I., Yabukarski, F., Ruigrok, R. W. H., & Jamin, M. (2011). Structural insights into the rhabdovirus transcription/replication complex. Virus Research, 162(1–2), 126–137. Iwanaga M., Hitotsuyama T., Katsuma S., et al (2012). Infection study of Bombyx mori macula-like virus (BmMLV) using a BmMLV-negative cell line and an infectious cDNA clone. J Virol Methods; 179:316–24. Kaczmarek J. C., Kowalski P. S., Anderson D. G. (2017). Advances in the delivery of RNA therapeutics: from concept to clinical reality. Genome Med 9, 60 Katsuma S, Tanaka S, Omuro N, Iwanaga M, Mita K, Shimada T. (2005). Novel macula-like virus identified in Bombyx mori cultured cells. J. Virol., 79(9):5577-84. Knipe, D. H. (2013). Fields virology. Philadelphia, PA 19103 US: Lippincott Williams & Wilkins. Koh, W.S., Porter, J.R. & Batchelor, E. (2019). Tuning of mRNA stability through altering 3′-UTR sequences generates distinct output expression in a synthetic circuit driven by p53 oscillations. Sci Rep 9, 5976 Li, H., Wang, S., Dong, X., Li, Q., Kou, Z. (2020). CRISPR-Cas13a Cleavage of Dengue Virus NS3 Gene Efficiently Inhibits Viral Replication. Molecular Therapy - Nucleic Acids, 19(March), 1460–1469. Li, T.C., Scotti, P.D., Miyamura, T., Takeda, N. (2007). Latent infection of a new alphanodavirus in an insect cell line. J. Virol., 81(20):10890-6. Liu, L., Li, X., Ma, J., Li, Z., You, L., Wang, Y. (2017). The Molecular Architecture for RNA-Guided RNA Cleavage by Cas13a. Cell, 170(4), 714-726.e10. Livingstone C.D. and Barton G.J. (1993), Protein Sequence Alignments: A Strategy for the Hierarchical Analysis of Residue Conservation. CABIOS Vol. 9 No. 6 (745-756)). Longdon, B., Day, J. P., Schulz, N., Leftwich, P. T., Jiggins, F. M. (2017). Vertically transmitted rhabdoviruses are found across three insect families and have dynamic interactions with their hosts. Proceedings of the Royal Society B: Biological Sciences, 284(1847). Luo, D., Vasudevan, S. G., & Lescar, J. (2015). The flavivirus NS2B-NS3 protease-helicase as a target for antiviral drug development. Antiviral Research, 118(September 2005), 148–158. Ma, H., Galvin, T. A., Glasner, D. R., Shaheduzzaman, S., & Khan, A. S. (2014). Identification of a Novel Rhabdovirus in Spodoptera frugiperda Cell Lines. Journal of Virology, 88(12), 6576–6585. Ma, H., Nandakumar, S., Bae, E. H., Chin, P.-J., & Khan, A. S. (2019). The Spodoptera frugiperda Sf9 cell line is a heterogeneous population of rhabdovirus-infected and virus-negative cells: Isolation and characterization of cell clones containing rhabdovirus X-gene variants and virus-negative cell clones. Virology, 536(June), 125– 133. Mabashi-Asazuma, H., & Jarvis, D. L. (2017). CRISPR-Cas9 vectors for genome editing and host engineering in the baculovirus–insect cell system. Proc. Natl. Acad. Sci. U S A., 114(34): 9068–9073. 47 Mabashi-Asazuma, H., & Jarvis, D. L. (2022). A new insect cell line engineered to produce recombinant glycoproteins with cleavable N-glycans. J Biol Chem. 2022 Jan;298(1):101454. Maghodia, A. B., Geisler, C., & Jarvis, D. L. (2017). Virus Free Cell Lines and Methods for Obtaining Same. WO 2017/075627 A1. Maghodia, A.B., Geisler, C., & Jarvis, D.L. (2016). Characterization of an Sf-rhabdovirus-negative Spodoptera frugiperda cell line as an alternative host for recombinant protein production in the baculovirus-insect cell system. Protein Expression and Purification, 122: 45-55. Makarova, K. S., Wolf, Y. I., & Koonin, E. V. (2013). The basic building blocks and evolution of CRISPR-Cas systems. Biochemical Society Transactions, 41(6), 1392–1400. Merkling S.H. & van Rij R.P. (2015). Analysis of resistance and tolerance to virus infection in Drosophila. Nat. Protoc.; 10(7):1084-97. Myhrvold, C., Freije, C. A., Gootenberg, J. S., Abudayyeh, O. O., Sabeti, P. C. (2018). Field-deployable viral diagnostics using CRISPR-Cas13. Science, 360(6387), 444–448. O’Connell, M. R. (2019). Molecular Mechanisms of RNA Targeting by Type VI CRISPR – Cas Systems. Journal of Molecular Biology, 431(1), 66–87 Palomares, L.A. Realme M.A., Ramírez O.T. (2015). An Overview of Cell Culture Engineering for the Insect Cell- Baculovirus Expression Vector System (BEVS). Cell Engineering vol. 9. Animal Cell Culture. Al-Rubeai M. (ed.) Springer International Switzerland. 501-519. Pickar-Oliver, A., & Gersbach, C. A. (2019). The next generation of CRISPR–Cas technologies and applications. Nature Reviews Molecular Cell Biology. Poch, O. B. (1990). Sequence comparison of five polymerases (L proteins) of unsegmented negative-strand RNA viruses: theoretical assignment of functional domains. Journal of General Virology, 1153-1162. Rahmeh, A. A., Li, J., Kranzusch, P. J., & Whelan, S. P. J. (2009). Ribose 2′-O Methylation of the Vesicular Stomatitis Virus mRNA Cap Precedes and Facilitates Subsequent Guanine-N-7 Methylation by the Large Polymerase Protein. Journal of Virology, 83(21), 11043–11050. Salomon, W. E., Jolly, S. M., Moore, M. J., Zamore, P. D., & Serebrov, V. (2015). Single-Molecule Imaging Reveals that Argonaute Reshapes the Binding Properties of Its Nucleic Acid Guides. Cell, Schroeder, L., Mar, T. B., Haynes, J. R., Wang, R., Wempe, L., & Goodin, M. M. (2019). Host Range and Population Survey of Spodoptera frugiperda Rhabdovirus . Journal of Virology, 93(6), 1–14. Shmakov, S., Abudayyeh, O. O., Makarova, K. S., Wolf, Y. I., Koonin, E. V. (2015). Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems. Molecular Cell, 60(3), Smith G.E, & Summers., M. (1983). Production of human beta interferon in insect cells infected with a baculovirus expression vector. Mol. Cell Biol., 3:2156–2165. Sternberg, S. H., Richter, H., Charpentier, E., & Qimron, U. (2016). Adaptation in CRISPR-Cas Systems. Molecular Cell, 61(6), 797–808. Swinteck, B. D., & Lyles, D. S. (2008). Plasma Membrane Microdomains Containing Vesicular Stomatitis Virus M Protein Are Separate from Microdomains Containing G Protein and Nucleocapsids. Journal of Virology, 82(11), 5536–5547. Tang, X., Liu, X., Tao, G., Qin, M., Yin, G., Suo, J., & Suo, X. (2016). “self-cleaving” 2A peptide from porcine teschovirus-1 mediates cleavage of dual fluorescent proteins in transgenic Eimeria tenella. Veterinary Research, 47(1), 1–5. Whelan, S., & Goldman, N. (2001). A general empirical model of protein evolution derived from multiple protein families using a maximum-likelihood approach. Molecular Biology and Evolution, 18(5), 691–699. Wirblich, C., Tan, G. S., Papaneri, A., Godlewski, P. J., Orenstein, J. M., Harty, R. N., & Schnell, M. J. (2008). PPEY Motif within the Rabies Virus (RV) Matrix Protein Is Essential for Efficient Virion Release and RV Pathogenicity. Journal of Virology, 82(19), 9730–9738. Yin, H., Kanasty, R. L., Eltoukhy, A. A., Vegas, A. J., Dorkin, J. R., & Anderson, D. G. (2014). Non-viral vectors for gene-based therapy. Nature Reviews Genetics, 15(8), 541–555. Zeng, L., Liu, Y., Nguyenla, X.H. et al (2022). Broad-spectrum CRISPR-mediated inhibition of SARS-CoV-2 variants and endemic coronaviruses in vitro. Nat Commun 13, 2766. Zhang, F., & Thiem, S. (2010). The Trichoplusia ni cell line MSU-TnT4 does not harbor a latent nodavirus. In Vitro CellDevBiol-Animal. 2010; 46:1–6. 48 ANEXO 1 Tabla A. Secuencias de genomas de Sf-rhabdovirus disponibles en el Genbank y alineadas con Jalview (v2.11.1.0) utilizando el método de AMAS (Livingstone & Barton, 1993). No. Genebank Nombre Tamaño del genoma (nt) Referencia KF947078.1 Spodoptera frugiperda rhabdovirus isolate Sf9 13534 (X +) Ma et al., 2014 MF536978.1 Spodoptera frugiperda rhabdovirus isolate Sf9 13220 (X -) Maghodia & Jarvis, 2017 MF536979.1 Spodoptera frugiperda rhabdovirus isolate Sf21 13540 (X +) Maghodia & Jarvis, 2017 MH926029.1 Spodoptera frugiperda rhabdovirus Bm-N 13573 (X +) Schroeder et al., 2019 MH926030.1 Spodoptera frugiperda rhabdovirus HsAM1 13190 (X -) Schroeder et al., 2019 MH926031.1 Spodoptera frugiperda rhabdovirus Sf-9 13271 (X -) Schroeder et al., 2019 49 50 51 52 Figura A. Alineamiento de nucleótidos con Muscle en Jalview (v2.11.1.0). Secuencias consenso obtenidas por secuenciación a partir de cDNA de Sf9 y SF+ alineadas contra las 6 secuencias de genomas de SfRV disponibles en el Genebank (KF947078.1, MF536978.1, MF536979.1, MH926029.1, MH926030.1 y MH926031.1). 53 ANEXO 2 Figura B. Alineamiento de aminoácidos con Muscle en MEGA X (v10.1.8). Secuencias alineadas con la proteína L (p496-p699) de X2KV89_9RHAB Spodoptera frugiperda rhabdovirus, contra A0A140D8K4 Drosophila affinis sigmavirus, A0A0B5KXG9 Tacheng Tick Virus 7, A0A120HAW4 Diachasmimorpha longicaudata rhabdovirus, A0A0B5KRI0 Shayang Fly Virus 3, A0A0B5KXS7 Wuhan Mosquito Virus 9, A0A140D8L6 Drosophila busckii rhabdovirus, A0A0B5KXM0 Wuhan House Fly Virus 2,). Motivos conservados se encuentran marcados por recuadros negros (Poch et al., 1990; Ma et al., 2014). Figura C. Algunas mutaciones detectadas en el genoma de SfRV A) Mutación puntual (A por C) cambia el codón de His por el de Gln, probablemente debido al cambio de organismo hospedero (de S. frugiperda a B. mori y H. subflexa). B) Inserción de 6 nt (adición de Lys y Asn) pero el marco de lectura se mantiene, parece provenir de un repetido C) Error en la anotación de la secuencia. A) B) C) 54 ANEXO 3 Tabla B. Secuencias de crARNs para la detección específica del genoma de SfRV mediante el sistema CRISPR- Cas13a Nombre Secuencia (5'->3') anti-crARN1 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUUAUCAACUCAUUGUGACACCCCUCUCA anti-crARN2 GACCACCCCAAUAUCGAAGGGGACUAAAACUUACCUGCACCCGGUCAAUUCAUACAUCCC anti-crARN3 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUUUCCUAAAUGUGUUUAAUGUACCAGUC anti-crARN4 GACCACCCCAAUAUCGAAGGGGACUAAAACUUCCUCUGAUGAAAAAUAAGGACUUAAUUA anti-crARN5 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAUUAAUCUUUAUCUGAGAAAAUGUUUCU anti-crARN6 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGGAAGCAGUUGUCAUGAGUGGAAAUGAU anti-crARN7 GACCACCCCAAUAUCGAAGGGGACUAAAACUUCUAAAUUUACAUCCUCAACUUAGAGUUA anti-crARN8 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUAGACAUAAGGAGUGGCCGGAAUUAGAU anti-crARN9 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGAAAGCUAAAGGCAAGGCUGUUUGGAUU anti-crARN10 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAGCAUCUAUUUCCGUAUUUCCCUGAAAU anti-crARN11 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUUCAAUACAGAACGAAAAAACAAAUUUA anti-crARN12 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGGUGAGUUUGGAUUUUUCCAAGUGGAAC anti-crARN13 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGGACACAUGAAAUGUUCUACAAUUCCUU anti-crARN14 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUGUUGGCGACAUCAUCUUGGGGGAAUCG anti-crARN15 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAUAUGUCUAUCAUGGGACAGGGGGACAA anti-crARN16 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAUGUUCCGAUGUUGCAACGAGGACUAUC anti-crARN17 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAUCAAUCGUUAGAUCGAAAUAGAACCUU anti-crARN18 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGAAACUUCAUGUCCCUCUUGUUCUAUCA anti-crARN19 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGUCAGCAGAUGCAACUGUUAAUAGGAUA anti-crARN20 GACCACCCCAAUAUCGAAGGGGACUAAAACUUCAUCAUUCAUGAGAAUGCAAAUCAAUCU anti-crARN21 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUGGCUAGAGUCUACUUAAGAGAGGGAGA anti-crARN22 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGUAGAUAGUGCCCCUCCUCAUGAGGUCU anti-crARN23 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAACCCCUUCUCUGUUACAAAGAGCUCUC anti-crARN24 GACCACCCCAAUAUCGAAGGGGACUAAAACUUCCAUAUUAGGAAUCCCUCUUCCAUACAG anti-crARN25 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAUCCCCCUAUUCAACAGCCUAUCAGAUU anti-crARN26 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAUAAAAAGAAUUCUAAAAUAUCCUAUCU anti-crARN27 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAUAUCCUAUCUGUUCACGGGAAGAUCUC anti-crARN28 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGAAUGGCAUAUCAAUAGAGUGAUAAAUG anti-crARN29 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAGCUGAUGGAACAGGUGGAUUCACCAGA anti-crARN30 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUUGCAGAUCUUCCAAUUUCUUGUCAGAA anti-crARN31 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAAUAUUAUUACUCUGGCAGAUGGUAAUC anti-crARN32 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUACAGAUUACAUCCAACUUAAUGCCUCA 55 anti-crARN33 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAUGUCAGAGUUGGCAAUGGCUCAGUCAA Tabla C. Secuencias de crARNs para la detección específica del antigenoma y ARNm de SfRV mediante el sistema CRISPR-Cas13a Nombre Secuencia (5'->3') sen-crARN1 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUGAUAGAUCAAAUAGAUUGGGGGGUGUU sen-crARN2 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUCCGUCAUGGUUAUUUCAGGGAAAUACG sen-crARN3 GACCACCCCAAUAUCGAAGGGGACUAAAACUUCUGGGGCUCUCAUAUUGGUGUUCCACUU sen-crARN4 GACCACCCCAAUAUCGAAGGGGACUAAAACUUACCAAACAUCGUAUCUAUAGUGUGGUAA sen-crARN5 GACCACCCCAAUAUCGAAGGGGACUAAAACUUACAUUUCAUGUGUCCUGGUAAAACAAUU sen-crARN6 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUCCAAGUUUCCUCCAACUUGAGAGGAGG sen-crARN7 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUAAAGUUAUCAGCAGCCACUGCAGAGUA sen-crARN8 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGGAGAUAGGGUCUUCUAAUAUUGCAUUG sen-crARN9 GACCACCCCAAUAUCGAAGGGGACUAAAACUUACGCAAGAUCAAAUGAUAAUUGGUCUGG sen-crARN10 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUUCUUAUACUCGGAGAGGAAUGGACUGG sen-crARN11 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUUGAUUUGCAUUCUCAUGAAUGAUGUUU sen-crARN12 GACCACCCCAAUAUCGAAGGGGACUAAAACUUCAACCAAAGAGUUGAAGUGAGGCAAUGA sen-crARN13 GACCACCCCAAUAUCGAAGGGGACUAAAACUUCCCCCAUUGUCUAGUCUAUCAUUUCGUA sen-crARN14 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAUUGGGGGUUUCGUAACAAUCUGAUAGG sen-crARN15 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAAGAGGCUGAUCACAAGACAUAGCUCUA sen-crARN16 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGGUUGGGAAGACAUUGCAGAAACAGAGA sen-crARN17 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGGGUGCAAUCAGGUGAGGUACUUUUCCU sen-crARN18 GACCACCCCAAUAUCGAAGGGGACUAAAACUUGAACAUAGGGACCUUCCAAACUCCUAAG sen-crARN19 GACCACCCCAAUAUCGAAGGGGACUAAAACUUCCUUGUGUUCACAACACCCGACUUAACA sen-crARN20 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAAUCUCUAUGUCCUAAUUCCGGAUGCAG sen-crARN21 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUGGUGCAGAGAGGGGUCUUCCGCAUCUC sen-crARN22 GACCACCCCAAUAUCGAAGGGGACUAAAACUUAUCGGAGAGAGAAUUGACUUCUUACUAC sen-crARN23 GACCACCCCAAUAUCGAAGGGGACUAAAACUUUCUCGCAGGUGGGACAACCCCCAGAUAG 56 ANEXO 4 I) II) III) 57 Figura D. Imágenes representativas de células Sf9 transfectadas con ARNm EGFP a las cero, 48, 96 y 120 h post-transfección, a I) 100, II) 200 y III) 300 mil cel/mL, relación 1:3 mARN/TransIT-Boost. Columna izquierda y del centro, células Sf9 transfectadas con mARN-EGFP y columna de la derecha control de transfección, NTC. Las imágenes fueron capturadas en el microscopio Nikon Eclipse TE300, objetivo 10X. ANEXO 5 I) II) III) 58 Figura E. Imágenes representativas de células Sf9 transfectadas con ARNm LwCas13a-msfGFP(P1-P10), ARNm EGFP(P11) y NTC (P12-P14) a las I) 24, II) 48, III) 72 h post-transfección, a 200,000 cel/mL en placas de 12 pozos, a 1 mL de cultivo, relación v/v 1:3 ARNm:TransIT-Boost. P1 anti-crARN2, P2 anti-crARN14, P3 anti-crARN22, P4 anti-crARN29, P5 sen-crARN3, P6 sen-crARN6, P7 sen-crARN17, P8 sen-crARN, P9 sen- crARN23, P10 Cas13-msfGFP, P11 EGFP, P12 Ctrl(-), P13 TransITCtrl(-) OptMEM y P14 NTC. Las imágenes fueron capturadas en el microscopio Nikon Eclipse TE300, objetivo 10X