Aug 07, 2023
La epistasis compensatoria mantiene la afinidad de ACE2 en el SARS
Volumen de comunicaciones de la naturaleza
Nature Communications volumen 13, Número de artículo: 7011 (2022) Citar este artículo
3170 Accesos
13 citas
29 Altmetric
Detalles de métricas
La variante Omicron BA.1 surgió a fines de 2021 y se extendió rápidamente por todo el mundo. En comparación con las variantes anteriores de SARS-CoV-2, BA.1 tiene muchas mutaciones, algunas de las cuales se sabe que permiten el escape de anticuerpos. Muchas de estas mutaciones de escape de anticuerpos disminuyen individualmente la afinidad del dominio de unión al receptor de pico (RBD) por ACE2, pero BA.1 todavía se une a ACE2 con alta afinidad. Por lo tanto, la aptitud y la evolución del linaje BA.1 están impulsadas por los efectos combinados de numerosas mutaciones. Aquí, mapeamos sistemáticamente las interacciones epistáticas entre las 15 mutaciones en el RBD de BA.1 en relación con la cepa Wuhan Hu-1. Específicamente, medimos la afinidad de ACE2 de todas las combinaciones posibles de estas 15 mutaciones (215 = 32,768 genotipos), que abarcan todos los posibles intermedios evolutivos desde la cepa ancestral Wuhan Hu-1 hasta BA.1. Encontramos que las mutaciones de escape inmune en BA.1 reducen individualmente la afinidad de ACE2 pero se compensan con interacciones epistáticas con otras mutaciones que mejoran la afinidad, incluidas Q498R y N501Y. Por lo tanto, la capacidad de BA.1 para evadir la inmunidad mientras mantiene la afinidad de ACE2 depende de la adquisición de múltiples mutaciones que interactúan. Nuestros resultados implican la epistasis compensatoria como un factor clave que impulsa un cambio evolutivo sustancial para el SARS-CoV-2 y son consistentes con Omicron BA.1 que surge de una infección crónica.
La variante Omicron BA.1 del SARS-CoV-2 surgió en noviembre de 2021 y se propagó rápidamente por todo el mundo, impulsada en parte por su capacidad para escapar de la inmunidad existente en individuos vacunados y previamente infectados1,2. Sorprendentemente, Omicron no emergió como descendiente del linaje Delta entonces muy extendido. En cambio, apareció como una cepa muy divergente después de acumular docenas de mutaciones dentro de un linaje que no estaba circulando ampliamente en ese momento, incluidas 15 mutaciones dentro del dominio de unión al receptor de la proteína espiga (RBD)1.
Un trabajo reciente ha demostrado que varias de estas 15 mutaciones RBD (algunas de las cuales se observan en otras variantes) interrumpen la unión de anticuerpos monoclonales específicos3,4,5,6,7, lo que podría contribuir al escape inmunitario. Sin embargo, también se ha demostrado que la mayoría de estas mutaciones reducen la afinidad de unión a la ACE2 humana cuando surgen dentro de los linajes Wuhan Hu-1, Delta o varios otros SARS-CoV-28,9, lo que podría afectar la entrada viral en las células huésped. Por el contrario, Omicron RBD tolera estas mutaciones de escape mientras conserva una fuerte afinidad con ACE210,11, lo que sugiere que otras mutaciones en este linaje pueden ayudar a mantener la entrada viral.
Trabajos anteriores han analizado sistemáticamente los efectos mutacionales sobre la unión de anticuerpos y la afinidad de ACE2, por ejemplo, mediante el uso de exploración mutacional profunda (DMS)9,12. Sin embargo, estos enfoques se centran en los efectos de mutaciones individuales en antecedentes genéticos específicos. Por lo tanto, son útiles para comprender los primeros pasos de la evolución a partir de variantes existentes, pero no pueden explicar cómo interactúan múltiples mutaciones en trayectorias evolutivas más largas. Por lo tanto, no está claro cómo las combinaciones de mutaciones, como las observadas en Omicron, interactúan para evadir la inmunidad y mantener una fuerte afinidad con ACE2. Para abordar esta pregunta, utilizamos un enfoque de ensamblaje combinatorio para construir una biblioteca de plásmidos que contiene todas las combinaciones posibles de las 15 mutaciones en Omicron BA.1 RBD (un total de 215 = 32 768 variantes). Esta biblioteca, que representa la biblioteca combinatoriamente completa más grande de una proteína viral hasta la fecha, incluye todos los posibles intermedios evolutivos entre Wuhan Hu-1 y Omicron BA.1 RBD. Transformamos esta biblioteca de plásmidos en una cepa de exhibición de levadura estándar, creando una biblioteca de levaduras en la que cada celda muestra una única variante RBD monomérica correspondiente al plásmido en esa celda. Luego usamos Tite-Seq, un método basado en secuenciación y citometría de flujo de alto rendimiento 13,14 (ver "Métodos"; Fig. 1A complementaria), para medir las afinidades de unión, KD, aplicación, de las 32,768 variantes RBD a ACE2 humano en paralelo.
De acuerdo con el trabajo anterior realizado por nosotros mismos14 y otros9,13,15, encontramos que las mediciones de Tite-Seq son altamente reproducibles (SEM de 0,2 log KD, aplicación entre mediciones por triplicado) y consistentes con mediciones independientes de bajo rendimiento (ver "Métodos"; Figura complementaria 1b-f). Observamos que nuestras mediciones de afinidad de unión tienen pequeñas diferencias sistémicas con respecto a un estudio anterior9 debido a las diferencias en las estrategias de activación, pero las afinidades relativas son consistentes entre los dos conjuntos de datos (Fig. 1f complementaria). Además, encontramos una variación mínima en los niveles de expresión de RBD y, por lo tanto, podemos inferir KD, aplicación para toda la biblioteca combinatoria (ver "Métodos"; Fig. 3 complementaria).
Encontramos que todos los 32,768 intermedios RBD entre Wuhan Hu-1 y Omicron BA.1 tienen una afinidad detectable con ACE2, con KD, la aplicación varía entre 0.1 μM y 0.1 nM (Fig. 1a y Fig. 1 complementaria; ver https://desai -lab.github.io/wuhan_to_omicron/ para un navegador de datos interactivo). De acuerdo con estudios previos10, el BA.1 RBD exhibe una ligera mejora (tres veces tanto por Tite-seq como por mediciones isogénicas) en la afinidad de unión en comparación con Wuhan Hu-1 (Fig. 2 complementaria). Sin embargo, la mayoría (~60%) de las secuencias RBD intermedias en realidad muestran una afinidad de unión más débil a ACE2 que el ancestral Wuhan Hu-1 RBD. De hecho, no hay rutas desde Wuhan Hu-1 hasta Omicron BA.1 que no contengan al menos un paso que disminuya la afinidad de ACE2. Esto se debe principalmente a que la gran mayoría de las mutaciones BA.1 tienen un efecto neutral o perjudicial sobre la afinidad de ACE2 en la mayoría de los antecedentes genéticos (Fig. 1b). Esto es particularmente cierto para K417N, G446S, Q493R, G496S e Y505H, cuatro de los cuales se sabe que están involucrados en el escape de varias clases de anticuerpos monoclonales16,17,18.
a Distribución de las afinidades de unión a ACE2 en todos los N = 32 768 genotipos RBD probados. Las afinidades de unión se muestran como -logKD,app; las líneas verticales azules y rojas indican -logKD,aplicación para Wuhan Hu-1 y Omicron BA.1, respectivamente. b Distribuciones del efecto de cada mutación en la afinidad de ACE2 (definida como el cambio en -logKD,app resultante de la mutación) en todos los antecedentes genéticos posibles en los otros 14 loci. Los segmentos de línea negra indican los percentiles 25 y 75 de las distribuciones de efectos y los puntos representan las medias de distribución, n=16384 fondos. Los puntos azul y rojo especifican los efectos en Wuhan Hu-1 y los fondos más mutados, respectivamente. c Distribución de afinidades de unión agrupadas por número de mutaciones Omicron BA.1. La afinidad de unión de la variante Wuhan Hu-1 se indica mediante una línea discontinua horizontal. Los recuadros corresponden al rango entre los percentiles 25 y 75, y los bigotes se extienden hasta el valor mayor/menor no más de 1,5 veces el rango intercuartílico.
Aunque muchas mutaciones de BA.1 reducen la afinidad de ACE2 en promedio, las interacciones entre estas mutaciones dan como resultado una mejora en la afinidad de ACE2 por BA.1 en relación con la cepa ancestral Wuhan Hu-1. Es decir, las mutaciones tienden a ser más perjudiciales para la afinidad de ACE2 si hay pocas otras mutaciones presentes, pero tienden a volverse neutrales o incluso beneficiosas en presencia de muchas otras mutaciones (Fig. 1c; Fig. 4 complementaria). De acuerdo con esto, encontramos que aunque la mayoría de las 15 mutaciones RBD reducen la afinidad de ACE2 en el fondo Wuhan Hu-1 (y en muchos casos también en la mayoría de los otros fondos), todas se vuelven menos perjudiciales o incluso beneficiosas en el más mutado. fondo (Fig. 1b). Este patrón explica por qué BA.1 RBD tiene una mayor afinidad por ACE2 a pesar de contener tantas mutaciones que reducen individualmente la afinidad por ACE2: sus efectos nocivos se ven mitigados por interacciones epistáticas compensatorias con otras mutaciones.
Para analizar sistemáticamente los efectos e interacciones mutacionales, ajustamos un modelo bioquímico estándar de epistasis19 a nuestros datos. Esto descompone nuestro -log(KD,app) medido (que se espera que sea proporcional a la energía libre de unión, ΔG)20,21 en una suma de efectos de mutaciones individuales, epistasis por pares e interacciones epistáticas de orden superior entre conjuntos de mutaciones (truncadas en quinto orden; figura complementaria 5, consulte "Métodos"). Específicamente, escribimos la afinidad de unión de una secuencia s como
donde \({C}_{i}\) contiene todas las \(\left(\begin{array}{c}L\\ i\end{array}\right)\) combinaciones de \(i\) mutaciones y \({x}_{c,s}\) es igual a 1 si la secuencia \(s\) contiene todas las mutaciones en \(c\) y a 0 en caso contrario (ver Métodos; todos los coeficientes para \(c\ ) con mutaciones \(i\) se denominan coeficientes de i-ésimo orden). Este modelo produce coeficientes que son comparables a modelos alternativos de epistasis estadística (Fig. 6 complementaria) y global22 (Fig. 7 complementaria). En general, encontramos que las magnitudes de los efectos de primer orden de las mutaciones individuales (Fig. 2a) se correlacionan con el área de superficie de contacto de ACE2 del residuo correspondiente (Fig. 2b, c), y es más probable que los residuos vecinos tengan fuertes pares. interacciones (Fig. 2e), como cabría esperar de trabajos previos14,23.
a Efectos de primer orden en el modelo de interacción epistática de mejor ajuste (hasta quinto orden). Las barras de error representan los errores estándar del ajuste del modelo y están centradas en la media, n=16 384. b Estructura cocristalina del receptor Omicron BA.1 RBD y ACE2 (PDB ID 7WPB). Los residuos mutados se muestran como esferas coloreadas como en (a). c Efectos de primer orden para cada mutación representados frente al área de superficie de contacto entre el residuo BA.1 RBD correspondiente y ACE2. Mutaciones coloreadas como en (a). El coeficiente de correlación de rango de Spearman (rs) entre el efecto de primer orden y el área de la superficie de contacto se indica en la parte superior izquierda. d Coeficientes de interacción epistática de segundo orden y coeficientes de interacción de orden superior. Para cada mutación, el coeficiente de interacción de orden superior (que se muestra en la parte inferior del gráfico del mapa de calor) se calcula sumando todos los coeficientes de interacción de tercer y cuarto orden relacionados con la mutación. e Coeficientes de interacción por pares representados frente a las distancias entre los respectivos carbonos alfa. Las mutaciones están coloreadas por coeficiente por pares como en (d). El coeficiente de correlación de rangos de Spearman (rs) se indica en la parte superior izquierda.
Nuestros coeficientes inferidos por pares y de orden superior revelan que las fuertes interacciones compensatorias compensan los efectos de las mutaciones reductoras de afinidad (Fig. 2d). La magnitud de estas interacciones es comparable a la de los efectos de primer orden, y esta epistasis es abrumadoramente positiva, ya que la exclusión de los términos epistáticos conduce a una subestimación constante de la afinidad predicha (Fig. 8 complementaria). Esta fuerte epistasis positiva significa que las mutaciones que reducen la afinidad de ACE2 se vuelven menos perjudiciales en fondos que contienen otras mutaciones. Por ejemplo, el efecto negativo de primer orden de Q498R se revierte completamente por su interacción con la mutación cercana N501Y; esta interacción por pares se ha destacado en trabajos anteriores8,11,24 como un caso de epistasis compensatoria. Además, identificamos muchas otras mutaciones que interactúan, incluidas interacciones positivas aún más fuertes (junto con efectos de tercer y cuarto orden) entre Q498R, G496S, N501Y e Y505H (Fig. 2d). De hecho, la afinidad de ACE2 se ve afectada por muchas interacciones de orden superior significativas, la mayoría de las cuales incluyen estas cuatro mutaciones (hasta el quinto orden; Datos complementarios 1).
Nuestros análisis de epistasis revelan que tal epistasis compensatoria de alto orden elimina los efectos fuertemente nocivos de las mutaciones involucradas en el escape de anticuerpos en la afinidad de ACE2. Esta compensación entre mutaciones beneficiosas específicas (en particular N501Y) y mutaciones de escape inmune se ha observado en estudios previos8,25,26,27. Aquí, cuantificamos el alcance de esta epistasis y, por lo tanto, su impacto en la configuración de todo el panorama de afinidad de secuencia RBD. Específicamente, trabajos anteriores han demostrado que cinco mutaciones BA.1 (K417N, G446S, E484A, Q493R y G496S) tienen un efecto particularmente fuerte en la promoción del escape de anticuerpos4,17,18. Todas estas mutaciones reducen individualmente la afinidad por ACE2 tanto en promedio como en el fondo Wuhan Hu-1 (excepto E484A; Figs. 1b, 2a, 3a), y la combinación de las cinco es fuertemente perjudicial (Fig. 3a, b). Sin embargo, la fuerte epistasis de alto orden con el par de Q498R y N501Y mitiga esto: N501Y o Q498R por sí solos reducen el costo de las cinco mutaciones de escape, y la combinación de ambos compensa casi por completo estos efectos nocivos (Fig. 3b). Si bien estas mutaciones de escape también se benefician de las interacciones con otras mutaciones (Fig. 9 complementaria), N501Y y Q498R representan la mayor parte del efecto compensatorio. Observamos que las fuertes interacciones compensatorias también mitigan el efecto nocivo de Y505H (Fig. 3c). No se ha demostrado previamente que esta mutación esté fuertemente involucrada en el escape de anticuerpos, pero el patrón de compensación que observamos sugiere que puede ser funcionalmente relevante de alguna manera.
a Afinidades de unión a ACE2 para variantes que contienen mutaciones que tienen un fuerte efecto en el escape de anticuerpos: K417N, G446S, E484A, Q493R y G496S agrupadas por la presencia de mutaciones compensatorias (Q498R y N501Y). La línea azul discontinua (resp. roja) indica la afinidad de unión a ACE2 de Wuhan Hu-1 (resp. Omicron BA.1). Los recuadros representan el rango intercuartílico. b Los cambios en las afinidades de unión a ACE2 para las variantes que contienen una (o todas) de las mutaciones de escape seleccionadas agrupadas por la presencia de mutaciones compensatorias (Q498R y N501Y). La línea discontinua indica que no hay cambio de afinidad. Los recuadros representan el rango intercuartílico. c Afinidades de unión a ACE2 para variantes que contienen Y505H y mutaciones de escape de anticuerpos presentadas como en (a).
La extensa epistasis que observamos significa que los efectos individuales de cada una de estas 15 mutaciones, así como las interacciones por pares entre ellas, probablemente sean diferentes en otros linajes virales. Sin embargo, trabajos anteriores han demostrado que las mutaciones de escape de anticuerpos descritas anteriormente (K417N, G446S, E484A, Q493R y G496S) reducen de manera similar la afinidad de ACE2 en varias otras variantes (incluidas Alpha, Beta, Eta y Delta)8. De acuerdo con este resultado, encontramos que estas mutaciones, junto con otras que encontramos que tienen un efecto negativo de primer orden en la afinidad de ACE2, rara vez ocurren en la filogenia del SARS-CoV-2 (Fig. 4a). Esto sugiere que mantener la afinidad con ACE2 humano es probablemente un aspecto importante de la aptitud viral, por lo que estas mutaciones generalmente se seleccionan en contra. De manera similar, encontramos que las mutaciones con efectos negativos en la afinidad de ACE2 que se compensan con interacciones epistáticas con N501Y tienden a enriquecerse a lo largo de la filogenia del SARS-CoV-2 en las cepas que también tienen N501Y, en relación con las cepas que no lo tienen (Fig. 4b; otras interacciones por pares ocurren muy raramente como para probarlas). Esto sugiere además que al menos algunas de las interacciones epistáticas por pares que observamos también están presentes en otros antecedentes, y que la evolución viral ha favorecido la compensación por la reducción de la afinidad por ACE2.
a Frecuencia de aparición de cada mutación en las secuencias de SARS-CoV-2 disponibles en GISAID (consulte "Métodos") en función de su efecto promedio en la afinidad de ACE2 en nuestros datos. Las barras de error indican la desviación estándar de los tamaños del efecto y están centradas en la media (n=16384 fondos). El coeficiente de correlación de rangos de Spearman (rs) se indica en la parte superior izquierda. (b) Frecuencia normalizada de mutaciones que coexisten con N501Y en las secuencias de SARS-CoV-2 disponibles en GISAID (calculada en función de la frecuencia con la que ocurre cada mutación en la misma rama que N501Y, normalizada por su frecuencia general; consulte "Métodos" ) en función de la diferencia en su efecto sobre la afinidad de ACE2 en presencia de N501Y. Las barras de error indican la desviación estándar de los efectos y están centradas en la media (n=8096 fondos). El coeficiente de correlación de rangos de Spearman (rs) se indica en la parte superior izquierda. c Trayectorias de afinidad de ACE2 para 100 vías seleccionadas al azar (que involucran las 15 mutaciones), que se muestran como una función del número de mutaciones con fuerte efecto en el escape de anticuerpos (K417N, G446S, E484A, Q493R y G496S) y la presencia o ausencia de compensación. mutaciones Q498R y N501Y (mostradas con colores). Cada trayectoria representa un posible orden de mutación, comenzando en el genotipo Wuhan Hu-1 y terminando en Omicron BA.1.
Juntos, estos resultados sugieren que la evolución del escape de anticuerpos en BA.1 fue posible sin interrumpir la unión a ACE2 debido a las interacciones compensatorias con muchas otras mutaciones exclusivas de este linaje. Si bien las firmas de estas presiones de selección e interacciones epistáticas están presentes en toda la filogenia viral28, y las variantes de escape de anticuerpos podrían haber sido compensadas por otras combinaciones de mutaciones, es solo el linaje BA.1 el que acumuló esta combinación particular de mutaciones compensatorias que interactúan.
Nuestros resultados también brindan información sobre por qué el fenotipo de escape inmunitario observado en Omicron BA.1 no surgió como resultado de la acumulación de mutaciones dentro de la variante Delta que entonces circulaba ampliamente. Específicamente, es poco probable que la combinación de múltiples mutaciones requeridas tanto para el escape inmunológico como para mantener la afinidad con ACE2 (Fig. 4c) se haya acumulado en el contexto de infecciones agudas, que involucran pocas mutaciones entre cuellos de botella de transmisión y presumiblemente fuertes presiones de selección en ambas funciones29. Por el contrario, en las infecciones crónicas (p. ej., en un huésped inmunocomprometido), los grandes tamaños de población y las presiones de selección relajadas pueden permitir la acumulación de muchas mutaciones necesarias para mantener la afinidad de ACE2 y evadir los anticuerpos neutralizantes30,31. Alternativamente, como se especuló anteriormente32,33, BA.1 puede haber evolucionado dentro de un reservorio animal donde las presiones de selección también pueden haberse relajado. En cualquier escenario, las mutaciones compensatorias pueden haber precedido a las mutaciones de escape inmunitario, minimizando sus efectos perjudiciales sobre la afinidad de ACE2. Alternativamente, la selección relajada para unirse a ACE2 puede haber creado un entorno permisivo para las mutaciones de escape inmune, seguido de una compensación que luego permitió que la variante se propagara a otros huéspedes. El análisis filogenético proporciona cierto apoyo a la primera posibilidad, ya que dos mutaciones de escape inmune (G446S y G496S) ocurren tarde en la evolución BA.1 (y no se comparten con el linaje BA.2; Fig. 10 complementaria). Además, un modelo de selección fuerte basado en la afinidad de ACE2 prefiere que las tres mutaciones específicas de BA.1 aparezcan tarde en la evolución, como se observa en la filogenia (Fig. 11 complementaria). Independientemente del orden exacto de las mutaciones, el gran tamaño de la población viral y la presión de selección relajada de una infección crónica pueden haber creado condiciones propicias para la fijación de las diversas mutaciones requeridas para que BA.1 evada los anticuerpos neutralizantes mientras mantiene la afinidad por ACE2.
Hacemos hincapié en que nuestro trabajo se limita a 15 mutaciones dentro de una región específica de una proteína y, por lo tanto, descuida las interacciones potenciales con las muchas otras mutaciones fuera del RBD que están presentes en el linaje Omicron BA.1. Sin embargo, encontramos que las interacciones entre las mutaciones de RBD por sí solas son suficientes para explicar cómo se mantiene la afinidad de ACE2, lo que no es obvio solo a partir de los datos de un solo mutante. Además, también notamos que las interacciones positivas en la afinidad de ACE2 podrían traducirse negativamente en otros fenotipos. Por ejemplo, estas interacciones podrían inhibir la evasión inmunitaria y, por lo tanto, también es necesario mapear los efectos resultantes de estas interacciones sobre la evasión inmunitaria. Además, es probable que la expresión y la estabilidad de la proteína espiga también desempeñen un papel clave en la evolución viral. Encontramos algunos indicios de esta tendencia en nuestros datos. Por ejemplo, identificamos una interacción sinérgica significativa entre S371L, S373P y S375F que mejora la expresión de RBD en levadura, de acuerdo con un trabajo anterior que muestra que este conjunto de mutaciones está asociado con la estabilización de una conformación descendente más apretada de RBD34 (Suplementario Figura 4). Más allá de esto, es probable que también sean relevantes muchos otros fenotipos.
A pesar de estas advertencias, nuestros resultados demuestran que los eventos clave en la evolución viral pueden depender de patrones de epistasis de alto orden. Encontramos que estas interacciones epistáticas son casi en su totalidad sinérgicas o compensatorias, un patrón que podría ser una característica emergente general de los virus que evolucionan en un paisaje inmuno-restringido. Esto puede ser especialmente importante para eventos adaptativos complejos que implican numerosas mutaciones, como el escape inmunitario y el cambio de huésped. Por lo tanto, para predecir el futuro de la evolución viral, debemos ir más allá de las pantallas de alto rendimiento de mutaciones individuales y analizar de manera más completa el espacio de secuencia combinatoria. Un desafío clave es la inmensidad de este espacio secuencial, que hace intratable la exploración exhaustiva. Sin embargo, generar paisajes combinatorios específicos como los presentados aquí puede ayudar a revelar patrones generales de epistasis que dan forma a la evolución viral en entornos complejos.
Para generar cepas de levadura clonales para las variantes Wuhan Hu-1 y Omicron BA.1, clonamos el gblock RBD correspondiente (IDT, datos complementarios 2) en el vector de visualización de superficie de levadura pETcon (plásmido 2649; Addgene, Watertown, MA, #166782 ) a través de Gibson Assembly. La secuencia del gblock se optimizó por codones para levadura (usando el algoritmo Twist Bioscience); encontramos que la optimización de codones tuvo un impacto significativo en la eficiencia de visualización. Además, para la construcción de la biblioteca (descrita a continuación), eliminamos dos sitios Bsa-I existentes del plásmido mediante mutagénesis dirigida al sitio (Agilent, Santa Clara, CA, #200521). En la producción de la cepa clonal, los productos de Gibson Assembly se transformaron en células de E. coli electrocompetentes NEB 10-beta (NEB, Ipswich, MA, #C3020K), siguiendo el protocolo del fabricante. Después de una incubación durante la noche a 37 °C, las células se recogieron y los plásmidos resultantes se purificaron y secuenciaron según Sanger. Transformamos plásmidos que contenían las secuencias correctas en la cepa de levadura AWY101 (obsequio amable del Dr. Eric Shusta)35 según lo descrito por Gietz y Schiestl36. Los transformantes se sembraron en agar SDCAA (1,71 g/l de YNB sin aminoácidos y sulfato de amonio [Sigma-Aldrich n.° Y1251], 5 g/l de sulfato de amonio [Sigma-Aldrich n.° A4418], dextrosa al 2 % [VWR n.° 90000–904 ], 5 g/L de Bacto casaminoácidos [VWR #223050], 100 g/L de ampicilina [VWR #V0339], 2 % Difco Noble Agar [VWR #90000–774]) e incubados a 30 °C durante 48 h. Se volvieron a sembrar varias colonias en agar SDCAA y se incubaron de nuevo a 30 °C durante 48 horas. Las cepas de levadura clonales se recogieron, inocularon, se cultivaron hasta la saturación en SDCAA líquido (6,7 g/L YNB sin aminoácido VWR n.º 90004-150), 5 g/L de sulfato de amonio (Sigma-Aldrich n.º A4418), dextrosa al 2 % (VWR n.º 90000–904), 5 g/L de Bacto casaminoácidos (VWR n.° 223050), 1,065 g/L de tampón MES (Cayman Chemical, Ann Arbor, MI, n.° 70310), 100 g/L de ampicilina (VWR n.° V0339)) a 30 °C, y se mezcla con glicerol al 5 % para almacenamiento a -80 °C.
Generamos la biblioteca de variantes RBD con una estrategia de ensamblaje combinatoria Golden Gate. Primero, dividimos la secuencia RBD en cinco fragmentos de aproximadamente la misma longitud, que van desde 90 a 131 pb y cada uno contiene entre 1 y 4 mutaciones. Introdujimos sitios BsaI y salientes en ambos extremos de cada secuencia de fragmento. Estos salientes contenían sitios de corte BsaI que permitirían que los cinco fragmentos se ensamblaran de forma única en su orden correcto dentro del esqueleto del plásmido. Para cada fragmento con n mutaciones, generamos versiones de 2n fragmentos ya sea produciendo los fragmentos a través de PCR (Fragmentos 1-4) o comprando dúplex de ADN individuales (Fragmento 5) de IDT. Estas permutaciones aseguraron la inclusión de todas las posibles combinaciones de mutaciones en la biblioteca. En el Fragmento 2, también incluimos una sustitución sinónima en el residuo K378 que corresponde a la mutación K417N. Esta sustitución permite secuenciar la biblioteca de amplicones en Illumina Novaseq SP (2x250 pb). Para la producción de dsDNA por PCR, diseñamos los fragmentos de modo que las mutaciones que contienen estén cerca de los extremos 3 'o 5'. Este diseño permitió que los cebadores incluyeran e introdujeran simultáneamente las mutaciones, los sitios BsaI y los salientes únicos elegidos durante la PCR. Producimos cada versión de cada fragmento individualmente (28 reacciones de PCR en total; Datos complementarios 3) y agrupamos los productos de cada fragmento en proporciones equimolares. Además, también agrupamos los 16 dúplex de ADN comprados que codifican el quinto fragmento en proporciones equimolares. Luego creamos una mezcla final de fragmentos agrupando los cinco grupos de fragmentos. En la reacción de Golden Gate, las versiones de cada fragmento se unirían en combinaciones aleatorias, produciendo todas las secuencias presentes en frecuencias aproximadamente iguales.
Además de la mezcla de fragmentos, preparamos cuatro versiones de la columna vertebral del plásmido para la reacción de Golden Gate. Cada versión contiene una combinación de las mutaciones N501Y e Y505H. Antes del ensamblaje, introdujimos el marcador de contraselección ccdB, en lugar de la región de inserción del fragmento, con sitios BsaI flanqueantes (Datos complementarios 3). Realizamos la clonación Golden Gate usando Golden Gate Assembly Mix (NEB, Ipswich, MA, #E1601L), siguiendo el protocolo recomendado por el fabricante, con una proporción molar de 7:1 del grupo de insertos de fragmentos al esqueleto del plásmido. Transformamos los productos de ensamblaje en células de E. coli electrocompetentes NEB 10-beta en alícuotas de células de 6 × 25 μL. Luego transferimos cada uno de los cultivos celulares recuperados a 100 ml de LB fundido (triptona al 1 %, extracto de levadura al 0,5 %, NaCl al 1 %) que contenía agarosa SeaPrep al 0,3 % (VWR, Radnor, PA n.° 12001–922) esparcida en una capa delgada en un matraz con deflectores de 1 L (alrededor de 1 cm de profundidad). La mezcla se colocó a 4 °C durante tres horas, después de lo cual se incubó durante 18 horas a 37 °C. Observamos un total de 3 millones de transformantes en alícuotas. Para aislar la biblioteca de plásmidos, mezclamos los matraces agitándolos durante 1 h y sedimentamos las células para maxiprep de plásmido estándar (Zymo Research, Irvine, CA, D4201), a partir del cual obtuvimos >90 μg de plásmido purificado.
Luego transformamos la biblioteca de plásmidos purificados en células AWY101 como se describe anteriormente. Recuperamos los transformantes en un gel de agarosa SDCAA fundido (1,71 g/L YNB sin aminoácidos y sulfato de amonio (Sigma-Aldrich #Y1251), 5 g/L de sulfato de amonio (Sigma-Aldrich, St. Louis, MO, #A4418), Dextrosa al 2 % (VWR n.° 90000–904), 5 g/L de Bacto casaminoácidos (VWR n.° 223050), 100 g/L de ampicilina (VWR n.° V0339)) que contienen 0,35 % de agarosa SeaPrep (VWR n.° 12001–922) esparcidas en una capa delgada (alrededor de 1 cm de profundidad). La mezcla se colocó a 4 °C durante tres horas, luego de lo cual se incubó a 30 °C durante 48 h. De cinco alícuotas, obtuvimos ~1,2 millones de colonias. Después de mezclar los matraces agitándolos durante 1 h, cultivamos células en tubos de 5 ml de SDCAA líquido durante cinco generaciones y almacenamos el cultivo saturado en alícuotas de 1 ml suplementadas con glicerol al 5 % a -80 °C.
Tite-Seq se realizó como se describió previamente36. Realizamos tres réplicas del ensayo en días diferentes. En las dos primeras réplicas, una pequeña parte de las variantes de la biblioteca contenía una mutación fuera del objetivo (E484W) en lugar de la mutación prevista (E484A). Estas variantes se eliminaron del análisis de datos y, en la tercera réplica, la biblioteca se complementó con variantes que contenían la mutación deseada (E484A).
Primero, descongelamos las bibliotecas RBD de levadura, así como las cepas clonales Wuhan Hu-1 y Omicron BA.1, mediante la inoculación de 150 μL del stock de glicerol correspondiente (cultivo saturado con glicerol al 5 % almacenado a -80 °C) en 5 mL de SDCAA a 30 °C durante 20 h. Al día siguiente, los cultivos de levadura se diluyeron a OD600 = 0,67 en 5 ml de SGDCAA (6,7 g/L YNB sin aminoácido VWR n.º 90004-150), 5 g/l de sulfato de amonio (Sigma-Aldrich n.º A4418), galactosa al 2 %. (Sigma-Aldrich n.° G0625), dextrosa al 0,1 % (VWR n.° 90000–904), 5 g/l de Bacto casaminoácidos (VWR n.° 223050), tampón MES de 1,065 g/l (Cayman Chemical, Ann Arbor, MI, n.° 70310) , 100 g/L de ampicilina (VWR n.º V0339)), y se rotaron a temperatura ambiente durante 16 a 20 horas.
Después de la inducción durante la noche, los cultivos de levadura se sedimentaron, se lavaron dos veces con PBSA al 0,01 % (VWR n.° 45001–130; GoldBio, St. Louis, MO, n.° A-420–50) y se resuspendieron hasta una OD600 de 1. Un total de 500 -700 μL de células de levadura OD1 se marcaron con ACE2 humano biotinilado (Acrobiosystems #AC2-H2H82E6) en cada una de las doce concentraciones de ACE2 (incrementos de medio logaritmo que abarcan 10-12,5-10-7 M), con volúmenes ajustados para limitar el agotamiento del ligando los efectos sean inferiores al 10 % (suponiendo 50 000 RBD de superficie/célula37). Las mezclas de levadura-ACE2 se incubaron y rotaron a temperatura ambiente durante 20 horas. Después de la incubación, los complejos levadura-ACE2 se sedimentaron centrifugando a 3000 × g durante 10 min a 4 °C, se lavaron dos veces con PBSA al 0,5 % + EDTA 2 mM y, posteriormente, se marcaron con estreptavidina-RPE (1:100, Thermo Fisher # S866) y anti-cMyc-FITC (1:50, Miltenyi Biotec, Somerville, MA, #130-116-485) a 4 °C durante 45 min. Después de este marcaje secundario, las levaduras se lavaron dos veces con PBSA al 0,5 % + EDTA 2 mM y se dejaron en hielo en la oscuridad hasta su clasificación.
Clasificamos el complejo de la biblioteca de levaduras en un BD FACS Aria Illu, equipado con láseres de 405 nm, 440 nm, 488 nm, 561 nm y 635 nm, y una boquilla fija de 85 micras. Para minimizar los efectos de superposición espectral, determinamos la compensación entre FITC y PE usando controles de un solo fluoróforo. Las células individuales se seleccionaron primero mediante FSC frente a SSC y luego se clasificaron por fluorescencia de expresión (FITC) o de unión (PE). Se clasificaron al menos un millón de células para cada muestra. En las clasificaciones de expresión, los singletes (basados en FSC frente a SSC) se clasificaron en ocho contenedores FITC equivalentes espaciados logarítmicamente. Para las clasificaciones de unión, las células FITC+ se clasificaron en 4 recipientes de PE (la población de PE- comprendía el recipiente 1 y la población de PE+ se dividió en tres recipientes espaciados logarítmicamente equivalentes 2–414,37. Las células clasificadas se recolectaron en tubos de polipropileno recubiertos y lleno con 1 ml de YPD suplementado con 1 % de BSA. Tras la recuperación, las células se sedimentaron centrifugando a 3000 xg durante 10 min y se resuspendieron en 4 ml de SDCAA. Los cultivos se rotaron a 30 °C hasta la fase logarítmica tardía (OD600 = 0,9– 1.4).
Se sedimentaron 1,5 ml de cultivos de levadura logarítmicos tardíos y se almacenaron a -20 °C durante al menos seis horas antes de la extracción. Los plásmidos de presentación de levadura se extrajeron utilizando Zymo Yeast Plasmid Miniprep II (Zymo Research # D2004), siguiendo las instrucciones del fabricante, y se eluyeron en un tampón de elución de 17 μL. Las bibliotecas de secuenciación de amplicón RBD se prepararon mediante una PCR de dos pasos como se describió anteriormente14,38. En la primera PCR, se agregaron identificadores moleculares únicos (UMI), índices en línea y adaptadores de Illumina parciales a la biblioteca de secuencias a través de 7 ciclos de amplificación para minimizar el sesgo de amplificación de la PCR. Usamos 5 μL de ADN plasmídico como plantilla en un volumen de reacción de 25 μL con polimerasa Q5 de acuerdo con el protocolo del fabricante (NEB # M0491L). La reacción se incubó en un termociclador con el siguiente programa: 1. 60 s a 98 °C, 2. 10 s a 98 °C, 3. 30 s a 66 °C, 4. 30 s a 72 °C, 5. GOTO 2, 6x, 6. 60 s a 72 °C. Poco después de que se completó la reacción, agregamos 25 μL de agua a las reacciones y realizamos una limpieza de perlas magnéticas 1.2X (Aline Biosciences #C-1003–5). A continuación, los productos purificados se eluyeron en 35 μl de tampón de elución. En la segunda PCR, el resto del adaptador Illumina y los índices Illumina i5 e i7 específicos de la muestra se agregaron a través de 35 ciclos de amplificación (Datos complementarios 4–5 para secuencias de cebadores). Usamos 33 μL del producto de PCR1 purificado como plantilla, en un volumen total de 50 μL usando polimerasa Kapa (Kapa Biosystems #KK2502) de acuerdo con las instrucciones del fabricante. Esta segunda reacción la incubamos en un termociclador con el siguiente programa: 1. 30 s a 98 °C, 2. 20 s a 98 °C, 3. 30 s a 62 °C, 4. 30 s a 72 °C, 5 GOTO 2, 34x, 6. 300 s a 72 °C. Las bibliotecas de secuenciación resultantes se purificaron utilizando perlas Aline 0,85X, se verificó que el tamaño del amplicón era de ∼500 pb al ejecutarlo en un gel de agarosa al 1 % y la concentración del amplicón se cuantificó mediante un colorante fluorescente de unión al ADN (Biotium, Fremont, CA, n.° 31068 , según las instrucciones del fabricante) en Spectramax i3. Luego agrupamos las bibliotecas de amplicones de acuerdo con la cantidad de células clasificadas y seleccionamos más este grupo por tamaño mediante una purificación de perlas Aline de dos lados (0.5–0.9X). El tamaño final de la piscina fue verificado por Tapestation 5000 HS y 1000 HS. La biblioteca de secuenciación final se cuantificó con un fluorómetro Qubit y se secuenció en un Illumina NovaSeq SP con 10 % de PhiX.
Procesamos nuestras lecturas de secuenciación demultiplexadas sin procesar para identificar y extraer los índices y los sitios mutacionales. Para hacerlo, desarrollamos una canalización de snakemake39 que primero analizó todos los archivos fastq y separó las lecturas de acuerdo con los índices en línea, UMI y lecturas de secuencia utilizando la biblioteca de Python regex40. Aceptamos secuencias que coincidían con la lectura completa (sin restricciones en las bases en los sitios de mutación) con una tolerancia de desajuste del 10 % pb. A continuación, descartamos los índices en línea incorrectos (según los índices i5/i7 correspondientes) y analizamos las secuencias de lectura en genotipos binarios ('0' para el alelo Wuhan Hu-1 o '1' para el alelo Omicron BA.1 en cada posición de mutación). Se descartaron las lecturas con errores en los sitios de mutación (es decir, que no coincidían ni con el alelo Wuhan Hu-1 ni con el alelo Omicron BA.1). Finalmente, contamos el número de UMI distintos para cada genotipo y recopilamos los recuentos de genotipos de todas las muestras en una sola tabla. La cobertura media en todas las réplicas fue ~150x.
Para ajustar las constantes de disociación de unión KD,app para cada genotipo, seguimos el mismo procedimiento descrito anteriormente39. En resumen, usamos datos de secuenciación y citometría de flujo para calcular el logaritmo de fluorescencia promedio de cada genotipo \(s\) en cada concentración \(c\), a continuación:
donde \({F}_{b,c}\) es la fluorescencia logarítmica media de bin \(b\) en la concentración \(c\), y \({p}_{b,s\vee c} \) es la proporción inferida de células del genotipo s que se clasifican en bin \(b\) en la concentración \(c\). El \({p}_{b,s\vee c}\) a su vez se estima a partir de los recuentos de lectura como
donde \({R}_{b,s,c}\) es el número de lecturas del genotipo s que se encuentran en el contenedor \(b\) en la concentración \(c\), mientras que \({C}_{ b,c}\) se refiere al número de células clasificadas en el contenedor \(b\) en la concentración \(c\).
Para propagar la incertidumbre en la estimación del intervalo medio, usamos la fórmula
donde \(\delta {F}_{b,c}\) es la dispersión de la fluorescencia logarítmica de las células ordenadas en el contenedor \(b\) a la concentración \(c\). Como investigamos previamente, encontramos que estimar \(\delta {F}_{b,c}\approx \sigma {F}_{b,c}\) es suficiente para capturar la variación que observamos en log-fluorescencia dentro de cada papelera. Por el contrario, el error en \({p}_{b,s\vee c}\) surge del error de muestreo, que se puede aproximar como un proceso de Poisson cuando los recuentos de lectura son lo suficientemente altos.
Así tenemos:
Finalmente, inferimos la constante de disociación de enlace (KD,s) para cada variante ajustando el logaritmo de la función de Hill al log-fluorescencia medio\({\bar{F}}_{s,c}\), como una función de concentraciones de ACE2 \(c\):
donde \({A}_{s}\) es el aumento de la fluorescencia en la saturación de ACE2 y \({B}_{s}\) es el nivel de fluorescencia de fondo. El ajuste se realizó mediante la función curve_fit en el paquete de Python scipy.optimize. En todos los genotipos, dimos límites razonables a los valores de \({A}_{s}\) para que fueran 102−106, \({B}_{s}\) para que fueran 1-105 y KD,s ser 10−14−10−5. Luego promediamos los valores de KD,s inferidos en las tres réplicas después de eliminar los valores con ajuste deficiente (\({r}^{2}\, < \, 0.8\)).
Notamos que nuestro enfoque aquí difiere ligeramente de algunos trabajos anteriores9,41 que a menudo ajustan esta función de Hill directamente usando el contenedor medio con la siguiente ecuación:
en lugar de utilizar los valores medios de fluorescencia inferidos. Este uso de valores de bin promedio introduce un sesgo porque los números de bin son proporcionales a la fluorescencia logarítmica media, en lugar de a la fluorescencia media. Por lo tanto, los valores de KD,s inferidos con este método anterior no son exactos. Sin embargo, en nuestro rango de medición, estos valores todavía están linealmente correlacionados con nuestras mediciones (ver la Fig. 1e complementaria).
Validamos nuestro método de afinidad de unión de alto rendimiento seleccionando 10 clones RBD específicos para una validación de bajo rendimiento: Wuhan Hu-1, Omicron, 5 mutantes simples (K417N, S477N, T478K, Q498R, N501), dos mutantes dobles (Q498R/ N501Y y E484A/Q498R), y un genotipo con cuatro mutaciones (K417N/E484A/Q498R/N501Y). Para cada curva de titulación isogénica, seguimos la misma estrategia de etiquetado, titulando ACE2 en concentraciones que oscilan entre 10-12-10-7 M para cepas de levadura isogénicas que muestran solo la secuencia de interés. El logaritmo medio de la fluorescencia se midió utilizando un analizador de células BD LSR Fortessa. Calculamos directamente la media y las varianzas de estas distribuciones para cada concentración y las usamos para inferir el valor de -log10 (KD) usando la fórmula (que se muestra arriba) (ver la Fig. 1 complementaria).
Primero usamos un modelo lineal simple donde los efectos de las combinaciones de mutaciones se suman al fenotipo de una secuencia. El logaritmo de la afinidad de unión \({{\log }}_{10}\left({K}_{D,s}\right)\) es proporcional a los cambios de energía libre, por lo que en un modelo sin interacción, ellos combinaría aditivamente41. El modelo de orden K completo se puede escribir:
donde \({\beta }_{c}\) denota el coeficiente para la combinación de mutación \(c\)(ya sea el coeficiente de mutación simple para \(i=1\) o el coeficiente de interacción de lo contrario), contiene todas las combinaciones de i mutaciones y es igual a 1 si la secuencia contiene todas las mutaciones en ya 0 en caso contrario. Esta elección se denomina epistasis 'bioquímica' o 'local'42 y es la utilizada en el texto principal. Otra opción, denominada epistasis 'estadística' o de 'conjunto', consiste en sustituir los coeficientes por. En este modelo "estadístico", la línea base es la afinidad media de la población y los efectos de primer orden de las mutaciones corresponden a su efecto medio sobre la afinidad. Presentamos el resultado de este análisis y las diferencias con el modelo bioquímico en la Fig. 6 complementaria.
Para elegir el valor óptimo de K, seguimos el método detallado en Phillips y Lawrence et al., 202142. Brevemente, usamos una validación cruzada de 10 veces para probar todos los valores de K ≤ 6. Para cada valor de K, los datos se divide en diez y cada uno de los diez subconjuntos de datos se utiliza como conjunto de prueba para un modelo entrenado en el resto de los datos. Elegimos el valor de K que maximiza el rendimiento de predicción (R²) promediado sobre los diez conjuntos de datos de prueba. Para este conjunto de datos, encontramos un valor óptimo de K = 5 (Fig. 5 complementaria). Finalmente, entrenamos un modelo K=5 sobre el conjunto de datos completo para obtener los coeficientes finales. El número de parámetros del modelo final (~5000) es mucho menor que el número de puntos de datos observados (215 = 32768).
Como se mencionó anteriormente, el logaritmo de la afinidad de unión es proporcional a un cambio de energía libre, una cantidad extensiva. Esto justifica teóricamente el uso de un modelo lineal. No obstante, en algunos escenarios, las interacciones entre mutaciones pueden explicarse mejor por una función no lineal con pocos parámetros que actúan sobre el fenotipo completo ("epstasis global") en lugar de una gran cantidad de interacciones de efectos pequeños de alto orden ("epstasis idiosincrática" ). Nuestra implementación es similar a la descrita por Sailer y Harms, 201743 y sigue de cerca a Phillips y Lawrence et al., 202142. En resumen, usamos una función logística Φ, con cuatro parámetros, para ajustar la expresión:
La elección de una función logística se justifica por la forma general de distribución de KD,app, que se "estancó" ligeramente en KD,app fuerte. Este efecto no es causado por artefactos experimentales (Fig. 3 complementaria), sino por una forma de epistasis de "rendimientos decrecientes"43. En la práctica, los parámetros se infieren ajustando sucesivamente los parámetros de la función aditiva βi y no lineal. Aunque la transformación global de la epistasis mejora el ajuste, los coeficientes aditivos observados en orden bajo no cambian significativamente (Fig. 7 complementaria).
Utilizamos la estructura de referencia de una estructura crio-EM de 2,79 Å de Omicron BA.1 complejada con ACE2 (PDB ID: 7WPB). En la Fig. 2c, el área de superficie de contacto se determina utilizando ChimeraX44 para medir el área de superficie enterrada entre ACE2 y cada residuo mutado en el RBD (medir función de área enterrada, radio de sonda predeterminado de 1,4 Å). En la Fig. 2E, la distancia entre los carbonos α se mide utilizando PyMol45.
La afinidad de unión de ACE2 afecta la aptitud de las variantes de SARS-CoV-2 y, por lo tanto, puede aprovecharse para inferir parcialmente su trayectoria pasada. Esta información es particularmente importante para Omicron BA.1, donde la información filogenética es limitada. Debido a que nuestro conjunto de datos contiene la afinidad ACE2 de todos los posibles intermedios evolutivos, podemos inferir las probabilidades de todas las vías entre la secuencia ancestral Wuhan Hu-1 y Omicron BA.1. Para ello tenemos que elegir un modelo de selección. Se desconocen las circunstancias en las que evolucionó la variante Omicron, y la aptitud evolutiva del virus es más compleja que su capacidad para unirse a ACE2: la presión inmunitaria, la estabilidad estructural y el nivel de expresión también juegan un papel, entre muchos otros factores46. Además, las retromutaciones son comunes en la evolución viral y la presión de selección puede cambiar dependiendo de si la cepa cambia rápidamente de huésped o es parte de una infección a largo plazo. Aquí, hemos optado por adoptar un régimen de evolución viral extremadamente simple de mutación débil/selección fuerte.
En ese modelo, la selección procede como un proceso de Markov, donde la población se caracteriza por una sola secuencia que adquiere una sola mutación en cada paso discreto31,47. Suponemos que las retromutaciones (es decir, un residuo que cambia del aminoácido Wuhan Hu-1 al aminoácido BA.1) no son posibles. Una vez que se genera dicha secuencia, se fijará en la población completa o se extinguirá. El parámetro importante es entonces la probabilidad de fijación, que depende de la afinidad de unión de las secuencias original y mutada. Elegimos usar la probabilidad de fijación clásica de uso común48, para una mutación con coeficiente de selección σ en una población de tamaño N:
Aquí, el coeficiente de selección es proporcional a la diferencia en las afinidades de unión de registros entre las dos secuencias. Usamos este modelo en el límite de "selección fuerte" (N → ∞ y σ → ∞), donde una mutación determina si es ventajosa o si es la opción menos dañina entre todas las mutaciones sobrantes. Los modelos de selección más débiles, con valores más bajos de σ y N, brindan resultados cualitativamente similares siempre que la presión de selección sea lo suficientemente alta (consulte la Fig. 11b complementaria; para presiones de selección lo suficientemente pequeñas, el orden se vuelve aleatorio como se esperaba). Para implementar este modelo, utilizamos un enfoque de matriz de transición que nos permite calcular rápidamente la probabilidad de que cada residuo aparezca en una posición específica. Para verificar que el orden de mutaciones específicas es estadísticamente significativo, utilizamos un método de arranque y muestras de valores de afinidad de distribuciones normales con media y desviación estándar dadas por nuestras mediciones experimentales. Luego tomamos muestras de mutaciones de acuerdo con el modelo descrito anteriormente y usamos métodos estándar para determinar la importancia.
El paisaje de afinidad de enlace de alta dimensión se puede proyectar en dos dimensiones con un enfoque de diseño gráfico dirigido por fuerza (ver https://desai-lab.github.io/wuhan_to_omicron/). Cada secuencia en la biblioteca de anticuerpos es un nodo, conectado por bordes a sus vecinos de mutación única. A un borde entre dos secuencias s y t se le da el peso:
En una representación dirigida por fuerza, los nodos se repelen entre sí, mientras que los bordes juntan los nodos a los que están unidos. En nuestro escenario, esto significa que los nodos con un genotipo similar (algunas mutaciones aparte) y un fenotipo similar (afinidad de unión) estarán cerca uno del otro en dos dimensiones.
Es importante destacar que esta no es una representación de "paisaje": la distancia entre dos puntos no está relacionada con lo fácil que es llegar a un genotipo de otro en un modelo de selección particular. Prácticamente, después de asignar todos los pesos de los bordes, usamos la función de diseño layout_drl del paquete iGraph de Python, con la configuración predeterminada, para obtener las coordenadas de diseño para cada variante.
Para analizar la filogenia del SARS-CoV-2 (Fig. 4a, b), utilizamos todas las secuencias RBD completas de todos los genomas del SARS-CoV-2 depositados en el repositorio de la Iniciativa Global para Compartir Todos los Datos de la Influenza (GISAID)49,50,51 con el Filogenia global GISAID Audacity (EPI_SET ID: EPI_SET_20220615uq, disponible en GISAID hasta el 15 de junio de 2022 y accesible en https://doi.org/10.55876/gis8.220615uq). Podamos el árbol para eliminar todas las secuencias con RBD que no coincidían con ninguno de los posibles intermedios entre Wuhan Hu-1 y Omicron BA.1 y analizamos este árbol utilizando el kit de herramientas ete352 de Python. Medimos la frecuencia de cada mutación (Fig. 4a) contando cuántas veces ocurre de forma independiente en el árbol (es decir, con qué frecuencia aparece la mutación en un nodo cuyo nodo principal no tiene esa mutación). Para la Fig. 4b, contamos dos mutaciones como coexistentes si ambas mutaciones están ausentes en el nodo principal y están contenidas en al menos uno de los nodos descendientes. Por lo tanto, estamos limitando nuestro alcance a las mutaciones que aparecen en la misma rama en lugar de considerar las mutaciones en todos los descendientes. Esto nos permite reducir el efecto del ruido y la contingencia. Por ejemplo, una mutación neutral que llega temprano a un linaje tendrá muchos descendientes, lo que podría sesgar su influencia. Esta estrategia de estudiar la frecuencia relativa de mutaciones coaparecidas es un caso específico del método desarrollado en Kryazhimskiy et al47, que infiere epistasis entre mutaciones a partir de datos filogenéticos (el método general no era aplicable en este conjunto de datos específico debido a su tamaño).
Todo el procesamiento de datos y los análisis estadísticos se realizaron con R v4.1.053 y Python 3.10.054. Todas las figuras se generaron usando ggplot255 y matplotlib56.
Más información sobre el diseño de la investigación está disponible en el Resumen de informes de Nature Portfolio vinculado a este artículo.
Las lecturas de secuenciación sin procesar generadas en este estudio se han depositado en la base de datos NCBI BioProject con el número de acceso PRJNA849979. El repositorio de github39 https://github.com/desai-lab/compensatory_epistasis_omicron/ contiene todos los metadatos asociados ('Titeseq/metadata') y los archivos fcs de citometría de flujo ('Titeseq/facs_data'). También utilizamos un conjunto de datos de terceros disponible públicamente de GISAID, accesible en https://doi.org/10.55876/gis8.220615uq.
El repositorio de Github39 https://github.com/desai-lab/compensatory_epistasis_omicron/Titeseq/ contiene todos los códigos de análisis asociados.
Viana, R. et al. Rápida expansión epidémica de la variante SARS-CoV-2 Omicron en el sur de África. Naturaleza 603, 679–686 (2022).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Dejnirattisai, W. et al. SARS-CoV-2 Omicron-B.1.1.529 conduce a un escape generalizado de las respuestas de anticuerpos neutralizantes. Celda 185, 467–484.e15 (2022).
Artículo CAS PubMed PubMed Central Google Scholar
Cameroni, E. et al. Los anticuerpos ampliamente neutralizantes superan el cambio antigénico de SARS-CoV-2 Omicron. Naturaleza 602, 664–670 (2022).
Artículo ADS CAS PubMed Google Scholar
Cao, Y. et al. Omicron escapa a la mayoría de los anticuerpos neutralizantes contra el SARS-CoV-2 existentes. Naturaleza 602, 657–663 (2022).
Artículo ADS CAS PubMed Google Scholar
Liu, L. et al. Sorprendente evasión de anticuerpos manifestada por la variante Omicron del SARS-CoV-2. Naturaleza 602, 676–681 (2022).
Artículo ADS CAS PubMed Google Scholar
Planas, D. et al. Escape considerable de SARS-CoV-2 Omicron a la neutralización de anticuerpos. Naturaleza 602, 671–675 (2022).
Artículo ADS CAS PubMed Google Scholar
Mannar, D. et al. SARS-CoV-2 Variante Omicron: evasión de anticuerpos y estructura crio-EM del complejo ACE2-proteína espiga. Ciencia 375, 760–764 (2022).
Artículo ADS CAS PubMed Google Scholar
Starr, TN et al. Restricciones mutacionales cambiantes en el dominio de unión al receptor SARS-CoV-2 durante la evolución viral. bioRxiv https://doi.org/10.1101/2022.02.24.481899 (2022).
Starr, TN et al. El escaneo mutacional profundo del dominio de unión al receptor SARS-CoV-2 revela restricciones en el plegamiento y la unión de ACE2. Celda 182, 1295–1310.e20 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Wu, L. et al. SARS-CoV-2 Omicron RBD muestra una afinidad de unión más débil que la variante Delta actualmente dominante a ACE2 humana. Sig. Transducto. Meta 7, 8 (2022).
Artículo CAS Google Académico
Han, P. et al. Unión del receptor y estructuras complejas de ACE2 humano para aumentar RBD de omicron y delta SARS-CoV-2. Celda 185, 630–640.e10 (2022).
Artículo CAS PubMed PubMed Central Google Scholar
Greaney, AJ et al. Mapeo integral de mutaciones en el dominio de unión al receptor SARS-CoV-2 que afectan el reconocimiento por parte de anticuerpos policlonales de plasma humano. Microbio huésped celular 29, 463–476.e6 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Adams, RM, Mora, T., Walczak, AM y Kinney, JB Medición del panorama de afinidad de secuencia de anticuerpos con curvas de titulación masivamente paralelas. Elife 5, (2016).
Phillips, AM et al. Los paisajes de afinidad de unión restringen la evolución de anticuerpos antigripales ampliamente neutralizantes. Elife 10, (2021).
Adams, RM, Kinney, JB, Walczak, AM & Mora, T. Epistasis en un paisaje de fitness definido por la energía libre de unión de anticuerpos y antígenos. Sistema celular 8, 86–93.e3 (2019).
Artículo CAS PubMed PubMed Central Google Scholar
McCallum, M. et al. Base estructural de la evasión inmune de SARS-CoV-2 Omicron y el compromiso del receptor. Ciencia 375, 864–868 (2022).
Artículo ADS CAS PubMed Google Scholar
Greaney, AJ et al. Mapeo de mutaciones al SARS-CoV-2 RBD que escapan a la unión de diferentes clases de anticuerpos. Nat. común 12, 4196 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Greaney, AJ, Starr, TN y Bloom, JD Una calculadora de escape de anticuerpos para mutaciones en el dominio de unión al receptor SARS-CoV-2. bioRxiv https://doi.org/10.1101/2021.12.04.471236 (2021).
Sailer, ZR & Harms, MJ La epistasis de alto orden da forma a las trayectorias evolutivas. Cómputo PLoS. Biol. 13, e1005541 (2017).
Artículo ADS PubMed PubMed Central Google Scholar
Wells, JA Aditividad de efectos mutacionales en proteínas. Bioquímica 29, 8509–8517 (1990).
Artículo CAS PubMed Google Académico
Olson, CA, Wu, NC y Sun, R. Una descripción biofísica completa de la epistasis por pares en todo un dominio de proteína. actual Biol. 24, 2643–2651 (2014).
Artículo CAS PubMed PubMed Central Google Scholar
Otwinowski, J., McCandlish, DM & Plotkin, JB Inferir la forma de la epistasis global. proc. Academia Nacional. ciencia EE. UU. 115, E7550–E7558 (2018).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Starr, TN & Thornton, JW Epistasis en la evolución de proteínas. Ciencia de las proteínas 25, 1204–1218 (2016).
Artículo CAS PubMed PubMed Central Google Scholar
Zahradnik, J. et al. La evolución in vitro de RBD habilita la predicción de variantes de SARS-CoV-2 y el diseño de fármacos antivirales. Nat. Microbiol. 6, 1188–1198 (2021).
Artículo PubMed Google Académico
Laffeber, C., de Koning, K., Kanaar, R. y Lebbink, JHG Pruebas experimentales de unión mejorada al receptor mediante la rápida propagación de variantes del SARS-CoV-2. J. Mol. Biol. 433, 167058 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Rochman, ND et al. Epistasis en la interfaz del dominio de unión al receptor SARS-CoV-2 y las implicaciones favorablemente aburridas para el escape de la vacuna. MBio 13, e0013522 (2022).
Artículo PubMed Google Académico
Javanmardi, K. et al. Escape de anticuerpos y estabilización críptica de dominios cruzados en la proteína de punta Omicron SARS-CoV-2. bioRxiv https://doi.org/10.1101/2022.04.18.488614 (2022).
Rochman, ND et al. Evolución adaptativa mundial y regional en curso del SARS-CoV-2. proc. nacional Academia ciencia Estados Unidos 118, (2021).
Lythgoe, KA et al. SARS-CoV-2 diversidad y transmisión dentro del huésped. Ciencia 372, eabg0821 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Kemp, SA et al. Evolución del SARS-CoV-2 durante el tratamiento de la infección crónica. Naturaleza 592, 277–282 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Choi, B. et al. Persistencia y evolución del SARS-CoV-2 en un huésped inmunocomprometido. N. ingl. J.Med. 383, 2291–2293 (2020).
Artículo PubMed Google Académico
Hale, VL et al. Infección por SARS-CoV-2 en ciervos de cola blanca en libertad. Naturaleza 602, 481–486 (2022).
Artículo ADS CAS PubMed Google Scholar
Bate, N. et al. La evolución in vitro predice mutaciones emergentes de CoV-2 con alta afinidad por ACE2 y unión entre especies. bioRxiv https://doi.org/10.1101/2021.12.23.473975 (2021).
Gobeil, SM-C. et al. Diversidad estructural del pico SARS-CoV-2 Omicron. mol. Celda 82, 2050–2068.e6 (2022).
Artículo CAS PubMed PubMed Central Google Scholar
Wentz, AE & Shusta, EV Una nueva pantalla de alto rendimiento revela genes de levadura que aumentan la secreción de proteínas heterólogas. aplicación Reinar. Microbiol. 73, 1189–1198 (2007).
Artículo ADS CAS PubMed Google Scholar
Gietz, RD & Schiestl, RH Transformación de levadura rápida y fácil utilizando el método de ADN/PEG portador de LiAc/SS. Nat. Protocolo 2, 35–37 (2007).
Artículo CAS PubMed Google Académico
Boder, ET & Wittrup, KD Pantalla de superficie de levadura para la detección de bibliotecas polipeptídicas combinatorias. Nat. Biotecnología. 15, 553–557 (1997).
Artículo CAS PubMed Google Académico
Nguyen Ba, AN et al. El seguimiento de linaje de alta resolución revela una onda viajera de adaptación en la levadura de laboratorio. Naturaleza 575, 494–499 (2019).
Artículo ADS CAS PubMed Google Scholar
Maulana, A. et al. desai-lab/compensatory_epistasis_omicron. (Zenodo, 2022). https://doi.org/10.5281/ZENODO.7235104.
Barnett, M. Regex. Preimpresión en (2013).
Starr, TN et al. Mapeo prospectivo de mutaciones virales que escapan a los anticuerpos utilizados para tratar COVID-19. Ciencia 371, 850–854 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Poelwijk, FJ, Krishna, V. & Ranganathan, R. La dependencia del contexto de las mutaciones: un vínculo de formalismos. Cómputo PLoS. Biol. 12, e1004771 (2016).
Artículo ADS PubMed PubMed Central Google Scholar
Sailer, ZR & Harms, MJ Detección de epistasis de alto orden en mapas no lineales de genotipo-fenotipo. Genética 205, 1079–1088 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Pettersen, EF et al. UCSF ChimeraX: visualización de estructuras para investigadores, educadores y desarrolladores. Ciencia de las proteínas 30, 70–82 (2021).
Artículo CAS PubMed Google Académico
Schrodinger, LLC El sistema de gráficos moleculares PyMOL. (2015).
Upadhyay, V., Patrick, C., Lucas, A. & Mallela, KMG La evolución convergente de múltiples mutaciones mejora la aptitud viral de las variantes del SARS-CoV-2 al equilibrar la selección positiva y negativa. Bioquímica 61, 963–980 (2022).
Artículo CAS PubMed Google Académico
Kryazhimskiy, S., Dushoff, J., Bazykin, GA & Plotkin, JB Prevalencia de epistasis en la evolución de las proteínas de superficie de influenza A. PLoS Genet. 7, e1001301 (2011).
Artículo CAS PubMed PubMed Central Google Scholar
Kimura, M. Sobre la probabilidad de fijación de genes mutantes en una población. Genética 47, 713–719 (1962).
Artículo CAS PubMed PubMed Central Google Scholar
Khare, S. et al. El papel de GISAID en la respuesta a la pandemia. China CDC Wkly 3, 1049–1051 (2021).
Artículo PubMed PubMed Central Google Académico
Elbe, S. & Buckland-Merrett, G. Datos, enfermedad y diplomacia: la contribución innovadora de GISAID a la salud mundial. globo Desafío. 1, 33–46 (2017).
Artículo PubMed PubMed Central Google Académico
Shu, Y. & McCauley, J. GISAID: Iniciativa global para compartir todos los datos sobre la influenza, desde la visión hasta la realidad. Eurovigilancia. 22, (2017).
Huerta-Cepas, J., Serra, F. & Bork, P. ETE 3: Reconstrucción, análisis y visualización de datos filogenómicos. mol. Biol. Evol. 33, 1635-1638 (2016).
Artículo CAS PubMed PubMed Central Google Scholar
Equipo central R. R: Un lenguaje y entorno para la computación estadística. (2017).
Van Rossum, G. y Drake, FL Manual de referencia de Python 3. (Crear Espacio, 2009).
Wickham, H. Ggplot2. (Springer International Publishing, 2016).
Hunter, JD Matplotlib: Un entorno de gráficos 2D. computar ciencia Ing. 9, 90–95 (2007).
Artículo Google Académico
Descargar referencias
Agradecemos a Zach Niziolek por su asistencia con la citometría de flujo y a los miembros del laboratorio de Desai por sus útiles debates. TD reconoce el apoyo de la Beca Postdoctoral del Programa de Ciencias Human Frontier, AMP reconoce el apoyo de la Beca Postdoctoral Hanna H. Gray del Instituto Médico Howard Hughes, JC reconoce el apoyo de la Beca de Investigación de Graduados de la Fundación Nacional de Ciencias y MMD reconoce el apoyo del NSF-Simons Center para el Análisis Matemático y Estadístico de la Biología en la Universidad de Harvard, con el apoyo de la subvención NSF no. DMS-1764269 y la Iniciativa de Biología Cuantitativa FAS de Harvard, otorgan PHY-1914916 de NSF y otorgan GM104239 de NIH. JDB agradece el apoyo de NIH/NIAID subvención R01AI141707 y es investigador del Instituto Médico Howard Hughes. Agradecemos a todos los contribuyentes de datos, es decir, los autores y sus laboratorios de origen responsables de obtener las muestras, y sus laboratorios de envío para generar la secuencia genética y los metadatos y compartirlos a través de la Iniciativa GISAID. El trabajo computacional se realizó en el clúster FASRC Cannon con el apoyo del Grupo de Computación de Investigación Científica de la División FAS de la Universidad de Harvard.
Estos autores contribuyeron por igual: Alief Moulana, Thomas Dupic, Angela M. Phillips, Jeffrey Chang.
Departamento de Biología Orgánica y Evolutiva, Universidad de Harvard, Cambridge, MA, 02138, EE. UU.
Alief Maulana, Thomas Dupic, Angela M. Phillips y Michael M. Desai
Departamento de Física, Universidad de Harvard, Cambridge, MA, 02138, EE. UU.
Jeffrey Chang y Michael M. Desai
Departamento de Biología Molecular y Celular, Universidad de Harvard, Cambridge, MA, 02138, EE. UU.
Serafina Nieves
Ciencias Biológicas y Biomédicas, Harvard Medical School, Boston, MA, 02115, EE. UU.
Anne A. Roffler
División de Ciencias Básicas y Programa de Biología Computacional, Centro de Investigación del Cáncer Fred Hutchinson, Seattle, WA, 98109, EE. UU.
Allison J. Greaney, Tyler N. Starr y Jesse D. Bloom
Departamento de Ciencias del Genoma, Universidad de Washington, Seattle, WA, 98195, EE. UU.
Allison J. Greaney y Jesse D. Bloom
Programa de formación de científicos médicos, Universidad de Washington, Seattle, WA, 98195, EE. UU.
Allison J. Greaney
Instituto Médico Howard Hughes, Seattle, WA, 98109, EE. UU.
jesse d flor
NSF-Simons Center for Mathematical and Statistical Analysis of Biology, Universidad de Harvard, Cambridge, MA, 02138, EE. UU.
Michael M. Desai
Iniciativa de Biología Cuantitativa, Universidad de Harvard, Cambridge, MA, 02138, EE. UU.
Michael M. Desai
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
Conceptualización: AM, TD, AMP, JC, TNS, AJG, JDB y MMD Metodología: AM, TD, AMP, JC, SN, TNS y AJG Diseño y producción de bibliotecas: AM, TD, AMP, JC y AJG Experimentos : AM, TD, AMP, JC y AAR Validación: AM, TD, AMP, JC, SN y TNS Análisis de datos: AM, TD, AMP, JC, SN y TNS Supervisión: AMP, JDB y MMD Adquisición de fondos : JDB y MMD Redacción: borrador original: AM, TD, AMP, JC y MMD Todos los autores revisaron y editaron el manuscrito.
Correspondencia a Angela M. Phillips o Michael M. Desai.
AMP y MMD han consultado o han consultado recientemente para Leyden Labs. JDB ha sido o ha sido consultor recientemente para Apriori Bio, Oncorus, Moderna y Merck. JDB, AJG y TNS son inventores de las patentes con licencia de Fred Hutch relacionadas con la exploración de mutaciones profundas virales. Los demás autores declaran no tener intereses contrapuestos.
Nature Communications agradece a Joachim Krug y a los otros revisores anónimos por su contribución a la revisión por pares de este trabajo.
Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Moulana, A., Dupic, T., Phillips, AM et al. La epistasis compensatoria mantiene la afinidad de ACE2 en SARS-CoV-2 Omicron BA.1. Nat Comun 13, 7011 (2022). https://doi.org/10.1038/s41467-022-34506-z
Descargar cita
Recibido: 08 Septiembre 2022
Aceptado: 26 de octubre de 2022
Publicado: 16 noviembre 2022
DOI: https://doi.org/10.1038/s41467-022-34506-z
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.
Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt
Biología BMC (2023)
Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.