Aug 06, 2023
Diseño de novo de luciferasas usando aprendizaje profundo
Naturaleza volumen 614, páginas
Nature, volumen 614, páginas 774–780 (2023)Citar este artículo
68k Accesos
4 citas
495 Altmetric
Detalles de métricas
El diseño de enzimas de novo ha buscado introducir sitios activos y bolsillos de unión al sustrato que se predice que catalizarán una reacción de interés en andamios nativos geométricamente compatibles1,2, pero ha estado limitado por la falta de estructuras proteicas adecuadas y la complejidad de la secuencia de la proteína nativa. –relaciones de estructura. Aquí describimos un enfoque de 'alucinación de toda la familia' basado en el aprendizaje profundo que genera un gran número de estructuras de proteínas idealizadas que contienen diversas formas de bolsillo y secuencias diseñadas que las codifican. Utilizamos estos andamios para diseñar luciferasas artificiales que catalizan selectivamente la quimioluminiscencia oxidativa de los sustratos de luciferina sintética difenilterazina3 y 2-desoxicoelenterazina. Los sitios activos diseñados posicionan un grupo de arginina guanidinio adyacente a un anión que se desarrolla durante la reacción en un bolsillo de unión con alta complementariedad de forma. Para ambos sustratos de luciferina, obtenemos luciferasas diseñadas con alta selectividad; la más activa de ellas es una enzima pequeña (13,9 kDa) y termoestable (con una temperatura de fusión superior a 95 °C) que tiene una eficacia catalítica sobre la difenilterazina (kcat/Km = 106 M−1 s−1) comparable a la de luciferasas nativas, pero una especificidad de sustrato mucho mayor. La creación de biocatalizadores altamente activos y específicos desde cero con amplias aplicaciones en biomedicina es un hito clave para el diseño de enzimas computacionales, y nuestro enfoque debería permitir la generación de una amplia gama de luciferasas y otras enzimas.
La luz bioluminiscente producida por la oxidación enzimática de un sustrato de luciferina por luciferasas se usa ampliamente para bioensayos e imágenes en la investigación biomédica. Debido a que no se necesita una fuente de luz de excitación, los fotones luminiscentes se producen en la oscuridad; esto da como resultado una mayor sensibilidad que las imágenes de fluorescencia en modelos de animales vivos y en muestras biológicas en las que la autofluorescencia o la fototoxicidad son un problema4,5. Sin embargo, el desarrollo de luciferasas como sondas moleculares se ha retrasado con respecto a los kits de herramientas de proteínas fluorescentes bien desarrollados por varias razones: (i) se han identificado muy pocas luciferasas nativas6,7; (ii) muchos de los que se han identificado requieren múltiples enlaces disulfuro para estabilizar la estructura y, por lo tanto, son propensos a plegarse incorrectamente en células de mamíferos8; (iii) la mayoría de las luciferasas nativas no reconocen las luciferinas sintéticas con propiedades fotofísicas más deseables9; y (iv) las imágenes multiplexadas para seguir múltiples procesos en paralelo utilizando pares de luciferasa-luciferina mutuamente ortogonales se han visto limitadas por la baja especificidad de sustrato de las luciferasas nativas10,11.
Buscamos utilizar el diseño de proteínas de novo para crear luciferasas que sean pequeñas, altamente estables, bien expresadas en las células, específicas para un sustrato y que no necesiten cofactores para funcionar. Elegimos una luciferina sintética, la difenilterazina (DTZ), como sustrato objetivo debido a su alto rendimiento cuántico, emisión desplazada hacia el rojo3, farmacocinética in vivo favorable12,13 y falta de cofactores necesarios para la emisión de luz. Esfuerzos previos de diseño de enzimas computacionales han reutilizado principalmente andamios de proteínas nativas en el Banco de datos de proteínas (PDB)1,2, pero hay pocas estructuras nativas con bolsillos de unión apropiados para DTZ, y los efectos de los cambios de secuencia en las proteínas nativas pueden ser impredecibles (diseñados). Los haces helicoidales también se han utilizado como estructuras enzimáticas14,15,16, pero su número es limitado y la mayoría no tiene cavidades adecuadas para la unión de DTZ). Para eludir estas limitaciones, nos propusimos generar una gran cantidad de andamios de proteínas pequeños y estables con bolsillos del tamaño y la forma apropiados para DTZ, y con relaciones claras de secuencia y estructura para facilitar la posterior incorporación del sitio activo. Para identificar los pliegues de proteínas que son capaces de albergar tales bolsillos, primero acoplamos DTZ en 4000 proteínas nativas de unión a moléculas pequeñas. Descubrimos que muchos pliegues similares al factor de transporte nuclear 2 (NTF2) tienen bolsillos de unión con complementariedad de forma y tamaño apropiados para la ubicación de DTZ (guiones rosas en la Fig. 1e) y, por lo tanto, seleccionamos la superfamilia similar a NTF2 como la topología objetivo.
a, Alucinación en toda la familia. Las secuencias que codifican proteínas con la topología deseada se optimizan mediante el muestreo de cadena de Markov Monte Carlo (MCMC) con una función de pérdida multicomponente. Las regiones conservadas estructuralmente (melocotón) se evalúan sobre la base de la consistencia con las distribuciones de distancia y orientación residuos-residuos de entrada obtenidas de 85 estructuras experimentales de proteínas similares a NTF2, mientras que las regiones no ideales variables (verde azulado) se evalúan sobre la base de la confianza de geometrías predichas entre residuos calculadas como la divergencia KL entre las predicciones de la red y la distribución de fondo. El muestreo MCMC de espacio de secuencia incorpora cambios de secuencia e inserciones y eliminaciones (consulte Métodos complementarios) para guiar la secuencia alucinada hacia estructuras de codificación con los pliegues deseados. Las redes de puentes de hidrógeno se incorporan a las estructuras diseñadas para aumentar la especificidad estructural. b–d, El diseño de los sitios activos de luciferasa. b, Generación de confórmeros de sustrato de luciferasa (DTZ). c, Generación de un campo de interacción rotámero (RIF) para estabilizar DTZ aniónico y formar interacciones de empaquetamiento hidrofóbico. d, acoplamiento del RIF en los andamios alucinados y optimización de las interacciones sustrato-andamio utilizando el diseño de secuencia sesgada de matrices de puntuación específicas de posición (PSSM). e, Selección de la topología NTF2. El RIF se acopló a 4000 proteínas nativas de unión a moléculas pequeñas, excluyendo las proteínas que se unen al sustrato de luciferina utilizando más de cinco residuos de bucle. La mayoría de los principales éxitos fueron de la superfamilia de proteínas similares a NTF2 (guiones rosas). Usando el protocolo de generación de andamios de alucinaciones de toda la familia, generamos 1.615 andamios y descubrimos que estos producían mejores energías de unión RIF predichas que las proteínas nativas. f,g, Nuestros andamios optimizados para DL muestrean más dentro del espacio de las estructuras nativas (f) y tienen relaciones de secuencia a estructura más sólidas (predicciones de estructura Alphafold2 más seguras) (g) que la energía de aprendizaje no profundo nativa o anterior -Andamios optimizados.
Las estructuras NTF2 nativas tienen una variedad de formas y tamaños de bolsillo, pero también contienen características que no son ideales, como bucles largos que comprometen la estabilidad. Para crear un gran número de estructuras ideales similares a NTF2, desarrollamos un enfoque de "alucinación de toda la familia" basado en el aprendizaje profundo que integra el diseño de novo sin restricciones17,18 y los enfoques de diseño de secuencias de Rosetta19 para permitir la generación de un número esencialmente ilimitado de proteínas que tienen un pliegue deseado (Fig. 1a). El enfoque de alucinaciones en toda la familia utilizó la capacidad de descubrimiento de secuencias y estructuras de novo de la alucinación de proteínas sin restricciones17,18 para las regiones variables y de bucle, y la optimización de secuencias guiada por estructuras para las regiones centrales. Utilizamos la red neuronal de predicción de estructura trRosetta20, que es eficaz para identificar proteínas diseñadas de novo con éxito experimental y alucinar nuevas proteínas globulares de diversas topologías. Partiendo de las secuencias de 2000 NTF2 naturales, llevamos a cabo búsquedas de Monte Carlo en el espacio de secuencias, en cada paso haciendo un cambio de secuencia y prediciendo la estructura utilizando trRosetta. Como función de pérdida que guía la búsqueda, utilizamos la confianza de la red neuronal en la estructura predicha (como en nuestro estudio anterior de alucinaciones libres) complementada con una función de pérdida específica de topología sobre geometrías de pares de residuos centrales (ver Métodos complementarios); en las regiones de bucle, también permitimos que variara el número de residuos, lo que resultó en bucles cortos casi ideales. Para codificar aún más la especificidad estructural, incorporamos redes de enlaces de hidrógeno de largo alcance enterradas. Los 1.615 andamios de NTF2 alucinados de toda la familia resultantes proporcionaron más bolsillos de unión complementarios a la forma para DTZ que las proteínas nativas de unión a moléculas pequeñas (Fig. 1e). Este método toma muestras de estructuras proteicas que están más cerca de las proteínas similares a NTF2 nativas (Fig. 1f) y que tienen mejores métricas de calidad de andamiaje que las producidas en un enfoque anterior basado en energía sin aprendizaje profundo21 (Fig. 1g).
El diseño de enzimas computacionales generalmente comienza desde un sitio activo ideal o una teozima que consiste en grupos funcionales de proteínas que rodean el estado de transición de la reacción que luego se combina con un conjunto de andamios existentes1,2. Sin embargo, la geometría catalítica detallada de las luciferasas marinas nativas no se comprende bien porque solo se han resuelto un puñado de estructuras apo y ninguna estructura holográfica con sustratos de luciferina (en el momento de este estudio)22,23,24. Tanto los cálculos de química cuántica25,26 como los datos experimentales27,28 sugieren que la reacción quimioluminiscente procede a través de una especie aniónica y que la polaridad del entorno puede alterar sustancialmente la energía libre del proceso posterior de transferencia de un solo electrón (SET) con oxígeno molecular triplete ( 3O2). Guiados por estos datos (Datos extendidos Fig. 1), buscamos diseñar un sitio catalítico de forma complementaria que estabilice el estado aniónico de DTZ y reduzca la barrera de energía SET, asumiendo que los pasos de termólisis del emisor de luz de dioxetano aguas abajo son espontáneos. Para estabilizar el estado aniónico, nos enfocamos en la ubicación del grupo guanidinio cargado positivamente de un residuo de arginina para estabilizar la carga negativa en desarrollo en el grupo imidazopirazinona.
Para diseñar computacionalmente dichos sitios activos en un gran número de andamios NTF2 alucinados, primero generamos un conjunto de confórmeros DTZ aniónicos (Fig. 1b). Luego, alrededor de cada confórmero, usamos el método RifGen29,30 para enumerar los campos de interacción de rotámeros (RIF) en cuadrículas tridimensionales que consisten en millones de ubicaciones de cadenas laterales de aminoácidos que forman enlaces de hidrógeno e interacciones no polares con DTZ (Fig. 1c) . Se colocó un grupo arginina guanidinio adyacente al átomo N1 del grupo imidazopirazinona para estabilizar la carga negativa. Luego se usó RifDock para acoplar cada confórmero DTZ y RIF asociado en la cavidad central de cada andamio para maximizar las interacciones proteína-DTZ. Se colocó un promedio de ocho rotámeros de cadena lateral, incluido un residuo de arginina para estabilizar el núcleo de imidazopirazinona aniónica, en cada bolsillo (Fig. 2a complementaria). Para los 50 000 muelles principales con las interacciones DTZ-cadena lateral más favorables, optimizamos el resto de la secuencia usando RosettaDesign (Fig. 1d) para la unión de alta afinidad a DTZ con un sesgo hacia la variación de secuencia observada naturalmente para garantizar la plegabilidad. Durante el proceso de diseño, las redes de enlaces de hidrógeno predefinidas (HBNet) en los andamios se mantuvieron intactas para la estabilidad y la especificidad estructural, y las interacciones de estas cadenas laterales de HBNet con DTZ se requirieron explícitamente en el paso RifDock para garantizar la organización previa de los residuos que son esenciales para la catálisis. En el primer paso del diseño de la secuencia, las identidades de todos los residuos de RIF y HBNet se mantuvieron fijas, y los residuos circundantes se optimizaron para mantener las interacciones de cadena lateral-DTZ en su lugar y mantener la especificidad estructural. En el segundo paso del diseño de la secuencia, también se permitió que variaran las identidades de los residuos del RIF (excepto la arginina), ya que Rosetta puede identificar interacciones de empaquetamiento apolares y aromáticas que se perdieron en el RIF debido a los efectos de agrupación. Durante el diseño de la secuencia, se permitió que la columna vertebral del andamio, las cadenas laterales y el sustrato DTZ se relajaran en el espacio cartesiano. Después de la optimización de la secuencia, los diseños se filtraron en función de la energía de unión del ligando, los enlaces de hidrógeno proteína-ligando, la complementariedad de la forma y la superficie molecular de contacto, y se seleccionaron y ordenaron 7648 diseños como oligos agrupados para el cribado experimental.
Los oligonucleótidos que codifican las dos mitades de cada diseño se ensamblaron en genes completos y se clonaron en un vector de expresión de Escherichia coli (consulte Métodos complementarios). Se utilizó un método de cribado basado en colonias para obtener imágenes directamente de las colonias de luciferasa activas de la biblioteca y las actividades de los clones seleccionados se confirmaron mediante una placa de expresión de 96 pocillos (Datos ampliados, Fig. 2). Se identificaron tres diseños activos; nos referimos al más activo de estos como LuxSit (del latín lux sit, 'dejar que la luz exista'), que con 117 residuos (13,9 kDa) es, hasta donde sabemos, más pequeño que cualquier luciferasa descrita anteriormente. El análisis bioquímico, que incluye SDS-PAGE y cromatografía de exclusión por tamaño (Fig. 2a, b y Datos extendidos Fig. 3), indicó que LuxSit se expresa altamente en E. coli, soluble y monomérica. La espectroscopia de dicroísmo circular (CD) mostró una fuerte firma de CD en el ultravioleta lejano, lo que sugiere una estructura α-β organizada. Los experimentos de fusión de CD mostraron que la proteína no se despliega completamente a 95 ° C y que la estructura completa se recupera cuando baja la temperatura (Fig. 2c). La incubación de LuxSit con DTZ resultó en luminiscencia con un pico de emisión de alrededor de 480 nm (Fig. 2d), consistente con el espectro de quimioluminiscencia de DTZ. Aunque no pudimos determinar la estructura cristalina de LuxSit, la estructura predicha por AlphaFold2 (ref. 31) está muy cerca del modelo de diseño en el nivel de la columna vertebral (desviación cuadrática media (RMSD) = 1,35 Å) y más las cadenas laterales interactuando con el sustrato (Fig. 2e). El sitio activo LuxSit diseñado contiene díadas Tyr14-His98 y Asp18-Arg65, con los átomos de nitrógeno de imidazol de His98 haciendo interacciones de enlaces de hidrógeno con Tyr14 y el átomo O1 de DTZ (Fig. 2f). El centro del catión guanidinio Arg65 está a 4,2 Å del átomo N1 de DTZ y Asp18 forma un enlace de hidrógeno bidentado con el grupo guanidinio y la columna vertebral N-H de Arg65 (Fig. 2g).
a, SDS-PAGE teñida con Coomassie de LuxSit recombinante purificado de E. coli (para obtener datos de fuente de gel, consulte la Fig. 1 complementaria). b, La cromatografía de exclusión por tamaño de LuxSit purificado sugiere propiedades monodispersas y monoméricas. c, Espectros de CD ultravioleta lejano a 25 °C (negro), 95 °C (rojo) y enfriados nuevamente a 25 °C (verde). Insertar, curva de fusión CD de LuxSit a 220 nm. MRE, elipticidad del residuo molar. d, Espectros de emisión de luminiscencia de DTZ en presencia (azul) y ausencia (verde) de LuxSit. e, Alineación estructural del modelo de diseño (azul) y el modelo pronosticado por AlphaFold2 (gris), que están muy de acuerdo tanto en el nivel de la columna vertebral (izquierda) como en el de la cadena lateral (derecha). f – i, Mutagénesis de saturación del sitio de residuos que interactúan con el sustrato. Vistas ampliadas (izquierda) de modelos diseñados (azul) y AlphaFold2 (gris) a nivel de cadena lateral, que ilustran las interacciones enzima-sustrato diseñadas de Tyr14–His98 core HBNet (f), díada Asp18–Arg65 (g), π- residuos de apilamiento (h) y de empaque hidrofóbico (i). Los perfiles de secuencia (derecha) están escalados por las actividades de diferentes variantes de secuencia: (actividad para el aminoácido indicado)/(suma de actividades sobre todos los aminoácidos probados en la posición indicada). Las sustituciones A96M y M110V con mayor actividad se resaltan en rosa.
Datos fuente
A continuación, buscamos aplicar el conocimiento obtenido del diseño de LuxSit para crear luciferasas específicas de 2-desoxicoelenterazina (h-CTZ). Debido a que la forma molecular de h-CTZ es diferente de la de DTZ, creamos un conjunto adicional de andamios de superfamilia NTF2 (ver Métodos complementarios) con formas de bolsillo coincidentes y alta confianza en el modelo (Prueba de diferencia de distancia local prevista por AlphaFold2 (pLDDT)> 92). Luego, instalamos sitios catalíticos en estos andamios y diseñamos las primeras interacciones de cadena lateral de proteína de cubierta-h-CTZ utilizando las geometrías de interacción de sustrato de histidina y arginina que fueron más exitosas en la primera ronda para DTZ. Para diseñar el resto de la secuencia, usamos ProteinMPNN32, que puede resultar en una mejor estabilidad, solubilidad y precisión que RosettaDesign. Después de filtrar sobre la base del pLDDT predicho por AlphaFold2, Cα RMSD, la superficie molecular de contacto y las energías de unión calculadas por Rosetta (ver Métodos complementarios), seleccionamos y expresamos experimentalmente 46 diseños en E. coli e identificamos 2 (HTZ3-D2 y HTZ3 -G4) que tenía actividad de luciferasa con el sustrato de luciferina h-CTZ. Ambos diseños eran altamente solubles, monodispersos y monoméricos, y las actividades de luciferasa eran del mismo orden de magnitud que LuxSit (Datos extendidos Fig. 4). La tasa de éxito aumentó de 3/7648 a 2/46 secuencias en la segunda ronda, probablemente debido al conocimiento de la geometría del sitio activo de la primera ronda y la mayor robustez del método de diseño de secuencias ProteinMPNN.
Para comprender mejor las contribuciones a la catálisis de LuxSit, el más activo de nuestros diseños, construimos una biblioteca de mutagénesis de saturación de sitio (SSM) en la que cada residuo en el bolsillo de unión al sustrato se mutó a cada otro aminoácido uno a la vez. (ver Métodos complementarios), y determinó el efecto de cada mutación en la actividad de la luciferasa. La Figura 2f–i muestra las preferencias de aminoácidos en posiciones clave. Arg65 está altamente conservado (Fig. 2g), y su compañero de díada Asp18 solo puede mutarse a Glu (lo que reduce la actividad), lo que sugiere que el enlace de hidrógeno carboxilato-Arg65 es importante para la actividad de la luciferasa. En la díada Tyr14–His98 (Fig. 2f), Tyr14 puede sustituirse por Asp y Glu, y His98 puede sustituirse por Asn. Como todas las variantes activas tenían donantes y aceptores de enlaces de hidrógeno en estas posiciones, las díadas podrían ayudar a mediar en la transferencia de electrones y protones necesaria para la luminiscencia. Los residuos hidrofóbicos (Fig. 2i) y de apilamiento π (Fig. 2h) en la interfaz de unión toleran otras sustituciones aromáticas o alifáticas y generalmente prefieren el aminoácido en el diseño original, de acuerdo con las predicciones de afinidad basadas en modelos de efectos mutacionales (Datos extendidos Figura 5). Los mutantes A96M y M110V (resaltados en rosa) aumentan la actividad 16 y 19 veces, respectivamente, sobre LuxSit (Tabla complementaria 1). La optimización guiada por estos resultados produjo LuxSit-f (A96M/M110V), con una cinética de emisión tipo flash, y LuxSit-i (R60S/A96L/M110V), con un flujo de fotones más de 100 veces mayor que el de LuxSit ( Datos extendidos Fig. 6). En general, los resultados de la mutagénesis de saturación del sitio activo respaldan el modelo de diseño, con las díadas Tyr14-His98 y Asp18-Arg65 que tienen funciones clave en la catálisis y el bolsillo de unión al sustrato se conserva en gran medida.
Los catalizadores más activos, LuxSit-i (datos extendidos Fig. 3b,e,h) y LuxSit-f (datos extendidos Fig. 3c,f,i), se expresaron solubles en E. coli en niveles altos y son monoméricos ( se observó algo de dimerización a la alta concentración de proteína (datos extendidos Fig. 3l) y termoestable (datos extendidos Fig. 3j, k). De manera similar a las luciferasas nativas que usan CTZ, las constantes de Michaelis aparentes (Km) de LuxSit-i y LuxSit-f están en el rango micromolar bajo (Fig. 3a) y la señal luminiscente decae con el tiempo debido a la rápida rotación catalítica (Extended Datos Fig. 7a). LuxSit-i es una enzima muy eficiente, con una eficiencia catalítica (kcat/Km) de 106 M−1 s−1. La señal de luminiscencia es fácilmente visible a simple vista (Fig. 3b), y el flujo de fotones (fotones por segundo) es un 38 % mayor que el de la luciferasa nativa de Renilla reniformis (RLuc) (Tabla complementaria 2). La reacción luminiscente DTZ catalizada por LuxSit-i depende del pH (datos extendidos Fig. 7b), de acuerdo con el mecanismo propuesto. Utilizamos una combinación de cálculos de la teoría funcional de la densidad (DFT) y simulaciones de dinámica molecular (MD) para investigar la base de la actividad de LuxSit con más detalle; los resultados respaldan el mecanismo de estabilización de aniones (datos extendidos Fig. 8a y suplementos Fig. 3a) y sugieren que LuxSit-i proporciona una mejor estabilización de carga de estado de transición DTZ que LuxSit (datos extendidos Fig. 8b).
a, Dependencia de la concentración de sustrato de la actividad de LuxSit, LuxSit-f y LuxSit-i. Los números indican la relación señal-fondo (S/N) en Vmax (fotón s-1 molécula-1). Los datos son la media ± sd (n = 3). b, Imágenes de luminiscencia adquiridas por un BioRad Imager (arriba) o una cámara Apple iPhone 8 (abajo). Tubos de izquierda a derecha: solo DTZ; DTZ más LuxSit purificado 100 nM; y DTZ plus 100 nM LuxSit-i purificado, que muestra la alta eficiencia de la producción de fotones. c, Imágenes microscópicas de fluorescencia y luminiscencia de células HEK293T vivas que expresan transitoriamente LuxSit-i-mTagBFP2; La actividad de LuxSit-i se puede detectar con una resolución de celda única. Izquierda, canal de fluorescencia que representa la señal mTagBFP2. A la derecha, los fotones de luminiscencia total se recolectaron durante un curso de exposición de 10 s sin luz de excitación, inmediatamente después de agregar 25 µM de DTZ. Recuadros, control negativo, células no transfectadas con DTZ. Barras de escala, 20 μm; 40 aumentos.
Datos fuente
Dado que las luciferasas son etiquetas genéticas y reporteros de uso común para estudios de biología celular, evaluamos la expresión y la función de LuxSit-i en células de mamíferos vivas. Las células HEK293T que expresan LuxSit-i-mTagBFP2 mostraron una luminiscencia específica de DTZ (Fig. 3c), que se mantuvo después de dirigir LuxSit-i-mTagBFP2 al núcleo, la membrana y las mitocondrias (Datos extendidos Fig. 9). Las luciferasas nativas y previamente diseñadas son bastante promiscuas, con actividad en muchos sustratos de luciferina (Fig. 4ac y Fig. 4 complementaria); esto es posiblemente el resultado de sus bolsillos grandes y abiertos (una luciferasa con alta especificidad para un sustrato de luciferina ha sido difícil de controlar incluso con una evolución dirigida extensa33,34). Por el contrario, LuxSit-i exhibió una especificidad exquisita para su luciferina objetivo, con una selectividad de 50 veces para DTZ sobre bis-CTZ (que difiere solo en un carbono bencílico; las simulaciones MD sugieren que esto surge de una mayor complementariedad de forma de estado de transición (Datos extendidos Fig. 8b, c y Fig. complementaria 3b, c)), selectividad de 28 veces sobre 8pyDTZ (que difiere solo en un átomo de nitrógeno) y selectividad de más de 100 veces sobre otros sustratos de luciferina (Fig. 4b). Uno de nuestros diseños activos para h-CTZ (HTZ3-G4) también fue altamente específico para su sustrato objetivo (Fig. 4c y Datos extendidos Fig. 4d). En general, la especificidad de nuestras luciferasas diseñadas es mucho mayor que la de las luciferasas nativas35,36 o las luciferasas37 diseñadas previamente (Tabla complementaria 5).
a, Estructuras químicas de análogos de sustrato de coelenterazina. b, Actividad normalizada de LuxSit-i en sustratos de luciferina seleccionados. Imagen de luminiscencia (arriba) y cuantificación de la señal (abajo) del sustrato indicado en presencia de LuxSit-i 100 nM. LuxSit-i tiene una alta especificidad para el sustrato objetivo de diseño, DTZ. c, visualización de mapa de calor de la especificidad del sustrato de LuxSit-i; luciferasa de renilla (RLuc); Gaussia luciferasa (GLuc); NLuc modificado a partir de luciferasa de Oplophorus; y la luciferasa de novo (HTZ3-G4) diseñada para h-CTZ. El mapa de calor muestra la luminiscencia de cada enzima en cada sustrato; los valores se normalizan por enzima a la señal más alta para esa enzima sobre todos los sustratos. d, el espectro de emisión de luminiscencia de LuxSit-i-DTZ (verde) y RLuc-PP-CTZ (púrpura) se puede resolver espectralmente con filtros 528/20 y 390/35 (que se muestran en barras discontinuas) y solo reconocen el sustrato afín. e, Esquema del ensayo multiplex de luciferasa. Las células HEK293T transfectadas transitoriamente con plásmidos CRE-RLuc, NF-κB-LuxSit-i y CMV-CyOFP se trataron con forskolina (FSK) o factor de necrosis tumoral humano (TNF) para inducir la expresión de luciferasas marcadas. f,g, las señales de luminiscencia de las células se pueden medir con métodos de resolución de sustrato o de resolución espectral mediante un lector de placas. f, Para el método de resolución de sustrato, la intensidad de la luminiscencia se registró sin filtro después de agregar PP-CTZ o DTZ. g, Para el método de resolución espectral, se agregaron tanto PP-CTZ como DTZ, y las señales se adquirieron usando filtros 528/20 y 390/35 simultáneamente. En f y g, el panel inferior indica la adición de FSK o TNF. Las señales de luminiscencia se adquirieron del lisado de 15 000 células en el reactivo CelLytic M, y la señal de fluorescencia de CyOFP se usó para normalizar el número de células y la eficiencia de la transfección. Todos los datos se normalizaron al correspondiente control no estimulado. Los datos son la media ± sd (n = 3).
Datos fuente
Razonamos que la alta especificidad de sustrato de LuxSit-i podría permitir la multiplexación de reporteros luminiscentes a través de señales luminiscentes específicas del sustrato o resueltas espectralmente (Fig. 4d y Datos extendidos Fig. 10a, b). Para investigar esta posibilidad, colocamos LuxSit-i aguas abajo del elemento de respuesta NF-κB y RLuc aguas abajo del elemento de respuesta cAMP (Fig. 4e). La adición de activadores (TNF) de la vía de señalización NF-κB resultó en luminiscencia cuando las células se incubaron con DTZ, mientras que la luminiscencia de PP-CTZ (el sustrato de RLuc) se observó solo cuando se activó la vía cAMP-PKA (Fig. .4f). Debido a que DTZ y PP-CTZ emiten luminiscencia en diferentes longitudes de onda, en principio se pueden combinar y las dos señales se pueden desconvolucionar mediante análisis espectral. De hecho, observamos que la activación de la señalización de NF-κB resultó en luminiscencia en la longitud de onda DTZ, mientras que la adición de activadores de la vía cAMP-PKA (FSK) generó luminiscencia en la longitud de onda PP-CTZ, lo que nos permitió evaluar simultáneamente la activación de los dos vías de señalización en la misma muestra con lisados celulares (Fig. 4g) o células HEK293T intactas (Datos extendidos Fig. 10c-e) proporcionando ambos sustratos juntos. Por lo tanto, la alta especificidad de sustrato de LuxSit-i permite la notificación multiplexada de diversas respuestas celulares.
El diseño de enzimas computacionales se ha visto limitado por la cantidad de andamios disponibles, lo que limita la medida en que se pueden lograr las configuraciones catalíticas y la complementariedad de la forma enzima-sustrato14,15,16. El uso de aprendizaje profundo para producir una gran cantidad de andamios diseñados de novo aquí elimina esta restricción, y RoseTTAfold (ref. 38) y AlphaFold2 (ref. 31) más precisos deberían permitir que los andamios de proteínas se generen de manera aún más efectiva a través de la familia. -amplia alucinación y otros abordajes18,39. La diversidad de formas y tamaños de los bolsillos de andamios nos permitió considerar una gama de geometrías catalíticas y maximizar la complementariedad de la forma de la enzima intermedia de reacción; que sepamos, ninguna luciferasa nativa tiene pliegues similares a LuxSit, y la enzima tiene una alta especificidad para un sustrato de luciferina completamente sintético que no existe en la naturaleza. Con la incorporación de tres sustituciones que proporcionan un bolsillo más complementario para estabilizar el estado de transición, LuxSit-i tiene una actividad más alta que cualquier enzima diseñada de novo anterior, con un kcat/Km (106 M−1 s−1) en el variedad de luciferasas nativas. Este es un avance notable para el diseño de enzimas computacionales, ya que se requirieron decenas de rondas de evolución dirigida para obtener eficiencias catalíticas en este rango para una retroaldolasa diseñada, y la estructura se remodeló considerablemente40; por el contrario, las diferencias previstas en las interacciones ligando-cadena lateral entre LuxSit y LuxSit-i son muy sutiles (Fig. 2b complementaria; lograr actividades tan altas directamente desde la computadora sigue siendo un desafío en el diseño de enzimas computacionales). El tamaño pequeño, la estabilidad y el plegado robusto de LuxSit-i lo hacen muy adecuado para fusiones de luciferasa con proteínas de interés y como etiqueta genética para vectores virales de capacidad limitada. Desde el punto de vista de la ciencia básica, el pequeño tamaño, la simplicidad y la alta actividad de LuxSit-i lo convierten en un excelente sistema modelo para estudios computacionales y experimentales del mecanismo catalítico de la luciferasa. Extender el enfoque utilizado aquí para crear luciferasas específicas similares para sustratos de luciferina sintética más allá de DTZ y h-CTZ extendería considerablemente las oportunidades de multiplexación ilustradas en la Fig. 4 (particularmente con los avances recientes en microscopía41) y permitiría una nueva generación de kits de herramientas luminiscentes multiplexados. . En términos más generales, nuestro método de alucinación para toda la familia abre un número casi ilimitado de posibilidades de andamiaje para la unión de sustratos y la ubicación de residuos catalíticos, lo cual es particularmente importante cuando el mecanismo de reacción y cómo promoverlo no se entiende completamente: muchas hipótesis estructurales y catalíticas alternativas. se pueden enumerar fácilmente con forma y bolsillos de unión químicamente complementarios pero con diferentes ubicaciones de residuos catalíticos. Aunque las luciferasas son únicas para catalizar la emisión de luz, la transformación química de sustratos en productos es común a todas las enzimas, y el enfoque desarrollado aquí debería ser fácilmente aplicable a una amplia variedad de reacciones químicas.
Más información sobre el diseño de la investigación está disponible en el Resumen de informes de Nature Portfolio vinculado a este artículo.
Los datos fuente para las Figs. 2–4 están disponibles en línea. La secuencia del gen para LuxSit-i se ha depositado en GenBank con el número de acceso OP820699. Consulte los datos complementarios para conocer los modelos de diseño de LuxSit y LuxSit-i. Los plásmidos con codones optimizados que codifican LuxSit-i para la expresión en bacterias y mamíferos están disponibles a través de Addgene. Los datos de origen se proporcionan con este documento.
El conjunto de modelos macromoleculares de Rosetta (https://www.rosettacommons.org) está disponible gratuitamente para usuarios académicos y no comerciales. Las licencias comerciales para la suite están disponibles a través de la Oficina de Transferencia de Tecnología de la Universidad de Washington. El código fuente para la implementación del acoplamiento RIF está disponible gratuitamente en https://github.com/rifdock/rifdock. Todos los guiones relevantes y un cuaderno de Júpiter que lo acompaña para la generación de andamios de alucinaciones en toda la familia están disponibles aquí: https://files.ipd.uw.edu/pub/luxSit/scaffold_generation.tar.gz. Todos los andamios generados están disponibles aquí: https://files.ipd.uw.edu/pub/luxSit/scaffolds.tar.gz. Los scripts de diseño computacional para las bibliotecas de luciferasa están disponibles aquí: https://files.ipd.uw.edu/pub/luxSit/luciferase_designs_methods.zip.
Jiang, L. et al. Diseño computacional de novo de enzimas retroaldólicas. Ciencia 319, 1387–1391 (2008).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Rothlisberger, D. et al. Catalizadores de eliminación de Kemp por diseño enzimático computacional. Naturaleza 453, 190–195 (2008).
Artículo ADS PubMed Google Scholar
Sí, HW et al. Pares de luciferasa-luciferina desplazados al rojo para imágenes de bioluminiscencia mejoradas. Nat. Métodos 14, 971–974 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Love, AC & Prescher, JA Ver (y usar) la luz: desarrollos recientes en tecnología de bioluminiscencia. Química celular. Biol. 27, 904–920 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Syed, AJ & Anderson, JC Aplicaciones de bioluminiscencia en biotecnología y más allá. química Soc. Rev. 50, 5668–5705 (2021).
Artículo CAS PubMed Google Académico
Sí, H.-W. & Ai, H.-W. Desarrollo y aplicaciones de reporteros y biosensores bioluminiscentes y quimioluminiscentes. año Anal Rev. química 12, 129–150 (2019).
Artículo CAS Google Académico
Zambito, G., Chawda, C. & Mezzanotte, L. Herramientas emergentes para imágenes de bioluminiscencia. actual Opinión química Biol. 63, 86–94 (2021).
Artículo CAS PubMed Google Académico
Markova, SV, Larionova, MD & Vysotski, ES Luz brillante sobre las luciferasas secretadas de los copépodos marinos: conocimientos y aplicaciones actuales. fotoquímica Fotobiol. 95, 705–721 (2019).
Artículo CAS PubMed Google Académico
Jiang, TY, Du, LP y Li, MY Iluminación bioluminiscente con coelenterazina: estrategias y aplicaciones. fotoquímica Fotobiol. ciencia 15, 466–480 (2016).
Artículo CAS PubMed Google Académico
Michelini, E. et al. Tecnología de genes con resolución espectral para bioluminiscencia multiplexada y cribado de alto contenido. Anal. química 80, 260–267 (2008).
Artículo CAS PubMed Google Académico
Rathbun, CM et al. Proyección paralela para la identificación rápida de herramientas bioluminiscentes ortogonales. Ciento ACS. ciencia 3, 1254–1261 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Yeh, H.-W., Wu, T., Chen, M. y Ai, H.-W. Identificación de factores que complican la obtención de imágenes por bioluminiscencia. Bioquímica 58, 1689–1697 (2019).
Artículo CAS PubMed Google Académico
Su, YC et al. Los nuevos sustratos NanoLuc permiten obtener imágenes de bioluminiscencia de dos poblaciones brillantes en animales. Nat. Métodos 17, 852–860 (2020).
Artículo CAS PubMed Google Académico
Lombardi, A., Pirro, F., Maglio, O., Chino, M. & DeGrado, WF Diseño de novo de metaloproteínas de haz de cuatro hélices: un andamio, diversas reactividades. Cuenta química Res. 52, 1148–1159 (2019).
Artículo CAS PubMed PubMed Central Google Scholar
Chino, M. et al. Enzimas artificiales de dihierro con una estructura de haz de cuatro hélices diseñada de novo. EUR. J. Inorg. química 2015, 3352–3352 (2015).
Artículo ADS CAS Google Académico
Basler, S. et al. Catálisis eficiente con ácido de Lewis de una reacción biológica en un andamio de proteína de novo. Nat. química 13, 231–235 (2021).
Artículo CAS PubMed Google Académico
Anishchenko, I. et al. Diseño de proteínas de novo por alucinación de redes profundas. Naturaleza 600, 547–552 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Wang, J. et al. Sitios funcionales de proteínas de andamiaje utilizando aprendizaje profundo. Ciencia 377, 387–394 (2022).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Norn, C. et al. Diseño de secuencias de proteínas mediante optimización del paisaje conformacional. proc. Academia Nacional. ciencia EE.UU. 118, e2017228118 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Yang, JY et al. Predicción mejorada de la estructura de la proteína utilizando orientaciones predichas entre residuos. proc. Academia Nacional. ciencia EE. UU. 117, 1496–1503 (2020).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Basanta, B. et al. Un algoritmo enumerativo para el diseño de novo de proteínas con diversas estructuras de bolsillo. proc. Academia Nacional. ciencia EE. UU. 117, 22135–22145 (2020).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Loening, AM, Fenn, TD & Gambhir, SS Estructuras cristalinas de la luciferasa y la proteína verde fluorescente de Renilla reniformis. J. Mol. Biol. 374, 1017–1028 (2007).
Artículo CAS PubMed PubMed Central Google Scholar
Tomabechi, Y. et al. Estructura cristalina de nanoKAZ: el componente mutado de 19 kDa de la luciferasa de Oplophorus que cataliza la reacción bioluminiscente con coelenterazina. Bioquímica Biografía. Res. común 470, 88–93 (2016).
Artículo CAS PubMed Google Académico
Wu, N. et al. Estructura de la solución de luciferasa de Gaussia con cinco enlaces disulfuro e identificación de una supuesta cavidad de unión de coelenterazina mediante RMN heteronuclear. ciencia Rep. 10, 20069 (2020).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Ding, BW y Liu, YJ Bioluminiscencia del calamar luciérnaga a través del mecanismo de oxigenación por transferencia de electrones individuales y luminiscencia inducida por transferencia de carga. Mermelada. química Soc. 139, 1106–1119 (2017).
Artículo CAS PubMed Google Académico
Isobe, H., Yamanaka, S., Kuramitsu, S. y Yamaguchi, K. Mecanismo de regulación del acoplamiento espín-órbita en la luminiscencia inducida por transferencia de carga de derivados de imidazopirazinona. Mermelada. química Soc. 130, 132–149 (2008).
Artículo CAS PubMed Google Académico
Kondo, H. et al. Efectos de los sustituyentes en la cinética de la reacción de quimioluminiscencia de 6-arilimidazo[1,2-a]pirazin-3(7H)-onas (análogos de luciferina de Cypridina): apoyo al mecanismo de oxigenación por transferencia de un solo electrón (SET) con oxígeno molecular triplete . tetraedro Lett. 46, 7701–7704 (2005).
Artículo CAS Google Académico
Branchini, BR et al. Soporte experimental para un único mecanismo de oxidación por transferencia de electrones en bioluminiscencia de luciérnagas. Mermelada. química Soc. 137, 7592–7595 (2015).
Artículo CAS PubMed Google Académico
Dou, JY et al. Diseño de novo de un barril β activador de fluorescencia. Naturaleza 561, 485–491.
Artículo ADS CAS PubMed PubMed Central Google Scholar
Cao, L. et al. Diseño de proteínas de unión a proteínas a partir de la estructura diana sola. Naturaleza 605, 551–560 (2022).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Jumper, J. et al. Predicción de estructura de proteínas de alta precisión con AlphaFold. Naturaleza 596, 583–589 (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Dauparas, J. et al. Diseño robusto de secuencias de proteínas basado en aprendizaje profundo utilizando ProteinMPNN. Ciencia 378, 49–56 (2022).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Sí, H.-W. et al. Variantes de reportero bioluminiscente independiente de ATP para mejorar la imagen in vivo. ACS química. Biol. 14, 959–965 (2019).
Artículo CAS PubMed PubMed Central Google Scholar
Xiong, Y. et al. Nano luciferasa emisora de ámbar diseñada y su uso para imágenes de inmunobioluminiscencia in vivo. Mermelada. química Soc. 144, 14101–14111 (2022).
Artículo CAS PubMed Google Académico
Bhaumik, S. & Gambhir, SS Imágenes ópticas de la expresión del gen reportero de luciferasa de Renilla en ratones vivos. proc. Academia Nacional. ciencia EE. UU. 99, 377–382 (2002).
Artículo ADS CAS PubMed Google Scholar
Szent-Gyorgyi, C., Ballou, BT, Dagnal, E. & Bryan, B. Clonación y caracterización de nuevas proteínas bioluminiscentes. En Proc. SPIE 3600, Imágenes biomédicas: reporteros, tintes e instrumentación (eds. Bornhop, DJ, Contag, CH y Sevick-Muraca, EM) https://doi.org/10.1117/12.351015 (SPIE, 1999).
Salón, MP et al. Reportero de luciferasa diseñado a partir de un camarón de aguas profundas que utiliza un sustrato novedoso de imidazopirazinona. ACS química. Biol. 7, 1848–1857 (2012).
Artículo CAS PubMed PubMed Central Google Scholar
Baek, M. et al. Predicción precisa de estructuras e interacciones de proteínas utilizando una red neuronal de tres pistas. Ciencia 373, 871-+ (2021).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Wicky, BIM et al. Montajes simétricos de proteínas alucinantes. Ciencia 378, 56–61 (2022).
Artículo ADS CAS PubMed PubMed Central Google Scholar
Giger, L. et al. La evolución de una retroaldolasa diseñada conduce a una remodelación completa del sitio activo. Nat. química Biol. 9, 494–498 (2013).
Artículo CAS PubMed PubMed Central Google Scholar
Yao, Z. et al. Microscopía de bioluminiscencia multiplexada mediante análisis fasorial. Nat. Métodos 19, 893–898 (2022).
Artículo CAS PubMed Google Académico
Descargar referencias
Agradecemos a B. Wicky y R. Kibler por su asistencia en las mediciones de CD; X. Li por su ayuda con el análisis de espectrometría de masas de proteínas; D. Feldman por la investigación inicial de imágenes celulares; L. Milles por optimizar el protocolo de ensamblaje Golden Gate; y la Fundación Nacional de Ciencias Naturales de China (22103060) por proporcionar recursos computacionales que se utilizaron en mecánica cuántica y simulaciones MD. Algunos paneles de figuras se crearon parcialmente con BioRender.com (Fig. 4e y Extended Data Figs. 2 y 10c). La investigación informada en esta publicación fue financiada parcialmente por el Instituto Nacional de Imágenes Biomédicas y Bioingeniería de los Institutos Nacionales de Salud con el número de concesión K99EB031913. El contenido es responsabilidad exclusiva de los autores y no representa necesariamente los puntos de vista oficiales de los Institutos Nacionales de Salud. Reconocemos la financiación del Instituto Médico Howard Hughes (YK, BC y DB); la Cátedra Henrietta y Aubrey Davis en el Departamento de Bioquímica (DB) de la Universidad de Washington; el premio NIH Pathway to Independence (AH-WY, K99EB031913); United World Antiviral Research Network (UWARN) (uno de los Centros para la Investigación de Enfermedades Infecciosas Emergentes; CREID) NIAID 1 U01 AI151698-01 (DB y AH-WY); el Proyecto Audaz del Instituto de Diseño de Proteínas (DB y AH-WY); el Proyecto de Filantropía Abierta para Mejorar el Fondo de Diseño de Proteínas (DB); la Fundación Novo Nordisk (CN, NNF18OC0030446), una Beca de la Fundación de Investigación de Washington (SP); E. y W. Schmidt, por recomendación del programa Schmidt Futures (DT, GRL, JZZ, LC, SH, MD, LC y DB); y la Fundación Nacional de Ciencias (KNH, DE y PM, CHE-1764328 y OCI-1053575 para XSEDE).
Estos autores contribuyeron por igual: Andy Hsien-Wei Yeh, Christoffer Norn
Departamento de Bioquímica, Universidad de Washington, Seattle, WA, EE. UU.
Andy Hsien-Wei Yeh, Christoffer Norn, Yakov Kipnis, Doug Tischer, Samuel J Pellock, Gyu Rie Lee, Jason Z Zhang, Ivan Anishchenko, Brian Coventry, Longxing Cao, Justas Dauparas y David Baker
Instituto para el Diseño de Proteínas, Universidad de Washington, Seattle, WA, EE. UU.
Andy Hsien-Wei Yeh, Christoffer Norn, Yakov Kipnis, Doug Tischer, Samuel J Pellock, Gyu Rie Lee, Jason Z Zhang, Ivan Anishchenko, Brian Coventry, Longxing Cao, Justas Dauparas, Samer Halabiya, Michelle DeWitt, Lauren Carter y David Baker
Departamento de Ingeniería Biomolecular, Universidad de California, Santa Cruz, Santa Cruz, CA, EE. UU.
Andy Hsien-Wei Yeh
Instituto Médico Howard Hughes, Universidad de Washington, Seattle, WA, EE. UU.
Yakov Kipnis, Brian Coventry y David Baker
Departamento de Química y Bioquímica, Universidad de California, Los Ángeles, Los Ángeles, CA, EE. UU.
Declan Evans, Pengchen Ma y KN Houk
Escuela de Química, Xi'an Laboratorio Clave de Química de Materiales de Energía Sostenible, MOE Laboratorio Clave para Síntesis de No Equilibrio y Modulación de Materia Condensada, Universidad Xi'an Jiaotong, Xi'an, China
Pengchen Ma
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
DB supervisó este trabajo. AH-WY concibió el proyecto y realizó la caracterización experimental. AH-WY, YK y CN conceptualizaron e investigaron las estrategias de diseño iniciales y AH-WY realizó el diseño computacional de las luciferasas. CN conceptualizó e implementó la canalización de alucinaciones en toda la familia. CN, DT, SJP e IA realizaron el diseño del andamio. SJP realizó el diseño de la secuencia ProteinMPNN de andamios NTF2. KNH asesoró a DE y PM para cálculos de mecánica cuántica y MD y contribuyó a la redacción de las partes mecanicistas del manuscrito. GRL desarrolló la simulación SSM computacional. JZZ preparó células de mamíferos y realizó imágenes de microscopía. BC y LC integraron la función de archivo de sintonización en RifDock. JD desarrolló ProteinMPNN. SH ayudó a ensamblar la biblioteca diseñada. MD y LC ayudaron con la expresión y purificación de proteínas. AH-WY, CN y DB escribieron el manuscrito inicial. Todos los autores discutieron los resultados y contribuyeron al manuscrito final.
Correspondencia a Andy Hsien-Wei Yeh o David Baker.
AH-WY, CN, YK, DT, SJP, IA y DB son coinventores en varias solicitudes de patentes provisionales (números de solicitud 63/300171, 63/300178, 63/381922 y 63/381924 presentadas por la Universidad de Washington) que cubren las luciferasas de novo y los andamios proteicos descritos en este artículo. AH-WY, CN, JZ y DB son accionistas de Monod Bio, una empresa que tiene como objetivo desarrollar las invenciones descritas en este manuscrito. Los autores restantes declaran no tener intereses contrapuestos.
Nature agradece a los revisores anónimos por su contribución a la revisión por pares de este trabajo. Los informes de los revisores están disponibles.
Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
El cálculo de la teoría funcional de la densidad (DFT) sugirió que la formación de un estado aniónico es la fuente de electrones esencial para la activación del triplete de oxígeno (3O2). Con el respaldo tanto de la teoría25,26 como de la evidencia experimental27,28, es probable que el próximo proceso de oxigenación sea a través de un mecanismo de transferencia de un solo electrón (SET) en el que el campo de reacción circundante podría influir en gran medida en el cambio de la energía libre de Gibbs (ΔGSET). Finalmente, la termólisis de un intermediario emisor de luz de dioxetano puede producir fotones a través del mecanismo de luminiscencia inducida por transferencia de carga gradualmente reversible (GRCTIL), que generalmente es exergónico. Dado que todas las pruebas históricas se basan en cálculos en disolventes virtuales o quimioluminiscencia en disolventes orgánicos ideales, el mecanismo detallado de una reacción de luminiscencia catalizada por luciferasa sigue sin estar claro. Propusimos que el paso clave de la enzima es promover la formación de un estado aniónico y crear un entorno adecuado para facilitar un SET eficiente. Por lo tanto, el objetivo de este estudio es diseñar un campo de reacción enzimático que rodee al sustrato para estabilizar el estado del sustrato aniónico y alterar la actividad protónica local, la polaridad del solvente y la hidrofobicidad para la activación eficiente de 3O2.
Las secuencias de ADN diseñadas computacionalmente se compraron en una matriz de oligos, donde los fragmentos se amplificaron por PCR, se ensamblaron y se ligaron en un vector de expresión bacteriano pBAD. La biblioteca de plásmidos se usó para transformar células DH10B. Cada colonia cultivada en la placa de agar LB representaba un diseño de luciferasa. Las placas se rociaron con solución DTZ y se tomaron imágenes para identificar colonias activas utilizando un generador de imágenes ChemiDoc. Las colonias seleccionadas se inocularon en placas de 96 pocillos, se expresaron y purificaron para confirmar la actividad de luciferasa individual. Luego, los plásmidos pueden secuenciarse individualmente para señalar modelos de diseño activos que brindan información sobre el principio de diseño y las funciones enzimáticas o pueden someterse a mutagénesis aleatoria para una mayor evolución. Inserto: se identificaron tres luciferasas a partir de esta selección. Nos referimos a la luciferasa más activa y específica de DTZ como "LuxSit".
a–c, la expresión recombinante de a, LuxSit, b, LuxSit-i, y c, LuxSit-f en E. coli. Las anotaciones para cada carril son las siguientes: 1: Pre-IPTG; 2: Post-IPTG; 3: lisado soluble; 4: Flujo continuo; 5: Lavado; 6: Elusión; 7: escisión post-TEV; 8: Post-SEC. d-f, cromatografía de exclusión por tamaño de la d purificada, LuxSit; e, LuxSit-i; yf, monómero LuxSit-f. g–i, Espectro de masa desconvolucionado de g, LuxSit, h, LuxSit-i e i, LuxSit-f. j, k, espectros de dicroísmo circular ultravioleta lejano (CD) (panel izquierdo) de j, LuxSit-i; yk, LuxSit-f a 25 °C (línea negra), 95 °C (línea roja) y enfriado nuevamente a 25 °C (línea verde). Curva de fusión de CD a 220 nm (panel derecho). l, se observó un pico de SEC dimérico cuando LuxSit-i se concentró a una concentración alta (~50 μM) en tampón Tris pH 8,0. Las fracciones de SEC diméricas y monoméricas mostraron el tamaño esperado en SDS-PAGE y ambos picos fueron catalíticamente activos para emitir luminiscencia en presencia de 25 μM DTZ.
a, SDS-PAGE teñida con Coomassie de HTZ3-D2 y HTZ3-G4 purificada a partir de la expresión recombinante en E. coli. b, Las vistas ampliadas de HTZ3-D2 (panel izquierdo) y HTZ3-G4 (panel derecho) ilustraron la preorganización de la cadena lateral de las interacciones luciferasa-h-CTZ. c, d, cromatografía de exclusión por tamaño (izquierda), espectro de masas desconvolucionado (centro) y las actividades de luciferasa normalizadas en compuestos seleccionados (derecha) de c, HTZ3-D2 y d, HTZ3-G4, lo que sugirió una alta especificidad para el diseño sustrato objetivo, h-CTZ. e, Dependencia de la concentración de sustrato de la actividad LuxSit (w/ DTZ), HTZ3-D2 (w/ h-CTZ) y HTZ3-G4 (w/ h-CTZ) en PBS. Todos los puntos de datos se ajustaron a la ecuación de Michaelis-Menten. HTZ3-D2 y HTZ3-G4 mostraron valores de Km de 7,9 y 19,5 μM con ~25 % y ~58 % de Imax de LuxSit, respectivamente. Los datos se presentan como media ± sd (n = 3).
El ddGbind calculado de cada mutación se representó gráficamente como una función de la actividad de luciferasa experimental promedio relativa. El ddGbind de residuos catalíticos hipotéticos: a, Tyr14-His98 y b, Asp18-Arg65 díadas generalmente no fueron los más bajos, lo que sugirió que estos residuos catalíticos diseñados no son favorables para la unión al sustrato. Los puntos rojos representan los aminoácidos de tipo salvaje (LuxSit). El rango de ddGbind de tipo salvaje para cada posición analizada para actividad se muestra con un mapa de calor en c. d – f, el ddGbind de tipo salvaje de los residuos diseñados para d, e, apilamiento π – π o f, las interacciones hidrofóbicas fueron las más bajas en comparación con los valores de mutación ddGbind. Esto muestra que la secuencia es casi óptima para la unión del sustrato y que el modelo de diseño es confiable.
Generamos una biblioteca completamente aleatoria en 60, 96 y 110 posiciones para examinar exhaustivamente todas las combinaciones posibles. Después de la selección basada en colonias, identificamos muchas colonias con fuertes actividades de luciferasa con DTZ. Cada colonia se expresó individualmente en cada pocillo de placas de 96 pocillos (cultivo de 1 ml) y se purificó en consecuencia (ver Métodos complementarios). a, la actividad de luminiscencia individual de cada mutante seleccionado se representó gráficamente y se comparó con el progenitor, LuxSit. Las actividades de luminiscencia se midieron en presencia de DTZ 25 µM. La actividad de luminiscencia (RLU) se mostró como la señal integrada durante los primeros 15 min. Análisis estadístico de la frecuencia de aminoácidos frente a la actividad de luciferasa en los residuos b, 60, c, 96 y d, 110. Los datos se presentan como media ± sd (n varía en cada barra a medida que los mutantes se seleccionaron de una biblioteca aleatoria). Se confirma que Arg60 es mutable entre todos los mutantes seleccionados, ya que Arg60 puede estar menos definido estructuralmente porque emana de un bucle y no tiene un compañero de enlace de hidrógeno. Ala96 prefiere sustituciones de cadenas laterales más grandes (Leu, Ile, Met y Cys), y Met110 favorece los residuos hidrofóbicos (Val, Ile y Ala). A una variante recién descubierta (R60S/A96L/M110V) con un flujo de fotones más de 100 veces mayor que LuxSit se le asignó LuxSit-i por su alto brillo. En la alineación de secuencias, las mutaciones se resaltan en fuentes amarillas y fondos grises. Las díadas catalíticas conservadas de Asp18–Arg65 y Tyr14–His98 están en fuentes verdes y azules.
a, Cinética de emisión normalizada de 15 000 células HeLa intactas que expresan LuxSit-i (rojo), LuxSit-i purificado 100 nM (verde) o LuxSit-f purificado 100 nM (azul) en presencia de DTZ 50 μM. La cinética de emisión más extendida en las células HeLa probablemente se deba a la tasa de difusión de DTZ a través de las membranas celulares. b, Las curvas de disminución de luminiscencia normalizadas de LuxSit-i en varios tampones de pH revelaron un mecanismo catalítico dependiente del pH. c, el rendimiento cuántico luminiscente se estimó a partir de la señal de luminiscencia integrada hasta convertir completamente sustratos de 125 pmol en fotones en presencia de luciferasa correspondiente a 50 nM (ver Métodos complementarios). Los datos se presentan como media (n = 3).
a, El perfil de energía libre calculado por la teoría funcional de la densidad (DFT) muestra que el oxígeno triplete puede reaccionar directamente con las especies aniónicas de DTZ (Int1) a través del complejo reactivo Int2 y TS1. El intermedio de dioxetano Int3 luego se escinde en un estado de transición singulete de capa abierta OSSTS2 para formar el intermedio excitado Int4*, que extruye rápidamente CO2 y forma el producto emisivo Int5. Nota: Int4* o Int5* emiten en la región observada, pero la vida útil de Int4* es muy corta y es probable que se convierta por completo en Int5* antes de la emisión. b, Int2 e Int3 se acoplaron tanto en LuxSit como en LuxSit-i y las uniones se evaluaron mediante dinámica molecular (MD). Las distancias entre His98 a O1 (fila superior) y Arg65 a N1 (fila inferior) del sustrato se trazaron a lo largo de simulaciones MD de 500 ns. LuxSit-i (traza azul) se une a Int2 '(centro) considerablemente mejor que LuxSit (traza roja), lo que sugiere que las mutaciones de LuxSit-i proporcionan un bolsillo de unión más complementario a TS1. Esta orientación de unión acerca mucho más a N1 del sustrato a Arg65, proporcionando una mejor estabilización de carga para el estado de transición de alta energía. c, Acoplamiento de la forma de anión peróxido de bis-CTZ en el bolsillo de LuxSit-i; la superposición azul representa DTZ en el modelo de diseño original. Durante la simulación MD, el carbono bencílico agregado de bis-CTZ (traza verde) interrumpe la complementariedad de forma entre LuxSit-i y los estados de transición (TS1 y TS2), lo que reduce la estabilización de carga por parte de Arg65. Esta estabilización de carga es necesaria para que prosiga la reacción, lo que explica la alta especificidad de sustrato de LuxSit-i para DTZ sobre bis-CTZ.
a, b, Imágenes de fluorescencia de células vivas a, HEK293T yb, HeLa que expresan LuxSit-i-mTagBFP2, que no está dirigida o está localizada en el núcleo (Histone2B), la membrana plasmática (KRasCAAX) o los compartimentos celulares de las mitocondrias (DAKAP). Barra de escala: 10 μm. c,d, Las señales de luminiscencia se midieron con 15.000 c, HEK293T o d, células HeLa intactas en presencia de 25 μM DTZ en DPBS. Las eficiencias de transfección oscilan entre el 60 % y el 70 % para las células HEK293T y entre el 5 % y el 10 % para las células HeLa. e, Los espectros de emisión de luminiscencia adquiridos de LuxSit-i que expresan células HEK293T son consistentes con los espectros de emisión de LuxSit-i recombinante purificado de E. coli. f, g, las señales de luminiscencia se midieron con 15.000 f, células HEK293T que expresan LuxSit-i intactas o g, lisado celular en presencia de sustrato indicado 25 μM en DPBS. Las intensidades de luminiscencia se normalizaron a la señal de DTZ, mostrando una alta especificidad de DTZ sobre otros sustratos en ensayos basados en células. Los datos se mostraron como señal de luminiscencia total durante los primeros 20 min ± sd (n = 3). h, perfil de intensidad de luminiscencia normalizado de líneas que atraviesan diferentes celdas (n = 10) de la imagen de luminiscencia principal de la Fig. 3c; las líneas grises representan células no transfectadas. Las barras de error representan ± SEM.
a, La relación de ortogonalidad entre los pares luminiscentes LuxSit-i-DTZ y RLuc-PP-CTZ (Prolume Purple, methoxy e-Coelenterazine). Los porcentajes indicados de cada luciferasa se mezclaron en diferentes proporciones hasta un total del 100%. Después de agregar los sustratos DTZ y PP-CTZ de 25 µM, se midió simultáneamente la luz filtrada de los canales 528/20 y 390/35. b, el mapa de calor muestra la señal de luminiscencia para luciferasa individual (100 nM) o mezcla 1:1 en presencia de sustratos afines o no afines (DTZ o PP-CTZ o ambos). Las señales de respuesta fueron adquiridas por un lector de placas Neo2 con filtros de 528/20 y 390/35 nm simultáneamente. c, Ensayo de luciferasa multiplex en HEK293T vivo después de la cotransfección de plásmidos CRE-RLuc, NFκB-LuxSit-i y CMV-CyOFP y estimulación con forskolina (FSK) o TNF humano. d, e, se analizaron 15 000 células intactas (consulte Métodos complementarios) mediante modos d, resueltos con sustrato o e, resueltos espectralmente después de agregar DTZ, PP-CTZ o DTZ y PP-CTZ en DPBS sin lisis celular. Se utilizó el escaneo del área de la señal de fluorescencia CyOFP para estimar el número de células y la eficiencia de la transfección. La unidad reportada fue RLU/au; unidades de luz relativas/medidas de intensidad de fluorescencia en Ex./Em. = 480/580 nm. Todos los datos se normalizaron al correspondiente control no estimulado. Los datos se presentan como media ± sd (n = 3).
Este archivo contiene la sección Métodos
Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Yeh, A.HW., Norn, C., Kipnis, Y. et al. Diseño de novo de luciferasas usando aprendizaje profundo. Naturaleza 614, 774–780 (2023). https://doi.org/10.1038/s41586-023-05696-3
Descargar cita
Recibido: 19 enero 2022
Aceptado: 03 enero 2023
Publicado: 22 febrero 2023
Fecha de emisión: 23 de febrero de 2023
DOI: https://doi.org/10.1038/s41586-023-05696-3
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.
Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt
Química de la naturaleza (2023)
Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.