Modelado atomístico de líquido.
Biología de las comunicaciones volumen 6, número de artículo: 886 (2023) Citar este artículo
Detalles de métricas
La separación de fases líquido-líquido de soluciones proteicas ha recuperado una mayor atención por su importancia biológica y relevancia patógena. Los modelos de grano grueso son limitados a la hora de explicar los efectos del nivel de residuos en el equilibrio de fases. Aquí presentamos diagramas de fases para cristalinas γ utilizando modelos atomísticos. Los cálculos fueron posibles combinando nuestro método FMAP para calcular potenciales químicos y simulaciones de dinámica browniana para muestreo configuracional de soluciones de proteínas densas, produciendo la temperatura binodal y crítica (Tc). Obtenemos una Tc más alta para una cristalina γ de alta Tc conocida, γF, que para un parálogo de Tc baja, γB. La diferencia en Tc se corrobora por una brecha en el segundo coeficiente virial. La descomposición de las interacciones entre proteínas revela una sustitución de aminoácidos entre γB y γF, de Ser a Trp en la posición 130, como el principal contribuyente a la diferencia en Tc. Este tipo de análisis nos permite vincular el equilibrio de fases a la secuencia de aminoácidos y diseñar mutaciones para alterar el equilibrio de fases.
La separación de proteínas en fase líquido-líquido se ha estudiado intensamente en los últimos años, porque los condensados biomoleculares resultantes median una serie de procesos celulares que van desde la transcripción hasta la regulación del estrés y también son propensos a la agregación relacionada con enfermedades1,2,3. La mayor parte de la atención se ha centrado en las proteínas intrínsecamente desordenadas (IDP) o proteínas con largas regiones desordenadas, en parte debido a la fuerte tendencia de dichas proteínas a sufrir una separación de fases4,5,6,7,8,9,10,11. Esta tendencia surge del hecho de que el desorden intrínseco permite que las proteínas formen fácilmente interacciones multivalentes que impulsan la separación de fases12. Irónicamente, la separación de fases se observó por primera vez en proteínas estructuradas, incluidas las γ-cristalinas13,14, que están presentes en el cristalino de los animales en altas concentraciones. Para las proteínas estructuradas, la formación de interacciones multivalentes que impulsan la separación de fases requiere altas concentraciones12. En consecuencia, la separación de fases de proteínas estructuradas se caracteriza por una alta concentración de saturación y/o una baja temperatura crítica (Tc), lo que plantea dificultades para los estudios experimentales. Mientras que los determinantes de secuencia para la separación de fases de proteínas desordenadas están bien estudiados5,7,10,11, nuestra comprensión de esta cuestión crucial está retrasada para las proteínas estructuradas.
Se han identificado hasta seis cristalinas γ altamente homólogas cada una en lentes bovinos, de rata y humanos15,16,17 (Fig. 1a y Fig. 1a complementaria). Según sus valores de Tc para separación de fases, se pueden dividir en dos grupos: uno, representado por γB bovino, tiene Tc inferior a 10 °C; el otro, representado por γF bovino, tiene Tc alrededor de la temperatura corporal14,18,19. Las cristalinas γ con alto Tc están presentes en un nivel más alto en el núcleo del cristalino que en la corteza, lo que contribuye al gradiente en el índice de refracción14,18. La separación de fases de las γ-cristalinas puede provocar cataratas y es suprimida por otros componentes, como las β-cristalinas20. Cuando se enfrió una lente de rata, se observó una separación de fases, en un fenómeno conocido como catarata fría21. Se han estudiado los efectos de varias mutaciones puntuales que causan cataratas sobre la separación de fases; los cambios resultantes en Tc, por ejemplo, por R14C (en presencia de un agente reductor para evitar la reticulación de disulfuro) y E107A de γD humana fueron pequeños22,23.
a Alineación de secuencia de γB y γF. Los números de residuos están según γB. La diferencia en la posición 130 se resalta con los colores verde y naranja para los aminoácidos, S y W, en γB y γF, respectivamente. El vinculador entre los dos dominios está en minúsculas. Las secuencias se recuperaron de las entradas P02526 y P23005 de UniProt (//www.uniprot.org/) para γB y γF, respectivamente, y se alinearon utilizando ClustalW58. La alineación de todas las secuencias conocidas de cristalinas γ bovinas, humanas y de rata se muestra en la figura complementaria 1a. b Superposición de estructuras cristalinas γB y γF (entradas PDB 1AMM y 1A45). γB y γF se muestran en representación de dibujos animados en verde y azul, respectivamente; las cadenas laterales en la posición 130 se muestran como bola y palo para γB y como palo para γF.
Dada la identidad de secuencia del 82% entre γB y γF bovinos (Fig. 1a), la gran brecha entre sus valores de Tc es asombrosa y generó la pregunta sobre sus determinantes de secuencia14. La primera comparación estructural entre estas dos proteínas24 también mostró una gran similitud [Fig. 1b; 0,19 Å desviación cuadrática media (RMSD) para todos los átomos de la estructura principal]; Los autores sugirieron diferencias en el contacto del cristal y la conformación del bucle (residuos 116-122) como posibles causas de la brecha Tc. Basado en la comparación de secuencias, Broide et al. 19 propusieron las sustituciones de aminoácidos en las posiciones 22 y 47 como potenciales, 15 como posibles y 163 como determinantes menos probables. Norledge et al. 15 señalaron que estos intentos previos se vieron obstaculizados por secuencias inexactas, porque las γ-cristalinas estudiadas se aislaron de lentes bovinos y se recolectaron como fracciones diferentes, y sus secuencias no fueron verificadas. Atribuyeron la brecha de Tc a diferencias en las cargas superficiales generales, incluida una mayor relación Arg/Lys y un mayor contenido de His en el grupo con alto contenido de Tc. Sin embargo, este intento tuvo su propia desventaja, es decir, la clasificación de la γD humana y de rata como Tc alta; Estudios posteriores han demostrado que tanto la γD humana como la de rata, al igual que la γD19 bovina, pertenecen al grupo de Tc baja22,25. Augusteyn et al. 26 midieron la extinción de la fluorescencia del triptófano de diferentes fracciones de γ-cristalinas bovinas. Al comentar sobre este último estudio, Norledge et al. 15 observaron que “su división de las cristalinas γ bovinas en dos grupos basándose en la fluorescencia del triptófano coincide con la división en dos grupos basándose en el comportamiento de separación de fases”, y atribuyeron la rápida extinción de la fluorescencia del grupo de alta Tc a un residuo de Trp expuesto, en la posición 130 (Fig. 1b). Sin embargo, no vincularon Trp130 con una Tc alta.
Los binodales, es decir, la dependencia de la temperatura de las concentraciones de proteínas en las fases diluida y densa coexistentes, medidas en la ref. 19 para cristalinas γ bovinas han motivado una serie de estudios computacionales. Dorsaz et al. 27 utilizaron partículas esféricas que interactuaban a través de un potencial de pozo cuadrado para modelar cristalinas γ. Kastelic et al. 28 ampliaron dicho modelo para tener sitios de interacción ubicados en la superficie esférica. Los modelos de grano grueso están teniendo éxito en reproducir los efectos de grandes variaciones de secuencia (p. ej., sustituciones de todos los residuos Tyr por Phe) en los equilibrios de fase de los IDP6,8,9, pero la predicción cuantitativa del efecto de una mutación puntual parece estar más allá de lo posible. alcance de estos modelos, especialmente para proteínas estructuradas. Reconociendo la limitación de estos modelos simplificados, desarrollamos un método llamado FMAP, o modelado basado en transformada rápida de Fourier (FFT) de interacciones proteína-proteína atomísticas, y demostramos su viabilidad para estudiar la separación de fases de cristalinas γ y otras proteínas29 (consulte el suplemento Nota 1 y figura complementaria 2). El poder de FFT permite a FMAP manejar una gran cantidad de cálculos necesarios para determinar el binodal de una proteína atomística. El enfoque basado en FFT también se ha utilizado para calcular los segundos coeficientes virial30, que son un indicador de la temperatura crítica31.
Aquí combinamos FMAP con simulaciones de dinámica browniana para el muestreo configuracional de soluciones de proteínas densas para determinar los binodales de γB y γF bovinos e identificar el origen de su brecha Tc. Nuestra descomposición específica de residuos de las interacciones entre proteínas y el análisis de secuencia revelan la sustitución de Ser en γB por Trp en γF en la posición 130 (Fig. 1b) como el principal contribuyente a la brecha de Tc. Este trabajo demuestra un enfoque computacional para mapear el equilibrio de fases en la secuencia de aminoácidos de proteínas estructuradas y abre la posibilidad de diseñar mutaciones para alterar el equilibrio de fases.
El potencial químico \(\mu\) es la energía libre por molécula. Para una solución de proteína, la dependencia del potencial químico de la concentración de proteína (\(\rho\)) permite la determinación del binodal12,32. \(\mu\) se puede descomponer en
La parte ideal \({\mu }_{{{{{\rm{id}}}}}}}\) es el potencial químico de una solución ideal, donde las moléculas de proteína no tienen ninguna interacción, y es lo mismo que la contraparte de un gas ideal,
donde \({k}_{{{{{\rm{B}}}}}}}\) es la constante de Boltzmann, \(T\) es la temperatura absoluta y \({\rho }_{0} \) es una concentración de referencia arbitraria. El exceso de parte \({\mu }_{{{{{\rm{ex}}}}}}}\) explica las interacciones entre las moléculas de proteína en la solución. Mientras que la concentración baja disminuye \({\mu }_{{{{{\rm{id}}}}}}\) (como lo dicta la ecuación [2]), las interacciones intermoleculares en concentraciones altas de proteína pueden disminuir \({\mu }_{{{{{\rm{id}}}}}}\) ({\mu }_{{{{{{\rm{ex}}}}}}}\). Dos fases coexistentes deben tener el mismo potencial químico. Entonces, la simple razón por la que una solución de proteína sufre una separación de fases es que \({\mu }_{{{{{{\rm{id}}}}}}}\) favorece la fase diluida mientras que \({\mu } _{{{{{{\rm{ex}}}}}}\) favorece la fase densa, lo que lleva a la igualdad en el potencial químico entre las fases.
Una forma de formular \({\mu }_{{{{{\rm{ex}}}}}}}\) es mediante la introducción de una proteína de prueba, que es idéntica a las moléculas de proteína en la solución, incluso experimentar las mismas interacciones intermoleculares, pero no afecta la solución de proteínas de ninguna manera. Si tratamos cada molécula de proteína como rígida, entonces la posición y orientación de la molécula de proteína permiten especificar las posiciones de todos sus átomos. Sean \({{{{{\bf{R}}}}}}\) y \({{{{{\boldsymbol{\Omega }}}}}}\), respectivamente, la posición y orientación de la proteína de prueba, \({{{{\bf{X}}}}}}\) sean las configuraciones de las moléculas de proteína en la solución, y \(U\left({{{{{\bf{X }}}}}},{{{{{\boldsymbol{\Omega }}}}}},{{{{{\bf{R}}}}}}\right)\) sea la energía de interacción entre los prueba de proteína y la solución de proteína, entonces el exceso de potencial químico viene dado por 33
donde \(\beta =1/{k}_{{{{{\rm{B}}}}}}}T\) y \(\left\langle \cdots \right\rangle\) significa promediar \({{{{{\bf{X}}}}}}\), \({{{{{\boldsymbol{\Omega }}}}}}\) y \({{{{{\ bf{R}}}}}}\).
Para proteínas modeladas a nivel atomístico, la evaluación de \({\mu }_{{{{{{\rm{ex}}}}}}\) requiere una gran cantidad de cálculos, que implican muestreo sobre \({ {{{{\bf{X}}}}}}\), \({{{{{\boldsymbol{\Omega }}}}}}\) y \({{{{{\bf{R }}}}}}\). Por ejemplo, el muestreo sobre \({{{{{\bf{R}}}}}}\) implica colocar la proteína de prueba (con una orientación particular \({{{{{\boldsymbol{\Omega }}} }}}\)) en numerosas posiciones dentro de una solución de proteína (con una configuración particular \({{{{{\bf{X}}}}}}\)), como se ilustra en la Fig. 2a. Nuestro método basado en FFT, aquí denominado FMAPμ, acelera el promedio sobre \({{{{{\bf{R}}}}}}\) y por lo tanto realiza la evaluación de \({\mu }_{{{{ {{\rm{ex}}}}}}}\) factible29. Nuestra función de energía de interacción se compone de contribuciones aditivas de todos los pares de átomos entre dos moléculas de proteína cualesquiera. La contribución de cada par de átomos i y j tiene tres términos29,34:
donde \({r}_{{ij}}\) es la distancia interatómica. El término estérico es
donde \({\sigma }_{{ii}}/2\) denota el radio del núcleo duro del átomo \(i\). El término de atracción no polar, incluidas las interacciones hidrofóbicas y de van der Waals, tiene la forma de un potencial de Lennard-Jones,
donde \({\epsilon }_{{ij}}\) denota la magnitud de la atracción \(ij\), \({\sigma }_{{ij}}\) es la distancia a la que la energía de interacción no polar es cero. Como en nuestros estudios anteriores29,34, utilizamos parámetros AMBER para \({\epsilon }_{{ij}}\) y \({\sigma }_{{ij}}\), junto con un parámetro de escala \( {s}_{1}\) = 0,16. El término electrostático tiene la forma de un potencial de Debye-Hückel,
donde \({q}_{i}\) es la carga parcial del átomo \(i\), \(\varepsilon\) es la constante dieléctrica y \(\kappa\) es el parámetro de detección de Debye. Introdujimos un factor de escala \({s}_{2}\) = 1,6 para tener en cuenta efectos como la posible reducción de la constante dieléctrica en soluciones proteicas densas29.
a Ilustración del método FMAPμ. Tres cuadros con diferentes números de copias de la proteína que se muestran en rojo representan un rango de concentraciones. En cada concentración, se inserta ficticiamente una copia adicional, o proteína de prueba, que se muestra en verde (indicada por flechas discontinuas) en el cuadro, y FMAP calcula su energía de interacción con las copias rojas. El promedio del factor de Boltzmann correspondiente produce el exceso de potencial químico en esa concentración de proteína. b, c Dependencias del exceso de potenciales químicos de la concentración de proteínas y la temperatura para γB y γF. Las barras de error se estimaron aplicando el método de bloqueo de la ref. 59 a los factores promedio de Boltzmann en 500 orientaciones de proteínas de prueba. El gran error del potencial químico excesivo de γB a 277 mg/ml y -2 °C se debió a una única energía de interacción baja y atípica (ver también la figura complementaria 5). El componente estérico es el límite de alta temperatura del exceso de potencial químico. En la figura complementaria 4 se muestra una comparación de los componentes estéricos entre γB y γF.
El muestreo de configuraciones de proteínas (\({{{{\bf{X}}}}}}\)) se implementó mediante simulaciones de dinámica browniana (BD)35. Se iniciaron de 30 a 450 moléculas γB o γF en una caja cúbica de 324 Å de longitud lateral, lo que dio como resultado concentraciones de 31 a 461 mg/ml que abarcan el rango experimentalmente relevante (consulte el recuadro de la Fig. 3f a continuación). La función de distribución de pares calculada a partir de las simulaciones de BD coincide con la esperada de la energía de interacción del par (Figura complementaria 3). A partir de estas simulaciones, tomamos 2000 configuraciones a intervalos de 10 ns para implementar FMAPμ. Para muestrear \({{{{{\boldsymbol{\Omega }}}}}}\), generamos 500 orientaciones aleatorias para la proteína de prueba. Por último, el muestreo sobre \({{{{{\bf{R}}}}}}\) se realizó discretizando la caja de simulación BD con una resolución de 0,6 Å en cada dimensión, dando como resultado un total de 5403 = 1,57464 × 108 puntos de cuadrícula. Entonces, en total obtuvimos 1.57464 × 1014 energías de interacción para calcular \({\mu }_{{{{{{\rm{ex}}}}}}}\) en cada concentración de proteína.
a La dependencia de la concentración del exceso de potencial químico γB a −2 °C. Los círculos con barras de error son los mismos datos sin procesar que se muestran en la Fig. 2b; los signos más muestran los resultados después de modelar la función de distribución acumulativa en la región de baja energía de interacción (consulte la figura complementaria 5a, b para obtener una ilustración); la curva se ajusta a un polinomio de quinto orden. b El potencial químico total, después de agregar la parte ideal. La línea horizontal biseca el potencial químico total con áreas iguales arriba y abajo; la primera y la última intersección definen el binodal mientras que los extremos definen el espinodal. c Binodal y espinodal de γB determinados mediante cálculos FMAPμ, mostrados como círculos rellenos y abiertos, respectivamente. Las flechas verticales continuas conectan la primera y la última intersección en (b) con las concentraciones binodales a −2 °C; las flechas verticales discontinuas conectan los extremos del potencial químico total con las concentraciones espinodales a -2 °C. El binodal y el espinodal experimentales (de la ref. 37 con la corrección de concentración de la ref. 19) se muestran como cuadrados rellenos y abiertos. d Instantáneas de γB de simulaciones de BD en concentraciones espinodales (123 y 400 mg/ml). Para mayor claridad, solo se muestran copias de proteínas en una losa que abarca un cuarto de la longitud del lado a lo largo de z (dirigida a la página). e Los resultados de γB del panel (a) que se muestran aquí nuevamente en comparación con las contrapartes de γF. f Comparación de los binodales de γB y γF determinados mediante cálculos FMAPμ. Recuadro: binodales experimentales de la ref. 19.
En la Fig. 2b, c, mostramos los resultados \({\mu }_{{{{{\rm{ex}}}}}}}\) para γB y γF en el rango de concentración antes mencionado y a temperaturas de −2 °C a 50 °C. Vale la pena señalar varias características a bajas temperaturas. Primero, las interacciones atractivas dominan el promedio de Boltzmann de la ecuación. [3], y por lo tanto \({\mu }_{{{{{{\rm{ex}}}}}}}\) es negativo. En segundo lugar y lo más interesante, γF \({\mu }_{{{{{\rm{ex}}}}}}}\) es más negativo que γB \({\mu }_{{{{{{ \rm{ex}}}}}}}\). Por ejemplo, en \(T\) = −2 °C y \(\rho\) = 400 mg/ml, \(\beta {\mu }_{{{{{{\rm{ex}}}} }}}\) es −2,3 ± 0,1 para γB pero disminuye a −3,0 ± 0,2 para γF. La diferencia en \({\mu }_{{{{{\rm{ex}}}}}}}\) refleja interacciones atractivas más fuertes en la solución γF y se traduce en una Tc más alta. Entonces, los resultados sin procesar de \({\mu }_{{{{{\rm{ex}}}}}}}\) ya capturan la diferencia clave entre γB y γF en el equilibrio de fases.
En tercer lugar, \({\mu }_{{{{{\rm{ex}}}}}}\) inicialmente disminuye al aumentar la concentración, porque cada vez más moléculas pueden participar en interacciones atractivas. Por ejemplo, para γB en \(T\) = −2 °C, \(\beta {\mu }_{{{{{\rm{ex}}}}}}}\) disminuye de −1,27 ± 0,02 a 123 mg/ml a −2,3 ± 0,1 a 400 mg/ml. Sin embargo, con un mayor aumento en la concentración, \({\mu }_{{{{{\rm{ex}}}}}}}\) comienza a girar, a medida que las moléculas experimentan repulsión estérica. Por último, a las temperaturas más bajas, los valores de \({\mu }_{{{{{\rm{ex}}}}}}}\) pueden sufrir grandes incertidumbres, como lo ilustra el \({\beta \mu }_{{{{{{\rm{ex}}}}}}}\) valor −4,7 (+2,6/−0,7) de γB a −2 °C y 277 mg/ml. Las incertidumbres numéricas surgen de la dificultad general de muestrear la región de menor energía de cualquier sistema molecular (por ejemplo, ref. 4).
A medida que aumenta la temperatura, las interacciones estéricas se vuelven importantes incluso a concentraciones de proteína más bajas, elevando así toda la curva \({\mu }_{{{{{\rm{ex}}}}}}}\). En T = 50 °C, \({\mu }_{{{{{\rm{ex}}}}}}}\) es positivo incluso en la concentración más baja de 31 mg/ml para γB y primero se vuelve positivo a 184 mg/ml para γF. En esta situación, cierta para todas las temperaturas por encima de Tc, ninguna fase densa puede lograr la misma estabilidad que una posible fase diluida y, por lo tanto, no es posible la separación de fases. En el límite de T → ∞, sólo el término estérico sobrevive en el promedio de Boltzmann de la ecuación. [3]; el exceso de potencial químico resultante, \({\mu }_{{{{{{\rm{ex}}}}}}}^{{{{{\rm{st}}}}}}}\) , está relacionado con la fracción, \({f}_{{{{{{\rm{CF}}}}}}}\), de colocaciones de proteínas de prueba que están libres de choques estéricos con las moléculas de proteínas en la solución. . Esta relación viene dada por la ecuación. [9] en Métodos computacionales. La fracción libre de choques se puede obtener con precisión a cualquier temperatura. Como se muestra en la figura complementaria 4, los resultados \({f}_{{{{{{\rm{CF}}}}}}}\) de γB y γF están muy cerca uno del otro y, en niveles altos concentraciones, son órdenes de magnitud más altas que la contraparte obtenida al reemplazar partículas de Lennard-Jones con moléculas γB, como hicimos en 201629. Las simulaciones de BD aquí, con una función de energía atomística, capturan la capacidad de las moléculas de proteínas para formar grupos intrincados estabilizado por interacciones preferenciales, dejando más huecos para colocar la proteína de prueba. El \({f}_{{{{{{{\rm{CF}}}}}}}\) excesivamente bajo, junto con un muestreo limitado en \({{{{{\boldsymbol{\Omega }}}} }}\), en nuestro estudio de 2016 es responsable del binodal estrecho obtenido allí.
Desarrollamos un procedimiento para mitigar las incertidumbres numéricas de \({\mu }_{{{{{{\rm{ex}}}}}}}\) manifestadas a bajas temperaturas. Este procedimiento se basa en la observación de que la función de distribución acumulativa (CDF) de la energía de interacción \(U\left({{{{{\bf{X}}}}}},{{{{{\boldsymbol{\ Omega }}}}}},{{{{\bf{R}}}}}}\right)\) es exponencial en más de 10 órdenes de magnitud, cubriendo casi todo el rango negativo de \(U\) ( Figura complementaria 5a, b). El procedimiento implica ajustar el logaritmo del CDF a una función lineal de \(U\) en una región intermedia de \(U\) (Figuras complementarias 5a, b) y luego extrapolar a una energía mínima \({U}_ {{{\min }}}\) (Figuras complementarias 5a, b y 636). Como se ilustra en la Fig. 3a, el \({\mu }_{{{{{\rm{ex}}}}}}}\ corregido), al modelar la CDF en la región de baja energía de interacción, ahora es libre de las grandes variaciones del \({\mu }_{{{{{{\rm{ex}}}}}}}\).
Luego sumamos la parte ideal a la \({\mu }_{{{{{\rm{ex}}}}}}\) corregida y realizamos una construcción de áreas iguales29,32 (Fig. 3b) para obtener las concentraciones en las fases diluida y densa coexistentes. Al conectar las concentraciones coexistentes de diferentes temperaturas, obtenemos el binodal (Fig. 3c). La construcción de áreas iguales también produce el espinodal, que define un rango de concentraciones en las que el sistema es termodinámicamente inestable. Como se muestra en la Fig. 3c, el binodal y el espinodal calculados para γB coinciden bien con las contrapartes experimentales de la ref. 37. El cálculo arroja una temperatura crítica de aproximadamente 4 °C para γB.
A T = −2 °C, las concentraciones espinodales calculadas para γB son 123 mg/ml en el extremo inferior y 400 mg/ml en el extremo superior. En la Fig. 3d, mostramos una porción de una configuración de la solución γB en estas concentraciones. Ambos ilustran los intrincados grupos señalados anteriormente, que a su vez se estabilizan mediante interacciones preferenciales. A mayor concentración, el número promedio de socios de interacción por molécula es mayor, lo que lleva a un \({\mu }_{{{{{\rm{ex}}}}}}\) más negativo como se presentó anteriormente. .
En la Fig. 3e, comparamos el \({\mu }_{{{{{{\rm{ex}}}}}}}\) original y corregido para γF a −2 °C, junto con los resultados correspondientes. para γB que ya se han mostrado en la Fig. 3a. Nuevamente, \({\mu }_{{{{{\rm{ex}}}}}}}\) es más negativo para γF que para γB. Finalmente, en la Fig. 3f, presentamos el binodal calculado para γF, que exhibe una Tc más alta, ~ 10 ° C, en relación con la contraparte de γB. Se predicen aumentos similares en Tc de γB a γF cuando se aplican otros valores aceptables de los factores de escala \({s}_{1}\) y \({s}_{2}\) en la función de energía (Ec. [4]) (Nota complementaria 1 y Fig. 7 complementaria). Aunque se mueve en la dirección correcta en relación con el γB Tc, el γF Tc previsto subestima significativamente el valor experimental de ~39 °C19.
Mientras que el exceso de potencial químico \({\mu }_{{{{{{\rm{ex}}}}}}}\) está determinado por las interacciones entre todas las moléculas de proteína en una solución, el segundo coeficiente virial \ ({B}_{2}\) está determinada por la interacción entre un par de moléculas de proteínas. Cuando \({\mu }_{{{{{\rm{ex}}}}}}\) se expande como una serie de Taylor en \(\rho\) (consulte la ecuación [19] en Métodos computacionales ), el coeficiente de primer orden es el doble de \({B}_{2}\). \({B}_{2}\) puede ser un indicador de la temperatura crítica31. Un \({B}_{2}\) más negativo corresponde a un Tc más alto.
Hemos adaptado el enfoque basado en FFT para derivar FMAPB2 como un método muy sólido para calcular segundos coeficientes viriales30. Los valores \({B}_{2}\) resultantes de γB y γF en un amplio rango de temperaturas se muestran como curvas sólidas en la Fig. 4a. Está claro que γF tiene un \({B}_{2}\) más negativo, por lo que apoya un Tc más alto. Los valores de \({B}_{2}\) calculados para γB coinciden bien con los datos experimentales de la ref. 38 (recuadro de la Fig. 4a).
a Dependencias de temperatura de B2 para γB, γF, γBS130W y γFW130S. B2 se expresa en unidades del volumen estérico (Vst) de la proteína respectiva; Vst = 0,53 × 10-4 mol ml/g3 para γB y tiene valores muy similares para todas las γ-cristalinas. Para γB y γF, los círculos provienen del coeficiente de primer orden del ajuste polinómico (Fig. 3a, e); Las curvas sólidas con colores coincidentes se calculan utilizando FMAPB230 (barras de error a 25 °C mediante el método de bloqueo). Los resultados de γFW130S y γBS130W se muestran como curvas discontinuas. Se traza una línea horizontal con una intersección de −6 de acuerdo con una regla empírica para determinar la temperatura crítica31. Recuadro: comparación de B2 experimental y calculado para γB. Los símbolos etiquetados como SLS son datos B2 obtenidos mediante dispersión de luz estática en tampón fosfato 52,4 mM (pH 7,1)38; una curva con una banda muestra los resultados de FMAPB2 con la fuerza iónica correspondiente (0,18 ± 0,01 M). b Binodales calculados para γFW130S y γBS130W (curvas discontinuas), en comparación con los de γB y γF (círculos conectados). El binodal de γFW130S usó configuraciones γB y el de γBS130W usó configuraciones γF.
Vliegenthart y Lekkerkerker31 encontraron una regla empírica, \({B}_{2}({T}_{{{{{{\rm{c}}}}}}})/{V}_{{{{{ {\rm{st}}}}}}}\approx -6\), para partículas esféricas con un núcleo estérico y un borde atractivo, donde \({V}_{{{{{{\rm{st}}} }}}}\) denota el volumen del núcleo estérico. Podemos usar la versión estérica de \({B}_{2}\), \({B}_{2}^{{{{{{\rm{st}}}}}}}\), obtenida cuando solo se mantiene el término estérico en la función de energía de interacción, para definir el volumen estérico: \({V}_{{{{{{\rm{st}}}}}}}\equiv {B}_{2 }^{{{{{{\rm{st}}}}}}}/4\). Las temperaturas críticas predichas por la regla de Vliegenthart-Lekkerkerker son 0 °C para γB y 6 °C para γF, lo que da como resultado la misma brecha en Tc determinada a partir de los binodales (Fig. 3f). Los coeficientes viriales determinados por FMAPB2 también son cercanos a aquellos, mostrados como círculos, derivados del coeficiente de primer orden de una expansión de Taylor truncada de \({\mu }_{{{{{{\rm{ex}}}} }}}\) (Ec. [19]).
Para identificar las sustituciones de γB a γF responsables del aumento de Tc, descompusimos las energías de interacción del par de moléculas γB o γF. Esta descomposición se ha utilizado anteriormente para revelar residuos importantes para la separación de fases39. En la Fig. 5, mostramos las diferencias entre los residuos correspondientes de γF y γB en sus contribuciones a las respectivas energías de interacción del par. Las seis posiciones que hacen las mayores contribuciones a la energía de interacción del par inferior de γF son, en orden descendente: 128, 130, 84, 79, 127 y 21. Las diferencias en las contribuciones energéticas en todas estas posiciones están más allá del límite establecido en media – 3 × DE. γB y γF tienen los mismos aminoácidos en cinco de estas posiciones: Asp21, Arg79, His84, Leu127 y Glu128. La única posición que implica un cambio de aminoácidos es la 130, de Ser en γB a Trp en γF. Por lo tanto, la descomposición revela que la sustitución S130W es la causa principal del fortalecimiento de las interacciones intermoleculares, lo que lleva a una mayor Tc de γF.
Las barras negras muestran las diferencias entre γF y γB en las energías de interacción descompuestas específicas de residuos; La función de distribución de las diferencias energéticas se muestra junto a la ordenada izquierda. La curva roja muestra las distancias residuales de Grantham; su función de distribución se muestra junto a la ordenada derecha. Las líneas horizontales punteadas indican ± 3 veces las desviaciones estándar de la media, tanto para las diferencias energéticas específicas de los residuos como para las distancias residuales de Grantham. El recuadro muestra el logotipo de secuencia para los residuos 127 a 133, calculado utilizando la alineación de secuencia de la Fig. 1 complementaria. Tenga en cuenta que el residuo Gln83 de γB se alinea con un espacio en γF (ver Fig. 1). La contribución energética de la posición 83 de γF se tomó como 0 y la diferencia calculada restando la contraparte de γB se muestra como una barra gris. La distancia residual de Grantham en esta posición se tomó como 0.
Para verificar el papel de la sustitución S130W, modelamos la mutación W a S en γF y la mutación inversa en γB, y calculamos sus efectos. Como se muestra en la Fig. 4a, el mutante γFW130S imita en gran medida a γB en \({B}_{2}\), con solo una ligera subestimación de su magnitud a bajas temperaturas. La mutación γBS130W recupera parcialmente el gran negativo \({B}_{2}\) de γF. Se aplican descripciones similares a los efectos de las dos mutaciones sobre las energías de interacción de pares descompuestos específicos de residuos. Como se muestra en la Fig. 8a complementaria, las diferencias de γF – γFW130S en la contribución específica de residuos son similares a las de las contrapartes de γF – γB (Fig. 5). En particular, en Asp21 y Glu128 junto con la posición 130, las diferencias γF – γFW130S exceden el límite medio: 3 × SD. Por otro lado, el mutante γBS130W no recupera del todo la energía de interacción de par de γF; solo la diferencia γBS130W – γB en la contribución específica del residuo en la posición 130 excede la media: 3 × límite de DE (Figura complementaria 8b).
Como prueba definitiva del papel de la sustitución S130W, determinamos los binodales de los mutantes γFW130S y γBS130W (Fig. 4b). El binodal del mutante γFW130S es cercano al de γB, mientras que el binodal del mutante γBS130W se acerca al de γF.
Para proporcionar más información sobre la sustitución de S130W, analizamos las poses con las energías de interacción de pares más bajas de los cálculos de FMAPB2. Etiquetamos a un miembro del par como copia central y al otro como proteína de prueba. Las poses de los pares de baja energía se muestran en la Fig. 6a para γB y 6b para γF. La copia central se representa en un dibujo animado o en una superficie y la proteína de prueba se representa mediante un punto en su centro geométrico, uno para cada pose de baja energía. Definimos un marco molecular, con el eje z paralelo a su interfaz entre dominios y el eje y apuntando desde el dominio C-terminal al dominio N-terminal. La vista en la Fig. 6a, b es hacia el eje x negativo de la copia central. En las películas complementarias 1 y 2 se presenta una vista de 360° de las figuras 6a y b.
a Distribución de configuraciones de energía de interacción más baja para γB. Arriba a la izquierda: 1000 configuraciones de energía de interacción más baja, mostradas con la copia central en representación de dibujos animados y la proteína de prueba como un punto ubicado en su centro de geometría. Los puntos están coloreados según la escala de interacción-energía del recuadro. Arriba a la derecha: representación en clúster de las 1000 configuraciones. En la estructura del miembro de menor energía de cada grupo grande, la cadena lateral Ser130 se muestra en representación esférica. Abajo a la derecha: igual que el panel superior derecho excepto que el tamaño del grupo umbral se reduce a 2. Abajo a la izquierda: igual que el panel superior izquierdo excepto que el criterio de selección fue un límite superior de -6 kcal/mol para la energía de interacción. La copia central se representa como una superficie, mientras que los puntos en los centros de la proteína de prueba se muestran con un plano de recorte cercano a 15 Å del centro de la copia central. b Distribución de las configuraciones de energía de interacción más baja para γF, presentada de la misma manera que en (a).
En los paneles superiores izquierdos de las figuras 6a, b, mostramos las 1000 poses de menor energía. Tanto para γB como para γF, la proteína de prueba tiende a concentrarse en posiciones frente al residuo 130 de la copia central, pero esta tendencia es más fuerte para γF. Agrupamos las 1000 poses y presentamos los grupos grandes (≥20 miembros) en los paneles superiores derechos de la Fig. 6a, b. Cada grupo está representado por una esfera y una flecha. La esfera tiene un radio proporcional al tamaño del cúmulo y está centrada en la posición con la energía más baja en ese cúmulo; la flecha está a lo largo del eje z del marco molecular de la proteína de prueba en la última postura. Tanto γB como γF tienen siete grandes grupos. Para γB, seis de los siete grupos están alrededor del residuo 130 y el séptimo grupo está en la parte posterior de la copia central; En conjunto, los siete grupos representan el 30% de las 1000 posturas de baja energía. Para γF, los siete grupos están alrededor del residuo 130 y recogen el 47% de las 1000 poses de menor energía, lo que indica una preferencia mucho más fuerte por que el residuo 130 sea un sitio de interacción.
También mostramos los representantes del grupo por sus estructuras moleculares en los paneles superiores derechos de la Fig. 6a, b. Como se ilustra con más detalle en la figura complementaria 9a, las dos moléculas γF asociadas prefieren una orientación relativa paralela, pero los pares γB prefieren una orientación perpendicular. Además, mientras que los pares γF tienen una fuerte tendencia a formar interfaces que entierran los residuos de Trp130 en ambas moléculas asociadas, γB Ser130 puede estar dentro o fuera de las interfaces de los pares de baja energía.
Trp tiene la cadena lateral más voluminosa y posee potencial para interacciones hidrofóbicas, catión-π, amido-π, π-π y de enlace de hidrógeno. Las funciones de las interacciones catión-π mediadas por Trp en la estabilidad del plegamiento de proteínas estructuradas y la estabilidad de la unión de los desplazados internos están bien reconocidas40,41. Por el contrario, Ser tiene sólo una cadena lateral polar corta, con una interacción limitada a los enlaces de hidrógeno. En las estructuras de cristalina γ, el residuo 130 se encuentra al pie de la hendidura entre dominios (Fig. 1b). En las interfaces que entierran los residuos de Trp130 en ambos socios, Trp130 en un socio puede interactuar con los residuos de la superficie alrededor de Trp130 del otro socio, incluidos Asp21, Arg79, Leu127 y Glu128 (Figura complementaria 9b). Por el contrario, para γB, Ser130 tiene una capacidad limitada para formar estas interacciones incluso cuando está enterrado en una interfaz; en cambio, otras interacciones, como entre Arg153 en un socio y Glu150 del otro socio, estabilizan la interfaz (Figura complementaria 9c).
Las diferencias estructurales anteriores entre γB y γF en sus respectivos pares ahora pueden explicar las diferencias energéticas en la Fig. 5. Los pares γF forman interfaces donde ambos residuos de Trp130 están enterrados; Las interacciones entre Trp130 en un lado y Asp21, Arg79, His84, Leu127 y Glu128 en el lado opuesto dan como resultado valores de energía negativos en estos residuos. Los pares γB pueden formar interfaces alternativas, lo que explica los valores de energía positivos en Arg153 y Asp156.
Si bien las interfaces en los representantes de los grandes clusters son energéticamente favorables, es importante señalar que γB o γF pueden formar muchas otras interfaces binarias. Se presenta una imagen más completa cuando se incluyen todos los grupos con al menos dos miembros (paneles inferiores derechos de la Fig. 6a, b). Las poses comienzan a poblar el resto de la superficie de la copia central. Se alcanza una imagen aún más completa cuando se incluyen todas las posturas con energías de pares inferiores a -6 kcal/mol (paneles inferiores izquierdos de la Fig. 6a, b). Para γF, aunque Trp130 es un sitio de interacción preferido, muchos otros sitios también pueden participar en interacciones intermoleculares, lo que permite la formación de grupos más allá de un dímero en una solución concentrada y, por lo tanto, conduce a la separación de fases. Este escenario se ilustra bien utilizando la distancia Trp130-Trp130 entre dos moléculas γF vecinas. La distribución de las distancias Trp130-Trp130 en pares de baja energía, ponderada por la función de Mayer, muestra un pico alto alrededor de 10 Å (Figura complementaria 9d), lo que refleja la interfaz Trp130-Trp130 mencionada anteriormente. Las distancias Trp130-Trp130 en los grupos γF formados en la fase densa (capturados por simulaciones BD) todavía muestran un pico alrededor de 10 Å (Figura complementaria 9e), lo que indica que las interfaces Trp130-Trp130 también se forman para estabilizar los grupos. Sin embargo, más allá de este pico, las distancias Trp130-Trp130 exhiben una distribución amplia, lo que indica la participación de otras interfaces. En comparación, las interfaces Ser130-Ser130 tienen una tendencia reducida a formarse en pares γB de baja energía (Figura complementaria 9d) y desempeñan un papel reducido en grupos γB (Figura complementaria 9e).
Calculamos la distancia de Grantham42 entre el grupo de Tc bajo (γA, γB, γC y γD) y el grupo de Tc alto (γE y γF) en cada posición a lo largo de la alineación de secuencia en la Figura complementaria 1a. La distancia de Grantham mide la diferencia fisicoquímica entre las cadenas laterales de dos aminoácidos. Su cuadrado es una suma ponderada de diferencias al cuadrado en tres propiedades: composición de grupo, polaridad y volumen molecular. La distancia residual de Grantham, definida como la diferencia entre las distancias entre grupos e intragrupo, se muestra como una curva roja en la Fig. 5. Los valores exceden el límite de la media +3 × DE en tres posiciones: 22, 111 y 130.
En la figura complementaria 1b, comparamos específicamente los aminoácidos de las 15 γ-cristalinas en cada una de estas tres posiciones. En la posición 22, el grupo de Tc baja contiene tres aminoácidos únicos: Asn, Cys e His, mientras que el grupo de Tc alta contiene solo His. Por lo tanto, los dos grupos comparten el aminoácido His en la posición 22. Una situación similar ocurre en la posición 111, donde los dos grupos comparten el aminoácido Ser. Sólo en la posición 130, los dos grupos no comparten ningún aminoácido: el grupo de baja Tc contiene Cys y Ser, mientras que el grupo de alta Tc contiene Trp y Tyr, ambos aromáticos. El análisis que utiliza la distancia de Grantham señala así que las sustituciones en la posición 130 implican la mayor diferencia fisicoquímica entre los grupos de Tc bajo y alto, desde una cadena lateral corta hasta una cadena lateral aromática. El logotipo de secuencia alrededor de la posición 130 se muestra como un recuadro en la Fig. 5, que ilustra la divergencia en la posición 130 y el consenso en las posiciones vecinas.
Las diferencias energéticas presentadas anteriormente entre γB y γF no solo no se limitan a las estructuras del Banco de datos de proteínas (PDB) elegidas para los cálculos, sino que también se extienden a otras cristalinas γ de baja y alta Tc. Ampliamos los cálculos de FMAPB2 a otras 13 estructuras de PDB (Fig. 7). Juntas, las 15 estructuras cubren seis cristalinas γ diferentes; Diez de estas estructuras están en el grupo de baja Tc y las cinco restantes están en el grupo de alta Tc. Los valores \({B}_{2}/{V}_{{{{{\rm{st}}}}}}}\) son −1,3 ± 0,5 (media ± DE) para la Tc baja. grupo y −2,1 ± 0,3 para el grupo de Tc alto. El grupo con Tc alto tiene una media \({B}_{2}\) muy significativamente más baja (valor de P = 0,002 en la prueba t no apareada), consistente con una Tc mucho más alta.
Las etiquetas son los nombres de las entradas del PDB, y la quinta letra indica la cadena; Las entradas de Tc baja y alta se muestran en regiones sombreadas en verde y azul, respectivamente. Las barras de error están determinadas por el método de bloqueo. "Humano" y "bovino" se abrevian como Hum y Bov, respectivamente. En el extremo derecho se muestran los diagramas de caja para los 10 B2 con Tc bajo y los 5 B2 con Tc alto.
Con base en extensos análisis secuenciales, estructurales y energéticos, hemos identificado una sustitución de Ser por Trp en la posición 130 como la causa principal de la diferencia en Tc entre γB y γF. Esta identificación finalmente proporciona una solución a la pregunta planteada por primera vez por Siezen et al. 14 hace casi 40 años. En términos más generales, nuestro estudio demuestra que ahora es posible explicar cuantitativamente las contribuciones de los residuos individuales a la energía de la separación de fases de las proteínas estructuradas. Dicha caracterización cuantitativa nos permite no solo comprender cómo la secuencia determina el equilibrio de fases sino también diseñar secuencias con la temperatura crítica alterada en la dirección deseada.
Trp (o Tyr) como aminoácido que promueve la separación de fases ha sido bien reconocido para los desplazados internos5,7,10. Aquí mostramos que una sustitución de Ser por Trp tiene un papel importante en el aumento de la Tc de una proteína estructurada. En los desplazados internos, un Trp puede aprovechar su flexibilidad para formar una variedad de interacciones intermoleculares que incluyen enlaces hidrófobos, catión-π, amido-π, π-π y de hidrógeno. En las proteínas estructuradas, el mismo potencial de interacciones intermoleculares está abierto para un Trp cuando consideramos el hecho de que la fase densa se estabiliza mediante una asociación intermolecular no específica que puede ocurrir de innumerables maneras.
Mientras que el efecto de una mutación de S a W podría depender del contexto para las personas desplazadas internamente, puede serlo mucho más en una proteína estructurada. Por ejemplo, se espera que una mutación de S a W en un sitio enterrado (suponiendo que la estructura de la proteína permanezca estable) tenga poco efecto en la separación de fases porque el residuo no participa en interacciones intermoleculares. Además, no todas las mutaciones de S a W expuestas son iguales. Una mutación de S a W en un sitio donde es poco probable que se formen pares de baja energía puede tener sólo un efecto modesto, pero una mutación de S a W en un sitio de unión preferencial, como al pie del interdominio Es probable que la hendidura de las cristalinas γ (Fig. 6) promueva la separación de fases. La mutación S130P de la γD humana abolió la agregación inducida por calor43, posiblemente al promover dímeros que ocultan los sitios del residuo 130 en ambos monómeros y así evitar una mayor agregación. Concluimos que la contribución significativa de la sustitución S130W a γF Tc se deriva no solo de las diferencias fisicoquímicas entre los dos aminoácidos sino también de la ubicación estratégica del residuo 130 en la superficie de la proteína.
Si bien tanto los desplazados internos como las proteínas estructuradas pueden sufrir una separación de fases, se ha reconocido que los desplazados internos lo hacen más fácilmente que las proteínas estructuradas12. En esencia, la flexibilidad de los desplazados internos les facilita la formación de interacciones intermoleculares que estabilicen la fase densa. Por el contrario, las proteínas estructuradas requieren altas concentraciones para que una determinada molécula de proteína interactúe con un número suficiente de moléculas asociadas para estabilizar la fase densa. Como resultado, la concentración en fase densa de una proteína estructurada es mucho mayor que la de una IDP típica, lo que corresponde a un binodal mucho más amplio. Una indicación de esta diferencia de concentración son las viscosidades de fase densa mucho más altas de las proteínas estructuradas o multidominio en relación con las IDP44. Para γB y γF, las concentraciones en fase densa son de 400 a 500 mg/ml, o alrededor de 20 mM19. El modelado atomístico presentado aquí captura bien las innumerables formas en que las proteínas pueden formar interacciones intermoleculares en la fase densa y, por lo tanto, pueden recapitular los binodales amplios.
Al explotar el poder de la FFT, nuestro enfoque ha superado el desafío que presenta la gran cantidad de cálculos necesarios para determinar el binodal de una proteína atomística. Aún así, el enfoque tiene un importante margen de mejora, incluida la precisión de la función energética de interacción y el tratamiento de la flexibilidad de las proteínas. Es muy probable que estas limitaciones expliquen la subestimación actual de la brecha Tc entre γF y γB. Los binodales son sensibles a las funciones energéticas y, por tanto, tienen un gran potencial para su parametrización. Por ejemplo, nuestra función energética actual puede subestimar la distinción entre Arg y Lys. Una sustitución de Lys por Arg en la posición 163 podría contribuir al alto Tc de γF15,19; De hecho, se ha descubierto que tales sustituciones en las cristalinas γ de austromerluza antártica tienen un efecto significativo sobre el Tc45. Nuestro cálculo preliminar utilizando la función de energía de todos los átomos de Rosetta46, que se usa ampliamente en el acoplamiento y el diseño de proteínas y es más sofisticada que nuestra función de energía, muestra una brecha más amplia entre γF y γB en las energías de interacción binaria (Nota complementaria 1 y Fig. 10 complementaria). ). En cuanto a la flexibilidad de las proteínas, un importante paso adelante puede ser el reempaquetado de las cadenas laterales en respuesta al acercamiento de otras moléculas de proteínas. Nuestro estudio preliminar, al utilizar RosettaDock47 para llevar a cabo el reempaquetado de la cadena lateral, muestra de hecho una ampliación adicional de la brecha de energía entre γF y γB (Nota complementaria 1 y Figura complementaria 10). Alternativamente, el uso de una biblioteca preseleccionada de estructuras de proteínas en simulaciones48 y para cálculos de potencial químico también parece una dirección prometedora. Como prueba inicial de esta idea, calculamos el valor de \({B}_{2}\) promediando múltiples estructuras del PDB para una cristalina γ determinada (Nota complementaria 1 y Figura complementaria 11). Estos valores promedio de \({B}_{2}\) muestran la brecha esperada entre los grupos de Tc bajo y alto, ahora con un nivel de confianza más alto ya que se basa en estructuras múltiples.
Las estructuras de las γ-cristalinas eran de las entradas de PDB 1AMM para γB49 bovino y 1A45 para γF15 bovino. Se usó PDB2PQR50 para agregar hidrógenos y asignar cargas ÁMBAR, con estados de protonación asignados de acuerdo con PROPKA51 a pH 7. La carga neta es 0 para γB y +1 para γF. Además, se descargaron otras 13 estructuras de rayos X de cristalina γ de alta resolución (2,3 Å o mejor) del PDB y se procesaron de manera similar (consulte la Fig. 7 para los nombres del PDB). La mutación S130W de γB se modeló injertando la cadena lateral de Trp130 en γF después del alineamiento de la estructura utilizando todos los átomos de la cadena principal. La cadena lateral Trp130 recién introducida chocó con la cadena lateral Arg147 cercana, por lo que estas dos cadenas laterales se refinaron mediante la minimización de energía de descenso más pronunciado en UCSF Chimera52. La mutación W130S de γF se modeló de manera similar. Cuatro de las cinco estructuras γD humanas (distintas de 1HK0) contenían mutaciones simples o dobles; cada una de las cadenas laterales mutadas se revirtió a la cadena lateral de tipo salvaje, injertando la cadena lateral correspondiente en 1HK0 (después de la alineación de la estructura usando átomos de la cadena principal del residuo en cuestión más dos residuos vecinos en cualquier dirección) y luego minimización de energía. A menos que se indique lo contrario, la fuerza iónica fue de 0,24 M, modelando un tampón de fosfato 100 mM a pH 7,1 en estudios experimentales de separación de fases de γ-cristalina19.
Se utilizó el paquete de simulación de asociación difusional (SDA, versión 7.2.2) 35 para generar configuraciones de proteínas en múltiples concentraciones. La caja de simulación era un cubo con una longitud de lado de 324 Å; Se impusieron condiciones de contorno periódicas. El número (N) de proteínas dentro de la caja era de 30 o un múltiplo superior, hasta 450, cubriendo un rango de concentración de 31 a 461 mg/ml. Para las configuraciones iniciales, las moléculas de proteína se orientaron aleatoriamente y se colocaron en las posiciones de las partículas de Lennard-Jones de simulaciones anteriores29. Las cargas efectivas derivadas de la resolución de la ecuación de Poisson-Boltzmann (con la superficie de van der Waals como límite dieléctrico) utilizando APBS53 se utilizaron para el cálculo de la energía de solvatación electrostática54. La temperatura era de 300 K. La energía de interacción entre las moléculas de proteínas consiste en la interacción de Coulomb, la solvatación electrostática, la solvatación hidrofóbica y la repulsión del núcleo blando. Se utilizaron valores de parámetros predeterminados excepto para el último término, para el cual redujimos el factor de escala cuatro veces (de 0,0156 a 0,0039). El último valor permitió una buena coincidencia con FMAPB2 en funciones de correlación de pares (Figura complementaria 3).
Después de un equilibrio de 1 μs, se recolectaron instantáneas a intervalos de 10 ns durante los siguientes 20 μs, con un total de 2000 instantáneas. Dependiendo del número de proteína N, las simulaciones de BD tardaron entre 5 y 330 h en 16 núcleos en dos CPU Intel(R) Xeon(R) E5-2650 de 2,6 GHz.
La función de energía de interacción se especifica mediante las ecuaciones. [4] a [7]. Se impuso un límite de 12 Å para calcular las interacciones entre dos átomos. Para una configuración dada \({{{{\bf{X}}}}}}\) de la solución de proteína y una orientación dada \({{{{{\boldsymbol{\Omega }}}}}}\ ) de la proteína de prueba, la energía de interacción \(U\left({{{{{\bf{X}}}}}},\,{{{{{\boldsymbol{\Omega }}}}}}{ {{{{\boldsymbol{,}}}}}}\,{{{{\bf{R}}}}}}\right)\) al colocar la posición \({{{{{\bf{ R}}}}}}\) de la proteína de prueba en cualquiera de los 5403 = 1,57464 × 108 puntos en una cuadrícula cúbica se calculó utilizando FMAP29,32,34. Para cada concentración de proteína, el cálculo se repitió 2000 × 500 = 106 veces, combinando 2000 configuraciones de proteínas con 500 orientaciones de la proteína de prueba. Estos cálculos tomaron aproximadamente 3500 h por concentración de proteína en 16 núcleos en dos CPU Intel(R) Xeon(R) E5-2650 de 2,6 GHz. El exceso de potencial químico se determina finalmente según la ecuación. [3].
Para un \({{{{{\bf{X}}}}}}\) dado y un \({{{{{\boldsymbol{\Omega }}}}}}\ dado), FMAP devuelve el número de puntos de la cuadrícula donde la proteína de prueba experimenta choque estérico y las energías de interacción en todos los puntos de la cuadrícula libres de choque. Los últimos puntos de la cuadrícula constituyen la fracción libre de conflictos, \({f}_{{{{{{\rm{CF}}}}}}}\). El valor de \({f}_{{{{{{\rm{CF}}}}}}}\) es muy estable con respecto al cambio en \({{{{{{\bf{X}} }}}}\) o \({{{{{\boldsymbol{\Omega }}}}}}\)55\({{{{{\rm{;}}}}}}\) por lo tanto podemos trate \({f}_{{{{{\rm{CF}}}}}}\) como una constante y agrupe las energías de interacción sin choques de las 106 combinaciones de \({{{{{\ bf{X}}}}}}\) y \({{{{{\boldsymbol{\Omega }}}}}}\), lo que lleva a
donde \({M}_{{{{{\rm{CF}}}}}}}\) es el número total de energías de interacción sin choques. El valor máximo posible de \({M}_{{{{{{\rm{CF}}}}}}\) es 1,57464 × 1014. Nos referimos a esta formulación del exceso de potencial químico como “suma bruta ”. En el límite hipotético de T → ∞, podemos establecer \(\beta\) en 0 en el lado derecho de la ecuación. [8] y obtener
Se necesitan resultados para \({\mu }_{{{{{\rm{ex}}}}}}}\) en un rango de temperaturas para determinar el binodal. En lugar de repetir los cálculos de FMAPμ anteriores a diferentes temperaturas, calculamos las energías de interacción una vez a 298 K y luego simplemente cambiamos \(\beta\) al realizar la suma de los factores de Boltzmann (ecuación [8]). Este atajo supone que la función de energía de interacción es independiente de la temperatura y que se pueden usar las mismas configuraciones de BD para cálculos de FMAPμ a diferentes temperaturas.
No guardamos las energías de interacción individuales, que podrían ser de hasta 1,6 × 1014 en número total, sino que las agrupamos en un histograma en contenedores muy finos (ancho \(\Delta\) a 0,016 kcal/mol). Guardamos todas las configuraciones con energías de interacción inferiores a −8 kcal/mol para su posterior análisis. La suma bruta en la ecuación. [8] ahora se puede expresar como
donde \(H(U)\) es el número de energías de interacción en el contenedor centrado en \(U\); y \({U}_{{{\min }}}\) y \({U}_{{{\max }}}\), respectivamente, son las energías de interacción mínima y máxima. Tenga en cuenta que el factor de Boltzmann \({e}^{-\beta U}\) es una función decreciente de \(U\) mientras que se espera que \(H(U)\) sea una función creciente de \(U\) ) a medida que \(U\) aumenta desde \({U}_{{{\min }}}\). Dependiendo de si la tasa de decadencia es menor o mayor que la tasa de crecimiento, el producto, \(H(U){e}^{-\beta U}\), es una función creciente o decreciente de \(U \). La velocidad de descomposición de \({e}^{-\beta U}\) depende de la temperatura. Para altas temperaturas, \(H(U){e}^{-\beta U}\) es una función creciente de \(U\); por lo tanto, sus valores en \(U\) cerca de \({U}_{{{\min }}}\) contribuyen poco a la suma en la ecuación. [10] y la inexactitud en \(H(U)\) cerca de \({U}_{{{\min }}}\) no causa errores numéricos graves en \({\mu }_{{{{ {{\rm{ex}}}}}}}\). Sin embargo, a bajas temperaturas, \(H(U){e}^{-\beta U}\) es una función decreciente de \(U\); entonces esta inexactitud en \(H(U)\) puede resultar en incertidumbres significativas en \({\mu }_{{{{{{\rm{ex}}}}}}}\), como lo ilustra el resultado para γB a 277 mg / ml y -2 ° C (Fig. 2b).
No sólo guardamos las energías totales de interacción sino también los términos separados (es decir, atracción no polar y electrostática) en forma de histograma. Estos datos nos permitieron producir rápidamente potenciales químicos y otros resultados cuando cambiamos los valores de los factores de escala \({s}_{1}\) y \({s}_{2}\).
Para mitigar las incertidumbres antes mencionadas en \({\mu }_{{{{{\rm{ex}}}}}}}\), modelamos \(H(U)\) en la región de baja energía de interacción. Observamos que la función de distribución acumulativa (CDF) (no normalizada)
tiene una dependencia exponencial de la energía de interacción (p. ej., Fig. complementaria 5a, b)
durante más de 10 órdenes de magnitud, cubriendo casi todo el rango negativo de \(U\). Los valores de \(\alpha\) oscilan entre 2,1 y 1,5 (disminuyendo al aumentar la concentración de proteína), comparable al valor, 1,7, de \(\beta\) a 298 K. En consecuencia, la función de histograma tiene la forma
Un cambio variable
convierte \(H\left(U\right)\) en una distribución de ley de potencia:
dónde
es el límite superior de \(x\) en la distribución de la ley de potencia.
En lugar de usar una distribución de ley de potencia exacta en \(x\), ajustamos el logaritmo del CDF a una función lineal de \(U\) usando el programa de regresión lineal local loess en el paquete R (http://cran. r-project.org/; con grado = 1 para regresión lineal y intervalo = 0,75 como fracción de puntos de datos para ajuste ponderado localmente). El ajuste se limitó a una porción de la CDF limitada por abajo por CDF = 104 y por arriba por \(U\) = −4 kcal/mol (Figuras complementarias 5a, b). Luego, la función de ajuste se extrapoló a \(U={U}_{\min }\). La determinación de \({U}_{\min }\) se describe a continuación.
Una posible estimación de \({U}_{\min }\) es la energía de interacción más baja observada, pero dicha estimación está sujeta a importantes incertidumbres estadísticas. Recientemente se desarrolló un método más robusto para estimar el límite superior \(b\) (igual al factor de Boltzmann de \({U}_{\min }\)) en una distribución de ley potencial36. En este método, se calcula el valor medio del \(x\) más grande observado entre muestras replicadas de un tamaño determinado y luego se ajusta la dependencia del valor medio más grande del tamaño de la muestra a una función.
Para aplicar este método, dividimos la lista completa de energías de interacción sin choques en bloques, cada uno de los cuales se generó a partir de un número fijo (\({M}_{{{{{{\rm{ori}}}}} }}\)) de orientaciones de proteínas de prueba. Cada bloque es una muestra replicada. El tamaño del bloque \({M}_{{{{{{\rm{ori}}}}}}}\) es efectivamente una medida del tamaño de la muestra; el número de energías de interacción para una única orientación de proteína de prueba es en realidad de hasta 2000 × 1,57464 × 108 = 3,1 × 1011. El número total de orientaciones en nuestros cálculos fue 500 (denotado como \({M}_{{{{{ {\rm{tot}}}}}}}\)); \({M}_{{{{{\rm{ori}}}}}}}\) podría ser cualquier factor de \({M}_{{{{{{{\rm{tot}}}} }}}\), incluyendo 1, 2, 4, 5, 10, 20, 25, 50, 100, 125, 250, 500. El número de bloques, o muestras replicadas, fue entonces \({M}_{{ {{{{\rm{rep}}}}}}}={M}_{{{{{{\rm{tot}}}}}}}/{M}_{{{{{{\rm {o yo}}}}}}}\). Para cada bloque se encontró la energía de interacción más baja; Luego se evaluó el promedio de las energías de interacción más bajas específicas del bloque para obtener la energía de interacción más baja media, \({\widehat{U}}_{\min }\), para un tamaño de bloque dado \({M}_{ {{{{{\rm{ori}}}}}}}\). La dependencia de \({\widehat{U}}_{\min }\) de \({M}_{{{{{{\rm{ori}}}}}}}\) finalmente se ajustó a
donde \({U}_{\min }\), \(D\), \(E\) y \(\delta\) son parámetros de ajuste, con \(\delta\) restringido a [0.6. 1]36. Para reducir las variaciones en los valores de ajuste de \({U}_{\min }\), ajustamos simultáneamente los datos de \({\widehat{U}}_{\min }\) de una proteína en diferentes concentraciones a la ecuación . [17] y trató \(D\) como un parámetro global. El ajuste se realizó llamando a la función de mínimos cuadrados en scipy (https://scipy.org/), con el algoritmo reflectante de la región de confianza como método de minimización. Además de obtener \({\widehat{U}}_{\min }\) de la salida de FMAP, también tomamos las 50 configuraciones con las energías de interacción FMAP más bajas de cada orientación de proteína de prueba y recalculamos las energías de interacción exactas mediante un método basado en átomos56, produciendo así un segundo conjunto de resultados \({\widehat{U}}_{\min }\). El ajuste a la ecuación. [17] se ilustra en la figura complementaria 6. Los valores \({U}_{\min }\) resultantes se presentan en la figura complementaria 5c, d, donde se puede ver que los métodos FMAP y basados en átomos dieron muy resultados similares.
Para suavizar aún más \({U}_{\min }\) en función de la concentración de proteína, asumimos que el punto final de la extrapolación de CDF tiene la siguiente dependencia de la fracción libre de choques en la concentración de proteína dada:
Con el coeficiente \(B\) elegido como 1 y el exponente \(\gamma\) elegido como 0,25, la ecuación. [18] modela de cerca los resultados \({U}_{\min }\) obtenidos según la ecuación. [17], como se muestra en la figura complementaria 5c, d. Así que finalmente usamos la Ec. [18] para determinar los valores de \({U}_{\min }\) para finalizar la extrapolación CDF. El \({\mu }_{{{{{\rm{ex}}}}}}\) resultante es ahora una función suave de la concentración de proteína (p. ej., Fig. 3a), libre de grandes variaciones causadas por una sola energía de interacción baja y periférica. Estos valores atípicos pueden identificarse mediante una desviación grande (>1,0 kcal/mol) de la \(U\) esperada cuando la función de ajuste para la CDF se extrapola a CDF = 1 (recuadro de la figura complementaria 5b). Los valores de \({U}_{\min }\) obtenidos según la ecuación. [17] en los casos con tales valores atípicos se muestran como símbolos abiertos en la figura complementaria 5c.
En resumen, aplicamos regresión lineal local a una parte de la CDF (por encima de CDF = 104) y luego extrapolamos hasta el límite inferior dado por la ecuación. [18]. Al calcular \({\mu }_{{{{{\rm{ex}}}}}}}\), la CDF extrapolada se usó entre el límite inferior y la CDF = 104, pero la CDF original se usó arriba FCD = 104.
Una vez que se calcula \({\mu }_{{{{{\rm{ex}}}}}}\) como se describió anteriormente para un rango de concentraciones de proteínas a una temperatura determinada, lo ajustamos a una quinta parte. polinomio de orden29:
Este ajuste facilita la determinación del binodal y del espinodal. La ecuación [19] es una expansión de Taylor truncada; en una expansión completa (relacionada con la expansión virial de la presión osmótica), el coeficiente de primer orden, \({b}_{1}\), es el doble del segundo coeficiente virial \({B}_{2}\ ). Sumar la parte ideal (ecuaciones [1] y [2]) produce el potencial químico completo \(\mu\).
Por debajo de la temperatura crítica, la dependencia de \(\mu\) respecto de \(\rho\) contiene una parte no monótona (conocida como bucle de van der Waals) para sistemas de tamaño finito como las soluciones de proteínas modeladas aquí (ver Fig. 3b). Una línea horizontal que biseca el bucle de van der Waals con áreas iguales debajo y arriba (construcción de áreas iguales) produce las concentraciones de la proteína en dos fases coexistentes. Es decir, las intersecciones interior y exterior definen las concentraciones en las fases diluida y densa, respectivamente. Al conectar las concentraciones de coexistencia a una serie de temperaturas, se obtiene el binodal. Además, las concentraciones en los dos extremos del bucle de van der Waals definen los límites de un rango de concentración en el que el sistema es termodinámicamente inestable. Al conectar las concentraciones extremas a una serie de temperaturas, se obtiene el espinodal.
Se encuentran más detalles sobre el ajuste polinomial y la construcción de áreas iguales en la ref. 32. Un servidor web que implementa estos pasos se encuentra en https://zhougroup-uic.github.io/LLPS/.
El segundo coeficiente virial \({B}_{2}\) está determinado por la energía de interacción entre un par de moléculas de proteína. Sea \({U}_{1}\left({{{{\bf{R}}}}}},{{{{{\boldsymbol{\Omega }}}}}}\right)\) sea la energía de interacción del par, entonces30
donde \(V\) es el volumen en el que se realiza el promedio sobre \({{{{{\bf{R}}}}}}\) y \(f\left({{{{{\ bf{R}}}}}},{{{{{\boldsymbol{\Omega }}}}}}\right)\) es la función de Mayer:
Calculamos \({B}_{2}\) también mediante un método basado en FFT llamado FMAPB230. La configuración de FMAPB2 es idéntica a la de FMAPμ, pero ahora el cuadro periódico contiene una sola molécula, es decir, la copia central. La función de energía de interacción (ver ecuaciones [4] a [7]) y otros detalles de FMAPB2 son los mismos que se describen anteriormente para los cálculos de FMAPμ, con las siguientes excepciones. La longitud lateral de la caja periódica era ~200 Å. Las orientaciones de las proteínas de prueba se generaron a partir de 68.760 matrices de rotación que muestrean de manera uniforme y determinista todo el espacio de orientación, con un ángulo de 6° entre matrices de rotación sucesivas57. La gran cantidad de orientaciones de las proteínas de prueba hace que los resultados de \({B}_{2}\) sean muy sólidos (con una diferencia del 3% en γB \({B}_{2}\) a 25 °C cuando la prueba -El espacio de orientación de proteínas se muestreó a intervalos de 4°, involucrando 232,020 matrices de rotación). Además del histograma de energías de interacción de pares, se guardaron configuraciones con energías de interacción inferiores a -6 kcal/mol para análisis posteriores.
Analizamos más a fondo las interacciones intermoleculares de pares de las 1000 configuraciones de menor energía utilizando el método basado en átomos. Específicamente, la energía de interacción del par se descompuso en las contribuciones de los residuos individuales de la proteína de prueba que interactúan con la copia central completa. Debido a que la proteína de prueba y la copia central son las mismas moléculas, también llevamos a cabo la descomposición de manera opuesta, es decir, con la copia central descompuesta en residuos individuales y la proteína de prueba tratada como un todo. Para un residuo determinado, los resultados se promediaron primero entre las 1.000 configuraciones de menor energía y luego sobre estas dos formas de descomposición.
Agrupamos las 1000 configuraciones de menor energía utilizando el ligando-RMSD como medida de distancia. Ligando-RMSD es la desviación cuadrática media entre dos poses de la proteína de prueba después de la superposición en la copia central. Utilizamos un límite de ligando-RMSD de 10 Å para definir grupos. En cada grupo, todos los miembros tienen RMSD de ligando ≤ el límite de un miembro.
Usamos RosettaDock47 (Rosetta versión 3.13; https://www.rosettacommons.org/) en las 1000 poses de menor energía de los cálculos de FMAPB2 para γB y γF. Primero queríamos ver cómo la función de energía de todos los átomos de Rosetta46 puede separar γF de γB en energía de interacción de pares. Para este propósito, aplicamos una única ronda de minimización de energía (opción -dock_min) y guardamos las energías de interacción del par resultante.
Luego quisimos ver cómo el reempaquetado de la cadena lateral puede afectar las energías de interacción del par. Para este propósito, llevamos a cabo un refinamiento de las poses de energía minimizada evitando la traslación y la rotación (magnitudes de movimiento establecidas en 0) pero permitiendo el reempaquetado de la cadena lateral (opción -use_input_sc y opciones -ex1 y -ex2aro, recomendadas por Rosetta). Se aplicaron hasta diez intentos de reempaquetado de cadena lateral para obtener una energía de interacción negativa. Si las energías de interacción fueron positivas en los diez intentos, se guardó el valor del último intento.
Como otra opción para modelar la flexibilidad de las proteínas en los cálculos de \({B}_{2}\), permitimos que la copia central y la proteína de prueba tuvieran en cada muestra una biblioteca preseleccionada de n estructuras, lo que resultó en n × n pares de estructuras. Para cada par, se realizó un cálculo utilizando FMAPB2339, que es igual que FMAPB230 excepto que a la copia central y a la proteína de prueba se les permitió adoptar estructuras diferentes. El promedio final \({B}_{2}\) se tomó como la media aritmética de los resultados de n × n FMAPB23. Para cada γ-cristalina particular (p. ej., γE de rata), la biblioteca constaba de todas las estructuras de rayos X de alta resolución en el PDB; todas las estructuras procesadas contenían los residuos 1 a 174 (numeración γB bovina) y la misma secuencia.
Hay 12 secuencias en el grupo de Tc baja y 3 secuencias en el grupo de Tc alta (Figura complementaria 1a); correspondientemente, hay 66 distancias de Grantham en el grupo de Tc baja, 3 de esas distancias en el grupo de Tc alta y 36 de esas distancias entre los dos grupos, en cada posición a lo largo de la secuencia. Primero calculamos los valores medios de las distancias intra o intergrupo, luego restamos la mayor de las dos distancias medias intragrupo de la distancia media entre grupos, obteniendo la distancia residual de Grantham entre grupos. Gln83 de γB se alinea con un espacio en 11 de las 15 secuencias; Establecemos la distancia residual de Grantham en esta posición en 0.
Más información sobre el diseño de la investigación está disponible en el Resumen del informe de Nature Portfolio vinculado a este artículo.
Todos los datos generados o analizados durante este estudio se incluyen en este artículo publicado (y sus archivos de datos complementarios). Los datos fuente de todos los gráficos presentados en las figuras están depositados en GitHub en https://github.com/hzhou43/g-crystallins.
Los procedimientos de análisis de datos se describieron en Métodos computacionales. Los códigos de muestra para calcular los potenciales químicos mediante FMAP se encuentran depositados en https://github.com/hzhou43/MiMB_simulations/tree/main/FMAP. Un servidor web para generar binodales a partir de potenciales químicos se encuentra en https://zhougroup-uic.github.io/LLPS/.
Cho, WK y cols. Los grupos de mediador y ARN polimerasa II se asocian en condensados dependientes de la transcripción. Ciencia 361, 412–415 (2018).
Artículo CAS PubMed PubMed Central Google Scholar
Kroschwald, S. y col. Los diferentes estados materiales de los condensados pub1 definen distintos modos de adaptación y recuperación del estrés. Representante celular 23, 3327–3339 (2018).
Artículo CAS PubMed Google Scholar
Alberti, S. y Dormann, D. Separación de fases líquido-líquido en enfermedades. Año. Rev. Genet. 53, 171-194 (2019).
Artículo CAS PubMed Google Scholar
Dignon, GL, Zheng, W., Best, RB, Kim, YC y Mittal, J. Relación entre las propiedades de una sola molécula y el comportamiento de fase de proteínas intrínsecamente desordenadas. Proc. Acad. Nacional. Ciencia. Estados Unidos 115, 9929–9934 (2018).
Artículo CAS PubMed PubMed Central Google Scholar
Wang, J. y col. Una gramática molecular que gobierna las fuerzas impulsoras para la separación de fases de proteínas de unión a ARN similares a priones. Celda 174, 688–699 e616 (2018).
Artículo CAS PubMed PubMed Central Google Scholar
Das, S., Lin, Y.-H., Vernon, RM, Forman-Kay, JD y Chan, HS Funciones comparativas de la carga, π y las interacciones hidrófobas en la separación de fases dependiente de la secuencia de proteínas intrínsecamente desordenadas. Proc. Acad. Nacional. Ciencia. Estados Unidos 117, 28795–28805 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Martín, EW y cols. La valencia y el patrón de los residuos aromáticos determinan el comportamiento de fase de los dominios similares a priones. Ciencia 367, 694–699 (2020).
Artículo CAS PubMed PubMed Central Google Scholar
Tesei, G., Schulze, TK, Crehuet, R. y Lindorff-Larsen, K. Modelo preciso del comportamiento de la fase líquido-líquido de proteínas intrínsecamente desordenadas a partir de la optimización de las propiedades de una sola cadena. Proc. Acad. Nacional. Ciencia. Estados Unidos 118, e2111696118 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
José, JA et al. Modelo de grano grueso basado en la física para la separación de fases biomoleculares con una precisión casi cuantitativa. Nat. Computadora. Ciencia. 1, 732–743 (2021).
Artículo PubMed PubMed Central Google Scholar
Bremer, A. y col. Descifrar cómo las características de secuencia que ocurren naturalmente impactan los comportamientos de fase de dominios similares a priones desordenados. Nat. Química. 14, 196–207 (2022).
Artículo CAS PubMed Google Scholar
Ruff, KM y cols. Gramática de secuencia subyacente al desarrollo y separación de fases de proteínas globulares. Mol. Celda 82, 3193–3208.e3198 (2022).
Artículo CAS PubMed Google Scholar
Zhou, HX, Nguemaha, V., Mazarakos, K. y Qin, S. ¿Por qué las proteínas estructuradas y desordenadas se comportan de manera diferente en la separación de fases? Tendencias Bioquímica. Ciencia. 43, 499–516 (2018).
Artículo CAS PubMed PubMed Central Google Scholar
Tanaka, T., Ishimoto, C. y Chylack, LT Jr. Separación de fases de una mezcla de proteína y agua en cataratas frías en el cristalino de ratas jóvenes. Ciencia 197, 1010-1012 (1977).
Artículo CAS PubMed Google Scholar
Siezen, RJ, Fisch, MR, Slingsby, C. & Benedek, GB Opacificación de soluciones de cristalinas gamma de lentes de ternero en relación con la formación de cataratas frías. Proc. Acad. Nacional. Ciencia. Estados Unidos 82, 1701-1705 (1985).
Artículo CAS PubMed PubMed Central Google Scholar
Norledge, BV, Hay, RE, Bateman, OA, Slingsby, C. & Driessen, HP Hacia una comprensión molecular de la separación de fases en la lente: una comparación de las estructuras de rayos X de dos cristalinas gamma con alto contenido de Tc, gammaE y gammaF , con dos gammacristalinas de bajo Tc, gamma B y gamma D. Exp. Res. ocular. 65, 609–630 (1997).
Artículo CAS PubMed Google Scholar
den Dunnen, JT, Moormann, RJM, Lubsen, NH y Schoenmakers, JGG Evolución concertada y divergente dentro de la familia de genes de γ-cristalina de rata. J. Mol. Biol. 189, 37–46 (1986).
Artículo de Google Scholar
Meakin, SO, Du, RP, Tsui, L.-C. & Breitman, ML γ-Cristalinas del cristalino del ojo humano: análisis de expresión de cinco miembros de la familia de genes. Mol. Biol celular. 7, 2671–2679 (1987).
CAS PubMed PubMed Central Google Académico
Siezen, RJ, Wu, E., Kaplan, ED, Thomson, JA y Benedek, GB Cristalinas gamma de lentes de rata. Caracterización de los seis productos genéticos y su distribución espacial y temporal resultante de la síntesis diferencial. J. Mol. Biol. 199, 475–490 (1988).
Artículo CAS PubMed Google Scholar
Broide, ML, Berland, CR, Pande, J., Ogun, OO y Benedek, GB Separación de fases líquidas binarias de soluciones de proteínas de lentes. Proc. Acad. Nacional. Ciencia. EE.UU. 88, 5660–5664 (1991).
Artículo CAS PubMed PubMed Central Google Scholar
Wang, Y., Lomakin, A., McManus, JJ, Ogun, O. y Benedek, GB. Comportamiento de fase de mezclas de proteínas del cristalino humano gamma D y Beta B1. Proc. Acad. Nacional. Ciencia. EE.UU. 107, 13282–13287 (2010).
Artículo CAS PubMed PubMed Central Google Scholar
Lo, WK Visualización de gotas de cristalina asociadas con la formación de cataratas frías en lentes de ratas jóvenes intactas. Proc. Acad. Nacional. Ciencia. Estados Unidos 86, 9926–9930 (1989).
Artículo CAS PubMed PubMed Central Google Scholar
Pandé, A. et al. Base molecular de una catarata hereditaria progresiva de aparición juvenil. Proc. Acad. Nacional. Ciencia. Estados Unidos 97, 1993–1998 (2000).
Artículo CAS PubMed PubMed Central Google Scholar
Banerjee, PR, Pande, A., Patrosz, J., Thurston, GM y Pande, J. El mutante E107A asociado a cataratas de la gammaD-cristalina humana muestra una mayor atracción por la alfa-cristalina y una mayor dispersión de la luz. Proc. Acad. Nacional. Ciencia. Estados Unidos 108, 574–579 (2011).
Artículo CAS PubMed Google Scholar
White, HE, Driessen, HP, Slingsby, C., Moss, DS y Lindley, PF Interacciones de empaquetamiento en el cristalino del ojo. Análisis estructural, simetría interna e interacciones reticulares de gamma IVa-cristalina bovina. J. Mol. Biol. 207, 217–235 (1989).
Artículo CAS PubMed Google Scholar
Cinar, S., Cinar, H., Chan, HS & Winter, R. Separación de fases líquido-líquido sensible a la presión y modulada por osmolitos de gammacristalinas del cristalino del ojo. Mermelada. Química. Soc. 141, 7347–7354 (2019).
Artículo CAS PubMed Google Scholar
Augusteyn, RC, Chandrasekher, G., Ghiggino, KP y Vassett, P. Sondeo de los microambientes de los residuos de triptófano en las cristalinas monoméricas del cristalino bovino. Biochim. Biofísica. Acta 1205, 89–96 (1994).
Artículo CAS PubMed Google Scholar
Dorsaz, N., Thurston, GM, Stradner, A., Schurtenberger, P. y Foffi, G. Separación de fases en mezclas de proteínas de lentes binarios. Materia blanda 7, 1763-1776 (2011).
Artículo CAS Google Scholar
Kastelic, M., Kalyuzhnyi, YV, Hribar-Lee, B., Dill, KA y Vlachy, V. Agregación de proteínas en soluciones salinas. Proc. Acad. Nacional. Ciencia. EE.UU. 112, 6766–6770 (2015).
Artículo CAS PubMed PubMed Central Google Scholar
Qin, S. & Zhou, HX Método rápido para calcular potenciales químicos y equilibrios de fases líquido-líquido de soluciones macromoleculares. J. Física. Química. B 120, 8164–8174 (2016).
Artículo CAS PubMed PubMed Central Google Scholar
Qin, S. y Zhou, HX Cálculo de segundos coeficientes viriales de proteínas atomísticas mediante transformada rápida de Fourier. J. Física. Química. B 123, 8203–8215 (2019).
Artículo CAS PubMed PubMed Central Google Scholar
Vliegenthart, GA & Lekkerkerker, HNW Predicción del punto crítico gas-líquido a partir del segundo coeficiente virial. J. química. Física. 112, 5364–5369 (2000).
Artículo CAS Google Scholar
Mazarakos, K., Qin, S. y Zhou, HX Cálculo binodal y tensión interfacial de condensados separados por fases a partir de simulaciones moleculares con correcciones de tamaño finito. Métodos Mol. Biol. 2563, 1–35 (2023).
Artículo PubMed Google Scholar
Widom, B. Algunos temas de la teoría de los fluidos. J. química. Física. 39, 2808–2812 (1963).
Artículo CAS Google Scholar
Qin, S. y Zhou, HX Mayor desarrollo del método basado en FFT para el modelado atomístico del plegamiento y unión de proteínas en situaciones de hacinamiento: optimización de la precisión y la velocidad. J. química. Computación teórica. 10, 2824–2835 (2014).
Artículo CAS PubMed PubMed Central Google Scholar
Martínez, M. et al. SDA 7: Una implementación modular y paralela de la simulación de software de asociación difusional. J. Computación. Química. 36, 1631-1645 (2015).
Artículo CAS PubMed PubMed Central Google Scholar
Zhou, HX Ley de potencia en un rango acotado: estimación de los límites superior e inferior a partir de datos de muestra. J. química. Física. 158, 191103 (2023).
Artículo CAS PubMed PubMed Central Google Scholar
Thomson, JA, Schurtenberger, P., Thurston, GM y Benedek, GB Separación de fases líquidas binarias y fenómenos críticos en una solución de proteína/agua. Proc. Acad. Nacional. Ciencia. Estados Unidos 84, 7079–7083 (1987).
Artículo CAS PubMed PubMed Central Google Scholar
Bucciarelli, S. y col. Ley ampliada de los estados correspondientes aplicada al efecto de los isótopos del disolvente sobre una proteína globular. J. Física. Química. Letón. 7, 1610-1615 (2016).
Artículo CAS PubMed Google Scholar
Ahn, SH et al. Caracterización de las subunidades de la proteína quinasa A (PKA) como reguladores macromoleculares de la separación de fases líquido-líquido PKA RIalpha. J. química. Física. 154, 221101 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Gallivan, JP & Dougherty, DA Interacciones catión-π en biología estructural. Proc. Acad. Nacional. Ciencia. Estados Unidos 96, 9459–9464 (1999).
Artículo CAS PubMed PubMed Central Google Scholar
Song, J., Ng, SC, Tompa, P., Lee, KAW y Chan, HS Las interacciones policatión-π son una fuerza impulsora para el reconocimiento molecular por parte de una familia de oncoproteínas intrínsecamente desordenada. Computación PLoS. Biol. 9, e1003239 (2013).
Artículo CAS PubMed PubMed Central Google Scholar
Grantham, R. Fórmula de diferencia de aminoácidos para ayudar a explicar la evolución de las proteínas. Ciencia 185, 862–864 (1974).
Artículo CAS PubMed Google Scholar
Serebryany, E. & King, JA Las cristalinas betagamma: estabilidad del estado nativo y vías de agregación. Prog. Biofísica. Mol. Biol. 115, 32–41 (2014).
Artículo CAS PubMed PubMed Central Google Scholar
Ghosh, A., Kota, D. y Zhou, HX La relajación por cizallamiento gobierna la dinámica de fusión de condensados biomoleculares. Nat. Comunitario. 12, 5995 (2021).
Artículo CAS PubMed PubMed Central Google Scholar
Bierma, JC et al. Control de la separación de fases líquido-líquido de proteínas cristalinas adaptadas al frío de la austromerluza antártica. J. Mol. Biol. 430, 5151–5168 (2018).
Artículo CAS PubMed Google Scholar
Alford, RF y cols. La función de energía de todos los átomos de Rosetta para el modelado y diseño macromolecular. J. química. Computación teórica. 13, 3031–3048 (2017).
Artículo CAS PubMed PubMed Central Google Scholar
Gray, JJ y cols. Acoplamiento proteína-proteína con optimización simultánea del desplazamiento del cuerpo rígido y las conformaciones de la cadena lateral. J. Mol. Biol. 331, 281–299 (2003).
Artículo CAS PubMed Google Scholar
Majumdar, BB y cols. Papel de la flexibilidad conformacional en simulaciones Monte Carlo de sistemas de muchas proteínas. J. química. Teoría de la computación 15, 1399-1408 (2019).
Artículo CAS PubMed Google Scholar
Kumaraswamy, VS, Lindley, PF, Slingsby, C. y Glover, ID Una estructura de proteína-agua del cristalino del ojo: 1.2 Una estructura de resolución de gammaB-cristalina a 150 K. Acta Crystallogr. D. Biol. Cristalogr. 52, 611–622 (1996).
Artículo CAS PubMed Google Scholar
Dolinsky, TJ, Nielsen, JE, McCammon, JA y Baker, NA PDB2PQR: una tubería automatizada para la configuración de cálculos electrostáticos de Poisson-Boltzmann. Ácidos nucleicos res. 32, W665–W667 (2004).
Artículo CAS PubMed PubMed Central Google Scholar
Olsson, MH, Sondergaard, CR, Rostkowski, M. & Jensen, JH PROPKA3: tratamiento consistente de residuos internos y superficiales en predicciones empíricas de pKa. J. química. Computación teórica. 7, 525–537 (2011).
Artículo CAS PubMed Google Scholar
Pettersen, EF y cols. UCSF Chimera: un sistema de visualización para investigación y análisis exploratorios. J. Computación. Química. 25, 1605-1612 (2004).
Artículo CAS PubMed Google Scholar
Baker, NA, Sept, D., Joseph, S., Holst, MJ y McCammon, JA Electrostática de nanosistemas: aplicación a microtúbulos y ribosomas. Proc. Acad. Nacional. Ciencia. Estados Unidos 98, 10037–10041 (2001).
Artículo CAS PubMed PubMed Central Google Scholar
Gabdoulline, RR & Wade, RC Cargas efectivas para macromoléculas en solvente. J. Física. Química. 100, 3868–3878 (1996).
Artículo CAS Google Scholar
Nguemaha, V., Qin, S. y Zhou, HX La transferencia de energías libres de proteínas de prueba a soluciones de proteínas abarrotadas depende simplemente de la concentración de aglomeración. Frente. Mol. Biosci. 6, 39 (2019).
Artículo CAS PubMed PubMed Central Google Scholar
Qin, S., Zhou, HX Un método basado en FFT para modelar el plegamiento y la unión de proteínas bajo hacinamiento: evaluación comparativa de crowders elipsoidales y de todos los átomos. J. química. Computación teórica. 9, 4633–4643 (2013).
Mitchell, JC Muestreo de grupos de rotación mediante imágenes ortogonales sucesivas. SIAM J. Ciencias. Computadora. 30, 525–547 (2008).
Artículo de Google Scholar
Thompson, JD, Gibson, TJ, Higgins, DG Alineación de secuencias múltiples utilizando ClustalW y ClustalX. actual. Protocolo. Bioinformática Capítulo 2, 2.3.1-2.3.22 (2003).
Flyvbjerg, H. & Petersen, HG Estimaciones de errores en promedios de datos correlacionados. J. química. Física. 91, 461–466 (1989).
Artículo CAS Google Scholar
Descargar referencias
Este trabajo fue apoyado por la subvención GM118091 de los Institutos Nacionales de Salud.
Departamento de Química, Universidad de Illinois Chicago, Chicago, IL, 60607, EE. UU.
Sanbo Qin y Huan-Xiang Zhou
Departamento de Física, Universidad de Illinois Chicago, Chicago, IL, 60607, EE. UU.
Huan-Xiang Zhou
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
SQ y HXZ diseñaron investigaciones, realizaron investigaciones, analizaron datos y escribieron manuscritos.
Correspondencia a Huan-Xiang Zhou.
Los autores declaran no tener conflictos de intereses.
Communications Biology agradece a Marina Guenza y a los demás revisores anónimos por su contribución a la revisión por pares de este trabajo. Editor principal: Gene Chong. Un archivo de revisión por pares está disponible.
Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Qin, S., Zhou, HX. El modelado atomístico del equilibrio de fases líquido-líquido explica la dependencia de la temperatura crítica de la secuencia de γ-cristalina. Común Biol 6, 886 (2023). https://doi.org/10.1038/s42003-023-05270-7
Descargar cita
Recibido: 02 de mayo de 2023
Aceptado: 22 de agosto de 2023
Publicado: 29 de agosto de 2023
DOI: https://doi.org/10.1038/s42003-023-05270-7
Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:
Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.
Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt
Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.