46
Label de Chimie Théorique Paris, 24 janvier 2017 1 Modélisations multi-échelle des processus biophysiques Sophie Sacquin-Mora (@sacquin_mo) Laboratoire de Biochimie Théorique-CNRS UPR 9080 Institut de Biologie Physico-Chimique, Paris

Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 1

Modélisations multi-échelle des processus biophysiques

Sophie Sacquin-Mora (@sacquin_mo) Laboratoire de Biochimie Théorique-CNRS UPR 9080

Institut de Biologie Physico-Chimique, Paris

Page 2: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 2

Plan du cours :

I. Introduction générale sur les modèles gros-grain

II. Propriétés mécaniques des protéines : 1. Le programme ProPHET

2. Résultats généraux (utilisation autonome de ProPHET)

3. Noyau mécanique dans les globines (utilisation couplée à des simulations tout-atome)

4. Réponse mécanique à une contrainte externe (utilisation couplée à des approches expérimentales

Page 3: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 3

Plan du cours :

I. Introduction générale sur les modèles gros-grain

II. Propriétés mécaniques des protéines : 1. Le programme ProPHET

2. Résultats généraux (utilisation autonome de ProPHET)

3. Noyau mécanique dans les globines (utilisation couplée à des simulations tout-atome)

4. Réponse mécanique à une contrainte externe (utilisation couplée à des approches expérimentales

Page 4: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 4

Introduction :

(Russel et al., Curr. Opin. Cell Biol, 2009)

Page 5: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Introduction : Une (très) brève histoire des représentations réduites

Label de Chimie Théorique Paris, 24 janvier 2017 5

Déjà 40 ans de modèles gros grains:

© 1975 Nature Publishing Group

(Levitt & Warshel, Nature, 1975)

J. Mol. Biol. (1976) 104, 59-107

A Simplified Representation of Protein Conformations for Rapid Simulation of Protein Folding

MICHAEL LEVITT

Weizmann Institute of Science, Rehovoth, Israel and

Medical Research Council Laboratory of Molecular Biology Hille Road, Cambridge, England-f

(Received 12 December 1975, and in revised form 19 February 1976)

This report is one of a series of papers that introduce and use a new and highly simplified treatment of protein conformations. The 6.rst paper (Levitt & Warshel, 1975) outlined the approach and showed how it could be used to simulate the “renaturation” of a small protein. The present paper describes the representation in some detail and tests the methods extensively under a variety of different conditions. The third paper (Warshel & Levitt, 1976) is devoted to a study of the folding pathway and stability of a mainly a-helical protein.

In this work, I show how the concept of time-averaged forces, introduced previously (Levitt & Warshel, 1975), can be used to simplify conformational energy calculations on globular proteins. A detailed description is given of the simplified molecular geometry, the parameterization of suitable force fields, the best energy minimization procedure, and the techniques for escaping from local minima. Extensive tests of the method on the native conformation of pancreatic trypsin inhibitor show that the simplifications work well in representing the stable native conformation of this globular protein. Further tests show that simulated folding of pancreatic trypsin inhibitor from open chain conformations gives com- pact calculated conformations that have many features in common with the actual native conformation. Folding simulations are done under a variety of conditions, and the relevance of such calculations to the actual in vitro folding process is discussed at some length. These same techniques have many potential applications including enzyme-substrate binding, changes in protein tertiary and quaternary structure, and protein-protein interactions.

1. Introduction Protein molecules fulfil almost all the catalytic and structural roles in the living cell ; they are both the machine tools and building blocks of the cell’s factories. Such functional and structural versatility is entirely due to the folding of different amino acid sequences into different three-dimensional conformations. In each of these folded conformations, the position of every atom is precise and depends uniquely on the particular amino acid sequence (Anfinsen et al., 1961; Anfinsen, 1973). This relationship between a protein’s sequence and its three-dimensional structure con- stitutes the second part of the translation of genetic information into functional

7 Present address.

(Levitt, J. Mol. Biol, 1976)

Page 6: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Introduction : Une (très) brève histoire des représentations réduites

Label de Chimie Théorique Paris, 24 janvier 2017 6

Déjà 40 ans de modèles gros grains:

Simulation du repliement de la BPTI (bovine pancreatic trypsin inhibitor), une petite protéine d’environ 60 résidus.

Le modèle gros-grain associe :

•Une représentation réduite (ici, 3 à 4 pseudo-atomes par acide aminé).

•Un champ de force (obtenu à partir de c a l c u l s t o u t a t o m e s o u d e d o n n é e s expérimentales)

(Levitt & Warshel, Nature, 1975)

© 1975 Nature Publishing Group

Page 7: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Introduction : Une (très) brève histoire des représentations réduites

Label de Chimie Théorique Paris, 24 janvier 2017 7

(Levitt & Warshel, Nature, 1975)

© 1975 Nature Publishing Group

Page 8: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Introduction : Une (très) brève histoire des représentations réduites

Label de Chimie Théorique Paris, 24 janvier 2017 8

Pourquoi des modèles gros-grain ? Parce que ça va plus vite...

• On réduit le nombre de degrés de liberté.

• Des potentiels à courte portée, moins couteux à calculer (ex : plus de PME pour l’électrostatique)

• Une surface d’énergie lissée ⇒ Dynamique plus rapide

• Des pas d’intégration plus grands (de 10 à 100 fs en fonction du degré de résolution)

• On a accès à des systèmes plus grands et des déplacements de plus grande ampleur (i. e. sur des temps plus longs).

! La dynamique n’est plus la même dans un système gros-grain !

Page 9: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 9

Intermède : une autre raison d’aimer les modèles réduits

xy

z

Page 10: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 10

xy

z

Intermède : une autre raison d’aimer les modèles réduits

Page 11: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 11

(E. Munch, Le Cri, 1893).

Intermède : une autre raison d’aimer les modèles réduits

Page 12: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 12

(Rader., Curr. Opin. Pharmacol, 2010)

Calmoduline (≈ 150 a.a.)

a) Modèle tout-atomes

(≈ 1100 atomes lourds)

b) Un grain par résidu

c) 12 noeuds

Lipide POPC

d) Modèle tout-atomes

e) Modèle MARTINI

f) Ellipsoide de Gay Berne

Introduction : Une (très) brève histoire des représentations réduites

Page 13: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 13

(Ingolfsson et al., WIREs Comput Mol Sci, 2014)

Advanced Review wires.wiley.com/wcms

a b

c d

e f

FIGURE 1 Mapping strategies for CG water models: (a) regularMartini water,17 (b) GROMOS CG water,18 (c) Martini compatiblepolarizable water (PW),19 (d) big multipole water (BMW),20 (e) ELBA21

induced point dipole water, and (f) Wat Four (WT4).22

on solute size and charges are explicitly screenedusing either Debye–Huckel theory or Generalized-Born models. Because of the emphasis on electro-statics, these methods have been popular in DNAmodels.27,28 Note that although most of the implicitsolvent models use an implicit representation for ions,some models combine implicit solvent with explicitions.29 Analogous to the screening of charges, someFFs scale the van der Waals (vdW) interactions usinga term based on solvent accessible surface area.30

Explicit ModelsAn excellent overview of explicit CG water models isgiven in recent reviews by Hadley and McCabe31 andDarre et al.32 Explicit water models can be dividedinto models that have been parameterized using eitherstructure or thermodynamics-based methods.

Structure-based models are constructed fromatomistic simulations of water using methods suchas IBI or FM (see Box 1). Several systematic studieslooking at the properties and transferability of thesewater models are available.33–35 As these methodsrely on atomistic simulation trajectories, they havetraditionally mapped one water molecule to one CGbead to avoid the challenging issue of grouping watermolecules. This 1:1 mapping has limited the speedupof these models but allowed quite accurate CG wa-

ter models to be conceived. The grouping issue hasrecently been circumvented by assembling togetherwater molecules in the atomistic trajectory using aK-means algorithm35 or the CUMULUS method.36

Thermodynamics-based models are parameter-ized by fitting to experimental solvent properties suchas density, water–air surface tension, diffusion rates,or solvation free energies. These models use analyticalpotentials, most commonly Morse, Lennard-Jones(LJ), or Mie ones, and apply different mappings(Figure 1). He et al.37 performed a systematic studyof the properties of different potentials. A popularexample of a thermodynamic-based water modelis the water model associated with the MartiniFF17 (Figure 1a). The model represents four watermolecules by a single CG bead (4:1 mapping) using ashifted LJ potential for the nonbonded interactions.It has been parameterized based on the density ofpure water and the solubility of water in apolarsolvents. An alternative water model compatiblewith the Martini FF uses a Morse potential forthe nonbonded interactions.38 The M3B model,39

developed in connection with carbohydrates, is basedon a 1:1 mapping and also uses a Morse potential. Itwas parameterized against the experimental density,intermolecular energy, and the diffusion coefficientof water. The thermodynamic-based water modelsused by Shelley et al.40 and later by Shinoda et al.41

use a 3:1 mapping and a 6–4 or 12–4 Mie potential,respectively. The first one was parameterized againstwater density, whereas the latter used density,compressibility, and air–water surface tension. Themonoatomic water (mW) model by Molinero et al.42

uses a nonbonded potential with two and three bodyterms mapping one water to one bead. This modelreproduces the tetrahedral organization of watermolecules in addition to a range of other propertiessuch as density and phase transition temperatures.

The lack of charges in these explicit watermodels prevents them from screening electrostatics.Charge–charge interactions are either ignored or im-plicit screening is used.42,43 For instance, the Martinimodel uses an implicit dielectric constant ε = 15.Ions, however, are typically included explicitly, andseveral of the CG water models have specific parame-ters available for ions.22,43,44 The models applying acoarser mapping (e.g., Martini and WT4—see below)represent an ion together with its first solvation shellin one bead.

Polarizable ModelsTo alleviate the lack of proper electrostatic screeningin the explicit water models discussed above, a num-ber of polarizable CG water models have recently

228 © 2013 John Wiley & Sons, Ltd. Volume 4, May/June 2014

Advanced Review wires.wiley.com/wcms

peptides as observed in atomistic MD simulationsand experimental data.

In the AWSEM (Associative memory, Water me-diated, Structure, and Energy Model) FF, developedby Papoian and coworkers,112 the position and ori-entation of each amino acid residue is dictated by thepositions of its Cα, Cβ, and O atoms. AWSEM com-bines a large number of physical interactions, fromBB terms to direct and water-mediated interactionsand H-bonding, with structural biases that are localin sequence, based on the alignments of fragmentsof nine residues or less of the target protein to thelocal segments found in a protein database. It hasbeen successfully used to predict protein structuresboth de novo and using homology models,112 as wellas dimeric protein interfaces.113 The dynamic prop-erties of the model have yet to be characterized indetail.

CG Nucleic Acid ModelsNucleic acids (DNA and RNA) seem more tractablefor modeling than proteins due to the smaller num-ber of building blocks involved. Nevertheless, perhapsbecause of scarcer structural data, tight packing, andhigher charge density, the development of CG nucleicacid models has progressed more slowly than withmany other biomolecules.

Despite the similarities between DNA and RNA,the challenges in modeling them differ greatly. DNAexists primarily as double-stranded structures (ds-DNA) with only a limited number of well-definedconformations but forms extremely large-scale as-semblies. For RNA, the challenge is to predict howthe single-stranded RNAs (ssRNAs) fold into theirfunctional form. These differences have led the CGmodels for DNA and RNA to use disparate strate-gies in order to reach their objectives. Most CG RNAmodels are aimed at predicting structures (see a re-cent review114) and use structure-based potentials.

Only a few CG RNA models can be used in MDsimulations,115,116 in contrast to the numerous DNACG models available—which span several orders ofmagnitude in the length scales they describe. Large-scale mechanical properties of DNA structures havebeen studied using very coarse models since the early90s.117,118 The development of more detailed CGmodels that are able to describe for example DNAmelting started later.119 We focus here on CG modelsthat are detailed enough to describe sequence speci-ficity. For an overview of coarser models, we refer thereader to previous reviews.120–122

3SPN Modelsde Pablo and coworkers27 proposed a CG model forDNA, coined 3SPN.0, where phosphate, sugar, andbase are described using one bead each (Figure 4a).Bonded interactions were derived from a canonicalstructure of B-DNA. Base stacking was implementedusing intrastrand Go-potentials that act between thefirst and second neighbors. H-bonds were modeledusing a potential that acts between complementarybases and an excluded volume term is used betweenall other beads. Electrostatics is described using aDebye–Huckel approximation. The authors did notethat these choices bias the model toward the B-formof DNA compared with other forms. The parame-ters were selected to reproduce experimental meltingcurves of DNA at a specific salt concentration, butthe model also performed rather well in other saltconcentrations as well as reproducing the persistencelength of dsDNA and ssDNA and bubble formation indsDNA. The authors measured roughly three ordersof magnitude speedup as compared with atomisticsimulations for short dsDNAs. The model has beenrefined (3SPN.1)123 to describe DNA hybridizationand to model ions explicitly.124–126 Very recently, the3SPN.2127 model that does not use Go-potentials forstacking was introduced.

a b c

FIGURE 4 Mapping strategies for CG nucleotide models illustrated for cytosine (top) and guanine (bottom) based on (a) 3SPN.0,27 (b)Ouldridge,25 and (c) Dans28 models.

234 © 2013 John Wiley & Sons, Ltd. Volume 4, May/June 2014

Introduction : Une (très) brève histoire des représentations réduites

Advanced Review wires.wiley.com/wcms

a

b

c

FIGURE 5 Mapping strategies for CG carbohydrate modelsillustrated for a single cellulose fibril. (a) The MB339 model is based onthe atomistic position of C1, C4, and C6 for every hexopyranose. (b)The Martini138 model relies on the COM of the atoms enclosed by thecircles. (c) The solvent-free model of Srinivas et al.26 makes use of asingle bead for the representation of every monosaccharide subunit.

robust reductive model for the simulation of carbohy-drates. The hexopyranose ring is represented by threeparticles (Figure 5a) and was directly mapped fromatomistic simulations, with bonded terms includingbond, angle, and dihedral potentials derived using anIBI approach. A single nonbonded term was used forall interactions and rigorously parameterized againstdensity, cohesive energy and structural unit cell pa-rameters. While the model was successfully applied tothe simulation of disaccharides (maltose) and longerpolysaccharides (amylose), the set of bonded param-eters is state specific and thus not transferable to al-ternative glycosidic links. Following the same, topo-logical descriptors, Liu et al.137 developed a reductivemodel for the simulation of carbohydrates, but usingnonbonded terms based on more versatile pretabu-lated potentials derived from atomistic simulations.This model can be combined with an explicit watermodel. So far, applications of the model have beenrestricted to the simulation of glucose and amylose.

The Martini ModelA more extendable and general approach is the onetaken by Lopez et al.138 based on the Martini CGFF. Each saccharide is mapped using three CG beadsin such a manner that the underlying polar–nonpolar

feature of the ring is preserved (Figure 5b). Follow-ing the philosophy of the Martini model,43 severalmonosaccharides and disaccharides were parameter-ized combining bottom-up and top-down approaches.Atomistic trajectories were used to iteratively adjustthe set of bond, angle, and dihedral potentials ofthe CG representation. Nonbonded terms were deter-mined to reproduce experimental partitioning data.While the parameters are straightforwardly applica-ble for the simulation of mono-, di-, and polysaccha-rides in the colloidal state, application to the crys-talline phase is rather problematic as was shown byWohlert and Berglund139 in the case of crystalline cel-lulose. A potential advantage of the Martini carbohy-drate model is its compatibility with the ample setof different biomolecules, illustrated recently by theparameterization of a Martini FF for glycolipids140

and application to cyclodextrin–cholesterol complexformation.141

Bellesia ModelRecently, Bellesia et al.142 developed a solvent-freeCG model for the interconversion between celluloseIβ to III. Based on a five-bead mapping of the ring,the model combines LJ terms with harmonic bondedpotentials aimed to reproduce the crystalline phase ofcellulose. The CG representation not only reproducesthe torsional angles between glucose planes, but alsothe transitional rotameric states of the hydroxymethylgroups thus effectively mimicking the changes in bothintracrystalline hydrogen bonds and stacking interac-tions during the transition from cellulose Iβ to cel-lulose III. The model has been shown to reproducestructural as well as thermomechanical properties ofcellulose.

Bathe ModelThe solvent-free model of Bathe et al.143 is aimed atmodeling chondroitin (glycan chains forming a majorcomponent of the extracellular matrix). This modelexplicitly describes the DOFs associated with thetorsional angle representing the glycosidic linkage.Each monosaccharide consists of three-bead sites,plus two additional beads at the centers of charge andgeometry, used to model the nonbonded electrostaticand steric interactions, respectively. All-atom reso-lution trajectories of isolated disaccharides are usedto generate pretabulated PMFs for the glycosidic tor-sions. Electrostatic interactions are included betweennonadjacent monosaccharides using a Debye–Huckelpotential, assuming zero ionic radius. Steric inter-actions between nonadjacent monosaccharides weremodeled using a LJ potential applied to the centerof geometry. The model was able to reproduce

236 © 2013 John Wiley & Sons, Ltd. Volume 4, May/June 2014

D’autres exemples de systèmes modélisés en gros-grain :

• Eau (solvant)

• Carbohydrates (fibres de cellulose)

• Acides nucléiques

Page 14: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 14

(Tozzini, Curr. Opin. Struct. Biol, 2005)Et maintenant on va là (Tirion, Phys. Rev. Lett., 1996)

Introduction : Une (très) brève histoire des représentations réduites

Page 15: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 15

Le modèle en réseau de ressorts• Dans son article fondateur de 1996, M. Tirion propose de donner une forme quadratique à l’énergie intramoléculaire d’un système protéique selon l’équations suivante :

• Ce modèle simplifié à l'extrême permet de reproduire les modes de vibration basse fréquence et des facteurs de température obtenus par cristallographie.

• Le Gaussian Network Model (GNM) est d’une grande robustesse, ce qui permet d’utiliser des représentations réduites à différentes échelles et permet de rendre compte de nombreux phénomènes protéiques : Dynamique fonctionnelle, structuration en domaines, changements conformationnels de grande amplitude…

Page 16: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 16

Le modèle en réseau de ressorts• Le modèle en réseau de ressorts est notamment employé pour accéder aux Modes Normaux des Protéines (NMA, Normal Modes Analysis).

• Les modes normaux de plus basse fréquence sont des mouvement de grande amplitude qui peuvent être reliés à l’activité biologique des protéines. (cf. Y-H. Sanejouand, HDR 2008, https://tel.archives-ouvertes.fr/tel-00258781/document)

• Ex : 1J8U, Phenylalanine Hydroxylase,

(via Webnm@, http://apps.cbu.uib.no/webnma/home)

Page 17: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 17

Le modèle en réseau de ressorts, NMA

(https://i12r-studfilesrv.informatik.tu-muenchen.de/wiki/index.php/Task_9:_Normal_Mode_Analysis)

Mode n°7

Mode n°8

Page 18: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 18

Le modèle de Zacharias• Ce modèle a été développé pour modéliser les interactions inter-protéiques dans le cadre de simulations d’amarrage protéine-protéine ou docking.

• Chaque acide aminé est représenté par 1 à 3 pseudo-atome en fonction de sa chaîne latérale. (Zacharias, Prot. Sci. 2003).

Représentation: Tout atome 1 pseudo-atome par résiduZacharias

• Les interactions entre pseudo-atomes (appartenant à deux protéines distinctes) suivent un potentiel simplifié de la forme :

Eij =Bij

rij8 −

Cij

rij6

⎝ ⎜ ⎜

⎠ ⎟ ⎟ +

qiq j

ε rij( )rij, with ε rij( ) =15rij

Page 19: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 19

Le modèle de Zacharias• Ce modèle CG est associé à un algorithme de minimisation multiple pour déterminer la structure des complexes protéiques :

Ligand

Recepteur

Page 20: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 20

Le modèle de Zacharias• Ce modèle CG est associé à un algorithme de minimisation multiple pour déterminer la structure des complexes protéiques :

Barnase/barstar : 0.69 Å

Page 21: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 21

Plan de l’exposé :

I. Introduction générale sur les modèles gros-grain

II. Propriétés mécaniques des protéines : 1. Le programme ProPHET

2. Résultats généraux (utilisation autonome de ProPHET)

3. Noyau mécanique dans les globines (utilisation couplée à des simulations tout-atome)

4. Réponse mécanique à une contrainte externe (utilisation couplée à des approches expérimentales

Page 22: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 22

Introduction :• Les seules données structurales sont insuffisantes pour comprendre le fonctionnement biologique des protéines :

Prendre en compte la mécanique et la dynamique locale

• Approches expérimentales : Facteurs de température (cristallographie), diffusion des neutrons (dynamique globale de la protéine), RMN (paramètres d’ordre) ⇒ Cas des résidus situés près du site actif : Mise en évidence de faibles facteurs de température (et donc d’une flexibilité réduite). • Approches théoriques : Simulations par Dynamique Moléculaire, étude des Modes Normaux

• Développement d’une approche permettant d’attribuer une constante de force à chaque résidu de la protéine.

Logiciel ProPHet (Probing Protein Heterogeneity)

(http://mobyle.rpbs.univ-paris-diderot.fr/cgi-bin/portal.py#forms::ProPHet)

Page 23: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 23

ProPHet : Représentation réduite des protéines:• Chaque acide aminé est représenté par 1 à 3 pseudo-atomes en fonction de sa chaîne latérale. (Zacharias, Prot. Sci. 2003).

• Les interactions entre pseudo-atomes sont représentées par un potentiel harmonique (avec rcut=9 Å et γ=0.6 kcal mol-1Å-2).

Représentation: Tout atome 1 pseudo-atome par résiduZacharias

Page 24: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

• Les simulations entraînent des déformations de la molécule avec un rmsd d’environ 1,5 Å par rapport à la conformation de départ .

• La constante de force associée à chaque particule est calculée à partir des fluctuations autour de sa position d’origine :

Soit di la distance moyenne de la particule i à toutes les autres particules de la

protéine

, pour la particule i

, pour le résidu k

Label de Chimie Théorique Paris, 24 janvier 2017 24

ProPHet : Simulations de dynamique brownienne :

ki =3kBT

di − di simulation( )2

simulation

Kk = ki i∈k

Ri Δt( ) = 0, Ri Δt( )R j Δt( ) = 2Dij0Δt, Δt =10 fs

Page 25: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 25

Horseradish peroxidase (1ATJ)

Profil de rigidité protéique :Fo

rce

cons

tant

Residue

Page 26: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 26

Mise en évidence des résidus catalytiques :

Horseradish peroxidase (1ATJ)

(Sacquin-Mora et al., 2006).

Page 27: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 27

Signatures structurales :

Cytochrome cd1

(1QKS),

Tonneau β

Bacterioferritin

(1BCF),

Hélices α

Page 28: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 28

Cytochrome c peroxidase (1NML)

Détection du noyau de repliement :

F38

Y159

I156

G34

Résidus clés sur le plan structural

• Hélices-α orthogonales

• Positions (i, i+4) et (j, j+3)

• Groupes aromatiques en i+4 et j+3

“Noyau de repliement” des domaines cytochrome c

(Ptitsyn et al., J. Mol. Biol., 1998)

Page 29: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 29

Profil de rigidité dans les globines :

Myoglobine

(1YMB)

(Ptitsyn et al., J. Mol. Biol., 1999)

Page 30: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 30

Résidus frontières et résidus “mécaniquement sensibles” :

Neuroglobine

(1OJ6)

• On compare les profils de rigidités de 5 structures caractéristiques produites par des simulations MD tout atome.

• Les fluctuations du profil mettent en évidence un jeu de résidus mécaniquement sensibles qui sont systématiquement situés aux frontières entre des cavités internes.

Max

imum

forc

e co

nsta

nt v

aria

tion

(kca

l mol

-1 Å

-2)

Residue

B9-B10

G8-G9

E11-E12

H11-H12

A12 A15 E18

G11-G12

H19

Page 31: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 31

Résidus frontières et résidus “mécaniquement sensibles” :• L’application de ce protocole à 6 chaînes distinctes (Ngb, Mgb, Cytoglobine, Hémoglobine tronquée, Hémoglobines α et β) fait apparaître 4 positions

mécaniquement sensibles conservées au sein de la famille des globines : E11, E15, G8 et G12

Page 32: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 32

• Les résidus constitutifs du noyau mécanique des globines jouent un rôle dans le contrôle de la diffusion de petits ligands au sein du réseau de cavités internes et ont tous été déjà signalés comme des résidus clés lors d’études expérimentales sur les globines.

Noyau mécanique des globines :

(Bocahut et al., JACS, 2011)

Page 33: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 33

• Le logiciel ProPHet combine une représentation réduite des protéines et un algorithme de dynamique brownienne pour sonder les propriétés mécaniques des protéines à l’échelle du résidu. • Les profils ainsi obtenus permettent de pointer des résidus clés sur les plans structural et fonctionnel, via leur rigidité accrue. • Le profil de rigidité d’une protéine présente des fluctuations dynamiques, qui permettent de cerner un petit nombre de résidus mécaniquement sensibles, dont la rigidité varie de manière importante au cours du temps. • Dans le cas des globines, ces résidus sont conservés et correspondent aux résidus frontières situés aux interfaces entre cavités internes. Les positions E11-E15-G8-G12 forment notamment un noyau mécanique essentiel pour réguler la diffusion de ligands internes.

• Application à d’autres familles de protéines globulaires ?

Conclusion et perspectives :

Page 34: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 34

• Biocatalyseur d’oxydation de l’hydrogène pour les piles à combustible

⇒ Projet ANR Biopac

Modélisation d’une hydrogénase :

(Fritsch et al., Nature, 2011)

NiFe

NiFe

NiFe

FeSprox NiFe

Glu28

• Existence d’un noyau mécanique associé à la migration des ligands

(H2 ou O2) dans la protéine ?

Page 35: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 35

Mise en évidence d’une triade Val/Leu/Arg de résidus «mécaniquement sensibles» et contrôlant la diffusion de petites molécules de gaz au sein de l’enzyme :

Modélisation d’une hydrogénase :

(a)

(b)

(c)(a)

(b)

(c)

(Oteri et al., J. Phys. Chem. B, 2014)

[NiFe]Hase from D. fructosovorans [NiFe]Hase from A. aeolicus

Page 36: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 36

Réponse enzymatique à une contrainte externe :

• Développement récent des approches de type molécule unique, microscopie à force atomique, pinces optiques ou magnétiques, pour l’étude de la mécanique des protéines (repliement, anisotropie des éléments de structure secondaire).

• Jusqu’ici les perturbations de l’activité enzymatique étaient liées à des changements structuraux importants.

• La conception de « chimères » protéine-ADN permet d’évaluer la réponse fonctionnelle de la protéine soumise à une contrainte externe de faible amplitude.

Page 37: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 37

Réponse enzymatique à une contrainte externe :

(Zocchi, Annu. Rev. Biophys., 2009)

• Trois directions ont été testées expérimentalement, et on suit l'évolution de trois paramètres par spectroscopie: KG (GMP binding), KA (ATP binding) et kcat (taux catalytique).

M.T Guanylate Kinase :

GMP + ATP → GDP + ADP

Page 38: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 38

Réponse enzymatique à une contrainte externe :

Direction KG KA kcat

75/171KG augmente (affinité pour

GMP diminue)

- -

40/171 - - kcat diminue

130/40 - - -

Page 39: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 39

Modification de ProPHEt :

• La contrainte externe est modélisée par un ressort supplémentaire dont les paramètres sont déterminés par les données expérimentales

(LC=150 Å et kC=1,2 kcal mol-1Å-2)

L0=35 Å

Page 40: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 40

Propriétés mécaniques de GK :

• Profil de rigidité :

P-loop β7

Page 41: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 41

Propriétés mécaniques de GK :

Variations du profil de rigidité:

75/171

40/171

40/130

Distorsion importante du site de fixation de GMP

⇒ Effet sur KG

P-loop β7

Page 42: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 42

Dynamique sous contrainte :• On effectue une analyse par composantes principales (PCA) des dynamiques sous contrainte que l’on compare à la trajectoire de la protéine libre.

• On s’intéresse plus particulièrement à la conservations du premier mode normal de vibration de la protéine (mouvement d’ouverture/fermeture de l’enzyme)

75/171 40/171 40/130

Trajectoire libre

Tra

ject

oir

e s

ou

s co

ntr

ain

te

CMO 0.655 0.803 0.829

P1 0.828 0.771 ⇒ Effet sur kcat 0.972

Page 43: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 43

Réponse enzymatique à une contrainte externe :

Direction KG KA kcat

75/171KG augmente (affinité pour

GMP diminue)

- -

40/171 - - kcat diminue

130/40 - - -

Page 44: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 44

Conclusion et perspectives :• Via une approche simple associant un modèle réduit pour la représentation des protéines et des simulations par dynamique brownienne on peut faire le lien entre les propriétés mécaniques et dynamiques de GK et son activité enzymatique.

• Il semble que la variation de KG soit liée à la perturbation mécanique locale du site de fixation de GMP.

• La variation de kcat viendrait elle d’une perturbation globale de la dynamique de la protéine (mouvement d’ouverture/fermeture).

• Via un scan de la surface protéique on peut proposer une nouvelle direction de contrainte Asp65-Leu122 qui entraînerait des variations de KG et kcat.

• Par contre on ne peut isoler de direction perturbant le seul site de fixation de l’ATP.

Contrôle de l’activité enzymatique par des « mutants mécaniques » ?

Page 45: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 45

Conclusion générale :

L’utilisation de représentations gros-grain pour la modélisation des protéines permet de faire le lien entre propriétés structurales et activité biologique pour un coût calculatoire réduit.

• Les représentations CG ne sont pas réservées aux seuls systèmes monstres.

• Absence d’un modèle CG universel, il faut savoir choisir le modèle

réduit adapté au système étudié (et à ses moyens computationnels) en étant conscient de ses l imitations (grands changements conformationnels, électrostatique...).

• Les approches hybrides CG/MM sont encore en cours développement.

Page 46: Modélisations multi-échelle des processus biophysiques · (LJ), or Mie ones, and apply different mappings (Figure 1). He et al.37 performed a systematic study of the properties

Label de Chimie Théorique Paris, 24 janvier 2017 46

Richard Lavery

Mécanique des protéines : • Emilie Laforet, Marc Baaden, Olivier Delalande, Francesco Oteri (LBT, IBPC)

• Pierre Sebban, Christiane Alba-Simionesco (Laboratoire de Chimie Physique, Université Paris-11, Orsay)

• Giovanni Venturoli (Lab. Biophysique et Biochimie, U. Bologne)

Projet Neuroglobine :

• Anthony Bocahut • Sophie Bernad, Valérie Derrien et Pierre Sebban (LCP, Orsay), spectroscopie UV-vis.

• Ewen Lescop (ICSN, Gif-surYvette), RMN

• Ron Clarke (Université de Sydney), ITC

• Chris Garvey (ANSTO, Sydney), neutrons

Remerciements