Upload
cosme-lagrange
View
103
Download
0
Embed Size (px)
Citation preview
DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION
In’Tech : Bio-informatiqueIn’Tech : Bio-informatiqueFrançois DelfaudFrançois Delfaud
– 23 Octobre 2003 – – 23 Octobre 2003 –
In’Tech Presentation – Oct 23rd 2003 - p2 More info at www.medit.fror by email at [email protected]
PlanPlan
1. Comprendre les fonctions protéiques à partir de modèles 3D
2. En bout de chaine de la bioinformatique: les outils de Drug Design
3. SuMo
4. MEDIT: une jeune start-up
In’Tech Presentation – Oct 23rd 2003 - p3 More info at www.medit.fror by email at [email protected]
-1- 3D & Fonctions -1- 3D & Fonctions les interactions atomiques observées les interactions atomiques observées• Exemple d’une protéase à sérine : la thrombine
• A l’échelle atomique : Caché derrière un Ki (une réaction): tout un chemin réactionnel Aspect entropique à 37°C (310°K) : ΔG= ΔH – T.ΔS Un très grand nombre de degrés de liberté
Triad Catalytique:Triad Catalytique:Asp-His-Asp-His-SerSer
…LDPRSFLLRN…
ThrombineThrombine
Trp60D : poche hydrophobe spécifiqueTrp60D : poche hydrophobe spécifique de cette sérine protéasede cette sérine protéase
In’Tech Presentation – Oct 23rd 2003 - p4 More info at www.medit.fror by email at [email protected]
• Interaction ionique
• Liaison hydrogène
• Interaction aromatique
• Interaction hydrophobe
-1- 3D & Fonctions -1- 3D & Fonctions Les interactions non covalentes stabilisantesLes interactions non covalentes stabilisantes
In’Tech Presentation – Oct 23rd 2003 - p5 More info at www.medit.fror by email at [email protected]
-1- 3D & Fonctions -1- 3D & Fonctions vers un modèle par approximations succéssivesvers un modèle par approximations succéssives
Modélisation Moléculaire Expérimental
Structure ImageT=0°K !
- à T=310°K Flexibilité
- Allostérie
Concentration 1,66.10-24 mol/l
1 molécule simulée ! (ou quelques)
Seuil de détection = Picomol
Mesure=Observable => Effet de moyenne
Environnement Pour certains modèles:- Solvant- Sels- Membrane cellulaire …
Infiniment complexe !
Echelle de temps
Simulation de l’ordre de la dizaine de Nano seconde (10-9s)
Reaction: kin et koff variant entre la nanosec et l’heure
RMN: moyenne dans le temps
Xray: effet de packing cristallin, facteur de température
In’Tech Presentation – Oct 23rd 2003 - p6 More info at www.medit.fror by email at [email protected]
-1- 3D & Fonctions -1- 3D & Fonctions Structure RX : exemple de la Thrombine Structure RX : exemple de la Thrombine
…LDPRSFLLRN…
ThrombineThrombine
19 structures RX superposées19 structures RX superposées
Glu192 très flexibleGlu192 très flexible
Ser195Ser195
Boucle d’autolyse peu ou pas résolue !Boucle d’autolyse peu ou pas résolue !
Trp60D boucle sixties: Trp60D boucle sixties: facteur temp. élevéfacteur temp. élevé
In’Tech Presentation – Oct 23rd 2003 - p7 More info at www.medit.fror by email at [email protected]
1. Comprendre les fonctions protéiques à partir de modèles 3D
2. En bout de chaine de la bioinformatique: les outils de Drug Design
3. SuMo
4. MEDIT: une jeune start-up
PlanPlan
In’Tech Presentation – Oct 23rd 2003 - p8 More info at www.medit.fror by email at [email protected]
-2- InSilico Drug Design : -2- InSilico Drug Design : Molecular ModelingMolecular Modeling
Genes
Target characterization
Generation of active molecules
Lead
Genomics and Proteomics Bioinformatics Tools
Ligand identification
Virtual screeningDeNovo Ligand Design3D PharmacophoreQSARDiversity selection
Hit optimization Selectivity profilingADME/Tox profiling
Protein Function/Structure determination
NMRXray DiffractionHomology ModelingStructure comparisonMolecular Dynamics
Target identification
In’Tech Presentation – Oct 23rd 2003 - p9 More info at www.medit.fror by email at [email protected]
1. Comprendre les fonctions protéiques à partir de modèles 3D
2. En bout de chaine de la bioinformatique: les outils de Drug Design
3. SuMo
4. MEDIT: une jeune start-up
PlanPlan
In’Tech Presentation – Oct 23rd 2003 - p10 More info at www.medit.fror by email at [email protected]
-3- SuMo : -3- SuMo : Collaboration avec l’IBCPCollaboration avec l’IBCP
• Unique technology to compare surfaces and detect similarities between macromolecular structure VERY fast Unique annotation to characterize the function from a 3D generated
model Under discussion with the FIST & C. Geourjon
Subtilisin Trypsin
Same function but only active site is similar and No sequence similarity
analogie locale
squelette différent
-3- SuMo -3- SuMo Evolution ConvergenteEvolution Convergente
squelette et séquences semblables
fonctions différentes ou antagonistes
10 20 30 40 50 60 70 80 90 100 110 120 | | | | | | | | | | | |2PELAx0 AETVSFNFNSFSEGNPAINFQGDVTVLSNGNIQLTNLN-----KVNSVGRVLYAMPVRIWSSATGNVASFLTSFSFEMKDIKDYDPADGIIFFIAPEDTQIPAGSIGGGTLGVSDTKGAGHFVGV1IOAAx1 ATETSFNFPNFHTDDKLI-LQGNATISSKGQLQLTGVGSNELPRVDSLGRAFYSDPIQIKD--SNNVASFNTNFTFIIRAKNQSISAYGLAFALVPVNSPPQKKQEFLGIFNTNNPEPNARTVAV * .**** .* .: * :**:.*: *:*::***.:. :*:*:**.:*: *::* . :.***** *.*:* :: :: .* *: * :.* :: . * :...:.: .: *.*Prim.cons. A222SFNF22F222222IN2QG22T22S2G22QLT222SNELP2V2S2GR22Y22P22I22SA22NVASF2T2F2F2222222222A2G22F222P222222222222G2222222222222V2V
135 145 155 165 175 185 195 205 215 225 235 245 | | | | | | | | | | | |2PELAx0 EFDTYSNSEYNDPPTDHVGIDVNSVDSVKTVPWNSVSGAVVKVTVIYDSSTKTLSVAVTNDNGDITT-IAQVVDLKAKLPERVKFGFSASG--SLGGRQIHLIRSWSFTSTLITTTRRS------1IOAAx1 VFNTFKNR--IDFDKNFIKPYVN-----ENCDFHKYNGEKTDVQITYDSSNNDLRVFLHFTVSQVKCSVSATVHLEKEVDEWVSVGFSPTSGLTEDTTETHDVLSWSFSSKFRNKLSNILLNNIL *:*:.* * .:.: ** :. ::. .* ..* : ****.: * * : .::. :: .*.*: :: * *..***.:. : . : * : ****:*.: .. . Prim.cons. 2F2T22N2EY2D222222222VNSVDSV222222222G2222V222YDSS222L2V22222222222S2222V2L22222E2V22GFS222GL2222222H222SWSF2S222222222LLNNIL
-3- SuMo -3- SuMo Evolution DivergenteEvolution Divergente
séquence
chaîne principale
groupements d'atomes
ACGYVRLAKCDDY-x(2)-[LV]-x-KC
-3- SuMo -3- SuMo les différents niveaux d'étude des protéinesles différents niveaux d'étude des protéines
Affichage et visualisation
SuMo
Sites 3D de fixation de ligands
(12000 sites sélectionnés)
Structure 3D
d'intérêt
PDB (21000 structures publiques)
SuMo server
-3- SuMo -3- SuMo Prédiction de sites de fixation de ligands Prédiction de sites de fixation de ligands par SuMo par SuMo
élément abstrait ponctuel
groupe d'atomes instanciation selon
l'environnement
position position physique position fonctionnelle
géométrie propre
aromatique
donneur de liaison H
donneur de liaison H
accepteurde liaison H
-3- SuMo -3- SuMo Définition des groupements chimiquesDéfinition des groupements chimiques
Amas globulairenon orienté
ex : charge + ou -Polarisation simple
ex : dipôle
Polarisation symétrique
ex : plan aromatique
Double polarisation semi-symétrique
ex : acide carboxylique
Double polarisationex : amide
-3- SuMo -3- SuMo Géométrie des groupements chimiquesGéométrie des groupements chimiques
instanciation des groupements chimiques
sélection de groupements chimiques
création automatique de triplets
Formation de triplets
Sélection de groupements chimiques
P1
P2P3
-3- SuMo -3- SuMo Triplets de groupements chimiquesTriplets de groupements chimiques
T3
T2
T1T4
Groupements chimiques
Graphe des triplets de
groupements chimiques
Base de données
Utilisation(comparaisons)
T3
T2
T1T4
-3- SuMo -3- SuMo Représentation finale des moléculesReprésentation finale des molécules
formation des paires de triplets similaires
connexion des paires voisines
extraction des sous-graphes indépendants
T1
T2
T3
T4
T1'
T5'
T3'
T2'
T4'
T3/T3'
T2/T2'
T1/T1'
T4/T4'
-3- SuMo -3- SuMo Heuristique d'extraction des listes Heuristique d'extraction des listes de correspondances de correspondances
Critères essentiels groupements chimiques de même type distances similaires orientation similaire similarité de forme de l'environnement local
Autres critères enfouissement similaire (densité atomique) disposition du triplet par rapport à la protéine
-3- SuMo -3- SuMo Critères de similitude des triplets Critères de similitude des triplets
programme sumo (157 modules, 20000 lignes) : Langage OCaml (Développé par l’INRIA)
programme central
utilisation locale ou indirecte, langage sumo
interface web (10000 lignes) HTTP/CGI/HTML
requêtes interactives ou via langage SuMoQ
optimisation des ressources de calcul machines multiprocesseurs
clusters
-3- SuMo -3- SuMo les différentes composantes de SuMoles différentes composantes de SuMo
Interfaces entre SuMo et les plate-formes de modélisation moléculaire (SPL, SVL, VB)
intégration dans un pipeline de modélisation et drug design
-3- SuMo -3- SuMo Les développements en cours (MEDIT)Les développements en cours (MEDIT)
In’Tech Presentation – Oct 23rd 2003 - p23 More info at www.medit.fror by email at [email protected]
1. Comprendre les fonctions protéiques à partir de modèles 3D
2. En bout de chaine de la bioinformatique: les outils de Drug Design
3. SuMo
4. MEDIT: une jeune start-up
PlanPlan
Contract Contract researchresearch
Service IntegrationService Integration
Commercial Commercial softwaresoftware
Grid ComputingGrid Computing
olecularolecular
xtendedxtended
istributionistribution
nformationnformation
echnologyechnology
inin
MEDIT distributionMEDIT distributionBioinfoBioinfoCheminfoCheminfoMol.ModelingMol.Modeling
In’Tech Presentation – Oct 23rd 2003 - p25 More info at www.medit.fror by email at [email protected]
-4- MEDIT-4- MEDIT exemple de produit en R&Dexemple de produit en R&D
-0.5
0.0
0.5
1.0
1.5
3D model generation from multiple sequence alignment
- for low homology area- to score the quality of the model
FASTER with Grid Computing – Can process full proteome FASTER with Grid Computing – Can process full proteome
- Unique annotations to characterize the function from a 3D generated model
MED-3DgenMED-3Dgen MED-ProScore MED-ProScore MED-SuMo MED-SuMo
In’Tech Presentation – Oct 23rd 2003 - p26 More info at www.medit.fror by email at [email protected]
Protéine cible (fichier PDB):
Extraire une carte d’interaction avec les points pharmacophoriques
N Ligands (fichier SD):
Pour chaque ligand n : recherche conformationnelle par Distance Geometry et/ou recuit simulé K conformations
Pour chaque conformation N°k : extraction des points pharmacophoriques
Prot
Don
Don
Acc
HydAcc
Passage aux points pharmacophoriques projetés
Hyd Don1
Don2
Acc1
-4- MEDIT-4- MEDIT R&D autour du dockingR&D autour du docking
In’Tech Presentation – Oct 23rd 2003 - p27 More info at www.medit.fror by email at [email protected]
-4- MEDIT-4- MEDIT services en informatique et contrats de rechercheservices en informatique et contrats de recherche
• Molecular Modeling contract research Virtual screening including selectivity prediction 1D-2D-3D molecular descriptors to QSAR model generation Homology modeling for Proteomics or Pharmacogenomics purposes QM/MM reactivity prediction profile … Training All can be done on a linux farm or with Grid Computing
• Software development C++, VB, Java, Python, PERL development Corba, XML, .NET, SOAP web services MySQL, PostGreSQL databases Unix, Linux administration
x10 to x1000 (or more) time faster !
MerciTo contact M.E.D.I.T. : Parc Théogone, Toulouse, France
Rue du Belvédère, Palaiseau, France
Tel: +33 (0)6 855 66 722http://www.medit.fr & [email protected]