29
Modélisation statistique des interactions protéine-ligand : prédiction de la « druggabilité » des poches. Rapport de Stage Présenté par : Stéphanie Pérot Directeur de stage : Anne-Claude Camproux Formation : Master 2 Recherche de Biologie Informatique Responsable : Catherine Etchebest Université : Paris Diderot Laboratoire d'accueil : Équipe de Bioinformatique Génomique et Moléculaire

Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

Modélisation statistique des interactions

protéine-ligand : prédiction de la

« druggabilité » des poches.

Rapport de Stage

Présenté par : Stéphanie Pérot

Directeur de stage : Anne-Claude Camproux

Formation : Master 2 Recherche de Biologie Informatique

Responsable : Catherine Etchebest

Université : Paris Diderot

Laboratoire d'accueil : Équipe de Bioinformatique Génomique et Moléculaire

Page 2: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

2

Poche druggable

Composé druglike

Introduction

Druggabilité : capacité à fixer (ou non) un médicament ou un composé « druglike »

Composé druglike : composé caractérisé par des propriétés physico-chimiques (masse

moléculaire < 500, donneurs de liaisons H < 5 ; accepteurs de liaisons H < 10 ...)

Poche druggable : fixation d'un composé druglike

Poche non-druggable : pas de fixation

Criblage virtuel : prédiction in silico de l'activité des molécules

Page 3: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

3

Principe du criblage virtuel

Banque de petites molécules

Structures protéiques

Filtrage in silico (ADME)

Détermination des sites de liaison

Arrimage moléculaire et évaluation (docking-scoring)

Optimisation

Phases cliniques

Page 4: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

4

Principe du criblage virtuel

Druggabilité : capacité à fixer (ou non) un médicament

Prédiction de la

druggabilité des

poches

Banque de petites molécules

Structures protéiques

Filtrage in silico (ADME)

Détermination des sites de liaison

Arrimage moléculaire et évaluation (docking-scoring)

Optimisation

Phases cliniques

Page 5: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

5

But du stage

Comment distinguer les poches druggables des

poches non-druggables ?

Ou

Quels descripteurs contribuent de manière

significative à la druggabilité des poches ?

Page 6: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

6

Jeux de données

Étude des 85 protéines du jeu de Astex [1]

- haute résolution < 2.50 Å

- fixation de médicaments ou de composés druglike

=> caractère « druggable »

[1] : Hartshorn et al. (2007) J. Med. Chem. 50:726­741[2] : Hajduk et al. (2005) J. Med. Chem. 48:2518­2525

Étude des 37 protéines du jeu de Hajduk [2]

- haute résolution < 2.50 Å

- criblage de 10000 composés :

- soit pas de fixation

- soit fixation à très faible affinité

=> caractère « non-druggable » ?

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

Page 7: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

7

Jeu de poches druggables

[1] : Le Guilloux, Schmidtke and Tuffery (2008) : to be published

Algorithme de détection des poches

fpocket [1]

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

2bsm

Page 8: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

8

Jeu de poches druggables

Poche complémentaire

Poche surfacique Poche profonde

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

67 poches druggables

2bsm

Page 9: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

9

Jeu de poches non-druggables

[1] : Huang et al. (2006) BMC Structural Biology 6:19­29[2] : Brady et al. (2000) J. Comput. Aided Mol. Des. 14:383­401

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

LIGSITEcsc [1]

fpocket

1aha

1aha

1aha

PASS [2]

Page 10: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

10

Jeu de poches non-druggables

LIGSITEcsc [1]

[1] : Huang et al. (2006) BMC Structural Biology 6:19­29[2] : Brady et al. (2000) J. Comput. Aided Mol. Des. 14:383­401

fpocket

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

182 poches non-druggables

1aha

PASS [2]

1aha

1aha

Page 11: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

11

Descripteurs calculés (exemples)

Descripteurs physico-chimiques

- Acides aminés et propriétés

- Atomes et propriétés

- Aire de la surface polaire et apolaire (PSA et APSA) [1]

PSA : atomes d'azote et d'oxygène

APSA : atomes de carbone et de soufre

- Charge totale

Descripteurs géométriques Descripteurs structuraux

- Volume approximé - Structures secondaires

- Indice de flexibilité - Alphabet structural

[1] : Hajduk et al. (2005) J. Med. Chem. 48:2518­2525

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

(Développés par des codes python)

Page 12: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

12

Méthodes d'apprentissage

Étude des descripteurs

- Analyse en Composantes Principales (ACP)

- Analyse univariée

Prédiction de la druggabilité des poches

- Régression logistique (glm)

- Séparateurs à Vaste Marge (svm)

Évaluation des résultats

- Indicateurs : Sensibilité (Se) : capacité à prédire les poches druggables

Spécificité (Sp) : capacité à prédire les poches non-druggables

Erreur (Er) : fiabilité de la méthode de prédiction [1]

- Validation croisée

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

Exemple de svm

(Développées par des codes R)

[1] : Nayal et al. (2006) Proteins 63:892­906

Page 13: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

13

Analyse des descripteurs : ACP

Analyse en Composantes Principales

variabilité : 26,8 %

Projection des poches Projection des descripteurs

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

physico-chimiques géométriques structuraux

Poches druggables (67)Poches non-druggables (182)

Page 14: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

14

Analyse univariée des descripteurs

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

1588 2625 0.85 0.98

0.008 0.040.18 0.21

moyennes moyennes

moyennes

Poches druggables (67)Poches non-druggables (182)

Page 15: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

15

12 Descripteurs :

Descripteurs pertinents

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

Poches druggables (67)Poches non-druggables (182)

Page 16: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

16

[1] & [2]  [1] [1] [1][2]

NouveauTrès significatif

12 Descripteurs :

Descripteurs pertinents

[1] : Nayal et al. (2006) Proteins 63:892­906[2] : Hajduk et al. (2005) J. Med. Chem. 48:2518­2525

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

- accord avec les études de druggabilité

- nouveaux descripteurs

Poches druggables (67)Poches non-druggables (182)

Page 17: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

17

Prédiction de la druggabilité

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

Taux de prédiction de la druggabilité des poches

Méthode Se (%) Sp (%) Er (%)

régression logistique 72,4 90,0 18,8

svm 75,4 91,7 16,4

Page 18: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

18

Prédiction de la druggabilité

[1] : Nayal et al. (2006) Proteins 63:892­906[2] : Hajduk et al. (2005) J. Med. Chem. 48:2518­2525[3] : Han et al. (2007) Drug Discov. Today 12:304­313

1. Jeux de données 2. Descripteurs 3. Méthodes 4. Analyse 5. Descripteurs pertinents 6. Prédiction

Comparaison autres études

Nayal [1] : étude de la poche la plus druggable au sein d'une même protéine

88,9 % de poches druggables bien prédites

Hajduk [2] : quantification de la druggabilité des poches selon 3 classes

(faiblement / moyennement / hautement druggable)

77,0 (41,0) % des poches hautement (faiblement) druggables bien prédites

Han [3] : étude de la druggabilité des protéines à partir d'alignements de séquence et des svm

67,6 % des protéines druggables bien prédites

Taux de prédiction de la druggabilité des poches

Méthode Se (%) Sp (%) Er (%)

régression logistique 72,4 90,0 18,8

svm 75,4 91,7 16,4

Page 19: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

19

Conclusion-Perspectives

Bilan

Court terme

Long terme

- Détermination de descripteurs pertinents, notamment la proportion de soufre

en surface (nouveau)

- Mise en place d'une fonction de score performante en terme de taux de

prédiction (poches druggables bien prédites à 72,4%)

- Approfondir les descripteurs d'intérêt (atomes, flexibilité ...)

- Mettre en place d'autres descripteurs (rugosité, compacité, inertie ...)

- Augmenter le nombre de poches druggables et non-druggables

- Quantifier l'incertitude sur les poches non-druggables (em)

- Déterminer différents types de poche en fonction de la nature du composé

médicamenteux

- Rechercher les descripteurs pertinents de chaque type de poche

Page 20: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

20

Je vous remercie de votre attention ...

Page 21: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

21

Principe des sphères-alpha

Page 22: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

22

Descripteurs calculés

Page 23: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

23

Descripteurs calculés

Page 24: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

24

Indicateurs de validation

Page 25: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

25

Descripteurs de la fonction de score

Page 26: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

26

Prédiction

Page 27: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

27

Définitions

Méthode ADME-Tox : prédiction préliminaire du comportement in vivo d'un composé afin

de tester sa capacité à être un médicament

ADME-Tox : Absorption – Distribution – Métabolisme – Excrétion – Toxicité

Docking (arrimage) : placement des petites molécules dans la poche du récepteur

Scoring : évaluation (score) puis classement des ligands potentiels sur la base d'un score

ou d'énergie d'interaction protéine-ligand.

Page 28: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

28

Définitions

Composé druglike : Un composé druglike se caractérise en termes de propriétés physico-

chimiques, d'absorption intestinale, de stabilité/réactivité ou encore d'interaction avec

les mécanismes de régulation cellulaire. Généralement, un tel composé vérifie les règles

de Lipinski [1] qui sont nécessaires mais pas suffisantes : coefficient de partage octanol/

eau ou log(P) calculé < 5 ; masse moléculaire < 500 ; donneurs de liaisons hydrogènes

< 5 ; accepteurs de liaisons hydrogènes < 10

[1] : Lipinski et al. (2001) Adv. Drug. Deliv. Rev. 46:3­26

Page 29: Modélisation statistique des interactions protéine-ligand : …stephanieperot.free.fr/Telechargements/Presentation_M2BI.pdf · 2011-03-20 · Université : Paris Diderot Laboratoire

29

Diagramme de Venn