55
Ingénierie rationnelle et combinatoire des protéines Principes et Méthodes Exemple d’une amylosaccharase Gabrielle Potocki-Veronese INSA-Laboratoire Biotechnologie-Bioprocédés Toulouse Equipe Ingénierie Enzymatique Moléculaire [email protected]

Ingénierie rationnelle et combinatoire des protéines ... · Ingénierie rationnelle et combinatoire des protéines Principes et Méthodes Exemple d’une amylosaccharase ... II-

  • Upload
    dangnhi

  • View
    237

  • Download
    0

Embed Size (px)

Citation preview

Ingénierie rationnelle et combinatoire des protéine s

Principes et Méthodes

Exemple d’une amylosaccharase

Gabrielle Potocki-VeroneseINSA-Laboratoire Biotechnologie-Bioprocédés

ToulouseEquipe Ingénierie Enzymatique Moléculaire

[email protected]

L’ingeniérie protéique

Comprendre - la fonction de la protéine

ex : mode d’action catalytique, interactions protéine-ligand…)

Exploiter ces connaissances :

- pour améliorer les protéines (enzymes, anticorps)

ex: amélioration de l’efficacité, de la stabilité, affinité …

- pour créer de nouveaux catalyseurs

ex: modification de la spécificité, …

Intérêt et applicationsIntérêt et applicationsIntérêt et applicationsIntérêt et applications

Relations structure-fonction

Ingénierie

L’ingeniérie protéique

Deux approches: du rationnel au combinatoireDeux approches: du rationnel au combinatoireDeux approches: du rationnel au combinatoireDeux approches: du rationnel au combinatoire

Ingénierie rationnelleIngénierie rationnelleIngénierie rationnelleIngénierie rationnelle- analyse de données structurales (structure primaire et tertiaire)

� identification de résidus cibles- construction de mutants par mutagénèse dirigée

� modification du gène et donc de la séquence en acides aminés- caractérisation de l’activité des mutants

� rôle des acides aminés ciblés / design rationnel

Ingénierie combinatoireIngénierie combinatoireIngénierie combinatoireIngénierie combinatoire- mutagénèse aléatoire et/ou recombinaison in vitro du gène d’intérêt

� construction de banques de variants - criblage des banques pour isoler les variants ayant l’activité recherchée

� miniaturisation / automatisation des protocoles- caractérisation de l’activité des mutants

� identification de résidus clés / optimisation d’enzymes

Prêts requis

(structures Iaire / IIIaire)

Criblage limitant

L’ingénierie protéique

PlanPlanPlanPlan

I- La structure des enzymes

II- Bio-cristallographie et RMN

III- La modélisation moléculaire

IV- La mutagénèse dirigée

V- Ingénierie combinatoire

� Résultats : - l’amylosaccharase de Neisseria polysaccharea Les exemples

Les méthodes

Les fondamentaux

Structure primaire : enchaînement des acides aminésStructure primaire : enchaînement des acides aminésStructure primaire : enchaînement des acides aminésStructure primaire : enchaînement des acides aminés

I- Structure des protéines

Protéine : 100-3000 acides aminés

Distinction : nature des chaînes latérales

� Les chaînes non polaires.Ala (A), Val (V), Leu (L), Ile (I), Met (M), Phe (F), Trp (W), Pro (P)

� Les chaînes polaires non ioniquesSer (S), Thr (T), Cys (C), Tyr (Y), Asn (N), Gln (Q)

� Les chaînes polaires ioniquesanioniques : Asp (D), Glu (E) cationiques : His (H), Lys (K), Arg (R)

Rôle clé pour la structure et la réactivité

Acide aminé : 54-186 Da

Alignement de structures primairesAlignement de structures primairesAlignement de structures primairesAlignement de structures primaires

I- Structure des enzymes

Comparaison de la séquence à des milliers de séquen ces déjà publiées

� identifier la famille

� reconstituer l’évolution

� associer à certaines portions de séquence une signification biologique précise.

Pourcentage d’identité , nombre d’a a identiques/aa totaux

Pourcentage de similitude , il consiste à évaluer le taux de ressemblance de chaque position d’une séquence comparée à une autre.Aa identiques = 100 % homologueGlu en face de Asp = 50 % homologueGlu en face de Gln= 50 % homologueGlu en face de Leu= 0 % homologueLeu en face de Val= 60 % homologue.La mutation changeant un acide aminé en un autre de même nature a davantage de chances d’être préservée par la sélection naturelle

Comparaison de structures primairesComparaison de structures primairesComparaison de structures primairesComparaison de structures primaires

I- Structure des protéines

� Utilisation d’algorithmes permettant de faire coïncider le maximum de caractères communs entre deux séquences en faisant glisser les chaînesde caractères latéralement

� Détection des similitudes dépend des méthodes de calculs Choix du programme et de son paramétragel’interprétation des résultats

Programme de référence: BLAST

Alignement de structures primaires : logiciels adaptésAlignement de structures primaires : logiciels adaptésAlignement de structures primaires : logiciels adaptésAlignement de structures primaires : logiciels adaptés

I- Structure des enzymes

Fasta Basic local alignmenthttp://www.dkfz-heidelberg.de/tbi/bioinfo/DBSearchI/FASTA/index.html

BLAST Basic Local Alignment Search toolhttp://www.ncbi.nlm.nih.gov/BLAST

BEAUTY:BLAST Alignement Blast amélioré informant sur les domaines/familles/régions conservéeshttp://searchlauncher.bcm.tmc.edu/seq-search/protein-search.html

CLUSTALW Alignement de plusieurs séquenceshttp://www.ebi.ac.uk/clustalw/

EXPASY Proteomics toolshttp://www.expasy.ch/tools

MULTALINhttp://www.toulouse.inra.fr/multalin.html

PFAMhttp://www.sanger.ac.uk/software/Pfam

séquence logo: logiciel delilahttp://www.lecb.ncifcrf.gov/~toms/delila.html

Alignement de structures primaires : Alignement de structures primaires : Alignement de structures primaires : Alignement de structures primaires :

I- Structure des protéines

SéquencesSéquencesSéquencesSéquences

signaturessignaturessignaturessignatures

AS 126-GLTYLHLM-P-134 182-DFIFNH-187 254-QWDLN-258

TAK 56-GFTAIWIT-P-64 117-DVVANH-122 155-YEDQ-158 173-LPDLD-177 AMY 36-GFGGVQVS-P-44 96-DAVINH-101 150-SYND-153 165-LLDLA-169 PUL 210-GVTHVELL-P-218 281-DVVYNH-286 308-AYGN-311 319-GNDIA-323 NPU 188-GINGIYLT-P-196 241-DAVFNH-246 284-NYDT-287 294-MPKLN-298CGT 70-GVTALWISQP-79 135-DFAPNH-140 185-SLEN-188 197-LADFN-201 GDE 137-GYNMIHFT-P-145 198-DVVYNH-203 248-KYKE-251 451-LRNFA-455

DSRS 958-GVTSFQLA-P-966 1023-DWVPDQ-1028 509-ANDVD-513 GTFB 862-GVTDFEMA-P-870 927-DWVPDQ-932 409-ANDVD-413GTFI 866-GITDFEMA-P-874 931-DWVPDQ-936 411-ANDVD-415GTFS 849-GITQFEMA-P-857 914-DLVPNQ-919 495-ANDVD-499

AS 126-GLTYLHLM-P-134 182-DFIFNH-187 254-QWDLN-258

TAK 56-GFTAIWIT-P-64 117-DVVANH-122 155-YEDQ-158 173-LPDLD-177 AMY 36-GFGGVQVS-P-44 96-DAVINH-101 150-SYND-153 165-LLDLA-169 PUL 210-GVTHVELL-P-218 281-DVVYNH-286 308-AYGN-311 319-GNDIA-323 NPU 188-GINGIYLT-P-196 241-DAVFNH-246 284-NYDT-287 294-MPKLN-298CGT 70-GVTALWISQP-79 135-DFAPNH-140 185-SLEN-188 197-LADFN-201 GDE 137-GYNMIHFT-P-145 198-DVVYNH-203 248-KYKE-251 451-LRNFA-455

DSRS 958-GVTSFQLA-P-966 1023-DWVPDQ-1028 509-ANDVD-513 GTFB 862-GVTDFEMA-P-870 927-DWVPDQ-932 409-ANDVD-413GTFI 866-GITDFEMA-P-874 931-DWVPDQ-936 411-ANDVD-415GTFS 849-GITQFEMA-P-857 914-DLVPNQ-919 495-ANDVD-499

TAK 56-GFTAIWIT-P-64 117-DVVANH-122 155-YEDQ-158 173-LPDLD-177 AMY 36-GFGGVQVS-P-44 96-DAVINH-101 150-SYND-153 165-LLDLA-169 PUL 210-GVTHVELL-P-218 281-DVVYNH-286 308-AYGN-311 319-GNDIA-323 NPU 188-GINGIYLT-P-196 241-DAVFNH-246 284-NYDT-287 294-MPKLN-298CGT 70-GVTALWISQP-79 135-DFAPNH-140 185-SLEN-188 197-LADFN-201 GDE 137-GYNMIHFT-P-145 198-DVVYNH-203 248-KYKE-251 451-LRNFA-455

DSRS 958-GVTSFQLA-P-966 1023-DWVPDQ-1028 509-ANDVD-513 GTFB 862-GVTDFEMA-P-870 927-DWVPDQ-932 409-ANDVD-413GTFI 866-GITDFEMA-P-874 931-DWVPDQ-936 411-ANDVD-415GTFS 849-GITQFEMA-P-857 914-DLVPNQ-919 495-ANDVD-499

AS 282-ILRMDAVAF-290 328-EAIV-332 388-YVR--SHD-393 480-GLPLIYLGD-488

TAK 202-GLRIDTVKH-210 230-EVLD-233 292-FVE--NHD-297 323-GIPIIYAGQ-331AMY 193-GFRLDASKH-201 233-EVID-236 295-FVD--NHD-300 334-GFTRVMSSY-342PUL 348-GFRFDLMGI-356 381-EGWD-384 464-YVE--SHD-469 405-GIPFLHSGQ-513NPU 323-GWRLDVANE-331 356-EVWH-359 418-LLG--SHD-423 450-GTPCIYYGD-458CGT 225-GIRVDAVKH-233 257-EWFL-260 323-FID--NHD-328 354-GVPAIYYGT-362GDE 505-GVRLDNCHS-513 538-ELFT-541 604-FMD-ITHD-610 642-GYDELVPHQ-650

DSRS 547-GIRVDAVDN-555 590-EDWS-593 657-FVR--AHD-662 727-TVPRVYYGD-735GTFB 447-SIRVDAVDN-455 489-EAWS-492 557-FIR--AHD-562 627-SVPRVYYGD-635GTFI 449-SIRVDAVDN-457 491-EAWS-494 559-FAR--AHD-564 629-SIPRVYYGD-637GTFS 433-GVRVDAVDN-441 475-EAWS-478 542-FIR--AHD-547 614-TVTRVYYGD-622

AS 282-ILRMDAVAF-290 328-EAIV-332 388-YVR--SHD-393 480-GLPLIYLGD-488

TAK 202-GLRIDTVKH-210 230-EVLD-233 292-FVE--NHD-297 323-GIPIIYAGQ-331AMY 193-GFRLDASKH-201 233-EVID-236 295-FVD--NHD-300 334-GFTRVMSSY-342PUL 348-GFRFDLMGI-356 381-EGWD-384 464-YVE--SHD-469 405-GIPFLHSGQ-513NPU 323-GWRLDVANE-331 356-EVWH-359 418-LLG--SHD-423 450-GTPCIYYGD-458CGT 225-GIRVDAVKH-233 257-EWFL-260 323-FID--NHD-328 354-GVPAIYYGT-362GDE 505-GVRLDNCHS-513 538-ELFT-541 604-FMD-ITHD-610 642-GYDELVPHQ-650

DSRS 547-GIRVDAVDN-555 590-EDWS-593 657-FVR--AHD-662 727-TVPRVYYGD-735GTFB 447-SIRVDAVDN-455 489-EAWS-492 557-FIR--AHD-562 627-SVPRVYYGD-635GTFI 449-SIRVDAVDN-457 491-EAWS-494 559-FAR--AHD-564 629-SIPRVYYGD-637GTFS 433-GVRVDAVDN-441 475-EAWS-478 542-FIR--AHD-547 614-TVTRVYYGD-622

TAK 202-GLRIDTVKH-210 230-EVLD-233 292-FVE--NHD-297 323-GIPIIYAGQ-331AMY 193-GFRLDASKH-201 233-EVID-236 295-FVD--NHD-300 334-GFTRVMSSY-342PUL 348-GFRFDLMGI-356 381-EGWD-384 464-YVE--SHD-469 405-GIPFLHSGQ-513NPU 323-GWRLDVANE-331 356-EVWH-359 418-LLG--SHD-423 450-GTPCIYYGD-458CGT 225-GIRVDAVKH-233 257-EWFL-260 323-FID--NHD-328 354-GVPAIYYGT-362GDE 505-GVRLDNCHS-513 538-ELFT-541 604-FMD-ITHD-610 642-GYDELVPHQ-650

DSRS 547-GIRVDAVDN-555 590-EDWS-593 657-FVR--AHD-662 727-TVPRVYYGD-735GTFB 447-SIRVDAVDN-455 489-EAWS-492 557-FIR--AHD-562 627-SVPRVYYGD-635GTFI 449-SIRVDAVDN-457 491-EAWS-494 559-FAR--AHD-564 629-SIPRVYYGD-637GTFS 433-GVRVDAVDN-441 475-EAWS-478 542-FIR--AHD-547 614-TVTRVYYGD-622

E

EEEEEE

EEEE

D

DDDDDD

DDDD

D

DDDDDD

DDDD

E

EEEEEE

EEEE

E

EEEEEE

E

EEEEEE

EEEE

EEEE

D

DDDDDD

DDDD

D

DDDDDD

D

DDDDDD

DDDD

DDDD

D

DDDDDD

DDDD

D

DDDDDD

D

DDDDDD

DDDD

DDDD

H

HHHHHH

QQQQ

F

HHIEHS

NNNN

H

HHHHHH

HHHH

H

HHHHHH

QQQQ

H

HHHHHH

H

HHHHHH

QQQQ

QQQQ

F

HHIEHS

NNNN

F

HHIEHS

NNNN

H

HHHHHH

HHHH

H

HHHHHH

HHHH

Comparaison AS / glycoside-hydrolases famille 13 (substrat amylose)AS / autres glucane-saccharases (substrat saccharose)

Identification des résidus catalytiques

Alignement de structures primaires : régions consensusAlignement de structures primaires : régions consensusAlignement de structures primaires : régions consensusAlignement de structures primaires : régions consensus

I- Structure des protéines

SéquencesSéquencesSéquencesSéquences

logoslogoslogoslogos

Résidus consensus impliqués dans une fonction spécifique

Alignement de structures primaires : limitesAlignement de structures primaires : limitesAlignement de structures primaires : limitesAlignement de structures primaires : limites

I- Structure des protéines

� si la protéine présente très peu d’homologie avec les protéines accessibles par les banques de données

pas d’informations structurales ou fonctionnelles

� une ressemblance de structure ne signifie pas une ressemblance de séquenceEx: famille Glucoside Hydrolase : même organisation structurale peut être obtenue à partir de séquences très différentes entre elles (homologie<20%)

� une même fonction ne correspond pas toujours à une forte homologie de séquence (cas des β-glucosidases)

Nécessité de disposer de la structure 3D !!

I- Structure des enzymes

Arrangement structural : forces nonArrangement structural : forces nonArrangement structural : forces nonArrangement structural : forces non----covalentes motricescovalentes motricescovalentes motricescovalentes motrices

� Forces d’interaction non-covalentes cruciales

- pour diriger le repliement spontané des protéines

- pour la reconnaissance mutuelle de surfaces moléculaires complémentaires

� Forces en question :

- Interactions de van der Waals (<1 kcal/mol)

- Interactions électrostatiques (paire d’ions, ex: pont salin, 1-6 kcal/mol)

- Liaison hydrogène (2-10 Kcal/mole)

- Interactions entre aromatiques (stacking) (1-2 kcal/mol)

I- Structure des protéines

Structure secondaireStructure secondaireStructure secondaireStructure secondaire� Correspond à des éléments structuraux de la chaîne qui doivent répondre à deux critères :

- les liaisons intracaténaires sont des ponts hydrogène- mettant en jeu uniquement les groupements CO-NH de la chaîne principale

Prédiction de structure secondaire

plusieurs logiciels de prédiction, dont la méthode HCA (Hydrophobic ClusterAnalysis, Gaboriaud, Mornon et coll.1987 FEBS letters, 224, 149-155):

(Analyse des sites hydrophobes le long de la à séquence protéique présentée sous forme de matrice et identification des similitudes de structure entre protéines)

I- Structure des protéines

Structure secondaireStructure secondaireStructure secondaireStructure secondaire

Hélice α

Brin β

repliement local des acides aminés en hélices, en feuillets, ou en d'autres formes similaires.

I- Structure des protéines

Structure tertiaireStructure tertiaireStructure tertiaireStructure tertiaire

� Structure définie dans l’espace

- éléments de structure secondaire

- connexion par des boucles

- parfois présence de modules capables de se replier seuls

� Les structures des protéines sont mieux conservées que leurs séquences

� agencement stable dans l'espace de ces hélices et feuillets

I- Structure des enzymes

Structure tertiaire : généralitésStructure tertiaire : généralitésStructure tertiaire : généralitésStructure tertiaire : généralités- Majorité des groupements apolaires forment des noyaux hydrophobes à l’intérieur de la protéine

- 90 % groupements polaires à l’intérieur de la structure impliqués dans des liaisons hydrogène

- Groupements chargés à la surface augmentent la solubilité

- Repliement aidé par les protéines chaperonnes

Protéines = assemblage très dense

forces non covalentes efficacement utilisées

interactions hydrophobes essentielles pour la stabilité

I- Structure des protéines

Structure tertiaire : exemples de repliementsStructure tertiaire : exemples de repliementsStructure tertiaire : exemples de repliementsStructure tertiaire : exemples de repliements

domaine B’boucle 7

domaine Cclé-grecque

domaine Atonneau (β/α)8

domaine Bboucle 3

domaine N

hélicoïdal

domaine B’boucle 7

domaine B’boucle 7

domaine Cclé-grecque

domaine Atonneau (β/α)8

domaine Bboucle 3

domaine N

hélicoïdal

domaine Cclé-grecque

domaine Cclé-grecque

domaine Atonneau (β/α)8

domaine Atonneau (β/α)8

domaine Bboucle 3

domaine Bboucle 3

domaine N

hélicoïdal

domaine N

hélicoïdal

� Existence de différents modes de repliements:

(α/α)6 β-jelly roll (β/α)8 β-propeller(α/α)6 β-jelly roll (β/α)8 β-propeller

I- Structure des protéines

Structure tertiaire : propriétés des bouclesStructure tertiaire : propriétés des bouclesStructure tertiaire : propriétés des bouclesStructure tertiaire : propriétés des boucles

� généralement disposées à la surface des protéines, nombreux contacts avec le solvant

� présence de résidus ioniques

� flexibilité importante pour ajustement induit et adaptation de la protéine autour de la molécule étrangère

� mises à contribution pour modeler le site actif

� impliquées dans la spécificité à partir d’une charpente commune, évolution vers de nouvelles fonctions

� évolution plus rapide que les éléments structuraux

I- Structure des protéines

Structure tertiaire : ponts Structure tertiaire : ponts Structure tertiaire : ponts Structure tertiaire : ponts didididi----sulfuressulfuressulfuressulfures

Repliement stable par liaison entre deux résidus cystéines (même éloignés sur la séquence), en conditions oxydantes :

Coupure des ponts di-sulfures par réduction (β-mercaptoéthanol)

� Dénaturation réversible (par oxydation)

2222

I- Structure des protéines

Structure quaternaire Structure quaternaire Structure quaternaire Structure quaternaire

Agencement des sous-unités entre elles, quand la protéine est constituée de plusieurs sous-unités indépendantes (comme l'est par exemple l'hémoglobine).

II- Méthodes de résolution

Cristallographie et diffraction des rayons XCristallographie et diffraction des rayons XCristallographie et diffraction des rayons XCristallographie et diffraction des rayons X

� 1ères structures “hémoglobine” (M. Perutz) et « myoglobine » (J. C. Kendrew ) (1958)

� Technique la plus utilisée

� Quantités nécessaires : dizaine(s) de mg de protéine pure en solution

� Nombreux programmes de génomique structurale lancés en Europe et dans le monde

Objectif: acquérir le plus rapidement possible la structure de nouvelles protéines

Stratégie: à partir du séquençage de différents génomes, clonage du plus grand nombre possible de gènes/ expression/ purification/ cristallisation/ Diffraction des rayons X/ Structure 3D

II- Cristallographie

DémarcheDémarcheDémarcheDémarche

1- Conditionnement de l’échantillon

2- Cristallisation

3- Caractérisation des cristaux

4- Enregistrement des données de diffraction

5- Construction d’un modèle initial

6- Affinement

7- Implications biologiques

II- Cristallographie

CristallisationCristallisationCristallisationCristallisation

Cristal = organisation des molécules en un réseau ordonné

Méthode: mise en présence de la solution protéique avec une solution contenant un agent précipitant (Sels, PEG, composés organiques volatils,....)

� diffusion de vapeurs

� évolution vers un équilibre

thermodynamique via une phase de

sur-saturation

� nucléation puis croissance des

cristaux

II- Cristallographie

Obtention des clichés de diffractionObtention des clichés de diffractionObtention des clichés de diffractionObtention des clichés de diffraction

Diffraction des rayons X (synchrotron)

Cliché de diffraction

Résolution � d’autant plus que les tâches de diffraction sont éloignées du centre

II- Cristallographie

Carte de densité électroniqueCarte de densité électroniqueCarte de densité électroniqueCarte de densité électroniqueAmplitudes mesurées (intensité : position des atomes) + phases calculées �cartes de densité électronique

Structure 3D

Affinement

II- Cristallographie

Complexes protéine / ligandComplexes protéine / ligandComplexes protéine / ligandComplexes protéine / ligand

- Co-cristallisation du ligand avec la protéine

-Soaking : diffusion du ligand dans le cristal protéique

� Identification des zones de fixation du ligand/substrat

domaine B’G7

G7

G4

II- Cristallographie

Complexes protéine / ligandComplexes protéine / ligandComplexes protéine / ligandComplexes protéine / ligand

+2

+3+4

+5

+6

Maltoheptaose (G7)

OB1

-1+1

Saccharose

SB1

II- Cristallographie

Complexes protéine / ligandComplexes protéine / ligandComplexes protéine / ligandComplexes protéine / ligand

Asp393

Glu328

Asp286

V- Ingénierie rationnelle

Mécanisme catalytique de Mécanisme catalytique de Mécanisme catalytique de Mécanisme catalytique de l’amylosaccharasel’amylosaccharasel’amylosaccharasel’amylosaccharaseO

O-Asp

O

HOHO

OH

H

O

O

HOHO

OH

OO

Glu

O

HOHO

OH

δδδδ+

δδδδ+

O

HOHO

OH

OH

O

O-Asp

OO

Glu-

O

HO HO

OH

O

HOHO

OH

OH

O

O

Asp

OO

Glu-

O

HOHO

OH

δδδδ+

δδδδ+

O

HOHO

OH

O

O-Asp

OO

Glu- HO

O

O-Asp

O

HOHO

OH

H

O

O

HOHO

OH

OO

Glu

Substrat Etat de transition Intermédiaire

ProduitEtat de transition

++

++

II- RMN

Résonance Magnétique NucléaireRésonance Magnétique NucléaireRésonance Magnétique NucléaireRésonance Magnétique Nucléaire- RMN bi ou tri-dimensionnelle

<80 aa RMN 1H

80-120aa 1H, 15N

120-200 1H, 15N, 13C

20-30 000 Da 1H, 15N, 2H, 13C

- alternative pour la résolution de protéines de petite taille

- limitée aux protéines de petites tailles (20 000 Da) en solution

- aspect dynamique : intérêt vis-à-vis de la cristallographie

- mesure de distances interatomiques

repliement : modélisation

quantité nécessaire 5 à 50 mg en solution

II- Banques de données

http://www.rcsb.org/pdb

II- Banques de données

http://www.rcsb.org/pdb

Structures 3D expérimentales (cristallographie et RMN)

20/09/2005: 32 727 structures disponibles

27 954 / cristallographie

4 773 / RMN

Fin 2000: 13 500 structures

Fin 1995: 4000

Fin 1990: < 50

II- Banques de données

- affinement des structures expérimentales : calcul des positions de chaînes latérales des acides aminés

- évaluation de la faisabilité de mutations ponctuelles

- prédiction de structures : construction de modèles à partir d’une structure de protéine connue de séquence analogue

- étude des interactions protéine-ligand ou leur modélisation (docking)

- étude de la trajectoire de substrats vers le site actif

- évaluation de la flexibilité des boucles

- design de molécules, d’inhibiteurs

Structure/FonctionIV- Modélisation moléculaire

ApplicationsApplicationsApplicationsApplications

V- Ingénierie rationnelle

DémarcheDémarcheDémarcheDémarche

� Analyse de la structure 3D de la protéine et de ses complexes

� identification des positions cibles

� modélisation moléculaire

� Mutagénèse dirigée des résidus identifiés

� construction, expression et purification des variants

� Caractérisation biochimique de l ’activité des mutants

�démonstration du rôle de ces résidus

�bases moléculaires de la catalyse dans le cas des enzymes

Amorce sens mutée

Gene recombinant

ERI

ERII

vecteur

Amorce reverse

mutationgene

ERI

ERII

vecteur

+

ERI

ERII

vecteurAmorce sens

1. PCR I: amorce sens mutagene+ amorce reverse normale

2. Purification du produit PCR (Quiagen columns)

3. PCR II: amorce sens normale

+ produit PCR I comme amorce reverse (mega primer)

V- Ingénierie rationnelle

Mutagenèse dirigéeMutagenèse dirigéeMutagenèse dirigéeMutagenèse dirigée

mutationERI

mutation

ERII

Gene muté

dsrS

ERIvecteur

+ERII

mutationERI

ERII

4. Purification du produit PCR II

5. Digestion de l’ADN plasmidique et du produit PCRII par les enzymes de restriction (ERI et ERII)

6. Ligation de l’insert et du vecteur et transformation d’E. coli

V- Ingénierie rationnelle

Mutagenèse dirigéeMutagenèse dirigéeMutagenèse dirigéeMutagenèse dirigée

Plamide recombinant muté

V- Ingénierie rationnelle

Cinétique enzymatiqueCinétique enzymatiqueCinétique enzymatiqueCinétique enzymatique

� Détermination des vitesses réactionnelles en variant [substrat],[produits], [inhibiteurs]

� Calcul des constantes cinétiques (Vmax, constante d’affinité Km, constante catalytique Kcat)

V- Ingénierie rationnelle

Cinétique enzymatiqueCinétique enzymatiqueCinétique enzymatiqueCinétique enzymatique

F G-Ftrehalulose

F

G-Fturanose

Sucrose isomerisation

G-enzymesucrose

GF + enzyme

F

G2

G3maltotriose

G

G2maltose

PolymerisationNon-reducing end

Gn

Gn+1

Insoluble amylose

Soluble maltooligosaccharides

G

HydrolysisH2O

glucose

Glc dans leur position cristallographique

Glc déplacés

OB2

OB1

Glc modélisés

Ramification αααα-1,6

V- Ingénierie rationnelle

Modélisation de l’arrimage du glycogèneModélisation de l’arrimage du glycogèneModélisation de l’arrimage du glycogèneModélisation de l’arrimage du glycogène

Glc dans leur position cristallographique

Glc déplacés

Glc modélisés

OB2

OB1

Tyr412

Phe417

V- Ingénierie rationnelle

OB2

OB1 SILLON

� mutation Y412G : activité de glucosylation du glycogène X 2

� Arrimage facilité sans Y412

Gly412

Phe417

V- Ingénierie rationnelle

� mutation F417A : réduit la glucosylation du glycogène

� F417 site d’arrimage clef

V- Ingénierie rationnelle

OB2

Phe417

Ext.

Red.

Ramification α-1,6

- Manque de données structurales (structures< 15 % de protéines de séquence connue)

- Résultat de la mutation non conforme à la prédiction

(effets mal connus sur le repliement, la stabilité, la dynamique)

-Difficulté/impossibilité d’identifier les aa clefs loin du site actif

- Obtention de mutants améliorés fastidieuse

(analyse des séquences et de la structure/ obtention des mutants/caractérisation fonctionnelle/ séquençage/ construction des double-mutants)

V- Ingénierie rationnelle

Les limitesLes limitesLes limitesLes limites

-Connaissance de la séquence

-Expression recombinante dans bactéries ou levures

- Génération de diversité au sein du gène

(mutations et recombinaisons aléatoires banques)

- Sélection et/ou criblage phénotypique des variants

Évolution dirigée

In vitro, en accéléré

Reproduire l’évolution naturelle des protéines

Mutations / Sélection /Recombinaisons

1 aa est muté en 200 000 ans dans une protéine de 900 aa

Alberts et al. Bio.Mol.Cell. (1990)

VI- Ingénierie combinatoire

L’évolution dirigéeL’évolution dirigéeL’évolution dirigéeL’évolution dirigée

VI- Ingénierie combinatoire

Générer la diversité : DNA Générer la diversité : DNA Générer la diversité : DNA Générer la diversité : DNA shufflingshufflingshufflingshuffling

Fragmentation

Séquences recombinées

Reassemblage par PCR sans amorce

Gène parent

Mutagénèse aléatoire

Banques de variants(106 à 1010 variants)

Transformation d’E. coli

VI- Ingénierie combinatoire

CriblageCriblageCriblageCriblage

Croissance et expressionen milieu liquide

Lyse

Réaction enzymatique

Identification des clones positifs

Sélection

des clones actifsMicroplaques

96 puits

Repiquage des colonies

Automatisation

Conditions de criblage

- expression / efficacité

- thermostabilité

- résistance aux solvants organiques

- résistance au pH

- spécificité modifiée

- ……

VI- Ingénierie combinatoire

Robotique : duRobotique : duRobotique : duRobotique : du colony picking colony picking colony picking colony picking à la détection des hitsà la détection des hitsà la détection des hitsà la détection des hits

Cadence de criblage : 3 000 – 10 000 clones / semain e

Pour un bon criblage

�Faible taux de positifs (0,3-1 %)�Peu d’interférences�Spécificité, sensibilité, réplicabilité, reproductibilité�Acquisition rapide des données (< 10 min / plaque)

Miniaturisation et robotisationDe 4 mois à 1 an

Coûts de fonctionnementDe 0,05 à 1,5 € / point

VI- Ingénierie combinatoire

Robotique : oui, mais…Robotique : oui, mais…Robotique : oui, mais…Robotique : oui, mais…

VI- Ingénierie combinatoire

Exemple : Exemple : Exemple : Exemple : l’amylosaccharasel’amylosaccharasel’amylosaccharasel’amylosaccharase

Amylosaccharase

fructose

αααα-1,4-glucanesaccharose

- Peu thermostable- Peu efficace- Réactions indésirables

Mais :

AS

Milieu minéral supplémenté de saccharose

25 % actif inactif

Diametre x 1.4

Diametre x 23

VI- Ingénierie combinatoire

Exemple de sélectionExemple de sélectionExemple de sélectionExemple de sélection

Amylosaccharase sauvage Mutant inactifControle -Controle +

Synthèsed’amylose

Libération de fructose

VI- Ingénierie combinatoire

Exemple de de criblage de l’activitéExemple de de criblage de l’activitéExemple de de criblage de l’activitéExemple de de criblage de l’activité

Mutations Activité

005-D2 Pro41 x 4Val389Leu Domaine IV (b7) Asn503Ileavant L8

006-G1 Arg20C ys N-term x 5Ala148Phe598Ser C-term

VI- Ingénierie combinatoire

Exemple : Amélioration de l’efficacité de l’ASExemple : Amélioration de l’efficacité de l’ASExemple : Amélioration de l’efficacité de l’ASExemple : Amélioration de l’efficacité de l’AS

006-G1005-D2

Variant C

Variant B

AS WT

0

1

2

3

4

5

6

0 10 20 30 40 50 60

temps d'incubation (min)

ln (

% A

ctiv

ité)

B C WT

→→→→ 1 min

→→→→ 11 min

→→→→ 35 min

VI- Ingénierie combinatoire

Exemple : Amélioration de la stabilité à 50°CExemple : Amélioration de la stabilité à 50°CExemple : Amélioration de la stabilité à 50°CExemple : Amélioration de la stabilité à 50°C

-Méthodes de recombinaison simples et robustes

-Outil rapide, puissant

-Etapes limitantes (temps et coût): sélection, criblage, miniaturisation, robotisation

- Intérêt applicatif (enzymes performantes) et cognitif (relations structure-fonction)

- Combiner ingénieries rationnelle et aléatoireTechniques semi-aléatoires

VI- Ingénierie combinatoire

Vers l’ingénierie semiVers l’ingénierie semiVers l’ingénierie semiVers l’ingénierie semi----aléatoirealéatoirealéatoirealéatoire