40
Exposé BIZUTAGE Aujourd'hui : Philippe VEBER & Goulven KERBELLEC – JOBIM – ECCB/ISMB

–JOBIM – ECCB/ISMB - · PDF fileJOBIM 2004 • Montréal (conférence francophone) • 28-30 juin se•6ton kye • 30 articles • 90 posters

  • Upload
    lehuong

  • View
    215

  • Download
    1

Embed Size (px)

Citation preview

Exposé BIZUTAGE

• Aujourd'hui : Philippe VEBER & Goulven KERBELLEC – JOBIM

– ECCB/ISMB

JOBIM 2004 & ECCB/ISMB 2004

• 5èmes Journées Ouvertes Biologie Informatique Mathématiques• http://www.congresbcu.com/jobim2004/fr/default_fra.htm

• European Conference on Computational Biology /Intelligent Systems for Molecular Biology

• http://www.iscb.org/ismbeccb2004

JOBIM 2004

• Montréal (conférence francophone)

• 28-30 juin

• 6 keynotes

• 30 articles

• 90 posters

Keynotes (1)

• Mathieu BLANCHETTE «Approches informatiques pour la détection et la caractérisation de régions fonctionnelles non-codantes dans le génome humain»

– Université de McGill

– Université de Washington

Keynotes (1)

• Mathieu BLANCHETTE «Approches informatiques pour la détection et la caractérisation de régions fonctionnelles non-codantes dans le génome humain»

– L'objectif est d'identifier les sous-séquencesrégulatrices dans les séquences d'ADN

– Sachant que si elles sont fonctionnelles elles ont moins évolué que les sous-séquencesnon-fonctionnelles(Phylogenic Footprinting)

An Exact Algorithm(generalizing Sankoff and Rousseau 1975)

Wu [s] = best parsimony score for subtree rooted at node u,

if u is labeled with string s.

AGTCGTACGTG

ACGGGACGTGC

ACGTGAGATAC

GAACGGAGTAC

TCGTGACGGTG

…ACGG: 2ACGT: 1...

ACGG: 0ACGT: 2...

ACGG: 1ACGT: 1...

ACGG: +∞ACGT: 0...

…ACGG: 1 ACGT: 0 ...

4k entries

…ACGG: 0 ACGT: +∞...

ACGG:∞ACGT :0 ...

ACGG:∞ACGT :0 ...

ACGG:∞ACGT :0 ...

Keynotes (1)

• Mathieu BLANCHETTE

* Blanchette, M. and Tompa, M. (2002) Discovery of Regulatoryelements by a computational method for phylogenetic footprinting. Genome Research.

* Blanchette, M., Schwikowski, B. and Tompa, M. (2001) Algorithms for phylogenetic footprinting. Journal of Computational Biology.

* Blanchette, M. and Sinha, S. (2001) Separating real motifs from theirartifacts. Bioinformatics (ISMB special issue).17:S30-S38.

Keynotes (2)

• Les Phylogénistes :Hervé PHILIPPE versus Bernard DUJON

«Rôle de la spéciation et importance des stratégies de reproduction sur l'origine et le maintien de la

biodiversité du genre Echinocardium (échinides spatangoïdes) ; comparaisons des approches moléculaire

contre morphométrique»versus« Evolution of gene order in the genomes of two related yeast species»

– Absolument pas d'accord sur une position d'une levure dans un arbre phylogénétique ...

Quelques Articles

• JO-1 & JO-10 sur les alphabets structuraux– "Description simplifiée des conformations 3D

des protéines à l'aide d'un Alphabet Structural", Anne-Claude CAMPROUX INSERM U346 PARISVII

– "Prédiction de l'architechture protéique locale par l'intermédiaire d'un Alphabet Structural", Thomas VINCENT INSERM U346 PARISVII

=> 27 blocs structuraux appris par HMM qui déterminent les directions des protéines dans l'espace

Quelques Articles (2)

• JO-77– "Vers l'identification de nouveaux oncogènes

et gènes suppresseurs de tumeurs. Analyse automatique des données de puces CGH (Comparative Genomic Hybridization)", Céline

ROUVEIROL LRI, PARIS SUD et Institut CURIE

• JO-46– "Apprentissage d'automates par fusions de

paires de fragments significativement similaires et premières expérimentations sur les protéines MIP", F. COSTE

ISMB/ECCB 2004

ISMB/ECCB 2004

• 8 keynotes

• 50 articles

• 952 posters …

• 2000 participants

Keynotes (1)

• Uri ALON «Simplicity in Complex Biological Networks»– Recherche de motifs simples dans les réseaux

• Génétiques

• Neuronaux

• Écologiques

• Électroniques

Weizmann Institute of Science,

ISRAEL

Keynotes (1)

• Uri ALON «Simplicity in Complex Biological Networks»

Keynotes (1)

• Uri ALON «Simplicity in Complex Biological Networks»

Keynotes (1)

• Uri ALON «Simplicity in Complex Biological Networks»– "Network Motifs : Simple Building Blocks of Complex

Networks" SCIENCE vol 298 oct 2002

– "Dynamics of the P53-Mdm2 feedback loop in living cells" NATURE GENETICS

– "Super-families of evolved and designed networks"SCIENCE

– "Network motifs in the transcriptional regulationnetwork of Escherichia Coli"

NATURE GENETICS avril 2002

Keynotes (2)

• David LIPMAN «Message & Meaning in Sequence Comparison : Is Systems Biology Possible ?»

– Mr NCBI

– PubMed

– Algo "Wilbur-Lipman" 1983• FASTA 1988

• BLAST 1990

• PSI-BLAST1997

Keynotes (3)

• Denis NOBLE « Computational Systems Biology of the Heart »– Université d'Oxford

– Modélisation d'organes

– 1er cœur virtuel

Keynotes (3)

• Denis NOBLE « Computational Systems Biology of the Heart »

Keynotes (3)

• Denis NOBLE « Computational Systems Biology of the Heart »

Keynotes (3)

• Denis NOBLE « Computational Systems Biology of the Heart »

Keynotes (3)

• Denis NOBLE « Computational Systems Biology of the Heart »– "Modelling the heart: from genes to cells to the whole

organ" SCIENCE 2002

– "Computational modelling of biological systems : toolsand visions" The Royal Society 2000

Keynotes (4)

• Anna TRAMONTANO «Progress, Assessment and Perspective in Protein Structure Prediction»

– molecular graphics software "Insight"

– Membre d'EMBL

Keynotes (4)

• Anna TRAMONTANO «Progress, Assessment and Perspective in Protein Structure Prediction»

– BIOSYM's Insight II

Keynotes (4)

• Anna TRAMONTANO «Progress, Assessment and Perspective in Protein Structure Prediction»– 112 publications

• Cf : http://cassandra.bio.uniroma1.it/~tramonta/publ.htm

– Relations entre les structures des moléculesd'immunoglobulines

– Prédiction des structures d'anticorps

– …

ALIGNEMENT MULTIPLE

• "MUSCLE" versus "PROBCONS"

Equipe de Robert EDGAR

Equipe de Chuong DO

ALIGNEMENT MULTIPLE

• "MUSCLE" – Le plus performant d'après leurs expérimentations

• Par rapport à T-coffee, MUSCLE aligne 1,5% plus de positions de façon correcte sur le benchmark "BAliBASE"

• On passe à 5% plus de positions sur leur propre benchmark : PREFAB

• Plus rapide et plus fin que PROBCONS

• Beaucoup plus rapide que CLUSTALW– "MUSCLE is able to align 5,000 sequences of length 350 in 7

minutes. We estimate that CLUSTALW would require about a year to complete this test."

ALIGNEMENT MULTIPLE

• "MUSCLE"

ALIGNEMENT MULTIPLE

• "PROBCONS"– "Many heuristic strategies use progressive

alignment based on an evolutionary tree or iterative approaches, but are prone to errors in early stages of alignment. To combat this, post-processing steps such as iterative refinement are applied."

ALIGNEMENT MULTIPLE• "PROBCONS"

ALIGNEMENT MULTIPLE

• "MUSCLE" va travailler avec "PROBCONS" pour faire le meilleur de l'alignement multiple !

LA TRANSITIVITE

• "Si une séquence X ressemble à une séquence Y et que Y ressemble à Z, alors X ressemble à Z"

• Tracking repeats using significance andtransitivity,Radek SZKLARCZYK and Jaap HERINGA– TRUST méthode ab initio pour déterminer les répétitions

internes dans les protéines

LA TRANSITIVITE

• "Si une séquence (fragment) X ressemble à une séquence Y et que Y ressemble à Z, alors X ressemble à Z"

• Rq : transitivité dans JO-46 (support) et dans SCANPS(extension)

STRUCTURE 3D

• Striped sheets and protein contact prediction, Robert MacCALLUM

• Assigning transmembrane segments to helices in intermediate-resolutionstructures, Angela ENOSH

• Protein network inference from multiple genomic data : a supervised approach, Y. YAMANISHI

ECCB/ISMB 2004Modeles probabilistes et reseaux

ECCB/ISMB 2004 – p.1/5

Couplage phylogenie – modele markovien

• Efficient approximations for learning phylogeneticHMM models from data, Jojic, Meek, Geiger, Siepel,Haussler et Heckerman

• approximations pour le calcul de la log vraisemblanced’un couplage

• formulation d’une borne inferieure atteinte

• application : identification d’un ılot CpG

ECCB/ISMB 2004 – p.2/5

Vu egalement

• Improved techniques for the identification ofpseudogenes, Coin et Durbin

• Deconvolving cell cycle expression data withcomplementary information, Bar-Joseph, Farkash,Gifford, Simon et Rosenfeld

• puces a ADN −→ mesure sur un ensemble de cellules

• synchronisation de cette population ?

ECCB/ISMB 2004 – p.3/5

Inference de reseaux de regulation

• Inferring quantitative models of regulatory networksfrom expression data, Nachman, Regev et Friedman

• inference des parametres cinetiques et du graphed’interaction

• Protein network inference from multiple genomicdata: a supervised approach, Yamanishi, Vert, Kanehisa

ECCB/ISMB 2004 – p.4/5

Que faire avec des reseaux ?

Etude de la dynamique :

• A knowledge based approach for representing andreasoning about signaling networks, Baral, Tran,Chancellor, Joy et Berens

• on y travaille aussi

Comme source de donnees pour d’autres taches :

• Learning kernels from biological networks bymaximizing entropy, Noble et Tsuda

ECCB/ISMB 2004 – p.5/5