Upload
lehuong
View
215
Download
1
Embed Size (px)
Citation preview
JOBIM 2004 & ECCB/ISMB 2004
• 5èmes Journées Ouvertes Biologie Informatique Mathématiques• http://www.congresbcu.com/jobim2004/fr/default_fra.htm
• European Conference on Computational Biology /Intelligent Systems for Molecular Biology
• http://www.iscb.org/ismbeccb2004
Keynotes (1)
• Mathieu BLANCHETTE «Approches informatiques pour la détection et la caractérisation de régions fonctionnelles non-codantes dans le génome humain»
– Université de McGill
– Université de Washington
Keynotes (1)
• Mathieu BLANCHETTE «Approches informatiques pour la détection et la caractérisation de régions fonctionnelles non-codantes dans le génome humain»
– L'objectif est d'identifier les sous-séquencesrégulatrices dans les séquences d'ADN
– Sachant que si elles sont fonctionnelles elles ont moins évolué que les sous-séquencesnon-fonctionnelles(Phylogenic Footprinting)
An Exact Algorithm(generalizing Sankoff and Rousseau 1975)
Wu [s] = best parsimony score for subtree rooted at node u,
if u is labeled with string s.
AGTCGTACGTG
ACGGGACGTGC
ACGTGAGATAC
GAACGGAGTAC
TCGTGACGGTG
…ACGG: 2ACGT: 1...
…
ACGG: 0ACGT: 2...
…
ACGG: 1ACGT: 1...
…
ACGG: +∞ACGT: 0...
…ACGG: 1 ACGT: 0 ...
4k entries
…ACGG: 0 ACGT: +∞...
…
ACGG:∞ACGT :0 ...
…
ACGG:∞ACGT :0 ...
…
ACGG:∞ACGT :0 ...
Keynotes (1)
• Mathieu BLANCHETTE
* Blanchette, M. and Tompa, M. (2002) Discovery of Regulatoryelements by a computational method for phylogenetic footprinting. Genome Research.
* Blanchette, M., Schwikowski, B. and Tompa, M. (2001) Algorithms for phylogenetic footprinting. Journal of Computational Biology.
* Blanchette, M. and Sinha, S. (2001) Separating real motifs from theirartifacts. Bioinformatics (ISMB special issue).17:S30-S38.
Keynotes (2)
• Les Phylogénistes :Hervé PHILIPPE versus Bernard DUJON
«Rôle de la spéciation et importance des stratégies de reproduction sur l'origine et le maintien de la
biodiversité du genre Echinocardium (échinides spatangoïdes) ; comparaisons des approches moléculaire
contre morphométrique»versus« Evolution of gene order in the genomes of two related yeast species»
– Absolument pas d'accord sur une position d'une levure dans un arbre phylogénétique ...
Quelques Articles
• JO-1 & JO-10 sur les alphabets structuraux– "Description simplifiée des conformations 3D
des protéines à l'aide d'un Alphabet Structural", Anne-Claude CAMPROUX INSERM U346 PARISVII
– "Prédiction de l'architechture protéique locale par l'intermédiaire d'un Alphabet Structural", Thomas VINCENT INSERM U346 PARISVII
=> 27 blocs structuraux appris par HMM qui déterminent les directions des protéines dans l'espace
Quelques Articles (2)
• JO-77– "Vers l'identification de nouveaux oncogènes
et gènes suppresseurs de tumeurs. Analyse automatique des données de puces CGH (Comparative Genomic Hybridization)", Céline
ROUVEIROL LRI, PARIS SUD et Institut CURIE
• JO-46– "Apprentissage d'automates par fusions de
paires de fragments significativement similaires et premières expérimentations sur les protéines MIP", F. COSTE
Keynotes (1)
• Uri ALON «Simplicity in Complex Biological Networks»– Recherche de motifs simples dans les réseaux
• Génétiques
• Neuronaux
• Écologiques
• Électroniques
Weizmann Institute of Science,
ISRAEL
Keynotes (1)
• Uri ALON «Simplicity in Complex Biological Networks»– "Network Motifs : Simple Building Blocks of Complex
Networks" SCIENCE vol 298 oct 2002
– "Dynamics of the P53-Mdm2 feedback loop in living cells" NATURE GENETICS
– "Super-families of evolved and designed networks"SCIENCE
– "Network motifs in the transcriptional regulationnetwork of Escherichia Coli"
NATURE GENETICS avril 2002
Keynotes (2)
• David LIPMAN «Message & Meaning in Sequence Comparison : Is Systems Biology Possible ?»
– Mr NCBI
– PubMed
– Algo "Wilbur-Lipman" 1983• FASTA 1988
• BLAST 1990
• PSI-BLAST1997
Keynotes (3)
• Denis NOBLE « Computational Systems Biology of the Heart »– Université d'Oxford
– Modélisation d'organes
– 1er cœur virtuel
Keynotes (3)
• Denis NOBLE « Computational Systems Biology of the Heart »– "Modelling the heart: from genes to cells to the whole
organ" SCIENCE 2002
– "Computational modelling of biological systems : toolsand visions" The Royal Society 2000
Keynotes (4)
• Anna TRAMONTANO «Progress, Assessment and Perspective in Protein Structure Prediction»
– molecular graphics software "Insight"
– Membre d'EMBL
Keynotes (4)
• Anna TRAMONTANO «Progress, Assessment and Perspective in Protein Structure Prediction»
– BIOSYM's Insight II
Keynotes (4)
• Anna TRAMONTANO «Progress, Assessment and Perspective in Protein Structure Prediction»– 112 publications
• Cf : http://cassandra.bio.uniroma1.it/~tramonta/publ.htm
– Relations entre les structures des moléculesd'immunoglobulines
– Prédiction des structures d'anticorps
– …
ALIGNEMENT MULTIPLE
• "MUSCLE" – Le plus performant d'après leurs expérimentations
• Par rapport à T-coffee, MUSCLE aligne 1,5% plus de positions de façon correcte sur le benchmark "BAliBASE"
• On passe à 5% plus de positions sur leur propre benchmark : PREFAB
• Plus rapide et plus fin que PROBCONS
• Beaucoup plus rapide que CLUSTALW– "MUSCLE is able to align 5,000 sequences of length 350 in 7
minutes. We estimate that CLUSTALW would require about a year to complete this test."
ALIGNEMENT MULTIPLE
• "PROBCONS"– "Many heuristic strategies use progressive
alignment based on an evolutionary tree or iterative approaches, but are prone to errors in early stages of alignment. To combat this, post-processing steps such as iterative refinement are applied."
ALIGNEMENT MULTIPLE
• "MUSCLE" va travailler avec "PROBCONS" pour faire le meilleur de l'alignement multiple !
LA TRANSITIVITE
• "Si une séquence X ressemble à une séquence Y et que Y ressemble à Z, alors X ressemble à Z"
• Tracking repeats using significance andtransitivity,Radek SZKLARCZYK and Jaap HERINGA– TRUST méthode ab initio pour déterminer les répétitions
internes dans les protéines
LA TRANSITIVITE
• "Si une séquence (fragment) X ressemble à une séquence Y et que Y ressemble à Z, alors X ressemble à Z"
• Rq : transitivité dans JO-46 (support) et dans SCANPS(extension)
STRUCTURE 3D
• Striped sheets and protein contact prediction, Robert MacCALLUM
• Assigning transmembrane segments to helices in intermediate-resolutionstructures, Angela ENOSH
• Protein network inference from multiple genomic data : a supervised approach, Y. YAMANISHI
Couplage phylogenie – modele markovien
• Efficient approximations for learning phylogeneticHMM models from data, Jojic, Meek, Geiger, Siepel,Haussler et Heckerman
• approximations pour le calcul de la log vraisemblanced’un couplage
• formulation d’une borne inferieure atteinte
• application : identification d’un ılot CpG
ECCB/ISMB 2004 – p.2/5
Vu egalement
• Improved techniques for the identification ofpseudogenes, Coin et Durbin
• Deconvolving cell cycle expression data withcomplementary information, Bar-Joseph, Farkash,Gifford, Simon et Rosenfeld
• puces a ADN −→ mesure sur un ensemble de cellules
• synchronisation de cette population ?
ECCB/ISMB 2004 – p.3/5
Inference de reseaux de regulation
• Inferring quantitative models of regulatory networksfrom expression data, Nachman, Regev et Friedman
• inference des parametres cinetiques et du graphed’interaction
• Protein network inference from multiple genomicdata: a supervised approach, Yamanishi, Vert, Kanehisa
ECCB/ISMB 2004 – p.4/5
Que faire avec des reseaux ?
Etude de la dynamique :
• A knowledge based approach for representing andreasoning about signaling networks, Baral, Tran,Chancellor, Joy et Berens
• on y travaille aussi
Comme source de donnees pour d’autres taches :
• Learning kernels from biological networks bymaximizing entropy, Noble et Tsuda
ECCB/ISMB 2004 – p.5/5