36
Cadre de Lecture et Le Genome Browser et la bioinformatique

Le Genome Browser Cadre de Lecture et - Université de ...dbcm1501/BCM1501_A16...Premier cadre de lecture Cadre de lecture 1; 5’ – 3’ UUU UCU UAU AUG UAC CAU CAA CAG GGG CUG

  • Upload
    lamnhu

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Cadre de Lecture et Le Genome Browser

et la bioinformatique

C’est quoi la bioinformatique?

@HWI-M03555:10:000000000-ACGCE:1:1101:17116:1057 1:N:0:TTAGGCNGGTTTCTTTTTCTTCAGTCGTGTAAGTGACGATCATGTCCGGAGACGGGAAAATCCCNCGNTNCNNGNNNNCCTGGAGNNANNNNTTCATCCGTTTGACGNCNNNCGTGTCATNNNCTTNAAAGNTTCCCATAATGTGCGTNNNNNNNAGGGNNATGACGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTNNNNNNNNNNANCGGNNNGNNNTTTTTCTCNAGATTGAGNNNNNNNNNNNNGTTGGGCGTCT+#8BCCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGEGGGGGGGGGGGG#:C#:#:##:####::DFGGG##:####::DFGGGGGGGGGGG#:###::FGGGGG###::D#:AF7#:AFGGGGGGGGGGGGG#######38@F##8@DFGGB##########################################################################################################################################@HWI-M03555:10:000000000-ACGCE:1:1101:15352:1057 1:N:0:TTAGGCNGCAAGCCGTTTACGATAACATCAAACGGACTGAAGCGATGCTTGAACAATATGAAGANAANCNGNNCNNNNTTAAAAANNTNNNNGAGCGTAAAGAAATGNTNNNAAAGCTGANNNAGCNTGCTNCCGGGTTGCAGGAAGANNNNNNNATGANNGCTCTGATNNNNGNGNNNGNNNNNTNANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGANNNNNNNNNNANACCNNNGNNNAGGAAAAGNCAGCGAACNNNNNNNNNNNNAGATGATGCGT+#8ACCGGCFFGGGGGGGGGGGGGFEFGGGGGGGGGGGGGGGG9EF@FGGGGGGGGGGF#:C#:#9##:####:69CFFG##9####:9CFFCEGGGGFGGG#:###::BDEGGG###4::#:AFF#:=DDFG:CCFBFG=F@#######88@D##68DFGGGC#########################################################################################################################################@HWI-M03555:10:000000000-ACGCE:1:1101:16821:1057 1:N:0:TTAGGCNCCCAATATCTGCGCTATCTCTTCGAATGACATGTTTTGCACAGCGTGCATCATGAAANTGNCNTNNTNNNNTTCGGTANNCNNNNATAGGGCATCAGCGANTNNNTCCTTATCNNNATCNCTTANCTCTCCCTCAGCCTCTNNNNNNNTTGCNNATTCTTCNNNNNGNGNNNCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGNNNNNNNNNNGNCTTNNNTNNNGCAGCCATNCAAGAGTGNNNNNNNNNNNNCTGATCATACT+#8ACCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGG#:C#:#:##:####::DFGGE##:####::,CFFGFFCGFGG7#:###::AFGGGA###::9#:9A<#:ADCFG,AFCFGGGGF#######88@+##88@FGGD##########################################################################################################################################

@HWI-M03555:10:000000000-ACGCE:1:1101:17116:1057 1:N:0:TTAGGCNGGTTTCTTTTTCTTCAGTCGTGTAAGTGACGATCATGTCCGGAGACGGGAAAATCCCNCGNTNCNNGNNNNCCTGGAGNNANNNNTTCATCCGTTTGACGNCNNNCGTGTCATNNNCTTNAAAGNTTCCCATAATGTGCGTNNNNNNNAGGGNNATGACGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTNNNNNNNNNNANCGGNNNGNNNTTTTTCTCNAGATTGAGNNNNNNNNNNNNGTTGGGCGTCT+#8BCCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGEGGGGGGGGGGGG#:C#:#:##:####::DFGGG##:####::DFGGGGGGGGGGG#:###::FGGGGG###::D#:AF7#:AFGGGGGGGGGGGGG#######38@F##8@DFGGB##########################################################################################################################################@HWI-M03555:10:000000000-ACGCE:1:1101:15352:1057 1:N:0:TTAGGCNGCAAGCCGTTTACGATAACATCAAACGGACTGAAGCGATGCTTGAACAATATGAAGANAANCNGNNCNNNNTTAAAAANNTNNNNGAGCGTAAAGAAATGNTNNNAAAGCTGANNNAGCNTGCTNCCGGGTTGCAGGAAGANNNNNNNATGANNGCTCTGATNNNNGNGNNNGNNNNNTNANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGANNNNNNNNNNANACCNNNGNNNAGGAAAAGNCAGCGAACNNNNNNNNNNNNAGATGATGCGT+#8ACCGGCFFGGGGGGGGGGGGGFEFGGGGGGGGGGGGGGGG9EF@FGGGGGGGGGGF#:C#:#9##:####:69CFFG##9####:9CFFCEGGGGFGGG#:###::BDEGGG###4::#:AFF#:=DDFG:CCFBFG=F@#######88@D##68DFGGGC#########################################################################################################################################@HWI-M03555:10:000000000-ACGCE:1:1101:16821:1057 1:N:0:TTAGGCNCCCAATATCTGCGCTATCTCTTCGAATGACATGTTTTGCACAGCGTGCATCATGAAANTGNCNTNNTNNNNTTCGGTANNCNNNNATAGGGCATCAGCGANTNNNTCCTTATCNNNATCNCTTANCTCTCCCTCAGCCTCTNNNNNNNTTGCNNATTCTTCNNNNNGNGNNNCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGNNNNNNNNNNGNCTTNNNTNNNGCAGCCATNCAAGAGTGNNNNNNNNNNNNCTGATCATACT+#8ACCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGG#:C#:#:##:####::DFGGE##:####::,CFFGFFCGFGG7#:###::AFGGGA###::9#:9A<#:ADCFG,AFCFGGGGF#######88@+##88@FGGD##########################################################################################################################################

Le Dogme CentraleTTTTCTTATATGTACCATCAACAGGGGCTGGTTCADN

UUUUCUUAUAUGUACCAUCAACAGGGGCUGGUUCARN

Protéines ? ? ? ? ? ? ? ? ? ? ?

Transcription

Traduction

Code Génétique

Comment savoir par quel codon il faut commencer ?

Cadre de lectures● Façon de diviser une séquence d’ADN/ARN en groupes de trois nucléotides

consécutifs de façon à former des codons.

UUUUCUUAUAUGUACCAUCAACAGGGGCUGGUUCAUGUCCAACAACAGGGGCUGGUUUACCAUCAAUAGGG

GCUGGUUUACCAUCAACAGGUGAGUUACCAUCAACAGGGGCUGGUU

Premier cadre de lecture

Cadre de lecture 1; 5’ – 3’UUU UCU UAU AUG UAC CAU CAA CAG GGG CUG GUU CAU GUC CAA CAA CAG GGG CUG Phe Ser Tyr Met Tyr His Gln Gln Gly Leu Val His Val Gln Gln Gln Gly Leu

GUU UAC CAU CAA UAG GGG CUG GUU UAC CAU CAA CAG GUG AGU UAC CAU CAA CAG Val Tyr His Gln ∗ Gly Leu Val Tyr His Gln Gln Val Ser Tyr His Gln Gln

GGG CUG GUU Gly Leu Val

Deuxieme cadre de lectureCadre de lecture 2; 5’ – 3’U UUU CUU AUA UGU ACC AUC AAC AGG GGC UGG UUC AUG UCC AAC AAC AGG GGC UGA Phe Leu Ile Cys Thr Ile Asn Arg Gly Trp Phe Met Phe Asn Asn Arg Gly ∗

UUU ACC AUC AAU AGG GGC UGG UUU ACC AUC AAC AGG UGG GUU ACC AUC AAC AG Phe Thr Ile Asn Arg Gly Trp Phe Thr Ile Asn Arg Trp Val Thr Ile Asn Arg

G GGC UGG UU Gly Trp

Troisième cadre de lectureCadre de lecture 3; 5’ – 3’UU UUC UUA UAU GUA CCA UCA ACA GGG GCU GGU UCA UGU CCA ACA ACA GGG GCU GGU Phe Leu Tyr Val Pro Ser Thr Arg Ala Gly Ser Cys Pro Thr Thr Arg Ala Gly

UUA CCA UCA AUA GGG GCU GGU UUA CCA UCA ACA GGU GGG UUA CCA UCA ACA GGGLeu Pro Ser Ile Arg Ala Gly Leu Pro Ser Thr Gly Gly Leu Pro Ser Thr Gly

GCU GGU UAla Gly

Quatrieme cadre de lecture?Cadre de lecture 1; 5’ – 3’UUU UCU UAU AUG UAC CAU CAA CAG GGG CUG GUU CAU GUC CAA CAA CAG GGG CUG Ser Tyr Met Tyr His Gln Gln Gly Leu Val His Val Gln Gln Gln Gly Leu

GUU UAC CAU CAA UAG GGG CUG GUU UAC CAU CAA CAG GUG AGU UAC CAU CAA CAG Val Tyr His Gln ∗ Gly Leu Val Tyr His Gln Gln Val Ser Tyr His Gln Gln

GGG CUG GUU Gly Leu Val

Comme le premier!!

Il existe cependant les cadres de lectures appeler -1, -2 et -3 pour le brin complémentaire d’un ADN double brins.

Cadre de lecture ouvert● Open Reading Frame (ORF)

● Séquence d’ARN débutant par le codon d’initiation (AUG) et se terminant par un codon stop (UAA, UAG, UGA)

● Entre ces deux codons se trouve une succession de codons qui forme, potentiellement, une protéine

Cadre de lecture 1; 5’ – 3’

UUU UCU UAU AUG UAC CAU CAA CAG GGG CUG GUU CAU GUC CAA CAA CAG GGG CUG Phe Ser Tyr Met Tyr His Gln Gln Gly Leu Val His Val Gln Gln Gln Gly Leu

GUU UAC CAU CAA UAG GGG CUG GUU UAC CAU CAA CAG GUG AGU UAC CAU CAA CAG Val Tyr His Gln ∗ Gly Leu Val Tyr His Gln Gln Val Ser Tyr His Gln Gln

GGG CUG GUU Gly Leu Val

Cadre de lecture 2; 5’ – 3’

U UUU CUU AUA UGU ACC AUC AAC AGG GGC UGG UUC AUG UCC AAC AAC AGG GGC UGA Phe Leu Ile Cys Thr Ile Asn Arg Gly Trp Phe Met Phe Asn Asn Arg Gly ∗

UUU ACC AUC AAU AGG GGC UGG UUU ACC AUC AAC AGG UGG GUU ACC AUC AAC AG Phe Thr Ile Asn Arg Gly Trp Phe Thr Ile Asn Arg Trp Val Thr Ile Asn Arg

G GGC UGG UU Gly Trp

Le Genome Browser

Le Genome Browser

Le Genome Browser● Le genome browser permet de mieux visualiser l’information sur la region

demander.

● Regroupe multiple information sur la région.

Les formats de fichiers - FASTA>Identifiant CommentaireXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

>gi|373251181|ref|NG_001742.2| Mus musculus olfactory receptor GA_x5J8B7W2GLP-600-794 (LOC257854) pseudogène on chromosome 2AGCCTGCCAAGCAAACTTCACTGGAGTGTGCGTAGCATGCTAGTAACTGCATCTGAATCTTTCAGCTGCTTGTTGGGCCTCTCACAAGGCAGAGTGTCTTCATGGGACTTTGATATTTATTTTTGTACAACCTAAGAGGAACAAATCCTTTGACACTGACAAATTGGCTTCCATATTTTATACCTTAATCATCTCCATGTTGAATTCATTGATCAACAGTTTAAGAAAAAAAGATGTAAAAATGCTTTTAGAAAGAGAGGCAAAGTTATGCACAATAACTTCTCATGAAGTCACAGTTTGTTAAAAGTTGCCTTAGTTCACAATAAATAATTATGTATGCTCTATAATTTCAGTGA

Formats de Fichier - GENBANK

Linux…

N'AYEZ PAS PEUR!

LES DEMOS ET GOOGLE SONT VOS AMIS! :)

Se connecter1- Connectez vous sur windows (pXXXXXX et mot de passe)

2- Connectez vous sur linux (pXXXXX et mot de passe choisi)

3-Bienvenue sur linux!!!

Jouer sur linux, familiarisez vous avec le terminal

Quelques commandes à connaître

-List → ls-Make Directory → mkdir-Change Directory → cd + nom

répertoire

-Print Working Directory → pwd

Make Directory → mkdir

1. Dans votre console, créez un répertoire de travail pour le cours BCM1501 (cela permet de mieux organiser vos données)

2. Vérifiez que votre dossier a bien été crée

List → ls

3. Déplacez-vous du répertoire (dossier) courant au répertoire BCM1501

Change Directory → cd + nom

répertoire

Important▪ Faites attention aux Majuscules et minuscules

▪ Linux n’aime pas les espaces

▫ ➔ écrire “nom_de_fichier” ou “NomDeFichier” au lieu de “nom de fichier”

▪ Quand vous travaillez sous Linux, n’essayez pas de télécharger quoique ce soit à partir de Windows… Il s’agit de 2 systèmes indépendants!

▪ Assurez-vous d’être invités par Linux avant de taper vos commandes → “/usagers_bac/p0xxxxxx>”

● Utilisez l'éditeur de texte gedit

● Copier/Coller en console:Sélection avec le bouton droit de la sourisRelâchement des données avec le bouton du milieu (roulette) OUctrl-shift-c pour copier, ctrl-shift-v pour coller