Upload
alisa-obrien
View
38
Download
0
Tags:
Embed Size (px)
DESCRIPTION
Introduktion til de praktiske øvelser. Vi vil i dag fokusere på tre forskellige online software til SNP analyser snpTree NDtree CSIphylogony. Introduktion til SNP analyser. http://cge.cbs.dtu.dk/services/all.php. snpTree. DRAG’n Drop (eller brug Browse) til at uploade filer. - PowerPoint PPT Presentation
Citation preview
Introduktion til de praktiske øvelser
Vi vil i dag fokusere på tre forskellige online software til SNP analyser
• snpTree• NDtree• CSIphylogony
Introduktion til SNP analyserhttp://cge.cbs.dtu.dk/services/all.php
DRAG’n Drop (eller brug Browse) til at uploade filer
Vælg en reference (samme bakterielle species)
Vælg data format (her: Assembled genomes)
Vælg minimal distance der skal være imellem SNPs.
snpTree
…eller vælg din egen reference (index case? – draft genome)!!
Prune?Hvad er SNPs…og hvad bruger vi dem til?Hvad er forudsætningen for at vi kan bruge dem?
Lidt om.....filnavne….
Kirsten Siggaard Kirsten_SiggaardIngen MELLEMRUM (eller sære tegn!) i filnavne!!!
Submit……..og vent……eller start et nyt job..
snpTree
Vælg minimal distance der skal være imellem SNPs.
Vælg alt ”CTRL + A” teksten i vinduet
og kopier ”CTRL + C”
Åben herefter MS Excel og sæt teksten ind ”CTRL + V”
Vælg alt ”CTRL + A” teksten i vinduet
og kopier ”CTRL + C”
Åben herefter TreeViewer og sæt teksten ind ”CTRL + V”
http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php
http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php
http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php
Copy/Paste tekst fra NEWICK filen her!
Vil I prøve anden Træ-viewer, så kan man hente FigTree her: http://tree.bio.ed.ac.uk/software/figtree/
Extracting archives:7-ZIP: http://7-zip.org/WinRar: http://www.rarlab.com/download.htm
Bemærk: .vcf filer i Windows er kontakt-filer til Outlook!!
For at åbne en bioinformatisk .vcf fil* skal man højre-klikke på filen og vælge ”Åben med” og vælge ”Notesblok” som standardprogram til denne filtype!
* En bioinformatisk .vcf fil indeholder information om alle SNPs i forhold til referencen for hver af de sekvenser, man har uploadet.
Vælg alt ”CTRL + A” teksten i vinduet
Vælg alt ”CTRL + A” teksten i vinduet og kopier ”CTRL + C”
Åben herefter MS Excel og sæt teksten ind ”CTRL + V”
NDtree
DRAG’n Drop (eller brug Browse) til at uploade filer
Vælg din egen foretrukne reference…eller lad serveren identificere det bedste match fra en meget lang liste af fuldt sekventerede genomer fra NCBI...
Vælg ”Fast mode” i dag…
Find filen i ”Download” eller ”Overførsler” mappen i Windows stifinder
Bemærk: .mat filer i Windows er MS Access filer!!
For at åbne en bioinformatisk .mat distancefil skal man højreklikke på filen og vælge ”Åben med” og vælge ”Notesblok” som standardprogram til denne filtype!
Herefter kopieres indholdet ”CTRL + A”, ”CTRL + C” og sættes ind i Excel ”CTRL + V”
P.S. Output kan være ret svært at læse (det arbejdes der på)
Vælg alt med ”CTRL + A” og kopier ”CTRL + C”
Åben herefter ThreeViewer og sæt teksten ind ”CTRL + V”
http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php
CSI Phylogeny
DRAG’n Drop (eller brug Browse) til at uploade filer
Vælg din egen reference (index case/Typestamme?)!!
Submit dit job
Vælg minimal distance der skal være imellem SNPs.
Vælg alt med ”CTRL + A” og kopier ”CTRL + C”
Åben herefter TreeViewer og sæt teksten ind ”CTRL + V”
http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php
Herefter kopieres indholdet i Notepad med ”CTRL + A”, ”CTRL + C” og sættes ind i Excel ”CTRL + V”
Herefter kopieres indholdet i Notepad med ”CTRL + A”, ”CTRL + C” og sættes ind i Excel ”CTRL + V”
SNP øvelsen
• Øvelsessættet består af 7 Klebsiella pneumoniae stammer relateret til et udbrud af CTX-M-15/SHV-28 producerende K. pneumoniae med udgangspunkt i Hospitalet i Hillerød.
• Herudover vil I få udleveret den nærmest beslægtede (fuldt sekventerede) NCBI reference stammer.
• Og et ESBL producerende E. coli stamme til at teste med.
Test dataNavn År Dato Sted Patient Species
Kpn_1 2006 04.01 A 1 K. pneumoniae
Kpn_2 2008 22.01 B 2 K. pneumoniae
Kpn_3 2008 14.07 B 3 K. pneumoniae
Kpn_4 2008 02.12 A 4 K. pneumoniae
Kpn_5 2008 14.03 C 5 K. pneumoniae
Kpn_6 2009 03.04 A 4 K. pneumoniae
Kpn_7 2009 06.08 C 6 K. pneumoniae
Ref_1084 ? ? NCBI Reference K. pneumoniae
Ec 2008 E. coli
Leg og lær….
• Tanken er, at I kan prøve én eller flere af de forskellige SNP web-servere af med dette testsæt.• Det er muligt at sætte mere end ét job over ad gangen….• …..men husk på, at vi er 25, der gør det samtidig, hvilket godt kan
have en effekt på hastigheden af serveren.
• Skulle det gå helt galt, kan vi blive nødt til at genstarte serveren…!!
I kan få tilsendt en e-mail med resultatet
• Resultatet vil kun være tilgængeligt i 48 timer på serveren….herefter slettes linket. Så vil I gerne gemme resultaterne af jeres fremtidige søgninger, er I nødt til at gemme filerne!• Kører I flere jobs, så anbefales det varmt, at I skriver en lille note ned
angående jobbet (Hvilken reference, hvilken prune, hvilke stammer osv.)
Forslag til Jobs, der kan sættes i gangStart med at lave en folder på computerens skrivebord, som I navngiver med jeres initialer.
1. Prøv at køre enten snpTree, Ndtree eller CSI Phylogony med de 7 teststammer. Brug introduktionen fra før til at sikre jer, at I starter det, med de korrekte parametre.
Note snpTree: Vælg en af de 5 Klebsiella’er i NCBI listen og husk at vælge ”Assembled genomes” som input!Note NDtree: Prøv at lade NDtree selv finde referencen ved at lade feltet ”Template file” stå tomt.Note CSI Phylogeny: Vælg filen ”Ref_1084” som reference.
Kan I identificere udbrudsstammerne imellem de 7 isolater.
Prøv jer frem….I kan prøve at tjekke nogle af outputfilerne ud.
• Kan I finde, hvor mange SNPs der er til forskel imellem de forskellige udbrudsstammer?
• Kan I få hentet NEWICK filen og få den over i TreeViewer? Prøv at ændre på træet i ThreeViewer.
Prøv jer frem….Prøv at gentage jobbet med ændrede parametre (højere prune, ændre reference, samme sæt med en af de to andre web-servere..).
• Får I samme resultater?• Hvordan reagerer de forskellige SNP-servere på at der kommer en
forkert species (her E. coli) med i analysen?
Prøv jer frem….Prøv at gentage jobbet med ændrede parametre: • højere prune• ændre reference til index case (kpn_1)• samme sæt data med en af de to andre web-servere.
• Får I samme resultater med de ændrede parametre?• Hvordan reagerer de forskellige SNP-servere på at der kommer en
forkert species (her E. coli) med i analysen?
Resultater…..1. snpTree, alle 7 stammer, reference (MGH….), 10 prune2. snpTree, alle 7 stammer, reference (kpn_7), 10 prune3. NDtree, alle 7 stammer, ingen valgt reference4. CSI Phylogeny, alle 7 stammer, Ref (1084), 10 prune5. snpTree, 6 sidste stammer, Ref (kpn_1), 10 prune6. NDtree, 6 sidste stammer, Ref (kpn_1)7. CSI Phylogeny, 6 sidste stammer, Ref (kpn_1), 10 prune8. CSI Phylogeny, 7 + EC, Ref (1084), 10 prune9. snpTree, 7 + EC, Ref (1084), 10 prune10. NDtree, 7 + EC, Ref (1084)11. snpTree, 6 udbrudsstammer, Ref (kpn_1), prune 1012. NDtree, 6 udbrudsstammer, Ref (kpn_1)13. CSI Phylogeny, 6 udbrudsstammer, Ref (kpn_1), prune 10
1. snpTree, alle 7 stammer, reference (MGH….), 10 prune
2. snpTree, alle 7 stammer, reference (kpn_7), 10 prune
3. NDtree, alle 7 stammer, ingen valgt reference
4. CSI Phylogeny, alle 7 stammer, Ref (1084), 10 prune
5. snpTree, 6 sidste stammer, Ref (kpn_1), 10 prune
6. NDtree, 6 sidste stammer, Ref (kpn_1)
7. CSI Phylogeny, 6 sidste stammer, Ref (kpn_1), 10 prune
8. CSI Phylogeny, 7 + EC, Ref (1084), 10 prune
9. snpTree, 7 + EC, Ref (1084), 10 prune
10. NDtree, 7 + EC, Ref (1084)
11. snpTree, 6 udbrudsstammer, Ref (kpn_1), prune 10
12. NDTree, 6 udbrudsstammer, Ref (kpn_1),
13. CSI Phylogeny, 6 udbrudsstammer, Ref (kpn_1), prune 10