Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Sommersemester 2012
Dr. Toralf Kirsten, Anika Großhttp://dbs.uni-leipzig.de
Universität LeipzigInstitut für Informatik
Datenbanken in der
Bioinformatik
Kapitel 0
Organisation
DBS-Module
� Master-Studium � 10-202-2215 – Moderne Datenbanktechnologien (Kleines Modul))
� 10-202-2216 – Moderne Datenbanktechnologien (Großes Modul))
� 10-202-2213 – Anwendungsbezogene Datenbankkonzepte (Kleines Modul)
� 10-202-2214 – Anwendungsbezogene Datenbankkonzepte (Großes Modul)
� 10-202-2011 – Masterseminar Informatik / Seminarmodul
� Bachelor-Studium� 10-201-2211 – Datenbanksysteme 1
� 10-201-2212 – Datenbanksysteme 2
� 10-201-2210 – Datenbankpraktikum
� 10-201-2224 – Realisierung von Informationssystemen
� 10-201-2010 – Bachelorseminar Informatik / Seminarmodul
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Masterstudium DBS-Profil
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Vorlesung BiodatenbankenUniversität Leipzig
DBS-LehrveranstaltungenLogo Name Typ SWS Sem.
Datenbanksysteme 1 Einführung 2+1 WS
Datenbanksysteme 2 Einführung 2+1 SS
Implementierung von DBS 1
Vertiefung 2 WS
Implementierung von DBS 2
Vertiefung 2 SS
Mehrrechner-DBS Vertiefung 2 WS
Data Warehousing Vertiefung 2 SS
Datenintegration Vertiefung 2 WS
Bio-Datenbanken Vertiefung 2 SS
Ontologie-Management
Vertiefung 2 WS
Cloud Data Management
Vertiefung 2 SS
Name Typ Sem.
DB-Praktikum
Praktikum SS
Data-Warehouse-Praktikum
Praktikum WS
Problem-seminar
Seminar WS
Bachelor-seminar
SeminarSS+WS
Master-seminar
SeminarSS+WS
LV im SS12
Mapping: Module – Lehrveranstaltungen SS12
� Master-Module “Anwendungsbezogene Datenbankkonzepte” (zwei bzw. drei Veranstaltungen für kleines bzw. großes Modul):� Data Warehousing
� Cloud Data Management
� Bio-Datenbanken
� ggf. DBS2
� Bachelor-Modul “Realisierung von Informationssystemen” � Data Warehousing
� Cloud Data Management
� Bachelorseminar / Masterseminar � Vortrag über laufende Bachelor/Masterarbeit
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Vorlesung BiodatenbankenUniversität Leipzig
Zur Vorlesung allgemein …
� Vorlesung: donnerstags, 9:15-11:45 UhrSeminargebäude Universitätsstraße, Raum SG 3-10
� http://dbs.uni-leipzig.de/de/stud/2012ss/biodbs
� Abschluss� schriftliche Prüfung im Juli/August 2012 (60 min)
� erfolgreiche Klausurbewältigung setzt Kenntnisse und Fertigkeiten voraus, die die Mitarbeit in der Vorlesung erfordert
� Prüfungsrelevant ist die Vorlesung, nicht ein Skript
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Vorlesung BiodatenbankenUniversität Leipzig
Zur Vorlesung allgemein …
� Fragen oder Probleme � Jederzeit in der Vorlesung
� Sprechstunde: Nach Vereinbarung
� Anregungen und Kommentare zur Verbesserung
� Feedback ist ausdrücklich erwünscht!
� Kontakt� Dr. Toralf Kirsten
� Raum: 315 (P.-Rosenthal-Straße 27)
� Anika Groß
� Raum 4-25 (Johannisgasse 26)
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Vorlesung BiodatenbankenUniversität Leipzig
Vorlesungsziele
� Kenntnis typischer BioDB und ihre Klassifikation
� Sequenz-, Protein-, Genom-, Publikations-DB, …
� Semantik der Daten, Modelle, Zugriffsmethoden, Verwendung
� Grundverständnis wichtiger Verfahren zur Datengewinnung und -verarbeitung
� Sequenzierung, Microarray-Analyse, …
� Annotationskonzept
� Kenntnis wichtiger Integrationstechniken
� Ähnlichkeitssuche
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Vorlesung BiodatenbankenUniversität Leipzig
Vorläufiges Inhaltsverzeichnis
1. Motivation und Grundlagen
2. Klassifizierung von BioDB, Überblick
3. Sequenzierung und Genexpressionsanalyse
4. Datenmodelle und Anfragesprachen
5. Modellierungsalternativen
6. Versionierung von Datenbeständen
7. Annotationen
8. Datenintegration: Ansätze und Systeme
9. Datenmanagement in der Cloud
Groß
Kirsten
Groß
Kirsten
Groß
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Vorlesung BiodatenbankenUniversität Leipzig
Literatur
� Lesk: Bioinformatik – Eine Einführung. Spektrum Akademischer Verlag, 2003
� Letowsky: Bioinformatics – Database and Systems. Kluwer, 2001
� Lacroix, Critchlow: Bioinformatics: Managing Scientific Data. Morgan Kaufman, 2003
� Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000
� Waterman: Introduction to Computational Biology: Maps, Sequences, Genomes. CRC Press, 1995
� Vorlesungsskript basiert teilweise auf:� Sarah Cohen-Boulakia, Ulf Leser: Next Generation Data
Integration for the Life Sciences, Tutorial at ICDE 2011
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Vorlesung BiodatenbankenUniversität Leipzig
Literatur - Datenbanksysteme
• Viele Bücher und Publikationen vorhanden
• H. Garcia-Molina, J.D. Ullman, J. Widom: Database SystemsPrentice Hall, 2008
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Vorlesung BiodatenbankenUniversität Leipzig
Literatur – Daten-/Informationsintegration
• Viele Bücher und Publi-kationen vorhanden
Ulf Leser, Felix NaumannInformationsintegrationdpunkt.verlag, 2007
� relativ neu, umfassend,anschaulich
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Vorlesung BiodatenbankenUniversität Leipzig
Noch Fragen?
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Vorlesung BiodatenbankenUniversität Leipzig
Wiederholung
� Datenquelle, Datei, Datenbank, Datenbanksystem
� Informationssystem: Komplex aus Hard- und Software mit Komponenten zur dauerhaften Speicherung, Ausgabe und Verarbeitung von Daten in einer aus dem Themengebiet der erhaltenen Info begründeten Form� Daten � Information: mit Hilfe der Begriffswelt und der Theorien
einer Wissenschaft
� "begründete Form"� Begriffswelt muss bekannt und nutzbar sein
� Nutzerschnittstelle kennt Begriffswelt
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Vorlesung BiodatenbankenUniversität Leipzig
Wiederholung
� Schichtenmodell von DBMS
� Datenmodellierung
� Entity-Relationship-Modell� Entitäten und Beziehungen
� Zusätzlich: Attribute, Wertebereiche, Schlüssel
� UML-Modell� Klassen und Assoziationen
� Zusätzlich: Attribute, Methoden, …
� Unterschiedliche Diagrammtypen
Sommersemester 2012Dr. Toralf Kirsten, Anika Groß
Vorlesung BiodatenbankenUniversität Leipzig
Typen von Daten
� Wissen
� bestätigt, abstrakt, dicht
� Texte, Grafiken
� Publikationen
� Information
� Interpretiert, gefiltert
� Objekte, Annotationen
� Daten
� Gemessen, kontext-frei,rohe, dreckige Daten
� Zahlen, Sequenzen, Metadaten
Biocarta, Apoptosis Pathway
Affimetrix Chip
Micro Array