Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf ·...

Preview:

Citation preview

Sommersemester 2012

Dr. Toralf Kirsten, Anika Großhttp://dbs.uni-leipzig.de

Universität LeipzigInstitut für Informatik

Datenbanken in der

Bioinformatik

Kapitel 0

Organisation

DBS-Module

� Master-Studium � 10-202-2215 – Moderne Datenbanktechnologien (Kleines Modul))

� 10-202-2216 – Moderne Datenbanktechnologien (Großes Modul))

� 10-202-2213 – Anwendungsbezogene Datenbankkonzepte (Kleines Modul)

� 10-202-2214 – Anwendungsbezogene Datenbankkonzepte (Großes Modul)

� 10-202-2011 – Masterseminar Informatik / Seminarmodul

� Bachelor-Studium� 10-201-2211 – Datenbanksysteme 1

� 10-201-2212 – Datenbanksysteme 2

� 10-201-2210 – Datenbankpraktikum

� 10-201-2224 – Realisierung von Informationssystemen

� 10-201-2010 – Bachelorseminar Informatik / Seminarmodul

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Masterstudium DBS-Profil

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

DBS-LehrveranstaltungenLogo Name Typ SWS Sem.

Datenbanksysteme 1 Einführung 2+1 WS

Datenbanksysteme 2 Einführung 2+1 SS

Implementierung von DBS 1

Vertiefung 2 WS

Implementierung von DBS 2

Vertiefung 2 SS

Mehrrechner-DBS Vertiefung 2 WS

Data Warehousing Vertiefung 2 SS

Datenintegration Vertiefung 2 WS

Bio-Datenbanken Vertiefung 2 SS

Ontologie-Management

Vertiefung 2 WS

Cloud Data Management

Vertiefung 2 SS

Name Typ Sem.

DB-Praktikum

Praktikum SS

Data-Warehouse-Praktikum

Praktikum WS

Problem-seminar

Seminar WS

Bachelor-seminar

SeminarSS+WS

Master-seminar

SeminarSS+WS

LV im SS12

Mapping: Module – Lehrveranstaltungen SS12

� Master-Module “Anwendungsbezogene Datenbankkonzepte” (zwei bzw. drei Veranstaltungen für kleines bzw. großes Modul):� Data Warehousing

� Cloud Data Management

� Bio-Datenbanken

� ggf. DBS2

� Bachelor-Modul “Realisierung von Informationssystemen” � Data Warehousing

� Cloud Data Management

� Bachelorseminar / Masterseminar � Vortrag über laufende Bachelor/Masterarbeit

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Zur Vorlesung allgemein …

� Vorlesung: donnerstags, 9:15-11:45 UhrSeminargebäude Universitätsstraße, Raum SG 3-10

� http://dbs.uni-leipzig.de/de/stud/2012ss/biodbs

� Abschluss� schriftliche Prüfung im Juli/August 2012 (60 min)

� erfolgreiche Klausurbewältigung setzt Kenntnisse und Fertigkeiten voraus, die die Mitarbeit in der Vorlesung erfordert

� Prüfungsrelevant ist die Vorlesung, nicht ein Skript

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Zur Vorlesung allgemein …

� Fragen oder Probleme � Jederzeit in der Vorlesung

� E-Mail

� Sprechstunde: Nach Vereinbarung

� Anregungen und Kommentare zur Verbesserung

� Feedback ist ausdrücklich erwünscht!

� Kontakt� Dr. Toralf Kirsten

� tkirsten@izbi.uni-leipzig.de

� Raum: 315 (P.-Rosenthal-Straße 27)

� Anika Groß

� gross@informatik.uni-leipzig.de

� Raum 4-25 (Johannisgasse 26)

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Vorlesungsziele

� Kenntnis typischer BioDB und ihre Klassifikation

� Sequenz-, Protein-, Genom-, Publikations-DB, …

� Semantik der Daten, Modelle, Zugriffsmethoden, Verwendung

� Grundverständnis wichtiger Verfahren zur Datengewinnung und -verarbeitung

� Sequenzierung, Microarray-Analyse, …

� Annotationskonzept

� Kenntnis wichtiger Integrationstechniken

� Ähnlichkeitssuche

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Vorläufiges Inhaltsverzeichnis

1. Motivation und Grundlagen

2. Klassifizierung von BioDB, Überblick

3. Sequenzierung und Genexpressionsanalyse

4. Datenmodelle und Anfragesprachen

5. Modellierungsalternativen

6. Versionierung von Datenbeständen

7. Annotationen

8. Datenintegration: Ansätze und Systeme

9. Datenmanagement in der Cloud

Groß

Kirsten

Groß

Kirsten

Groß

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Literatur

� Lesk: Bioinformatik – Eine Einführung. Spektrum Akademischer Verlag, 2003

� Letowsky: Bioinformatics – Database and Systems. Kluwer, 2001

� Lacroix, Critchlow: Bioinformatics: Managing Scientific Data. Morgan Kaufman, 2003

� Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

� Waterman: Introduction to Computational Biology: Maps, Sequences, Genomes. CRC Press, 1995

� Vorlesungsskript basiert teilweise auf:� Sarah Cohen-Boulakia, Ulf Leser: Next Generation Data

Integration for the Life Sciences, Tutorial at ICDE 2011

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Literatur - Datenbanksysteme

• Viele Bücher und Publikationen vorhanden

• H. Garcia-Molina, J.D. Ullman, J. Widom: Database SystemsPrentice Hall, 2008

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Literatur – Daten-/Informationsintegration

• Viele Bücher und Publi-kationen vorhanden

Ulf Leser, Felix NaumannInformationsintegrationdpunkt.verlag, 2007

� relativ neu, umfassend,anschaulich

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Noch Fragen?

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Wiederholung

� Datenquelle, Datei, Datenbank, Datenbanksystem

� Informationssystem: Komplex aus Hard- und Software mit Komponenten zur dauerhaften Speicherung, Ausgabe und Verarbeitung von Daten in einer aus dem Themengebiet der erhaltenen Info begründeten Form� Daten � Information: mit Hilfe der Begriffswelt und der Theorien

einer Wissenschaft

� "begründete Form"� Begriffswelt muss bekannt und nutzbar sein

� Nutzerschnittstelle kennt Begriffswelt

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Wiederholung

� Schichtenmodell von DBMS

� Datenmodellierung

� Entity-Relationship-Modell� Entitäten und Beziehungen

� Zusätzlich: Attribute, Wertebereiche, Schlüssel

� UML-Modell� Klassen und Assoziationen

� Zusätzlich: Attribute, Methoden, …

� Unterschiedliche Diagrammtypen

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Typen von Daten

� Wissen

� bestätigt, abstrakt, dicht

� Texte, Grafiken

� Publikationen

� Information

� Interpretiert, gefiltert

� Objekte, Annotationen

� Daten

� Gemessen, kontext-frei,rohe, dreckige Daten

� Zahlen, Sequenzen, Metadaten

Biocarta, Apoptosis Pathway

Affimetrix Chip

Micro Array