17
Sommersemester 2012 Dr. Toralf Kirsten, Anika Groß http://dbs.uni-leipzig.de Universität Leipzig Institut für Informatik Datenbanken in der Bioinformatik Kapitel 0 Organisation

Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012

Dr. Toralf Kirsten, Anika Großhttp://dbs.uni-leipzig.de

Universität LeipzigInstitut für Informatik

Datenbanken in der

Bioinformatik

Kapitel 0

Organisation

Page 2: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

DBS-Module

� Master-Studium � 10-202-2215 – Moderne Datenbanktechnologien (Kleines Modul))

� 10-202-2216 – Moderne Datenbanktechnologien (Großes Modul))

� 10-202-2213 – Anwendungsbezogene Datenbankkonzepte (Kleines Modul)

� 10-202-2214 – Anwendungsbezogene Datenbankkonzepte (Großes Modul)

� 10-202-2011 – Masterseminar Informatik / Seminarmodul

� Bachelor-Studium� 10-201-2211 – Datenbanksysteme 1

� 10-201-2212 – Datenbanksysteme 2

� 10-201-2210 – Datenbankpraktikum

� 10-201-2224 – Realisierung von Informationssystemen

� 10-201-2010 – Bachelorseminar Informatik / Seminarmodul

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Page 3: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Masterstudium DBS-Profil

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Page 4: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Page 5: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

DBS-LehrveranstaltungenLogo Name Typ SWS Sem.

Datenbanksysteme 1 Einführung 2+1 WS

Datenbanksysteme 2 Einführung 2+1 SS

Implementierung von DBS 1

Vertiefung 2 WS

Implementierung von DBS 2

Vertiefung 2 SS

Mehrrechner-DBS Vertiefung 2 WS

Data Warehousing Vertiefung 2 SS

Datenintegration Vertiefung 2 WS

Bio-Datenbanken Vertiefung 2 SS

Ontologie-Management

Vertiefung 2 WS

Cloud Data Management

Vertiefung 2 SS

Name Typ Sem.

DB-Praktikum

Praktikum SS

Data-Warehouse-Praktikum

Praktikum WS

Problem-seminar

Seminar WS

Bachelor-seminar

SeminarSS+WS

Master-seminar

SeminarSS+WS

LV im SS12

Page 6: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Mapping: Module – Lehrveranstaltungen SS12

� Master-Module “Anwendungsbezogene Datenbankkonzepte” (zwei bzw. drei Veranstaltungen für kleines bzw. großes Modul):� Data Warehousing

� Cloud Data Management

� Bio-Datenbanken

� ggf. DBS2

� Bachelor-Modul “Realisierung von Informationssystemen” � Data Warehousing

� Cloud Data Management

� Bachelorseminar / Masterseminar � Vortrag über laufende Bachelor/Masterarbeit

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Page 7: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Zur Vorlesung allgemein …

� Vorlesung: donnerstags, 9:15-11:45 UhrSeminargebäude Universitätsstraße, Raum SG 3-10

� http://dbs.uni-leipzig.de/de/stud/2012ss/biodbs

� Abschluss� schriftliche Prüfung im Juli/August 2012 (60 min)

� erfolgreiche Klausurbewältigung setzt Kenntnisse und Fertigkeiten voraus, die die Mitarbeit in der Vorlesung erfordert

� Prüfungsrelevant ist die Vorlesung, nicht ein Skript

Page 8: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Zur Vorlesung allgemein …

� Fragen oder Probleme � Jederzeit in der Vorlesung

� E-Mail

� Sprechstunde: Nach Vereinbarung

� Anregungen und Kommentare zur Verbesserung

� Feedback ist ausdrücklich erwünscht!

� Kontakt� Dr. Toralf Kirsten

[email protected]

� Raum: 315 (P.-Rosenthal-Straße 27)

� Anika Groß

[email protected]

� Raum 4-25 (Johannisgasse 26)

Page 9: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Vorlesungsziele

� Kenntnis typischer BioDB und ihre Klassifikation

� Sequenz-, Protein-, Genom-, Publikations-DB, …

� Semantik der Daten, Modelle, Zugriffsmethoden, Verwendung

� Grundverständnis wichtiger Verfahren zur Datengewinnung und -verarbeitung

� Sequenzierung, Microarray-Analyse, …

� Annotationskonzept

� Kenntnis wichtiger Integrationstechniken

� Ähnlichkeitssuche

Page 10: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Vorläufiges Inhaltsverzeichnis

1. Motivation und Grundlagen

2. Klassifizierung von BioDB, Überblick

3. Sequenzierung und Genexpressionsanalyse

4. Datenmodelle und Anfragesprachen

5. Modellierungsalternativen

6. Versionierung von Datenbeständen

7. Annotationen

8. Datenintegration: Ansätze und Systeme

9. Datenmanagement in der Cloud

Groß

Kirsten

Groß

Kirsten

Groß

Page 11: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Literatur

� Lesk: Bioinformatik – Eine Einführung. Spektrum Akademischer Verlag, 2003

� Letowsky: Bioinformatics – Database and Systems. Kluwer, 2001

� Lacroix, Critchlow: Bioinformatics: Managing Scientific Data. Morgan Kaufman, 2003

� Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

� Waterman: Introduction to Computational Biology: Maps, Sequences, Genomes. CRC Press, 1995

� Vorlesungsskript basiert teilweise auf:� Sarah Cohen-Boulakia, Ulf Leser: Next Generation Data

Integration for the Life Sciences, Tutorial at ICDE 2011

Page 12: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Literatur - Datenbanksysteme

• Viele Bücher und Publikationen vorhanden

• H. Garcia-Molina, J.D. Ullman, J. Widom: Database SystemsPrentice Hall, 2008

Page 13: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Literatur – Daten-/Informationsintegration

• Viele Bücher und Publi-kationen vorhanden

Ulf Leser, Felix NaumannInformationsintegrationdpunkt.verlag, 2007

� relativ neu, umfassend,anschaulich

Page 14: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Noch Fragen?

Page 15: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Wiederholung

� Datenquelle, Datei, Datenbank, Datenbanksystem

� Informationssystem: Komplex aus Hard- und Software mit Komponenten zur dauerhaften Speicherung, Ausgabe und Verarbeitung von Daten in einer aus dem Themengebiet der erhaltenen Info begründeten Form� Daten � Information: mit Hilfe der Begriffswelt und der Theorien

einer Wissenschaft

� "begründete Form"� Begriffswelt muss bekannt und nutzbar sein

� Nutzerschnittstelle kennt Begriffswelt

Page 16: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Wiederholung

� Schichtenmodell von DBMS

� Datenmodellierung

� Entity-Relationship-Modell� Entitäten und Beziehungen

� Zusätzlich: Attribute, Wertebereiche, Schlüssel

� UML-Modell� Klassen und Assoziationen

� Zusätzlich: Attribute, Methoden, …

� Unterschiedliche Diagrammtypen

Page 17: Datenbanken in der - uni-leipzig.dedbs.uni-leipzig.de/file/biodb-SS2012-kap-00.pdf · 2012-04-18 · Pewzner: Computational Bioinformatics: An algorithmic Approach. MIT Press, 2000

Sommersemester 2012Dr. Toralf Kirsten, Anika Groß

Vorlesung BiodatenbankenUniversität Leipzig

Typen von Daten

� Wissen

� bestätigt, abstrakt, dicht

� Texte, Grafiken

� Publikationen

� Information

� Interpretiert, gefiltert

� Objekte, Annotationen

� Daten

� Gemessen, kontext-frei,rohe, dreckige Daten

� Zahlen, Sequenzen, Metadaten

Biocarta, Apoptosis Pathway

Affimetrix Chip

Micro Array