24
Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

Embed Size (px)

Citation preview

Page 1: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

Self Organizing Tree Algorithm

Bastian JarzembinskiEnrico Bade

Tobias Aagard

Page 2: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

2

Gliederung

Theorie

Hintergrund

Lernverfahren

Experimente

Attributskalierung

Wachstumssteuerung

Bewertung

Vergleich mit anderen Verfahren

Einsatz

Page 3: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

3

Theorie Hintergrund Lernverfahren

Page 4: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

4

Theorie Hintergrund

Bioinformatik

Microarrays

Ähnliches Aussehen = Ähnliche Funktion?

Page 5: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

5

Theorie Lernverfahren

n-dimensionale Vektoren mit metrischen Attributen

Knoten bilden Clusterzentren

Knoten mit größter Varianz wird geteilt

Page 6: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

6

Theorie Lernverfahren

Inputvektor

Repräsentant

Distanz

Lernrate

Fehler

Page 7: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

7

Theorie Lernverfahren

Wurzel

Blatt

Zuordnung

Page 8: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

8

Theorie Lernverfahren

Ressource /mittlere Abweichung

Variability /Spannweite

Page 9: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

9

Theorie Lernverfahren

Page 10: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

10

Theorie Lernverfahren

?

Page 11: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

11

Theorie Lernverfahren

Ancestor / Vorfahre

Sister / Schwester

Page 12: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

12

Experimente Attributskalierung Fallbeispiel

Page 13: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

Experimente Attributskalierung

Parameter in KNIME können das zyklisches Wachsen des Treesbeeinflussen:

Lerningrates

min. variablity und min. ressource nur bei „Use variablity“ berücksichtigt

min. Error

Distance: Euclid. Oder Cosinus

Clustern ohne Zielattribut

Page 14: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

Experimente Fallbeispiel

IRIS-Datenset

4 Attribute, metrisch skaliert

Zielattribut mit 3 Klassen

LIVE DEMO

Quantitativer Vergleich zu Klassifikationsalgorithmen

i.d.F. k-Means

Keine signifikanten Unterschiede

Anwendung des SOTA auf Daten mit und ohne Zielattribut

Keine signifikanten Unterschiede

Page 15: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

15

Bewertung Vergleich mit anderen Verfahren Einsatz

Page 16: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

16

Bewertung Vergleich mit anderen Verfahren

Eigenschaften k-Means

Wenige Iterationen

Einfaches Verfahren

Anfällig für Rauschen / Ausreißer

Ergebnis von initialen Zerlegung abhängig

Page 17: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

17

Bewertung Vergleich mit anderen Verfahren

Eigenschaften k-Means

Wenige Iterationen

Einfaches Verfahren

Anfällig für Rauschen / Ausreißer

Ergebnis von initialen Zerlegung abhängig

Annähernd lineares Laufzeitverhalten

Punkt für k-Means

Resistent

Unabhängig

Eigenschaften SOTA

Page 18: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

18

Bewertung Vergleich mit anderen Verfahren

Hierarchisches Clustern

Divisiv oder agglomerativ

Knoten sind einfache Darstellung der Teilmengen

Zwischenschritte sind irreversibel

Page 19: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

19

Hierarchisches Clustern

Divisiv oder agglomerativ

Knoten sind einfache Darstellung der Teilmengen

Zwischenschritte sind irreversibel

Bewertung Vergleich mit anderen Verfahren

Divisives Verfahren

Knoten sind Mittelwerte sämtlicher folgenden Knoten

Zuordnung wird ständig angepasst

Eigenschaften SOTA

Page 20: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

20

Bewertung Vergleich mit anderen Verfahren

Self Organizing Map (Kohonen Map)

Ähnliches Verfahren, aber andere Topologie

SOM: vorgegebenes Netz, wird bestmöglich an den Eingaberaum angepasst

SOTA: wächst dynamisch, um den Eingaberaum bestmöglich darzustellen; Hierarchie vorhanden

Page 21: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

21

Bewertung Einsatz

Methodisch vielversprechend

Erfolge nicht reproduzierbar

Mögliche Ursachen

Ungeeignete Daten

Ungeeignete Parameterjustierung

Mangelndes (Aufgaben-)Verständnis

Weitere Untersuchung

Hintergrundwissen Bioinformatik

Microarray-Datensätze wählen

Page 22: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

22

Fin

Page 23: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

23

Theorie Hintergrund

Page 24: Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

24

Theorie Hintergrund