Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Machine Learning
Ein Überblick
2
Inhalt
Anwendungsbeispiele
Begriffe
Arten des Machine Learnings
3
Anwendungsbeispiele
4
Anwendungsbeispiele
Automatische Zusammenfassung
Buch wurde herausgegeben von
Springer Nature
Autor: Beta Writer
Fasst Forschungsstand im Bereich
Lithium-Ionen-Akkus zusammen
Input: Große Anzahl aktueller
Forschungsartikel aus dem
Forschungsbereich (von SpringerLink)
https://link.springer.com/book/10.1007
/978-3-030-16800-1
5
Anwendungsbeispiele
Textgenerierung
OpenAI GPT-2
Berücksichtigt Sprachstil der Eingabe
Modell wurde bisher nicht vollständig veröffentlicht
https://openai.com/blog/better-language-models/#sample1
6
Anwendungsbeispiele
Deep Fakes
Bildgenerierung
Fake-Porträts
https://thispersondoesnotexist.com/
Videogenerierung
Austausch von Gesichtern in Videos
FakeApp
Obama-Video
7
Anwendungsbeispiele
AlphaGo Zero
Brettspiel Go
Training nur auf Basis der Go-Spielregeln
Lernen durch Spiel gegen sich selbst
AlphaStar
Starcraft II
Zusammenarbeit mit Blizzard für direkten Zugriff
auf Spielinformationen (Feature-Karten)
Gewann 10 von 10 Spiele gegen 2 Top-Profis unter
Wettbewerbsbedingungen
Herausforderungen
Unzureichende Informationen („Fog of War“)
Echtzeitspiel
Viele mögliche Aktionen
Langzeitplanung / Strategie
Quelle:
https://de.wikipedia.org/wiki/Go_(Spiel)#/me
dia/Datei:Go_game_Kobayashi-Kato.png
Quelle: https://starcraft2.com/de-de/media#screenshots-13
8
Anwendungsbeispiele
Weitere Beispiele
Erkennung von Kreditkartenbetrug, Versicherungsbetrug
Produktempfehlungen auf Basis des bisherigen Kaufverhaltens
Diagnostik in der Medizin
Selbstfahrende Autos
Voraussage von Aktienkursen
Automatische Übersetzung
Voraussage des Stromverbrauchs
…
9
Begriffe
10
Begriffe
Künstliche Intelligenz (KI)
Nachahmung menschlichen Verhalten und Denkens
Automatische und autonome Aufgabenerledigung
Quelle: http://www.datenbanken-verstehen.de/lexikon/kuenstliche-intelligenz/
11
Begriffe
Machine Learning
Ein Programm lernt, wenn seine Leistung in Bezug auf eine Aufgabe mit zunehmender Erfahrung
anwächst (Tom Mitchell, 1997)
Keine explizite Programmierung (Arthur Samuel, 1959)
12
Explizite Programmierung vs ML
Manuell Autom.
Regeln
Explizite Programmierung Machine Learning
Programmieren
ProgrammEingabe Ausgabe
Ände
rung Daten
Training
ProgrammEingabe Ausgabe
Ände
rung
13
Begriffe
Deep Learning
Machine Learning mit mehrschichtigen neuronalen Netzen
Dem menschlichen Gehirn nachempfunden
14
Begriffe
Datensatz
Besteht aus mehreren
Datenpunkten
Ein Datenpunkt besteht i. d. R.
aus mehreren Merkmalen
(Features)
Zu einem Datenpunkt können
ein oder mehrere zugehörige
Ausgaben vorhanden sein
(Targets, Labels)
Features Targets
Zimmer Größe(m²)
Preis (Euro)
3 80 150.000
1 23 60.000
4 100 155.000
… … …
15
Arten des Machine Learnings
16
Arten des Machine Learnings
Klassifikation nach menschlicher Überwachung
Überwachtes Lernen (Supervised Learning)
Unüberwachtes Lernen (Unsupervised Learning)
Halb-/Teilüberwachtes Lernen (Semi-Supervised Learning)
Bestärkendes Lernen (Reinforcement Learning)
Aktives Lernen (Active Learning)
17
Überwachtes Lernen
Datensatz enthält
Features
Targets
Features Targets
Zimmer Größe(m²)
Preis (Euro)
3 80 150.000
1 23 60.000
4 100 155.000
… … …
18
Überwachtes Lernen
Regression
Vorhersage numerischer Werte
Ausgabe kontinuierlicher
Werte
Kontinuierliche Werte sind
geordnet
Beispiele:
Ausgabe von
Immobilienpreisen
Prognose von Aktienkursen
Prognose von Temperaturen
Features Targets
Zimmer Größe(m²)
Preis (Euro)
3 80 150.000
1 23 60.000
4 100 155.000
… … …
19
Überwachtes Lernen
Klassifikation
Ausgabe von diskreten Werten
Jeder dieser Werte steht für eine Klasse
Die Werte sind nicht geordnet
Beispiele:
Spamfilter
– Spam
– Ham
Klassifikation von Kunden
– Wird nochmal kaufen
– Wird nicht mehr kaufen
Klassifikation von Fotos
– Hund
– Katze
– Maus
Features Targets
Zimmer Größe(m²)
Preis (Euro)
Ausstattung
3 80 150.000 Gehoben
1 23 600.000 Luxus
4 90 155.000 Standard
… … … …
20
Überwachtes Lernen
Viele Algorithmen zur Regression können auch zur Klassifikation eingesetzt werden (und
umgekehrt)
Beispiel
Logistische Regression wird zur Klassifikation eingesetzt
Sie gibt kontinuierliche Werte aus, die für Wahrscheinlichkeiten stehen
Features Targets Vorhersage
Zimmer Größe(m²)
Preis (Euro)
Ausstattung Standard Gehoben Luxus
3 80 150.000 Gehoben 0.3 0.6 0.1
1 23 600.000 Luxus 0.0 0.1 0.9
4 90 155.000 Standard 0.5 0.4 0.1
… … … … … … …
21
Unüberwachtes Lernen
Datensatz enthält
nur Features
Datensatz enthält
keine Targets!
Features Targets
Zimmer Größe(m²)
Preis (Euro)
Ausstattung
3 80 150.000 Gehoben
1 23 600.000 Luxus
4 85 155.000 Standard
… … … …
22
Unüberwachtes Lernen
Clustering
Visualisierung
Dimensionsreduktion
Anomalieerkennung
Lernen von
Assoziationsregeln
Feature 1
Feature 2
23
Unüberwachtes Lernen
Clustering
Visualisierung
Dimensionsreduktion
Anomalieerkennung
Lernen von
Assoziationsregeln
Quelle: https://cdn-images-1.medium.com/max/1600/1*Wcn_sTqL05a7vHpmxf24Dw.png
24
Unüberwachtes Lernen
Clustering
Visualisierung
Dimensionsreduktion
Anomalieerkennung
Lernen von
Assoziationsregeln
Manifold Learning
Quelle: https://csdl-images.computer.org/trans/tp/2008/09/figures/ttp20080915471.gif
25
Unüberwachtes Lernen
Clustering
Visualisierung
Dimensionsreduktion
Anomalieerkennung
Lernen von
Assoziationsregeln
Features
Lauf-leistung(km)
Alter(Jahre)
Preis (Euro) …
10.000 1 13.000 …
35.000 4 27.000 …
90.000 10 15.000 …
… … … …
Features
Abnutzung Preis (Euro)
…
0.1 13.000
Merkmalsextraktion
26
Unüberwachtes Lernen
Clustering
Visualisierung
Dimensionsreduktion
Anomalieerkennung
Lernen von
Assoziationsregeln
Target 1
Feature 1
Unauffälliger Datenpunkt
Anomalie
27
Unüberwachtes Lernen
Clustering
Visualisierung
Dimensionsreduktion
Anomalieerkennung
Lernen von
Assoziationsregeln
Quelle: https://www.amazon.de/dp/B07339ND52
28
Halb-/Teilüberwachtes Lernen
Datensatz enthält
mehrheitlich
Datenpunkte ohne
Targets
Meist Kombination aus
unüberwachtem und
überwachtem Lernen
A
B
Feature 1
Feature 2
29
Bestärkendes Lernen
Agent interagiert mit
Umgebung
Agent lernt Strategie (Policy),
um Belohnung (Reward) zu
maximieren
Betrachtet Zustand und
Aktionen und deren Wert
Beispiele
Roboter lernen laufen
AlphaGo, AlphaStar
Agent
Beobachtet
Zustand
Umgebung
Policy
AktionBelohnung1
23
30
Aktives Lernen
Keine / wenige gelabelte Datenpunkte vorhanden
Labeln von Datenpunkten ist aufwändig
Supervisor vorhanden (Orakel)
Algorithmus wählt zu lernende Datenpunkte aus
Fragt Supervisor interaktiv bzgl. korrektem Label
Benötigt weniger Datenpunkte zum Lernen
Verschiedene Befragungsstrategien
31
Arten des Machine Learnings
Klassifikation nach der Fähigkeit, inkrementell aus einem kontinuierlichen
Datenstrom dazuzulernen
Batch-Lernen (Batch-Learning)
Online-Lernen (Online-Learning)
32
Batch-Lernen
Kein inkrementelles Lernen möglich
System wird immer mit dem vollständigen Trainingsdatensatz trainiert
Hoher Verbrauch an Ressourcen
Rechenkapazitäten für das Training
Speicherplatz für den gesamten Datensatz
Keine schnelle Anpassung an neue Daten möglich
Offline-Learning
Training erfolgt immer außerhalb des Produktivsystems
Im Produktivsystem nur Anwendung des Erlernten
33
Online-Learning
Inkrementelles Lernen möglich
Einzelne Datenpunkte
Pakete aus wenigen Datenpunkten (Mini-Batches)
Schnelle Anpassung an neue Daten möglich
Insgesamt geringerer Verbrauch an Ressourcen
Geringere Rechenkapazitäten benötigt
Einmal gelernte Datenpunkte können nach dem Training verworfen
werden
Problem
Beobachtung nötig, um Lernen auf Basis minderwertiger Datenpunkte
zu verhindern
Eingabedatenpunkte automatisiert tracken, z. B. mittels eines
Anomalieerkennung
34
Arten des Machine Learnings
Klassifikation nach Art der Verallgemeinerung
Instanzbasiertes Lernen
Modellbasiertes Lernen
35
Instanzbasiertes Lernen
Auswendiglernen der
Datenpunkte
Verallgemeinerung durch
Anwendung eines
Ähnlichkeitsmaßes
Feature 1
Feature 2
Neuer Datenpunkt
36
Modellbasiertes Lernen
Auf Basis der
Datenpunkte wird ein
konkretes Modell erstellt
(Lernphase)
Modellierung z. B. mittels
Gerade
Polynom
Neuronales Netz
Schnelle Abfrage des
Modells möglich
(Inferenz)
Feature 1
Feature 2
Neuer Datenpunkt
37
Fazit
Extrem umfangreich
Viele Anwendungsgebiete
Viele unterschiedliche Verfahren