30
Deep Blue Hendrik Baier

Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Embed Size (px)

Citation preview

Page 1: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

DeepBlue

Hendrik Baier

Page 2: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Themen

• Matches Deep Blue – Kasparov 1996/97• Faktoren von Deep Blues Erfolg• Systemarchitektur• Search Extensions• Evaluationsfunktion• Extended Book

• Vergleichstraining derEvaluationsfunktion

Page 3: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Teil eins

Beating the

World Champion

Page 4: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Man vs. Machine

• Februar 1996 – Garry Kasparov vs. Deep Blue (I) 4 : 2

• Mai 1997 – Garry Kasparov vs. Deep Blue (II) 2,5 : 3,5

• Zweifel• Ausblick

Page 5: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Kasparov

• Vor dem Match

• Nach dem Match

"I made a firm decision for myself to takeany challenge. And even if one day I'mdoomed to lose, I thought it would beabsolutely vital for us to play and to fightas long as we can."

“I’m only a human being.I get scared when I see somethingbeyond my comprehension.”

Page 6: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Team Blue

Page 7: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Teil zwei

Inside Deep Blue

Page 8: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Deep Blue

• Die Geschichte des Projekts• Systemüberblick• Der Chess Chip• Die Hardware-Suche• Die Software-Suche• Parallelität• Die Evaluationsfunktion• Verschiedenes

Page 9: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Die Geschichte

Page 10: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Systemüberblick

• 30-processor IBM RS/6000 SP Computer• 480 single-chip chess search engines (16 p.P.)• Nodes sind P2SC-Prozessoren 120 / 135 MHz

mit je 1 GB RAM, 4 GB Disk• Betriebssystem: AIX 4.2• Drei-Schichten-Organisation• Grundideen• Systemgeschwindigkeit ~ 126 Mio. Pos./Sek.

Page 11: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Der Chess Chip

• Zuggenerierung

• Evaluationsfunktion

• Suchkontrolle

• Erweiterbarkeit

Page 12: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Hardware-Suche

• Null-Window Search

• 4 – 5-ply tief plus Quiescence

• binäre Suche möglich

Page 13: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Software-Suche

• hochselektives Suchverfahren:„dual credit with delayed extensions“

• Mechanismen der Crediterzeugung• Beispielverhalten

Page 14: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Parallelität

• Algorithmen der parallelen Suche

• Implementierung der parallelen Suche

• Performance der parallelen Suche

Page 15: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Die Evaluationsfunktion

• Überblick

• Beispiel: Türme auf Linien (Rooks on files)

• automatische Analyse der Evaluationsfunktion

Page 16: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Verschiedenes

• Opening Book

• Extended Book

• Endspiel-Datenbank

• Zeitkontrolle

Page 17: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Teil drei

Tuning the

Evaluation Function

Page 18: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Grundideen

• Methoden des Trainings Neuraler Netze:

• Supervised Learning• Comparison Training• Reinforcement Learning

• Häufiges Problem: Overfitting• Abhilfe: z.B. Early Stopping

Page 19: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Tesauros Arbeit

• Verallgemeinerung des Vergleichstrainingsauf Suchtiefen > 1 ply(angewendet auf das Training der Gewichte einer linearen Evaluationsfunktion)

• Experimente mit SCP• Erfolgreiche Anwendung bei Deep Blue• Ausblick

Page 20: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Problemstellung

• Schach benötigt einen Suchmechanismus, der viele Züge vorausrechnet

• Interaktion zwischen Suche und Evaluation ist nichttrivial

• Trainingssuchtiefe geringer als Performancesuchtiefe

• Zwei Arten von Verallgemeinerung erwartet

Page 21: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Verallgemeinerung

• Trainingsidee: multiple PVs

• Problem: keine Konvergenz?

• Lösungsidee: learningrate verringern, keine cutoffs

Page 22: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Experimente mit SCP

• Einfaches 1-ply-Training

Page 23: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Experimente mit SCP

• 1-ply-Training mit Erweiterungenmit zufälligen Gewichten gestartet

Page 24: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Experimente mit SCP

• 1-ply-Training mit Erweiterungenmit voreingestellten Gewichten gestartet

Page 25: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Anwendung bei

Deep Blue

• Entscheidung für eine kleine Untermenge von Features (king safety)

• Anpassungen des Tuning-Algorithmus

• Auswirkungen auf das Match gegen Kasparov

Page 26: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Auswirkungen

• Beispiel aus Spiel zwei

Page 27: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Auswirkungen

• Beispiel aus Spiel sechs

Page 28: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Ausblick

• GM-Imitation = gutes Spiel?

• andere algorithmische Formulierungen

• Othello, Go, Dame, Shogi

• multi-layer network evaluators (gewinnen an Bedeutung, sobald Suchstrategien keine Fortschritte mehr machen)

Page 29: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to

Quellen

• Murray Campbell, A. Joseph Hoane Jr., Feng-hsiung Hsu: DeepBlue. Volume 134, Number 1-2, January 2002, pp. 57-83.

• Gerald Tesauro: Comparison Training of Chess Evaluation Functions. In Fürnkranz & Kubat: Machines That Learn To Play Games, Nova Science Publishers 2001.

• Murray Campbell: Knowledge Discovery in Deep Blue. Communications of the ACM 42(11): 65-67, 1999.

• Google• Google• Google

Page 30: Deep Blue - Knowledge Engineering Group · Kasparov • Vor dem Match • Nach dem Match "I made a firm decision for myself to take any challenge. And even if one day I'm doomed to