Einzelnen Beitrag anzeigen
  #30  
Alt 06.01.18, 16:28
Hawkwind Hawkwind ist offline
Singularität
 
Registriert seit: 22.07.2010
Ort: Rabenstein, Niederösterreich
Beitr?ge: 3.057
Standard AW: Alpha Zero schlägt Stockfish

Zitat:
Zitat von TomS Beitrag anzeigen
Einen der o.g. Artikel habe ich da anders verstanden, dass dies nämlich einen maßgeblichen Einfluss hat.

Egal, es ging Google nie um eine exakte ELO-Bewertung oder um ein Turnier unter fairen Bedingungen (was im Computerschach sowieso nur möglich war, weil sich da eine Art Monokultur entwickelt hat). Es ging darum, dass eine ziemlich generische KI Schach "from scratch" lernen kann. Stockfisch u.a. Programme haben nie irgendetwas etwas gelernt; es gab lediglich unglaublich viele fleißige Programmierer und Datentypisten, die seit Jahrzehnten Programme optimiert und Eröffnungsdatenbanken eingetippt haben.

Jetzt an diesen Kleinigkeiten rumzumäkeln ist ungefähr so blöd wie Goethe für Rechtschreibfehler im Manuskript von Faust zu kritisieren.
100% d'accor, aber eine kleine Reandbemerkung zu
Zitat:
Zitat von TomS Beitrag anzeigen
Stockfisch u.a. Programme haben nie irgendetwas etwas gelernt; es gab lediglich ...
Die meisten neueren Programme - ich schätze Stockfish sicher eingeschlossen - haben ein recht simples Book-Learning implementiert: Varianten, die sich nicht bewähren, werden im Eröffnungsbuch weniger stark gewichtet bzw komplett gestrichen, und umgekehrt.
Zudem legen manche Programme die Suchergebnisse der Wurzelknoten (erreichte Suchtiefe, zugehörige Bewertung) in einer persistenten Hash-Tabelle auf der Festplatte ab (eventuell nur dann, wenn sich die Bewertung von einer Iteration zur nächsten drastisch verändert hatte (z.B. Falle festgestellt, "vergifteter Bauer" ...). Diese Ergebnisse können in nachfolgenden Spielen die Suche etwas beschleunigen, wenn denn genau diese Positionen im Suchbaum auftreten bzw es wird sogar gelernt, einmal gemachte Fehler zu vermeiden. Diese 2 Features sind nicht ganz unnütz und machen die Programme auch etwas unberechenbarer; so hat mein Programm in ein-und derselben Stellung bei derselben Suchtiefe nicht immer zwangsläufig denselben Zug gewählt.
Aber das sind sehr simple Implementation einer Lernfunktion im Vergleich zu AlphaZero.

Ge?ndert von Hawkwind (06.01.18 um 16:41 Uhr)
Mit Zitat antworten