19520 V Neuronale Netze (2,n)
|
Rojas
|
Implementieren Sie den Backpropagation-Algorithmus für ein Netz mit einer verdeckten Schicht.
Das Netz soll Tic-Tac-Toe spielen und gewinnen lernen. Die Eingabe ist der momentane Zustand des Spielfelds, die Ausgabe der nächste Zug. Es sollen nur kritische Stiuationen als Trainigsbeispiele zur Verfügung stehen.
Trainieren Sie es mit 9 Eingabeneuronen, 9 Ausgabeneuronen, unterschiedlich vielen verdeckten Neuronen (5 bis 20) und unterschiedlichen Lernkonstanten (0,1 bis 2). Tragen sie die unterschiedlichen Lernerfolge in einer Tabelle ein.
Fügen sie etwas Steuerlogik hinzu und spielen Sie gegen den Computer Tic-Tac-Toe.