Abstract |
Die (optimale) Steuerung von dynamischen Systemen ist eine bereits seit längerem betrachtete Problemstellung. In der vorliegenden Arbeit wurde ein von Deisenroth, Rasmussen und Peters entwickeltes und veröffentlichtes Verfahren zur Lösung dieses Problems implementiert und an einem einfachen Beispiel getestet. Dieses Verfahren ist in der Lage, die Dynamik des zu steuernden Systems anhand von Beobachtungen zu Lernen. Es ist nicht darauf angewiesen, ein vollständiges (durch eine Differentialgleichung gegebenes) Modell des Systems zu besitzten. |