Inhalt des Dokuments
Bachelorarbeiten
Zitatschlüssel | Froese:2010:VZQ |
---|---|
Autor | Vincent Froese |
Jahr | 2010 |
Schule | TU Berlin |
Zusammenfassung | Diese Arbeit beschäftigt sich mit dem Thema Reinforcement Learning, einem Teilgebiet der Künstlichen Intelligenz. Es wird ein neuer O-Policy Algorithmus namens Z-Learning vorgestellt, der von Emanuel Todorov für eine spezielle Klasse stetiger Markov Decision Problems entwickelt wurde. Dieser Algorithmus wird mit dem bisherigen Standard, dem Q-Learning, auf klassischen Markov Decision Problems verglichen. Zunächst wird eine kurze Zusammenfassung der Theorie des Reinforcement Learnings, sowie des Artikels von Todorov gegeben. Danach werden beide Algorithmen in verschiedenen Experimenten auf ihre Leistungsfähigkeit geprüft. Es zeigt sich, dass Z-Learning auch zum Lösen diskreter Markov Decision Problems eingesetzt werden kann und dabei sogar ezienter als das Q-Learning ist. |
Typ der Publikation | Bachelorarbeit |
Zusatzinformationen / Extras
Direktzugang
Schnellnavigation zur Seite über Nummerneingabe