Page Content
List of Publications
Citation key | Froese:2010:VZQ |
---|---|
Author | Vincent Froese |
Year | 2010 |
School | TU Berlin |
Abstract | Diese Arbeit beschäftigt sich mit dem Thema Reinforcement Learning, einem Teilgebiet der Künstlichen Intelligenz. Es wird ein neuer O-Policy Algorithmus namens Z-Learning vorgestellt, der von Emanuel Todorov für eine spezielle Klasse stetiger Markov Decision Problems entwickelt wurde. Dieser Algorithmus wird mit dem bisherigen Standard, dem Q-Learning, auf klassischen Markov Decision Problems verglichen. Zunächst wird eine kurze Zusammenfassung der Theorie des Reinforcement Learnings, sowie des Artikels von Todorov gegeben. Danach werden beide Algorithmen in verschiedenen Experimenten auf ihre Leistungsfähigkeit geprüft. Es zeigt sich, dass Z-Learning auch zum Lösen diskreter Markov Decision Problems eingesetzt werden kann und dabei sogar ezienter als das Q-Learning ist. |
Bibtex Type of Publication | Bachelorarbeit |
Back [3]
ationen/Froese_2010_VZQ.pdf
meter/en/?no_cache=1&tx_sibibtex_pi1%5Bdownload_bib
tex_uid%5D=318336&tx_sibibtex_pi1%5Bcontentelement%
5D=tt_content%3A286237
meter/en/
Zusatzinformationen / Extras
Quick Access:
Schnellnavigation zur Seite über Nummerneingabe
Auxiliary Functions
Copyright TU Berlin 2008