direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Sie sind hier

TU Berlin

Inhalt des Dokuments

Bachelorarbeiten

Vergleich von Z-Learning und Q-Learning auf diskreten Markov Decision Problems
Zitatschlüssel Froese:2010:VZQ
Autor Vincent Froese
Jahr 2010
Schule TU Berlin
Zusammenfassung Diese Arbeit beschäftigt sich mit dem Thema Reinforcement Learning, einem Teilgebiet der Künstlichen Intelligenz. Es wird ein neuer O-Policy Algorithmus namens Z-Learning vorgestellt, der von Emanuel Todorov für eine spezielle Klasse stetiger Markov Decision Problems entwickelt wurde. Dieser Algorithmus wird mit dem bisherigen Standard, dem Q-Learning, auf klassischen Markov Decision Problems verglichen. Zunächst wird eine kurze Zusammenfassung der Theorie des Reinforcement Learnings, sowie des Artikels von Todorov gegeben. Danach werden beide Algorithmen in verschiedenen Experimenten auf ihre Leistungsfähigkeit geprüft. Es zeigt sich, dass Z-Learning auch zum Lösen diskreter Markov Decision Problems eingesetzt werden kann und dabei sogar ezienter als das Q-Learning ist.
Typ der Publikation Bachelorarbeit
Link zur Publikation [1] Download Bibtex Eintrag [2]
------ Links: ------

Zusatzinformationen / Extras

Direktzugang

Schnellnavigation zur Seite über Nummerneingabe

Copyright TU Berlin 2008