Fahrsysteme oder Fahrerassistenzsysteme sind bereits seit einigen Jahren
Bestandteil von Forschungsprojekten. Dabei umfassen diese meist zwei
wesentliche Bestandteile: die Erfassung der Umwelt sowie die Generierung von
Steuerungsbefehlen. Die Lernfähigkeit solcher Projekte gewinnt zunehmend an
Bedeutung und ist der Hauptfokus der vorliegenden Forschungsarbeit - wobei
Lernfähigkeit als Optimierung von Fahrverhalten verstanden wird, d.h. die
Auswahl vom optimalen Verhalten für eine jeweilige Situation.
Die vorliegende Arbeit setzt für die Lernfähigkeit erstmals ein System basierend
auf Verstärkungslernen (Reinforcement Learning) ein – dies im Gegensatz zu
bisherigen Arbeiten im ähnlichen Umfeld basierend auf Modellierung oder
Neuronalen Netzen. Im Kern der Arbeit werden Situationen klassifiziert und für
jede Situation eine mögliche Anzahl von Verhalten ermittelt. Durch
Verstärkungslernen werden diese Verhalten bewertet und die entsprechenden
Situationsbewertungen konvergieren über die Zeit. Fazit: es wird autonom
ermittelt, welche Verhalten in einer Situation angemessen sind und welche nicht.
Neben einer mathematischen Abhandlung über das Konvergenzverhalten von
Verstärkungslernen-Systemen wird mit unterschiedlichen Testreihen die
Funktionsweise des o.g. Ansatzes im Rahmen einer konkreten Implementierung
nachgewiesen und die Konvergenz der Situationsbewertungen untersucht.