Ziel dieser Arbeit ist es, einen Entwurfsprozess zu entwickeln, zu implementieren und zu analysieren, der den systematischen und optimalen Aufbau eines biologisch motivierten visuellen Objekterkennungssystems erlaubt. Das optimierte visuelle System soll schnell und robust Objekte aus unterschiedlichen Bilddomänen erkennen können. Die optimierten visuellen Systeme sollen in ihrem Aufbau untersucht und in Bezug auf ihre Generalisierungsfähigkeit evaluiert werden.
Das verwendete visuelle Verarbeitungssystem bringt gezielt Vorwissen aus dem Bereich der Neurobiologie ein. Durch die Integration von leistungsfähigen Verarbeitungsprinzipien, die durch das menschliche Sehsystem inspiriert sind, wird der große Gestaltungsraum aller möglichen Systementwürfe sinnvoll eingegrenzt. Die Festlegung der verbleibenden freien Parameter und Strukturelemente soll in dieser Arbeit mit Hilfe Evolutionärer Algorithmen erfolgen. Aus dieser Klasse von Methoden werden speziell die Evolutionsstrategien verwendet, welche sich durch eine Selbstadaption der mutativen Schrittweite auszeichnen.
Die gängigen Evolutionären Algorithmen simulieren im Wesentlichen die Phylogenese, also die Weiterentwicklung von Individuen von Generation zu Generation. In dieser Arbeit sollen hingegen auch Elemente der Ontogenese erstmals bei der evolutionären Optimierung eines visuellen Erkenners, der ein anspruchsvolles Erkennungsproblem mit realen dreidimensionalen Objekten zu lösen vermag, verwendet werden. Hierzu sollen unterschiedliche unüberwachte Lernverfahren zum Einsatz kommen, die in den Prozess der evolutionären Optimierung eingebettet sind. Ein biologisches Prinzip, das dabei angewendet werden soll, ist das der spärlichen Kodierung. Die verwendete Kopplung von evolutionärer Optimierung und lokalen Lernverfahren wird in dieser Arbeit als indirekte Kodierung bezeichnet.
Von besonderer Bedeutung bei der evolutionären Optimierung von neuronalen Strukturen zur Objekterkennung ist die Frage nach ihrer Generalisierungsfähigkeit. Im Allgemeinen versteht man darunter bei technischen Objekterkennungssystemen die Fähigkeit des Systems, nach dem Erlernen von Trainingsansichten auf davon unterschiedliche Testansichten eines Objektes generalisieren zu können. Ein optimaler Entwurf des Erkennungssystems soll diese Fähigkeit verbessern. Überprüft wird diese Fähigkeit meist auf problemspezifischen Objektdaten. Wünschenswert ist jedoch ein System, das nicht nur auf einer beim Entwurf verwendeten Datenbank eine gute Generalisierung aufweist, sondern diese Fähigkeit domänenübergreifend, d.h. auch auf unterschiedlichen Objektklassen, aufweist. Diese Form der Generalisierung wird in dieser Arbeit mit Generalisierung 2. Ordnung bezeichnet. Sie dient als ein weiteres Evaluierungskriterium für das evolutionär strukturierte visuelle System.
Diese Generalisierungseigenschaft soll in Verbindung mit der Forderung nach Robustheit in die evolutionäre Optimierung eingebracht werden. Zwei Methoden werden hierzu untersucht: Zum einen soll eine Verallgemeinerung des Fitnessmaßes neben der reinen Erkennungsleistung die Konfidenz der Klassifikationsentscheidung mit aufnehmen, zum anderen wird durch die Simulation einer veränderlichen Bildumgebung die Entwicklung eines visuellen Systems mit allgemeiner einsetzbaren Merkmalen unterstützt.
Bei der Anwendung von stochastischen Optimierungsalgorithmen wie den Evolutionsstrategien kann das Erreichen des globalen Optimums nicht garantiert werden. Wird die Aufgabe nicht vollständig gelöst, so kann das an der Lösungsstruktur (hier dem visuellen System) oder aber an der Konvergenz des Algorithmus in lokalen Optima liegen. Um die Leistungsfähigkeit des visuellen Systems im Zusammenspiel mit der vorgeschlagenen evolutionären Optimierung genauer untersuchen zu können, soll ein generatives Modell zur Erzeugung von hierarchischen Musterdatenbanken entwickelt werden. Durch die damit ermöglichte Erzeugung von Mustern können gezielt Erkennungsaufgaben konzipiert werden. Der entscheidende Vorteil hierbei ist, dass von vornherein die prinzipielle Lösbarkeit der gestellten Aufgabe mit der zu optimierenden visuellen Struktur bekannt ist.
Zum besseren Verständnis der Wirkungsweise sowohl der direkt als auch der indirekt kodierten evolutionären Optimierung (mittels der Einbettung unüberwachter Lernverfahren in Anlehnung an die Ontogenese) werden die unterschiedlichen Entwurfsverfahren und die jeweils erzeugten visuellen Systeme vergleichend analysiert. Zur weiteren Einordnung der Güte der optimierten visuellen Systeme sollen die erzielten Erkennungsergebnisse denen anderer leistungsfähiger Erkennungssysteme gegenübergestellt werden.