Die vorliegende Arbeit beschäftigt sich mit einem speziellen Typ Neuronales Netz, welches sich durch eine hierarchische, vorwärtsgerichtete Topologie auszeichnet. Das Netz imitiert durch eine alternierende Anwendung von Transformationspaaren, bestehend aus Redundanz- und Invarianz-Erzeugung, ein grundlegendes Prinzip der Informationsverarbeitung in biologischen Sehsystemen und lässt sich so zur Lösung praktischer Objekterkennungsaufgaben nutzen. Die Arbeit behandelt neben einer allgemeinen formalen Beschreibung des neuronalen Modells zunächst die Optimierung von Modellparametern mittels eines speziell entwickelten Verfahrens zur Messung der Komplexität von Multiklassen-Datensätzen. Anschließend wird das Modell auf zwei praktische Computer-Vision-Problemstellungen angewendet: die Klassifikation von natürlichen Bildausschnitten und die segmentierungsfreie Multiklassen-Detektion in Vollbildern. Die experimentellen Ergebnisse beruhen auf teilsynthetischen Bilddatensätzen, die durch das Hinzufügen von künstlichen Störungen auf bekannte Datenbanken natürlicher Bilder erzeugt werden. Dabei werden die drei verschiedenen Bilddomänen abgedeckt: handgeschriebene Ziffern, kompakte Objekte und Gesichter. Mit Hilfe dieser Datensätze wird gezeigt, dass der Ansatz ermöglicht, bei der Erkennung A-priori-Wissen über die generellen statistischen Eigenschaften von natürlichen Bildern gewinnbringend auszunutzen. In natürlichen Bildern typischerweise auftretende Störungen können durch die Verarbeitung des Netzes sukzessive ausgeglichen werden, wodurch deutlich bessere Erkennungsleistungen erzielt werden können, als es mit herkömmlichen Methoden wie etwa Eigenraum-basierten Verfahren oder Nächste-Nachbarn-Klassifikatoren möglich ist.
Titelaufnahme
- TitelHierarchical feed-forward models for robust object recognition
- Verfasser
- Gutachter
- Erschienen
- SpracheEnglisch
- DokumenttypDissertation
- Schlagwörter
- URN
- Das Dokument ist frei verfügbar
- Social MediaShare
- Nachweis
- IIIF
This thesis deals with a special type of neural network which features a hierarchical feed-forward topology. By alternatingly applying pairs of transformations that consist of redundancy and invariance creation, the network imitates a fundamental principle of information processing found in biological vision systems and can therefore be used for solving practical object recognition tasks. The thesis first presents a general formal description of the neural model and then deals with the optimization of model parameters using a special method for measuring the complexity of multi-class datasets. Then, the model is applied to two practical computer vision problems: classification of natural image patches and segmentation-free multi-class object detection in full-frame images. Experimental results rely on semi-synthetic image datasets, which are generated by applying artificial distortions to well-known natural image databases covering the three domains of handwritten digits, compact objects, and faces. Using these datasets it is shown that the approach allows us to exploit a priori knowledge about the general statistical properties of natural imagery. Distortions typically occurring in natural images can be successively compensated, leading to a significant increase in recognition performance compared to common approaches such as eigenspace-based methods or nearest neighbor classification.
- Das PDF-Dokument wurde 4 mal heruntergeladen.