de
en
Schliessen
Detailsuche
Bibliotheken
Projekt
Impressum
Datenschutz
zum Inhalt
Detailsuche
Schnellsuche:
OK
Ergebnisliste
Titel
Titel
Inhalt
Inhalt
Seite
Seite
Im Dokument suchen
Weise, Stephan: Integrierte Analyse pflanzenbiologischer Daten unter besonderer Berücksichtigung der Datenqualität. 2009
Inhalt
Abbildungsverzeichnis
Tabellenverzeichnis
1. Einleitung
1.1 Motivation und Zielsetzung
1.2 Gliederung der Arbeit
2. Grundlagen
2.1 Grundlagen aus der Informatik
2.1.1 Datenbanksysteme
2.1.2 Datenmodellierung
2.1.3 Entity-Attribute-Value-Ansatz
2.1.4 Record Linkage
2.2 Grundlagen aus der Biologie
2.2.1 Bausteine des Lebens
2.2.2 Besonderheiten von Pflanzen
2.2.3 Datendomänen
2.2.4 Besondere pflanzliche Datenressourcen
2.3 Fachübergreifende Grundlagen
2.3.1 Kontrolliertes Vokabular
2.3.2 Taxonomie
2.3.3 Ontologien
2.3.4 Merkmale und Skalen
2.4 Resümee
3. Datenintegration und -analyse
3.1 Datenintegration
3.1.1 Virtuelle Integration
3.1.2 Materialisierte Integration
3.2 Datenanalyse
3.2.1 Datenbanksprachen
3.2.2 OnLine Analytical Processing (OLAP)
3.2.3 Knowledge Discovery in Databases (KDD)
3.2.4 Vorverarbeitung von Rohdaten
3.2.5 Transformation von Rohdaten
3.2.6 Datamining
3.3 Resümee
4. Datenqualität in der Pflanzenbioinformatik
4.1 Informationstechnische Ursachen für Qualitätsprobleme
4.1.1 Software
4.1.2 Weiterverbreitung von Daten
4.2 Durch die Datengewinnung bedingte Ursachen für Qualitätsprobleme
4.2.1 Rohdaten
4.2.2 Abgeleitete Daten
4.2.3 Zeitlich begrenzte Projekte
4.2.4 Manuelle Erfassung von Daten
4.3 Konzeptionelle Ursachen für Qualitätsprobleme
4.3.1 Bewertungssysteme
4.3.2 Informationssysteme
4.3.3 Vorhersagemethoden
4.3.4 Nichteinheitliche Vokabulare / Methoden
4.4 Biologisch bedingte Ursachen für Qualitätsprobleme
4.5 Lösungsvorschläge
4.6 Resümee
5. Untersuchung existierender Integrations- und Analyseansätze
5.1 Bewertungskriterien
5.2 Gene-EYe
5.3 Columba
5.4 GeWare
5.5 Atlas
5.6 BioWarehouse
5.7 BioMart
5.8 Resümee
6. Entwicklung eines Konzepts
6.1 Schicht 1: Quelldaten
6.2 Schicht 2: Extraktion, (Transformation,) Laden
6.3 Schicht 3: Datenpool
6.4 Schicht 4: Transformation und Laden
6.4.1 Verbesserung der Datenqualität
6.4.2 Vorbereitung / Vorverarbeitung von Daten
6.5 Schicht 5: Analysespezifische Datamarts
6.5.1 Verknüpfen von Schemata unterschiedlicher Domänen
6.5.2 Verknüpfen der Records unterschiedlicher Domänen
6.6 Schicht 6: Analyse
6.7 Bewertung des Konzepts
6.8 Resümee
7. Anwendung
7.1 Beschreibung des Anwendungsfalls
7.2 Anforderungen
7.2.1 Allgemeine Anforderungen
7.2.2 Anforderungen zur Integration
7.2.3 Anforderungen zur Analyse
7.3 Prototyp
7.3.1 Schicht 1: Quelldaten
7.3.2 Schicht 2: Extraktion und Laden
7.3.3 Schicht 3: Datenpool
7.3.4 Schicht 4: Transformation und Laden
7.3.5 Schicht 5: Analysespezifischer Datamart
7.3.6 Schicht 6: Analyse
7.4 Einschätzung des Prototypen
7.4.1 Zeitbedarf
7.4.2 Erhöhung der Datenqualität
7.4.3 Ergebnisse
7.4.4 Bewertung
7.5 Resümee
8. Zusammenfassung und Ausblick
8.1 Zusammenfassung
8.2 Ausblick
A Screenshots des Prototypen
B Quellcodes
B.1 Bereinigung importierter Daten im Assoziationsmart
B.2 Abfrage und Export von Daten aus dem Assoziationsmart
Glossar
Literaturverzeichnis
Index