Im Bereich des Cross Media Publishing (CMP) ist die Integration der Prozesse zweier separater Anwendungsbereiche erforderlich: Erstens die Prozesse zur Online-Verarbeitung via Web Content Management Systemen (WCMS) und ähnlichen Anwendungen und zweitens, die Prozesse für die traditionellen gedruckten Publikationen, wie Layout und Formatierung mit Hilfe von Desktop-Publishing-Systemen (DTP). Nachdem diese Welten über viele Jahre isoliert nebeneinander existierten, wurde in den letzten Jahren viel Aufwand in die Übertragung der Inhalte zwischen diesen Medienarten investiert. Ein großer Fortschritt war die Entwicklung von XML als Transport-Protokoll für den Austausch der Daten. XML und die daraus abgeleiteten Sub-Sprachen behandeln mittlerweile viele der sich daraus ergebenden Probleme.
Im Zuge der Medienkonvergenz erfahren diese Integrationsprozesse eine schnell steigende Bedeutung. Medienunternehmen streben eine im Rahmen ihrer Diversifikationsstrategien notwendige Mehrfachverwertung von aufwändig erstellten Inhalten mit möglichst geringen Kosten an.
Ziel dieser Arbeit war zunächst, die neu entstehenden Prozesse in der medienneutralen Informationsverarbeitung zu erkennen, ihre Risiken und Kosten zu identifizieren und zu formalisieren. Während die Prozesse für die medienneutrale Verarbeitung von Bilddaten theoretisch bereits gelöst sind, gab es für die Behandlung von typographischen Metadaten bisher keine befriedigende Lösung, wenn man die industriellen Standards zur Bearbeitung von Inhalten beibehalten und den Anwendern weiterhin das Arbeiten in ihren gewohnten Umgebungen ermöglichen will.
Jede einzelne, medienspezifische Anwendung zur Bearbeitung und Gestaltung von Textinhalten besitzt ihre eigene Sprache mit typographischer Syntax und Semantik. Um diese typographischen Metadaten bei der Übertragung zwischen medienspezifischen Anwendungen und bei der mehrfachen Verwendung von Texten innerhalb einer Mediengattung nicht zu verlieren, wurde im Rahmen dieser Arbeit ein Verfahren zur Übersetzung dieser typographischen Metadaten auf Basis von grammatikgesteuerten Übersetzern entwickelt. Die Übersetzer verwenden als Drehscheibe für den Datenaustausch die Typographische Markup Sprache TML, ein XML-basierter Dialekt zur medienneutralen Datenhaltung der typographischen Metadaten. Die TML wurde ebenfalls im Rahmen dieser Arbeit entwickelt.
Die Anforderungen an die Gesamtarchitektur wurden für diese Arbeit in Zusammenarbeit mit der InterRed GmbH formuliert. InterRed entwickelt und vertreibt ein Redaktions- und Publishingsystem für die medienübergreifende Publikation von Inhalten wie Texte, Bilder und Video. Für die bidirektionale Übertragung von Textinhalten zwischen dem Redaktionssystem und Standards wie Quark XPress, Adobe Indesign, RTF oder HTML gab es bisher kein Verfahren, welches die typographische Semantik eines Textes berücksichtigt.