Die Idee, inhaltlich verwandte Texte automatisiert in Verbindung zueinander zu setzen, ist
nicht neu. Der im Rahmen dieser Arbeit vorgestellte Lösungsansatz verfolgt zwei Hauptziele:
automatisiert auf Basis unstrukturierter Texte zu arbeiten und eine hohe Anzahl gleichzeitiger
Zugriffe zu unterstützen. Es unterscheidet sich von anderen Verfahren im Wesentlichen durch
die Ermittlung des semantischen Abstandes zwischen den Texten auf Basis einer
asymmetrischen vorberechneten Distanzmatrix. Die Beziehungen zwischen unstrukturierten
Textobjekten werden mittels eines, von der Landessprache unabhängigen, heuristischen
Algorithmus zur Merkmalsselektion hergestellt. Die resultierende "Wortwolke" wird dann als
Anfrageparameter für die Selektion passender Texte verwendet. Dem Benutzer werden zum
gerade angezeigten Text inhaltlich verwandte Texte empfohlen. Die
Verarbeitungsgeschwindigkeit des Verfahrens wurde in Form der Laufzeitkomplexität der
Algorithmen analysiert. Über einen Zeitraum von 12 Monaten wurden außerdem
umfangreiche Praxistests auf der Website eines Industriemagazins durchgeführt, um die
Effizienz des Verfahrens im Hinblick auf die Qualität der Empfehlungen zu prüfen. Die
Ergebnisse zeigen, dass der vorgestellte Ansatz den manuell erstellten Empfehlungen
professioneller Redakteure nahezu ebenbürtig ist.