Wissenschaftliche Publikationen und ihre beschreibenden Metadaten stehen in stetig zunehmender Anzahl über Plattformen für elektronische Zeitschriften oder digitale Repositorien frei über das Internet zur Verfügung und lassen sich nachnutzen. Die Metadaten können über OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) abgerufen werden (Harvesting). Durch Weiterverarbeitung und Indexierung der Metadaten lassen sich Services wie die „Bielefeld Academic Search Engine“ (BASE) entwickeln.
Dieser Artikel beschreibt die praktischen Erfahrungen, die seit über 10 Jahren im Rahmen des Betriebs von BASE an der Universitätsbibliothek Bielefeld gewonnen wurden. BASE sammelt Millionen von Metadatensätzen aus Tausenden von Quellen weltweit. Die Metadaten werden während des Indexierungsprozesses teilweise korrigiert, normalisiert und um weitere Informationen angereichert. BASE sammelt zudem Metadaten zu den indexierten Quellen, die ebenfalls für Retrieval und Anzeige verwendet werden.
Eine Übersicht der Services vergleichbarer Suchdienste zeigt auf, welche Unterschiede und Gemeinsamkeiten es zwischen BASE und anderen wissenschaftlichen Suchdiensten gibt.
BASE wird auf vielfältige Weise verwendet, und die enthaltenen Daten werden über Schnittstellen nachgenutzt. Neue Herausforderungen ergeben sich insbesondere aus der Erweiterung des Umfangs der Metadaten und ihrer Bereitstellung mithilfe detaillierterer Datenformate jenseits von Dublin Core. Durch die Anreicherung der Metadaten um Informationen wie Personenattribute (IDs, Affiliationen), Förderorganisationen und verknüpfte Forschungsdaten entsteht die Notwendigkeit, das Datenschema für die Indexierung in geeigneter Weise zu erweitern.