Das Open-Archives-Initiative Protocol for Metadata Harvesting (OAI-PMH) als Grundlage für den Austausch von Datenbank-Hilfetexten - Ein Vorschlag

von Gerrit Gragert

Elektronische Ressourcen im Allgemeinen und Datenbanken im Besonderen bieten dem Nutzer viele Vorteile. Er kann im Volltext schnell und einfach Begriffe finden oder in den einzelnen Feldern seine Suche auf spezielle Kriterien beschränken. Indexe, Sortierfunktionen, Trunkierung und Verknüpfungen erleichtern dabei die Recherche und helfen, die gewünschten Informationen möglichst exakt zu erhalten. Doch wie allseits bekannt, liegt in diesen Vorteilen auch ein Problem: Für (fast) jede Datenbank gibt es eine eigene Oberfläche mit eigenen Feldbezeichnungen, Trunkierungs- und Verknüpfungsfunktionen sowie der Möglichkeit des Druckens und Speicherns. Da der Nutzer nur schwer exakt die Informationen, die er sucht, auch finden kann, wenn er eben diese Möglichkeiten nicht kennt, sehen es mittlerweile viele Bibliotheken zu Recht als ihre Aufgabe an, hier Unterstützung zu leisten. Diese reicht von regelmäßigen Datenbankschulungen über umfangreiche Anleitungen - teilweise ebenfalls online bei der Bibliothek verfügbar - bis hin zu Kurzhinweisen in Form von Faltblättern o.ä. Gerade für große und häufig subskribierte Datenbanken entsteht nun aber die Situation, dass in mehreren Bibliotheken immer wieder von Neuem aufwändig Hilfetexte erstellt werden. Sicher ist dies aufgrund der unterschiedlichen Anforderungen an solche Anleitungen, resultierend auch aus der Nutzerschaft der jeweiligen Bibliothek, verständlich, andererseits stellt sich unweigerlich die Frage, ob diese vielerorts verrichtete Doppelarbeit nicht vermeidbar ist?1

Momentan erleichtern sich engagierte Bibliothekare die Arbeit dadurch, dass sie gelungene Hilfetexte anderer Kollegen entweder direkt verlinken oder mittels "Copy-And-Paste" in ihr System vor Ort übernehmen. Eventuell werden im letzten Fall noch Anpassungen an die lokalen Bedürfnisse und Gegebenheiten vorgenommen, wobei sich hier auf urheberrechtlich dünnem Eis bewegt wird. Denn näher betrachtet unterscheiden sich die Inhalte solcher Hilfen oftmals nur in der Detailliertheit der Beschreibungen: erwähnen manche nur stichpunktartig z.B. die Verwendungsweise boolescher Operatoren, stellen andere sehr detailliert (teilweise mit Screenshots) alle Funktionalitäten einer Datenbank dar. Trotzdem die Hilfetexte einen gemeinsamen Grundstamm an Informationen zu einer Datenbank beinhalten, ist es aufgrund der lokalen Gegebenheiten aus oben beschriebenen Gründen schwer denkbar, dass man sich bibliotheksübergreifend auf eine Art Standardformat solcher Nutzungshinweise einigt.

OAI-PMH - offenes Protokoll für verschiedene Datenformate

Dennoch ist es nicht ausgeschlossen, Benutzungsanleitungen für Datenbanken über Bibliotheksgrenzen hinweg auszutauschen und so Mehrfacharbeit zu vermeiden oder zu vermindern. Die Werkzeuge hierfür existieren in den etablierten Standards der Extensible Markup Language (XML)2 und dem Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH)3. Dieser Artikel will einen Weg aufzeigen, wie es unter Nutzung der genannten Standards möglich ist, eine technische Grundlage zum Austausch von Datenbank-Hilfetexten zu schaffen, ohne dass Bibliotheken sich zusätzlich auf eine (kaum machbare) standardisierte Beschreibung von Datenbanken einigen.

Die Open-Archives-Initiative wollte ein Problem lösen, welches mit der steigenden Zahl an wissenschaftlichen Veröffentlichungen auf Preprint-Servern oder in elektronischen Archiven entstand. Die damit einhergehende wachsende Menge dieser meist fachlich orientierten Verzeichnisse machte es immer schwieriger, Beiträge aufzufinden. Es blieb dem Wissenschaftler bei seiner Suche somit keine Wahl, als die Archive mit ihren mannigfaltigen Rechercheoberflächen einzeln abzusuchen, um ein umfassendes Ergebnis zu erhalten. Die OAI wollte diesen Weg vereinfachen und einen standardisierten Zugang zu den Metadaten der Volltexte ermöglichen.4

Aus dieser Idee entwickelte sich ein Modell, welches zunächst zwei Kommunikationspartner kennt. Zum einen die elektronischen Archive und Preprint-Server als Anbieter der Metadaten, die sog. Dataprovider. Zum anderen diejenigen, die diese Metadaten verarbeiten und Mehrwertdienste anbieten, die sog. Serviceprovider. Der Austausch der Metadaten erfolgt zwischen Data- und Serviceprovider im bereits erwähnten Kommunikationsprotokoll OAI-PMH unter Nutzung von HTTP und XML. Auf Seiten des Dataproviders sieht das OAI-PMH sechs grundlegende Befehle vor, die es dem Serviceprovider ermöglichen, Informationen über das Archiv zu erhalten und Metadaten zu den Volltexten einzusammeln. Den jeweiligen Befehl sendet der Serviceprovider mittels HTTP an ein Skript oder Servlet auf Seiten des Dataproviders. Dieser antwortet auf die Anfrage in XML, wobei der Aufbau dieser Reaktion im OAI-PMH festgeschrieben ist.5

Benutzungsinformationen sind auch Metadaten

Nicht festgeschrieben im Protokoll ist jedoch das Format der Metadaten an sich. Es ist nur vorgesehen, dass der Anbieter der Metadaten in der Antwort mitteilt, wie ein Metadatensatz aufgebaut ist. Dazu muss der Anbieter i.d.R. mittels eines XML Schemas6 dieses Format einmalig definieren und die Datensätze diesem Schema konform liefern. Durch die Nutzung von XML Namensräumen wird diese Definition dann in die OAI-PMH-konforme Antwort auf die Anfrage eines Serviceproviders "eingebaut". Auf diese Weise wird das OAI-PMH zu einem sehr offenen Standard, mit dem man nicht nur beliebige Metadaten zu Texten und Aufsätzen austauschen kann, sondern auch zu Bildern, Skulpturen, Landkarten und anderen Objekten jeglicher Art. Zu diesen Objekten zählen natürlich auch elektronische Ressourcen wie Datenbanken und zu den beliebigen Metadaten strukturierte Benutzungshinweise und Hilfen.

Entschließt sich nun eine Bibliothek, die Benutzungshilfen, die sie bislang ihren Nutzern evtl. als HTML-Seite im Netz angeboten hat, nach einem eigenen, den lokalen Anforderungen entsprechenden, erstellten XML Schema anzubieten, eröffnet sich nicht nur die Möglichkeit, diese Hilfetexte in verschiedenen Formaten (beispielsweise wie gehabt in HTML oder auch als PDF-Dokumente) zu offerieren, sondern beim Einsatz der OAI-Schnittstelle auch der Weg, diese Hilfen automatisiert über das Netz zu sammeln bzw. anderen Bibliotheken zur Weiternutzung anzubieten. Da nicht nur die Metadaten selbst, sondern auch die Schema-Dateien über das Netz zugänglich sind, kann eine Einrichtung auch entscheiden, ob das XML Schema einer anderen Bibliothek für sie nützlich und brauchbar ist oder ob doch ein eigenes Schema entwickelt werden soll. Bei genügend großer Teilnahme entstünde so eine Art "Tauschbörse" von elektronisch les- und verarbeitbaren Datenbankhilfen, in der jeder von der Arbeit des anderen profitieren kann, dies aber nicht muss (Abb. 1).

Abbildung 1: Bibliothek sucht direkt nach Benutzungshilfen

Noch mehr gewinnen wird diese Idee, wenn sich eine oder mehrere Bibliotheken zusätzlich als Serviceprovider im Sinne der Open Archives Initiative beteiligen. Diese Bibliotheken hätten dann Harvester im Einsatz, welche in bestimmten Abständen unter Zuhilfenahme des OAI-PMH von anderen Bibliotheken Benutzungshilfen einsammeln und in einem eigenen Index abspeichern. Gleichzeitig bieten sie eine Benutzeroberfläche an, über die in diesem Index von vielen verschiedenen Benutzungshilfen gesucht werden kann (Abb. 2). Somit kann sich der Auskunftsbibliothekar oder vielleicht sogar der Nutzer selbst schnell einen Überblick verschaffen, welche Bibliothek zu welchen Datenbanken Hilfen anbietet. Findet der Bibliothekar eine für sein Haus passende Anleitung, kann er diese wiederum einfach mittels "Copy-And-Paste" oder fortgeschritten automatisiert über Skripte und Stylesheets in die lokale Hilfesammlung übernehmen. Wird er nicht fündig, kann er sich die Mühe machen und eine eigene Hilfe erstellen, die dann wiederum anderen Bibliotheken zur Weiternutzung via OAI-PMH zur Verfügung gestellt wird.

Abbildung 2: Nutzung eines zentralen Index

Diese Idee soll und kann nur ein Vorschlag sein, wie die verschiedensten Bibliotheken mit allen ihren unterschiedlichen Anforderungen dennoch einen Weg finden können, bibliotheksspezifische Arbeiten wie Datenbankhilfen untereinander austauschen zu können. Sie soll ebenso dazu anregen, den Begriff der Metadaten von der streng bibliothekarisch-bibliographischen Sicht zu lösen und etwas weiter zu fassen. Voraussetzung für das Gelingen einer solchen Idee ist natürlich die Teilnahme mehrerer Bibliotheken sowie die Bereitschaft auf allen Seiten, das Attribut "offen" der Open Archives Initiative auch im Sinne des "Open Access" zu sehen und seine Arbeit anderen zur Verfügung zu stellen. Denn dies geschieht ja nicht ohne Gegenleistung, zumal jeder in diesem Modell von der Arbeit des anderen profitieren kann.


Zum Autor

Gerrit Gragert, MA

ist Electronic Resources Administrator

IT-Abteilung
Staatsbibliothek zu Berlin PK
Potsdamer Straße 33
D-10772 Berlin
E-Mail: gerrit.gragert@sbb.spk-berlin.de


Anmerkungen

1. Dieses Thema wurde schon 1999 - vor allem in Bezug auf CD-ROM-Datenbanken - in der Mailingliste INETBIB diskutiert: http://www.ub.uni-dortmund.de/listen/inetbib/msg09515.html sowie http://www.ub.uni-dortmund.de/listen/inetbib/msg08909.html
[gesehen 27.07.2004]

2. http://www.w3.org/XML/
[gesehen 27.07.2004]

3. http://www.openarchives.org/
[gesehen 27.07.2004]

4. Einen guten Überblick verschafft das Tutorial des Open Archives Forum (in Englisch): http://www.oaforum.org/tutorial/
[gesehen 27.07.2004]

5. Die Komplette Protokollspezifikation (in Englisch): http://www.openarchives.org/OAI/openarchivesprotocol.html
[gesehen 27.07.2004]

6. http://www.w3.org/XML/Schema
[gesehen 27.07.2004]