Die Digitale Bibliothek NRW

Chronologie, Projektverlauf und Technische Beschreibung

von Moritz Habermann und Stefan Heidbrink

Chronologie

Die Digitale Bibliothek NRW wurde im Februar 1998 durch eine Initiative des damaligen Ministeriums für Wissenschaft und Forschung des Landes NRW (jetzt: Ministerium für Schule und Weiterbildung, Wissenschaft und Forschung) ins Leben gerufen. Ziel des Projekts war es, die Versorgung aller Hochschulangehörigen des Landes, vor allem der Studierenden, mit Literatur in gedruckten und elektronischen Ausgaben nachhaltig zu verbessern. Konzeption und Aufbau dieser Digitalen Bibliothek NRW erfolgte kooperativ, arbeitsteilig und in einem abgestimmten Verfahren gemeinsam durch alle Hochschulbibliotheken und das Hochschulbibliothekszentrum NRW (HBZ). Die Projektleitung liegt in der Aufbauphase 1998 und 1999 bei der Bibliothek der Universität Bielefeld und wird ab dem Jahr 2000 an das HBZ NRW übergeben.

Nachdem die Arbeitsgemeinschaft der Universitätsbibliotheken und die Arbeitsgemeinschaft der Fachhochschulbibliotheken dem Grundkonzept im April 1998 zugestimmt hatten, wurden mehrere Arbeitsgruppen eingerichtet, die verschiedene Teilbereiche der Digitalen Bibliothek NRW untersuchen und Empfehlungen erarbeiten sollten. Dies waren im einzelnen Arbeitsgruppen zur Ausarbeitung des technischen Konzepts, zum flächendeckenden Aufbau von Hochschulschriftenservern, zur Konzeption des Abrechnungssystems sowie zur Auswahl und Beschaffung von Literatur in elektronischer Form.

Im Anschluß an diese Konzeptphase erfolgte eine intensive Marktanalyse mit dem Ergebnis, daß ein System mit der gewünschten Funktionalität und der geforderten Integration der Dienstleistungen auf dem Markt nicht vorhanden war. Daraufhin wurden in enger Zusammenarbeit mit den Firmen IHS Technologies GmbH, München, beim zentralen Zugangssystem und axion, Köln, beim Zugangskontroll- und Monitoringsystem sowie beim Abrechnungssystem Pflichtenhefte für die Realisierung der zentralen Systeme der Digitalen Bibliothek NRW erarbeitet. Auf dieser Grundlage wurden die Aufträge an die genannten Firmen erteilt und im weiteren Verlauf des Jahres 1998 mit der Umsetzung und Programmierung begonnen

Die vielfältigen Aktivitäten der Hochschulbibliotheken des Landes auf dem Gebiet elektronischer Dienstleistungen wurden außerdem in die Digitale Bibliothek NRW integriert. Dazu wurden mehrere Projekte aus den Bereichen Sammlung und Erschließung von elektronischen Dokumenten sowie Authentifizierung und Zertifizierung an den Hochschulbibliotheken durchgeführt.

Nach intensiven internen Tests und Optimierungen der Systeme wird jetzt die Einführung der Systeme in dem Routinebetrieb vorbereitet. Im Laufe des Mai 1999 erfolgte die Freischaltung des Zugangs für die Benutzer in den ersten sechs Pilothochschulen. Auch hier begleiten umfangreiche Tests und Befragungen die Einführung der Systeme, deren Optimierung fortgesetzt wird. Im weiteren Verlauf des Jahres werden dann auch die übrigen Hochschulen Zugang zur Digitalen Bibliothek NRW erhalten. Ein Gastzugang auch für Personen, die nicht Hochschulangehörige in NRW sind, wird demnächst unter der URL: http://www.digibib-nrw.de eingerichtet werden.

Die zentralen Systeme

Aus Benutzersicht sind vor allem folgende Funktionen besonders hervorzuheben:

Detailierte technische Beschreibung der zentralen Systeme

Eine Reihe sogenannter "Metasuchmaschinen" ermöglicht es bereits heute, mit einer einzigen Suchanfrage in mehreren Datenbanken parallel zu recherchieren. Die Anforderungen an das Zugangssystem der Digitalen Bibliothek NRW gehen jedoch weit darüber hinaus: unter einer konsistenten Web-Oberfläche integriert es die Suche nach Dokumenten, die anschließende Prüfung ihrer lokalen Verfügbarkeit sowie den direkten Zugriff auf den Volltext, sofern dieser in elektronischer Form vorliegt. Für Zeitschriftenartikel bietet es die Bestellung über die existierenden Dienste JASON und Subito an.

Das bereits nutzbare Datenbankangebot reicht von deutschen Verbundkatalogen über lokale und ausländische OPACs bis hin zu fachbibliographischen Datenbanken. Von besonderer Bedeutung ist die Collect-Datenbank, die als zentrales Nachweisinstrument für elektronische Volltexte speziell für die Digitale Bibliothek aufgebaut wurde. Die fortlaufende Erweiterung dieses Angebotes ist geplant und kurzfristig realisierbar.

Ein Kernstück des Zugangssystems ist das Standardprodukt Query Server der Dataware Technologies, Inc. Er setzt eine eingegebene Suchanfrage in gleichzeitige Parallelsuchen in allen ausgewählten Datenbanken um und sammelt und konsolidiert die Rückgaben zu einer einheitlichen Liste.

Z.Z. bietet das Zugangssystem zur Anbindung von Datenbanken Schnittstellen über HTPP und Z39.50 an. Im Gegensatz zur statuslosen HTTP-Verbindung ist das Z39.50-Protokoll sitzungsorientiert, d.h. es wird eine Session zwischen einem Z-Client und dem Z-Server der Zieldatenbank eröffnet, die solange bestehen bleibt, bis entweder der Client sie explizit beendet oder der Server sie aufgrund von Inaktivität beendet. Da die Digitale Bibliothek als internet-basiertes System grundsätzlich stateless arbeitet, wurde ein Z-Client benötigt, der die Umsetzung von Z39.50 zu HTTP und zurück leistet. Dafür fiel die Wahl auf das Standardprodukt WebPAC von Ameritech/Dynix.

Die Suchsyntax für die parallel abgefragten Datenbanken ist i.A. nicht einheitlich. So bestehen Unterschiede in der Behandlung von Umlauten; Trunkierungszeichen sind z.T. nicht erlaubt oder unterschiedlich, sogar die erforderliche Syntax für die Eingabe von Autorennamen weist Unterschiede auf. Auf eine fehlerhafte Anfrage werden keine Treffer oder eine Fehlermeldung zurückgegeben. Um nach außen hin ein weitgehend identisches Verhalten der an sich so unterschiedlichen Datenbankschnittstellen zu erzielen, muß also eine Suchanfrage, die in der gemeinsamen Eingabemaske formuliert wird, für jede Datenbank in eine für sie verständliche Form transformiert werden. Für diese Transformation sorgt ein Gateway, das jeweils zwischen Query Server und Datenbank (bzw. WebPAC als HTTP-Interface Z-Quelle) geschaltet ist und die datenbankspezifische Umwandlung des Suchstrings vornimmt.

Doch auch die Formate, in denen die Rechercheergebnisse von den Quelldatenbanken zurückkommen, weichen z.T. erheblich voneinander ab. Da das Zugangssystem jedoch eine einheitliche Ergebnisanzeige liefern soll, ist auch auf dem Rückweg von den Datenbanken zum Query Server eine Umformatierung durch die Gateways erforderlich. Analoges gilt für das Anfordern sowie die Präsentation der Vollanzeige.Das Zugangssystem unterscheidet drei Arten, wie ein Dokument verfügbar sein kann: als Monographie/Printversion, als Online-Datei oder über einen Bestellservice. Abhängig von den Daten, die für ein Dokument zur Verfügung stehen, wird nun eine Recherche in den entsprechenden Verfügbarkeitsdatenbanken durchgeführt. Ist beispielsweise die ISSN-Nummer bekannt, werden Verfügbarkeitsdatenbanken für Zeitschriften herangezogen.

Lokale Besonderheiten

Abhängig vom Campus, auf dem sich ein Benutzer anmeldet, werden diesem unterschiedliche Datenbanken zur Recherche angeboten. Die Auflistung der gefundenen Dokumente ist wiederum standortspezifisch, Ergebnisse lokaler Datenbanken werden zuerst dargestellt. Möglich ist damit auch eine thematische Zusammenstellung z.B. speziell für naturwissenschaftliche, technische oder medizinische Studiengänge.

Für jede Sicht können darüber hinaus Suchmaske und Ergebnisanzeigen im Rahmen der beschriebenen konsistenten Web-Oberfläche gestaltet werden.

Zugangskontrolle

Die Zugangskontrolle ermöglicht die Identifizierung des Benutzers und eine Zuordnung zur entsprechenden Sicht. Darüber hinaus ermöglicht ein anonymer Gastzugang Zugriff auf frei zugängliche kostenlose Angebote. Registrierte Benutzer geben bei der Registrierung ihre persönlichen Daten und eine Kontoverbindung an. Dies ist notwendig, damit kostenpflichtige Dienste beim Benutzer abgerechnet werden können. Wählt der Benutzer nach einer Recherche ein kostenpflichtiges Dokument aus, wird überprüft, welches Berechnungsverfahren gewählt wurde. Hat dieser einen Pauschalzugang auf diese Datenbank beantragt, findet er auf der Abrechnung den pauschalen Betrag zur Verwendung der Datenbank. Bei Einzelabrechnung werden neben dem Preis auch Informationen über das ausgewählte Dokument aufgeführt.

Collect-Datenbank

Die Collect-Datenbank der Firma IHS Technologies ist die Nachweisdatenbank für elektronische Dokumente, die von den teilnehmenden Hochschulen bzw. Hochschulbibliotheken im Rahmen der Digitalen Bibliothek NRW zur Verfügung gestellt werden. Inhalt sind also Nachweise über in elektronischer Form vorliegende Hochschulschriften oder über digital vorliegende Zeitschriften.

Die Metadaten werden im Dublin-Core-Format erzeugt und in die Collect-Datenbank eingespielt. An lokalen Bibliotheksstandorten werden Nachweisseiten erstellt und in Austauschverzeichnissen abgelegt. Eine zentral installierte Gatherer-Software "scannt" diese Verzeichnisse in regelmäßigen Abständen und überträgt die Nachweisseiten auf den zentralen Server der Collect-Datenbank. Dort werden die Daten konvertiert, mittels MILOS verbal erschlossen und indiziert und in das Datenbanksystem BRS/Search der Firma Dataware Technologies importiert.

Query-Server

Im Rahmen des Zugangssystems ruft der Query-Server die abzufragenden Nachweisdatenbanken über Gateways in jeweils einem eigenen Thread auf. Die Gateways erhalten dazu als Parameter neben der Suche, formuliert in einer Meta-Anfragesprache, auch die URL der zu durchsuchenden Nachweis-Metadatenbank.

Die Suchanfrage wird daraufhin untersucht, welche Operatoren darin enthalten sind. Falls ein Operator verwendet wird, der für die Datenbank nicht definiert ist bzw. von dieser nicht unterstützt wird, greift der Operation-Fallback Mechanismus: die nicht unterstützten Operatoren werden automatisch auf unterstützte Operatoren abgebildet.

Zukünftige Entwicklungen

Eine wesentliche Erweiterung der Digitalen Bibliothek wird der Aufbau des Liefersystems für rückgabepflichtige Dokumente, also vor allem Bücher, sein. Außerdem wird eine englischsprachige Fassung der Benutzeroberfläche integriert werden, die vor allem beim Aufbau von Kooperationen mit ausländischen Dienstleistern und Verlagen wichtig ist.

Außerdem werden die weltweit verteilt vorgehaltenen und wissenschaftlich relevanten Dokumente und Informationsmedien in die Nachweissysteme der Digitalen Bibliothek NRW integriert, um auch die über das Internet frei verfügbaren Medien für die Benutzer komfortabel zugänglich zu machen.

 

Firmenprofil IHS Technologies GmbH

IHS Technologies ist eine Tochtergesellschaft der IHS Group, einer international führenden Unternehmensgruppe für Datenbank-Publishing. Mit einem umfassenden Dienstleistungsangebot und innovativen Softwareprodukten unterstützt IHS Technologies seit über 12 Jahren seine Kunden aus den Bereichen Forschung und Lehre, Industrie, Behörden und Verlagswesen bei der Datenaufbereitung, dem Datenbank-Design und der Informationsintegration und –verteilung im Internet/Intranet, auf CD-ROM, Online und in Form von Hybrid-Lösungen.

Grundlage des umfassenden Serviceangebotes bilden modernste Informationstechnologien mit den Schwerpunkten Electronic Publishing und Information Access für CD-ROM, Internet/Intranet und Client/Server Kunden.

Sowohl kommerzielle Anwendungen als auch interne auf spezifische Zielgruppen abgestimmte Informationsprodukte werden heute von über 700.000 Endanwendern weltweit genutzt.

Zu den Autoren

Moritz Habermann ist ADV-Koordinator an der Universitäts-Bibliothek Bielefeld.

Stefan Heidbrink ist im Hause IHS verantwortlich für das Projektmanagement.