Entwurf und Implementierung einer neuen Multi-Klassifikations-Normdatei für den Österreichischen Bibliothekenverbund


Abstract

1 Einleitung
2 Ziele und erwartete Nutzungseffekte
3 Konzeptionelle Überlegungen
4 Redaktionsarbeiten
5 Setup und Umsetzung
6 Implementierungsaspekte
7 Katalogisierung und OPAC-Funktionalitäten
8 Ausblick

von Otto Oberhauser und Josef Labner

1 Einleitung

Im Vorjahr wurde in dieser Zeitschrift über die Implementierung klassifikationsbasierter Anzeige- und Recherchemöglichkeiten im Online-Katalog des Österreichischen Bibliothekenverbundes berichtet.1 Dieser durch Die Österreichische Bibliothekenverbund und Service Gesellschaft m.b.H., Wien (OBVSG)2 unter der Software "Aleph 500" betriebene Österreichische Verbundkatalog3 weist inzwischen bereits 5,3 Millionen Titel mit etwa 10,2 Millionen Exemplar- und rund 0,7 Millionen Zeitschriften-Bestandsangaben nach (Stand: Oktober 2006). 2005 wurden in diesem OPAC Funktionalitäten wie die Verlinkung der Notationsangaben in der Titelvollanzeige mit den Webseiten des betreffenden Klassifikationssystems zum Zweck der Veranschaulichung der Bedeutung der Notationen eingebaut; dies geschah für die ZDB-Systematik, die Regensburger Verbundklassifikation (RVK), die Mathematics Subject Classification (MSC) und später auch für die Basisklassifikation (BK). Im Teilkatalog "Zeitschriften und Serien" wurde darüber hinaus eine Suchoption eingerichtet, die eine hierarchische Suche mittels der ZDB-Systematik ermöglicht, ohne dass Kenntnis der ZDB-Notationen vorausgesetzt wird.

Anzeige

Die Möglichkeiten für die Implementierung eines Klassifikationssystems als Normdatei unter Aleph 500 wurden in Österreich schon vor einigen Jahren - damals noch unter der Aleph-Version 11.5 - analysiert, doch kam dieser Versuch nicht weit über die Parametrisierung und Präsentation einer Demo-Version4 hinaus. Nach dem Beginn der damaligen Implementierungsphase konnten die Eingabe- und Redaktionsarbeiten, die an der mathematischen Fachbereichsbibliothek der Universität Wien erfolgten, aus personellen Gründen nicht fortgeführt werden; auch unter der nächsten Version (14.2) wurden sie nicht wieder aufgenommen. Nach der im Jahr 2005 erfolgten Migration des Verbundsystems in die Aleph-Version 16 wurde das Projekt "reanimiert" und als Grundlage für die im folgenden beschriebenen Entwicklungsarbeiten herangezogen.

Während ursprünglich nur geplant war, eine Aleph-Normdatei für ein Klassifikationssystem -die MSC - einzurichten, konkretisierte sich in jüngerer Vergangenheit der Gedanke an eine Normdatei für mehrere verschiedene Klassifikationssysteme. Dieser Ansatz geht nicht unwesentlich auf die in den letzten drei Jahren gemachten positiven Erfahrungen der OBVSG mit "Aleph Sharing" zurück, einem modularen Modell der Teilnahme an einem Aleph-Lokalsystem für kleinere Bibliotheken, die sich dabei die Aleph-Libraries BIB, ADM und HOL (für bibliographische, administrative, lokale/bestandsspezifische Daten) teilen. Da die MSC mit ihren rund 5.000 Klassen keine große Datenmenge darstellt, entstand die Idee, erstmals auch im Bereich einer Aleph-Normdatei zu versuchen, eine gemeinsame Belegung der betreffenden Aleph-Library AUT ("authorities") durch mehrere Klassifikationssysteme in die Realität umzusetzen. Durch eine solche Lösung könnten die eingesetzten Ressourcen besser und kostengünstiger genutzt werden und außerdem wertvolle Erfahrungen für künftige Anwendungen im Verbundbereich wie auch für die an der OBVSG geführten lokalen Aleph-Installationen gewonnen werden. Als zweites System für das Projekt zur Erstellung einer solchen Multi-Klassifikations-Normdatei wurde die seit 2004 im Österreichischen Bibliothekenverbund primär für die Erschließung von Dissertationen verwendete Basisklassifikation (BK) ausgewählt, die mit rund 2.100 Klassen ebenfalls ein "kleines" Schema darstellt und wie die MSC über eine monohierarchische Struktur verfügt.

Mathematics Subject Classification (MSC)

Die von der American Mathematical Society herausgegebene und gepflegte MSC ist das international anerkannte sachliche Erschließungsinstrument für das Fachgebiet Mathematik. Sie wird daher auch von den für diesen Bereich zuständigen Sacherschließern im Österreichischen Bibliothekenverbund angewandt und ist somit von verbundweitem Interesse. Die aktuelle Version5 stammt aus dem Jahr 2000 und ist eine revidierte Fassung der Version aus 1991, die seitdem auch von den bekannten Dokumentationsdiensten Mathematical Reviews und Zentralblatt für Mathematik verwendet wird.

Die Notationen dieses hierarchischen Klassifikationssystems mit drei Ebenen setzen sich aus numerischen (oberste und dritte Ebene) und alphabetischen Codes (zweite Ebene) zusammen, die die Hierarchien vollständig abbilden. Ein Beispiel dazu findet sich in Abbildung 1, aus der auch quantitative Angaben über die Belegung der Hierarchieebenen mit Klassen für die beiden MSC-Versionen 2000 und 1991 entnommen werden können.

Abbildung 1: Struktur, Notationen und Klassenanzahl der MSC

Basisklassifikation (BK)

Die vom Gemeinsamen Bibliotheksverbund (GBV) gepflegte BK ist eine modifizierte deutschsprachige Version ("Version 2000, Stand: Dezember 2004")6 der ursprünglich von der PICA-Stiftung entwickelten Nederlandse basisclassificatie. Dabei handelt es sich um ein monohierarchisches System von etwa 2.100 Klassen in 48 Hauptgruppen. Die BK ist aufgrund ihrer relativ groben Struktur in erster Linie als Ergänzung zur verbalen Sacherschließung in Online-Katalogen konzipiert und eignet sich daher z.B. für die thematische Eingrenzung von Schlagwortrecherchen. Auch nicht geschulte Klassifizierer wie etwa die Verfasser der österreichischen Dissertationen, die ihre Arbeiten vor der Aufnahme in den Verbundkatalog selbst mit der BK erschließen, kommen mit diesem kompakten System relativ gut zu Rande.

Die BK verfügt über bis zu fünf Hierarchieebenen; zumeist werden aber nur die ersten drei genutzt. Ihre Notationen sind vierstellig, enthalten nur Ziffern sowie einen Punkt nach den beiden ersten, für die Hauptklassen stehenden Stellen. Sie sind grundsätzlich enumerativ und bilden nur in manchen Bereichen die Hierarchien ab. Ein Beispiel dazu gibt Abbildung 2, die auch quantitative Angaben über die Belegung der Hierarchieebenen mit Klassen für die aktuelle BK-Version (2000) enthält.

Abbildung 2: Struktur, Notationen und Klassenanzahl der BK

2 Ziele und erwartete Nutzungseffekte

Eine kurze Übersicht über die grundsätzlichen Aspekte von Normdateien und Normdatensätzen findet sich z.B. bei Haller & Fabian (2004, 246 ff). Im deutschsprachigen Bibliothekswesen werden überregionale Normdateien bekanntlich für die Bereiche Personennamen (PND), Körperschaften (GKD) und Schlagwörter (SWD) eingesetzt. Seltener geschieht dies im Bereich der klassifikatorischen Erschließung; ein Beispiel ist etwa die im OPAC des HBZ auf der Basis einer Aleph-Normdatei realisierte "NWBib-Systematik".7

Normdateien bieten nicht nur das, was ihr Name sagt - die Normierung bestimmter Datenelemente (z.B. Autoren-/Körperschaftsnamen, Schlagwörter) bzw. die Gewährleistung der normgerechten Ansetzung dieser Elemente (z.B. in der Abfolge: Notation, Leerstelle, Bindestrich, Leerstelle, Klassenbenennung). Wenn sie in ein integriertes Bibliothekssystem eingebunden sind, leisten sie darüber hinaus auch noch zumindest folgendes:

Das Beispiel in Abbildung 3 zeigt dazu die Verbindung zwischen Katalogisat, Index und Normdatenvollanzeige in der Sachkatalogisierung in einem Aleph-500-Bearbeiterinterface.

Abbildung 3: SWD-Nutzung in der Sachkatalogisierung
Abbildung 4: SWD im OPAC

3 Konzeptionelle Überlegungen

Bei der Untersuchung der für eine hierarchische Normdatei verwendbaren Linkstrukturen in Aleph stellte sich schon bei der Analyse im Jahr 2000 heraus, dass die im Prinzip verfügbare Funktionalität von Thesauruslinks nur in der MARC-Version, nicht aber in der MAB-Version der Software einsatzfähig war. Aus diesem Grund optierte schon das erste Konzept für die Verwendung hierarchischer Aleph-Titellinks. Diese basieren auf der MAB-Kategorie 010, in der die ID-Nummer des jeweils übergeordneten Satzes eingetragen wird. In einer bibliographischen Aleph-Library entstehen dadurch die typischen Hauptsatz-Untersatz-Relationen, wobei die Links zwischen den beiden Satztypen unter Verwendung der Einträge aus Titelkategorien generiert werden.8 Als Konsequenz dieses Ansatzes wurde schon damals entschieden, in den Datensätzen des Prototyps der Klassifikations-Normdatei anstelle von ID-Nummern (Kategorie 001) die Notationen zu verwenden und als Ansetzungsform für jede Klasse (Kategorie 331) die Notation nebst der Klassenbenennung zu katalogisieren. Dabei erfolgte die vielleicht auf den ersten Blick "missbräuchliche" Verwendung von Titelkategorien wie 331 aus rein pragmatischen Gründen, d.h. um das Funktionieren in der Aleph-Umgebung zu gewährleisten.9 Außerdem sah das ursprüngliche Konzept vor, bei jedem Normdatensatz auch die Ansetzungsformen der jeweils über- bzw. untergeordneten Klassen in entsprechenden Kategorien einzutragen.10 Zur Herstellung von Assoziativrelationen (Siehe-auch-Verweisungen) diente die Kategorie 860, in der darüber hinaus auch Benutzungshinweise u.a. katalogisiert wurden. Durch diese Kategorienbelegungen sollte gewährleistet werden, dass bei der Vollanzeige des Normdatensatzes im OPAC der bibliographischen Datenbank bestimmte Navigationsmöglichkeiten entstehen, zumal die über den Aleph-Titellink generierten Texte (331) ausschließlich in der Normdatenbank selbst verfügbar sind. Die genannten Navigationsmöglichkeiten inkludieren:

Abbildung 5: Normdatei und Titeldatei: Strukturen und Navigation

Dieses Grundkonzept wurde auch in der gegenwärtigen Aleph-Version beibehalten.11 Abbildung 5 veranschaulicht dazu die Beziehungen zwischen Normdatei und Titeldatei, sowie zwischen den Datenelementen der Normdatei bzw. den Navigationsmechanismen in der Titeldatei. Wie ersichtlich, beruht die Navigation innerhalb der Normdatei12 auf den erwähnten, aus den Kategorien 331 der über- bzw. untergeordneten Klassen "gespeisten" UP- und DN-Links bzw. den Siehe-auch-Verweisungen (Kategorie 860). Die in der Normdatei generierten UP- und DN-Links sind jedoch für die Navigation innerhalb der Titeldatei (Verbundkatalog) nicht nutzbar. In dieser bilden die hier durchaus nutzbaren Siehe-auch-Verweisungen gemeinsam mit den "katalogisierten" Kategorien OGN und UGN die Navigationsbasis. Zur Normdatenanzeige gelangt man einerseits über den dem betreffenden Klassifikationssystem zugeordneten Phrasenindex (wie in der Abbildung dargestellt), andererseits auch über Hyperlinks in der Titelvollanzeige (hier aus Gründen der Übersichtlichkeit nicht dargestellt). In der Vollanzeige des Normdatensatzes selbst scheinen zweierlei Links auf: Zum einen führen diese zum Aufblättern der Indexliste an der entsprechenden Stelle (d.h. bei der jeweils übergeordneten, untergeordneten oder verwandten Klasse), zum anderen zur Anzeige einer Ergebnisliste mit Titeln zur jeweiligen Klasse. Beide Links werden nur dann generiert, wenn für die betreffenden Klassen auch tatsächlich Titeldaten in der Datenbank vorhanden sind. Zum Klassifikationsindex in der Titeldatenbank sei noch festgehalten, dass dieser nicht nur aus den Ansetzungsformen der Klassen (Notation + Klassenbenennung) besteht, sondern um beliebige verbale Einträge erweitert werden kann. Dabei kann es sich um die Klassenbenennungen selbst, permutierte Teile der Klassenbenennungen, anderssprachige Benennungen sowie Verweisungsformen handeln.

Über das ursprüngliche Konzept hinausgehend wurde im Zuge der Überlegungen evident, dass eine verbesserte Strukturierung bestimmter Kategorien notwendig sein würde. Erreicht wurde dies durch die Einführung unterschiedlicher Subfelder für Datenelemente wie Notation, Klassenbenennung, Version und sonstige Texte. Davon betroffen waren die Kategorie 331 (Ansetzungsform) sowie alle für die Bildung von Relationen benötigten Kategorien (OGN, UGN, 860). Zudem wurde auch durch Erweiterungen in der Feldstruktur die Versionskennzeichnung optimiert, um zu gewährleisten, dass Normdatensätze aus mehreren Versionen eines Klassifikationssystems gemeinsam vorgehalten bzw. genutzt werden können. Dies soll zukünftige Versionen ebenso unterstützen wie ältere - letzteres wird z.B. dann benötigt, wenn ein Titel bewusst mit einer nicht mehr aktuellen Klasse erschlossen werden soll.

Abbildung 6: Modell einer Multi-Klassifikations-Normdatei

Die zusätzliche Erweiterung des ursprünglichen Modells zu einer Multi-Klassifikations-Normdatei wird in Abbildung 6 graphisch veranschaulicht. Die auf der linken Seite dargestellte Normdatenbank nimmt mehrere hierarchisch strukturierte Klassifikationssysteme auf, die durch eine entsprechende Parametrisierung von einander abgegrenzt werden und in der Aleph-Umgebung, sofern notwendig, auch als "logische Datenbanken" separat angesprochen werden können. Die Datensätze des auf der rechten Seite dargestellten Verbundkataloges können wahlweise mit den Normdatensätzen (Klassen) eines oder auch mehrerer in der Normdatenbank geführten Klassifikationssysteme verknüpft werden. Als die Idee zu diesem Konzept entstand, war a priori nicht klar, ob dies technisch möglich sein würde bzw. welche Parametrisierungsschritte erforderlich wären, um eine reibungslose "Koexistenz" mehrerer Klassifikationssysteme in nur einer Normdatei zu gewährleisten. Ein nicht unwesentlicher und vor allem auch zeitaufwendiger Schritt des gesamten Projektes bestand daher im Austesten diverser Parametrisierungsschritte und im Beobachten der erwünschten bzw. unerwünschten Folgewirkungen dieser Maßnahmen.

4 Redaktionsarbeiten

Wie bereits erwähnt, enthält die neue Multi-Klassifikations-Normdatei vorerst Datensätze aus zwei Klassifikationssystemen (MSC und BK). Während die Einbeziehung der MSC primär auf eine Initiative der Fachbereichsbibliothek Mathematik, Statistik und Informatik13 der Universität Wien zurückgeht und unter starker redaktioneller Beteiligung von dort erfolgte, wurde die BK durch die OBVSG selbst eingebracht (zumal diese auch die Österreichische Dissertationsdatenbank14 betreibt, in der BK-Notationen eingegeben werden).

Die mit der Aufnahme der beiden Klassifikationssysteme verbundenen redaktionellen Arbeiten erstreckten sich aufgrund der knappen personellen Ressourcen über einen längeren Zeitraum. Diese Arbeiten umfassten hauptsächlich zwei Aspekte:

Mathematics Subject Classification

Im Falle der MSC erfolgte der Dateninput, d.h. die Katalogisierung der einzelnen Normdatensätze, zum Teil manuell an der genannten Fachbereichsbibliothek, teilweise aber auch mittels dort erstellter Skripte, die Informationen aus der Web-Ausgabe der MSC nutzten. Die Belegung der Kategorien OGN und UGN geschah per Hand. Außerdem wurden neben der gesamten aktuellen Version der MSC (2000) auch etwa 450 Datensätze aus der Version 1991 aufgenommen, um der bereits erfolgten Klassifizierung zahlreicher Verbundtitel Rechnung tragen zu können. Dies machte eine explizite Kennzeichnung der einzelnen Datensätze erforderlich (Kategorie 808a), aus der ersichtlich wird, ob die betreffende Klasse der Version 2000 entstammt, ob sie eventuell bereits in der Version 1991 in gleicher Form enthalten war (Kennung 2000 und 1991) oder ob sie nur in der früheren Version bestand. Des weiteren mussten die in zahlreichen MSC-Klassen vorhandenen griechischen Buchstaben und sonstigen Sonderzeichen (Exponenten, Indizes usw.) redigiert - d.h. korrekt nach Unicode codiert bzw. in Anlehnung an §314 RSWK verbalisiert - werden. Schließlich wurde auch eine Konkordanz zur BK hergestellt und dabei jede MSC-Klasse mit mindestens einer Notation aus diesem System (700f) versehen. Die Ermittlung der jeder Klasse zuzuordnenden Hierarchiestufe war im Falle der MSC relativ einfach, da diese Information mit einem Skript direkt aus den Notationen abgeleitet werden konnte.

Folgende Maßnahmen zur Indexanreicherung kamen zum Tragen:

Basisklassifikation

Die Rohdaten der BK wurden der OBVSG freundlicherweise durch die Verbundleitung des GBV in Form einer Textdatei zur Verfügung gestellt. Die Überführung dieser Daten in das für die Multi-Klassifikations-Normdatei ausgearbeitete Kategorienschema (siehe unten), inklusive der Generierung der Kategorien OGN und UGN, geschah in einigen Iterationsstufen mit Hilfe ad hoc erstellter Skripte. Zudem war es bei einer Reihe von Klassen nötig, die in den Rohdaten nur in zerlegter Form vorhandenen Klassenbezeichnungen in die für die Kategorie 331 zusammengesetzte Ansetzungsform umzuwandeln, so z.B. im Fall der Klasse "53.36 Energiedirektumwandler, elektrische Energiespeicher" (die Rohdaten dazu lauteten - in zwei getrennten GBV-Kategorien 500 - "Energiedirektumwandler" und "elektrische Energiespeicher").

Als etwas schwieriger erwies sich die Ermittlung der Hierarchiestufen der einzelnen Klassen, da die BK-Notationen die Hierarchien nicht konsequent abbilden. Aus diesem Grund wurde die gesamte Klassenstruktur der BK in einer Excel-Datei abgebildet, dort die dem Layout der Druckausgabe der BK intellektuell entnommene Hierarchieinformation eincodiert und später mit einem weiteren Skript in das BK-Datenfile übertragen.16

Für die Indexanreicherung konnte zunächst auf die bereits in den Rohdaten vorhandenen aufgelösten Klassenbenennungen (nunmehr in Kategorie 801) zurückgegriffen werden. Des weiteren enthält die BK eine größere Zahl von "Hier"-Angaben (830a) und Synonymen (830), die ebenfalls als Indexelemente nutzbar gemacht wurden. Um das rein deutschsprachige Vokabular der BK weiter anzureichern, wurde geprüft, inwieweit die englische BK-Version17 der Niederländischen Königlichen Bibliothek für diesen Zweck herangezogen werden könnte. Da die deutsche BK in ihrer Klassenstruktur aber deutlich von der niederländischen abweicht und auch die Qualität der vorgefundenen englischen Version nicht immer zufriedenstellen konnte, wurde entschieden, eine neubearbeitete englische Version der Klassenbenennungen (802) zu erstellen und diese für den Phrasenindex zu zerlegen (803). Dabei enthält die englische Anzeigekategorie in vielen Fällen die hierarchische Information in verbaler Form (z.B. für die Klasse 17.75: "literary theory: literary criticism" unter Wiederholung der Bezeichnung für die übergeordnete Klasse 17.73: "literary theory: general"), zumal für die englischen Klassenbezeichnungen im Gegensatz zur deutschsprachigen Ansetzungsform keine Navigation zu über- bzw. untergeordneten Klassen eingerichtet wurde.

5 Setup und Umsetzung

Einen wesentlichen Anteil bei der Realisierung der neuen Multi-Klassifikations-Normdatei hatten jene Arbeiten, die im direkten Zusammenhang mit dem Setup der erforderlichen Parametertabellen sowohl für diese Datenbank als auch für die Titeldatei (Verbundkatalog) standen. Bis zur Fertigstellung einer erfolgreichen Implementierung war eine größere Zahl iterativer Schritte vonnöten, zumal hier - trotz bestehender Erfahrungen im Bereich der Normdatenparametrisierung - in mancherlei Hinsicht durchaus Neuland betreten wurde. Im Zuge dieser iterativen Schritte kristallisierten sich einige pragmatische Ansätze heraus, wie aus den folgenden Setup-Beschreibungen ersichtlich wird.

Kategorienschema

Dieser Pragmatismus spiegelt sich im besonderen in dem schlussendlich zustandegekommenen Kategorienschema wider (siehe Tabelle 1). Eingeflossen sind darin nicht nur Elemente aus zwei MAB-Formaten für Normdateien (MAB-NOTAT, MAB-SWD), sondern auch Strukturen aus MAB-TITEL und den dafür existenten Funktionalitäten der Aleph-Software.18 Ein besonderes Charakteristikum des Schemas ist die Berücksichtigung der möglichen Aufnahme mehrerer Klassifikationssysteme. Dies wird einerseits durch die "Formatangabe" in der Kategorie FMT und andererseits durch die Kennzeichnung der "logischen Datenbank" in der Kategorie LBA erzielt. Die daraus ableitbaren Definitionen und Sichten für Indexierung und Display sollen ein störungsfreies Nebeneinander der vorgehaltenen Klassifikationssysteme gewährleisten. Auch die anderen Felder des Schemas mussten unter diesem Gesichtspunkt definiert werden. So wird in der Kategorie 331 die MSC inklusive einer Versionsangabe angesetzt, die BK hingegen nicht; ein anderes Beispiel ist die Kategorie 803, die im Falle der MSC die originär englischen Klassenbenennungen enthält, im Falle der BK hingegen die Übersetzungen der deutschen Klassenbenennungen. Die Nutzung der Kategorien 001, 010 und 331 für die Abbildung der hierarchischen Strukturen der Klassifikationssysteme wurde bereits weiter oben erwähnt. Zu ergänzen wäre hier, dass die in den Kategorien 001 und 010 für die Zwecke des hierarchischen Linkaufbaus verzeichneten Notationen durch ein Präfix (MC bzw. BK) eindeutig gemacht werden mussten.19 Die für zusätzliche Indexeinträge benötigten Kategorien weisen zum Teil eine Unterfeldstruktur auf. Dies ist für die Navigation mit Einträgen für assoziative und hierarchische Relationen unabdingbar (z.B. 860), nicht jedoch im Falle von Äquivalenzrelationen (z.B. 803). Auf die "redundanten" Kategorien OGN und UGN - die genau unter diesem Aspekt benötigt werden - wurde bereits hingewiesen, ebenso auf die Struktur der RSWK-Kategorien analog zum MAB-Segment "9--".

Tabelle 1: Implementiertes Kategorienformat (w = wiederholbares Feld / Unterfeld)

Einbettung in die Verbundarchitektur

Abbildung 7 veranschaulicht die "Landschaft" des Österreichischen Bibliothekenverbundes mit den konkreten Datenbankbezeichnungen in der Aleph-Umgebung der OBVSG. Zu sehen ist hier die Einbettung der neuen Multi-Klassifikations-Normdatei ACC19 und ihre Beziehung zur bibliographischen Titeldatei ACC01, die z.B. die automatische Nachführung von Updates der Normdaten in den Verbundtiteln gewährleistet. Dargestellt ist weiter die Nutzung des Konzepts der "logischen Datenbanken" (ACC19MC, ACC19BK) für die einzelnen Klassifikationssysteme und deren Verbindung zu den Titeldaten im Verbundkatalog. Auch die geplante Kopplung der ACC19 mit der Schlagwortnormdatei (ACC12) für die RSWK-Beschlagwortung der MSC-Klassen ist angedeutet. Zuletzt wird auch die Beziehung zu allen Lokalsystemen des Verbundes (siehe im Detail weiter unten) in dieser Graphik berücksichtigt.

Abbildung 7: Einbettung der Multi-Klassifikations-Normdatei in die Verbundarchitektur

Indexierung

Ein wesentlicher Teil des Setups betrifft die Indexierung, insbesondere unter Berücksichtigung der Konsequenzen für das Retrieval. Neben einigen hauptsächlich für interne bzw. redaktionelle Zwecke eingerichteten Indizes wurden die in Tabelle 2 dargestellten Browse- und Wort-Indizes implementiert, wobei im Fall von Klassifikationen Browse-Indizes von größerer Bedeutung sind. Abgesehen von dem für alle Aleph-Normdateien obligatorischen Abgleichindex GEN, der die Verbindung zur Titeldatenbank (inklusive Update und Anreicherung) gewährleistet, bilden die Browse-Indizes PMC (MSC) und PBK (BK) die Grundlage für die Nutzung der einzelnen Klassifikationssysteme bei der Sacherschließung. Im Gegensatz zu GEN sind diese beiden Phrasenindizes über die Filterung mittels Formatkennung (FMT) den einzelnen logischen Datenbanken (ACC19MC, ACC19BK) zugeordnet. Diese drei Indizes enthalten neben den strukturierten Ansetzungsformen auch Anreicherungsformen, die durch entsprechende Parametrisierung so aufbereitet sind, dass ihre Eindeutigkeit bei der Indexanzeige für Bearbeitung und OPAC sichergestellt ist.20 Als wichtigster Wort-Index kann WRD gelten, der alle relevanten Felder umfasst. Die korrespondierenden Indizes der bibliographischen Datenbank sind naheliegenderweise klassifikationsspezifisch angelegt und werden aus dem erwähnten Abgleichindex GEN gespeist.

Tabelle 2: Wichtigste Indizes der beteiligten Datenbanken

Tabellen-Setup (Parametertabellen)

Die für die Einrichtung der Multi-Klassifikations-Normdatei wesentlichsten Parametertabellen können wie folgt aufgegliedert werden:

Lokalsysteme

Der überwiegende Teil der rund 70 aktiven Verbundteilnehmer des Österreichischen Bibliothekenverbundes nutzt ebenfalls die Bibliotheksverwaltungssoftware Aleph 500.21 Dadurch sind alle oben beschriebenen Funktionalitäten auch den betreffenden Lokalsystemen - sofern dies gewünscht wird - zugänglich. Die OBVSG hat daher im Zuge der Planungen für die neue Multi-Klassifikations-Normdatei auch ein spezielles "Lokalsystem-Setup" ausgearbeitet. Dieses betrifft lediglich die lokalen Titeldatenbanken und die Bearbeiter-Clients, nicht hingegen die (nur zentral vorgehaltene) Normdatei; letztere muss im Lokalsystem lediglich als "remote library" definiert sein. Der Umfang der Parametrisierungsarbeiten durch die lokalen Systembibliothekare lässt sich wie folgt umreißen: Im Prinzip sind alle oben bereits beschriebenen Parametertabellen betroffen, mit Ausnahme der - lokal nicht benötigten - Katalogisierungsfunktionalitäten. Da im Österreichischen Bibliothekenverbund die Verwaltung der Bearbeiter-Clients dezentral organisiert ist, obliegt auch die korrekte Eintragung aller benötigten Angaben zu der neuen Normdatei in diesen Clients (z.B. Namen und Adressen der "logischen Datenbanken") dem Lokalbereich.

6 Implementierungsaspekte

Im Falle der MSC wurden schon zu Beginn des ursprünglichen Projektes (2000) zahlreiche Titel in der bibliographischen Datenbank mit Notationen dieses Klassifikationssystems versehen. Da zum damaligen Zeitpunkt noch keine MAB-TITEL-Kategorie für die MSC vorgesehen war, geschah dies in einer willkürlich festgelegten Behelfskategorie (70Va). Ungeachtet der nicht lange danach eingeführten MAB-TITEL-Kategorie 700m wurde diese Praxis auch in der Folge beibehalten; der Umstieg auf die "offizielle" Kategorie sollte erst mit Inbetriebnahme der neuen Normdatei erfolgen. Da sich - nicht zuletzt aufgrund des Fehlens einer Normdatei - dabei eine Reihe von Katalogisierungsfehlern eingeschlichen hatte, erwies es sich nunmehr als notwendig, vor der Überspielung der MSC-Erschließungen in die Kategorie 700m relativ umfangreiche Datenbereinigungen vorzunehmen. Dabei wurde auf die einheitliche Kategorienstruktur "$a Notation" "$c Version" normiert und anstelle verschiedentlich geübter Unterfeldwiederholungen eine Kategorienwiederholung hergestellt. Erst dann konnte - mittels Import und Export der betroffenen Titeldatensätze - der Transfer in die Kategorie 700m erfolgen. Dies war die Voraussetzung für den anschließend durchgeführten Abgleich mit der Normdatei, als dessen Ergebnis die Kategorien der Titeldatensätze mit den korrespondierenden Klassenbenennungen ($b) angereichert wurden. Außerdem wurde anstelle der bisher katalogisierten Versionsangabe ($c) jene aus der Normdatei übernommen. Falls ein Titel ursprünglich nach der älteren MSC-Version (1991) erschlossen worden war, nunmehr aufgrund der identen Notation aber die Versionskennung "2000" erhielt, wurde die Information "1991" dabei in ein titelspezifisches Unterfeld ($h) eingetragen. Notationen in den Titeldaten, die im Zuge des Abgleichs nicht in der Normdatei auffindbar waren, wurden nicht mit einer Klassenbenennung, sondern mit dem (recherchierbaren) Hinweis "Zuordnungsfehler-MSC" versehen. Alle Korrekturarbeiten, einschließlich der Ergänzung fehlender Versionsangaben, wurden zum Teil automatisch (Skripte) und zum Teil durch die kooperierende Fachbereichsbibliothek durchgeführt.

Im April 2006 wurde - ein wenig überraschend - die MAB-TITEL-Kategorie 700f für die BK neu eingeführt. Kurz davor hatte die OBVSG einige tausend Dissertationsdatensätze des Verbundkataloges mit Informationen aus dem Erfassungssystem OPUS angereichert. Darunter waren auch Notationen der BK, für die vorerst eine Behelfskategorie (701) definiert worden war. Diese Notationen mussten nunmehr, ähnlich wie im Fall der MSC, in die korrekte Kategorie transferiert werden, woran sich in analoger Weise der Abgleich mit der Normdatei schloss. Auch hier führten nicht zuordenbare Notationen (z.B. Eingabefehler der Dissertanten) zu Einträgen mit einem entsprechenden Hinweis ("Zuordnungsfehler-BK").

Zur Implementierung zählte auch die Adaptierung der Mitarbeiter-Zugriffsrechte sämtlicher Verbundbearbeiter, um diesen die Normdatenverlinkung bei der Katalogisierung in der zentralen Titelbank zu ermöglichen. Darüberhinaus wurden einige wenige Redaktionsparaphen mit erweiterten Zugriffsrechten in der Normdatei eingerichtet; dies betraf nur die - von einigen Fachreferenten redaktionell betreute - MSC. Die Einbindung der neuen Multi-Klassifikations-Normdatei in die Produktionsumgebung der Verbundzentrale (zyklische Sicherungen, Cronjobs, Überwachung der Dämonen usw.) bildete den Abschluss der Implementierungsarbeiten bzw. die Voraussetzung für die aktive Produktionsaufnahme (Frühsommer 2006).

7 Katalogisierung und OPAC-Funktionalitäten

Die Realisierung der weiter oben in Abbildung 3 bereits angedeuteten Zielvorstellung für die Nutzung der Multi-Klassifikations-Normdatei bei der Katalogisierung wird in Abbildung 8 veranschaulicht. Im konkreten Beispiel (MSC) wird in Kategorie 700m die Notation "11Rxx" eingegeben und der korrespondierende Normdatensatz "auf Knopfdruck" über den hinterlegten Phrasenindex (mit weiteren Navigationsmöglichkeiten) angesteuert. Sofern die gewählte Klasse der Erschließungsabsicht entspricht, kann deren Ansetzungsform durch einen weiteren "Knopfdruck" in das Titelkatalogisat übernommen werden.

Abbildung 8: MSC-Nutzung in der Sachkatalogisierung

Die im OPAC der Titeldatei (Verbundkatalog) derzeit bestehenden Navigations- und Anzeigemöglichkeiten sind in Abbildung 9 an einem Beispiel aus der BK dargestellt. Ein mögliches Recherche-Szenario zum Thema "Theatereinrichtung" wäre etwa der Einstieg im Phrasenindex der BK an der Position "24", um den relevanten Indexbereich aufzublättern. Beim Eintrag für die gewünschte Klasse ("24.07") besteht die Möglichkeit, die Vollanzeige des zugehörigen Normdatensatzes aufzurufen (mit weiteren Navigationsmöglichkeiten)22 oder direkt die beiden mit dieser Klasse verknüpften Titel anzeigen zu lassen. Ein weiteres Szenario bestünde darin, zunächst z.B. eine Autor-/Titelsuche durchzuführen und sodann zu der in der Vollanzeige eines Titeldatensatzes ersichtlichen Klasse eine weiterführende Recherche anzustoßen. In Aleph 500 geschieht dies über die sogenannten "Suchdienste", mit Hilfe derer man in diesem Fall die Indexliste aufblättern, weitere mit der gewünschten Klasse erschlossene Titel aufrufen oder auch zur Vollanzeige eines Normdatensatzes gelangen kann.

Abbildung 9: BK im OPAC

8 Ausblick

Für die beiden bisher in der Multi-Klassifikations-Normdatei implementierten Klassifikationssysteme bestehen im Österreichischen Bibliothekenverbund durchaus Zukunftsperspektiven. Mag es sich bei der MSC zwar um ein fachspezifisches Schema handeln, wird dieses doch von einer möglicherweise noch wachsenden Zahl von Bibliotheken bzw. Fachreferenten angewandt. Darüberhinaus gibt es z.B. an der mathematischen Fachbereichsbibliothek der Universität Wien nicht unbeträchtliche Bestände, die im Bereich der lokalen/bestandsspezifischen Daten bereits mit MSC-Notationen erschlossen sind und einer Aufarbeitung im zentralen Titeldatensatz bedürfen. Was die BK betrifft, so ist gegenwärtig ein wachsendes, über die Erschließung von Dissertationen hinausgehendes Interesse im Österreichischen Bibliothekenverbund zu registrieren. Des weiteren besteht auch aus der Sicht der Verbundzentrale der Wunsch nach einer Übernahme von BK-Notationen aus anderen Quellen. Bei Vorliegen entsprechend großer Titelmengen würde sich auch die Entwicklung eines benutzerfreundlichen OPAC-Interfaces für eine hierarchische Recherche im Verbundkatalog mittels des jeweiligen Klassifikationsschemas lohnen. Eine Vorform dazu soll in Kürze für die Zwecke der Vergabe von BK-Notationen im Erfassungssystem OPUS durch die Verfasser von Dissertationen angeboten werden. Mit diesem Interface wird es möglich sein, BK-Klassen entweder über eine hierarchische Navigation (ohne Kenntnis der Notationen) oder über die weiter oben beschriebenen Phrasen- und Wort-Indizes aufzufinden.

Redaktionelle Verbesserungen sind sowohl für die MSC als auch für die BK geplant. Dies betrifft vor allem die Anreicherung mit zusätzlichen Indexeinträgen (Verweisungsformen). Im Falle der MSC handelt es sich einerseits um Klassen aus älteren Versionen (vor 1991), die z.B. in der Vorlage eingedruckt sind und auf entsprechende aktuelle Klassen verwiesen werden sollen, andererseits um weitere verbale Sucheinstiege. Letztere erscheinen auch im Bereich der BK angesichts deren relativ grober Struktur äußerst wünschenswert.

Schließlich ist auch die Einbindung weiterer Klassifikationssysteme in die neue Multi-Klassifikations-Normdatei durchaus ein Thema, zumal auch die RVK (Regensburger Verbundklassifikation) und die DDC (Dewey Decimal Classification) im Österreichischen Bibliothekenverbund auf breiterer Basis (gegenwärtig und/oder zukünftig) verwendet werden. Inwieweit diese beiden großen und komplexen Systeme in die vorgestellten Strukturen integrierbar sind, müsste allerdings erst untersucht werden. Ebenso wäre zu überlegen, ob auch lokal verwendete Klassifikationssysteme mit ähnlicher Struktur in eine solche Normdatei aufgenommen werden könnten, um dies interessierten Teilnehmern des Österreichischen Bibliothekenverbundes als Dienstleistung anbieten zu können.

Zitierte Literatur

Haller, K.; Fabian, C. (2004). Bestandserschließung. In: Frankenberger, R.; Haller, K. (Hrsg.). Die moderne Bibliothek: Ein Kompendium der Bibliotheksverwaltung. München: Saur. 222-261.

Oberhauser, O. (2005). Klassifikatorische Erschließung und Recherche im Österreichischen Verbundkatalog. B.I.T.online 8(2). 123-132.

Schwabl, H.-D.; Labner, J. (2000). Die Mathematics Subject Classification als Normdatei in Aleph: Ein Werkstattbericht. Vortrag, 26. Österreichischer Bibliothekartag, Wien, September 2000. - Online: http://www.obvsg.at/fileadmin/files/obvsg/publ/ams_bt2000.pdf [07.11.2006]

Danksagung

Die Autoren danken Martin Hekele und Peter Klien für ihre Unterstützung bei der Fertigstellung dieses Beitrages.


Zu den Autoren

Dr. Otto Oberhauser MPhil MSc MLIS ist seit 1978 im Bibliotheksdienst und seit 1992 im Österreichischen Bibliothekenverbund tätig, vor allem in den Bereichen Online-Kataloge (zentrale und lokale Systeme) und Systemparametrisierung.

E-Mail: otto.oberhauser@obvsg.at

Ing. Josef Labner ist seit 1990 als Systemanalytiker im Österreichischen Bibliothekenverbund tätig, vor allem in den Bereichen Normdateien, Datenformate und Systemparametrisierung.

E-Mail: josef.labner@obvsg.ac.at

Beide:
Die Österreichische Bibliothekenverbund und Service GmbH
Brünnlbadgasse 17/2a
A-1090 Wien, Österreich


Anmerkungen

1. Oberhauser (2005)

2. http://www.obvsg.at
[alle Web-Adressen verfiziert per 08.11.2006.]

3. http://opac.obvsg.at/acc01

4. Vgl. dazu den Vortrag von Schwabl & Labner (2000).

5. http://www.ams.org/msc/

6. http://www.gbv.de/vgm/info/mitglieder/02Verbund/01Erschliessung/02Richtlinien/05Basisklassifikation/

7. http://okeanos-www.hbz-nrw.de/F/?func=find-a-0&local_base=hbz13

8. UP-Link (Link zur übergeordneten Klasse); DN-Link (Down-Link zur untergeordneten Klasse).

9. Seit der Aleph-Version 16 wäre dies auch mit anderen Kategorien möglich.

10. OGN = übergeordnete Notation; UGN = untergeordnete Notation (dies sind willkürlich eingeführte Kategorienbezeichnungen). Diese bewusst in Kauf genommene Redundanz wäre bei Verfügbarkeit der MARC-Funktionalitäten nicht erforderlich gewesen, stellt jedoch angesichts automatischer Generierungsmöglichkeiten, des relativ geringen Datenvolumens sowie dessen niedriger Updatefrequenz kein Problem dar.

11. Auf den kostenpflichtigen Erwerb eines mittlerweile erhältlichen Aleph-Thesaurusmoduls (sowie die nachfolgend notwendige Parametrisierung dieser Software) wurde verzichtet.

12. Dies gilt sowohl für das Bearbeiter-Interface (GUI-Client) als auch für eine allfällig zu erstellende Web-Version (Normdatei-OPAC).

13. http://www.univie.ac.at/FB-MathStatInf/

14. http://media.obvsg.at/dissdb

15. Dieser Bearbeitungsschritt wurde bisher nur für einen Teil der MSC realisiert. Auch die (bereits getestete) Kopplung mit der SWD-Normdatei zum Zweck der Aktualisierung der Schlagwörter wurde noch nicht in die produktive Umgebung übernommen.

16. Der geringe Umfang der BK machte diese Vorgangsweise, deren Grenzen auf der Hand liegen, gerade noch möglich.

17. Inzwischen auf den englischen Webseiten der KB (http://www.kb.nl/index-en.html) nicht mehr auffindbar.

18. Kurzreferenzen zu den MAB-Formaten: http://www.ddb.de/standardisierung/formate/mab.htm

19. Dies auch im Hinblick auf weitere Klassifikationssysteme, die in Zukunft eventuell aufgenommen werden sollen.

20. Dazu werden an die rein verbalen Indexeinträge die jeweils entsprechenden Notationen angefügt. Dies wird - ohne auf weitere Details einzugehen - mit Hilfe der in Tabelle 2 angeführten Kategorien TMP01, TMP02, COR, VMC, VBK (die nicht im Kategorienschema / Tabelle 1 aufscheinen) erzielt.

21. Bei den übrigen ist die Software Alephino in Verwendung.

22. Von der Vollanzeige des Normdatensatzes ausgehend, kann auf zweierlei Art weiternavigiert werden. Beim Anklicken der Kategorienbezeichnungen in der linken Spalte (z.B. "Verweis") gelangt man zur entsprechenden Position der Indexliste, wohingegen das Anklicken des verlinkten Kategorieninhalts in der rechten Spalte (z.B. "56.84 Schulbau, ...") direkt zu den zugehörigen Titeldatensätzen führt. Diese Links werden nur dann generiert, wenn zu der entsprechenden Klasse auch tatsächlich Titelmaterial im Katalog vorhanden ist.