Inhaltliche Erschließung in Zeiten des Internets:
Googeln oder Nichtgoogeln - das ist hier die Frage!


1. Einführung
2. Inhaltliche Erschließung
3. Zwei Projekte des IZ Bildung

von Hartmut Müller1

1. Einführung

Große Diskrepanzen tun sich auf! Die Vorstellungen und Interessen der Informationsspezialisten sind weit von denen der Nutzer von Informationsprodukten und -dienstleistungen entfernt. So, oder so ähnlich könnte man den Status Quo in weiten Teilen der Informationsvermittlung und -recherche charakterisieren. Seitdem das Internet zur primären Schnittstelle zwischen dem Angebot von Fachinformation und deren Nutzung geworden ist, ergeben sich m.E. zwei Phänomene:

  1. Die Ein-Fenster-Recherche hat den Zugang zur Fachinformation wesentlich erleichtert und damit die Anzahl der Zugriffe auf Informationsprodukte und -dienstleistungen enorm gesteigert.
  2. Die Ein-Fenster-Recherche hat den Zugang zur Fachinformation aber auch simplifiziert, d.h. die Nutzer greifen kaum noch, jedenfalls zu wenig, auf die differenzierten, anspruchsvolleren Rechercheinstrumente, also auf Schlagworte, Thesauri oder Fachsystematiken zurück.

Dieser Themenkreis wurde in der INETBIB-Liste im letzten Jahr intensiv und sehr kontrovers diskutiert. Dass es Möglichkeiten gibt, das eine zu tun - die Ein-Fenster-Recherche - ohne das andere zu lassen - die Expertensuche -, das möchte ich an zwei Produkten des Informationszentrums (IZ) Bildung darlegen.

Noch eine Bemerkung zu dem Titelbegriff Googeln: aus Schulungen mit Studenten sowie aus der Recherchepraxis mit Nutzern vor Ort weiß ich, dass der Begriff Googeln mit der Ein-Fenster-Recherche gleichgesetzt wird. Er ist fast ein Begriff der Alltagssprache geworden und ist offenbar auch in der BID-Szene üblich.

2. Inhaltliche Erschließung

Um Missverständnisse zu vermeiden, möchte ich betonen, dass mich hinsichtlich des Nutzerverhaltens nur der Aspekt Inhaltliche Erschließung interessiert. Die formale Erfassung hat gewiss auch ihre Tücken, selbst bei den IuD-lern führt sie auf glatteisiges Terrain. Den Nutzern unserer Dienste wird es mehr als ähnlich gehen. Jedoch, es kommt vergleichsweise selten vor, dass IuD-Angebote weder auf schwierige körperschaftliche Ansetzungen hin abgefragt, noch dass Antworten auf die prekären Differenzen chinesischer und japanischer Namen verlangt werden. Allerdings kann ich mir vorstellen, dass sich die Ein-Fenster-Recherche auch beim Thema formale Erfassung als fragiles Instrument erweist. Mein Thema lautet also: Nutzerverhalten und Inhaltliche Erschließung.

Eine weitere Einschränkung wird durch die Produkte erforderlich, die ich in dem oben genannten Zusammenhang vorstellen will: Zeitungsdokumentation Bildungswesen (ZEITDOK) und Informationssystem Medienpädagogik (ISM). Für die dort verwendeten Formen der inhaltlichen Erschließung genügt es, aus dem weiten Spektrum der Dokumentationssprachen, die Erschließungsmittel Stichwort und Schlagwort herauszugreifen, um den Problemen näher zu kommen. Ein Thesaurus liegt nicht vor, eine Fachsystematik im eigentlichen Sinn gibt es nur bei ISM, kann aber hier unberücksichtigt bleiben, da sie bei der Internetpräsenz keine Rolle spielt.

Beachtet werden sollte zudem, dass der Autor von dem Statement ausgeht: Für die Inhaltliche Erschließung gibt es keine festen Regeln, es gibt nur formale Definitionen für die Instrumente, die zum Einsatzkommen können.

Die Definitionen von Stichwort und Schlagwort2 sind Standard, ebenso die Gleichsetzung von Sacherschließung (bibliothekarisch) mit Inhaltliche Erschließung (IuD). Wichtig erscheint jedoch, die Rahmenbedingungen der Inhaltlichen Erschließung zu beachten, ein Faktor, der in der Fachliteratur wenig repräsentiert erscheint und wegen der Extrapolarisation in die Wissensorganisation oder Semiotik zu kurz kommt. Die Ziele sowie die Methoden und Verfahren der Inhaltlichen Erschließung sind u.a. bedingt durch:

3. Zwei Projekte des IZ Bildung

3.1 Zeitungsdokumentation Bildungswesen (ZEITDOK)3

Für die ZEITDOK werden zur Zeit ca. 30 in- und ausländische Tages- und Wochenzeitungen sowie Informationsdienste ausgewertet. Alle Bereiche des Bildungswesens finden Berücksichtigung. 14tägig erscheint eine Ausgabe von ZEITDOK in gedruckter sowie in elektronischer Form (je 200 bis 250 Nachweise von Zeitungsartikeln). Die ZEITDOK-Datenbank erscheint seit 1978 und umfasst mehr als 110.000 Nachweise, die im Original vorliegen. Das konventionelle Archiv, das bis Anfang 1950 zurückgeht, enthält nochmals ca. 50.000 Originale.

Die Inhaltliche Erschließung der ZEITDOK erfüllt bis heute eine doppelte Funktion. Sie dient der Gliederung und Sortierung der erfassten Datensätze und hat zugleich die Funktion von Schlagworten. Diese Funktionen wurden parallel zur sich verändernden Computertechnik jeweils neu konstituiert. Zunächst stand im Mittelpunkt der ZEITDOK die gedruckte Form. Die dazugehörige Datenbank spielte erst eine wichtige Rolle, seitdem es sie online gibt (ab 1997). Mit der Verlinkung der ZEITDOK-Datenbank auf dem Deutschen Bildungsserver (DBS) im Jahr 2001 erhielt die Nutzungsfrequenz des Onlineangebots einen neuen Schub. Die nach wie vor existierende gedruckte Form, die immer noch ihre Liebhaber hat, wird zunehmend von dem gleichartigen, digitalen Produkt (eine pdf-Datei) abgelöst.

Über eine gemeinsame DBS-Seite kann sowohl eine Recherche in der Datenbank erfolgen als auch die aktuelle pdf-Datei aufgerufen werden. Das parallele Angebot hat weiterhin seinen Sinn. Schließlich könnte man ohne weiteres die aktuellen Datensätze über eine Updateroutine anzeigen lassen oder nach dem jeweiligen Updatefile recherchieren. Allerdings bekäme man dann eine unstrukturierte Menge, ein kunterbuntes Gewirr an Datensätzen zu den bekannten Bildungsbereichen. Nur wer jeden Tag abfragte, behielte noch den Überblick bei dann 10 bis 20 Artikeln. Wir sind nicht so vermessen, das tatsächlich zu erwarten. Hinzu kommt, Bildung ist nur bedingt ein Tagesgeschäft und die Presseorgane benötigen auch ihre Zeit, um ein Thema zu bringen. Der 14-tägige Rhythmus für die Anzeige der aktuellen Artikel hat sich bewährt.

Die erste Stufe der Inhaltlichen Erschließung der ZEITDOK beruht auf der Unterteilung des Themas Wissenschaft und Bildung in 12 Kapitel. Zu jedem Kapitel werden bis zu zwei weitere, feststehende Unteraspekte vergeben. Damit soll gewährleistet sein, dass die Zeitungsartikel zu einem bestimmten Thema in den periodisch erscheinenden pdf-Dateien immer an derselben Stelle wiederzufinden sind. Nach der Zuordnung des Artikels zu diesem Schema kann ein engeres Schlagwort vergeben werden. So kann ein Nutzer erwarten, dass die Artikel zum Thema Kopftuch immer unter Schule / Lehrerin : Islam erscheinen,

es sei denn, es handelt sich um die Behandlung des Sujets im Ausland. Dafür existiert ein eigenes Kapitel. Alle Begriffe, also die, die der Sortierung der Datensätze dienen, als auch die weiteren, präziseren Begriffe mutieren bei der Übernahme der Daten in die ZEITDOK-Datenbank zu recherchierbaren Schlagworten4.

Wer jetzt vielleicht meint, dass die feste Zuordnung der Zeitungsartikel zu einer weitgehend feststehenden Vorgabe an Schlagworten zu Lasten der Nutzer bei der Recherche in der ZEITDOK-Datenbank führt, der irrt. Die Berichterstattung zu den vielfältigen Facetten der Bildung erfolgt in der Presse eindimensionaler als zu erwarten wäre. Am Beispiel des Profildienstes zum Thema Kopftuch (s. die oben genannte DBS-Seite) lässt sich der Sachverhalt ausgezeichnet exemplifizieren. Die Datei verfügt über fünf Lesezeichen, vier davon verweisen auf eine überschaubare Informationsmenge. Das fünfte bildet mit seinem Kern von ca. 75% den Hauptteil der Dokumentnachweise ab, das wären mehr als 200 Zeitungsartikel, eine kaum zumutbare Menge an Dokumenten für die Nutzer.

Diese zu unterteilen erscheint schwierig, zumal eine weitere Spezifizierung der Artikel deren erneute, tiefergehende Erschließung bedeutete. Denkbar wäre, bei der anfänglichen Bearbeitung formale Aspekte zu berücksichtigen, z. B. den Umfang des Zeitungsberichts. Eine lösbare Aufgabe, aber: zu häufig war eine Zwanzig-Zeilen-Meldung bei diesem Dokumenttyp - dem Zeitungsartikel - gewichtiger als ein Halbseitenbericht.

Das beinhaltet jedoch nicht das Kernproblem, vor dem die Nutzer der ZEITDOK-Datenbank offenbar stehen. Obwohl auf der Rechercheseite deutliche Hinweise auf eine qualifizierte Suche hervorgehoben sind, verwenden die Nutzer zu über 90% die einfache Suche. Diese Größe ergibt sich aus den Rückmeldungen, sprich Anforderungen von Kopien für den persönlichen Gebrauch. Die Nutzer geben Kopftuch ein und bekommen ein ziemlich gutes Ergebnis, da die Zeitungen im Titel sehr häufig mit gängigen Begriffen als eye-catcher arbeiten.

Dass ein Nutzer aber längst nicht alle relevanten Dokumente bekommen hat, scheint egal zu sein und wird als vernachlässigbar angesehen. So äußern sich ganz offen die Studenten am Beginn unserer Schulungen. Dass sie diese Haltung am Ende der Schulung revidieren und erstaunt sind über die vielfältigen Möglichkeiten der Recherche zu Bildungsinformationen über Google hinaus, sollte eine Bestätigung dafür sein, dass das Thema Informationsrecherche unbedingt in den Fächerkanon aller Bildungsbereiche gehört.5

Ein Ziel der Qualifizierung von Nutzern muss sein, diese zur Informationskompetenz zu befähigen. Dazu zählt auch das Wissen über die von Informationsspezialisten eingesetzten Methoden und Verfahren zur Aufbereitung und Strukturierung von Medien, Daten und Informationen. Diese sollten sie in den Grundzügen kennen und gemäß ihren jeweiligen Interessen angeboten bekommen. Kurz gesagt: sie sollen mehr als googeln können.

Ein weiteres Ziel muss sein, dass Nutzer die gesamte Angebotspalette des Internets so für sich in Anspruch nehmen können, dass sie möglichst wenig unter Informationsverlusten zu leiden haben. Kurz gesagt: sie sollen hemmungslos googeln, zumindest da, wo es angebracht erscheint.

Diesen Anspruch wollen wir bei der ZEITDOK-Datenbank verwirklichen, indem wir Begriffe aus dem Medienbereich bzw. der Alltagssprache mit den Schlagworten verknüpfen, die u.U. schon seit langer Zeit für einen Sachverhalt stehen. So wird z.B. die Postkoordination Hochschulpolitik AND Elite aktuell verknüpft mit Elite-Universität oder eine Verknüpfung wird hergestellt zwischen Kopftuch sowie Lehrerin AND Islam als auch Lehrerin AND Christentum als auch Lehrerin AND Christentum AND Islam.

Warum dieser Aufwand? Wie gesagt, die Nutzer sind vom googeln nicht abzuhalten. Sie verkraften zudem bei der klassischen Stichwortrecherche im Titel gegenüber der Recherche mit Schlagworten einen Informationsverlust, der mindestens über 20% liegt und manchmal sogar bis zu 100% geht, zumindest was die ZEITDOK betrifft. Und, die Fachsprache der Datenbank fällt ihnen auch nicht ohne weiteres zu. Die richtige Verwendung der Schlagworte könnte sogar kontraproduktiv sein. Bei Hochschulpolitik AND Elite enthielte die Ergebnisliste auch sehr vieles zum Thema Hochbegabung.

Diese Verknüpfungen sollen nur temporär gelten. Sobald das Thema aus den Schlagzeilen verschwindet, verschwindet auch die gesetzte Verknüpfung. Denn sonst kann diese zu Verwirrung führen. Schließlich hat das Thema Lehrerin AND Islam auch noch andere Konnotationen als das Kopftuch.

3.2 Informationssystem Medienpädagogik (ISM)6

Medienkompetenz zählt zu den Kernthemen in der allgemeinen und beruflichen Bildung, an den Hochschulen sowie in der Weiterbildung. Ziel von ISM ist die Unterstützung und Förderung von Medienkompetenz in Wissenschaft und Praxis. Hierfür werden die fachlich relevanten Publikationen, Lehr- und Lernmedien, aber auch Forschungsprojekte sowie Daten und Informationen erschlossen und in Zusammenarbeit mit wichtigen deutschen Informationseinrichtungen als Internetprodukt angeboten. ISM sieht sich als Arbeitsinstrumente für alle, die über die Entwicklungen im Mediensektor informiert sein wollen und mit dem Einsatz und der Nutzung von Medien in Bildung und Ausbildung befasst sind. Ende 2003 umfassen die angebotenen Datenbanken ca. 70.000 Nachweise von Fachliteratur, Medien und Projekten.

Das Internetangebot ISM 2003 bietet nicht nur eine Auswahl verschiedener Datenbanken an, sondern ermöglicht auch, zwischen drei Rechercheoptionen zu wählen:

  1. Einfache Suche
  2. Erweiterte Suche
  3. Suche über Indizes

Auch hier geht es zuvörderst um das bereits behandelte Thema, also die Frage: Dürfen Benutzer hier googeln? Aber ja! ruft der Marketing-Mensch. Leider ja! ruft das personifizierte IuD-Gewissen, das verschmitzt grinsend zu wissen meint, dass der Googler nicht alles kriegt, was er will. So ist es: zum Sujet Sesamstraße beispielsweise werden in der Einfachen Suche 75 Nachweise gefunden, die Erweiterte Suche liefert über das gleiche Schlagwort immerhin fast das Dreifache, genau 208 DEs.

Bei der gezielten Suche nach eindeutigen Fachbegriffen sollte und muss die erweiterte Suche der Standardrecherche überlegen sein, denn sonst ließe sich der für die differenzierte Inhaltliche Erschließung geleistete Aufwand kaum rechtfertigen.7 Die Vorbereitung dieser Fachdatenbank auf die beiden dominierenden Paradigmen für Informationsrecherchen werden durch die Nutzungszahlen bestätigt. Wir haben sehr hohe Werte bei den Zugriffen auf die Datenbank (Sessions) und zudem große Volumina bei den Downloads. Aus welcher der drei Zugriffsangebote die Downloads stammen, ließ sich leider nicht feststellen.

Andererseits, die Googlianer werden bei der Ein-Fenster-Recherche auch noch verführt, dieselbe zu verwenden. Via Aktivierung der Schaltfläche Kontext anzeigen erhalten sie all das angezeigt, was sich im Umfeld des eingegebenen Begriffes bewegt bzw. verfügbar ist. Allerdings bietet die erweiterte Suche diese Funktion sogar mehrfach und bezogen auf bestimmte Feldinhalte an (bei Schlagwort und Person). In der Index-Suche besteht zudem die Möglichkeit, sich die Wortbestände der vier wichtigsten Indizes anzeigen zu lassen, um zu prüfen, ob z.B. ein gewünschter Recherchebegriff überhaupt vorhanden ist.

Hiermit komme ich zum zweiten Haupthindernis, das für Nutzer neben der erforderlichen Umsetzung von Alltagssprache in die aktuelle Suchsprache beim Recherchieren besteht: die Dokumentationssprache Schlagwort und wie sie zur Indexierung von Dokumenten eingesetzt wird. Die Schlagwortnormdatei ist ein sehr gutes Instrument, um zumindest im Bereich der Bibliotheksverbünde die OPAC-Nutzer vor Verwirrung zu bewahren. Denn die wird von den Benutzern allgemein beklagt; sie sehen sich nicht in der Lage, in verschiedene Fachsprachen eintauchen zu müssen, bevor sie in den unterschiedlichen Fachdatenbanken recherchieren können. Das kann ihnen auch passieren, wenn sie aus dem Schatten der Verbundkataloge heraustreten und den Fach-OPAC einer medizinischen oder tierärztlichen Hochschule konsultieren. Der kann und wird kaum mit dem Fundus der SWD auskommen, er fungiert als reiner Standortkatalog und die Fachrecherchen finden in Fachdatenbanken statt.

Die Fachdatenbanken stellen für den wenig geübten Nutzer schon eine spezielle Hürde dar. Meine These hierzu lautet: Je differenzierter das Themenspektrum einer Datenbank, desto spezieller der Wortschatz, desto größer die Anzahl präkoordinierter Begriffe.8 Die Datenbank des FIS Bildung ist eine Fachdatenbank und verfügt über bildungsbezogene Fachbegriffe, die in einem OPAC einer Universalbibliothek nicht benötigt werden, zumal in den OPACs im allgemeinen kaum Zeitschriftenaufsätze bzw. Aufsätze aus Büchern enthalten sind. Im Gegensatz dazu sind in einer Fachdatenbank selten Beschränkungen hinsichtlich der Dokumentart gegeben. Außerdem erhält mit der Erschließungstiefe in Fachdatenbanken die Häufigkeit der Verknüpfung von Schlagworten und Dokumenten eine neue Dimension, die bei fehlender Präzision während der Indexierung zu unerfreulichen Rechercheresultaten führen kann.

Nun muss eine Fachdatenbank wie FIS Bildung noch nicht den Endpunkt zusätzlicher Differenzierungen des Wortschatzes darstellen. Die ISM-Datenbank geht auf dem Weg des erweiterten Fachwortschatzes noch weiter und bildet innerhalb des FIS-Verbundes einen eigenen Fokus aus. Das geht ebenso wenig anders wie im Bereich Erwachsenen-/Weiterbildung, wo die präkoordinierten Fachbegriffe, die für den Schulsektor auf -erziehung enden durchgängig auf -bildung enden müssen. Die Skala der Fachtermini spiegelt die Wirklichkeit.

Zum Ganzen zwei Beispiele: Ein Sammelwerk mit ca. 30 Aufsätzen steht als eine DE im OPAC der DB korrekt mit fünf Schlagworten. Die ISM-Datenbank führt dieses Sammelwerk mit ca. 30 DEs und ca. 150 Schlagworten, auch korrekt, denn fast alle medienbezogenen Disziplinen sind mit Aufsätzen vertreten. Im Schlagwortindex der ISM-Datenbank steht hinter dem Begriff Computer die Zahl der zuzuordnenden Dokumente: 5.150, eine unmöglich große Menge an Dokumentnachweisen, die für die Recherche nur handhabbar wird, wenn ein sehr präziser Wortschatz zum Aufbrechen dieses Informationsberges bereit steht.

Präzision im Wortschatz erzielt man durch Übernahme von speziellem Fachvokabular sowie vor allem durch Bildung von präkoordinierten Begriffen. Die Erfahrungen aus den Schulungen wie auch hinsichtlich der Benutzerhilfe beim Recherchieren vor Ort deuten darauf hin, dass die Nutzer bevorzugen, das konkrete, für ihre Arbeit unmittelbar verwertbare Ergebnis einer Recherche mitnehmen zu können, auch wenn sie nur teilweise oder gerade mal eben während der Präsentation/Einführung verstanden haben, wie das Ergebnis zustande kam. Was sie überhaupt nicht mögen, sind unübersichtliche Haufen von Informationen, Ergebnislisten ohne fachlichen Hintergrund und Struktur.

Dann können sie ja gleich googeln, sagen sie. Dann haben sie nicht nur ein Ergebnis, sondern wissen - sich auf ihre bisherigen Erfahrungen mit Google verlassend - dass das Google-Ranking zumeist dazu führt, auf den ersten drei Seiten der Ergebnisliste die Links mit den zumeist relevanten Objekten anzuzeigen. Weiter blättert kaum jemand. In jedem Fall vermittelt Google Sicherheit, da man mit weniger Fachkenntnis offenbar bessere Resultate erzielt als mit derselben Anfrage in einem OPAC bzw. einer Fachdatenbank. Skepsis und Unsicherheit seitens der Nutzer mögen schlechte Ratgeber für erfolgreiche, sach- und fachgerechte Recherchen sein. Sie zu überwinden kann aber nur gelingen, wenn man die vorherrschende Realität des Googelns akzeptiert und die Hilfsmittel zur Optimierung dieses Rechercheverfahrens weiter ausbaut.

Darüber hinaus sollte der Grundsatz gelten, die Nutzer bei jeder Gelegenheit auf die anspruchsvolleren und letztlich erfolgreicheren Methoden und Verfahren der erweiterten Suche zu stoßen. Der freiwillige Rückzug allein auf das Angebot der Ein-Fenster-Suche erscheint mir doch etwas voreilig und könnte als Resignation vor der nicht ausreichenden Informationskompetenz der Nutzer insbesondere von Fachdatenbanken gesehen werden. Daher sollte die unermüdliche Qualifizierung der Datenbankkunden ebenfalls zu den Basisaufgaben von Informationsspezialisten zählen.


Zum Autor

Dipl.-Soziol. Hartmut Müller ist Leiter der Frankfurter Forschungsbibliothek

Deutsches Institut für Internationale Pädagogische Forschung
Schloßstraße 29
D-60486 Frankfurt a.M.
E-Mail: mueller@dipf.de


Anmerkungen

1. Dieser Aufsatz wird ergänzt durch den Beitrag von Heike vom Orde in dieser Ausgabe von B.I.T.online..

2. Wobei fraglich ist, ob Stichworte zur Inhaltlichen Erschließung zählen, sie sind passiv und werden zugeordnet.

3. Weitere Informationen, z.B. Liste der ausgewerteten Periodika, die ZEITDOK-Datenbank usw. unter http://www.bildungsserver.de/zd/

4. Alle hierbei verwandten Begriffe sind keine freien Schlagworte, sondern stammen aus dem Schlagwortbestand des IZ Bildung.

5. Das aber wäre mehr als einen eigenen Aufsatz wert.

6. Weitere Informationen sowie die ISM-Datenbanken unter http://www.ism-info.de. Auf das Offline-Produkt CD-ROM ISM 2003 sowie auf die CD Medienpädagogik kann hier nicht eingegangen werden.

7. Wie differenziert sollte/muss Inhaltliche Erschließung aussehen, wenn sie korrespondierend die Ansprüche der Wissenschaft aufnimmt? Auch zu diesem Thema reicht hier nicht der Platz.

8. Meine Co-Autorin zeigt, wie die Vermeidung von Präkoordination historische Ursachen haben kann.