Google Scholar als Alternative zu wissenschaftlichen Fachdatenbanken


Abstracts

1. Einleitung
2. Google Scholar
3. Vergleichsrecherchen
4. Ergebnis
5. Fazit

von Franka Handreck und Michael W. Mönnich

1. Einleitung

Seit dem Start von Google Scholar als einem neuartigen Suchdienst für wissenschaftliche Literatur (in der englischen Version im November 20041 und in der deutschen Version im April 20062), sorgt dieser Dienst für Gesprächsstoff unter Fachleuten. In diesem Beitrag wird nicht untersucht, wie vollständig Zeitschriftenlisten von Fachdatenbanken oder Verlagen und die Indexierung von Open Access Hochschulschriftenservern durch Google Scholar abgedeckt werden und auch das Pageranking und die Indexierungshäufigkeit von Google Scholar stehen nicht im Fokus, sondern es geht um die praktische Anwendung dieses Suchdienstes bei wissenschaftlichen Literaturrecherchen. Wie müssen Suchanfragen formuliert werden, um thematisch passende Ergebnisse zu bekommen und wie viele relevante Ergebnisse gibt es innerhalb dieser Treffermengen.

2. Google Scholar

Seit der Suchdienst 2004 von Google eingeführt wurde, schweigt sich die Firma beharrlich über die indexierten Datenquellen aus. Es gibt keine genauen Angaben über die in Google abgedeckten wissenschaftlichen Fachgebiete, nur die Aussage "aus allen allgemeinen Forschungsbereichen"4. Auch bezüglich der Aktualisierungszyklen des immer noch im Betastadium befindlichen Google Scholar werden keine Informationen verbreitet.

Zur Frage "Was beinhaltet Google Scholar?"3, findet sich bei Google Scholar nur folgende Aussage:

"Google Scholar umfasst von Kommilitonen bewertete Seminararbeiten, Doktorarbeiten, Bücher, Zusammenfassungen und wissenschaftliche Literatur aus allen allgemeinen Forschungsbereichen. Hier finden Sie im Internet verfügbare Arbeiten vieler verschiedener akademischer Verlage und Berufsverbände sowie wissenschaftliche Artikel. Google Scholar kann auch mehrere, wahrscheinlich vorläufige, Versionen eines Artikels aufführen, auf die Sie möglicherweise Zugriff haben."3

Auf die Frage, "Wie werden die Artikel gewichtet", gibt Google Scholar die Antwort: "Google Scholar ordnet Ihre Suchergebnisse nach Relevanz an. So wie bei der Webseitensuche mit Google werden die nützlichsten Verweise oben auf der Seite angezeigt. Die Ranking-Technologie von Google berücksichtigt den vollständigen Text eines Artikels, den Autor, wo der Artikel veröffentlicht wurde und wie oft der Text in der wissenschaftlichen Literatur zitiert wurde." 4

2.1 Recherche mit Google Scholar

Google Scholar bietet für die Recherche folgende Möglichkeiten an:


Abb.1: Erweiterte Suche

Ausschließlich in der englischen Version wird zudem angeboten:

Neben Links auf Webdokumente liefert die Recherche mit Google Scholar auch zahlreiche Treffer, die keine direkte Verlinkung bieten (" [Zitation] "). Der Nutzer kann bei diesen, meist aus frei zugänglichen Fachdatenbanken wie Pubmed stammenden Zitationen dann zwischen vier Möglichkeiten wählen:

Über die Funktion "Zuletzt aufgerufene Artikel" kann die Suche auf Jahresringe eingegrenzt werden. Die Inhalte von Google Books (http://books.google.de) werden ebenfalls indexiert und sind als " [Buch] " gekennzeichnet. Daneben gibt es noch Buchtitel ohne Verlinkung, die aus Zitaten stammen. Daneben gibt es noch " [PDF] ", " [HTML] ", " [DOC] " und möglicherweise noch andere Dateiformate. Eine Einschränkung der Suche auf diese Dokumenttypen über "filetype:" analog zur Google Websuche ist nicht dokumentiert und funktioniert auch nur teilweise.


Abb.2: Trefferliste von Google Scholar

3. Vergleichsrecherchen

Es wurden vier typische Literaturrecherchen aus dem Fächerspektrum Wirtschaftswissenschaften, Ingenieurwissenschaften und Architektur gewählt und die Ergebnisse aus Google Scholar mit denen der Fachdatenbanken verglichen.

  1. Das Holocaust-Mahnmal in Berlin von Peter Eisenman (Gebiet Architektur, Fachdatenbank RSWB Plus)
  2. Die EU-Osterweiterung und die Auswirkungen auf den Arbeitsmarkt (Gebiet Wirtschaftswissenschaften, Fachdatenbank wiso)
  3. Biegefestigkeit von Brettschichtholz aus Buche (Gebiet Bauingenieurwesen, Fachdatenbank RSWB Plus)
  4. Tribologie von Lagern aus Kupferlegierung (Gebiet Maschinenbau, Fachdatenbank Tema)

Folgende Datenbanken wurden benutzt: RSWB PLUS, entstanden durch Zusammenschluss der deutschen Baudatenbank RSWB und der international ausgerichteten Baudatenbank ICONDA 6 zu den Themen Raumordnung, Städtebau, dem Wohnungs- und Bauwesen, Hoch- und Tiefbau, Architektur und Stadtplanung. Die Fachdatenbank wird monatlich aktualisiert. Die Fachdatenbank Tema vom FIZ Technik umfasst über drei Millionen bibliographische Nachweise zum gesamten Gebiet der Technik und wird wöchentlich aktualisiert. In der Fachdatenbank wiso findet man deutschsprachige Literatur in den Themenbereichen Wirtschafts- und Sozialwissenschaften. Unter wiso praxis presse werden zudem Tages- und Wochenzeitungen ausgewertet.

Die Bewertung richtet sich zuerst nach der inhaltlichen Relevanz, die entweder mit sehr gut bis gut oder als nicht passend eingestuft wurde. Dabei wurde auch die Anzahl der Dubletten berücksichtigt. Zitationen unter Google Scholar werden dann als relevante Treffer gewertet, wenn mit geringem Aufwand (mit dem Link "Websuche") der Volltext der Zitationen zu finden war.

Die Auswertung bei allen Suchdiensten erfolgte mindestens mit den ersten 50 Treffern. Waren jedoch mehr als 10 Treffer hintereinander nicht relevant, wurde die Auswertung beendet. Dies entspricht dem üblichen Nutzerverhalten, der auch die Auswertung abbricht, wenn zu viele irrelevante Treffer erscheinen. Die Recherchen wurden Anfang August innerhalb des Campusnetzes der Universität Karlsruhe durchgeführt.

3.1 Recherche 1: Das Holocaust-Mahnmal in Berlin von Peter Eisenman

Die Thematik wurde in diesem Fall sehr allgemein gehalten. Es werden keine spezifischen Anforderungen an die Thematik, wie z. B. besondere Betonanforderungen oder künstlerische Bedeutung, gestellt. Der ausführliche Name für das "Holocaust-Mahnmal in Berlin" lautet "Denkmal für die ermordeten Juden Europas - Holocaust-Mahnmal". Für die Suche werden die Schlüsselbegriffe der allgemein gebrauchten Bezeichnung genutzt.

3.1.1 Google Scholar

Eine geeignete Suchanfrage für Google Scholar wurde aus den gleichen Vorüberlegungen entwickelt. Allerdings sind mehrere Suchanfragen und deren Verknüpfung nicht möglich, so dass alle Suchbegriffe mit "und" verknüpft werden.

3.1.2 Fachdatenbank RSWB PLUS

Folgende Suchschritte wurden durchgeführt:

3.1.3 Ergebnis

Die Suchanfrage der Datenbank erzielte 40 Treffer, die alle ausgewertet werden. Die Suchanfrage bei Google Scholar ergab 64 Treffer. Davon wurden jedoch nur 40 ausgewertet, da mehr als 10 Treffer für die Thematik nicht geeignet waren.

 

RSWB Plus

Google Scholar

Treffermenge

40 (=100%)

40 (=100%)

Relevanz

   

   sehr gut bis gut

75 %

32 %

   nicht passend

15%

66%

   Dubletten

10%

2%

Anmerkungen: Die Rechercheergebnisse aus der Fachdatenbank sind zu 75 % thematisch passend. Die Dublettenanzahl, vor allem durch doppelte Titel in gleicher Sprache, war dabei recht hoch.

3.2 Recherche 2: Die EU-Osterweiterung und die Auswirkungen auf dem Arbeitsmarkt

Die Recherche wurde allgemein und einfach gehalten, so dass die Bildung der Rechercheabfrage für beide Suchdienste einfach war. Der Begriff Auswirkungen kann eliminiert werden, da mögliche Auswirkungen in den Treffern erläutert werden sollen. Die großen Treffermengen wurden in beiden Fällen durch die Beschränkung des Veröffentlichungszeitraumes von 2005-2008 verringert. Die Suchergebnisse wurden nur als Treffer gewertet, wenn diese die EU-Osterweiterung zum Inhalt hatten. Treffer, welche die Beitrittsbemühungen der Türkei, Makedonien oder Kroatien thematisieren, wurden nicht als relevante Treffer betrachtet.

3.2.1 Google Scholar

Die erste Sucheingabe eu osterweiterung arbeitsmarkt brachte jedoch zu wenige relevante Treffer. Die Suchanfrage musste durch eine OR-Verknüpfung innerhalb gesetzter Klammern und Wortvarianten von Arbeit-... verbessert werden. An dieser Stelle erweist sich die fehlende Trunkierungsmöglichkeit von Google Scholar als großer Nachteil.

3.2.2 Fachdatenbank wiso

Die Suche in wiso wurde auf den sozialwissenschaftlichen Teil der Datenbank eingeschränkt:

eu-osterweiterung and arbeit*

 

wiso

Google Scholar

Treffermenge

85 (=100%)

87 (=100%)

Relevanz

   

   sehr gut bis gut

70 %

51 %

   nicht passend

23%

49%

   Dubletten

7%

 

Anmerkungen: Die Suchergebnisse in der Fachdatenbank wiso werden als eine Ergebnistabelle mit 3 Spalten ausgegeben, in denen der Autor, der Titel und die Quelle genannt werden. Eine Detailanzeige ist ebenfalls möglich. Die darin enthaltenen Abstracts und zusätzlichen Informationen sind sehr ausführlich, so dass sich der Nutzer ein gutes Bild von der Relevanz des Treffers machen kann.

Die Suchanfrage der Datenbank wiso erzielte 140 Treffer nach dem Veröffentlichungsdatum sortiert. 85 Treffer wurden davon ausgewertet. Auf Grund des gesetzten Zeitrahmens konnten nicht mehr ausgewertet werden. Durch die sehr allgemein gehaltene Suchanfrage waren auch Treffer dabei, die mit einer ausgefeilteren Suchtechnik eliminierbar gewesen wären. Die Suchanfrage bei Google Scholar ergab 513 Treffer. Auf Grund des Zeitschnittes wurden nur 87 Treffer ausgewertet.

3.3 Recherche 3: Biegezugfestigkeit von Brettschichtbindern aus Buche

Die Herstellung von Brettschichtbindern aus Nadelholz gehört zum Standard der holzverarbeitenden Technik, die Nutzung von Buche als einem Laubholz zur Herstellung von Brettschichtbindern ist indes eher selten. Innerhalb der Universität Karlsruhe wurde viel auf diesem Gebiet geforscht und die Publikationen wurden unter anderem im Universitätsverlag Karlsruhe veröffentlicht und sind im Internet frei zugänglich.

3.3.1 Google Scholar

Die Eingabe der einfachen Schlüsselbegriffe ergab keine Treffer. Da eine Trunkierung der Suchbegriffe nicht möglich ist, wurden die Synonyme mit OR verknüpft und die englischen Begriffe als Phrasensuche eingegeben (Google Scholar sucht sonst nach den einzelnen Begriffen). Die drei Klammerbegriffe wurden dann durch ein Leerzeichen mit AND verknüpft. Mit dieser Suchanfrage wurde die Auswertung durchgeführt.

(Zugfestigkeit OR Biegefestigkeit OR Biegeberechnung OR Biegebemessung OR Biegekennwerte OR "bending strength" OR "bending stress") (BSH OR Holzbinder OR Brettschichtbinder OR Brettschichtholz OR Leimbinder OR glulam) (Laubholz OR Buche OR beech)

3.3.2 Fachdatenbank RSWB PLUS

Die Suchbegriffe wurden, soweit es möglich war, trunkiert. Die Suchschritte ergaben sich daraus folgendermaßen:

Die Suchanfrage der Datenbank erzielte 11 Treffer, die alle ausgewertet wurden. Die Suchanfrage bei Google Scholar lieferte 124 Treffer. Auf Grund des häufigen Auftretens von 9 thematisch nicht passenden Treffern und zur Vermeidung einer künstlichen Verschlechterung der Auswertungsergebnisse wurde bereits nach neun nicht relevanten Treffern die Auswertung der Ergebnisliste beendet. Die ausgewertete Treffermenge reduziert sich daher auf 31 Treffer.

 

RSWB Plus

Google Scholar

Treffermenge

11 (=100%)

31 (=100%)

Relevanz

   

   sehr gut bis gut

82 %

39 %

   nicht passend

0 %

61 %

   Dubletten

18 %

 

Anmerkungen: Es handelt sich um eine sehr spezielle Suche, die durch den Suchbegriff "Buche" stark eingegrenzt ist. Die Treffermenge aus RSWB Plus ist gering und liegt im Zeitraum von 1978 bis 2008. Die Treffer beschäftigen sich bis auf 2 Dubletten als Hauptthematik mit dem Recherchethema, sodass auf dieser Suche weiter aufgebaut werden kann. An dem großen Zeitraum der gefundenen Suchergebnisse ist zu erkennen, dass die Forschungsintensität auf diesem Gebiet zwar gering ist, jedoch immer wieder versucht wird, sich dieser Thematik zu nähern und neuartige Brettschichtbinder zu entwickeln. Auf Grund der sehr geringen Treffermenge ist diese Recherche zu speziell gewählt worden. In der geringen Treffermenge waren keine irrelevanten Treffer dabei. Die Fachdatenbank beinhaltet ausgewertete Zeitschriften und Kongresse. Frei im Internet zugängliche Literatur zu dieser Thematik ist nicht Datenbasis der Fachdatenbank.

Bei Google Scholar wurden von 142 Treffern 31 ausgewertet. Davon waren 2/3 thematisch nicht passend. Dennoch ist bei dieser Recherche die Anzahl der relevanten Treffer bei Google Scholar höher als bei der Recherche mit einer Fachdatenbank. Auffällig bei der Auswertung dieser Recherche ist die hohe Zitationstreffermenge: 50 % der relevanten Treffer sind Zitationen mit teilweise rudimentären bibliographischen Angaben, zum Beispiel fehlen manchmal Titel, Heftangabe, ISSN oder Seitenangabe. Da die Zitation nicht verlinkt ist, werden erst über die Websuche die Volltexte bzw. das Abstract des Zeitschriftenartikels zugänglich.

3.4 Recherche 4: Tribologie von Lagern aus Kupferlegierung

Die Tribologie von Lagern ist eine verbreitete Thematik im Maschinenbau. In der Recherche in der Fachdatenbank tema geht es dabei speziell um Lager aus Kupferlegierungen.

3.4.1 Google Scholar

Auch für dieses Recherchethema gestaltet sich die Bildung der Suchanfrage komplizierter als erwartet. Es mussten bei dieser Suchanfrage inhaltlich große Kompromisse eingegangen werden, um überhaupt relevante Treffer zu erhalten.

Die Anfrage

ergab nur sechs Treffer, von denen nur drei relevant waren. Der Schlüsselbegriff Kupferlegierung wurde deshalb zur Vermeidung zu starker Eingrenzung der Suchanfrage weggelassen und nur auf Deutsch eingegeben. Die Vergleichbarkeit mit den Ergebnissen der Fachrecherche ist daher nur sehr eingeschränkt möglich.

 

Tema

Google Scholar

Treffermenge

50 (=100%)

29 (=100%)

Relevanz

  

   sehr gut bis gut

98 %

32 %

   nicht passend

2 %

68 %

   Dubletten

0 %

 

Anmerkungen: Auch diese Fragestellung war durch die Einschränkung der Maschinenlager aus Kupferlegierung sehr speziell. Der Anteil an passenden Treffern ist in tema mit 89 % dennoch sehr hoch. Die Zeitschriftenartikel als Publikationsform überwiegen mit 2/3 oder 64 % der relevanten Treffer. Einzelbeiträge wurden mit 16 % in Reihen als Sammelbände und 20 % in Kongressbänden veröffentlicht. Für die ausgewertete Datenbasis der Fachdatenbank Tema ein zu erwartendes Ergebnis. Der abgedeckte Veröffentlichungszeitraum reicht von 2007 bis 1965, davon sind 28 Treffer ab dem Jahr 2000 veröffentlicht, im Jahr 2007 wurden fünf Dokumente gefunden.

Von den 200 Treffern in Google Scholar wurden nur 28 also 14 % ausgewertet. Selbst davon konnten nur ein Drittel als relevant eingestuft werden (Lehrbücher und Wörterbücher wurden nicht als Treffer gewertet, da sich diese zu allgemein mit der Thematik auseinandersetzen).

Die Suchanfrage der Datenbank lieferte 58 Treffer, von denen 50 Treffer ausgewertet wurden. Die Suchanfrage bei Google Scholar in deutscher Sprache ergab 200 Treffer, nach zehn thematisch nicht geeigneten Treffern wurde die Auswertung nach 29 Ergebnissen abgebrochen.

4. Ergebnis

4.1 Auswertung der Rechercheergebnisse

Die Ergebnismenge von Google Scholar ist zwar bei allen Recherchen insgesamt größer als die der Fachdatenbanken, jedoch verringert sich die Zahl verwertbarer Treffer durch die anfangs festgelegten Rahmenbedingungen für die Auswertung erheblich. Der Anteil relevanter Treffer liegt bei den Fachdatenbanken mit 70 % und 98 % deutlich höher als bei Google Scholar mit 32 % bis 51 %.

Einige der bereits sehr knappen bibliographischen Daten der Ergebnisliste unter Google Scholar weisen neben den formalen zusätzlich noch inhaltliche Defizite auf. Ein minimaler bibliographischer Standard - Autor, vollständiger Titel, aussagekräftige Quellenangabe, Erscheinungsjahr und Umfang des Dokuments - wird bei Google nicht immer eingehalten.

Zitationen sind als Teil der Datenbasis von Google Scholar kritisch zu betrachten. Da Zitationen nicht mit einem Objekt verlinkt sind, verweisen sie über die "Websuche" auf sich selbst. Dies verschachtelt die Ergebnisse unter Google Scholar unnötig. Die weiteren Recherchemöglichkeiten von Zitationen durch "ähnliche Artikel" oder "zitiert durch" können zwar vereinzelt weiterhelfen, doch bedingt dies stets einen zusätzlichen Suchschritt und verkompliziert die Recherche.

4.2 Fachdatenbanken

Die Fachdatenbanken sind lizenzpflichtig und in der Bedienung meist nicht intuitiv. Diese beiden Eigenschaften sind die einzigen echten Nachteile gegenüber Google Scholar. Fachdatenbanken bieten dem Nutzer eine große Anzahl von Möglichkeiten, z. B. einen Thesaurus, die Möglichkeit der Trunkierung von Wörtern, viele verschiedene Verknüpfungsfunktionen, die Eingabe von Suchschritten, die Aufbereitung einer Suchhistorie und eine Klassifikation. Sie dienen der Verallgemeinerung oder der Verfeinerung einer komplex gestellten Suchanfrage. Als Ergebnismenge werden fachlich relevante Treffer mit hochwertigen bibliographischen Daten gelistet. Sie können nach dem Veröffentlichungsdatum geordnet werden. Die Datenanreicherung der Fachdatenbanken entsteht durch Fachleute, welche die Entscheidung über die Aufnahme eines Artikels aus einer bekannten Datenbasis (ausgewertete Literatur) und die fachliche Zuordnung (Klassifikation) übernehmen. Der Aktualisierung einer Datenbank erfolgt in einem definierten Zeitabschnitt.

4.3 Google Scholar

Die freie Zugänglichkeit von Google Scholar als Suchdienst bietet für eine große Nutzerzahl die Möglichkeit der Recherche. Die einfache Bedienung macht den Umgang mit diesem Suchdienst sehr leicht und die Hemmschwelle, diesen Suchdienst "mal schnell" zu benutzen, um sich Informationen zu verschaffen, ist niedrig. Hierin liegt der große Vorteil von Google Scholar gegenüber den Fachdatenbanken.

Im Vergleich zu Fachdatenbanken bietet die Hilfe nur wenig Unterstützung und weder Thesaurus, noch Klassifikation, noch die Trunkierung von Wörtern. Die Ergebnisse werden gemäß dem Pageranking von Google und der Zitationshäufigkeit aufgelistet. Die Sortierung nach Relevanz anhand der Zitationshäufigkeit ist für Forschungsliteratur nicht geeignet. Eine andere Sortierung der Ergebnisliste, z. B. nach Veröffentlichungsdatum ist nicht möglich.

Die bibliographischen Daten sind in der Regel sehr knapp und die Angaben zum Titel, Autor und den markierten Stellen der gefundenen Schlüsselwörter genügen nicht einem bibliographischen Mindeststandard. Die Datenbasis der ausgewerteten Quellen ist nicht bekannt. Die Aktualisierung der Datenmenge von Google Scholar erfolgt über die maschinelle Indexierung vieler - leider nicht aller - im Internet zugänglichen Quellen.

5. Fazit

Was erwartet ein Nutzer von einem idealen Suchdienst für wissenschaftliche Informationen? Wie bei der Websuche eine einfache, schnelle und unkomplizierte Suche, möglichst viele relevante Treffer und idealerweise den sofortigen Zugriff auf die Originaldokumente. Beides zugleich können derzeit weder die untersuchten Fachdatenbanken noch Google Scholar bieten. Während Google Scholar mit einem sehr übersichtlichen Nutzerinterface punktet, erfordert die Komplexität des Umgangs mit Fachdatenbanken noch immer eine Unterstützung der Nutzer durch Bibliotheken. Von daher ist anzunehmen, dass trotz der erheblichen inhaltlichen Defizite der Nutzerkreis von Google Scholar weiter zunehmen wird. Für den Einstieg in eine Thematik oder eine ergänzende Nachrecherche ist Google Scholar in jedem Fall nützlich, auch wenn die bei Fachdatenbanken selbstverständliche Transparenz bei der Quellenauswertung und deren Qualität der bibliographischen Daten weitgehend fehlt.


Autoren

Dipl.-Ing. Franka Handreck

Bibliotheksreferendarin

Univeritätsbibliothek Karlruhe
franka.handreck@ubka.uni-karlsruhe.de


Dr. Michael W. Mönnich

Universitätsbibliothek Karlsruhe
Kaiserstr. 12
76049 Karlsruhe
Michael.Moennich@ubka.uni-karlsruhe.de


Anmerkungen

1. http://googleblog.blogspot.com/2004/10/scholarly-pursuits.html

2. http://www.heise.de/newsticker/Googles-Wissenschaftssuchdienst-auf-Deutsch--/meldung/72205

3. http://scholar.google.de/intl/de/scholar/about.html

4. http://scholar.google.de/intl/de/scholar/help.html

5. http://scholar.google.de/intl/de/scholar/refinesearch.html

6. Handbuch RSWB PLUS http://www.fiz-technik.de/download/rswb-handbuch.pdf