Lewandowski, Dirk: Web Information Retrieval: Technologien zur Informationssuche im Internet


- Frankfurt am Main: Deutsche Gesellschaft f. Informationswissenschaft u. Informationspraxis 2005. 248 S. (Reihe Informationswissenschaft - 7)
ISBN 3-925474-55-2, Euro 25,-

Der Autor studierte nach der Ausbildung zum Diplombibliothekar (FH) an der Heinrich-Heine-Universität Düsseldorf Philosophie und Informations- und Medienwissenschaft und nimmt dort einen Lehrauftrag am Institut für Sprache und Information wahr. Das vorliegende Werk ist dem Vorwort zufolge aus einer Dissertation hervorgegangen. Wie alle Autoren, die sich eingehender mit Suchmaschinen und deren Technologie befassen, hat auch Lewandowski das Problem, dass Informationen über die Suchmaschinen zugrundeliegenden Technik von den im scharfen Konkurrenzkampf stehenden Betreibern nicht offen gelegt werden. Wer sich mit Suchmaschinentechnik befasst, muss sich diese durch Feldversuche und die Konsultation sekundärer Quellen erschließen.

Im Gegensatz zu vielen anderen ist das Buch von Lewandowski keine schnell veraltende Gebrauchsanweisung für die Suche nach Informationen im Internet, sondern stellt vielmehr eine methodisch fundierte Bestandsaufnahme des "State of the Art" bei Internetsuchmaschinen dar.

Lewandowski Buch umfasst 13 Kapitel und beginnt bei der Beschreibung des Web und der darin enthaltenen Dokumente und ihrer Struktur und rekursiert dann auf die klassischen Techniken des Information Retrievals. Anschließend beschreibt der Autor ausführlich die im Volltextretrieval üblichen linguistischen Verfahren, geht dann auf Fragen des Ranking, Benutzerführung sowie Methoden zur Bestimmung der Aktualität und Qualität von Dokumenten ein.

Der Autor legt Wert darauf, die Besonderheiten des "Web Information Retrieval", im Gegensatz zum "klassischen" Information Retrieval herauszuarbeiten. Das Ziel des Web Information Retrieval ist mit dem des klassischen Information Retrieval zwar weitgehend identisch, nämlich dem Nutzer die für die Befriedigung seines Informationsbedürfnisses besten Ergebnisse zu liefern. Die Recherche in den Webseiten des Internet hat jedoch mit ganz anderen Problemen zu kämpfen als die bekannte Literatur- oder Faktenrecherche in Fachdatenbanken, deren Daten in einem ordentlich gepflegten Umfeld vorliegen. Im Web hat man mit Indexspamming, Volltextretrieval, Fragen der Aktualität und insbesondere mit dem für die Qualität der Suchergebnisse entscheidend wichtigen Relevanzranking zu tun.

Der Autor strebt an, in seiner Darstellung den technikzentrierten Ansatz der Informatik um einen "Blick fürs Ganze" zu erweitern und vor allem die Bedürfnisse der Nutzer in ihren Ansatz einzubinden. Dies gelingt ihm zur Gänze und so füllt sein Buch eine bislang schmerzlich empfundene Lücke in der Literatur über Internetsuchmaschinen.


Anschrift des Rezensenten

Dr. Michael Mönnich
Universitätsbibliothek Karlsruhe
E-Mail: moennich@ubka.uni-karlsruhe.de