Neues aus Großbritannien

Der lange Weg vom Dokumentenserver zum Datenserver:
Erfahrungen aus Großbritannien


1 Entstehung von Dokumentenserver in Großbritannien
2 Maßnahmen zur Förderung von Dokumentenservern in Großbritannien
3 Erste Schritte zum Aufbau eines Datenservers an der Universität Oxford
4 Schlussfolgerung

von Alice Keller

1 Entstehung von Dokumentenserver in Großbritannien

Der Aufbau von Dokumentenservern in Großbritannien verlief sehr unterschiedlich zur Entwicklung im deutschsprachigen Raum. Meinen Erfahrungen aus der Eidgenössischen Technischen Hochschule Zürich zeigten, dass - obwohl der Open Access Gedanke groß propagiert wurde -Dokumentenserver im deutschsprachigen Raum vor allem für die Archivierung und für den Zugang zu Dissertationen verwendet werden. Wenn ich heute aus der Ferne auf den Inhalt der ETH E-Collection schaue, so stelle ich fest, dass es sich bei 81% der Dokumente um Dissertationen oder Habilitationsschriften handelt.

In Großbritannien zeit sich ein sehr anderes Bild: Dissertationen gelten als Gut der Spezialsammlungen und werden traditionell nicht in gleichem Masse der Öffentlichkeit zur Verfügung gestellt1. Entsprechend sind nur 6% der Dokumente auf dem Dokumentenserver der Universität Oxford Dissertationen. Stattdessen profitieren die britischen Dokumentenserver vermutlich mehr von den Zielsetzungen der Open Access Bewegung als auf dem Kontinent. Denn die Konditionen, die an manche Drittmittel geknüpft sind, verlangen strikte, dass die Resultate der Öffentlichkeit frei zugänglich gemacht werden2.

Die Entwicklung von Dokumentenservern in Großbritannien ist eng mit dem Projekt SHERPA (Securing a Hybrid Environment for Research Preservation and Access) verknüpft3. Das im Jahre 2006 abgeschlossene Projekt gab den britischen Hochschulen einen geeigneten Rahmen und eine Anschubfinanzierung für den Aufbau von institutionellen Repositorien.

Obwohl das Projekt als solches seit längerer Zeit abgeschlossen ist, existiert die Website von SHERPA (http://www.sherpa.ac.uk/) weiter und dient dazu, Dienste und Informationen, die im Zusammenhang mit Dokumentenservern oder Open Access wichtig sind, zusammen zu bringen. Im Vordergrund stehen vier sehr nützliche Verzeichnisse oder Tools:

Trotz dieser ausgezeichneten Unterstützung, fehlt es den Dokumentenservern in Großbritanniens an Inhalt. Mit dem Ausbleiben von Dissertationen als primäre "Futterquelle", kämpfen sie für Volltexte. Der in Oxford vorhandene Dokumentenserver namens ORA (Oxford University Research Archive) hat nach fünf Jahren sehr starkem Engagement der Projektleiterin lediglich 2'850 Eintragungen. Und bei manchen Dokumenten handelt es sich nicht um Volltexte, sondern nur um bibliographische Daten.

Nach Auskunft der Projektleitung leiden die institutionellen Repositorien Großbritanniens v.a. darunter, dass die Autoren es in vielen Fällen bevorzugen, ihre Publikationen in fachspezifischen Archiven abzulegen. Hierzu gehört beispielsweise die sehr erfolgreiche Volltextdatenbank UK PubMed Central. Open Access macht sich als also selber die grösste Konkurrenz.

2 Maßnahmen zur Förderung von Dokumentenservern in Großbritannien

Damit die institutionellen Repositorien Großbritanniens den dringend benötigten Sprung nach vorne schaffen, konzentrieren sich die Projektmanager auf eine Imageaufbesserung und auf den Ausbau der Dienstleistungen. Hierzu fallen mir drei Trends auf, die nachfolgend beschrieben werden.

2.1 Einsatz der Dokumentenserver in der Forschungsevaluation

Diesen Trend, Dokumentenserver enger in die Forschungsevaluation einzubinden, habe ich in meinem Beitrag "Forschungsevaluation in Großbritannien" diskutiert4. Hiermit soll erreicht werden, dass universitäre Dokumentenserver - bzw. deren Inhalt - einen unentbehrlichen Bestandteil im Prozess der Forschungsevaluation darstellen. Denn, wer auch immer sich in der Forschungsevaluation (Research Excellent Framework, REF) unentbehrlich machen kann, dessen Zukunft ist gesichert!

Die Überlegungen zielen dahin, dass ein Dokumentenserver diesen Evaluationsprozess in verschiedener Weise unterstützen könnte:

2.2 Verknüpfung von Dokumentenservern mit anderen Datenquellen

Ein anderes Experiment, Dokumentenserver attraktiver zu machen, sieht man beim nachfolgend beschriebenen Pilotprojekt, bei dem gegenwärtig verteilte Daten unter einer Oberfläche präsentiert werden.

Das im Jahr 2008 lancierte Pilotprojekt Content Integration Project (CIP) an der Universität Bristol (http://cip.ilrt.bris.ac.uk/cip/) dauerte nur sechs Monate und hatte zum Ziel, Informationen aus verschiedenen Quellen automatisch zusammen zu führen. Hierbei handelte sich um Personen- und Publikationsdaten zu Forschern5; Projektinformationen aus den Fakultäten; sowie zentral gespeicherte Projektdaten aus den staatlichen Fördereinrichtungen (hier Engineering and Physical Sciences Research Council, EPSRC).

Die Universität Bristol profitiert von den Vorzügen des semantischen Webs, um eine höchstmögliche Flexibilität bei der Suche und den Präsentationsmöglichkeiten zu erzielen.

Wie schon eingangs erwähnt, handelte es sich um ein Pilotprojekt, und die Datenbank umfasst nur eine beschränkte Datenmenge. Dennoch scheint die Idee sehr zukunftsweisend zu sein. Allerdings dürften nicht alle Wissenschaftler gleichermaßen begeistert sein von dieser neuen Form der Transparenz!

Abbildung 1: Content Integration Project (CIP) an der Universität Bristol (http://cip.ilrt.bris.ac.uk/cip/).
Das Ziel des Projektes war, verteilte Daten zu Personen, Publikationen, Forschungsprojekten
und Drittmittelgeber unter einer Suchoberfläche zusammenzubringen und suchbar zu machen.

2.3 Ausweitung des Sammelauftrags zur Integration von Forschungsdaten

Da es den Dokumentenservern derzeit an Inhalt fehlt, so bietet es sich an, den Sammelauftrag zu erweitern. Hierbei erstaunt es nicht, dass die Projektleiter von Dokumentenservern und die Befürworter der Open Access Bewegung an die Einbindung von Forschungsprimärdaten denken.

Und obwohl man anfangs der Meinung war, dass die Integration von Forschungsdaten auf einen laufenden Dokumentenserver problemlos möglich sein würde, stellte sich sehr schnell heraus, dass es sich - wie man mir so schön sagte - um "two quite different kettles of fish" handelte.

Die Universität von Oxford war von Anfang beteiligt an diesen Diskussionen und war stark daran interessiert, an einem Pilotprojekt teilzunehmen.

Allerdings zeigen die Erfahrungen von Oxford, dass es nicht einfach darum gehen kann, fertige Datensammlungen aufzunehmen und auf einem Server abzulegen. Wie ich im Nachfolgenden zeigen möchte, sind die Unterschiede zwischen Dokumentenserver und Datenserver viel größer als anfangs vermutet.

3 Erste Schritte zum Aufbau eines Datenservers an der Universität Oxford

Wie so oft im britischen Bibliothekswesen, war man auch bei diesem Projekt auf die Geldspritze von JISC angewiesen. Die Universität Oxford war hierbei Partner im Projekt DISC-UK DataShare, das eine Laufzeit von März 07 bis März 09 hatte6. Ziel des Projektes war es, die Bedürfnisse der wissenschaftlichen Community bezüglich Forschungsprimärdaten zu evaluieren. Hierbei ging es also (noch) nicht um den Aufbau von Datenservern, sondern um die Klärung, wie und wo Datenserver sinnvoll eingesetzt werden könnten.

Im Rahmen dieser Initiative gelang es Oxford, eine befristete Stelle als Projektkoordinator zu besetzen und das "Scoping Digital Repository Services for Research Data Management Project" zu lancieren7.

Interessanterweise ist der Projektkoordinator Luis Martinez-Uribe nicht der Bibliothek, sondern dem Oxford e-Research Centre angegliedert, was bereits darauf hindeutet, dass Datenserver nicht unbedingt und ausschließlich als Aufgabe der Hochschulbibliotheken betrachtet werden. In Fall von Oxford handelt es sich beim oben genannten Projekt um eine Kooperation zwischen Rechenzentrum, Universitätsbibliothek, Oxford e-Research Centre, und IT-Direktorat.

Wie der Name sagt, handelt es sich beim hier beschriebenen Projekt um eine "Scoping" Studie: es geht also um die Evaluation der Bedürfnisse und um die Erarbeitung eines Konzeptes für die Verwaltung und Archivierung von Forschungsdaten.

Für die Bedürfnisabklärung wurden Workshops mit Forschungsgruppen geführt. Hier einige der typischen Fragestellungen, die in den Gesprächsrunden wiederholt auftauchten:

Diese Fragestellungen zeigen sehr deutlich, dass es nicht nur oder primär darum geht, Speicherplatz für Forschungsdaten zur Verfügung zu stellen. Vielmehr beanspruchen die Wissenschaftler gezielte Hilfestellung und Tools während des gesamten Lebenszyklus eines Forschungsprogramms: also von der Planung des Projektes, bis hin zur dauerhaften Archivierung der Daten.

Der Projektkoordinator Martinez-Uribe fasst die Bedürfnisse wie folgt zusammenfassen:

Der Open Access Gedanke, also der Zugang zu den Daten für die breite Öffentlichkeit, wurde von den Forschern nirgends nicht als Bedürfnis genannt.

Das Resultat dieser einjährigen Bedürfnisevaluation war die Formulierung eines Rahmenplans für die Unterstützung der Wissenschaftler beim gesamten Prozess der Forschungsdatenverwaltung. Dieses "Research Data Management and Curation Services Framework" definiert dreizehn Schritte oder Aktivitäten, bei denen entweder Beratung und Support, oder Tools und Infrastruktur zur Verfügung gestellt werden sollten. (Siehe Abb. 2).

Abbildung 2: Darstellung des "Research Data Management and Curation Services
Framework", d.h. des Rahmenplans für die Unterstützung der Wissenschaftler
beim gesamten Prozess der Forschungsdatenverwaltung8

Es wurde schnell klar, dass ein solch breites Spektrum an Expertenwissen und Tools nicht von einer Stelle aus zur Verfügung gestellt werden kann. Andererseits ist das erforderliche Spezialwissen in vielen Fällen bereits an der Universität vorhanden - möglicherweise in einem vollständig anderen Kontext. In einem nächsten Schritt geht es also darum abzuklären, wo an der Universität Kompetenzen bereits vorhanden sind und wie diese angezapft werden können. Zudem will man in einem Folgeprojekt und anhand von zwei konkreten Forschungsvorhaben den Lebenszyklus der Forschungsprimärdaten näher verfolgen und die einzelnen Schritte im Detail besser beschreiben.

4 Schlussfolgerung

Der Weg vom Dokumentenserver zum Datenserver scheint aufwändiger und komplexer zu sein als anfangs vermutet. Bibliotheken werden diese neuen Dienstleistungen weder im Alleingang, noch ohne weitere finanzielle Unterstützung übernehmen können. Im Vergleich zu den traditionellen Dokumentenservern handelt es sich beim Datenserver um ein neues Modell der Datennutzung; um technisch komplexere Daten und Dateitypen; und um Daten, die evtl. nicht verständlich oder geeignet sind für Öffentlichkeit.

Allerdings scheint auch hier - wie schon bei den Dokumentenservern - das größte Problem darin zu liegen, dass die Autoren extrem zurückhaltend sind bei der Freigabe ihrer Forschungsdaten für die Öffentlichkeit. Luis Martinez-Uribe verweist mich auf ein Zitat: "The best results from your data will come from someone else". Und dieses Schicksal will der Wissenschaftler nicht noch mehr herbei beschwören, indem er den Zugang zu seinen Rohdaten allzu einfach macht!


Autorin

Dr. Alice Keller

Assistant Director, Collections & Resource Description
Bodleian Library
Oxford OX1 3BG
England
alice.keller@ouls.ox.ac.uk


Anmerkungen

1. Siehe auch: Keller, A.: Britische Dissertationen: Gewagter Sprung vom Handschriftensaal ins Internet. In: B.I.T.online, Heft 4/2007, S. 311-312.

2. Eine Zusammenstellung dieser Anforderungen findet sich im Verzeichnis JULIET, das im nachfolgenden Text vorgestellt wird.

3. SHERPA war Teil des JISC FAIR (Focus on Access to Institutional Resources) Rahmenprogramms. Eine Auflistung der Zielsetzungen von SHERPA findet sich unter: http://www.sherpa.ac.uk/projects/sherpa.html.

4. Keller, A.: Forschungsevaluation in Großbritannien. In: B.I.T.online, Vol. 11, Heft 3/2008, pp. 293-295.

5. Die Publikationsdaten stammen hierbei natürlich vom Dokumentenserver.

6. DISC-UK DataShare project: http://www.disc-uk.org/datashare.html.

7. Scoping Digital Repository Services for Research Data Management Project: http://www.ict.ox.ac.uk/odit/projects/digitalrepository/.

8. Nähere Erklärungen dazu, siehe: Luis Martinez-Uribe, (2009). Research data management services: findings of the consultation with service providers. Link to archived copy: http://ora.ouls.ox.ac.uk/objects/uuid:0bcc3d57-8d20-42dd-82ac-55eab5cd682b.