Neues aus Grossbritannien

Schlechtwetternachrichten aus Grossbritannien -
oder ein Blick hinter die Kulissen von EEBO (Early English Books Online) TCP

Von Alice Keller

Im April diesen Jahres kündigte das britische Met Office einen heissen Sommer an. Der Oberste Wetterfrosch meldete, dass ein dritter verregneter Sommer in Folge unwahrscheinlich sei. Voller Optimismus erklärte er kurz nach Ostern: “This year will be much drier than normal. Get the BBQ out. Probably with spells of weather with the temperature reaching 30 degrees Celsius.”

Überall brach Begeisterung aus und man entschied sich, für einmal die Sommerferien nicht im sonnigen Süden, sondern im eigenen Land zu verbringen. Auch die Verkäufe von Gartengrills und Gartenmöbel schnellten in die Höhe. Der Ausdruck „Barbecue Summer“ wurde erstmals offiziell in das Vokabular des Engländers aufgenommen.

Aber als das Quecksilber bis Ende Juli die 30 Grad Marke noch nie erreicht hatte, erschienen erzürnte Leserbriefe in der Zeitung. Das Met Office gab nun offiziell zu, dass ein „Barbecue Summer“ unwahrscheinlich sei. Und am 29. Juli meldete das Met Office schiesslich: “For the rest of summer, rainfall is likely to be near or above average over the UK.”1 Und so war es denn auch. Das Wetter blieb auch für den Rest des Sommers kühl und nass. Goretexjacke und Regenschirm blieben immer in Griffnähe.

Es ist allerdings nicht das erste Mal, dass sich die Wetterfrösche getäuscht haben. Am berühmtesten ist die fatale Fehlprognose des BBC Wetteransagers Michael Fish aus dem Jahr 1987, als er einen Hurrikan dem Radarbild übersah und versagte, Fernsehzuschauer davor zu warnen.

Heute scheint man sich einig zu sein, dass die häufigen Sturmböen, starken Regenfälle und Überschwemmungen Folgen der Klimaveränderung sind. Das mag sein, aber sicher gab es auch früher schon Sturm und Regen?

Gute Frage: Wie war eigentlich das britische Wetter in früheren Jahrhunderten? Mir kam am regnerischen Bank Holiday Wochenende im August nichts Besseres in den Sinn, als in EEBO (Early English Books Online) nachzuschlagen.

Unter dem Schlagwort „Floods“ finde ich zahlreiche Werke in EEBO, die über verheerende Überschwemmungen in England berichten. Ins Auge stechen die zahlreichen Werke zu den grossen Fluten des Jahres 1607, die in manchen Teilen Englands wüteten.

William Jones of Usk: Gods vvarning to His people of England, by the great overflowing of the waters or floudes lately hapned in South-Wales and many other places, 1607. Abgedruckt mit freundlicher Bewilligung der Bodleian Library, Titelblatt aus Signatur 4°C 16 (47) Art.BS.

Hier finde ich auch ein Werk von William Jones of Usk mit dem etwas ausführlichen Titel: Gods vvarning to His people of England, by the great overflowing of the waters or floudes lately hapned in South-Wales and many other places vvherein is declared the great losses and wonderfull damages that hapned thereby, by the drowning of many townes and villages to the vtter vndooing of many thousandes of people (London, 1607).

Das Ausmass des Desasters wird bereits bildhaft auf dem Titelblatt festgehalten: Währenddem Pferde, Ochsen und Menschen in den Fluten ertrinken, haben es einige glückliche Gestalten geschafft, sich auf einen Baum oder ein Hausdach zu retten. Nur eine Figur behält scheinbar Ruhe, wendet sich Gott zu und fleht um Hilfe. Seinen sicheren Hügel teilt er mit zahlreichen Katzen, während dem es die Vögel eilig haben, das Überschwemmungsgebiet möglichst schnell zu überfliegen.

In der Tat scheinen die Überschwemmungen aus dem Jahr 1607 besonders schlimm gewesen zu sein. Wikipedia widmet ihnen sogar einen eigenen Eintrag (Bristol Channel floods, 1607). Offenbar gab es 2‘000 Tote und über 500 km2 Agrarland mitsamt Viehbestand wurden vernichtet.

Möchte ich allerdings den Text zu dieser Abbildung lesen, so stosse ich schnell an meine Grenzen. Aber ich habe Glück, denn hier hilft mir die Text Creation Partnership weiter. Gemeinsam geben uns EEBO und TCP einen einzigartigen Einblick in die Geschichte der britischen Inseln.

EEBO (Early English Books Online)

Bevor ich über die Text Creation Partnership berichte, an der die Universität Oxford beteiligt ist, möchte ich etwas zur Entstehungsgeschichte von EEBO – und der oben gezeigten Abbildung – sagen (http://eebo.chadwyck.com/home).

Man kann sich die geisteswissenschaftliche Forschung in Grossbritannien heute wohl kaum mehr ohne EEBO (Early English Books Online) und ECCO (Eighteenth Century Collection Online) vorstellen. Beide Produkte wurden von JISC „für die Nation“ gekauft und stehen in allen Hochschulen des Landes uneingeschränkt zur Verfügung, sofern die Einrichtung eine bescheidene „Hosting-Gebühr“ bezahlt. Obwohl beide Ressourcen für die moderne Forschung unentbehrlich sind, befasst sich dieser Artikel ausschliesslich mit EEBO.

EEBO deckt die Zeit vom ersten Buchdruck bis 1700 ab. Die Online Sammlung umfasst derzeit 100’000 der 125’000 Bücher, die in den Verzeichnissen Redgrave's Short-Title Catalogue (1475-1640), Wing's Short-Title Catalogue (1641-1700), Thomason Tracts (1640-1661) und im Early English Books Tract Supplement aufgeführt sind. Inhaltlich deckt EEBO alle Werke ab, die in England, Schottland, Irland, Wales oder „Britisch Amerika“ gedruckt worden sind, sowie englischsprachige Bücher aus anderen Ländern. Natürlich machte ich mir den Spass nachzuprüfen, ob auch einige Werke aus der Schweiz da waren. Und in der Tat, insbesondere Genf ist zahlreich vertreten. Kein Wunder, wenn man bedenkt, dass sogar die Familie von Sir Thomas Bodley in Genf Zuflucht suchen musste, um der katholischen Maria I. auszuweichen.

Ausgangspunkt für EEBO war die Early English Books Mikrofilm Sammlung von UMI, die dann später digitalisiert wurde. Man kann sicher und mit Recht sagen, dass wir dieses Mammutwerk der Vision und Hartnäckigkeit von Eugene B. Power (1905-1993), Pionier im Bereich der Mikroverfilmung und Gründer von UMI (University Microfilms International), zu verdanken haben.

UMI veröffentlichte den ersten Mikrofilm für die Serie Early English Books I (Pollard & Redgrave, STC I) im Jahr 1938. Das Programm kam in den 90-er Jahren ins Stocken, und es dauerte acht Jahre, bis man genügend Originalmaterial für die Fortsetzung des Projektes finden konnte. Bis heute sind insgesamt 83 Einheiten (units) Mikrofilm erschienen. Die Mikroverfilmung der zweiten Serie, also der Altbestände für Early English Books II (Wing, STC II) begann im Jahr 1957. Jährlich erscheinen ungefähr zwei Einheiten in dieser zweiten Reihe; insgesamt sind es hier über 2‘800 Filmrollen oder 132 Einheiten (units).

Die Produzenten (UMI ist inzwischen von Proquest übernommen worden) gehen davon aus, dass die Restverfilmung von STC I und STC II weitere fünf bis zehn Jahre dauern wird. Je weiter das Projekt vorschreitet, desto schwieriger wird es, geeignete Originalausgaben zu finden. Proquest arbeitet derzeit mit 125 Partnerbibliotheken.

Die Herstellung der elektronischen Ausgabe von Early English Books – also EEBO – erfolgt ausschliesslich ab Film. Alle Werke, die also auf Film vorliegen, werden früher oder später auch elektronisch greifbar sein. Wie eingangs erwähnt, umfasst EEBO derzeit 100‘000 Werke in digitaler Form. Parallel dazu arbeitet die Text Creation Partnership an der Weiterbearbeitung des verfilmten Materials.

Die EEBO Text Creation Partnership (TCP)

Das Ziel der EEBO Text Creation Partnership ist die Umsetzung des Inhalts von EEBO in maschinenlesbare Texte (http://www.lib.umich.edu/tcp/eebo/). Allerdings sollen nicht alle 125‘000 Bücher übersetzt werden, das wäre viel zu teuer. Man beschränkt sich auf Erstausgaben, signifikante Neuausgaben sowie wichtige Autoren. Zudem werden nur Englischsprachige Bücher bearbeitet, obwohl EEBO als Sammlung auch anderssprachige Werke, die in England gedruckt worden sind, enthält.

Partner im TCP Programm sind die Universitäten Michigan und Oxford, das Council on Library and Information Resources (CLIR) und ProQuest Information and Learning. Diese Einrichtungen haben sich gemeinsam zum Ziel gesetzt, SGML/XML Textausgaben zu Werken in EEBO bereitzustellen. Aufgabe von Michigan und Oxford ist es, korrekte Abschriften von EEBO Werken zu liefern. Hierbei wird ein Grossteil der Tipp-Arbeit von externen Firmen erledigt. In Michigan und Oxford werden vor allem Vorbereitungs- und Nachbereitungsarbeiten sowie Qualitätskontrolle geleistet. Ursprüngliches Ziel von EEBO TCP war es, bis Sommer 2009 insgesamt 25‘000 Text bereitzustellen; diese Ziel konnte beinahe erreicht werden. Und die Projektmitarbeitenden haben Grund zum Feiern, denn das Projekt wurde soeben um weitere fünf Jahre verlängert. Endziel ist die Bearbeitung von 40 bis 45‘000 Titel.

Herstellung der Textdateien für EEBO-TCP

Die Auswahl der abzutippenden Texte wird in Michigan gefällt, gemäss detaillierten Richtlinien2. Anschliessend an diese Selektion werden die passenden digitalen Facsimiles von ProQuest zur Verfügung gestellt und an externe Firmen zur Abschrift in Auftrag gegeben. Fertige SGML/XML Dateien mit Textauszeichnung werden dann zur Schlussbearbeitung und Qualitätskontrolle nach Michigan oder Oxford geschickt. Der fertige Text soll ein Qualitätsniveau von 99,995% Richtigkeit erreichen (d.h. max. 1 Zeichen falsch pro 20‘000).

Akzeptierte Texte werden dann mit den bibliographischen Daten aus EEBO angereichert und in die wachsende Volltextdatenbank aufgenommen. Derzeit wächst diese Datenbank um monatlich 200 bis 300 Titel.

Häufig wird die Frage gestellt, ob es denn nicht möglich sei, Texte in EEBO direkt mittels OCR Bearbeitung suchbar zu machen. In der Tat wäre dies die viel billigere und schnellere Variante! Allerdings haben Tests gezeigt, dass die automatisierte Zeichenerkennung – zumindest bis heute – keine akzeptablen Resultate liefert. Die Text Creation Partnership sieht aber auch signifikante Vorteile bei der manuellen und intellektuellen Bearbeitung der Texte.

Bei meinen Besuch des TCP Büros in Oxford traf ich die Kollegin Pip Wilcox bei der Arbeit. Die studierte Mediävistin war gerade daran, einen abgetippten Text Korrektur zu lesen. Bei kurzen Werken liest sie den ganzen Text, bei längeren Werken einen bestimmten Anteil. Findet sie mehr Fehler als zulässig, so wird der Text nicht akzeptiert.

Interessant für mich war, wie die Text Creation Partnership mit unlesbaren Zeichen umgeht. Ich war etwas erstaunt, dass Pip Wilcox ausschliesslich mit der von ProQuest zur Verfügung gestellten Bilddatei als Vorlage arbeitet. Ich hatte mir ursprünglich gedacht, dass man für die Qualitätskontrolle und Korrektur auf den Originaltext zurück greifen würde. Schliesslich ist das Büro von Pip Wilcox in unmittelbarer Nähe einer der grössten Spezialsammlungen der Welt. Aber dies ist nicht der Fall, nicht zuletzt weil die Originaltexte ja weltweit verstreut sind.

Ist ein Zeichen unlesbar, darf nicht geraten oder spekuliert werden, statt dessen werden Platzhalter ergänzt (siehe Beispiel im nächsten Abschnitt). Frei ergänzen darf Pip Wilcox allerdings Gliederungselemente, um den Text einfacher navigierbar zu machen.

Das oben gezeigte Werk aus der Bodleian Library “Gods vvarning to His people of England ... (1607)” ist nicht von TCP bearbeitet worden. Aber ich habe Glück, denn die Ausgabe aus der Huntington Library liegt als abgetippter Volltext vor. (Allerdings ist die Abbildung auf dem Titelblatt in dieser Ausgabe geradezu langweilig im Vergleich zur Oxforder Ausgabe!) In der Huntington Abschrift kann man lesen, Menschen, Schweine, Schafe und Ochsen jämmerlich ertrinken. Glück hat allerdings ein Kleinkind, das die Fluten in seiner Wiege überlebt: „An infant likewise was found swimming in a Cradle, some mile or two fro~ ye place where it was knowen to be kept.

Interessant ist übrigens die Erklärung für das schlechte Wetter. Die Schuld für die Reihe von nassen Sommern 2007-09 weist das Met Office der von Menschen verursachten Klimaveränderung zu. Die Überschwemmungen im Jahr 1607 hingegen wurden als Warnung Gottes gegen das ungehorsame Volk gesehen. Damals rettete man sich auf einen Hügel und flehte zu Gott. Heute versucht man den CO2 Ausstoss zu verringern. Wem wird man wohl in weiteren 400 Jahren die Schuld zuweisen?


Autorin

Dr. Alice Keller

University of Oxford
alice.keller@hotmail.co.uk


Anmerkungen

1. “Met Office admits 'barbecue summer is off'”. Times Online, July 29, 2009.

2. Für die Richtlinien siehe: http://www.lib.umich.edu/tcp/eebo/proj_stat/ps_text.html.