Europas größtes Digitalisierungsprojekt für Zeitungen setzt auf Zeutschel Buchscanner

400 Jahre Zeitgeschichte ins 21. Jahrhundert transferieren

Von Jürgen Neitzel

Kein anderes Medium hat in den vergangenen Jahrhunderten Zeitgeschichte so facettenreich widergespiegelt wie Tageszeitungen. Im Bestreben, diesen wertvollen Fundus zu erhalten und einer breiten Öffentlichkeit zugänglich zu machen, hat die Nationalbibliothek der Niederlande in Den Haag jetzt damit begonnen, ihr einzigartiges, über 400 Jahre hinweg reichendes, historisches Zeitungsarchiv zu digitalisieren. Um eine gleich bleibend hohe Qualität der digitalen Reproduktionen bei gleichzeitig optimalen Schutz der teilweise hochempfindlichen Originale zu bieten, erfolgt die Digitalisierung mittels ausgeklügelter Workflows, in deren Mittelpunkt OS 14000 Aufsichtsscanner der neuesten Generation von Zeutschel stehen.

Zeitungstradition bewahren

Es ist eine 400 Jahre andauernde Erfolgsgeschichte, die langsam aber sicher zu Ende geht: Die Geschichte der Tageszeitung. Analog zu zweistellig wachsenden Zugriffsraten auf Nachrichten-Websites, verlieren die gedruckten Ausgaben der meisten Zeitungen in den führenden Industrieländern kontinuierlich an Auflage. Umfangreiche Zeitungsarchive mit enormer zeitgeschichtlicher Bedeutung laufen Gefahr in Vergessenheit zu geraten. Sie für die Nachwelt zu konservieren und gleichzeitig eine Brücke zu schlagen zu den neuen elektronischen Informationsmedien aber auch zu neuen Internet-geprägten Benutzergenerationen, ist eine Herausforderung, vor der viele Archive und Bibliotheken weltweit stehen.

Zeitungen haben in den Niederlanden eine lange Tradition. Bereits 1618 wurde in Amsterdam die erste niederländische Wochenzeitung herausgegeben. Das einzige noch existierende Exemplar der Erstausgabe wird in der Kungliga Biblioteket in Stockholm aufbewahrt. Spätere Ausgaben von 1628 bis 1664 befinden sich bereits in der Nationalbibliothek (KB) in Den Haag. Die Nationalbibliothek, die sich verpflichtet hat, das Kulturerbe des Landes zu bewahren, nimmt alle(!) niederländischen Publikationen in ihren Bestand auf.

Im Jahre 2007 gab das niederländische Ministerium für Bildung, Kultur und Wissenschaft, dem die Nationalbibliothek zugeordnet ist, den Startschuss für ein bis dato einmaliges Digitalisierungsprojekt für historische Zeitungen. Mehr als acht Millionen Seiten niederländischer Zeitungen von 1618 bis 1995 aus den umfangreichen historischen Beständen der Bibliothek sollen bis zum Jahr 2011 digitalisiert und über ein neu zu errichtendes Web-Portal einer interessierten Öffentlichkeit zugänglich gemacht werden.

Gewaltige Herausforderungen

Das europaweit bislang umfangreichste Projekt seiner Art macht die Nationalbibliothek zu einem Vorreiter und eröffnete den Verantwortlichen die Möglichkeit, in diesem Segment neue Richtlinien und Normen zu definieren. Die damit verbundenen Herausforderungen sind nach Angaben von Hans van Dormolen, Verantwortlicher Projektleiter bei der Königlichen Bibliothek, allerdings gewaltig: "Über die Jahrhunderte hinweg haben sich Zeitungen in ihrer Erscheinungsform kontinuierlich verändert. Das Spektrum reicht von höchst unterschiedlichen Papierformaten, Papierqualitäten, Schriftformen und Schriftgrößen bis zu unterschiedlichen Arten der Bindung von der Blattsammlung bis zu umfangreichen Bänden." Die sehr konkreten Vorstellungen der Bibliotheks-Verantwortlichen sowohl hinsichtlich technologischer Aspekte als auch in Bezug auf die projektspezifischen Organisationsstrukturen, bildeten die detaillierte Grundlage für eine europaweite Ausschreibung.

Gefordert waren hochauflösende, unkomprimierte Scans in JPEG2000-Formaten (Graustufen und Farbe) inklusive zugehöriger Metadaten, die Strukturinformationen zum Seitenaufbau enthalten. Zudem sollen die Bilder bis auf Artikelebene segmentiert werden, sodass beispielsweise Werbeanzeigen, Familienanzeigen und journalistische Beiträge separiert dargestellt werden können. Eine Anforderung, die auch eine Datenaufbereitung der gescannten Dokumente mittels automatischer Texterkennung (Optical Character Recognition, OCR) einschließt. Letztendlich sollte die gezielte Suche nach Stichworten durch das bibliotheksintern zum Einsatz kommende Suchmaschinen-Modul möglich sein.

"Zwar verfügt die Nationalbibliothek über eine eigene technische Abteilung mit umfangreicher Expertise rund um die Digitalisierung, aufgrund des Projektumfangs sahen wir uns in diesem Fall aber doch in der Rolle eines Auftraggebers, der Richtlinien vorgibt und deren Einhaltung überwacht", begründet Hans van Dormolen, Spezialist für Bildbearbeitung an der Nationalbibliothek in Den Haag, die Entscheidung, den Auftrag der Datenaufbereitung an einen kompetenten Dienstleister zu vergeben. Demgegenüber wird die Konzeption und Errichtung eines Web-Portals zur späteren Präsentation der digitalen Dokumente komplett in Eigenregie durchgeführt.

Nach intensiver Prüfung der Ausschreibungsteilnehmer erhielt im Februar 2008 der Hamburger Digitalisierungs- und Konvertierungsspezialist CCS GmbH den Zuschlag, dessen Angebot die Durchführung sämtlicher Scan-Dienstleistungen durch den niederländischen Spezialisten M&R Microimaging BV beinhaltete. "Das Paket bestehend aus der Erfahrung von CCS aus ähnlich gelagerten Projekten, dem von CCS entwickelten Workflow-Modul DocWorks, die Kompetenz von M&R und letztendlich die hohe Qualität der mit Zeutschel Scannern produzierten Probe-Scans, haben uns überzeugt", resümiert Hans van Dormolen die Entscheidungskriterien.

Buchscanner als Schlüsselkomponente

Die hohe Scan-Qualität unabhängig von Art und Zustand der zu digitalisierenden Dokumenten über den gesamten Projektzeitraum sicher zu stellen, ist ein Hauptkriterium des Anforderungskatalogs. Für diese Anforderungen eignet sich der Zeutschel OS 14000, der je nach Modell die Vorlagenformate A0, A1 und A2 unterstützt. Mit einer Auflösung von maximal 6,3 lp/mm bei 400 ppi beim A0- und 8 lp/mm beim A1-Scanner wird die originalgetreue Reproduktion historischer Vorlagen erreicht. Das patentierte LED-Beleuchtungssystem sorgt für eine optimierte Lichtfokussierung. Das Resultat ist eine hohe Scan-Geschwindigkeit sowie eine geringe Lichtbelastung ohne UV/IR-Strahlung sowohl für den Anwender als auch für die teilweise empfindlichen Dokumentenvorlagen.

Der Aufbau der notwendigen Infrastrukturen sowie die exakte Umsetzung der seitens der Königlichen Bibliothek vorgegebenen Richtlinien dauerten sechs Monate. In der Implementierungsphase wurden bei M&R fünf Zeutschel OS 14000 Aufsichtsscanner (4 x Format A1, 1 x Format A0), sowie das von CCS entwickelte Workflow-Modul DocWorks installiert. Die Software zerlegt digital elektronische Dokumente und ihre Bestandteile und schafft durchsuchbare Inhalte. Strukturelle und semantische Metadaten werden erfasst und Inhalte für ein digitales Bestandsmanagement produziert. Um den Projektvorgaben gerecht zu werden, waren umfangreiche Anpassungen notwendig.

Scanner-Kalibrierung in Perfektion

Der Einhaltung technologischer Parameter und somit der Scanner-Kalibrierung kommt im gesamten Projekt eine Schlüsselrolle zu. Denn die Projektziele sehen Scans auf konstant hohem Qualitätsniveau vor, was angesichts der enormen Dokumentenmenge hohe Ansprüche an die eingesetzte Hardware stellt.

Als erster Repräsentant einer neuen Generation von Aufsichtsscannern will der Zeutschel OS 14000 neue Qualitätsmaßstäbe bei der digitalen Erfassung gebundener Dokumente setzen. Zu diesem Zweck verfügt er über umfangreiche Kalibriermöglichkeiten. Ein automatischer Weißabgleich gehört ebenso zum Funktionsumfang wie Kalibrieroptionen für Parameter wie beispielsweise Rauschen/Schärfe, Tonwertwiedergabe oder Farbtreue.

Im Gegensatz zu Buchscannern anderer Anbieter können beim OS 14000 verschiedene Parameterkombinationen als feste "Setups" im Scanner gespeichert werden. Um Veränderungen in der Bildqualität, hervorgerufen durch mechanische, elektronische oder optische Dejustierungen im Scannerbetrieb zu verhindern, werden in regelmäßigen Abständen Prüfscans mittels Kalibriervorlagen (so genannte Targets, vergleichbar Testbildern im Fernsehen) durchgeführt und eventuelle Regulierungen per Hand vorgenommen.

Universelles Test-Target

Ein vergleichsweise aufwändiger Vorgang, der in nicht allzu ferner Zukunft deutlich vereinfacht werden soll. In fernführender Funktion für den Branchenverband FMI e.V. (Fachverband für Multimediale Informationsverarbeitung e.V.)arbeitet Zeutschel gemeinsam mit der Königlichen Bibliothek und dem Testlabor "Image Engineering" derzeit an der Entwicklung eines neuen, speziell für den Einsatz im Bibliotheksumfeld konzipierten, Universal Test Targets (UTT).

"Mit Hilfe des neuartigen Testcharts können alle relevanten Parameter mit nur einem einzigen Scan erfasst werden. Anschließend wird das Bild dann mittels einer intelligenten Analysesoftware selbstständig ausgewertet und die Qualitätssicherung somit komplett automatisiert. Ein umfassender Kalibriervorgang, der unter Umständen heute zwei bis drei Stunden dauert, wird damit auf wenige Minuten reduziert. Die Qualitätssicherung erfolgt damit 'in-line' im Produktionsvorgang und nicht mehr in einem zur Produktion parallelen Prozess", erläutert Volker Jansen, Entwicklungsleiter bei Zeutschel. Nach Jansens Angaben liegt die Spezifikation des UTT offen (http://www.universaltesttarget.com/). "UTT verfolgt den Ansatz, einen von der Community weltweit getragenen offenen Standard zur Qualitätssicherung in der Digitalisierung zu etablieren", so Jansen.

Angesicht der enormen Dokumentenmenge - bei einer wöchentlichen Frequenz von derzeit 60.000 Seiten wurden bislang 1,2 Millionen Dokumente digitalisiert - wird die Einhaltung der Qualitätskriterien analog zu der von der Königlichen Bibliothek vorgegebenen Spezifikation derzeit mindestens 1x täglich (!) durch Prüfscans kontrolliert. "Operatoren mit spezieller Ausbildung führen jeden morgen Prüfscans durch und senden die Ergebnisse an die Nationalbibliothek. Dort werden die Ergebnisse gewissenhaft überprüft. Entspricht die Qualität den hohen Standards, können wir die täglichen Scan-Prozesse starten", erläutert Louis van Erven, Geschäftsführer von M&R.

Der führende niederländische Scan-Dienstleister, der über ein hochmodernes Rechenzentrum verfügt, kann auf eine langjährige Erfahrung sowohl im Bereich der Mikroverfilmung als auch bei der Digitalisierung zurückblicken. Ein Teil des historischen Zeitungsarchivs der Königlichen Bibliothek wurde vor Jahren mikroverfilmt. Im Rahmen eines zweiten Projektschrittes sollen auch diese Bestände für die Präsentation auf dem Web-Portal digitalisiert werden. In ersten Pilotstudien wird derzeit der Zeutschel Mikrofilmscanner OM 1600 auf seine Eignung getestet.


Autor

Jürgen Neitzel

Neitzel Communications
Löwenstr. 46a
70597 Stuttgart
jneitzel@neitzel-services.de