7. Dezember 2024
  WEITERE NEWS
Aktuelles aus
L
ibrary
Essentials

In der Ausgabe 8/2024 (November 2024) lesen Sie u.a.:

  • Bibliotheken als Brückenbauer: Informations­kompe­tenz in Zeiten des Klimawandels
  • Barrierefreiheit wissenschaftlicher PDF-Dokumente: Eine umfassende Studie legt teilweise gravierende Mängel offen
  • Wikipedia als Quelle für die Wissenschaft?
  • Neuer Bericht untersucht Auffindbarkeit von Open-Access-Publikationen in Bibliotheken
  • OpenCitations Index: Fundament für
    die Bibliometrie von morgen
  • Können KI-Assistenten Bibliothekare ersetzen? Neue Studie testet
    Sprachmodelle im Auskunftsdienst
  • Wie transparent sind KI-gestützte wissenschaftliche Suchsysteme wirklich?
  • Lokale KI-Modelle gewinnen in der Forschung an Bedeutung
  • Jahresberichte und Social Media:
    Ungenutzte Strategien für bessere
    Kommunikation in Bibliotheken
  • LibraryTok: Wie Bibliothekare TikTok erobern und eine neue Generation inspirieren
  • Innovationen in Bibliotheken:
    Mehr als nur Bücherregale
  • Forscher warnen vor vereinfachter Kategorisierung von Diamond Open Access
u.v.m.
  fachbuchjournal
Ausgabe 6 / 2023

BIOGRAFIEN
Vergessene Frauen werden sichtbar

FOTOGRAFIE
„In Lothars Bücherwelt walten magische Kräfte.“
Glamour Collection, Lothar Schirmer, Katalog einer Sammlung

WISSENSCHAFTSGESCHICHTE
Hingabe an die Sache des Wissens

MUSIK
Klaus Pringsheim aus Tokyo
Ein Wanderer zwischen den Welten

MAKE METAL SMALL AGAIN
20 Jahre Malmzeit

ASTRONOMIE
Sonne, Mond, Sterne

LANDESKUNDE
Vietnam – der aufsteigende Drache

MEDIZIN | FOTOGRAFIE
„Und ja, mein einziger Bezugspunkt
bin ich jetzt selbst“

RECHT
Stiftungsrecht und Steuerrecht I Verfassungsrecht I Medizinrecht I Strafprozessrecht

uvm

Künstliche Intelligenz für den Datenjournalismus

TH Köln und Science Media Center Germany entwickeln Lösung für die Informationsextraktion

Datenjournalisten sammeln und analysieren öffentlich zugängliche Daten und bereiten die darin verborgenen Informationen für ihre Medien auf. Dafür müssen sie häufig mit Daten arbeiten, die nur in unstrukturierter Form vorliegen. Dies macht eine automatisierte Auswertung schwierig. Im Forschungsprojekt „Journalistic Information Extraction“ (JoIE) möchten die TH Köln und das Science Media Center Germany daher ein Tool entwickeln, das mit solchen Datenquellen umgehen und diese journalistisch nutzbar machen kann.

„Die Daten, in denen Journalisten nach Informationen suchen, können ungemein vielfältig sein: Es handelt sich um Texte, Tabellen oder Grafiken, Dokumente unterschiedlichen Typs wie Word, PDF oder E-Mail oder um Webseiten, die zudem noch höchst unterschiedlich formatiert sein können. All das macht es sehr schwierig, zuverlässige und konsistente Regeln zu definieren, nach denen eine automatisierte Auswertung erfolgen könnte“, erläutert Prof. Dr. Philipp Schaer vom Institut für Informationswissenschaft der TH Köln die Problemstellung.

Auf Grundlage der beiden Open-Source-Werkzeuge Workbench und Fonduer soll eine Lösung entstehen, die unstrukturierte Daten in eine strukturierte und damit auswertbare Form bringt. Workbench erlaubt unter anderem die Extraktion von Webdaten. Fonduer verwendet künstliche Intelligenz, um automatisch Extraktionsmuster zum Beispiel zur Erkennung von Tabellen zu lernen.

„Kernidee unseres Projektes ist die Synthese der Nutzerfreundlichkeit von Workbench mit der hervorragenden Extraktionsleistung von Fonduer. Dabei geht es auch darum, komplexe Eingabehilfen zu entwickeln, mit denen Regeln für die Datenbearbeitung ohne Programmierkenntnisse erstellt und entwickelt werden können“, sagt Björn Engelmann, der im Rahmen von JoIE seine Doktorarbeit verfassen wird.

Um die spezifischen Anforderungen von Redaktionen und Datenjournalisten zu erfahren, sind Experteninterviews und gegebenenfalls Umfragen geplant. „Mit unserem Tool möchten wir den State of the Art der Datenverarbeitung für Redakteurinnen und Redakteure verfügbar machen, damit sie Informationen aus der Wildnis des Internets schnell und zuverlässig beschaffen können. Da diese oftmals mit begrenzten Ressourcen arbeiten müssen, wird unsere Lösung kostenlos und als Open-Source-Software verfügbar sein“, sagt Dr. Meik Bittkowski, Leiter Forschung und Entwicklung beim Science Media Center Germany.

Das Forschungsprojekt „Journalistic Information Extraction“ (JoIE) wird über drei Jahre von der Klaus Tschira Stiftung gGmbH gefördert. In dieser Zeit soll das Grundgerüst der Anwendung entstehen. Die Überführung in ein für Externe nutzbares System ist für eine optionale Projektverlängerung von zwölf Monaten angedacht.

www.th-koeln.de