29. Mai 2024
  WEITERE NEWS
Aktuelles aus
L
ibrary
Essentials

In der Ausgabe 3/2024 (Mai-Juni 2024) lesen Sie u.a.:

  • KI verursacht immer mehr Besorgnis bei Kreativen, Arbeit­nehmern – und Hochschulen
  • Audio-Nutzung in Deutschland: Weniger Radio, mehr Podcasts, mehr Streaming – Bibliotheken noch zurückhaltend
  • Neue wissenschaftliche Zeitschriften: Ein internationaler Überblick
  • Künstliche Intelligenz: Wie sie die Arbeits­märkte revolutioniert und wer davon profitiert
  • Übersicht der europäischen institutionellen Verlagslandschaft: Einblicke aus der DIAMAS-Umfrage
  • Google Scholar unter der Lupe: Eine Analyse der Anfälligkeit für Manipulationen
  • Welche Vorteile haben digitale Ausstellungen von wissenschaftlichen Bibliotheken?
  • Generation Z entdeckt die Liebe zum physischen Buch: Lesen ist sexy
u.v.m.
  fachbuchjournal
Ausgabe 6 / 2023

BIOGRAFIEN
Vergessene Frauen werden sichtbar

FOTOGRAFIE
„In Lothars Bücherwelt walten magische Kräfte.“
Glamour Collection, Lothar Schirmer, Katalog einer Sammlung

WISSENSCHAFTSGESCHICHTE
Hingabe an die Sache des Wissens

MUSIK
Klaus Pringsheim aus Tokyo
Ein Wanderer zwischen den Welten

MAKE METAL SMALL AGAIN
20 Jahre Malmzeit

ASTRONOMIE
Sonne, Mond, Sterne

LANDESKUNDE
Vietnam – der aufsteigende Drache

MEDIZIN | FOTOGRAFIE
„Und ja, mein einziger Bezugspunkt
bin ich jetzt selbst“

RECHT
Stiftungsrecht und Steuerrecht I Verfassungsrecht I Medizinrecht I Strafprozessrecht

uvm

ZBW-Studie zeigt: KI-Sprachmodell DistilBERT führend
im automatischen Gewinnen von Schlagworten

Einsatz von KI in der Fachterminologie: Die ZBW untersucht automatisierte Methoden
zur Aktualisierung des Standard-Thesaurus Wirtschaft

Die ZBW – Leibniz-Informationszentrum Wirtschaft erforscht die Aktualisierung ihres Fachvokabulars durch den Einsatz von KI-gestützten Methoden. Eine aktuelle Studie zeigt, dass das vortrainierte BERT-Sprachmodell DistilBERT in der automatisierten Schlagwort-Extraktion besonders effektiv ist und die Möglichkeit bietet, den Standard-Thesaurus Wirtschaft (STW) unterstützt durch KI-Methoden zu aktualisieren.

Wissenschaftliche Bibliotheken verschlagworten ihre Literatur anhand genormter Wörterbücher, sogenannter Thesauri. Die zeitnahe und umfassende Aktualisierung derartiger spezialisierter Thesauri, stellt eine besondere Herausforderung dar – vor allem in sich thematisch schnell weiterentwickelnden Fachdisziplinen wie den Wirtschaftswissenschaften.

Die ZBW – Leibniz-Informationszentrum Wirtschaft, weltweit bekannt für ihren umfangreichen Standard-Thesaurus Wirtschaft (STW) mit 6.000 Schlagwörtern und über 20.000 alternativen Sucheinstiegen in Deutsch und Englisch, erforscht nun den Einsatz von KI-Technologien, um Schlagworte automatisch aus wissenschaftlichen Publikationen zu gewinnen und so Thesaurus zu aktualisieren.

Unter der Leitung von Dr. Ralf Krestel, Professor für Information Retrieval und Profiling, hat ein Forschungsteam der ZBW eine Methode entwickelt und getestet, die wichtige Fachbegriffe automatisch aus wissenschaftlichen Artikeln extrahiert, insbesondere aus Titeln und Abstracts. Das Team setzte vortrainierte BERT-Sprachmodelle ein und verglich deren Leistungsfähigkeit mit konventionellen Methoden wie TFIDF, TextRank und KeyBERT.

Die aktuelle Studie zeigt, dass das BERT-Modell DistilBERT insgesamt am effektivsten in der Schlagwort-Extraktion ist. Es konnte nicht nur präzise spezifische Schlüsselwörter aus den Wirtschaftswissenschaften identifizieren, sondern auch mehr potenzielle neue Begriffe für den Standard-Thesaurus Wirtschaft vorschlagen als konkurrierende Methoden.

Die Datengrundlage bildete ein Datensatz der ZBW, der der Datenbank ECONIS entstammt. Es wurden Titel, Abstracts und ausgewählte Metadaten, aber keine Volltexte, aus wissenschaftlichen Publikationen extrahiert. Die Metadaten umfassen Erscheinungsjahr und Sprache der Werke. Zudem wurden vorhandene Schlagwörter verschiedener Art hinzugefügt. So zum Beispiel Stichwörter, die von den Autor:innen frei gewählt wurden, als auch vorhandene normierte Schlagwörter. Die Analyse beschränkte sich auf Publikationen zwischen 2009 und 2021 und resultierte in einem Datensatz von 575.000 Einträgen.

Der Standard-Thesaurus Wirtschaft stellt das umfangreichste zweisprachige Fachvokabular für die Erfassung und Suche wirtschaftswissenschaftlicher Themen dar und bietet eine weitreichende Abdeckung nicht nur von wirtschaftlichen, sondern auch angrenzenden Fachgebieten. Verschiedenste Organisationen, wissenschaftliche Bibliotheken und Forschungsinstitute, darunter beispielsweise das Deutsche Institut für Wirtschaftsforschung, setzen den Standard-Thesaurus Wirtschaft für ihre thematische Erschließung und spezialisierte Recherche ein. Verantwortlich für die Pflege und Aktualisierung dieses wertvollen Ressourcenpools ist die ZBW – Leibniz-Informationszentrum Wirtschaft, das über den weltweit größten Bestand an wirtschaftswissenschaftlicher Literatur verfügt.

Weitere Informationen

Die vollständige Studie, „Domain-Specific Keyword Extraction using BERT“ von Jill Sammet und Ralf Krestel, ist im Workshop TermTrends, bei der LDK 2023, veröffentlicht worden und online verfügbar.

www.zbw.eu