SOOM - Service Orientiertes Objekt-Management

von Walter Koch

Als ein wesentlicher Trend der Informationstechnologie (IT) für 2009 und die kommenden Jahre wurde von dem IT-Marktforschungsunternehmen Gartner "Cloud Computing" genannt. Dieses Konzept "umfasst On-Demand-Infrastruktur (Rechner, Speicher, Netze) und On-Demand-Software (Betriebssysteme, Anwendungen, Middleware, Management- und Entwicklungs-Tools), die jeweils dynamisch an die Erfordernisse von Geschäftsprozessen angepasst werden. Dazu gehört auch die Fähigkeit, komplette Prozesse zu betreiben und zu managen."1 Damit werden verschiedene Konzepte und Entwicklungen der letzten Jahre wie GRID-Computing2 oder Service- und Ressource Orientierte Architekturen (SOA3/ROA4) zusammengeführt, eine Entwicklung die auch an Dokumentations- und Informationseinrichtungen in verschiedenen Bereichen nicht spurlos vorübergehen wird. Wesentlich für Cloud Computing ist neben der Bereitstellung und Wiederverwendung von Ressourcen (bspw. Speicherplatz und Rechenzeit) auch die Orientierung an Geschäftsprozessen, vor allem jenen die zur Wertschöpfung eines Unternehmen beitragen5. Im SOOM-Projekt wird ein Referenzmodell für Design und Implementierung von Informationssystemen entwickelt, das technologische und methodische Aspekte der Systementwicklung berücksichtigt. So werden Funktionalitäten über WebServices6 definiert, Prozesse in einer Notation beschrieben, die Umsetzungen ohne erheblichen Entwicklungsaufwand ermöglicht, Architekturkonzepte ohne umfangreiche Middleware7 untersucht, Vorgehensmodelle erarbeitet, die sich an industriellen Beispielen orientieren, sowie Migrationskonzepte entwickelt, die eine Ablöse veralteter Softwareprodukte erleichtern. Basistechnologie für alle Datenhaltungs- und Abfrageprozesse ist XML8; der Einsatz von Open Source9 Produkten steht im Vordergrund. Das SOOM-Projekt will die Entwicklung von Informationssystemen von IT-Experten weitgehend unabhängig machen und dem Bereichsexperten wieder mehr Gestaltungsfreiraum bei der Realisierung einer Geschäftsidee verschaffen.

Der Vormarsch des Internets hat in den letzten Jahren dazu geführt, dass Datenleitungen über immer höhere Übertragungsraten verfügen, "Computerarbeit" dezentralisiert wird und die Kommunikation zwischen Computern und auch den sie bedienenden Menschen intensiviert wird. Damit wird es möglich, immer größere Datenmengen über Leitungen zwischen immer leistungsfähigeren Computern auszutauschen und sie dort verarbeiten zu lassen wo das noch benötigte Personal die geringsten Lohnkosten verursacht. Um die Möglichkeiten der Informationstechnologie effizient nutzen zu können, ist es notwendig die Geschäftsprozesse genau zu analysieren, Standards für die Austauschbarkeit von Daten und die Interoperabilität von Systemen betreffend zu verwenden, die Rollen einzelner Akteure (Menschen und Maschinen) genau zu definieren und die erforderlichen Software und Hardwareausstattungen der benötigten Geräte leistungsgerecht zu dimensionieren. Dies führt heute oft zu einer Aufteilung von Computer- und Arbeitsleistungen auf verteilte Arbeitsplätze und EDV-Infrastrukturen. Ein aktuelles Beispiel soll dies zeigen: Ein Naturkundemuseum in Spanien möchte ein Buch (erschienen im 19. Jahrhundert) der Forschergemeinschaft über das Internet zugänglich machen, hat es dazu digitalisiert und mit einem Bibliotheksprogramm die bibliographischen Meta-Daten erfasst. Die Daten werden in Österreich zur Weiterverarbeitung aufbereitet (die gescannten Seiten wurden über einen ftp-Server erhalten, die Metadaten - im IberoMARC Format - über eine Z39.50-Schnittstelle). Über eine von Amazon10 entwickelte Schnittstelle wurden die Daten in die USA transferiert und im Internet Archive11 verarbeitet (Erzeugung von verschiedenen Dateien, um das Buch digital lesbar und über Retrieval-Systeme wiederauffindbar zu machen). Die OCR verarbeiteten Daten wurden dann in Österreich verwendet um Deskriptoren mithilfe eines "biologischen" webServices (taxonFinder von uBio12), in diesem Fall Taxa13 aus dem Voll-Text zu extrahieren. Abschließend wurden die Metadaten in eine fachspezifische Aggregationsplattform in den USA14 übernommen. Die Speicherung der nun im Internet Archive und im System der Biodiversity Heritage Library vorhandenen Daten in einem digitalen Europäischen Zugangsportal und die Abfragemöglichkeit über ein europäisches multilinguales Portal sind Gegenstand eines EU-Projektes15. Allein dieser heute nicht mehr unübliche arbeitsteilige Vorgang im Umfeld der Digitalen Bibliothek erfordert eine Analyse des gesamten Arbeitsablaufes sowie der Abläufe an den einzelnen involvierten Stellen.

Mithilfe eines in den letzten Jahren entwickelten Standards zur Prozessmodellierung, BPMN - Business Process Modelling Notation16 wurden im Rahmen des SOOM-Projektes die im SPECTRUM-Standard17 dargelegten Prozesse, die in Museen vorkommen, modelliert und können über das Internet abgerufen werden18. Diese Prozesse bilden ein Referenzmodell für die Entwicklung von Sammlungsverwaltungssystemen, und da der eingesetzte BPMN-Designer einen ablauffähigen Programmcode (BPEL: Business Process Execution Language19) erzeugt, kann aus den Modellen ein Programm erzeugt werden, das den Workflow steuert und die Kommunikation zwischen den einzelnen Akteuren regelt. Eine Modellierung von Prozessen im Bibliotheksbereich wurde im OLE-Projekt20 (Open Library Environment) vorgenommen. Der Zusammenhang zwischen Geschäftsprozessen und den Softwarekomponenten, die diese Prozesse unterstützen (WebServices, siehe Anmerkung 7) ist in der untenstehenden Abbildung 1 dargestellt.

Abbildung 1

Hier werden Geschäftsprozesse in Prozessketten zerlegt, deren Teilprozesse durch WebServices realisiert werden. Man unterscheidet dabei zwischen grobkörnigen und feinkörnigen Services. Feinkörnige Services können einfache Funktionen eines Datenverwaltungssystems sein, wie zum Beispiel das Neuanlegen, Wiederauffinden, Erneuern und Löschen von Datensätzen. Ein grobkörniges Service könnte die Abfrage eines Thesaurus und die Rückgabe von relevanten Begriffen zu einer Anfrage sein. Im Rahmen von SOOM wurden auch ein WebService und eine Schnittstelle (API) zur Einbindung von Vokabularien in die Dokumentations- und Abfragetätigkeit erarbeitet. Die Definition dieser Schnittstelle und die Funktionalität - beschrieben in WSDL (Web Service Description Language21) - ist im Internet verfügbar22. Als Modellfall wurde der Ortsnamen-Thesaurus23 der Getty Stiftung in den USA als WebService realisiert. Das in der nächsten Abbildung 2 angeführte Beispiel zeigt eine Anfrage (Flussnamen ausschließlich steirischer Flüsse) in Textform und das Ergebnis als Baum dargestellt.

Abbildung 2

Der Anwendungsfall: Die Thesaurusentwicklung und -abfrage wurde im SOOM-Projekt weiter elaboriert und kann auf der Projekt-WebSeite nachgelesen werden24 (SOOM-Vocabulary Server). Hier wurde auch ein Verrechnungsmodell ("epoints") auf "Pay per View" Basis entwickelt.

Abbildung 3

Der Workflow zu thesaurusrelevanten Tätigkeiten ist ausschnittweise weiter unten angeführt. Man erkennt drei verschiedene Gruppen von Akteuren deren Prozesse in der BPMN Schreibweise in "Pools" zusammengefasst werden. Ein Pool enthält die Betreiber des Thesaurus Systems (vocserv.org) ein weiterer jene Prozesse die ausschließlich von der IT-Infrastruktur (Software, Hardware, Netzwerk) durchgeführt werden. Dieser Prozess wird noch in zwei "Schwimmbahnen" (swim lanes) zerlegt: eine enthält die Prozesse die in einer kooperativen Arbeits- und Kommunikationsumgebung (Groupware) ablaufen, die andere jene Facilitäten die zum Betrieb des Thesaurusservers (Aufbau, Änderung und Abfrage von Vokabularien) benötigt werden. Der letzte Pool ist den Anwendern zugeordnet die wiederum unterteilt werden in einen "Standardanwender" (kann auch ein Programm sein) und einen Bereichsexperten, der zur Betreuung von Vokabularien bei Bedarf hinzugezogen wird. In diesem Fragment eines Arbeitsablaufdiagrammes sieht man den Aufruf eines WebServices aus einem Sammlungsverwaltungsprogramms und nach der Abarbeitung durch den Server (der Prozess wurde in dem Beispiel nicht modelliert) die Rückgabe eines Anfragergebnisses an das aufrufende Programm.

Eine Weiterentwicklung des bereits fertiggestellten Dienstes (erprobt mit verschiedenen Thesauren wie IconClass25, Hessischer Systematik26, etc) stellt die Erweiterung durch den Einsatz von XTM-TopicMaps27 als Navigationsinstrument dar. Das nachfolgende Beispiel (Abbildung 4) modelliert einen Sachverhalt aus dem Bereich der erneuerbaren Energie (aus: "RESEARCH PROJECTS IN RENEWABLE ENERGY FOR HIGH SCHOOL STUDENTS"28). Weiter Beispiele finden sich auf der Demonstrationsseite des EU-Projektes REGNET (Cultural Heritage in Regional Networks29).

Diese Darstellungs- und Modellierungsmethode wurde bereits zu Anfang des 21. Jahrhunderts entwickelt und als ISO-Standard eingeführt, gewinnt aber mit der Entwicklung des "Semantischen Netzes"30 als eine semantische Technologie an Bedeutung. XTM-TopicMaps unterscheidet einen "Navigationsraum" (semantisches Netz) von einem "Informationsraum". Das semantische Netz besteht aus der Verbindung von Konzepten (Sachverhalten, "Topics") durch Relationen ("Assoziationen") oder im speziellen eine Klassenbeziehung. Im Informationsraum befinden sich die Informationsobjekte ("Occurrences") die verschiedene Ausprägungen haben können: Texte, Medienobjekte, aber auch Prozesse. Im Beispiel wäre ein "Einstiegspunkt" ein Text zu einem Windgenerator über den man zur Windenergie als eine Alternativenergie kommt, usw.

Aus den bisherigen Beispielen erkennt man, dass ein prozessorientiertes Vorgehen bei der Entwicklung von Informationssystemen von Bedeutung ist. Die Definition und Beschreibung von Prozessen und der Arbeitsablauf wird im SOOM-Projekt anhand des Anwendungsbereiches "Kulturelles Erbe" gezeigt. Darüberhinaus beschäftigt sich SOOM intensiv mit der einzusetzenden Informationstechnologie und Computertechnik. Es werden Alternativkonzepte untersucht die auf XML-Technologien basieren, wie XFORMS31 bei der Datenerfassung, oder auf dem Einsatz von reinen (nativen) XML-Datenbanken. Als Beispiel kann ein "MODS32-Editor der Brown University Library33 genannt werden.

Abbildung 4

Im technischen Bereich untersucht SOOM den potentiellen Einsatz der Cloud Technologie beim Betrieb von Informationssystemen. Dabei wird sowohl Hardware als auch Software (SaaS Software as a Service34) von einem Servicezentrum angeboten. Der Nutzer dieses Zentrums bedient sich dabei einer verlässlichen und leistungsfähigen Infrastruktur, bezahlt genau das was er oder sie verbraucht und erspart sich in dieser "technologisch" schnelllebigen Zeit teure Investitionen. Das eingangs erwähnte Internet Archive35 stellt Speicher im Peta-Byte Bereich zur Verfügung und bietet rund 70 leistungsfähige Computer für verschiedene Dienstleistungen an.

Diese Entwicklungen bedingen auch ein Umdenken bei der Fertigung, Wartung und Weiterentwicklung von Systemen. Im Rahmen von SOOM wurde die "agile" Entwicklungsmethode SCRUM36 erprobt, die in den 1980er-Jahren in der japanischen Automobilindustrie entwickelt worden ist. Damit wird SOOM auch Hinweise zur Arbeitsmethodik und zur Vorgehensweise bei Entwicklungsprojekten liefern.


Autor

Ao.Univ.Prof. Dr. Walter Koch

Steinbeis Transferzentrum IMCHI
Informationsmanagement und Kulturerbe-Informatik
Klosterwiesgasse 22
A-8010 Graz
office@imchi.org


Anmerkungen

1. . URL: http://de.wikipedia.org/wiki/Cloud_Computing
(2009-07-13)

2. URL: http://de.wikipedia.org/wiki/Grid-Computing
(2009-07-13)

3. URL: http://de.wikipedia.org/wiki/Serviceorientierte_Architektur
(2009-07-13)

4. URL: http://en.wikipedia.org/wiki/Resource_oriented_architecture
(2009-07-13)

5. URL: http://en.wikipedia.org/wiki/Value_chain
(2009-07-13)

6. URL: http://en.wikipedia.org/wiki/Webservice
(2009-07-13)

7. URL: http://en.wikipedia.org/wiki/Middleware
(2009-07-13)

8. URL: http://en.wikipedia.org/wiki/XML
(2009-07-13)

9. URL: http://en.wikipedia.org/wiki/Opensource
(2009-07-13)

10. URL: http://aws.amazon.com/s3/ (2009-08-07)

11. URL: http://www.archive.org/index.php
(2009-08-07)

12. URL: http://www.ubio.org/index.php?pagename=xml_services
(2009-08-07)

13. URL: http://de.wikipedia.org/wiki/Taxon
(2009-08-07)

14. URL: http://www.biodiversitylibrary.org/
(2009-08-07)

15. URL: http://www.bhl-europe.eu/
(2009-08-07)

16. URL: http://www.bpmn.org/
(2009-08-07)

17. URL: http://www.collectionstrust.org.uk/spectrum
(2009-08-07)

18. URL: http://dev.ait.co.at/spectrum-bpmn/
(2009-08-07); Passwort erforderlich.

19. URL: http://de.wikipedia.org/wiki/WS-Business_Process_Execution_Language
(2009-08-07)

20. URL: http://oleproject.org/
(2009-08-07)

21. URL: http://de.wikipedia.org/wiki/Web_Services_Description_Language
(2009-08-07)

22. URL: http://demo.ait.co.at/thesaurus/
(2009-08-07)

23. URL: http://www.getty.edu/research/conducting_research/vocabularies/tgn/
(2009-08-07)

24. URL: http://scrum.ait.co.at/projects/soom/wiki/Vocabulary-Issues
(2009-08-07)

25. URL: http://www.iconclass.nl/
(2009-08-07)

26. URL: http://museum.zib.de/museumsvokabular/index.php?main=download&ls=9&co=we&ln=de

(2009-08-07)

27. URL: http://en.wikipedia.org/wiki/Topic_Maps
(2009-08-07)

28. URL: http://www.nrel.gov/
(2009-08-07)

29. URL: http://www.regnet.org/demonstrationarea.html
(2009-08-07)

30. URL: http://de.wikipedia.org/wiki/Semantisches_Netz
(2009-08-07)

31. URL: http://de.wikipedia.org/wiki/XForms
(2009-08-07)

32. URL: http://www.loc.gov/standards/mods/
(2009-08-07)

33. URL: http://dl.lib.brown.edu/its/software/metadata/
(2009-08-07)

34. URL: http://de.wikipedia.org/wiki/Software_as_a_Service
(2009-08-07)

35. URL: http://www.sun.com/customers/servers/internetarchive.xml
(2009-08-07)

36. URL: http://de.wikipedia.org/wiki/Scrum
(2009-08-07)