Patentstatistische und bibliometrische Analysen sowie deren grafische Umsetzung


Abstract

1 Einleitung
2 Patentliteratur und wissenschaftliche Literatur
3 Analyse und Visualisierung wissenschaftlicher Literatur
4 Analyse und Visualisierung von Patentliteratur
5 Zusammenfassung

von Dieter Schwartz

1 Einleitung

Eine Patentschrift fungiert als standardisierte Veröffentlichungs- und Dokumentationsform für rechtlich geschütztes technologisches Wissen.1 Die herausragende Bedeutung der Patente gründet u.a. auf der Tatsache, dass im Bereich der Naturwissenschaft und Technik etwa 70% aller Veröffentlichungen ausschließlich in Form von Patenten erscheinen.2 Nicht weniger beeindruckend ist die Tatsache, dass das Deutsche Patent- und Markenamt im Jahre 2005 mehr als 60.000 Patentanmeldungen verzeichnete.3

Aufgrund ihres Aufbaus und ihrer Struktur bieten Patente insbesondere die Möglichkeit, statistische Analysen durchzuführen. Ebenso wie Zitationsanalysen im Bereich der wissenschaftlichen Literatur sind Patentzitationen ein Gradmesser für die Wirkung einer Veröffentlichung. Im vorliegenden Beitrag werden Unterschiede und Gemeinsamkeiten zwischen Patent- und Nicht-Patentliteratur4 gegenübergestellt; des weiteren werden Patentindikatoren sowie Möglichkeiten zu deren graphischen Aufbereitung vorgestellt.

2 Patentliteratur und wissenschaftliche Literatur

Während in Patenten technische Aufgabenstellungen und die daraus entwickelten Lösungen beschrieben werden, stellt wissenschaftliche Literatur i.a. das methodische Vorgehen bei der Entwicklung von Lösungswegen in der Forschung heraus. In Patenten sind Ergebnisse in standardisierter Form dokumentiert, diese werden - dem Kommunikationsprozess über wissenschaftliche Zeitschriften innerhalb der Scientific Community durchaus vergleichbar - für die öffentliche Kommunikation freigegeben.5 Eine Gegenüberstellung von Merkmalen der Patent- und Nicht-Patentliteratur ist in Abbildung 1 wiederzufinden (Vgl. Abb. 1).

Erläuterung Patentliteratur Nicht-Patentliteratur
Darstellung des ... Stands der Technik Stands der Wissenschaft
Beschreibung einer ... technischen Aufgabenstellung wissenschaftlichen Aufgabenstellung
Daraus folgt unmittelbar die ... Entwicklung einer Lösung und Darstellung des erfinderischen Prinzips Aufstellung einer Hypothese und Darstellung der Methodik
Verifikation erfolgt ... durch konkrete Ausführungsbeispiele, z.B. Messdaten, techn. Zeichnungen im Labor z.B. Versuchsdaten oder über Kommunikationsprozesse

Abbildung 1: Merkmale von Patent- und Nicht-Patentliteratur

Die Struktur eines Patentdokuments besteht im wesentlichen aus folgenden drei Teilen:

Wissenschaftliche Zeitschriftenaufsätze folgen ebenfalls einer festen Struktur. Sie besitzen die Elemente:

Neben diesen formalen und inhaltlichen Merkmalen, die die Dokumenttypen beschreiben, soll auf zwei weitere Unterschiede hingewiesen werden. Der eine betrifft den rechtlichen Rahmen, aus dem heraus die Dokumente erwachsen, der andere zielt auf die Strategie ab, die mit einer Veröffentlichung verfolgt wird.

Der Staat gewährt durch ein Patent einem Erfinder ein zeitlich begrenztes Exklusivrecht für die gewerbliche Auswertung einer technischen Erfindung. Um von diesem rechtlich geschützten Kommerzialisierungsmonopol profitieren zu können, muss der Erfinder im Gegenzug sein Wissen offen legen.6 Während durch das Patentgesetz dem Erfinder der Schutz auf seine technischen Erfindung gewährt wird, schützt das Urheberrechtsgesetz den Autor und sein Werk.

Für Unternehmen ist ein Patent eine strategische Komponente bei der ökonomischen Ausbeutung und Entwicklung von Technologie. Den damit verbundenen finanziellen Erwartungen stehen die finanziellen Aufwendungen gegenüber, die erforderlich sind, um ein Patent anzumelden.7 Aus diesem Spannungsfeld ergeben sich für Unternehmen unterschiedliche Patentierungs- bzw. Veröffentlichungsstrategien.8 Im Bereich der wissenschaftlichen Literatur provoziert eine Vielzahl an Quellen und Verteilungskanälen eine ständig ansteigende Informationsflut. Treibende Kraft hierfür ist nicht zuletzt die hohe Bedeutung, die häufig wissenschaftlichen Publikationen als Leistungsnachweis der Forschungstätigkeit beigemessen wird.9

3 Analyse und Visualisierung wissenschaftlicher Literatur

3.1 Bibliometrische Indikatoren

Mit Hilfe der Bibliometrie kann eine quantitative Untersuchung und Auswertung wissenschaftlicher Literatur erfolgen. Bibliometische Analysen geben beispielsweise Auskunft über die Wahrnehmung von Veröffentlichungen einer Forschergruppe oder eines Instituts in der Fachöffentlichkeit.10 Die Zitationsanalyse untersucht dabei die Beziehungen zwischen zitierenden und zitierten Veröffentlichungen. Es können unterschiedliche Gründe aufgelistet werden, warum im Rahmen einer wissenschaftlichen Veröffentlichung andere Quellen herangezogen werden.11

Im Rahmen bibliometrischer Analysen werden Kennzahlen ermittelt, diese werden im einfachsten Fall durch Auszählen ermittelt oder bei aufwendigeren Verfahren durch Formeln errechnet. Am Ende dieses Bearbeitungsprozesses kann dann beispielsweise ein Ranking von Publikationen bestimmter Autoren stehen oder der Wissenstransfer in unterschiedliche Technologiebereiche quantifiziert werden. Bei der Betrachtung derartiger Kennzahlen stößt man auf das Problem, die Aussagen, die über diese Indikatoren transportiert wurden, einem Außenstehenden zu vermitteln. Man kann also jene Indikatoren, die bereits über ihren quantitativen Wert aussagekräftig sind, von jenen unterscheiden, deren inhaltliche Bedeutung vorzugsweise über eine grafische Aufbereitung transportiert wird.

3.2 Bibliometrische Analyse und Visualisierung

Die Abbildung 2 zeigt ein Zitationsnetz, das auf der Grundlage von 15 Publikationen erstellt wurde. In der Abbildung sind diese Publikationen als gelbe Knoten, die in diesen Publikationen verwendeten Quellen (cited references) sind als grüne Knoten innerhalb dieses Netzes gekennzeichnet.12 Während die zitierenden und zitierten Veröffentlichungen als Knoten dargestellt werden, erscheinen die inhaltlichen Verbindungen zwischen den Veröffentlichungen (insb. Zitationen) als Kanten zwischen diesen Knoten.13

Abbildung 2: Zitationsnetz

Zentrale Publikationen können mit Hilfe einer Visualisierung leicht identifiziert werden: In dem Zitationsnetz ist ein Übersichtsartikel, der viele Quellen heranzieht, von einer Punktwolke umgeben. Publikationen, die Verbindungen zu mehreren Quellen aufweisen, rücken ins Zentrum des Netzes. Es ist leicht nachzuvollziehen, dass ein derartiges Netz weiter wächst, wenn die Anzahl der Publikationen (beispielsweise durch eine Ausdehnung des Betrachtungszeitraum oder Erweiterung der Anzahl der Autoren) ausgedehnt wird und damit die Anzahl der Knoten und Vernetzungen steigt. Dies kann dazu führen, dass solche Netze entsprechend unübersichtlich werden.

Die Software-technischen Lösungen, mit deren Hilfe derartige Netze realisiert werden, bieten eine Reihe von Hilfestellungen an. Das Netz kann beispielsweise verkleinert oder vergrößert werden, es kann als 3-D-Modell im Raum gedreht und damit von unterschiedlichen Perspektiven betrachtet werden. Über entsprechende Gewichtungsfaktoren können Entwicklungslinien (beispielsweise Hauptzitationswege) generiert oder aus einem komplexen Netzwerk Teilnetze ausgegliedert werden.

4 Analyse und Visualisierung von Patentliteratur

Bei US-amerikanischen Patenten umfasst das Titelblatt eine umfangreiche Auflistung von Patentquellen (references cited). Es wird zwischen US-amerikanischen Patenten, ausländischen Patenten und anderen Quellen unterschieden (Vgl. Abb. 3). Neben den auf der Titelseite des Patents stehenden sind im Textkörper weitere Quellen angegeben.14

United States Patent: 4,526,704
Petrzilka , et al. : July 2, 1985
Multiring liquid crystal esters
Abstract [...]
Inventors: Petrzilka; Martin (Kaiseraugst, CH), Schadt; Martin (Seltisberg, CH), Villiger; Alois (Basel, CH)
Assignee: Hoffmann-La Roche Inc. (Nutley, NJ)
[...]
Foreign Application Priority Data
Jul 28, 1982 [CH] 4581/82
[...]
Current U.S. Class: 252/299.61 [...]
Field of Search: [...]
References Cited [Referenced By]
U.S. Patent Documents
4001137   January 1977   Steinstrasser
4065489   December 1977   Steinstrasser et al.
[...]
4480117   October 1984   Takatsu et al.
Foreign Patent Documents
8956   Mar., 1980   EP
23730   Feb., 1981   EP
[...]
2092146   Aug., 1982   GB
Other References
Demus et al., Synthesis and Properties of New Liquid Crystalline Materials, Mol. Crystal Liq. Crystal, 63, 129-144 (1981).
Gray et al., Synthesis and Liquid Crystal Properties, Mol. Cryst. Liq. Cryst., 37, 189-211 (1976).
[...]
U.S. patent application Ser. No. 432,212, filed Oct. 1, 1982-Petrizilka et al..
[...]

Abbildung 3: US-Patent 4,526,704

4.1 Patentstatistische Indikatoren

Vor dem Hintergrund unternehmensspezifischer Fragestellungen werden unterschiedliche Kennzahlen gebildet. Eine patentstatistische Analyse kann beispielsweise darauf abzielen, den Innovationsgrad einer Erfindung und damit deren Marktwert zu bestimmen. Nachfolgend werden Beispiele für Aktivitäts-, Qualitäts- und Verbindungskennzahlen vorgestellt.15

Aktivitätskennzahlen basieren auf der Anzahl von Patentanmeldungen eines Unternehmens innerhalb eines gewählten Zeitraums. Diese Kennzahlen können für ein Patentbenchmarking herangezogen werden. Dabei wird die Leistungsfähigkeit der verschiedenen Unternehmen im Vergleich zur Leistungsfähigkeit des "Branchenprimus" innerhalb eines Technologiefeldes ermittelt. Über die Aktivität wird zudem der technologische Konzentrationsgrad bestimmt: Ein hoher Konzentrationsgrad kann bedeuten, dass technologischer Fortschritt nur von wenigen Unternehmen betrieben wird und damit eine hohe Barriere für den Markteintritt eines neuen Bewerbers besteht.

Von Aktivitätskennzahlen können Qualitätskennzahlen abgegrenzt werden. So kann beispielsweise die Anzahl der Entgegenhaltungen und Zitate, die eine Patentschrift in späteren Prüfverfahren auf sich vereint, als Maß für die technologische und ökonomische Qualität eines Patents aufgefasst werden. Über das Verhältnis aus der Anzahl der eingereichten Patentanmeldungen und der Anzahl der erfolgreichen Patenterteilungen eines Unternehmens kann eine weitere Qualitätskennzahl gebildet werden.

Als letzte Gruppen seien an dieser Stelle die Verbindungskennzahlen aufgeführt. Zitationen dokumentieren beispielsweise Verbindungen zwischen Patenten. In Patenten werden Quellen aufgeführt, um bereits vorangegangene Ideen und Konzepten anzuzeigen und damit den technischen Hintergrund zu dokumentieren. Ein Heranziehen von Patent- und Nicht-Patentliteratur dient dem Herausstellen der Alleinstellungsmerkmale der Erfindung und damit letztlich der Untermauerung der Patentansprüche.

Abbildung 4: Zitierende und zitierte Patente
aus unterschiedlichen Bereichen16

Die zitierten und zitierenden Patente können dabei aus unterschiedlichen technischen Disziplinen stammen. In Abbildung 4 ist dies durch unterschiedliche Spalten angedeutet, in die zitierende bzw. zitierte Patente eingeordnet sind. Ein Patent kann also auf andere Bereiche ausstrahlen oder aus unterschiedlichen Bereichen erwachsen.17 Betrachtet man den zeitlichen Abstand zwischen Cited Patent, Origination Patent und Citing Patent kommt man zur Kennzahl Aktualität. Falls in einer Patentschrift überwiegend jüngere Schriften zitiert werden, liegt die Vermutung nahe, dass diese Technologie ein rasches Wachstum erfährt.

4.2 Patentanalyse und Visualisierung

Für eine Auswertung der Aktivität können die in Patenten aufgeführten Quellen analysiert und graphisch umgesetzt werden. In Abbildung 5 wurde die Anzahl der Patentzitationen zur Anzahl der Patente in Beziehung gesetzt. Als Datenbasis wurden US-amerikanische Patente aus dem Zeitraum 1975 bis 1999 herangezogen. Es kann herausgestellt werden, dass einerseits eine hohe Anzahl von Patenten weniger als fünf Zitationen auflistet, andererseits sind zahlreiche Patente zu finden, die mehr als 40 Zitationen aufweisen.18

Abbildung 5: Patente und Patentzitationen

Dem bereits in Kapitel 3 vorgestellten Zitationsnetz für wissenschaftliche Literatur vergleichbar, kann ein entsprechendes Netz für Patente erstellt werden (Vgl. Abb. 6). Die Verbindungen zwischen den einzelnen Patenten wurden zudem gewichtet. Grundlage für die Gewichtung war dabei das gemeinsame Auftreten von Patenten bzw. Patentzitationen aus einer vordefinierten Menge: Da die US-Patente 4,526,704 (Veröffentlichungsdatum 1985) und 4,550,981 (Veröffentlichungsdatum 1985) besonders häufig zusammen auftreten, erscheint innerhalb dieses Netzes ihre Verbindung besonders stark. Außerdem sind die Patente in eine zeitliche Abfolge gebracht, indem die Patente mit einem frühen Veröffentlichungsdatum in dem Netz unten stehen und die nachfolgenden Patente darauf aufbauen. Aus dem Netz entsteht ein Zitationsbaum.19

Abbildung 6: US-Patent 4,526,704
im Zitationsnetz20

Im Rahmen einer weiteren Auswertung wurden beispielhaft US-amerikanische und deutsche Patente auf der Grundlage ihrer Patentklassen unterteilt. Vergleichsdaten aus dem Bereich der Nicht-Patentliteratur wurden entsprechend der vorhandenen Index Terms strukturiert. Die Anzahl der Patente in den jeweiligen Patentklassen wächst, so dass sich die Größe der Patentklassen im Laufe der Zeit verändert. Diese Veränderungen in der Patentklassengröße kann mit Hilfe von sogenannten Treemaps dargestellt werden. Die Größe der Patentklasse (Anzahl der Patente in der jeweiligen Patentklasse) wird durch die Größe der Rechtecke, die prozentuale Veränderung gegenüber dem vorangegangenen Betrachtungszeitraum durch die Farbe bzw. die Intensität der Farbe wieder gegeben.21

Abbildung 7: Patentliteratur und Nicht-Patentliteratur im Zeitraum 2001-2006


Abbildung 8: Patentliteratur und Nicht-Patentliteratur im Zeitraum 1971-1980

In den Abbildungen 7 und 8 sind unterschiedliche Betrachtungszeiträume ausgewertet worden. Die direkte Gegenüberstellung dieser Zeitsegmente zeigt, dass ...

Die beiden Abbildungen geben eine Bildschirmdarstellung wieder. Die Treemap-Software lässt jedoch eine Reihe von Interaktionsmöglichkeiten zu (z.B. Wahl der Farbgebung, Ausblenden von Elementen, Strukturieren der Daten).

5 Zusammenfassung

Die Gegenüberstellung von Patent- und Nicht-Patentliteratur zeigt Unterschiede, aber auch Gemeinsamkeiten auf. Ein Unterschied ergibt sich u.a. aus den Zielrichtungen, die mit einer Veröffentlichung verfolgt werden. Eine Gemeinsamkeit liegt in der Möglichkeit, bibliometrische bzw. patentstatistische Analysen (insb. Zitationsanalysen) für Patent- und Nicht-Patentliteratur durchzuführen.

Einige Patentkennzahlen sind durch ihren Zahlenwert aussagekräftig, andere Indikatoren können anschaulich in Grafiken dargestellt werden. So kann beispielsweise die Anzahl der Veröffentlichungen und deren zeitlicher Verlauf in einem Säulendiagramm erfasst werden. Im Rahmen dieses Beitrages wurden neben diesen konventionellen auch innovative Darstellungsformen vorgestellt: die Beziehung zwischen Dokumenten und die inhaltliche Stärke dieser Beziehungen kann in Form von Netzen, die Anzahl von Dokumenten in einer Klasse und das Größenverhältnis zu anderen Klassen kann über Treemaps veranschaulicht werden.

Die vorgestellten Beispiele spiegeln einen kleinen Ausschnitt der möglichen Visualisierungstechniken wieder.22 Unterschiedliche Metaphern können zur Darstellung der ermittelten Indikatoren herangezogen werden. Ein Retrievalsystem müsste also mehrere Visualisierungsformen bereitstellen, um damit den verschiedenen Anforderungen einer Aufbereitung von Recherche-Ergebnissen gerecht zu werden.


Zum Autor

Dr. Dieter Schwartz ist wissenschaftlicher Mitarbeiter an der

Fachhochschulbibliothek Münster
Bereichsbibliothek Steinfurt
Stegerwaldstr. 39
D-48565 Steinfurt
E-Mail: schwartz@fh-muenster.de


Anmerkungen

1. Mersch, Christian: Patente und Publikationen. Zur globalen Kommunikation technologischen und wissenschaftlichen Wissens.
www.uni-bielefeld.de/soz/iw/pdf/MerschDA.pdf

2. Der Inhalt von etwa 80% der Patente erscheint nie in einer anderen Informationsquelle. Vgl. Mensendieck, Detlef: Grundlagen des Gewerblichen Rechtsschutzes. Patente, Marken, Lizenzen und Spezialitäten. o. O. 1997. - Eine weitere Zahl zum Vergleich: 85-90% des gesamten veröffentlichten naturwissenschaftlich-technischen Wissens sind in Patentdokumenten enthalten. Vgl. Greif, Siegfried: Zur Erfassung von Forschungs- und Entwicklungstätigkeit durch Patente. In: Naturwissenschaften 76 (1989) S. 156-159.

3. Vgl. Jahresbericht 2005. Deutsches Patent- und Markenamt.
www.dpma.de/veroeffentlichungen/jahresbericht05/dpma_jb_2005.pdf

4. Damit sind in diesem Rahmen insbesondere wissenschaftliche Zeitschriften gemeint.

5. Das Patentgesetz regelt diesen Kommunikationsprozeß. Vgl. u.a. § 59 PatG - Einspruch gegen ein erteiltes Patent. - Während ein Patent über die Auseinandersetzung Erfinder, Patentanwalt und Patentamt erfolgt, entsteht eine wissenschaftliche Publikation über den Austausch zwischen Autor, Koautoren, Lektor und Verlag. Zur Unterscheidung zwischen öffentlichem und privatem Kommunikationsprozess innerhalb des Patentierungsprozesses vgl. Meyer, Martin: What is special about patent citations? Differences between scientific and patent citations. In: Scientometrics 49 (2000) 1, S. 93-123.

6. Das lateinische "patere" bedeutet soviel wie offenlegen oder veröffentlichen.

7. Die Anmeldekosten für ein EU-Patent belaufen sich auf rd. 11.000 Euro. Vgl. www.copat.de/mn_pat_kosten.html

8. Eine Strategie besteht darin, durch Patentanmeldungen einem Konkurrenten den Eintritt in ein bestimmtes Marktsegment zu erschweren oder sogar zu verbauen (Sperrpatent).

9. Der amerikanische Soziologe Logan Wilson brachte diesen Publikationszwang im akademischen Bereich bereits 1942 auf die bekannte Formel "publish or perish".

10. Ball, Rafael; Tunger, Dirk: Bibliometrische Analysen - Daten, Fakten und Methoden. Jülich 2005, S. 15.

11. Als Gründe werden u.a. aufgeführt: Ehrung von grundlegenden Werken, Hinweis auf ähnliche Arbeiten, Unterscheidung oder kritische Auseinandersetzung mit bestehenden Werken. Vgl.: Osareh, Farideh: Bibliometrics, Citation Analysis and Co-Citation Analysis: A Review of Literature I. In: Libri 96 (1996) S. 153.

12. Im Science Citation Index 1993-2000 sind 15 Publikationen nachgewiesen, die Ulrich Wittrock zitieren. Der gesuchte Autor wird in der Abbildung durch eine grüne Raute gekennzeichnet.

13. Die Umsetzung erfolgte mit Hilfe der Software Pajek: http://vlado.fmf.uni-lj.si/pub/networks/pajek

14. Diese "versteckten" Quellen sind schwieriger zu recherchieren (und damit auszuwerten), sie sind aber ebenso wichtig wie "examiner citations" auf dem Titelblatt.

15. Detaillierte Beschreibungen der Patentindikatoren sowie Indikatoren zur Beurteilung der rechtlichen Stärke von gewerblichen Schutzrechten findet man in: Wallaschek, Jörg u.a. : Patentanalyse und Patent-Portfolio-Werkzeuge des strategischen Patentmanagements. In: Modernes Patentbewusstsein in Hochschulen. Hrsg. Michael Asche. Münster 2004, S. 47-78.

16. Vgl. Trajtenberg, M. u.a.: University versus Corporate Patents: A Window on the Basicness of Invention. In: Patents, Citations, and Innovations. An Window on the Knowledge Economy. Hrsg. Adam B. Jaffe und Manuel Trajtenberg. Cambridge 2002, S. 58.

17. Diese Verlinkung zu anderen Technologiebereichen kann über die Indikatoren generality und orginality beschrieben werden. Vgl: Bownwyn, H. Hall u.a.: The NBER Patent-Citations Data File: Lessons, Insights, and Methodological Tools. In: Patents, Citations, and Innovations. An Window on the Knowledge Economy. Hrsg. Adam B. Jaffe und Manuel Trajtenberg. Cambridge 2002, S. 428.

18. Zwei Beispiele zur Veranschaulichung: Das US-Patent 4,526,704 aus Abbildung 3 enthält 37 Quellen, das US-Patent 5,292,834 listet 42 US-Patente sowie 11 EU- bzw. WO-Patente auf. Vgl.: www.uspto.gov

19. Zwei weitere Beispiele für US-Patente mit ihren jeweiligen Veröffentlichungsdatum 4,659,502 (1987) und 4,422,951 (1983).

20. Abbildung entnommen aus: Batagelj, Vladimir: Efficient Algorithms for Citation Network Analysis. In: Computer Science, abstract cs.DL/0309023. Figure 7, S. 20.
http://arxiv.org/abs/cs/pdf/0309/0309023

21. Die Farbe dokumentiert den prozentualen Anstieg (grün) oder prozentualen Abstieg (rot) im Vergleich zu den Vorjahreswerten. Die Umsetzung erfolgte mit Hilfe der Software Treemap: www.cs.umd.edu/hcil/treemap/ - Zum Einsatz von Treemap für Analysezwecke vgl. Kutz, Daniel O.: Examining the Evolution and Distribution of Patent Classifications. In: Proceedings of the Eighths International Conference on Information Visualisation (IV‘04). S. 983-988.

22. Schwartz, Dieter: Mehr Information durch Visualisierung von Daten? Konventionelle und innovative Visualisierungstechniken. In: B.I.T.online 2 (1999) 4, S.455-462.