Fobbe, Sean
2023-04-03
<p> </p>
<p><strong>Überblick</strong></p>
<p>Das <strong>Corpus der Entscheidungen des Bundespatentgerichts (CE-BPatG)</strong> ist der bislang größte, frei verfügbare Datensatz von Entscheidungen des Bundespatentgerichts. Er ist eine Zusammenstellung aller Entscheidungen die in der <a href="https://www.bundespatentgericht.de/">amtlichen Datenbank des Bundespatentgerichts</a> am jeweiligen Stichtag veröffentlicht waren.</p>
<p><em>Bitte beachten Sie das beiliegende Codebook!</em> Es enthält wichtige Informationen zur korrekten Nutzung des Datensatzes. Es hilft auch bei der Entscheidung, welche Variante für Sie am besten geeignet ist. In der Regel empfehle ich für quantitative Forschung die CSV-Dateien und für traditionelle Forschung die PDF-Sammlung.</p>
<p>Für Praktiker:innen stelle ich zusätzlich nach Senat sortierte PDF-Sammlungen aller <em>Leitsatzentscheidungen</em> zur Verfügung.</p>
<p> </p>
<p><strong>Aktualisierung</strong></p>
<p>Dieser Datensatz wird <em>1-2 mal im Jahr</em> aktualisiert. Benachrichtigungen über neue und aktualisierte Datensätze veröffentliche ich immer zeitnah auf Mastodon unter <a href="https://fediscience.org/@seanfobbe">@seanfobbe@fediscience.org</a></p>
<p> </p>
<p><strong>NEU in Version 2023-04-02</strong></p>
<ul>
<li>Vollständige Aktualisierung der Daten</li>
<li>Gesamte Laufzeitumgebung mit Docker versionskontrolliert</li>
<li>Aktenzeichen aus dem Eingangszeitraum 2000 bis 2009 nun korrekt mit führender Null formatiert (z.B. 1 BvR 44/02 statt 1 BvR 44/2)</li>
<li>Vereinfachung der Konfigurationsdatei</li>
<li>Run- und Delete-Skripte aktualisiert</li>
<li>Neue Funktion für automatischen clean run (Löschung aller Zwischenergebnisse)</li>
<li>Neuorganisation des Repositories</li>
<li>Inhalt des ZIP-Archivs mit dem Source Code orientiert sich nun an der Versionskontrolle mit Git und enthält auch die gesamte Git-Historie</li>
<li>Proto-Package Mono-Repo entfernt, alle Funktionen nun fest projektbasiert versionskontrolliert</li>
<li>Update der Download-Funktion</li>
<li>Überflüssige Warnung in f.future_lingsummarize-Funktion entfernt</li>
<li>Zusätzliche Unit-Tests</li>
<li>Alle Roh-Dateien werden nun im Ordner "files/" gespeichert</li>
<li>Verbesserung des Robustness Check Reports</li>
<li>Verbesserung des Codebooks</li>
<li>Alle Diagramme neu nummeriert</li>
<li>Verbesserte Formatierung von Profiling, Warnungen und Fehlermeldungen im Compilation Report</li>
<li>README im Hinblick auf Docker überarbeitet</li>
<li>Alle Zwischenergebnisse der Pipeline werden automatisch im Ordner "output/" archiviert</li>
<li>Umfang der Datenbankabfrage ist nun vollständig automatisiert</li>
<li>Zwischenergebnisse werden im qs-Format gespeichert um Speicherplatz zu sparen</li>
</ul>
<p> </p>
<p><strong>Features</strong></p>
<ul>
<li>Insgesamt bis zu 31 Variablen in der CSV-Variante</li>
<li>Fortlaufende Aktualisierung</li>
<li>Urheberrechtsfreiheit</li>
<li>Offene und plattformunabhängige Formate (PDF, TXT, CSV)</li>
<li>Linguistische Kennzahlen</li>
<li>Umfangreiches Codebook</li>
<li><a href="https://zenodo.org/record/7767296/files/CE-BPatG_2023-04-02_CompilationReport.pdf?download=1">Compilation Report</a> um den Erstellungs-Prozess zu erläutern</li>
<li>Dutzende Diagramme und Tabellen für alle Zwecke (im ZIP-Archiv 'Analyse')</li>
<li>Jedes Diagramm liegt in einem für den Druck (PDF) und das Web (PNG) optimierten Format vor. Tabellen sind im CSV-Format bereitgestellt und sind damit sowohl für Menschen als auch für Maschinen gut lesbar</li>
<li>Kryptographische Signaturen</li>
<li><a href="https://doi.org/10.5281/zenodo.7767296">Veröffentlichung des Source Codes</a></li>
</ul>
<p> </p>
<p><strong>Eckdaten</strong></p>
<p><em>Stichtag:</em> 2. April 2023</p>
<p><em>Inhaltlicher Umfang</em>: 30.299 Entscheidungen</p>
<p><em>Zeitlicher Umfang:</em> 2000 bis 2023</p>
<p><em>Formate:</em><strong> </strong>PDF, TXT und CSV</p>
<p> </p>
<p><strong>Source Code und Compilation Report</strong></p>
<p>Der gesamte Erstellungs-Prozess ist ab Version 2022-07-12 vollautomatisiert und detailliert dokumentiert. Mit jeder Kompilierung des vollständigen Datensatzes wird auch ein <a href="https://zenodo.org/record/7767296/files/CE-BPatG_2023-04-02_CompilationReport.pdf?download=1">umfangreicher Compilation Report</a> in einem attraktiv designten PDF-Format erstellt (ähnlich dem Codebook). Zudem werden Robustness Checks auf Vollständigkeit und Plausibilität durchgeführt und in einem separaten Bericht dokumentiert.</p>
<p>Der Compilation Report enthält den Source Code für die Daten-Pipeline, dokumentiert relevante Rechenergebnisse, gibt sekundengenaue Zeitstempel an und ist mit einem klickbaren Inhaltsverzeichnis versehen. Wenn Sie sich für Details des Erstellungs-Prozesses interessieren, lesen Sie diesen bitte zuerst.</p>
<p>Der vollständige <em>Source Code,</em> der <em>Compilation Report</em> und die <em>Robustness Checks</em> sind <em>öffentlich einsehbar und dauerhaft erreichbar</em> im wissenschaftlichen Archiv des CERN unter diesem Link hinterlegt: <a href="https://doi.org/10.5281/zenodo.7767296">https://doi.org/10.5281/zenodo.7767296</a></p>
<p> </p>
<p><strong>Kryptographische Signaturen</strong></p>
<p>Die Integrität und Echtheit der einzelnen Archive des Datensatzes sind durch eine <em>Zwei-Phasen-Signatur</em> sichergestellt.</p>
<p>In <em>Phase I</em> werden während der Kompilierung für jedes ZIP-Archiv, das Codebook und die Robustness Checks Hash-Werte in zwei verschiedenen Verfahren (SHA2-256 und SHA3-512) berechnet und in einer CSV-Datei dokumentiert.</p>
<p>In <em>Phase II</em> werden diese CSV-Datei und der Compilation Report mit meinem persönlichen geheimen GPG-Schlüssel signiert. Dieses Verfahren stellt sicher, dass die Kompilierung von jedermann durchgeführt werden kann, insbesondere im Rahmen von Replikationen, die persönliche Gewähr für Ergebnisse aber dennoch vorhanden ist.</p>
<p>Die während der Kompilierung des Datensatzes erstellte CSV-Datei mit den Hash-Prüfsummen ist mit meiner <em>persönlichen GPG-Signatur</em> versehen. Der mit dieser Version korrespondierende Public Key ist sowohl mit dem Datensatz als auch mit dem Source Code hinterlegt. Er hat folgende Kenndaten:</p>
<p><em>Name:</em> Sean Fobbe (fobbe-data@posteo.de)</p>
<p><em>Fingerabdruck:</em> FE6F B888 F0E5 656C 1D25 3B9A 50C4 1384 F44A 4E42</p>
<p> </p>
<p><strong>Kein Urheberrecht: Public Domain</strong></p>
<p>An den Entscheidungstexten und amtlichen Leitsätzen besteht gem. § 5 Abs. 1 UrhG <em>kein </em>Urheberrecht, da sie amtliche Werke sind. § 5 UrhG ist auf amtliche Datenbanken analog anzuwenden (BGH, Beschluss vom 28.09.2006 - I ZR 261/03, "Sächsischer Ausschreibungsdienst"). Alle eigenen Beiträge (z.B. durch Zusammenstellung und Anpassung der Metadaten) und damit den gesamten Datensatz stelle ich gemäß einer <a href="https://creativecommons.org/publicdomain/zero/1.0/legalcode">CC0 1.0 Universal Public Domain License</a> vollständig urheberrechtsfrei.</p>
<p> </p>
<p><strong>Disclaimer</strong></p>
<p>Dieser Datensatz ist eine private wissenschaftliche Initiative und steht in keiner Verbindung zu Behörden, Gerichten oder anderen amtlichen Stellen der Bundesrepublik Deutschland.</p>
<p> </p>
<p><strong>Weitere Open Access Veröffentlichungen (Fobbe)</strong></p>
<p>Website<em> </em>—<em> </em><a href="https://www.seanfobbe.de">www.seanfobbe.de</a></p>
<p>Open Data — <a href="https://zenodo.org/communities/sean-fobbe-data/">zenodo.org/communities/sean-fobbe-data/</a></p>
<p>Source Code — <a href="https://zenodo.org/communities/sean-fobbe-code/">zenodo.org/communities/sean-fobbe-code/</a></p>
<p>Volltexte regulärer Publikationen — <a href="https://zenodo.org/communities/sean-fobbe-publications/">zenodo.org/communities/sean-fobbe-publications/</a></p>
<p> </p>
<p><strong>Kontakt</strong></p>
<p>Fehler gefunden? Anregungen? Melden Sie diese entweder im Issue Tracker auf GitHub oder schreiben Sie mir eine E-Mail an <a href="mailto:fobbe-data@posteo.de">fobbe-data@posteo.de</a></p>
<p> </p>
https://doi.org/10.5281/zenodo.7767295
oai:zenodo.org:7767295
deu
Zenodo
https://www.bundespatentgericht.de/
https://doi.org/10.5281/zenodo.7767296
https://github.com/SeanFobbe/ce-bpatg
https://zenodo.org/communities/sean-fobbe-data
https://doi.org/10.5281/zenodo.3954850
info:eu-repo/semantics/openAccess
Creative Commons Zero v1.0 Universal
https://creativecommons.org/publicdomain/zero/1.0/legalcode
Bundespatentgericht
BPatG
Patent
Marke
Gewerblicher Rechtsschutz
Patentrecht
Sortenrecht
Markenrecht
Zwangslizenz
Urteil
Beschluss
Gericht
Deutsches Patent- und Markenamt
DPMA
Deutschland
Open Legal Data
Text-as-data
Text Mining
Federal Patent Court
Germany
Judgment
Court
Patent Law
Corpus der Entscheidungen des Bundespatentgerichts (CE-BPatG)
info:eu-repo/semantics/other