Corpus der Entscheidungen des Bundesverfassungsgerichts (CE-BVerfG)
Description
Überblick
Das Corpus der Entscheidungen des Bundesverfassungsgerichts (CE-BVerfG) ist der bislang größte, frei verfügbare Datensatz von Entscheidungen des Bundesverfassungsgerichts. Er ist eine Zusammenstellung aller Entscheidungen die auf der amtlichen Webseite des Bundesverfassungsgerichts am jeweiligen Stichtag veröffentlicht waren.
Bitte beachten Sie das beiliegende Codebook! Es enthält wichtige Informationen zur korrekten Nutzung des Datensatzes. Es hilft auch bei der Entscheidung, welche Variante für Sie am besten geeignet ist. In der Regel empfehle ich für quantitative Forschung die CSV-Dateien und für traditionelle Forschung die PDF-Sammlung.
Alle die Corona-Pandemie betreffenden Entscheidungen des Bundesverfassungsgerichts finden Sie zusätzlich separat dokumentiert und analysiert im Datensatz Corona-Rechtsprechung des Bundesverfassungsgerichts (BVerfG-Corona).
Das CE-BVerfG sollte nicht mit dem Corpus der amtlichen Entscheidungssammlung des Bundesverfassungsgerichts (C-BVerfGE) verwechselt werden. Letzterer zielt nur auf eine Abbildung der amtlichen Sammlung ab und ist deutlich kleiner.
Aktualisierung
Dieser Datensatz wird 1-2 mal im Jahr aktualisiert. Benachrichtigungen über neue und aktualisierte Datensätze veröffentliche ich immer zeitnah auf Mastodon unter @seanfobbe@fediscience.org
NEU in Version 2025-09-22
- Vollständige Aktualisierung der Daten
- Neue Variablen: Tenor und Beschlussformel
- Neues Feature: Datensatz im Parquet-Format verfügbar
- Variable entfernt: Kurzbeschreibung (wird vom BVerfG nicht mehr angeboten)
- Amtliche Sammlung bis inklusive Band 169 mit Name, Band und Seite versehen
- Anpassung der Sammlung von Entscheidungen an neues Datenbankformat der BVerfG-Webseite
- Überarbeitung der Dokumentation zu den Varianten des Datensatzes
- Expliziter R Package Version Lock für 2024-06-13 (CRAN Date)
- Parallelisierung von Quanteda repariert
- Überarbeitung des Dockerfiles
- Zusätzliche Tests auf Einzigartigkeit von ECLI und doc_id
- Definition von Inhalt des Source Code-Archivs via git
- /tmp in Arbeitsspeicher ausgelagert
- Fix für Metadaten-Extraktion
Features
- Insgesamt bis zu 38 Variablen in der CSV-Variante
- Fortlaufende Aktualisierung
- Urheberrechtsfreiheit
- Offene und plattformunabhängige Formate (PDF, TXT, CSV, HTML)
- Entscheidungsnamen und BVerfGE-Fundstelle (nur BVerfGE)
- Verknüpfung mit PräsidentIn/Vize-PräsidentIn
- Linguistische Kennzahlen
- Umfangreiches Codebook
- Compilation Report um den Erstellungs-Prozess zu erläutern
- Dutzende Diagramme und Tabellen für alle Zwecke (im ZIP-Archiv 'ANALYSE').
- Jedes Diagramm liegt in einem für den Druck (PDF) und das Web (PNG) optimierten Format vor. Tabellen sind im CSV-Format bereitgestellt und sind damit sowohl für Menschen als auch für Maschinen gut lesbar
- Kryptographische Signaturen
- Veröffentlichung des Source Codes
Eckdaten
Stichtag: 22. September 2025
Inhaltlicher Umfang: 9.302 Entscheidungen
Zeitlicher Umfang: 1998 bis 2025, plus vereinzelte Entscheidungen aus anderen Jahren
Zitationsnetzwerk: ca. 170.000 Zitate zwischen ca. 14.500 Entscheidungen
Formate: PDF, TXT, CSV, HTML und GraphML
Source Code und Compilation Report
Der gesamte Erstellungs-Prozess ist ab Version 2021-01-08 vollautomatisiert und detailliert dokumentiert. Mit jeder Kompilierung des vollständigen Datensatzes wird auch ein umfangreicher Compilation Report in einem attraktiv designten PDF-Format erstellt (ähnlich dem Codebook). Zudem werden Robustness Checks auf Vollständigkeit und Plausibilität durchgeführt und in einem separaten Bericht dokumentiert.
Der Compilation Report enthält die gesamte Daten-Pipeline, dokumentiert relevante Rechenergebnisse, gibt sekundengenaue Zeitstempel an und ist mit einem klickbaren Inhaltsverzeichnis versehen. Wenn Sie sich für Details des Erstellungs-Prozesses interessieren, lesen Sie diesen bitte zuerst.
Der vollständige Source Code, der Compilation Report und die Robustness Checks sind öffentlich einsehbar und dauerhaft erreichbar im wissenschaftlichen Archiv des CERN unter diesem Link hinterlegt: https://doi.org/10.5281/zenodo.4308216
Kryptographische Signaturen
Die Integrität und Echtheit der einzelnen Archive des Datensatzes sind durch eine Zwei-Phasen-Signatur sichergestellt.
In Phase I werden während der Kompilierung für jedes ZIP-Archiv, das Codebook und die Robustness Checks Hash-Werte in zwei verschiedenen Verfahren (SHA2-256 und SHA3-512) berechnet und in einer CSV-Datei dokumentiert.
In Phase II werden diese CSV-Datei und der Compilation Report mit meinem persönlichen geheimen GPG-Schlüssel signiert. Dieses Verfahren stellt sicher, dass die Kompilierung von jedermann durchgeführt werden kann, insbesondere im Rahmen von Replikationen, die persönliche Gewähr für Ergebnisse aber dennoch vorhanden ist.
Die während der Kompilierung des Datensatzes erstellte CSV-Datei mit den Hash-Prüfsummen ist mit meiner persönlichen GPG-Signatur versehen. Der mit dieser Version korrespondierende Public Key ist sowohl mit dem Datensatz als auch mit dem Source Code hinterlegt. Er hat folgende Kenndaten:
Name: Sean Fobbe (fobbe-data@posteo.de)
Fingerabdruck: FE6F B888 F0E5 656C 1D25 3B9A 50C4 1384 F44A 4E42
Kein Urheberrecht: Public Domain
An den Entscheidungstexten und amtlichen Leitsätzen besteht gem. § 5 Abs. 1 UrhG kein Urheberrecht, da sie amtliche Werke sind. § 5 UrhG ist auf amtliche Datenbanken analog anzuwenden (BGH, Beschluss vom 28.09.2006 - I ZR 261/03, "Sächsischer Ausschreibungsdienst"). Alle eigenen Beiträge (z.B. durch Zusammenstellung und Anpassung der Metadaten) und damit den gesamten Datensatz stelle ich gemäß einer CC0 1.0 Universal Public Domain License vollständig urheberrechtsfrei.
Disclaimer
Dieser Datensatz ist eine private wissenschaftliche Initiative und steht weder mit dem Bundesverfassungsgericht noch mit den Herausgebern der BVerfGE in Verbindung.
Ähnliche Datensätze zum BVerfG
Wendel, L., & Möllers, C. (2023). Korpus der Entscheidungen des Bundesverfassungsgerichts (2.0) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.10369205
[Senatsentscheidungen 1972-2010] Engst, Benjamin G., Thomas Gschwend, Christoph Hönnige & Caroline E. Wittig. (2020). “The Constitutional Court Database." https://ccdb.eu/
[BVerfGE von 1951 bis 2015] Coupette, C. (2019). Juristische Netzwerkforschung: Modellierung, Quantifizierung und Visualisierung relationaler Daten im Recht (Online-Appendix). Zenodo. https://doi.org/10.1628/978-3-16-157012-4-appendix
Weitere Open Access Veröffentlichungen (Fobbe)
Website — www.seanfobbe.de
Open Data — zenodo.org/communities/sean-fobbe-data/
Source Code — zenodo.org/communities/sean-fobbe-code/
Volltexte regulärer Publikationen — zenodo.org/communities/sean-fobbe-publications/
Kontakt
Fehler gefunden? Anregungen? Notieren Sie diese bitte im Issue Tracker auf Codeberg oder schreiben Sie mir via www.seanfobbe.de
Files
CE-BVerfG_2025-09-22_Codebook.pdf
Files
(1.2 GB)
Name | Size | Download all |
---|---|---|
md5:072309b2ebbc86123dfc275e1e593749
|
3.0 MB | Preview Download |
md5:ab257f59b6cf25cb8e6694a3d379a8fd
|
10.4 MB | Preview Download |
md5:0b2d772969928d5f06149729a7961b42
|
54.5 MB | Preview Download |
md5:8b74400abaa88c6f9942ced1edb52ed2
|
1.2 MB | Preview Download |
md5:9423acd6fdae5fc37a22ecc922f14003
|
58.7 MB | Preview Download |
md5:a052fac92cb8e2c0b8f81f11e0f24d9a
|
708.9 kB | Preview Download |
md5:c098ff098c528adf3d93cce9991244b1
|
217.7 MB | Preview Download |
md5:c22165e8695fc153600cf3ba8c1fe09d
|
714.7 MB | Preview Download |
md5:203f1d28a85b45f1b83eb08a5b307101
|
91.4 MB | Download |
md5:418377ce24d4ecf5aa27e41ff16d537d
|
66.1 MB | Preview Download |
md5:d6a317f9fc751e2071d480280528c4ac
|
6.6 kB | Preview Download |
Additional details
Related works
- Cites
- Software: https://codeberg.org/SeanFobbe/ce-bverfg (URL)
- Is compiled by
- Software: 10.5281/zenodo.16932396 (DOI)
- Is derived from
- https://www.bundesverfassungsgericht.de/ (URL)
Software
- Repository URL
- https://codeberg.org/SeanFobbe/ce-bverfg
- Programming language
- R
- Development Status
- Active