[R] Source Code des 'Corpus der Amtlichen Entscheidungssammlung des Bundesverfassungsgerichts (C-BVerfGE-Source)'
Creators
Description
Überblick
Dieses R-Skript lädt alle auf www.bundesverfassungsgericht.de verfügbaren Entscheidungen der amtlichen Entscheidungssammlung des Bundesverfassungsgerichts (BVerfG) herunter und verarbeitet sie in einen reichhaltigen menschen- und maschinenlesbaren Korpus. Es ist die Basis für den Corpus der amtlichen Entscheidungssammlung des Bundesverfassungsgerichts (C-BVerfGE).
Alle mit diesem Skript erstellten Datensätze werden dauerhaft kostenlos und urheberrechtsfrei auf Zenodo, dem wissenschaftlichen Archiv des CERN, veröffentlicht. Alle Versionen sind mit einem persistenten Digital Object Identifier (DOI) versehen.
Die neueste Version des Datensatzes ist immer über den Link der Concept DOI erreichbar: https://doi.org/10.5281/zenodo.3831111
Das C-BVerfGE sollte nicht mit dem Corpus der Entscheidungen des Bundesverfassungsgerichts (CE-BVerfG) verwechselt werden. Letzterer zielt auf eine Abbildung aller auf www.bundesverfassungsgericht.de veröffentlichten Entscheidungen und ist mit über 8000 Entscheidungen mehr als zehnmal so groß.
NEU in Version 2025-08-20
- Vollständige Aktualisierung der Daten (bis einschließlich Band 169)
- LIZENZÄNDERUNG: Source Code jetzt unter GNU General Public License Version 3 (GPLv3) oder später lizenziert
- Neue Variablen: Tenor und Beschlussformel
- Variable entfernt: Kurzbeschreibung (wird vom BVerfG nicht mehr angeboten)
- R-Version auf 4.4.0 aktualisiert (wegen CVE-2024-27322)
- Expliziter R Package Version Lock für 2024-06-13 (CRAN Date)
- Paralellisierung von Quanteda repariert
- Überarbeitung des Dockerfiles
- Anpassung von Compose File an Debian 11
- Docker Zeitzone auf Berlin eingestellt
- Zusätzliches Lösch-Skript mit Docker-Integration
- Vereinfachung der Run-Skripte und stärkere Integration mit Docker Compose
- /tmp in Arbeitsspeicher ausgelagert
Systemanforderungen
- Docker
- Docker Compose
- 500 MB Speicherplatz auf Festplatte
- Multi-core CPU empfohlen (8 cores/16 threads für die Referenzdatensätze).
In der Standard-Einstellung wird das Skript vollautomatisch die maximale Anzahl an Rechenkernen/Threads auf dem System zu nutzen. Die Anzahl der verwendeten Kerne kann in der Konfigurationsatei angepasst werden. Wenn die Anzahl Threads auf 1 gesetzt wird, ist die Parallelisierung deaktiviert.
Anleitung
Schritt 1: Ordner vorbereiten
Kopieren Sie bitte den gesamten Source Code in einen leeren Ordner (!), beispielsweise mit:
$ git clone https://codeberg.org/seanfobbe/c-bverfge
Verwenden Sie immer einen separaten und leeren (!) Ordner für die Kompilierung. Die Skripte löschen innerhalb von bestimmten Unterordnern (files/, temp/, analysis/ und output/) alle Dateien die den Datensatz verunreinigen könnten --- aber auch nur dort.
Schritt 2: Docker Image erstellen
Ein Docker Image stellt ein komplettes Betriebssystem mit der gesamten verwendeten Software automatisch zusammen. Nutzen Sie zur Erstellung des Images einfach:
$ bash docker-build-image.sh
Schritt 3: Datensatz kompilieren
Falls Sie zuvor den Datensatz schon einmal kompiliert haben (ob erfolgreich oder erfolglos), können Sie mit folgendem Befehl alle Arbeitsdaten im Ordner löschen:
$ bash delete_all_data.sh
Den vollständigen Datensatz kompilieren Sie mit folgendem Skript:
$ bash docker-run-project.sh
Ergebnis
Der Datensatz und alle weiteren Ergebnisse sind nun im Ordner output/ abgelegt.
Weitere Open Access Veröffentlichungen (Fobbe)
Website — www.seanfobbe.de
Open Data — https://zenodo.org/communities/sean-fobbe-data/
Source Code — https://zenodo.org/communities/sean-fobbe-code/
Volltexte regulärer Publikationen — https://zenodo.org/communities/sean-fobbe-publications/
Urheberrecht
Der Source Code und alle von mir bereitgestellten Rohdaten stehen unter der GNU General Public License v3.0 oder später.
Kontakt
Fehler gefunden? Anregungen? Kommentieren Sie gerne im Issue Tracker oder kontaktieren Sie mich über www.seanfobbe.de
Files
C-BVerfGE_2025-08-20_CompilationReport.pdf
Additional details
Related works
- Compiles
- Dataset: 10.5281/zenodo.16898303 (DOI)
- Is derived from
- Software: https://codeberg.org/SeanFobbe/c-bverfge (URL)
- References
- https://www.bundesverfassungsgericht.de/ (URL)
Software
- Repository URL
- https://codeberg.org/SeanFobbe/c-bverfge
- Programming language
- R
- Development Status
- Active