[R] Source Code des 'Corpus der Amtlichen Entscheidungssammlung des Bundesverfassungsgerichts (C-BVerfGE-Source)'
Creators
Description
Überblick
Dieses R-Skript lädt alle auf www.bundesverfassungsgericht.de verfügbaren Entscheidungen der amtlichen Entscheidungssammlung des Bundesverfassungsgerichts (BVerfG) herunter und verarbeitet sie in einen reichhaltigen menschen- und maschinenlesbaren Korpus. Es ist die Basis für den Corpus der amtlichen Entscheidungssammlung des Bundesverfassungsgerichts (C-BVerfGE).
Alle mit diesem Skript erstellten Datensätze werden dauerhaft kostenlos und urheberrechtsfrei auf Zenodo, dem wissenschaftlichen Archiv des CERN, veröffentlicht. Alle Versionen sind mit einem persistenten Digital Object Identifier (DOI) versehen. Die neueste Version des Datensatzes ist immer über den Link der Concept DOI erreichbar: https://doi.org/10.5281/zenodo.3831111
Das C-BVerfGE sollte nicht mit dem Corpus der Entscheidungen des Bundesverfassungsgerichts (CE-BVerfG) verwechselt werden. Letzterer zielt auf eine Abbildung aller auf www.bundesverfassungsgericht.de veröffentlichten Entscheidungen und ist mit über 8000 Entscheidungen mehr als zehnmal so groß.
NEU in Version 2022-06-20
- Vollständige Aktualisierung der Daten (bis einschließlich Band 158)
- Überarbeitung der codierten Entscheidungsnamen
- Standardisierung der Befangenheitsanträge als "Selbstablehnung" und "Richterablehnung" in der Variable "name"
- Strenge Versionskontrolle von R packages mit renv
- Kompilierung jetzt detailliert konfigurierbar, insbesondere die Parallelisierung
- Parallelisierung nun vollständig mit future statt mit foreach und doParallel
- Codebook-Erstellung stark beschleunigt durch Verwendung vorberechneter Diagramme
- Fehlerhafte Kompilierungen werden vor der nächsten Kompilierung vollautomatisch aufgeräumt
- Alle Ergebnisse werden automatisch fertig verpackt in den Ordner "output" sortiert
- README und CHANGELOG sind jetzt externe Markdown-Dateien, die bei der Kompilierung automatisiert eingebunden werden
- Source Code des Changelogs zu Markdown konvertiert
- REGEX-Tests im Detail kommentiert
Systemanforderungen
Betriebssystem
Das Skript in seiner veröffentlichten Form kann nur unter Linux ausgeführt werden, da es Linux-spezifische Optimierungen (z.B. Fork Cluster) und Shell-Kommandos (z.B. OpenSSL) nutzt. Das Skript wurde unter Fedora Linux entwickelt und getestet. Die zur Kompilierung benutzte Version entnehmen Sie bitte dem sessionInfo()-Ausdruck am Ende des jeweiligen Compilation Reports.
Programmiersprache 'R' und Packages für 'R'
Sie müssen die Programmiersprache R installiert haben. Starten Sie danach eine Session im Ordner des Projekts, Sie sollten automatisch zur Installation aller packages in der empfohlenen Version aufgefordert werden. Andernfalls führen Sie bitte folgenden Befehl aus:
renv::restore()
LaTeX
Um die PDF Reports zu kompilieren benötigen Sie eine LaTeX-Installation. Sie können diese auf Fedora wie folgt installieren:
sudo dnf install texlive-scheme-full
Alternativ können sie das R package tinytex installieren.
Parallelisierung
In der Standard-Einstellung wird das Skript vollautomatisch die maximale Anzahl an Rechenkernen/Threads auf dem System zu nutzen. Die Anzahl der verwendeten Kerne kann in der Konfigurationsatei angepasst werden. Wenn die Anzahl Threads auf 1 gesetzt wird, ist die Parallelisierung deaktiviert.
Speicherplatz
Auf der Festplatte sollten 8 GB Speicherplatz vorhanden sein.
Kompilierung
Um den vollständigen Datensatz zu kompilieren, sowie Compilation Report und Codebook zu erstellen, kopieren Sie bitte alle im Source-Archiv bereitgestellten Dateien in einen leeren Ordner (!) und führen mit R diesen Befehl aus:
source("00_C-BVerfGE_FullCompile.R")
Bei der Prüfung der GPG-Signatur im Codebook wird ein Fehler auftreten und im Codebook dokumentiert, weil die Daten nicht mit meiner Original-Signatur versehen sind. Dieser Fehler hat jedoch keine Auswirkungen auf die Funktionalität und hindert die Kompilierung nicht.
Alle Kommentare sind im roxygen2-Stil gehalten. Die beiden Skripte können daher auch ohne render() regulär als R-Skripte ausgeführt werden. Es wird in diesem Fall kein PDF-Bericht erstellt und Diagramme werden nicht abgespeichert.
Weitere Open Access Veröffentlichungen (Fobbe)
Website — www.seanfobbe.de
Open Data — https://zenodo.org/communities/sean-fobbe-data/
Source Code — https://zenodo.org/communities/sean-fobbe-code/
Volltexte regulärer Publikationen — https://zenodo.org/communities/sean-fobbe-publications/
Urheberrecht
Der Source Code und alle von mir bereitgestellten Rohdaten stehen unter einer MIT No Attribution (MIT-0)-Lizenz. Sie können sie frei für alle Zwecke nutzen.
Kontakt
Fehler gefunden? Anregungen? Notieren Sie diese gerne im Issue Tracker auf GitHub oder schreiben Sie mir eine E-Mail an fobbe-data@posteo.de
Files
C-BVerfGE_2022-06-20_CompilationReport.pdf
Additional details
Related works
- Compiles
- Dataset: 10.5281/zenodo.6569896 (DOI)
- Is derived from
- Software: https://github.com/SeanFobbe/c-bverfge (URL)
- References
- https://www.bundesverfassungsgericht.de/ (URL)