[R] Source Code der Corona-Rechtsprechung des Bundesverfassungsgerichts (BVerfG-Corona-Source)
Description
Überblick
Dieses R-Skript lädt den Corpus der Entscheidungen des Bundesverfassungsgerichts (CE- BVerfG) herunter, untersucht ihn auf mit SARS-CoV-2 assoziiertem Vokabular und speichert relevante Entscheidungen. Es ist die Grundlage für den Datensatz Corona-Rechtsprechung des Bundesverfassungsgerichts (BVerfG-Corona).
Alle mit diesem Skript erstellten Datensätze werden dauerhaft kostenlos und urheberrechtsfrei auf Zenodo, dem wissenschaftlichen Archiv des CERN, veröffentlicht. Alle Versionen sind mit einem persistenten Digital Object Identifier (DOI) versehen. Die neueste Version des Datensatzes ist immer über den Link der Concept DOI erreichbar: https://doi.org/10.5281/zenodo.4459405
NEU in Version 2023-02-26
- Vollständige Aktualisierung der Daten
- Gesamte Laufzeitumgebung nun mit Docker versionskontrolliert
- Funktionen werden nun nicht mehr aus einem Submodule bezogen, sondern sind direkt im Projekt verankert
- Vereinfachung der Konfigurations-Datei
- ZIP-Archiv mit Source Code wird nun aus dem Git-Manifest generiert
- README im Hinblick auf Docker überarbeitet
- Speichern von temporären Dateien nun in speziellen Ordnern in files/, pdf/ und txt/
- Option für automatische Löschung der Dateien aus vorherigen Runs zu Konfiguration hinzugefügt
- Delete-Skript hinzugefügt
Systemanforderungen
- Docker
- Docker Compose
- 1 GB Speicherplatz auf Festplatte
In der Standard-Einstellung wird das Skript vollautomatisch die maximale Anzahl an Rechenkernen/Threads auf dem System zu nutzen. Die Anzahl der verwendeten Kerne kann in der Konfigurationsatei angepasst werden. Wenn die Anzahl Threads auf 1 gesetzt wird, ist die Parallelisierung deaktiviert.
Anleitung
Schritt 1: Ordner vorbereiten
Kopieren Sie bitte den gesamten Source Code in einen leeren Ordner (!), beispielsweise mit:
$ git clone https://github.com/seanfobbe/bverfg-corona
Verwenden Sie immer einen separaten und leeren (!) Ordner für die Kompilierung. Die Skripte löschen innerhalb von bestimmten Unterordnern (files/, temp/, analyse/ und output/) alle Dateien die den Datensatz verunreinigen könnten --- aber auch nur dort.
Schritt 2: Docker Image erstellen
Ein Docker Image stellt ein komplettes Betriebssystem mit der gesamten verwendeten Software automatisch zusammen. Nutzen Sie zur Erstellung des Images einfach:
$ bash docker-build-image.sh
Schritt 3: Datensatz kompilieren
Falls Sie zuvor den Datensatz schon einmal kompiliert haben (ob erfolgreich oder erfolglos), können Sie mit folgendem Befehl alle Arbeitsdaten im Ordner löschen:
$ Rscript delete_all_data.R
Den vollständigen Datensatz kompilieren Sie mit folgendem Skript:
$ bash docker-run-project.sh
Ergebnis
Der Datensatz und alle weiteren Ergebnisse sind nun im Ordner output/ abgelegt.
Projektstruktur
.
├── buttons # Buttons (nur optische Bedeutung)
├── CHANGELOG.md # Alle Änderungen
├── compose.yaml # Konfiguration für Docker
├── config.toml # Zentrale Konfigurations-Datei
├── data # Datensätze, auf denen die Pipeline aufbaut
├── delete_all_data.R # Löscht den Datensatz und Zwischenschritte
├── docker-build-image.sh # Docker Image erstellen
├── Dockerfile # Definition des Docker Images
├── docker-run-project.sh # Docker Image und Datensatz kompilieren
├── functions # Wichtige Schritte der Pipeline
├── gitconfig # Git-Konfiguration für Container
├── gpg # Persönlicher Public GPG-Key für Seán Fobbe
├── BVerfG-Corona_CorpusCreation.R # Zentrale Definition der Pipeline
├── README.md # Bedienungsanleitung
├── requirements-python.txt # Benötigte Python packages
├── requirements-R.R # Benötigte R packages
├── requirements-system.txt # Benötigte system dependencies
├── run_project.R # Kompiliert den gesamten Datensatz
└── tex # LaTeX-Templates
Weitere Open Access Veröffentlichungen (Fobbe)
Website — www.seanfobbe.de
Open Data — https://zenodo.org/communities/sean-fobbe-data/
Source Code — https://zenodo.org/communities/sean-fobbe-code/
Volltexte regulärer Publikationen — https://zenodo.org/communities/sean-fobbe-publications/
Urheberrecht
Der Source Code und alle von mir bereitgestellten Rohdaten stehen unter einer MIT No Attribution (MIT-0)-Lizenz. Sie können sie frei für alle Zwecke nutzen.
Kontakt
Fehler gefunden? Anregungen? Melden Sie diese entweder im Issue Tracker auf GitHub oder schreiben Sie mir eine E-Mail an fobbe-data@posteo.de
Files
BVerfG-Corona_2023-02-26_CompilationReport.pdf
Additional details
Related works
- Compiles
- Dataset: https://zenodo.org/record/7807020 (URL)
- Is derived from
- https://github.com/SeanFobbe/bverfg-corona (URL)
- References
- https://www.bundesverfassungsgericht.de/ (URL)