There is a newer version of the record available.

Published March 22, 2023 | Version 2023-03-21
Dataset Open

Corpus der Entscheidungen des Bundesverwaltungsgerichts (CE-BVerwG)

  • 1. Ludwig-Maximilians-Universität München

Description

 

Überblick

Das Corpus der Entscheidungen des Bundesverwaltungsgerichts (CE-BVerwG) ist der bislang größte, frei verfügbare Datensatz von Entscheidungen des Bundesverwaltungsgerichts. Er ist eine Zusammenstellung aller Entscheidungen die in der amtlichen Datenbank des Bundesverwaltungsgerichts am jeweiligen Stichtag veröffentlicht waren.

Bitte beachten Sie das beiliegende Codebook! Es enthält wichtige Informationen zur korrekten Nutzung des Datensatzes. Es hilft auch bei der Entscheidung, welche Variante für Sie am besten geeignet ist. In der Regel empfehle ich für quantitative Forschung die CSV-Dateien und für traditionelle Forschung die PDF-Sammlung.

 

Aktualisierung

Dieser Datensatz wird 1-2 mal im Jahr aktualisiert. Benachrichtigungen über neue und aktualisierte Datensätze veröffentliche ich immer zeitnah auf Mastodon unter @seanfobbe@fediscience.org

 

Neu in Version 2023-03-21

  • Vollständige Aktualisierung der Daten
  • Gesamte Laufzeitumgebung mit Docker versionskontrolliert
  • 4 neue Variablen: BVerwGE, Leitsatz, Fachpresse und Übersetzung (jeweils binär)
  • Linguistisch annotierte Variante ist wieder verfügbar
  • Aktenzeichen aus dem Eingangszeitraum 2000 bis 2009 nun korrekt mit führender Null formatiert (z.B. 1 BvR 44/02 statt 1 BvR 44/2)
  • Aktenzeichen in Verzögerungsverfahren nun korrekt formatiert
  • Aktenzeichen verwenden nun richigerweise den Punkt als Trenner (statt den Schrägstrich wie bei anderen Gerichten)
  • Berücksichtigung von Präsident Korbmacher und Vize-Präsidentin Rublack in den jeweiligen Variablen
  • Update des Run-Skripts und des Delete-Skripts
  • Proto-Package Mono-Repo entfernt, alle Funktionen nun fest projektbasiert versionskontrolliert
  • Vereinfachung der Konfigurations-Datei
  • Neue Funktion für automatischen clean run (Löschung aller Zwischenergebnisse)
  • Update der Download-Funktion
  • Überflüssige Warnung in f.future_lingsummarize-Funktion entfernt
  • Alle Roh-Dateien werden nun im Unterordner "files" gespeichert
  • Vom BVerwG nicht veröffentlichte Entscheidungstypen im Codebook genauer beschrieben
  • Verbesserte Formatierung von Profiling, Warnungen und Fehlermeldungen im Compilation Report
  • Zusätzliche Unit-Tests
  • Verbesserung des Robustness Check Reports
  • README im Hinblick auf Docker überarbeitet

 

Features

  • Insgesamt bis zu 31 Variablen in der CSV-Variante
  • Fortlaufende Aktualisierung
  • Urheberrechtsfreiheit
  • Offene und plattformunabhängige Formate (PDF, TXT, CSV, HTML)
  • Linguistische Kennzahlen
  • Umfangreiches Codebook
  • Compilation Report um den Erstellungs-Prozess zu erläutern
  • Dutzende Diagramme und Tabellen für alle Zwecke (im ZIP-Archiv 'Analyse').
  • Jedes Diagramm liegt in einem für den Druck (PDF) und das Web (PNG) optimierten Format vor. Tabellen sind im CSV-Format bereitgestellt und sind damit sowohl für Menschen als auch für Maschinen gut lesbar
  • Kryptographische Signaturen
  • Veröffentlichung des Source Codes

 

Eckdaten

Stichtag: 21. März 2023

Inhaltlicher Umfang: 26.395 Entscheidungen

Zeitlicher Umfang: 2002 bis 2023, plus vereinzelte Entscheidungen aus anderen Jahren

Formate: PDF, TXT und CSV

 

Source Code und Compilation Report

Der gesamte Erstellungs-Prozess ist ab Version 2021-04-15 vollautomatisiert und detailliert dokumentiert. Mit jeder Kompilierung des vollständigen Datensatzes wird auch ein umfangreicher Compilation Report in einem attraktiv designten PDF-Format erstellt (ähnlich dem Codebook). Zudem werden Robustness Checks auf Vollständigkeit und Plausibilität durchgeführt und in einem separaten Bericht dokumentiert.

Der Compilation Report enthält den Source Code für die Daten-Pipeline, dokumentiert relevante Rechenergebnisse, gibt sekundengenaue Zeitstempel an und ist mit einem klickbaren Inhaltsverzeichnis versehen. Wenn Sie sich für Details des Erstellungs-Prozesses interessieren, lesen Sie diesen bitte zuerst.

Der vollständige Source Code, der Compilation Report und die Robustness Checks sind öffentlich einsehbar und dauerhaft erreichbar im wissenschaftlichen Archiv des CERN unter diesem Link hinterlegt: https://doi.org/10.5281/zenodo.7749684

 

 

Kryptographische Signaturen

Die Integrität und Echtheit der einzelnen Archive des Datensatzes sind durch eine Zwei-Phasen-Signatur sichergestellt.

In Phase I werden während der Kompilierung für jedes ZIP-Archiv, das Codebook und die Robustness Checks Hash-Werte in zwei verschiedenen Verfahren (SHA2-256 und SHA3-512) berechnet und in einer CSV-Datei dokumentiert.

In Phase II werden diese CSV-Datei und der Compilation Report mit meinem persönlichen geheimen GPG-Schlüssel signiert. Dieses Verfahren stellt sicher, dass die Kompilierung von jedermann durchgeführt werden kann, insbesondere im Rahmen von Replikationen, die persönliche Gewähr für Ergebnisse aber dennoch vorhanden ist.

Die während der Kompilierung des Datensatzes erstellte CSV-Datei mit den Hash-Prüfsummen ist mit meiner persönlichen GPG-Signatur versehen. Der mit dieser Version korrespondierende Public Key ist sowohl mit dem Datensatz als auch mit dem Source Code hinterlegt. Er hat folgende Kenndaten:

Name: Sean Fobbe (fobbe-data@posteo.de)

Fingerabdruck: FE6F B888 F0E5 656C 1D25 3B9A 50C4 1384 F44A 4E42

 

Kein Urheberrecht: Public Domain

An den Entscheidungstexten und amtlichen Leitsätzen besteht gem. § 5 Abs. 1 UrhG kein Urheberrecht, da sie amtliche Werke sind. § 5 UrhG ist auf amtliche Datenbanken analog anzuwenden (BGH, Beschluss vom 28.09.2006 - I ZR 261/03, "Sächsischer Ausschreibungsdienst"). Alle eigenen Beiträge (z.B. durch Zusammenstellung und Anpassung der Metadaten) und damit den gesamten Datensatz stelle ich gemäß einer CC0 1.0 Universal Public Domain License vollständig urheberrechtsfrei.

 

Disclaimer

Dieser Datensatz ist eine private wissenschaftliche Initiative und steht in keiner Verbindung zu Behörden, Gerichten oder anderen amtlichen Stellen der Bundesrepublik Deutschland.

 

Weitere Open Access Veröffentlichungen (Fobbe)

Website www.seanfobbe.de

Open Data  —  zenodo.org/communities/sean-fobbe-data/

Source Code  —  zenodo.org/communities/sean-fobbe-code/

Volltexte regulärer Publikationen  —  zenodo.org/communities/sean-fobbe-publications/

 

Kontakt

Fehler gefunden? Anregungen? Melden Sie diese entweder im Issue Tracker auf GitHub oder schreiben Sie mir eine E-Mail an fobbe-data@posteo.de

 

Files

CE-BVerwG_2023-03-21_Codebook.pdf

Files (2.1 GB)

Name Size Download all
md5:39b99927149fa7f860c77f4113be6239
570.8 kB Preview Download
md5:8301d379245bfd547608948ecdfa3d62
2.7 MB Preview Download
md5:712c2a365b8344d189510313a43e97ca
672.0 MB Preview Download
md5:9b040110279cd1c86d2e6fd365922471
101.4 MB Preview Download
md5:5abe75fa2fcc972e1a718339c1fc50e7
952.1 kB Preview Download
md5:29098d77ef593d13eaf6dd15209aaee5
1.2 GB Preview Download
md5:44a63666903a26e103225366e4c7c9e1
139.2 MB Preview Download
md5:e6d9a71892ce750a5e5c651b600744ca
6.1 kB Preview Download

Additional details

Related works

Is compiled by
Software: 10.5281/zenodo.7749684 (DOI)
Software: https://github.com/SeanFobbe/ce-bverwg/ (URL)
Is derived from
https://www.bverwg.de (URL)
Dataset: 10.5281/zenodo.4568682 (DOI)
Dataset: 10.5281/zenodo.4569564 (DOI)