Published October 17, 2023 | Version 2023-10-15
Dataset Open

Corpus der Entscheidungen des Bundesfinanzhofs (CE-BFH)

  • 1. ROR icon Ludwig-Maximilians-Universität München

Description

Überblick

Das Corpus der Entscheidungen des Bundesfinanzhofs (CE-BFH) ist eine möglichst vollständige Sammlung der vom Bundesfinanzhof (BFH) veröffentlichten Entscheidungen. Der Datensatz nutzt als seine Datenquelle die amtliche Entscheidungsdatenbank des Bundesfinanzhofs und wertet diese vollständig aus.

Bitte lesen Sie zuerst das beiliegende Codebook! Es enthält wichtige Informationen zur korrekten Nutzung des Datensatzes. Es hilft auch bei der Entscheidung, welche Variante für Sie am besten geeignet ist. In der Regel empfehle ich für quantitative Forschung die CSV-Dateien und für traditionelle Forschung die PDF-Sammlung.

Für Praktiker:innen stelle ich zusätzlich eine Variante mit allen in der amtlichen Sammlung BFHE abgedruckten "V-Entscheidungen" zur Verfügung.

 

Aktualisierung

Dieser Datensatz wird 1-2 mal im Jahr aktualisiert. Benachrichtigungen über neue und aktualisierte Datensätze veröffentliche ich immer zeitnah auf Mastodon unter @seanfobbe@fediscience.org

 

Eckdaten

Stichtag: 15. Oktober 2023

Inhaltlicher Umfang: 10.310 Entscheidungen des Bundesfinanzhofs der Bundesrepublik Deutschland

Zeitlicher Umfang: von Januar 2010 bis zum Stichtag

Formate: CSV, PDF, TXT und HTML

 

Features

  • Bis zu 34 Variablen in den CSV-Varianten
  • Fortlaufende Aktualisierung
  • Urheberrechtsfreiheit
  • Metadaten enthalten u.a. relevante Rechtsnormen, Vorinstanz, Titel der Entscheidung und Leitsätze
  • Sowohl für traditionelle Rechtsanwender als auch für Legal Tech-Anwendungen geeignete Formate (CSV, PDF, TXT und HTML)
  • Umfangreicher Compilation Report um den Erstellungs-Prozess zu erläutern
  • Hochauflösende Diagramme und deskriptive Tabellen für alle Zwecke
  • Diagramme in PDF (Druck) und PNG (Web) verfügbar, Tabellen als menschen- und maschinenlesbares CSV
  • Veröffentlichung des Source Codes

 

Source Code und Compilation Report

Der gesamte Erstellungs-Prozess ist vollautomatisiert und detailliert dokumentiert. Mit jeder Kompilierung des vollständigen Datensatzes wird auch ein umfangreicher Compilation Report in einem attraktiv designten PDF-Format erstellt (ähnlich dem Codebook). Zudem werden Robustness Checks auf Vollständigkeit und Plausibilität durchgeführt und in einem separaten Bericht dokumentiert.

Der Compilation Report enthält den Code für die vollständige Pipeline, dokumentiert relevante Rechenergebnisse, gibt sekundengenaue Zeitstempel an und ist mit einem klickbaren Inhaltsverzeichnis versehen. Er ist zusammen mit dem Source Code hinterlegt. Wenn Sie sich für Details des Erstellungs-Prozesses interessieren, lesen Sie diesen bitte zuerst.

Der vollständige Source Code — sowohl für die Erstellung des Datensatzes, als auch für das Codebook — ist öffentlich einsehbar und dauerhaft erreichbar im wissenschaftlichen Archiv des CERN unter diesem Link hinterlegt. Der Link zum Source Code ist am Ende der Seite zu finden.

 

Kryptographische Signaturen

Die Integrität und Echtheit der einzelnen Archive des Datensatzes sind durch eine Zwei-Phasen-Signatur sichergestellt.

In Phase I werden während der Kompilierung für jedes ZIP-Archiv, das Codebook und die Robustness Checks Hash-Werte in zwei verschiedenen Verfahren (SHA2-256 und SHA3-512) berechnet und in einer CSV-Datei dokumentiert.

In Phase II werden diese CSV-Datei und der Compilation Report mit meinem persönlichen geheimen GPG-Schlüssel signiert. Dieses Verfahren stellt sicher, dass die Kompilierung von jedermann durchgeführt werden kann, insbesondere im Rahmen von Replikationen, die persönliche Gewähr für Ergebnisse aber dennoch vorhanden ist.

Die während der Kompilierung des Datensatzes erstellte CSV-Datei mit den Hash-Prüfsummen ist mit meiner persönlichen GPG-Signatur versehen. Der mit dieser Version korrespondierende Public Key ist sowohl mit dem Datensatz als auch mit dem Source Code hinterlegt. Er hat folgende Kenndaten:

Name: Sean Fobbe (fobbe-data@posteo.de)

Fingerabdruck: FE6F B888 F0E5 656C 1D25 3B9A 50C4 1384 F44A 4E42

 

Kein Urheberrecht: Public Domain

An den Normtexten und Metadaten besteht gem. § 5 Abs. 1 UrhG kein Urheberrecht, da sie amtliche Werke sind. § 5 UrhG ist auf amtliche Datenbanken analog anzuwenden (BGH, Beschluss vom 28.09.2006 - I ZR 261/03, "Sächsischer Ausschreibungsdienst"). Alle eigenen Beiträge (z.B. durch Zusammenstellung und Anpassung der Metadaten) und damit den gesamten Datensatz stelle ich gemäß einer CC0 1.0 Universal Public Domain License vollständig urheberrechtsfrei.

 

Disclaimer

Dieser Datensatz ist eine private wissenschaftliche Initiative und steht in keiner Verbindung zu Behörden, Gerichten oder anderen öffentlichen Stellen der Bundesrepublik Deutschland.

 

Weitere Open Access Veröffentlichungen (Fobbe)

Website www.seanfobbe.de

Open Data  —  zenodo.org/communities/sean-fobbe-data/

Source Code  —  zenodo.org/communities/sean-fobbe-code/

Volltexte regulärer Publikationen  —  zenodo.org/communities/sean-fobbe-publications/

 

Kontakt

Fehler gefunden? Anregungen? Melden Sie diese entweder im Issue Tracker auf GitHub oder schreiben Sie mir eine E-Mail an fobbe-data@posteo.de

 

Files

CE-BFH_2023-10-15_Codebook.pdf

Files (999.0 MB)

Name Size Download all
md5:2a3b7b2d980dcdad62754d3305ecde93
543.0 kB Preview Download
md5:2218952222abd606588b3d153ab00848
2.9 MB Preview Download
md5:05ce92ce0c686783a42ef24d7987fb5b
46.5 MB Preview Download
md5:4909f419105863b83f77ce6e8c6e8c8a
3.4 MB Preview Download
md5:2530385a683bd1b3ec45cbbdabe1f245
122.5 MB Preview Download
md5:e3f9d6b5290c6553fd8ec4ee3953df5e
231.5 MB Preview Download
md5:4a26677daff248241913af6748ff3a23
529.5 MB Preview Download
md5:008e27ca9f5d106b92c8e688781d6f85
62.2 MB Preview Download
md5:27922f756fa1ae9a5dbf4e8aab0b8627
6.3 kB Preview Download

Additional details

Related works

Cites
Software: https://github.com/SeanFobbe/ce-bfh (URL)
Is compiled by
Software: 10.5281/zenodo.7691843 (DOI)
Is derived from
Dataset: https://www.bundesfinanzhof.de/ (URL)