Planned intervention: On Wednesday April 3rd 05:30 UTC Zenodo will be unavailable for up to 2-10 minutes to perform a storage cluster upgrade.
Published February 12, 2021 | Version 1.0.0
Presentation Open

Open Legal Data: Freie juristische Daten im Rechtsstaat

Creators

Description

 

Abstract

Die quantitative Analyse von Texten (»Text Mining«, »Natural Language Processing«) ist in den deutschen Rechtswissenschaften ein junges und noch kaum bearbeitetes Feld. Die außerordentlich geringe Anzahl an frei verfügbaren Datensätzen hat hieran großen Anteil.

Die meisten hochwertigen Datensätze lagern (fast) unerreichbar in kommerziellen Datenbanken und sind wissenschaftlich gar nicht oder nur gegen Entgelt zu nutzen. Frei verfügbare Datenbanken (z.B. OpenJur, OpinioIuris) verbieten oft ausdrücklich das maschinelle Auslesen der Rohdaten. Wissenschaftliche Initiativen wie der Juristische Referenzkorpus (JuReKo) sind nach jahrelanger Arbeit hinter verschlossenen Türen verschwunden.

In diesem Vortrag soll es um Wege aus dieser Misere gehen. Ich bespreche Anforderungen an juristische Datensätze, stelle wissenschaftliche Leitlinien für hochwertige Open Access-Daten vor (z.B. die FAIR Data-Prinzipien) und demonstriere Anwendungsbeispiele aus dem Natural Language Processing (NLP).

Alle Anwendungsbeispiele beruhen auf aktuell oder in absehbarer Zukunft frei verfügbaren Datensätzen. Diese und andere freie Datensätze stammen aus meiner eigenen Forschungstätigkeit und sind größtenteils bereits jetzt open access, urheberrechtsfrei, umfangreich dokumentiert und dauerhaft weltweit verfügbar im wissenschaftlichen Archiv des CERN hier bereitgestellt: https://zenodo.org/communities/sean-fobbe-data/

 

Kontext

Diese Präsentation war Grundlage für den im Rahmen des Daidalos-Kolloquiums am 11. Februar 2021 gehaltenen Online-Vortrag von Seán Fobbe.

Das Daidalos-Kolloquium wird von Münchner StipendiatInnen der Studienstiftung des deutschen Volkes veranstaltet. Sie organisieren für Studenten wie Alumni der Studienstiftung Abendvorträge zu fächerübergreifenden Themen durch namhafte Referenten.

 

Quellen

Die FAIR Data-Prinzipien (Folie 3) sind in der Präsentation nur zusammenfassend besprochen. Die vollständigen Prinzipien sind auf einer eigenen Webseite (www.go-fair.org) visuell ansprechend erläutert und als wissenschaftliches Paper hier publiziert: Wilkinson, M., Dumontier, M., Aalbersberg, I. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data 3, 160018 (2016). https://doi.org/10.1038/sdata.2016.18

Die Open Definition (Folie 4) findet sich hier: https://opendefinition.org/

Für die während dem Vortrag (Folie 5) erwähnte Integration von Zenodo und Github (automatischer Export und Archivierung) ist hier eine Anleitung verfügbar.

Die Webseiten von OpenLegalData.io, quantitative-rechtswissenschaft.de und richter-im-internet.de (Folie 6) sind immer einen Besuch wert. Die Alpha-Version des neuen Rechtsinformationsportals des Bundes ist eine spannende Neuentwicklung. Aktuelle Datenquellen sind aber nur die alten Portale gesetze-im-internet.de und rechtsprechung-im-internet.de.

Alle auf Folie 7 besprochenen Datensätze sind hier abrufbar: https://zenodo.org/communities/sean-fobbe-data/

Der Lexical Dispersion Plot für die Corona-Rechtsprechung des Bundesverfassungsgerichts (Folie 10) ist in hoher Qualität hier verfügbar. Der Source Code ist hier verfügbar.

Die Diagramme auf den Folien 9, 11 bis 14 und 16 bis 22 stammen aus laufender Forschung. Source Code und Bild-Dateien werden nach Fertigstellung in meinem Code Repository veröffentlicht.

 

Über den Referenten

Seán Fobbe ist Rechtswissenschaftler und Legal Data Scientist. Seine Dissertation über ein Thema an der Schnittstelle von Völkerrecht, internationalem Menschenrechtsschutz, Anthropologie und Friedensforschung wird aktuell von der Studienstiftung des deutschen Volkes gefördert. Er ist zudem pro bono als Chief Legal Officer der NGO RASHID International tätig, die auf den Schutz des irakischen Kulturguts spezialisiert ist und bei den Vereinten Nationen special consultative status innehat. Seit kurzem twittert er auch unter @FobbeSean über Menschenrechte und Data Science.

Webseite: www.seanfobbe.de

 

Files

2021-02-11_OpenLegalData_Fobbe-v1-0-0.pdf

Files (4.4 MB)

Name Size Download all
md5:8153aad215893859c2fc8e2c2049f023
4.4 MB Preview Download

Additional details