SEFLAG. Systematic Evaluation Framework for NLP Models and Datasets in Latin and Ancient Greek

Schulz, Konstantin

doi:10.5281/zenodo.14012948

Published October 30, 2024 | Version 1.0

Presentation Open

SEFLAG. Systematic Evaluation Framework for NLP Models and Datasets in Latin and Ancient Greek

Schulz, Konstantin (Project member)¹

1. Humboldt-Universität zu Berlin

Contributors

Project member:

Deichsler, Florian¹

1. Humboldt-Universität zu Berlin

Das SEFLAG-Framework, präsentiert von Konstantin Schulz und Florian Deichsler (Humboldt-Universität zu Berlin), stellt ein systematisches Evaluationsframework für NLP-Modelle und -Datensätze für Latein und Altgriechisch vor. Die Hauptziele sind die Bewertung und Dokumentation bestehender NLP-Ressourcen, die Auswahl passender Modelle für Forschungsvorhaben sowie die Förderung der Interoperabilität durch standardisierte Annotationsrichtlinien. Diese Initiative reagiert auf den steigenden Einsatz von NLP in der Literaturwissenschaft historischer Sprachen und die damit verbundenen Herausforderungen, wie die Diversität an Modellen, die fehlende zentrale Verwaltung von Ressourcen und die Notwendigkeit einer systematischen Evaluation.

SEFLAG konzentriert sich zunächst auf Lemmatisierung und Named Entity Recognition (NER) und plant zukünftig die Erweiterung um weitere NLP-Tasks. Die Ergebnisse werden auf Plattformen wie Hugging Face veröffentlicht und zielen darauf ab, der Forschungsgemeinschaft Zeit und Ressourcen zu sparen. Durch Dokumentation und Benchmarking wird eine nachhaltige Infrastruktur geschaffen, die Forschenden in den Bereichen Philologie, Geschichte und Archäologie zugutekommt und Innovationen im Bereich der historischen NLP-Methoden fördert.

Files

korpling_kolloquium_2024_seflag.pdf

Files (834.4 kB)

Name	Size	Download all
korpling_kolloquium_2024_seflag.pdf md5:19153cafd3796280f6f963e4485bbb40	834.4 kB	Preview Download

Additional details

Deutsche Forschungsgemeinschaft
Daidalos-Projekt - Entwicklung einer Infrastruktur zum Einsatz von Natural Language Processing für Forschende der Klassischen Philologie 518919950

Repository URL: https://github.com/daidalos-project/seflag
Programming language: Python
Development Status: Wip

	All versions	This version
Views	55	55
Downloads	57	57
Data volume	56.7 MB	56.7 MB

SEFLAG. Systematic Evaluation Framework for NLP Models and Datasets in Latin and Ancient Greek

Contributors

Project member:

Files

korpling_kolloquium_2024_seflag.pdf

Files (834.4 kB)

Additional details

Funding

Software

SEFLAG. Systematic Evaluation Framework for NLP Models and Datasets in Latin and Ancient Greek

Creators

Contributors

Project member:

Description

Files

korpling_kolloquium_2024_seflag.pdf

Files (834.4 kB)

Additional details

Funding

Software