Published October 30, 2024 | Version 1.0
Presentation Open

SEFLAG. Systematic Evaluation Framework for NLP Models and Datasets in Latin and Ancient Greek

  • 1. ROR icon Humboldt-Universität zu Berlin

Contributors

Project member:

  • 1. ROR icon Humboldt-Universität zu Berlin

Description

Das SEFLAG-Framework, präsentiert von Konstantin Schulz und Florian Deichsler (Humboldt-Universität zu Berlin), stellt ein systematisches Evaluationsframework für NLP-Modelle und -Datensätze für Latein und Altgriechisch vor. Die Hauptziele sind die Bewertung und Dokumentation bestehender NLP-Ressourcen, die Auswahl passender Modelle für Forschungsvorhaben sowie die Förderung der Interoperabilität durch standardisierte Annotationsrichtlinien. Diese Initiative reagiert auf den steigenden Einsatz von NLP in der Literaturwissenschaft historischer Sprachen und die damit verbundenen Herausforderungen, wie die Diversität an Modellen, die fehlende zentrale Verwaltung von Ressourcen und die Notwendigkeit einer systematischen Evaluation.

SEFLAG konzentriert sich zunächst auf Lemmatisierung und Named Entity Recognition (NER) und plant zukünftig die Erweiterung um weitere NLP-Tasks. Die Ergebnisse werden auf Plattformen wie Hugging Face veröffentlicht und zielen darauf ab, der Forschungsgemeinschaft Zeit und Ressourcen zu sparen. Durch Dokumentation und Benchmarking wird eine nachhaltige Infrastruktur geschaffen, die Forschenden in den Bereichen Philologie, Geschichte und Archäologie zugutekommt und Innovationen im Bereich der historischen NLP-Methoden fördert.

Files

korpling_kolloquium_2024_seflag.pdf

Files (834.4 kB)

Name Size Download all
md5:19153cafd3796280f6f963e4485bbb40
834.4 kB Preview Download

Additional details

Funding

Deutsche Forschungsgemeinschaft
Daidalos-Projekt - Entwicklung einer Infrastruktur zum Einsatz von Natural Language Processing für Forschende der Klassischen Philologie 518919950

Software

Repository URL
https://github.com/daidalos-project/seflag
Programming language
Python
Development Status
Wip