LLM-Benchmarking für die Digital Humanities: Ein praxisorientierter Ansatz aus der Forschungsberatung

Hindermann, Maximilian

doi:10.5281/zenodo.17582144

Published November 11, 2025 | Version v1

Presentation Open

LLM-Benchmarking für die Digital Humanities: Ein praxisorientierter Ansatz aus der Forschungsberatung

Hindermann, Maximilian¹

1. University of Basel

Slides for AGDH-KI Webinar

Grosse Sprachmodelle (LLMs) werden zunehmend in den digitalen Geisteswissenschaften eingesetzt. Doch welches Modell eignet sich für welche Aufgabe, und wie lassen sich Leistung, Kosten und Aufwand zuverlässig vergleichen? Das Webinar stellt die RISE Humanities Data Benchmark Suite vor, ein offenes Framework zur Evaluation von Sprachmodellen auf geisteswissenschaftlichen Bild- und Textdaten.

Im Unterschied zu allgemeinen NLP-Benchmarks richtet sich der Ansatz an den praktischen Fragen realer DH-Projekte aus: Wann sind Ergebnisse «gut genug» für den Projektkontext? Wie lässt sich die Verarbeitung grosser Datenmengen planen? Und was ist technisch möglich, wenn sensible Materialien lokal bleiben müssen?

Das Webinar zeigt den Aufbau der Benchmark-Suite, zentrale Metriken zu Leistung, Kosten und Laufzeit sowie Vergleichsergebnisse verschiedener Modelle, darunter GPT, Claude, Gemini, Mistral und Llama. Zudem werden Infrastruktur-Optionen vorgestellt – von API-Diensten über OpenRouter bis zu lokalen HPC-Installationen – und in einer kurzen Demonstration gezeigt, wie sich die Suite für eigene Evaluationen einsetzen lässt.

Files

LLM-Benchmarking für die Digital Humanities_ 2025-11-11.pdf

Files (3.9 MB)

Name	Size	Download all
LLM-Benchmarking für die Digital Humanities_ 2025-11-11.pdf md5:9282ea2314f465d3bb95cb600ae6f1c0	3.9 MB	Preview Download

Additional details

Describes: Software: 10.5281/zenodo.16941752 (DOI)

	All versions	This version
Views	105	105
Downloads	50	50
Data volume	261.9 MB	261.9 MB

LLM-Benchmarking für die Digital Humanities: Ein praxisorientierter Ansatz aus der Forschungsberatung

Authors/Creators

Description

Files

LLM-Benchmarking für die Digital Humanities_ 2025-11-11.pdf

Files (3.9 MB)

Additional details

Related works