Published February 26, 2025 | Version v1
Conference paper Open

Reddit als (Text-)Ressource: Erstellung und Nachnutzbarkeit eines deutschsprachigen Reddit-Korpus

  • 1. Berlin-Brandenburgische Akademie der Wissenschaften, Deutschland
  • 2. Universität Heidelberg, Deutschland
  • 1. Universität zu Köln
  • 2. Universität Passau
  • 3. Universität Bielefeld
  • 4. Digital Humanities im deutschsprachigen Raum

Description

Das Poster präsentiert die Erstellung eines deutschsprachigen Reddit-Korpus aus 40 manuell ausgewählten Subreddits, einschließlich der Datenbereinigung und Konvertierung in TEI-XML. Es stellt zudem die vollständige Datenverarbeitungskette dar, die zur weiteren Nutzung im öffentlichen Repositorium bereitgestellt wird. Darüber hinaus wird die laufende Integration des Korpus in die Textkorpora des Digitalen Wörterbuchs der deutschen Sprache (DWDS) aufgezeigt, welche breite Untersuchungsmöglichkeiten für die Sprachwissenschaft und andere Disziplinen sowie allgemein die Digital Humanities eröffnet.

Files

G_TTEL_Sebastian_Reddit_als__Text__Ressource__Erstellung_und.pdf

Additional details

Related works

Is part of
Book: 10.5281/zenodo.14887460 (DOI)
Is supplemented by
Poster: 10.5281/zenodo.14944552 (DOI)