Published March 7, 2022 | Version v1
Conference paper Open

Semantische Suche mit Word Embeddings für ein mehrsprachiges Wörterbuchportal

  • 1. Leibniz-Institut für Deutsche Sprache, Germany
  • 1. Universität der Bundeswehr München, Deutschland
  • 2. Universität Potsdam, Deutschland
  • 3. Digital Humanities im deutschsprachigen Raum e.V., Deutschland

Description

"Das Poster präsentiert eine semantische Suchfunktion, basierend auf Word Embeddings, für das Lehnwortportal Deutsch (LWPD), ein Online-Informationssystem zu lexikalischen Entlehnungen aus dem Deutschen in andere Sprachen. Der onomasiologische Zugriff auf die lexikalischen Einheiten des Portals ermöglicht es Forschungsfragen, wie z.B. zur Wahrscheinlichkeit der Entlehnung von lexikalischen Einheiten mit einer bestimmten Bedeutung (Haspelmath/Tadmor, 2009; Zeller, 2015) zu beantworten. Die Suchtechnologie basiert auf multilingualen vortrainierten Word Embeddings: Bedeutungen von Wörtern aus dem Portal werden Vektoren zugeordnet. Die Benutzer:innen können ein oder mehrere Suchbegriff(e) aus einer großen Anzahl wählen, die Datenbank liefert dann lexikalische Einheiten aus dem LWPD, deren Vektor ähnlich zu dem des Suchbegriffs bzw. der Suchbegriffe ist. Wir zeigen die Vorteile dieses Ansatzes im Vergleich zu Suchfunktionen auf, die auf semantischen Feldern basieren. Außerdem geben wir eine vorläufige Evaluation der Qualität der Suchergebnisse."

Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.

Files

TU_Ngoc_Duyen_Tanja_Semantische_Suche_mit_Word_Embeddings_f_.pdf

Additional details

Related works

Is part of
Book: 10.5281/zenodo.6304590 (DOI)
Is supplemented by
Poster: 10.5281/zenodo.6322585 (DOI)