Semantische Suche mit Word Embeddings für ein mehrsprachiges Wörterbuchportal
Contributors
- 1. Universität der Bundeswehr München, Deutschland
- 2. Universität Potsdam, Deutschland
- 3. Digital Humanities im deutschsprachigen Raum e.V., Deutschland
Description
"Das Poster präsentiert eine semantische Suchfunktion, basierend auf Word Embeddings, für das Lehnwortportal Deutsch (LWPD), ein Online-Informationssystem zu lexikalischen Entlehnungen aus dem Deutschen in andere Sprachen. Der onomasiologische Zugriff auf die lexikalischen Einheiten des Portals ermöglicht es Forschungsfragen, wie z.B. zur Wahrscheinlichkeit der Entlehnung von lexikalischen Einheiten mit einer bestimmten Bedeutung (Haspelmath/Tadmor, 2009; Zeller, 2015) zu beantworten. Die Suchtechnologie basiert auf multilingualen vortrainierten Word Embeddings: Bedeutungen von Wörtern aus dem Portal werden Vektoren zugeordnet. Die Benutzer:innen können ein oder mehrere Suchbegriff(e) aus einer großen Anzahl wählen, die Datenbank liefert dann lexikalische Einheiten aus dem LWPD, deren Vektor ähnlich zu dem des Suchbegriffs bzw. der Suchbegriffe ist. Wir zeigen die Vorteile dieses Ansatzes im Vergleich zu Suchfunktionen auf, die auf semantischen Feldern basieren. Außerdem geben wir eine vorläufige Evaluation der Qualität der Suchergebnisse."
Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
Files
TU_Ngoc_Duyen_Tanja_Semantische_Suche_mit_Word_Embeddings_f_.pdf
Files
(28.2 kB)
Name | Size | Download all |
---|---|---|
md5:b9288d683f05463f853be54edbeed6ef
|
13.4 kB | Preview Download |
md5:39960105cace775ea1f339fcf0e3f35b
|
14.8 kB | Preview Download |
Additional details
Related works
- Is part of
- Book: 10.5281/zenodo.6304590 (DOI)
- Is supplemented by
- Poster: 10.5281/zenodo.6322585 (DOI)