Published November 2024 | Version v1
Publication Open

SrpCNNeL: Serbian Model for Named Entity Linking

  • 1. ROR icon University of Belgrade – Faculty of Philology
  • 2. ROR icon University of Belgrade
  • 3. ROR icon University of Belgrade - Faculty of Mining and Geology

Description

Ovaj rad predstavlja razvoj modela za prepoznavanje i povezivanje imenovanih entiteta (NEL) sa bazom znanja Vikipodaci za srpski jezik pod nazivom SrpCNNeL. Model je obučen da prepozna i poveže sedam različitih imenovanih tipova entiteta (osobe, lokacije, organizacije, profesije, događaji, demoni i umetnička dela) na skupu podataka koji sadrži rečenice iz romana, pravnih dokumenata, kao i rečenice generisane iz znanja Vikipodataka baza i Leksimirka leksička baza podataka. Dobijeni model je pokazao dobre performanse, postigavši F1 rezultat od 0,8 na test skupu. S obzirom da skup podataka sadrži najveći broj lokacija povezanih sa bazom znanja, evaluacija je sprovedena na nezavisnom skupu podataka i upoređena sa osnovnim modelom Spacy Entity Linker samo za lokacije.

Files

SrpCNNEL-FedCSIS.pdf

Files (6.2 MB)

Name Size Download all
md5:7bf4e33c34ba17c18e5fa2f8b0d87188
6.2 MB Preview Download