SrpCNNeL: Serbian Model for Named Entity Linking
Authors/Creators
Description
Ovaj rad predstavlja razvoj modela za prepoznavanje i povezivanje imenovanih entiteta (NEL) sa bazom znanja Vikipodaci za srpski jezik pod nazivom SrpCNNeL. Model je obučen da prepozna i poveže sedam različitih imenovanih tipova entiteta (osobe, lokacije, organizacije, profesije, događaji, demoni i umetnička dela) na skupu podataka koji sadrži rečenice iz romana, pravnih dokumenata, kao i rečenice generisane iz znanja Vikipodataka baza i Leksimirka leksička baza podataka. Dobijeni model je pokazao dobre performanse, postigavši F1 rezultat od 0,8 na test skupu. S obzirom da skup podataka sadrži najveći broj lokacija povezanih sa bazom znanja, evaluacija je sprovedena na nezavisnom skupu podataka i upoređena sa osnovnim modelom Spacy Entity Linker samo za lokacije.
Files
SrpCNNEL-FedCSIS.pdf
Files
(6.2 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:7bf4e33c34ba17c18e5fa2f8b0d87188
|
6.2 MB | Preview Download |