Presentation Open Access

Bag of words vs. Textsegmentierung auf Artikelebene. Workflow zur Texterkennung einer vormodernen Anzeigenzeitung

Serif, Ina

Vorstellung des Workflows zur Texterkennung einer vormodernen Anzeigenzeitung (18./19. Jh.) auf Artikelebene mithilfe manuell erstelltem Layout-Groundtruth zur Entwicklung eines Layouterkennungsmodells hin zur automatischen Layouterkennung als Grundlage der segmentierten Texterkennung (u.a. mit Transkribus und dhSegment)

Files (3.6 MB)
Name Size
Avisblatt_Workshop_DHd_Frankfurt_inaserif_pp.pdf
md5:da53975e5af2f315ee29fde86251a0cc
3.6 MB Download
156
60
views
downloads
All versions This version
Views 156125
Downloads 6055
Data volume 217.9 MB200.0 MB
Unique views 143116
Unique downloads 5452

Share

Cite as