Corpus of Occitan Written Traditional Folktales Annotated with Part-Of-Speech (OWT-Tag)

Marianne Vergez-Couret

doi:10.5281/zenodo.1456564

Published October 11, 2018 | Version 0.0.1

Dataset Open

Corpus of Occitan Written Traditional Folktales Annotated with Part-Of-Speech (OWT-Tag)

Marianne Vergez-Couret¹

1. Queen's University

Contributors

Contact person:

Marianne Vergez-Couret¹

1. Queen's University

This resource contains 5 extracts of texts in Occitan which were manually annotated with lemmas and parts-of-speech, following the Grace standard. It was produced during the ExpressioNarration project, funded by a Marie Curie Individual Fellowship, in order to evaluate the performance of an Occitan Part-Of-Speech tagger, Talismane, to the specifities of the corpus of the project called Oral Occitan (OcOr), also available on https://zenodo.org/record/1451753#.W78FJWOYSpo.
Each extract contains around 1500 words. They are extracted from 'Contes et proverbes populaires recueillis en armagnac et Contes populaires recueillis en agenais' de J.-F. Bladé, 'Coundes biarnés, couéilhuts aüs parsàas miéytadès dou péys dé Biarn' de J.-V. Lalanne, 'Contes populaires du Languedoc' de L. Lambert and 'Contes populaires recueillis dans la Grande-Lande' de F. Arnaudin.
The annotation process is described in the following article available on https://www.openscience.fr/IMG/pdf/iste_modocv1n1_2.pdf.

Files

OWT-tag.zip

Files (35.1 kB)

Name	Size	Download all
OWT-tag.zip md5:8931fd2ac6bf619177c705eabe5f83ec	35.1 kB	Preview Download

Additional details

European Commission
EXPRESSIONARRATION - Narration, linguistic expression and discourse structure: explorations of orality in Occitan and French 655034

Vergez-Couret M. (2017). « Constitution et annotation d'un corpus écrit de contes et récits en occitan », Analyses et méthodes formelles pour les humanités numériques, ISTE OpenScience, 1-1, publication en ligne : https://www.openscience.fr/Constitution-et-annotation-d-un-corpus-ecrit-de-contes-et-recits-en-occitan.

	All versions	This version
Views	778	772
Downloads	76	75
Data volume	2.9 MB	2.8 MB

Contributors

Contact person:

OWT-tag.zip

Files (35.1 kB)

Funding

References

Corpus of Occitan Written Traditional Folktales Annotated with Part-Of-Speech (OWT-Tag)

Authors/Creators

Contributors

Contact person:

Description

Files

OWT-tag.zip

Files (35.1 kB)

Additional details

Funding

References