SIMPITIKI corpus for simplification in Italian

doi:10.5281/zenodo.2535627

Simpatico project community

There is a newer version of the record available.

Published January 8, 2019 | Version v1

Dataset Open

SIMPITIKI corpus for simplification in Italian

1. Fondazione Bruno Kessler

SIMPITIKI is a Simplification corpus for Italian and it consists of two sets of simplified pairs: the first one is harvested from the Italian Wikipedia in a semi-automatic way; the second one is manually annotated sentence-by-sentence from documents in the administrative domain.

For more details, see https://github.com/dhfbk/simpitiki

Files

simpitiki.zip

Files (365.6 kB)

Name	Size	Download all
simpitiki.zip md5:0925a605d41219bf6196696dba5ab147	365.6 kB	Preview Download

Additional details

SIMPATICO – SIMplifying the interaction with Public Administration Through Information technology for Citizens and cOmpanies 692819: European Commission

Sara Tonelli, Alessio Palmero Aprosio, Francesca Saltori. SIMPITIKI: a Simplification corpus for Italian extracted from Wikipedia. In Proceedings of the Third Italian Conference on Computational Linguistics, Naples, Italy.

649

Views

Downloads

Show more details

	All versions	This version
Views	649	317
Downloads	28	3
Data volume	24.8 MB	1.1 MB

More info on how stats are collected....

DOI

Resource type

Dataset

Publisher

Zenodo

Creative Commons Attribution 4.0 International

The Creative Commons Attribution license allows re-distribution and re-use of a licensed work on the condition that the creator is appropriately credited. Read more

Technical metadata

Created: January 8, 2019
Modified: January 24, 2020

SIMPITIKI corpus for simplification in Italian

Files

simpitiki.zip

Files (365.6 kB)

Additional details

Funding

References

SIMPITIKI corpus for simplification in Italian

Creators

Description

Files

simpitiki.zip

Files (365.6 kB)

Additional details

Funding

References