Video-aligned sarcasm dataset in Spanish

Hämäläinen, Mika; Alnajjar, Khalid

doi:10.5281/zenodo.4701383

Published April 19, 2021 | Version 1.0

Dataset Open

Video-aligned sarcasm dataset in Spanish

1. University of Helsinki

This is the same data as in (https://www.kaggle.com/mikahama/the-best-sarcasm-annotated-dataset-in-spanish). The difference is that the text is in chronological order and has been aligned with video. A change in scene is indicated with #. The file has video file names and start and end positions in milliseconds for each utterance.

This release does not include the video files due to copyright reasons. The text has been transcribed by us by hand and it does not originate form subtitles. The data is provided for academic research purposes only.

If you use this data in your research, please cite:

Alnajjar, K., & Hämäläinen, M. (2021) ¡Qué maravilla! Multimodal Sarcasm Detection in Spanish: a Dataset and a Baseline. In the Proceedings of Third Workshop on Multimodal Artificial Intelligence (MAI-Workshop).

The data is based on the following work:

Parker, Trey & Stone, Matt (2012). South Park. 16ª temporada. South Park Digital Studios, LLC.

Episodio 2. Compramos oro. Fecha de emisión: 21.3.2012
Episodio 8. Sarcasmobol. Fecha de emisión: 26.9.2012

Reed, Adam (2015). Archer. 6ª temporada. Floyd County Productions.

Episodio 2. Tango para tres. Fecha de emisión: 15.1.2015
Episodio 6. Canguro. Fecha de emisión: 12.2.2015

Files

Files (74.5 kB)

Name	Size	Download all
sarcasmo.xlsx md5:032cb83a47cad192105e5040e1eed230	74.5 kB	Download

	All versions	This version
Views	566	563
Downloads	136	135
Data volume	10.4 MB	10.3 MB

Video-aligned sarcasm dataset in Spanish

Authors/Creators

Description

Files

Files (74.5 kB)