Song Describer Dataset

Manco, Ilaria; Weck, Benno; Bogdanov, Dmitry; Tovstogan, Philip; Won, Minz

doi:10.5281/zenodo.10072001

Published November 16, 2023 | Version 1.0.0

Dataset Open

Song Describer Dataset

1. Queen Mary University of London
2. Pompeu Fabra University
3. Universitat Pompeu Fabra

The Song Describer Dataset: a Corpus of Audio Captions for Music-and-Language Evaluation

A retro-futurist drum machine groove drenched in bubbly synthetic sound effects and a hint of an acid bassline.

The Song Describer Dataset (SDD) contains ~1.1k captions for 706 permissively licensed music recordings. It is designed for use in evaluation of models that address music-and-language (M&L) tasks such as music captioning, text-to-music generation and music-language retrieval. More information about the data, collection method and validation is provided in the paper describing the dataset.

If you use this dataset, please cite our paper:

The Song Describer Dataset: a Corpus of Audio Captions for Music-and-Language Evaluation, Manco, Ilaria and Weck, Benno and Doh, Seungheon and Won, Minz and Zhang, Yixiao and Bogdanov, Dmitry and Wu, Yusong and Chen, Ke and Tovstogan, Philip and Benetos, Emmanouil and Quinton, Elio and Fazekas, György and Nam, Juhan, Machine Learning for Audio Workshop at NeurIPS 2023, 2023

Files

audio.zip

Files (3.3 GB)

Name	Size
audio.zip md5:2126b8facfe9468cf806c6154e09bbe5	3.3 GB	Preview Download
audio_licenses.txt md5:cda13a080c03e14b8319430e1486ae6e	162.2 kB	Preview Download
audio_metadata.tsv md5:fa5d126659b08680719d189387d61e39	97.7 kB	Download
data_dump_14_04_23.zip md5:afd19dbc39ba86d9c959d84b0cbb89db	141.8 kB	Preview Download
datasheet.pdf md5:e2bf7d961dceb364e9dc7ab82f80c0b4	204.2 kB	Preview Download
song_describer.csv md5:e90e9459c22bfbe69f5462dc1434d573	186.2 kB	Preview Download
song_describer_14_04_23.mtg-jamendo.tsv md5:3532f2df8b4c21a7ea85d9121eae244a	108.7 kB	Download

Additional details

Subtitle: a Corpus of Audio Captions for Music-and-Language Evaluation

Is derived from: Dataset: 10.5281/zenodo.3826813 (DOI)
Is supplemented by: Software: https://github.com/ilaria-manco/song-describer-dataset (URL)

UK Research and Innovation
UKRI Centre for Doctoral Training in Artificial Intelligence and Music EP/S022694/1
Agencia Estatal de Investigación
Musical AI: Artificial intelligence to support musical experiences: towards a data-driven, human-centred approach PID2019-111403GB-I0

	All versions	This version
Views	4,812	4,812
Downloads	6,095	6,095
Data volume	9.7 TB	9.7 TB

The Song Describer Dataset: a Corpus of Audio Captions for Music-and-Language Evaluation

audio.zip

Files (3.3 GB)

Additional titles

Related works

Funding

Song Describer Dataset

Authors/Creators

Description

The Song Describer Dataset: a Corpus of Audio Captions for Music-and-Language Evaluation

Files

audio.zip

Files (3.3 GB)

Additional details

Additional titles

Related works

Funding