Published November 4, 2025 | Version v2
Dataset Open

Dados do estudo " The Impact of Prosodic Segmentation on Speech Synthesis of Spontaneous Speech"

Description

Dados de áudio e arquivos textgrids do estudo The Impact of Prosodic Segmentation on Speech Synthesis of Spontaneous Speech. Utilizamos uma amostra de fala natural para a fase de testes do nosso experimento, a fim de compará-la prosodicamente com dois grupos de fala sintetizada pelo FastSpeech 2. Para os propósitos deste estudo, selecionamos declarativas do locutor SP-DID-234-TB-L1, livres de ênfase, sobreposição de turno, riso, ruído ou outros elementos paralinguísticos. Cada fala continha uma única fronteira terminal (QT) ou uma fronteira não terminal (FNT) dentro de uma FT. A seleção de declarativas neutras de um corpus de fala espontânea é uma tarefa desafiadora; portanto, 30 frases foi o número máximo que correspondeu estritamente aos critérios estabelecidos. Anotamos 4 pontos de F0 na fala natural, descritos no artigo. Posteriormente, marcamos exatamente os 4 pontos nas versões sintetizadas do FastSpeech2.

Files

Áudios e Textgrids da fala do FastSpeech2 a partir do NURC-SP CM segmentado pelo Whisper.zip