Published October 25, 2018 | Version v1
Lesson Open

Usos da plataforma R para processamento de dados fonéticos

  • 1. UNICAMP

Description

Em dados naturalísticos de fala, fenômenos fonéticos, fonológicos e prosódicos não raro ocorrem em abundância, o que acarreta no dispêndio demasiado de tempo para seu devido tratamento. Este minicurso tem o objetivo de apresentar os fundamentos da linguagem R (R Core Team 2018) e certos recursos que a plataforma oferece para a criação de scripts que otimizam o tratamento de dados. Em especial, serão apresentados: (i) o script silac (Oushiro 2018), que transforma uma transcrição ortográfica de textos em português em uma transcrição fonológica, com marcação de acento e de segmentação silábica; (ii) o pacote dmsocio (Oushiro 2014), que automaticamente identifica ocorrências de uma variável e as extrai para uma planilha, a partir de uma transcrição (ortográfica ou fonológica); e (iii) expressões regulares e funções específicas do R, que permitem a manipulação automática de uma grande quantidade de dados. (Os participantes deverão trazer um laptop e ter instalados certos programas e materiais, a ser divulgados antes do período do minicurso.)  

 

Referências

Oushiro, L. (2014) Tratamento de dados com o R para análises sociolinguísticas. In: Freitag, R.M.K. Metodologia de Coleta e Manipulação de Dados em Sociolinguística. São Paulo: Ed. Blucher.

Oushiro, L. (2018) silac: Transcritor fonológico do português. Versão online (v0.5.1). Disponível em <oushiro.shinyapps.io/silac>.

R Core Team (2018). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em <https://www.R-project.org/>.

Files

materiaisEscolaProsodia.zip

Files (4.5 MB)

Name Size Download all
md5:ec57aff2e85836c14fd5a8c54e97f5b2
4.5 MB Preview Download