Usos da plataforma R para processamento de dados fonéticos
Description
Em dados naturalísticos de fala, fenômenos fonéticos, fonológicos e prosódicos não raro ocorrem em abundância, o que acarreta no dispêndio demasiado de tempo para seu devido tratamento. Este minicurso tem o objetivo de apresentar os fundamentos da linguagem R (R Core Team 2018) e certos recursos que a plataforma oferece para a criação de scripts que otimizam o tratamento de dados. Em especial, serão apresentados: (i) o script silac (Oushiro 2018), que transforma uma transcrição ortográfica de textos em português em uma transcrição fonológica, com marcação de acento e de segmentação silábica; (ii) o pacote dmsocio (Oushiro 2014), que automaticamente identifica ocorrências de uma variável e as extrai para uma planilha, a partir de uma transcrição (ortográfica ou fonológica); e (iii) expressões regulares e funções específicas do R, que permitem a manipulação automática de uma grande quantidade de dados. (Os participantes deverão trazer um laptop e ter instalados certos programas e materiais, a ser divulgados antes do período do minicurso.)
Referências
Oushiro, L. (2014) Tratamento de dados com o R para análises sociolinguísticas. In: Freitag, R.M.K. Metodologia de Coleta e Manipulação de Dados em Sociolinguística. São Paulo: Ed. Blucher.
Oushiro, L. (2018) silac: Transcritor fonológico do português. Versão online (v0.5.1). Disponível em <oushiro.shinyapps.io/silac>.
R Core Team (2018). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em <https://www.R-project.org/>.
Files
materiaisEscolaProsodia.zip
Files
(4.5 MB)
Name | Size | Download all |
---|---|---|
md5:ec57aff2e85836c14fd5a8c54e97f5b2
|
4.5 MB | Preview Download |