Published February 20, 2022 | Version v1
Conference paper Open

O IMPACTO DA PANDEMIA NOS MICRO E PEQUENOS EMPRESÁRIOS: APLICAÇÃO DE MODELAGEM DE TÓPICOS EM COMENTÁRIOS NO INSTAGRAM

  • 1. ROR icon São Paulo State Technological College

Description

A presente pesquisa exploratória consiste na aplicação de técnica de modelagem de tópicos, denominada Latent Dirichlet Allocation ou LDA, em comentários publicados na plataforma de mídia social Instagram em posts de perfis dos principais veículos editoriais de notícias que publicam sobre empreendedorismo, negócios e temas relacionados. Foram coletados posts e comentários de um total de 9 perfis ao longo de 17 meses de pandemia, que foram tratados para análise. A aplicação da técnica de modelagem de tópicos permitiu identificar diferentes temas abordados facilitando a análise exploratória do impacto que a pandemia causou e que foi comentado pelos micro e pequenos empreendedores no Instagram. A técnica se mostrou eficaz e adequada para uma análise exploratória em um contexto de big data, permitindo a seleção de uma amostra de comentários para leitura analítica entre dezenas de milhares, agrupada por tópicos, e sem os vieses de leitura da realidade se considerasse apenas os conteúdos que nos chegam mediados pelos algoritmos das plataformas, como os conteúdos virais.

Abstract (English)

This exploratory research consists of applying a topic modeling technique, called Latent Dirichlet Allocation or LDA, in comments published on the social media platform Instagram in profile posts of the main editorial news vehicles that publish about entrepreneurship, business and related topics. Posts and comments were collected from a total of 9 profiles over the 17 months of the pandemic, which were processed for analysis. The application of the topic modeling technique allowed us to identify different topics covered, facilitating the exploratory analysis of the impact that the pandemic caused and that was commented on by micro and small entrepreneurs on Instagram. The technique proved to be effective and adequate for an exploratory analysis in a big data context, allowing the selection of a sample of comments for analytical reading among tens of thousands, grouped by topics, and without the biases of reading reality if only the contents that reach us mediated by platform algorithms, such as viral contents.

Files

4_EnGeTec_paper_176.pdf

Files (978.4 kB)

Name Size Download all
md5:7b6e173237ed911c1db6be7175bb2202
978.4 kB Preview Download

Additional details

References

  • AGÊNCIA BRASIL. Primeira morte por covid-19 no Brasil aconteceu em 12 de março. Disponível em: <https://agenciabrasil.ebc.com.br/saude/noticia/2020-06/primeira-morte-por-covid-19-no-brasil-aconteceu-em-12-de-marco>. Acesso em 14 março 2021.
  • BLEI, David M.; NG, Andrew Y.; JORDAN, Michael I. Latent dirichlet allocation. the Journal of machine Learning research, v. 3, p. 993-1022, 2003.
  • ESHIMA, Shusei, KOSUKE Imai, TOMOYA Sasaki. Keyword assisted topic models. arXiv preprint arXiv:2004.05964, 2020.
  • FALEIROS, Thiago de Paulo et al. Modelos probabilísticos de tópicos: desvendando o latent Dirichlet allocation. 2016.
  • LU, Bin et al. Multi-aspect sentiment analysis with topic models. 2011 IEEE 11th international conference on data mining workshops. IEEE, 2011. p. 81-88.
  • PHAN, Xuan-Hieu; NGUYEN, Le-Minh; HORIGUCHI, Susumu. Learning to classify short and sparse text & web with hidden topics from large-scale data collections. Proceedings of the 17th international conference on World Wide Web. 2008. p. 91-100.
  • SILGE, Julia; ROBINSON, David. Text mining with R: A tidy approach. " O'Reilly Media, Inc.", 2017.
  • WICKHAM, Hadley; GROLEMUND, Garrett. R for data science: import, tidy, transform, visualize, and model data. " O'Reilly Media, Inc.", 2016.