Published July 1, 2021 | Version v2
Dataset Open

Brazilian Portuguese COVID-19 Tweets

Description

Brazilian Portuguese symptoms about COVID-19:

  • Source: Twitter
  • Start: 2019-01-01 (January 1st)
  • End: 2021-09-30 (September 30th)
  • Tweets: 13,859,059
    • Year 2019 [full year]: 4,043,958 obs. of 26 variables (Brazil_Portuguese_COVID19_Tweets2019.csv)
    • Year 2020 [full year]: 6,155,844 obs. of 26 variables (Brazil_Portuguese_COVID19_Tweets2020.csv)
    • Year 2021 [Q1 - Q3]: 3,659,257 obs. of 26 variables (Brazil_Portuguese_COVID19_Tweets2021.csv)

Search terms (56 symptoms keywords about COVID-19):

(1) adinamia, (2) ageusia, (3) anosmia, (4) boca azulada, (5) calafrio, (6) cansaço, (7) cefaleia, (8) cianose, (9) coloração azulada no rosto, (10) congestão nasal, (11) conjuntivite, (12) coriza, (13) desconforto respiratório, (14) diarreia, (15) dificuldade para respirar, (16) diminuição do apetite, (17) dispneia, (18) distúrbio gustativo, (19) distúrbio olfativo, (20) dor abdominal, (21) dor de cabeça, (22) dor de garganta, (23) dor no corpo, (24) dor no peito, (25) dor persistente no tórax, (26) erupção cutânea na pele, (27) fadiga, (28) falta de ar, (29) febre, (30) gripe, (31) hiporexia, (32) inapetência, (33) infecção respiratória, (34) lábio azulado, (35) mialgia, (36) nariz entupido, (37) náusea, (38) obstrução nasal, (39) perda de apetite, (40) perda do olfato, (41) perda do paladar, (42) pneumonia, (43) pressão no peito, (44) pressão no tórax, (45) prostração, (46) quadro gripal, (47) quadro respiratório, (48) queda da saturação, (49) resfriado, (50) rosto azulado, (51) saturação baixa, (52) saturação de o2 menor que 95%, (53) síndrome respiratória aguda grave, (54) srag, (55) tosse, (56) vômito.

Variables:

Variable           str        Description
----------------------------------------------------------------------------------
id                (integer64) - Tweet identifier
conversation_id   (integer64) - Tweet conversation identifier
date              (POSIXct)   - Tweet created date (format: YYYY-MM-DD hh:mm:ss)
tweet             (chr)       - Symptoms mention about COVID-19
language          (chr)       - Tweet language: Portuguese 
hashtags          (chr)       - Sign (#) used to identify specific topic
user_id           (integer64) - User identifier
username          (chr)       - Twitter user name
link              (chr)       - Tweet url
urls              (chr)       - External urls from tweet
photos            (chr)       - Photos posted in message (link)
video             (int)       - Video posted in message (1=True;0=False)
thumbnail         (chr)       - Thumbnail posted in message
retweet           (logi)      - Message reposted by another user
nlikes            (int)       - Number of tweet likes     
nreplies          (in)        - Number of tweet replies  
nretweets         (int)       - Number of tweet retweets  
Near              (logi)      - Near a certain City (Example: London)
geo               (logi)      - Geo coordinates (lat,lon,km/mi.)
user_rt_id        (logi)      - User retweet identifier   
user_rt           (logi)      - Retweet user   
retweet_id        (logi)      - Retweet identifier
reply_to          (chr)       - Answer to someone
retweet_date      (logi)      - Retweet created date (format: YYYY-MM-DD hh:mm:ss)
symptoms          (chr)       - Symptoms mentioned
nsymptoms         (int)       - Number of symptons mentioned

str: Compactly Display the Structure of an Arbitrary R Object

Notes

The project is hosted on: https://codatmo.github.io/UNINOVE_Brazil/

Files

Brazil_Portuguese_COVID19_Tweets2019.csv

Files (4.2 GB)

Name Size Download all
md5:c5fcbf3b12ddb57293755c5ea2a73867
1.1 GB Preview Download
md5:5a88a4eca9f63ea86ba1e3b743194d12
1.9 GB Preview Download
md5:6f894a8495861dfc6d7e52e57421a489
1.2 GB Preview Download

Additional details

References

  • CODATMO.codatmo/UNINOVE_Brazil: Covid Modeling work at UNINOVE Brazil. [S.l.: s.n.],2021.https://github.com/codatmo/UNINOVE_Brazil. (Accessed on 07/26/2021).
  • DATASUS.Painel Coronavírus. 2021. Disponível em: <https://covid.saude.gov.br/>.Acesso em: 23 jul. 2021.
  • SANTOS, A. L. M. F. dos et al.Brazilian Portuguese COVID-19 Tweets. The project is hostedon: https://codatmo.github.io/UNINOVE_Brazil/. Jul. 2021. DOI:10.5281/zenodo.5073680.Disponível em: <https://doi.org/10.5281/zenodo.5073680>.
  • STOROPOLI, J.; SANTOS, A. L. M. F. dos; PELLINI, A. C. G.; BALDWIN, B.Simulation-DrivenCOVID-19 Epidemiological Modeling with Social Media. 2021. arXiv:2106.11686[stat.AP].Disponível em: <https://europepmc.org/article/PPR/PPR362249>.
  • UNA-SUS.Coronavírus: Brasil conrma primeiro caso da doença - Notícia - UNA-SUS.[S.l.: s.n.], fev. 2020.https://www.unasus.gov.br/noticia/coronavirus-brasil-confirma-primeiro-caso-da-doenca. (Accessed on 07/26/2021).
  • SANTOS, A. L. M. F.; STOROPOLI, J.;PELLINI, A. C. G. Desenvolvimento de um modelo epidemiológico aprimorado com dados de redes sociais e processamento de linguagem natural para a predição de casos de COVID-19. Mar. 2024. https://bibliotecatede.uninove.br/handle/tede/3237#preview-link0