Conjunto de dados utilizados no estudo "Algoritmo para análise de presença online de pesquisadores da base ORCID"
Description
Conjunto de dados utilizados no estudo "Algoritmo para análise de presença online de pesquisadores da base ORCID apresentado e publicado nos anais do VIII Workshop de Informação, Dados e Tecnologia (WIDaT).
Este repositório contém o código criado e utilizado no estudo (Algoritmo de presença online_ORCID.R), o arquivo utilizados para testes (1000_ORCID_usp_unicamp_unesp_ufmg_ufrj.txt) e os resultados gerados (rede de de presença online e presenca online).
###
1) Código em linguagem R para extração e visualização da presença online de pesquisadores com registro na base ORCID.
Este programa consome a API pública do ORCID: https://pub.orcid.org/v3.0/{orcid}/record
- A partir desta API, são extraídos e organizados dados relativos à presença online do pesquisador.
- O programa extrai os seguintes dados: ORCID IDs, Nome, País, Websites & social links e Other ID.
- Utilizando os dados oriundos dos Websites & social links, extrai o domínio de cada website ou rede social
Estes dados permitem gerar os seguintes resultados:
- Tabela de dados gerais: tabela com dados brutos contendo ORCID IDs, Nome, País, Websites & social links, links dos websites, domínio dos websites, Outros ID e links dos Outros ID.
- Tabela de dados sumarizados: similar à tabela de dados gerais, porém com dados únicos e aglutinados.
- Tabela dupla entre País e Domínio: tabela cruzada entre os países de origem e domínios dos Websites & social links.
- Rede (grafo) de presença online: grafo relacionando cada ORCID ID aos respectivos domínios de Websites & social links.
###
2) Arquivo para teste
Conjunto de 1000 ORCID iDs composto pelos 200 primeiros resultados de busca no site da ORCID (orcid.org) das cinco universidades brasileiras mais bem ranqueadas no Scimago Institution Ranking 2025: Universidade de São Paulo (USP), Universidade de Campinas (UNICAMP), Universidade Estadual Paulista (UNESP), Universidade Federal de Minas Gerais (UFMG) e Universidade Federal do Rio de Janeiro (UFRJ). Buscou-se pela sigla de cada uma das universidades para gerar o conjunto com os 200 primeiros resultados de cada busca, gerando uma lista de 1000 Orcid iDs.
###
3) Resultados gerados
Planilha "presenca online.xlsx" contendo 4 abas:
- Aba 1: Dados Gerais - Tabela com oito colunas contendo Número de ORCID (Orcid iDs), Nome, país de origem, websites e mídias sociais (Websites & social links), urls dos respectivos websites e mídias sociais, Domínio (Plataforma), outros identificadores (Other IDs) e as respectivas urls dos outros identificadores
- Aba 2: Dados Sumarizados - Possui com valores únicos, aglutinando nas colunas “Domínio (Plataforma)” e “Outros ID”, em uma única célula, estas informações utilizando o separador ponto e vírgula (;)
- Aba 3: País x Plataforma: Tabela dupla entre país de origiem e plataformas.
- Aba 4: Coocorrência entre Plataformas - Coocorrencia entre as plataformas presente nos perfís dos pesquisadores.
Rede de Coocorrência "rede de presença online.html":
Rede (grafo) de coocorrencia entre as plataformas dos perfís analisados.
###