Data on scientific production on letramento informacional in Brazil: collection procedures and resulting corpus [Dataset for thesis] Dados sobre a produção científica sobre letramento informacional no Brasil: procedimentos de coleta e corpus resultante BY Mariana de Souza Alves (UFPE) Data from: Alves, Mariana de Souza. Apropriação do termo letramento pela Biblioteconomia e Ciência da Informação brasileira: tensões terminológico-conceituais em torno do letramento informacional. Orientação: Marcos Galindo Lima. Coorientação: Maria do Socorro Alencar Nunes Macedo. 2023. 542f. Tese (Doutorado em Ciência da Informação), Universidade Federal de Pernambuco, Recife, 2023.Disponível em: https://attena.ufpe.br/handle/123456789/53340. Acesso em: 9 dez. 2023. How to cite this dataset: Alves, Mariana de Souza. (2024). Data on scientific production on letramento informacional in Brazil: collection procedures and resulting corpus [Dataset for thesis]. Zenodo. DOI 10.5281/zenodo.10672668. 1 Procedimentos de coleta A seguir, descreveremos os procedimentos de coleta de informações empreendidas para a realização do estudo Apropriação do termo letramento pela Biblioteconomia e Ciência da Informação brasileira: tensões terminológico-conceituais em torno do letramento informacional de Alves (2023). Os dados descritos a seguir podem ser reutilizados para a geração de diversos estudos métricos sobre o tema, ajudando a identificar aspectos temporais, temáticos, geográficos, epistemológicos, dentre outros acerca da difusão do termo no país. 1.1 Levantamento sistemático da produção científica Optamos, na primeira fase, por fazer um levantamento amplo e multidisciplinar. A nossa pergunta norteadora para explorar o tema durante esta etapa foi: Do ponto de vista histórico-epistemológico, como se configuram os estudos sobre letramento informacional no contexto brasileiro? Com essa pergunta pretendíamos coletar os trabalhos que utilizassem o termo letramento informacional, que apresentassem as justificativas para a preferência pela tradução de information literacy para letramento informacional, bem como as discussões que apresentassem um quadro teórico sobre o tema e a aplicação do conceito. Para isso, partimos de princípios e do protocolo da Revisão Sistemática da Literatura (RSL) para fazer uma busca sistemática, mas esta pesquisa não se trata de uma revisão sistemática de fato, visto que esta exige um trabalho coletivo de escolhas e visa identificar tendências temáticas, o que não era o nosso intento. Além disso, a particularidade desta pesquisa necessitou de um levantamento que incluísse critérios específicos que possibilitassem a inclusão de outros trabalhos. Dessa forma, do ponto de vista metodológico, esta pesquisa está mais próxima de um mapeamento ou levantamento de trabalhos sobre o tema letramento informacional no Brasil, considerando os objetivos do estudo, do que de uma RSL propriamente dita. Dessa maneira, os gêneros textuais acadêmicos-científicos que compõem o corpus são os seguintes: artigos científicos, comunicações em eventos (de qualquer tipo, anais, poster) e dissertações e teses. Para isso, escolhemos bases de dados das áreas de Ciências Humanas e Ciências Sociais Aplicadas (tanto multidisciplinares como disciplinares, principalmente as subáreas de Educação e BCI), sobretudo as que indexam periódicos brasileiros. Para a seleção das fontes, foram realizadas as buscas na biblioteca virtual do Portal de Periódicos, da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)1 e nas seguintes bases de dados: Biblioteca Digital Brasileira de Teses e Dissertações (BDTD)2; Catálogo de Teses e Dissertações da CAPES (CTDC)3, como bases multidisciplinares para recuperar trabalhos de outras áreas que publicaram sobre o tema que não apenas a área da BCI. Tais bases também foram escolhidas por serem bases essenciais para a divulgação científica no Brasil. Para contemplar os trabalhos em BCI, já que temos bases de dados específicas em nossa área, foram escolhidas a coleção BENANCIB e a Base de Dados Referenciais de Artigos de Periódicos em Ciência da Informação (BRAPCI). A primeira coleção está no Repositório do Projeto de Pesquisa "Questões em Rede”, que indexa trabalhos e palestras apresentados nos Encontros Nacionais de Pesquisa e Pós-Graduação em Ciência da Informação (ENANCIBs), desde sua primeira edição em 1994 4. 1 O acesso remoto ao conteúdo assinado do Portal de Periódicos foi feito via Comunidade acadêmica federada (CAFe) da UFPE, provido pela Rede Nacional de Ensino e Pesquisa (RNP): https://www-periodicos-capes-gov-br.ezl.periodicos.capes.gov.br/. 2 Página inicial da BDTD: https://bdtd.ibict.br/vufind/Content/whatIs. 3 Interface de busca do Catálogo: http://catalogodeteses.capes.gov.br/catalogo-teses/#!/. 4 “Criado pelo Grupo de Pesquisa “‘Informação, Discurso e Memória’, da Universidade Federal Fluminense, cadastrado no CNPq, em parceria com a ANCIB, é viabilizado por financiamento da Fundação Carlos Chagas de Amparo à Pesquisa do Rio de Janeiro (FAPERJ), Bolsas do CNPq e pelo apoio técnico da Superintendência de Tecnologia da Informação – STI/ UFF, onde também está hospedado.” (Questões [...], [2021]). Disponível em: http://repositorios.questoesemrede.uff.br/repositorios/. Já a BRAPCI 5 é uma base de dados referencial que indexa artigos de títulos de periódicos da área de Ciência da Informação desde 1972 até o momento atual 6 (Bufrem; Costa; Gabriel Junior; Pinto, 2010). Embora a BRAPCI também indexe anais do ENANCIB, ela não o faz para todos os anos e há documentos em uma base que não está em outra. No nosso caso, a coleção BENANCIB, recuperou trabalhos sobre o tema de 2009 a 2016 e a BRAPCI só trouxe trabalhos de 2018 a 2019. 5 Página inicial da BRAPCI: https://brapci.inf.br/index.php/res/collections. 6 A base é “o produto de informação do projeto de pesquisa “Opções metodológicas em pesquisa: a contribuição da área da informação para a produção de saberes no ensino superior”, cujo objetivo é subsidiar estudos e propostas na área de Ciência da Informação, fundamentando-se em atividades planejadas institucionalmente” (Base [...], [2021]). Disponível em: https://brapci.inf.br/index.php/res/about. Dessa forma, em termos de bases de dados e tipos de documentos, esta pesquisa se configura da seguinte forma: para artigos, o Portal de Periódicos da CAPES e a BRAPCI; para comunicações em eventos, a BENANCIB e a BRAPCI; para dissertações e teses a BDTD e o Catálogo de Teses e Dissertações CAPES. Para elaboração da estratégia de busca nessas bases (Portal de Periódicos da CAPES, BDTD, CTDC, BRAPCI e coleção BENANCIB), usamos o termo exato investigado “letramento informacional”, em português, tendo em vista as implicações linguísticas do termo em inglês “information literacy” que possui várias traduções para o português. Não foi possível incluir “information literacy” e depois refinar por “letramento informacional” nessas bases, pois diante dos vários testes que realizamos verificando diversas possibilidades de estratégias de busca com este termo em inglês, incluindo na estratégia a proibição de ocorrência do termo competência "information literacy" NOT ("competência informacional" AND "competência em informação") ou "information literacy" NOT "competência informacional" ", essas estratégias não funcionaram, sendo ainda recuperados trabalhos em diversos idiomas e com o termo competência e suas variações. Como esses resultados eram quantitativamente altos, e como precisávamos fazer uma leitura intensiva dos trabalhos, ficou inviável de abarcar uma estratégia de busca tão ampla. As buscas foram realizadas do dia 19 de agosto ao dia 02 de setembro de 2021. Os critérios de inclusão utilizados nos campos de busca e/ou nos filtros de refinamento foram os seguintes: para idioma: português, não importando a nacionalidade das autorias, contanto que se tratasse de contextos e da realidade brasileira; intervalo temporal: de 2000 a 2020 (justificado pelo fato de 2000 ter sido o ano em que foi publicado o primeiro artigo sobre information literacy no país, Caregnato (2000)). Sobre os refinamentos, como cada base possui uma estrutura de busca avançada com diferentes características, foram adotadas as seguintes opções: 1. Estratégia de busca com a expressão “letramento informacional” entre aspas, por ser um termo composto e as aspas fixarem a ordem das palavras fornecendo mais precisão na busca; ou opção de campo de busca avançada: “é (exato)”; 2. Extração em “qualquer campo”; “All Fields”; “title, keyword and abstract”. Quando não foi possível agregar todos os campos ou integrar título, abstract e palavras-chave, fizemos buscas separadas para cada campo com a mesma estratégia de busca e exclui-se as duplicatas. Os critérios de exclusão, efetuados durante o download dos trabalhos, foram os seguintes: trabalhos em outros idiomas que não o português; texto completo indisponível na base de dados e não encontrado em nenhum outro site na internet; trabalhos que se tratassem de discussões sobre competência informacional ou competência em informação e não letramento informacional (que foram recuperados apenas por citarem este último); trabalhos com nenhuma ocorrência do termo letramento informacional; trabalhos que apenas citassem o termo sem fazer uma discussão sobre ele, sendo esta conferência feita por meio do quantitativo de ocorrências no texto e, na contagem das ocorrências, desconsideramos as ocorrências dos cabeçalhos dos artigos (a análise das ocorrências, no entanto, não foi definida por quantitativo, pois mesmo que o termo tenha sido citado apenas uma vez, mas fosse uma consideração importante, o trabalho foi selecionado, enquanto outros que tiveram quatro ocorrências, sendo três em referências, por exemplo, e outra no texto sem nenhuma consideração a respeito, não foram considerados); trabalhos duplicados na mesma base ou que já tivessem sido encontrados em outra base; trabalhos que não fossem artigos, dissertações, teses ou comunicações em eventos, tais como editorial e resumos de teses. A exportação das referências ocorreu por meio do gerenciador Endnote 7 para o Portal de Periódicos da CAPES e via editor de texto Word da Microsoft para a BRAPCI. Não tivemos sucesso nas formas de exportação disponíveis na BDTD, então para esta base, para a coleção BENANCIB e para o Catálogo de Teses e Dissertações CAPES fizemos de forma não automática, um a um, copiando as referências dos repositórios, quando havia, ou criando quando não existia. Da mesma forma, os downloads foram feitos de forma individual para cada trabalho e separados em pastas no computador por ordem de ano e de ordem alfabética de autoria (ex.: Alves_2015). 7 O Endnote é desenvolvido pela Clarivate Analytics e acessado por meio da Web os Science integrado ao portal de Periódicos da CAPES. Fizemos o acesso da versão gratuita via acesso CAFe da UFPE. Em seguida essas referências foram registradas em quadros, resultando no que estamos denominando de corpus inicial, contendo 156 trabalhos. Para a disponibilização neste repositório, Zenodo, transferimos os dados dos Quadros para uma Planilha em CSV UTF-8, porém não foi possível segmentar os metadados, ficando a referência completa do trabalho em cada célula da Planilha caracterizando-se, dessa forma, como dados parcialmente tratados e não dados brutos. Dessa forma os 156 trabalhos estão no arquivo “1Dataset_textual_data_information_literacy_CSV”. Até aqui contemplamos o primeiro dos três polos cronológicos que constituem a análise de conteúdo de Bardin (2008), a fase da pré-análise. Os três objetivos dessa fase são a escolha dos documentos, a formulação das hipóteses e dos objetivos e a elaboração de indicadores que dão sustentação à interpretação final (Bardin, 2008). Por corpus entende-se “um conjunto dos documentos tidos em conta para serem submetidos aos procedimentos analíticos”, que são escolhidos por meio de seleções e regras (Bardin, 2008, p, 122). No nosso caso, adotamos a Regra da homogeneidade. Nesta regra os documentos obedecem a “critérios precisos de escolha” e “não apresentam demasiada singularidade fora destes critérios” (BARDIN, 2008, p. 124). Nesta pesquisa, a regra foram os trabalhos que tratassem exclusivamente do tema letramento informacional 8, incluindo discussão terminológica e conceitual e dados empíricos, no intervalo temporal de 2000 a 2020. Sendo esta regra utilizada, segundo Bardin (2008), principalmente, quando se quer “obter resultados globais ou comparar entre si os resultados individuais” (Bardin, 2008, p. 124). 8 O corpus, porém, traz outros trabalhos que tratam de competência informacional e competência em informação que foram selecionados por, ainda assim, trazerem considerações importantes acerca do termo letramento informacional, tendo em vista nossos objetivos de entender a especificidade do letramento informacional. Neste corpus inicial, foi possível realizar a pré-análise, a exploração do material e a interpretação dos trabalhos referentes aos dez primeiros anos do corpus. Os trabalhos desta primeira década do corpus inicial revelaram as imersões iniciais sobre o tema no Brasil e, com isso, a diversidade de abordagens, sendo possível identificar pontos em comuns, mas, sobretudo, abordagens diferenciadas em cada trabalho. O tratamento dos resultados e a interpretação (Bardin, 2008) dessa análise foram estruturadas durante os meses de outubro a novembro de 2021. Após essa exploração geral do tema, que incluiu trabalhos de outras áreas do conhecimento, decidimos refinar o corpus com trabalhos apenas da BCI, tendo em vista ser mais coerente analisar as disputas dentro de um único campo científico e considerando que ambas foram as áreas pioneiras na discussão do tema no Brasil. Partimos então para a filtragem dos trabalhos que responderiam à nova pergunta norteadora: como o termo letramento foi apropriado pela BCI brasileira e como este conceito se individualiza perante as outras traduções de information literacy para elaborar o conceito de letramento informacional? Para isso, utilizamos os seguintes critérios de exclusão/filtragem: a) Trabalhos de 2003 a 2010 (exceto os de Bernadete Campello e Kelley Gasque, uma vez que o termo letramento informacional não havia sido consolidado no campo). O trabalho dessas pesquisadoras foi separado para ser analisado numa seção exclusiva; b) Trabalhos que não eram do campo da Biblioteconomia, Ciência da Informação ou Gestão da Informação (GI). A identificação foi feita pelos títulos das Revistas e escopos correspondentes e pelos títulos dos Programas de Pós-Graduação, com exceção de alguns trabalhos que foram defendidos em outros Programas que não os de BCI, mas cujas autorias possuíam graduação em Biblioteconomia, as quais foram identificadas pela busca no Currículo Lattes; c) Trabalhos (artigos ou comunicações) oriundos de dissertações e teses, visto que estas últimas traziam o tema de modo mais completo e favoreciam uma análise mais justa9. Da mesma forma, as mesmas comunicações que foram publicadas em artigos, apenas estes últimos foram considerados; d) Trabalhos que não respondiam à pergunta norteadora. Por fim, como última etapa, sentimos a necessidade de incluir os trabalhos dos últimos dois anos (2021 a 202210), a fim de realizar um diagnóstico mais preciso e atualizado. Em relação às bases de dados, não foram feitas buscas no Portal de Periódicos da CAPES, da mesma forma que não buscamos mais por anais ou comunicações em eventos. Foram seguidos os mesmos procedimentos e passos descritos anteriormente para a estratégia de busca. O levantamento foi realizado nos dias 24 e 25 de dezembro de 2022. Os motivos de exclusão foram: trabalhos já coletados nas buscas anteriores; trabalhos duplicados na mesma base; trabalhos com nenhuma ocorrência do termo letramento informacional 11; trabalhos que não se adequavam à pergunta norteadora; trabalhos que não faziam parte do campo da BCI e da GI. Ao final, consolidamos um corpus final de 95 trabalhos publicados entre 2011 e 2022 sobre letramento informacional no âmbito da BCI brasileira (2Dataset_textual_data_information_literacy_CSV). 9 Com exceção de um trabalho, em que foi mais adequado escolher o artigo. 10 Mesmo a busca inicial tendo sido realizada em agosto de 2021, nesta nova busca consideramos o intervalo temporal de 2020-2022, para verificarmos se havia trabalhos de 2020 que ainda não estavam nas bases de dados na época do primeiro levantamento, e, de fato, os recuperamos. Com isso, excluímos as duplicatas dos trabalhos que já havíamos recuperado e adicionamos os trabalhos novos de 2020. 11 Isso acontece porque, em alguns repositórios, no momento da indexação, algumas profissionais inserem termos sinônimos para ampliar a recuperação da informação. Nestes casos os trabalhos tratavam de competência em informação e nos metadados do repositório havia o termo letramento informacional. Porém ao baixar o trabalho não encontrei a ocorrência do termo nenhuma vez. Os resultados quantitativos das buscas, desde a primeira etapa, estão descritos no esquema a seguir (Figura 1), cuja inspiração partiu, muito genericamente, do diagrama para revisões sistemáticas “Preferred Reporting Items for Systematic Reviews and Meta-Analyses (PRISMA)” (PAGE, et al., 2020). Figura 1 – Etapas da seleção e filtragem do corpus Infográfico colorido dividido em quatro colunas, representando as ações de “Identificação”, “Filtragem 1”, “Filtragem 2” e “Adição”. Ainda compreende uma legenda na barra inferior para identificação de dados numéricos relacionados às cores. Cada coluna é formada por caixas de texto compostas por ícones e por dados numéricos representando o quantitativo de trabalhos acadêmicos recuperados ou excluídos no processo. As caixas de texto de cada coluna são coloridas de acordo com as bases de dados ou os motivos de exclusão, a saber: “Portal Capes”, na cor roxa; “BRAPCI”, na cor vermelha; “BENANCIB”, na cor azul; “BDTD”, na cor laranja; “CTDC”, na cor verde e “Motivos de exclusão”, na cor amarela, que estão como legenda na barra inferior. Na etapa de Identificação, foi recuperado o seguinte quantitativo de trabalhos: 55 no Portal Capes; 79 na BRAPCI; 16 no BENANCIB; 43 na BDTD e 60 no CTDC, perfazendo a soma de 253 trabalhos incluídos. Na etapa de Filtragem 1, foi excluído o seguinte quantitativo de trabalhos: 22 no Portal Capes; 26 na BRAPCI; 04 no BENANCIB; 08 na BDTD e 37 no CTDC, perfazendo um total de 97 trabalhos excluídos e resultando no corpus inicial de 156 trabalhos. Na etapa de Filtragem 2, foram aplicados os seguintes critérios de exclusão: “Trabalhos recuperados até 2010, exceto os de Bernadete Campello e os de Kelley Gasque” = 18 trabalhos excluídos; “Trabalhos que não eram do campo da Biblioteconomia, Ciência da Informação ou Gestão da Informação” = 23 trabalhos excluídos; “Trabalhos (artigos ou comunicações) oriundos de dissertações e teses” = 24 trabalhos excluídos; “Trabalhos que não respondiam à pergunta norteadora da busca” = 14 trabalhos excluídos, obtendo uma redução de 79 trabalhos, formando um total restante de 77 trabalhos. Na etapa de Adição, foi adicionado o seguinte quantitativo de trabalhos: 10 recuperados da BRAPCI; 3 recuperados da BDTD e 5 recuperados do CTDC, correspondendo à adição de 18 trabalhos, formando um corpus final de 95 documentos. Fonte: Elaborada pela autora. Design de Loudovico Soares. Como nosso foco foi analisar o que é discutido e argumentado nos textos sobre letramento informacional em relação à discussão terminológico-conceitual do tema information literacy, a análise que fizemos sobre os termos competência em informação e competência informacional partiu de três vias: 1) do próprio corpus sobre letramento informacional; 2) das obras citadas no referido corpus e 3) de uma pesquisa complementar feita na BRAPCI para recuperar trabalhos de revisão sobre os termos. Essas produções foram listadas nos arquivos “3Dataset_textual_data_information_literacy_CSV” e “4Dataset_textual_data_information_literacy_CSV”. Referências BARDIN, Laurence. Análise de conteúdo. [Lisboa]: Edições 70, 2008. BASE de dados referencial de artigos de periódicos em ciência da informação (BRAPCI). Rio Grande do Sul. Disponível em: https://brapci.inf.br/index.php/res/about. Acesso em: 29 ago. 2021. BUFREM, Leilah Santiago; COSTA, Francisco Daniel de Oliveira.; GABRIEL JUNIOR, Rene Faustino.; PINTO, J. S. P. Modelizando práticas para a socialização de informações: a construção de saberes no ensino superior. Perspectivas em Ciência da Informação, v. 15, n. 2, 2010. Disponível em: https://brapci.inf.br/index.php/res/v/35867. Acesso em: 15 abr. 2023 PAGE, M. J.; MCKENZIE, J. E.; BOSSUYT, P. M.; BOUTRON, I.; HOFFMANN, T. C.; MULROW, C. D., et al. The PRISMA 2020 statement: an updated guideline for reporting systematic reviews. BMJ 2021; 372: n.71, 2020. Disponível em: http://www.prisma-statement.org/. Acesso em: 24 jul. 2023. QUESTÕES em rede – coleções. Rio de Janeiro. [2021]. Disponível em: http://repositorios.questoesemrede.uff.br/repositorios/. Acesso em: 29 ago. 2021. Agradecimentos A Karen Santos-d'Amorim pela indicação do repositório e pelo suporte nas dúvidas. A Karolayne Costa Rodrigues de Lima, bibliotecária da Universidade Federal do Paraná, pelo profissionalismo e presteza no fornecimento das valiosas orientações sobre o preenchimento do registro e a preparação dos arquivos para o Zenodo. Link of license: https://creativecommons.org/licenses/by/4.0/ --------------- ------------------------------------------------------------ --------------- ------------------------------------------------------------ DOI: 10.5281/zenodo.10672668