Published April 12, 2020
| Version v1.1
Dataset
Open
Cruce de casos por Coronavirus con el PIB Per Cápita Mundial
Contributors
Data collectors:
Description
Esta práctica se ha realizado bajo el contexto de la asignatura Tipología y ciclo de vida de los datos, perteneciente al Máster en Ciencia de Datos de la Universitat Oberta de Catalunya. En ella, se aplican técnicas de web scraping mediante el lenguaje de programación Python para extraer información relevante al coronavirus a través de Wikipedia - Pandemia de enfermedad por coronavirus de 2019-2020 y del PIB de cada país con el periódico "Expansión". Se genera un dataset el cual sirve para buscar posibles correlaciones entre estos datos.
Files
Coronavirus.csv
Files
(20.7 kB)
Name | Size | Download all |
---|---|---|
md5:8026428f1d4d9090e537673e79e9b732
|
20.7 kB | Preview Download |
Additional details
Related works
- Is supplement to
- https://github.com/JorgeSaNel/PRA-1-Coronavirus- (URL)
References
- Subirats, L., Calvo, M. (2018). Web Scraping. Editorial UOC.
- Masip, D. El lenguaje Python. Editorial UOC.
- Lawson, R. (2015). Web Scraping with Python. Packt Publishing Ltd. Chapter 2. Scraping the Data.
- Simon Munzert, Christian Rubba, Peter Meißner, Dominic Nyhuis. (2015). Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining. John Wiley & Sons.
- PIB Per Cápita -> https://datosmacro.expansion.com/pib
- Casos confirmados de Coronavirus -> https://es.wikipedia.org/wiki/Pandemia_de_enfermedad_por_coronavirus_de_2019-2020