Dataset de libros históricos de Project Gutenberg: metadatos bibliográficos por categoría
Description
Dataset de metadatos bibliográficos extraídos mediante web scraping de Project Gutenberg, organizado por categorías históricas. Contiene 118 registros distribuidos en 5 categorías: History - Ancient, History - Medieval/Middle Ages, History - Early Modern (c. 1450-1750), History - Royalty y Books in Natural History.
Cada registro incluye los siguientes campos: URL de la ficha, título, autor, idioma, materias, clasificación de la Library of Congress (LoC Class), categoría, número de ebook, fecha de publicación, nivel de lectura Flesch-Kincaid, estado de copyright, número de descargas, e identificador y nombre de la categoría de origen.
Los datos fueron extraídos en marzo-abril de 2026 y representan una instantánea de la colección disponible en ese momento. Todas las obras son de dominio público.
Dataset generado como parte de la Práctica 1 de la asignatura M2.851 Tipología y ciclo de vida de los datos del Máster en Ciencia de Datos de la Universitat Oberta de Catalunya (UOC).
Files
libros_gutenberg_historia.csv
Files
(64.0 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:a66a52cc4039aafc70db06373ae2599e
|
64.0 kB | Preview Download |
Additional details
Dates
- Collected
-
2025-03-31
Software
- Programming language
- Python