README 

Indicadores espaciales de caminabilidad y morfología urbana en Madrid (Walkability Indicators Madrid Dataset)
********
Autores
********
Ana Patricia Maté Sánchez de Val, Fernando A. López Hernández y Mariluz Maté Sánchez-Val

********************
Descripción general
*********************
Este dataset contiene indicadores espaciales y morfológicos calculados a nivel de sección censal para el municipio de Madrid (España), utilizados en los modelos de regresión espacial y multivariante del artículo asociado.

El objetivo del dataset es analizar los factores físicos, ambientales y de conectividad urbana que explican la caminabilidad (walkability) de la ciudad de Madrid, a través de distancias accesibles a pie de 5 y 15 minutos.

Los datos combinan información procedente de fuentes oficiales (Ayuntamiento de Madrid, Geoportal Madrid, OpenStreetMap, Esri España) con métricas espaciales generadas mediante técnicas de análisis geográfico (R + GIS).
Los archivos df.csv y ma.sf.shp se generan a partir del procesamiento de estas fuentes mediante los scripts incluidos (model_v3.R y MARS_Cross_Validation_Tesis_Ana_(k-means).R)


df.csv — Dataset principal (2443 observaciones, una por sección censal)
ma.sf.shp — Polígonos de las secciones censales (formato shapefile)
README.md — Documento descriptivo (este archivo)
model_v3.R — Código empleado
MARS_Cross_Validation_Tesis_Ana_(k-means) — Código empleado en la validación cruzada

******************
Fuentes de datos
******************

Los datos empleados para la elaboración de este dataset proceden de fuentes abiertas de acceso público. En concreto, se han utilizado:
OpenStreetMap (OSM): información sobre la red viaria, pasos peatonales, parques y otros elementos urbanos.
Fuente: https://www.openstreetmap.org/
Portal de Datos Abiertos del Ayuntamiento de Madrid: capas geográficas de secciones censales, edificios, equipamientos urbanos y otros elementos del entorno construido.
Fuente: https://datos.madrid.es/
Esri España – Red ferroviaria.
Instituto Nacional de Estadística (INE) – Secciones censales y variables sociodemográficas.

Elaboración propia – Cálculos espaciales y derivaciones métricas.

Estas fuentes son de libre acceso y se emplearon como base para generar el archivo df.csv, que contiene 2.443 observaciones (una por sección censal) y las variables empleadas en los análisis de accesibilidad urbana desarrollados en el estudio. Los datos fueron procesados y combinados mediante los scripts incluidos (model_v3.R y MARS_Cross_Validation_Tesis_Ana_(k-means).R), generando las variables finales utilizadas en los modelos MARS y de regresión espacial.

**************************
Metodología de generación
***************************
Los indicadores fueron generados en R utilizando los paquetes sf, geosphere, dplyr, spdep, earth, y spsur.

Las principales etapas fueron:

Carga y preprocesamiento de geometrías
Se emplearon shapefiles del municipio de Madrid (ma.sf) y se calcularon centroides, áreas y coordenadas.

Cálculo de indicadores físicos y de accesibilidad

Walk5 y Walk15: población accesible a 5 y 15 minutos a pie.
Sidewalk: ancho medio de aceras.
Streetwidth: ancho medio de calles.
Crosswalk: densidad de pasos de peatones por área.
Building: densidad de edificaciones.
Parks: superficie de parques por unidad de área.
Roundabout: presencia de glorietas.
DistHW: distancia mínima a autopistas tipo M30.
DistTrain: distancia mínima a vías ferroviarias.

Cálculo de retardos espaciales (matriz Queen)
Se generó la matriz de contigüidad de primer orden mediante poly2nb() y nb2mat() del paquete spdep, permitiendo calcular retardos espaciales (WStreetwidth, WParks, WRoundabout, etc.).

Modelización estadística
Se estimaron modelos SUR-SIM, SUR-SLX, y MARS (Multivariate Adaptive Regression Splines) para evaluar la influencia de los factores urbanos y su efecto espacial en los indicadores de caminabilidad.

Estructura del dataset (df.csv)

Cada fila representa una sección censal (identificada por CUSEC).
Principales variables:

Variable	Descripción	Unidad / Tipo
CUSEC	Código sección censal	Texto
Walk5	Población accesible a 5 min a pie	Personas
Walk15	Población accesible a 15 min a pie	Personas
area	Área de la sección censal	m²
Streetwidth	Ancho medio de calles	m
Sidewalk	Ancho medio de aceras	m
Building	Densidad de edificaciones	nº / km²
Crosswalk	Densidad de pasos de peatones	nº / km²
Parks	Proporción de área verde	%
Roundabout	Presencia de glorieta (1 = sí, 0 = no)	Binaria
DistHW	Distancia mínima a autopista	km
DistTrain	Distancia mínima a vía férrea	km
Lat, Lon	Coordenadas del centroide	Decimal
WStreetwidth, WParks, ...	Retardos espaciales de cada variable	Variable continua
Cobertura espacial

Ciudad de Madrid (España)

Sistema de coordenadas: WGS84 (EPSG:4326)

Cobertura temporal

Datos base entre 2020 y 2022, según disponibilidad de las capas originales.

Licencia

Este dataset se distribuye bajo licencia Creative Commons Attribution 4.0 International (CC BY 4.0).
Puedes copiar, redistribuir y adaptar el contenido, siempre que cites adecuadamente a los autores.

Cita recomendada

Maté-Sánchez-Val, A., Hernández, F. A. L., & Maté-Sánchez-Val, M. (2025). City for people, city for cars. Analyzing maximum walkability areas through machine learning algorithms and open-source data. Cities, 162, 105895.

Enlace al artículo asociado

https://doi.org/10.1016/j.cities.2025.105895