{ "metadata": { "title": "Análisis de robots.txt en 25 medios españoles: Sesgo GEO", "author": "Francisco José García-Ull", "affiliation": "Universidad Europea de Valencia", "email": "franciscojose.garcia@universidadeuropea.es", "date_collected": "2025-01-29", "date_analysis": "2025-01-29", "version": "1.0", "description": "Dataset original con políticas de acceso a crawlers de IA de 25 principales medios españoles", "methodology": "Análisis directo de archivos robots.txt públicos", "sample_size": 25, "geographic_scope": "España", "license": "Creative Commons Attribution 4.0 (CC BY 4.0)", "citation": "García-Ull, F.J. (2025). Análisis de robots.txt en 25 medios españoles: Dataset original [Datos de investigación]. Universidad Europea de Valencia." }, "medios_caracterizacion": [ { "id": "M01", "medio": "20 Minutos", "url": "www.20minutos.es", "descripcion": "Diario gratuito líder", "audiencia_mensual": 25.2, "tipo_medio": "Prensa", "perfil_ideologico": "Centrista", "nativo_digital": false, "fundacion": 2000, "sede": "Madrid" }, { "id": "M02", "medio": "El País", "url": "www.elpais.com", "descripcion": "Diario referencia nacional", "audiencia_mensual": 23.8, "tipo_medio": "Prensa", "perfil_ideologico": "Progresista", "nativo_digital": false, "fundacion": 1976, "sede": "Madrid" }, { "id": "M03", "medio": "El Mundo", "url": "www.elmundo.es", "descripcion": "Gran diario centroderecha", "audiencia_mensual": 18.5, "tipo_medio": "Prensa", "perfil_ideologico": "Conservador", "nativo_digital": false, "fundacion": 1989, "sede": "Madrid" }, { "id": "M04", "medio": "ABC", "url": "www.abc.es", "descripcion": "Diario conservador histórico", "audiencia_mensual": 12.3, "tipo_medio": "Prensa", "perfil_ideologico": "Conservador", "nativo_digital": false, "fundacion": 1903, "sede": "Madrid" }, { "id": "M05", "medio": "La Vanguardia", "url": "www.lavanguardia.com", "descripcion": "Principal diario catalán", "audiencia_mensual": 11.7, "tipo_medio": "Prensa", "perfil_ideologico": "Centrista", "nativo_digital": false, "fundacion": 1881, "sede": "Barcelona" }, { "id": "M06", "medio": "RTVE", "url": "www.rtve.es", "descripcion": "Corporación pública audiovisual", "audiencia_mensual": 10.8, "tipo_medio": "Audiovisual", "perfil_ideologico": "Centrista", "nativo_digital": false, "fundacion": 1956, "sede": "Madrid" }, { "id": "M07", "medio": "Antena 3", "url": "www.antena3.com", "descripcion": "Canal televisión privado", "audiencia_mensual": 9.2, "tipo_medio": "Audiovisual", "perfil_ideologico": "Centrista", "nativo_digital": false, "fundacion": 1990, "sede": "Madrid" }, { "id": "M08", "medio": "elDiario.es", "url": "www.eldiario.es", "descripcion": "Medio digital progresista", "audiencia_mensual": 8.9, "tipo_medio": "Prensa", "perfil_ideologico": "Progresista", "nativo_digital": true, "fundacion": 2012, "sede": "Madrid" }, { "id": "M09", "medio": "Telecinco", "url": "www.telecinco.es", "descripcion": "Cadena televisiva privada", "audiencia_mensual": 8.1, "tipo_medio": "Audiovisual", "perfil_ideologico": "Centrista", "nativo_digital": false, "fundacion": 1990, "sede": "Madrid" }, { "id": "M10", "medio": "laSexta", "url": "www.lasexta.com", "descripcion": "Canal televisión progresista", "audiencia_mensual": 7.8, "tipo_medio": "Audiovisual", "perfil_ideologico": "Progresista", "nativo_digital": false, "fundacion": 2006, "sede": "Madrid" }, { "id": "M11", "medio": "El Español", "url": "www.elespanol.com", "descripcion": "Medio digital liberal", "audiencia_mensual": 7.4, "tipo_medio": "Prensa", "perfil_ideologico": "Conservador", "nativo_digital": true, "fundacion": 2015, "sede": "Madrid" }, { "id": "M12", "medio": "El Confidencial", "url": "www.elconfidencial.com", "descripcion": "Diario digital económico", "audiencia_mensual": 6.8, "tipo_medio": "Prensa", "perfil_ideologico": "Centrista", "nativo_digital": true, "fundacion": 2001, "sede": "Madrid" }, { "id": "M13", "medio": "Cadena SER", "url": "www.cadenaser.com", "descripcion": "Principal cadena radiofónica", "audiencia_mensual": 6.2, "tipo_medio": "Audiovisual", "perfil_ideologico": "Progresista", "nativo_digital": false, "fundacion": 1924, "sede": "Madrid" }, { "id": "M14", "medio": "Público", "url": "www.publico.es", "descripcion": "Medio progresista social", "audiencia_mensual": 5.7, "tipo_medio": "Prensa", "perfil_ideologico": "Progresista", "nativo_digital": true, "fundacion": 2007, "sede": "Madrid" }, { "id": "M15", "medio": "Vozpópuli", "url": "www.vozpopuli.com", "descripcion": "Digital liberal-conservador económico", "audiencia_mensual": 4.9, "tipo_medio": "Prensa", "perfil_ideologico": "Conservador", "nativo_digital": true, "fundacion": 2011, "sede": "Madrid" }, { "id": "M16", "medio": "La Razón", "url": "www.larazon.es", "descripcion": "Diario conservador tradicional", "audiencia_mensual": 4.3, "tipo_medio": "Prensa", "perfil_ideologico": "Conservador", "nativo_digital": false, "fundacion": 1998, "sede": "Madrid" }, { "id": "M17", "medio": "HuffPost España", "url": "www.huffingtonpost.es", "descripcion": "Edición española progresista", "audiencia_mensual": 3.8, "tipo_medio": "Prensa", "perfil_ideologico": "Progresista", "nativo_digital": false, "fundacion": 2012, "sede": "Madrid" }, { "id": "M18", "medio": "Libertad Digital", "url": "www.libertaddigital.com", "descripcion": "Medio digital conservador", "audiencia_mensual": 3.2, "tipo_medio": "Prensa", "perfil_ideologico": "Conservador", "nativo_digital": true, "fundacion": 2000, "sede": "Madrid" }, { "id": "M19", "medio": "El Independiente", "url": "www.elindependiente.com", "descripcion": "Periodismo independiente equilibrado", "audiencia_mensual": 2.9, "tipo_medio": "Prensa", "perfil_ideologico": "Centrista", "nativo_digital": true, "fundacion": 2016, "sede": "Madrid" }, { "id": "M20", "medio": "infoLibre", "url": "www.infolibre.es", "descripcion": "Progresista financiado lectores", "audiencia_mensual": 2.4, "tipo_medio": "Prensa", "perfil_ideologico": "Progresista", "nativo_digital": true, "fundacion": 2013, "sede": "Madrid" }, { "id": "M21", "medio": "OKDiario", "url": "www.okdiario.com", "descripcion": "Portal conservador marcado", "audiencia_mensual": 2.1, "tipo_medio": "Prensa", "perfil_ideologico": "Conservador", "nativo_digital": true, "fundacion": 2015, "sede": "Madrid" }, { "id": "M22", "medio": "El Nacional", "url": "www.elnacional.cat", "descripcion": "Medio catalán independentista", "audiencia_mensual": 1.8, "tipo_medio": "Prensa", "perfil_ideologico": "Progresista", "nativo_digital": true, "fundacion": 2010, "sede": "Barcelona" }, { "id": "M23", "medio": "Euronews España", "url": "es.euronews.com", "descripcion": "Canal europeo español", "audiencia_mensual": 1.5, "tipo_medio": "Audiovisual", "perfil_ideologico": "Centrista", "nativo_digital": false, "fundacion": 1993, "sede": "Lyon/Madrid" }, { "id": "M24", "medio": "El Periódico", "url": "www.elperiodico.com", "descripcion": "Diario catalán progresista", "audiencia_mensual": 1.3, "tipo_medio": "Prensa", "perfil_ideologico": "Progresista", "nativo_digital": false, "fundacion": 1978, "sede": "Barcelona" }, { "id": "M25", "medio": "Estrella Digital", "url": "www.estrelladigital.es", "descripcion": "Medio digital general", "audiencia_mensual": 0.9, "tipo_medio": "Prensa", "perfil_ideologico": "Centrista", "nativo_digital": true, "fundacion": 2009, "sede": "Madrid" } ], "politicas_ia": [ { "medio_id": "M01", "estrategia_ia": "Restrictiva Agresiva", "bots_bloqueados_total": 18, "tipo_bloqueo": "Completo", "seccion_especifica_ai": true }, { "medio_id": "M02", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M03", "estrategia_ia": "Restrictiva Moderada", "bots_bloqueados_total": 5, "tipo_bloqueo": "Completo", "seccion_especifica_ai": false }, { "medio_id": "M04", "estrategia_ia": "Restrictiva Moderada", "bots_bloqueados_total": 4, "tipo_bloqueo": "Completo", "seccion_especifica_ai": false }, { "medio_id": "M05", "estrategia_ia": "Selectiva", "bots_bloqueados_total": 5, "tipo_bloqueo": "Por secciones", "seccion_especifica_ai": false }, { "medio_id": "M06", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M07", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M08", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M09", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M10", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M11", "estrategia_ia": "Restrictiva Mínima", "bots_bloqueados_total": 2, "tipo_bloqueo": "Completo", "seccion_especifica_ai": false }, { "medio_id": "M12", "estrategia_ia": "Restrictiva Mínima", "bots_bloqueados_total": 1, "tipo_bloqueo": "Completo", "seccion_especifica_ai": false }, { "medio_id": "M13", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M14", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M15", "estrategia_ia": "Restrictiva Agresiva", "bots_bloqueados_total": 14, "tipo_bloqueo": "Completo", "seccion_especifica_ai": true }, { "medio_id": "M16", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M17", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M18", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M19", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M20", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M21", "estrategia_ia": "Restrictiva Mínima", "bots_bloqueados_total": 1, "tipo_bloqueo": "Completo", "seccion_especifica_ai": false }, { "medio_id": "M22", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false }, { "medio_id": "M23", "estrategia_ia": "Híbrida", "bots_bloqueados_total": 3, "tipo_bloqueo": "Selectivo", "seccion_especifica_ai": true }, { "medio_id": "M24", "estrategia_ia": "Híbrida", "bots_bloqueados_total": 5, "tipo_bloqueo": "Por secciones", "seccion_especifica_ai": false }, { "medio_id": "M25", "estrategia_ia": "Acceso Completo", "bots_bloqueados_total": 0, "tipo_bloqueo": null, "seccion_especifica_ai": false } ], "bots_especificos": [ { "bot_nombre": "GPTBot", "empresa": "OpenAI", "funcion": "Entrenamiento LLM", "medios_bloquean": [ "M01", "M03", "M04", "M05", "M11", "M12", "M15", "M21" ], "total_bloqueos": 8 }, { "bot_nombre": "ChatGPT-User", "empresa": "OpenAI", "funcion": "Búsqueda web", "medios_bloquean": [ "M01", "M03", "M04", "M11" ], "total_bloqueos": 4 }, { "bot_nombre": "Google-Extended", "empresa": "Google", "funcion": "Entrenamiento IA", "medios_bloquean": [ "M01", "M03", "M04", "M15", "M23" ], "total_bloqueos": 5 }, { "bot_nombre": "anthropic-ai", "empresa": "Anthropic", "funcion": "Entrenamiento Claude", "medios_bloquean": [ "M01", "M03", "M05", "M15" ], "total_bloqueos": 4 }, { "bot_nombre": "ClaudeBot", "empresa": "Anthropic", "funcion": "Claude web access", "medios_bloquean": [ "M01", "M05", "M15", "M24" ], "total_bloqueos": 4 }, { "bot_nombre": "CCBot", "empresa": "Common Crawl", "funcion": "Corpus entrenamiento", "medios_bloquean": [ "M01", "M03", "M15", "M23" ], "total_bloqueos": 4 }, { "bot_nombre": "Meta-ExternalAgent", "empresa": "Meta", "funcion": "IA Meta", "medios_bloquean": [ "M01", "M15", "M24" ], "total_bloqueos": 3 }, { "bot_nombre": "PerplexityBot", "empresa": "Perplexity", "funcion": "Motor búsqueda IA", "medios_bloquean": [ "M04", "M24" ], "total_bloqueos": 2 }, { "bot_nombre": "FacebookBot", "empresa": "Meta", "funcion": "Crawling Facebook", "medios_bloquean": [ "M01", "M15" ], "total_bloqueos": 2 }, { "bot_nombre": "Bytespider", "empresa": "ByteDance", "funcion": "TikTok/ByteDance IA", "medios_bloquean": [ "M01", "M15" ], "total_bloqueos": 2 } ] }