Published April 9, 2021 | Version v1
Dataset Open

Coches de segunda mano Milanuncios

Description

Contexto y descripción del dataset 

El conjunto de datos recolectado incluye distintos datos de los coches que aparecen en el portal milanuncios.com extraído el 09/04/2020. Su objetivo es permitir comparar vehículos de segunda mano en España. El conjunto de datos contiene multitud de campos extraídos de cada uno de los anuncios de coches, incluyendo el título, la referencia y la descripción del anuncio; características del vehículo como la marca, el modelo, o la potencia; y estadísticas de cada anuncio.

Licencia: Released Under CC BY-NC-SA 4.0 License 

Contenido del dataset ‘coches_milanuncios_09_04_2021.csv’ 

Utilizando técnicas de web scraping como selenium, hemos programado un script que extrae y los guarda en un archivo csv, ‘coches_milanuncios_09_04_2021.csv’.

Los distintos campos que contiene el csv son los siguientes:

  • titulo: recoge el título completo del anuncio, que incluye marca y modelo
  • marca: marca del vehículo, extraída del título
  • modelo: modelo del vehículo, extraído del título
  • referencia: referencia inequívoca del anuncio
  • ano_vehic: año de matriculación del vehículo
  • km: nº de kilómetros que ha recorrido ya el vehículo
  • combustible: tipo de combustible utilizado por el vehículo (gasolina / diesel)
  • puertas: nº de puertas que tiene el vehículo
  • cv: potencia del vehículo en caballos de vapor
  • transmision: tipo de transmisión (automático / manual)
  • ubicacion: ubicación del vehículo
  • vendedor: nombre del usuario vendedor
  • precio: precio del vehículo
  • particular: tipo de anunciante (particular / profesional)
  • descripcion: descripción del anuncio por parte del anunciante
  • stats_visto: nº de veces listado 
  • stats_contactado: nº de veces contactado 
  • stats_compartido: nº de veces compartido 
  • stats_favorito: nº de veces añadido a favoritos
  • stats_renovados: nº de veces renovado

Código Python y dataset: https://github.com/lreyp/Scraping-Milanuncios-Coches

Autores: Iván Maseda Zurdo (https://github.com/imaseda)  & Lucas Rey Pitaluga (https://github.com/lreyp)

Notes

Este dataset ha sido extraído el 09/04/2020 limitado a 500 registros. Para actualizarlo, puede encontrarse el código en https://github.com/lreyp/Scraping-Milanuncios-Coches.

Files

coches_milanuncios_09_04_2021.csv

Files (530.1 kB)

Name Size Download all
md5:8ab386b96887fd4738241f84d320a5c6
530.1 kB Preview Download