Valores atípicos en los datos, ¿cómo identificarlos y manejarlos?

Leneidy Pérez Pelea

doi:10.5281/zenodo.4730571

Published December 31, 2019 | Version v1

Journal article Open

Valores atípicos en los datos, ¿cómo identificarlos y manejarlos?

Leneidy Pérez Pelea¹

1. Universidad de la habana

En el análisis de datos experimentales, es frecuente encontrar variables biológicas con distribución no normal, en las cuales no se cumplen también, otras de las premisas planteadas en los métodos estadísticos tradicionales. En ocasiones, la falta de normalidad puede atribuirse a la presencia de uno o más valores atípicos (outliers) en los datos, los cuales se desvían mucho del resto de los valores y caen fuera del patrón general de distribución de la variable. Varios autores han propuesto diferentes definiciones para estos valores y han desarrollado métodos muy variados para identificarlos y manejarlos. Los métodos más empleados están basados en análisis de distancia, agrupamientos, varianza, ángulos entre vectores y densidad en la vecindad de las observaciones. También varían en depencia de si los valores atípicos están presentes en experimentos que analizan una o múltiples variables. Existe una gran controversia en la literatura en relación con la eliminación de los valores atípicos. Se ha
planteado que se debe conocer su causa y la influencia que pueden tener en los resultados de los experimentos, antes de tomar la decisión de eliminarlos o incluirlos en el análisis, porque cambian las inferencias que se obtienen y, en ocasiones, su eliminación puede conducir a la pérdida de una información importante. En el presente artículo se hace una revisión de las principales causas que pueden provocar la aparición de estos valores atípicos, y algunos de los métodos que se han propuesto para identificarlos y manejarlos.

Files

446-536-1-SM(1).pdf

Files (352.9 kB)

Name	Size	Download all
446-536-1-SM(1).pdf md5:69ec85f5d2a96e5b0f81904e07dcee29	352.9 kB	Preview Download

Citations

Oops! Something went wrong while fetching results.

	All versions	This version
Views	27	27
Downloads	15	15
Data volume	5.6 MB	5.6 MB

Valores atípicos en los datos, ¿cómo identificarlos y manejarlos?

Creators

Description

Files

446-536-1-SM(1).pdf

Files (352.9 kB)