nonparametric – Encontrar valores atípicos sin asumir una distribución normal

Pregunta:

Tengo pequeños conjuntos de datos de tamaño 40-50 puntos. Sin asumir que los datos se distribuyen normalmente, quería averiguar los valores atípicos con un 90% de confianza al menos. Pensé que el diagrama de caja podría ser una buena forma de hacerlo, pero no estoy seguro.

Se agradece cualquier ayuda.

Además, con las implementaciones de gráficos de caja no pude encontrar una implementación que, además de dibujar el gráfico, escupe explícitamente los valores atípicos.

Respuesta:

Eso es porque tal algoritmo no puede existir. Necesita una distribución asumida para poder clasificar algo como fuera del rango de valores esperados.

Incluso si asume una distribución normal, declarar puntos de datos como valores atípicos es un asunto complicado. En general, no solo necesita una buena estimación de la distribución real, que a menudo no está disponible, sino también una buena razón teóricamente respaldada para tomar su decisión (es decir, el sujeto rompió la configuración experimental de alguna manera). Este juicio suele ser imposible de codificar en un algoritmo.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top

web tasarım