Tengo un conjunto relativamente pequeño (~ 100 valores) de enteros: cada uno de ellos representa la cantidad de tiempo (en milisegundos) que duró una prueba.
El algoritmo trivial para calcular el promedio es resumir todas las n
valores y dividir el resultado por n
, pero esto no tiene en cuenta que algún valor ridículamente alto / bajo debe ser incorrecto y debe descartarse.
¿Qué algoritmos están disponibles para estimar el valor promedio real?
Respuestas
2 para la respuesta № 1Como dijiste puedes descartar todos los valores quedivergir más de un valor dado del promedio y luego volver a calcular el promedio. Otro valor que puede ser interesante es la mediana, que es el valor más frecuente.
1 para la respuesta № 2
Depende de las diferentes condiciones de su prueba. Y es una tarea de la teoría de la probabilidad. Una de las formas más sencillas es intentar calcular un mediana, que puede tratar con valores ridículamente altos / bajos. Mira el enlace de abajo: Wiki sobre la mediana
1 para la respuesta № 3
Como notó, la media aritmética no es buena siHay valores muy altos / bajos. Puede calcular la mediana, como alguien sugirió, que es, en una lista ordenada de sus valores, el valor "medio" (si su conjunto contiene una cantidad desigual de elementos) o la media aritmética de los dos valores "medios" (de lo contrario ).
Otro método sería descartar, digamos, los cinco más bajos y los más altos. percentiles y calcular la media aritmética del resto.
1 para la respuesta № 4
Algunas opciones:
- Primero descarte N los valores más altos y más bajos y calcule la media aritmética para el resto. Establezca N en el valor adecuado para que, por ejemplo, se descarte el 1% o el 10% de los valores.
- Use el mediana, o valor medio.
- Utilizar significado geometrico Que dan menos peso para los valores atípicos.
Listas de Wikipedia algunas maneras para calcular diferentes valores "medios"