/ / Obliczanie rzeczywistej wartości średniej - algorytm, agnostyka językowa, oszacowanie, średnia

Obliczanie rzeczywistej wartości średniej - algorytm, język-agnostyk, estymacja, średnia

Mam stosunkowo mało (~ 100 wartości) zestawu liczb całkowitych: każdy z nich reprezentuje ile czasu (w milisekundach) trwał test.

Trywialny algorytm obliczania średniej polega na podsumowaniu wszystkich n wartości i podziel wynik przez n, ale to nie bierze pod uwagę, że jakaś śmiesznie wysoka / niska wartość musi być błędna i powinna zostać odrzucona.

Jakie algorytmy są dostępne do oszacowania rzeczywistej średniej wartości?

Odpowiedzi:

2 dla odpowiedzi № 1

Jak powiedziałeś, możesz odrzucić wszystkie wartościróżnią się od średniej od danej wartości, a następnie przeliczają średnią. Inną wartością, która może być interesująca, jest Mediana, która jest najczęstszą wartością.


1 dla odpowiedzi nr 2

To zależy od różnych warunków twojego testu. I jest to zadanie z teorii prawdopodobieństwa. Jednym z najprostszych sposobów jest próba obliczenia a mediana, że możesz radzić sobie z absurdalnie wysokimi / niskimi wartościami. Spójrz na poniższy link: Wiki o medianie


1 dla odpowiedzi nr 3

Jak zauważyłeś, średnia arytmetyczna nie jest dobra, jeślisą bardzo wysokie / niskie wartości. Możesz obliczyć medianę, jak ktoś zasugerował, czyli na posortowanej liście twoich wartości, „środkową” wartość (jeśli twój zestaw zawiera nierówną ilość elementów) lub średnią arytmetyczną dwóch „średnich” wartości (w przeciwnym razie ).

Inną metodą byłoby upuszczenie, powiedzmy, najniższej i najwyższej piątki percentyle i oblicz średnią arytmetyczną reszty.


1 dla odpowiedzi nr 4

Niektóre opcje:

  • Najpierw odrzuć N najwyższych i najniższych wartości i oblicz arytmetyczną średnią dla reszty. Ustaw N na odpowiednią wartość, aby np. 1% lub 10% wartości zostało odrzuconych.
  • Użyj medianalub wartość środkowa.
  • Posługiwać się Średnia geometryczna które dają mniejszą wagę dla wartości odstających.

Listy w Wikipedii kilka sposobów obliczyć różne wartości „średnie”