Калькулятор стандартного отклонения
Вставьте список чисел — калькулятор вычислит среднее значение, дисперсию, стандартное отклонение (для выборки s — с знаменателем n−1, для популяции σ — с знаменателем n), коэффициент вариации и z-значения для каждого числа. Это очень удобно при необходимости оценить степень рассеивания данных вокруг их среднего значения — ключевой показатель перед проведением любого параметрического теста.
Как рассчитывается стандартное отклонение
-
1
Вставьте свои числа
Элементы разделены запятыми, пробелами или новыми строками; ненумерические значения пропускаются.
-
2
Средняя линия типа «x» рассчитывается.
Сумма, разделённая на количество.
-
3
Квадратные отклонения суммируются.
сумма ((x – среднее значение x)²).
-
4
Разделите и извлеките корень
Для выборки делите на (n − 1) и извлекайте квадратный корень; для всей популяции делите на n и также извлекайте квадратный корень.
Примерная выборка против общей выборки — когда использовать каждую из них
| Используется общая выборка (n/2) | Используется выборка размером (n−1)/2 |
|---|---|
| У вас есть вся общая популяция; у вас — выборка, взятая из более большой популяции. | |
| Полный перечень сотрудников | 20 клиентов, отобранных из тысяч |
| Все 10 бросков кубика в течение одной сессии | Измерения с производственной линии |
Делитель n−1 (коррекция Бесселя) позволяет получить несмещённый оценщик дисперсии популяции на основе выборочных данных. При использовании делителя n истинная дисперсия популяции систематически занижается; при большом размере выборки это различие уменьшается, однако при малых размерах выборки оно остаётся значимым.
Интуиция стандартного отклонения
Если среднее значение множества составляет 100, а стандартное отклонение — 15, то (при условии приблизительно нормального распределения):
- 68 % значений находятся в диапазоне от 85 до 115 (1 стандартное отклонение) – 95 % в диапазоне от 70 до 130 (с погрешностью ±2 стандартных отклонений) – 99,7 % в диапазоне от 55 до 145 (с погрешностью ±3 стандартных отклонений)
Это правило 68–95–99,7, также известное как эмпирическое правило; оно тесно соответствует результатам тестов на интеллект (IQ), человеческой росту и многим другим естественным измерениям.
Коэффициент вариации
Коэффициент вариативности (КВ) равен стандартному отклонению делённому на среднее значение. Это безразмерная мера дисперсии, полезная при сравнении степени изменчивости данных с разными средними значениями. КВ = 0,1 (10 %) означает, что стандартное отклонение составляет примерно 10 % от среднего значения; этот показатель не имеет смысла для данных, значения которых могут быть нулевыми.
З-значения
Для каждого значения x выполняется выражение: z = (x – среднее значение) / стандартное отклонение. Значение z показывает, насколько данное значение находится выше или ниже среднего значения в единицах стандартного отклонения. Если |z| > 2, такое значение обычно считается аномальным; при этом значение |z| > 3 встречается крайне редко в нормальных данных.
Найтичные ошибки
– Использование популяции вместо выборки приводит к занижению степени вариабельности в выборочной выборке. – Сочетание среднего значения и стандартного отклонения из разных единиц измерения. Обязательно проверяйте масштаб. – Применение правил нормального распределения к данным, не подчиняющимся нормальному распределению. Несимметричные или многомодальные данные нарушают эвристику 68–95–99,7; сначала составьте гистограмму. – Игнорирование аномальных значений: одно крайнее значение может утроить стандартное отклонение. Для данных с тяжёлыми хвостами существуют надёжные альтернативы (абсолютное отклонение от медианы, интерквартильный диапазон).
Часто задаваемые вопросы
В Excel имеются две функции: STDEV (для выборки, с знаменателем n−1) и STDEVP (для всей популяции, с знаменателем n). Убедитесь, что вы используете ту из них, которая соответствует вашим предположениям относительно выборки или всей популяции.
Да — стандартное отклонение выражается в тех же единицах, что и ваши измерения (см, доллары, секунды). Дисперсия измеряется в квадратных единицах, поэтому стандартное отклонение легче понимать.
Стандартное отклонение выборки определяется при n ≥ 2. При n ≈ 30 рекомендуется указывать доверительные интервалы вокруг стандартного отклонения или использовать более надежный альтернативный подход.
Стандартное отклонение по-прежнему определяется следующим образом: для доли p стандартное отклонение равен √(p × (1 − p)). Для выборки, в которой 60 % значений равны единице, стандартное отклонение составляет √(0,6 × 0,4) ≈ 0,49 независимо от количества наблюдений.