Калькулятор стандартного отклонения

Standard deviation

Вставьте список чисел — калькулятор вычислит среднее значение, дисперсию, стандартное отклонение (для выборки s — с знаменателем n−1, для популяции σ — с знаменателем n), коэффициент вариации и z-значения для каждого числа. Это очень удобно при необходимости оценить степень рассеивания данных вокруг их среднего значения — ключевой показатель перед проведением любого параметрического теста.

Как рассчитывается стандартное отклонение

  1. 1

    Вставьте свои числа

    Элементы разделены запятыми, пробелами или новыми строками; ненумерические значения пропускаются.

  2. 2

    Средняя линия типа «x» рассчитывается.

    Сумма, разделённая на количество.

  3. 3

    Квадратные отклонения суммируются.

    сумма ((x – среднее значение x)²).

  4. 4

    Разделите и извлеките корень

    Для выборки делите на (n − 1) и извлекайте квадратный корень; для всей популяции делите на n и также извлекайте квадратный корень.

Примерная выборка против общей выборки — когда использовать каждую из них

Используется общая выборка (n/2) Используется выборка размером (n−1)/2
У вас есть вся общая популяция; у вас — выборка, взятая из более большой популяции.
Полный перечень сотрудников 20 клиентов, отобранных из тысяч
Все 10 бросков кубика в течение одной сессии Измерения с производственной линии

Делитель n−1 (коррекция Бесселя) позволяет получить несмещённый оценщик дисперсии популяции на основе выборочных данных. При использовании делителя n истинная дисперсия популяции систематически занижается; при большом размере выборки это различие уменьшается, однако при малых размерах выборки оно остаётся значимым.

Интуиция стандартного отклонения

Если среднее значение множества составляет 100, а стандартное отклонение — 15, то (при условии приблизительно нормального распределения):

Это правило 68–95–99,7, также известное как эмпирическое правило; оно тесно соответствует результатам тестов на интеллект (IQ), человеческой росту и многим другим естественным измерениям.

Коэффициент вариации

Коэффициент вариативности (КВ) равен стандартному отклонению делённому на среднее значение. Это безразмерная мера дисперсии, полезная при сравнении степени изменчивости данных с разными средними значениями. КВ = 0,1 (10 %) означает, что стандартное отклонение составляет примерно 10 % от среднего значения; этот показатель не имеет смысла для данных, значения которых могут быть нулевыми.

З-значения

Для каждого значения x выполняется выражение: z = (x – среднее значение) / стандартное отклонение. Значение z показывает, насколько данное значение находится выше или ниже среднего значения в единицах стандартного отклонения. Если |z| > 2, такое значение обычно считается аномальным; при этом значение |z| > 3 встречается крайне редко в нормальных данных.

Найтичные ошибки

– Использование популяции вместо выборки приводит к занижению степени вариабельности в выборочной выборке. – Сочетание среднего значения и стандартного отклонения из разных единиц измерения. Обязательно проверяйте масштаб. – Применение правил нормального распределения к данным, не подчиняющимся нормальному распределению. Несимметричные или многомодальные данные нарушают эвристику 68–95–99,7; сначала составьте гистограмму. – Игнорирование аномальных значений: одно крайнее значение может утроить стандартное отклонение. Для данных с тяжёлыми хвостами существуют надёжные альтернативы (абсолютное отклонение от медианы, интерквартильный диапазон).

Часто задаваемые вопросы

В Excel имеются две функции: STDEV (для выборки, с знаменателем n−1) и STDEVP (для всей популяции, с знаменателем n). Убедитесь, что вы используете ту из них, которая соответствует вашим предположениям относительно выборки или всей популяции.

Да — стандартное отклонение выражается в тех же единицах, что и ваши измерения (см, доллары, секунды). Дисперсия измеряется в квадратных единицах, поэтому стандартное отклонение легче понимать.

Стандартное отклонение выборки определяется при n ≥ 2. При n ≈ 30 рекомендуется указывать доверительные интервалы вокруг стандартного отклонения или использовать более надежный альтернативный подход.

Стандартное отклонение по-прежнему определяется следующим образом: для доли p стандартное отклонение равен √(p × (1 − p)). Для выборки, в которой 60 % значений равны единице, стандартное отклонение составляет √(0,6 × 0,4) ≈ 0,49 независимо от количества наблюдений.