для чего нужно стандартное отклонение

11.10.202325.06.2023 admin 0 Comments

Стандартное отклонение

Стандартное отклонение (англ. Standard Deviation) — простыми словами это мера того, насколько разбросан набор данных.

Вычисляя его, можно узнать, являются ли числа близкими к среднему значению или далеки от него. Если точки данных находятся далеко от среднего значения, то в наборе данных имеется большое отклонение; таким образом, чем больше разброс данных, тем выше стандартное отклонение.

Стандартное отклонение обозначается буквой σ (греческая буква сигма).

Стандартное отклонение также называется:

Использование и интерпретация величины среднеквадратического отклонения

Стандартное отклонение используется:

Рассмотрим два малых предприятия, у нас есть данные о запасе какого-то товара на их складах.

День 1	День 2	День 3	День 4
Пред.А	19	21	19	21
Пред.Б	15	26	15	24

В обеих компаниях среднее количество товара составляет 20 единиц:

Однако, глядя на цифры, можно заметить:

Если рассчитать стандартное отклонение каждой компании, оно покажет, что

Стандартное отклонение показывает эту волатильность данных — то, с каким размахом они меняются; т.е. как сильно этот запас товара на складах компаний колеблется (поднимается и опускается).

Расчет среднеквадратичного (стандартного) отклонения

Формулы вычисления стандартного отклонения

Разница между формулами S и σ («n» и «n–1»)

Состоит в том, что мы анализируем — всю выборку или только её часть:

Как рассчитать стандартное отклонение?

Пример 1 (с σ)

Рассмотрим данные о запасе какого-то товара на складах Предприятия Б.

День 1	День 2	День 3	День 4
Пред.Б	15	26	15	24

Если значений выборки немного (небольшое n, здесь он равен 4) и анализируются все значения, то применяется эта формула:

Применяем эти шаги:

1. Найти среднее арифметическое выборки:

μ = (15 + 26 + 15+ 24) / 4 = 20

2. От каждого значения выборки отнять среднее арифметическое:

3. Каждую полученную разницу возвести в квадрат:

4. Сделать сумму полученных значений:

5. Поделить на размер выборки (т.е. на n):

6. Найти квадратный корень:

Пример 2 (с S)

Задача усложняется, когда существуют сотни, тысячи или даже миллионы данных. В этом случае берётся только часть этих данных и анализируется методом выборки.

У Андрея 20 яблонь, но он посчитал яблоки только на 6 из них.

Популяция — это все 20 яблонь, а выборка — 6 яблонь, это деревья, которые Андрей посчитал.

Яблоня 1	Яблоня 2	Яблоня 3	Яблоня 4	Яблоня 5	Яблоня 6
9	2	5	4	12	7

Так как мы используем только выборку в качестве оценки всей популяции, то нужно применить эту формулу:

Математически она отличается от предыдущей формулы только тем, что от n нужно будет вычесть 1. Формально нужно будет также вместо μ (среднее арифметическое) написать X ср.

Применяем практически те же шаги:

1. Найти среднее арифметическое выборки:

Xср = (9 + 2 + 5 + 4 + 12 + 7) / 6 = 39 / 6 = 6,5

2. От каждого значения выборки отнять среднее арифметическое:

X1 – Xср = 9 – 6,5 = 2,5

X2 – Xср = 2 – 6,5 = –4,5

X3 – Xср = 5 – 6,5 = –1,5

X4 – Xср = 4 – 6,5 = –2,5

X5 – Xср = 12 – 6,5 = 5,5

X6 – Xср = 7 – 6,5 = 0,5

3. Каждую полученную разницу возвести в квадрат:

4. Сделать сумму полученных значений:

Σ (Xi – Xср)² = 6,25 + 20,25+ 2,25+ 6,25 + 30,25 + 0,25 = 65,5

5. Поделить на размер выборки, вычитав перед этим 1 (т.е. на n–1):

(Σ (Xi – Xср)²)/(n-1) = 65,5 / (6 – 1) = 13,1

6. Найти квадратный корень:

S = √((Σ (Xi – Xср)²)/(n–1)) = √ 13,1 ≈ 3,6193

Дисперсия и стандартное отклонение

Стандартное отклонение равно квадратному корню из дисперсии (S = √D). То есть, если у вас уже есть стандартное отклонение и нужно рассчитать дисперсию, нужно лишь возвести стандартное отклонение в квадрат (S² = D).

Дисперсия — в статистике это «среднее квадратов отклонений от среднего». Чтобы её вычислить нужно:

Ещё расчёт дисперсии можно сделать по этой формуле:

Правило трёх сигм

Это правило гласит: вероятность того, что случайная величина отклонится от своего математического ожидания более чем на три стандартных отклонения (на три сигмы), почти равна нулю.

Глядя на рисунок нормального распределения случайной величины, можно понять, что в пределах:

Это означает, что за пределами остаются лишь 0,28% — это вероятность того, что случайная величина примет значение, которое отклоняется от среднего более чем на 3 сигмы.

Стандартное отклонение в excel

Вычисление стандартного отклонения с «n – 1» в знаменателе (случай выборки из генеральной совокупности):

1. Занесите все данные в документ Excel.

2. Выберите поле, в котором вы хотите отобразить результат.

3. Введите в этом поле «=СТАНДОТКЛОНА(«

4. Выделите поля, где находятся данные, потом закройте скобки.

5. Нажмите Ввод (Enter).

В случае если данные представляют всю генеральную совокупность (n в знаменателе), то нужно использовать функцию СТАНДОТКЛОНПА.

Коэффициент вариации

Коэффициент вариации — отношение стандартного отклонения к среднему значению, т.е. Cv = (S/μ) × 100% или V = (σ/X̅) × 100%.

Стандартное отклонение делится на среднее и умножается на 100%.

Можно классифицировать вариабельность выборки по коэффициенту вариации:

Источник

Exceltip

Блог о программе Microsoft Excel: приемы, хитрости, секреты, трюки

Что такое стандартное отклонение — использование функции СТАНДОТКЛОН для расчета стандартного отклонения в Excel

Стандартное отклонение является одним из тех статистических терминов в корпоративном мире, которое позволяет поднять авторитет людей, сумевших удачно ввернуть его в ходе беседы или презентации, и оставляет смутное недопонимание тех, кто не знает, что это такое, но стесняется спросить. На самом деле большинство менеджеров не понимают концепцию стандартного отклонения и, если вы один из них, вам пора перестать жить во лжи. В сегодняшней статье я расскажу вам, как эта недооцененная статистическая мера позволит лучше понять данные, с которыми вы работаете.

Что измеряет стандартное отклонение?

Представьте, что вы владелец двух магазинов. И чтобы избежать потерь, важно, чтобы был четкий контроль остатков на складе. В попытке выяснить, кто из менеджеров лучше управляет запасами, вы решили проанализировать стоки последних шести недель. Средняя недельная стоимость стока обоих магазинов примерно одинакова и составляет около 32 условных единиц. На первый взгляд среднее значение стока показывает, что оба менеджера работают одинаково.

Но если внимательнее изучить деятельность второго магазина, можно убедится, что хотя среднее значение корректно, вариабельность стока очень высокая (от 10 до 58 у.е.). Таким образом, можно сделать вывод, что среднее значение не всегда правильно оценивает данные. Вот где на выручку приходит стандартное отклонение.

Стандартное отклонение показывает, как распределены значения относительно среднего в нашей выборке. Другими словами, можно понять на сколько велик разброс величины стока от недели к неделе.

В нашем примере, мы воспользовались функцией Excel СТАНДОТКЛОН, чтобы рассчитать показатель стандартного отклонения вместе со средним.

В случае с первым менеджером, стандартное отклонение составило 2. Это говорит нам о том, что каждое значение в выборке в среднем откланяется на 2 от среднего значения. Хорошо ли это? Давайте рассмотрим вопрос под другим углом – стандартное отклонение равное 0, говорит нам о том, что каждое значение в выборке равно его среднему значению (в нашем случае, 32,2). Так, стандартное отклонение 2 ненамного отличается от 0, и указывает на то, что большинство значений находятся рядом со средним значением. Чем ближе стандартное отклонение к 0, тем надежнее среднее. Более того, стандартное отклонение близкое к 0, говорит о маленькой вариабельности данных. То есть, величина стока со стандартным отклонением 2, указывает на невероятную последовательность первого менеджера.

В случае со вторым магазином, стандартное отклонение составило 18,9. То есть стоимость стока в среднем отклоняется на величину 18,9 от среднего значения от недели к неделе. Сумасшедший разброс! Чем дальше стандартное отклонение от 0, тем менее точно среднее значение. В нашем случае, цифра 18,9 указывает на то, что среднему значению (32,8 у.е. в неделю) просто нельзя доверять. Оно также говорит нам о том, что еженедельная величина стока обладает большой вариабельностью.

Такова концепция стандартного отклонения в двух словах. Хотя оно не дает представление о других важных статистических измерениях (Мода, Медиана…), фактически стандартное отклонение играет решающую роль в большинстве статистических расчетов. Понимание принципов стандартного отклонения прольет свет на суть многих процессов вашей деятельности.

Как рассчитать стандартное отклонение?

Итак, теперь мы знаем, о чем говорит цифра стандартного отклонения. Давайте разберемся, как она считается.

Рассмотрим набор данных от 10 до 70 с шагом 10. Как видите, я уже рассчитал для них значение стандартного отклонения с помощью функции СТАНДОТКЛОН в ячейке H2 (оранжевым).

Ниже описаны шаги, которые предпринимает Excel, чтобы прийти к цифре 21,6.

Обратите внимание, что все расчеты визуализированы, для лучшего понимания. На самом деле в Excel расчет происходит мгновенно, оставляя все шаги за кулисами.

Для начала Excel находит среднее значение выборки. В нашем случае, среднее получилось равным 40, которое на следующем шаге отнимают от каждого значения выборки. Каждую полученную разницу возводят в квадрат и суммируют. У нас получилась сумма равная 2800, которую необходимо разделить на количество элементов выборки минус 1. Так как у нас 7 элементов, получается необходимо 2800 разделить на 6. Из полученного результата находим квадратный корень, это цифра будет стандартным отклонением.

Для тех, кому не совсем ясен принцип расчета стандартного отклонения с помощью визуализации, привожу математическую интерпретацию нахождения данного значения.

Функции расчета стандартного отклонения в Excel

В Excel присутствует несколько разновидностей формул стандартного отклонения. Вам достаточно набрать =СТАНДОТКЛОН и вы сами в этом убедитесь.

Стоит отметить, что функции СТАНДОТКЛОН.В и СТАНДОТКЛОН.Г (первая и вторая функция в списке) дублируют функции СТАНДОТКЛОН и СТАНДОТКЛОНП (пятая и шестая функция в списке), соответственно, которые были оставлены для совместимости с более ранними версиями Excel.

Особенностью функций СТАНДОТКЛОНА и СТАНДОТКЛОНПА (третья и четвертая функция в списке), является то, что при расчете стандартного отклонения массива в расчет принимаются логические и текстовые значения. Текстовые и истинные логические значения равняются 1, а ложные логические значения равняются 0. Мне трудно представить ситуацию, когда бы мне могли понадобится эти две функции, поэтому, думаю, что их можно игнорировать.

Вам также могут быть интересны следующие статьи

32 комментария

Ренат, добрый день.
Мне нравится статья, а главное способ подачи материала. Визуализация расчёта также порадовала новизной подхода, хотя и времени потребовала больше для понимания (классическое советское образование). Согласен, что про стандартное отклонение никто толком не знает, а зря…

Добрый день.
В формуле ошибка: под знаком корня необходимо суммировать квадраты отклонений

Источник

Стандартное отклонение

Стандартное отклонение — классический индикатор изменчивости из описательной статистики.

Стандартное отклонение, среднеквадратичное отклонение, СКО, выборочное стандартное отклонение (англ. standard deviation, STD, STDev) — очень распространенный показатель рассеяния в описательной статистике. Но, т.к. технический анализ сродни статистике, данный показатель можно (и нужно) использовать в техническом анализе для обнаружения степени рассеяния цены анализируемого инструмента во времени. Обозначается греческим символом Сигма «σ».

Спасибо Карлам Гауссу и Пирсону за то, что мы имеем возможность пользоваться стандартным отклонением.

Используя стандартное отклонение в техническом анализе, мы превращаем этот «показатель рассеяния» в «индикатор волатильности«, сохраняя смысл, но меняя термины.

Что представляет собой стандартное отклонение

Понимание сути стандартного отклонения возможно с пониманием азов описательной статистики. К примеру, мы имеем 2 выборки, у которых среднее арифметическое одинаково и равно 3. Казалось бы, одинаковое среднее делает эти две выборки одинаковыми. Ан-нет! Давайте рассмотрим возможные варианты данных для этих двух выборок:

Очевидно, что разброс (или рассеяние, или, в нашем случае, волатильность) гораздо больше во второй выборке. Следовательно, несмотря на то, что у этих двух выборок одинаковое среднее (равное 3), они совершенно разные в силу того, что у второй выборки данные беспорядочно и сильно рассеяны вокруг центра, а у первой — сконцентрированы около центра и упорядочены.

Но если нам надо быстро дать понять о таком явлении, мы не будем объяснять, как в абзаце выше, а просто скажем, что у второй выборки очень большое стандартное отклонение, а у первой — очень маленькое. Так, у второй выборки стандартное отклонение равно 186, а у первой оно равно 1,6. Разница существенная.

Стандартное отклонение в техническом анализе

Стандартное отклонение используется в техническом анализе не так часто, но оно служит отличным индикатором волатильности (изменчивости). Стандартное отклонение используется для промежуточных вычислений различных индикаторов, таких как, например, Полосы Боллинджера или Ширина Полос Боллинджера.

Но помимо промежуточных вспомогательных вычислений, стандартное отклонение вполне приемлемо для самостоятельного вычисления и применения в техническом анализе. Как отметил активный читатель нашего журнала burdock, «до сих пор не пойму, почему СКО не входит в набор стандартных индикаторов отечественных диллинговых центров«.

Действительно, стандартное отклонение может классическим и «чистым» способом измерить изменчивость инструмента. Но к сожалению, этот индикатор не так распространен в анализе ценных бумаг.

Применение стандартного отклонения

Для любого индикатора нам понадобится переменная, т.е. параметр. В данном случае нам нужен только период n, который указывает, какое количество периодов мы будем включать в вычисление стандартного отклонения.

Для вычисления, мы берем данные закрытия из n периодов назад от последней доступной цены. Т.е. если мы установили период индикатора 20 (достаточно часто используемый период),то мы берем 20 последних данных и оперируем ими для вычисления стандартного отклонения сегодня. Следовательно, для вычисления стандартного отклонения в любой момент времени k, надо взять цены закрытия всех n периодов назад от k.

Вычисление стандартного отклонения

Предупреждаю, что самостоятельное вычисление вам врядли понадобиться, т.к. основные программы обработки данных имеют встроенную функцию вычисления стандартного отклонения. Например, в Microsoft Excel эта функция называется СТАНДОТКЛОН.

Вручную вычислить стандартное отклонение не очень интересно, но полезно для опыта. Стандартное отклонение можно выразить формулой STD=√[(∑(x- x ) 2 )/n], что звучит как корень из суммы квадратов разниц между элементами выборки и средним, деленной на количество элементов в выборке.

Если количество элементов в выборке превышает 30, то знаменатель дроби под корнем принимает значение n-1. Иначе используется n.

Пошагово вычисление стандартного отклонения:

Для наглядности, вот пример из таблицы Excel:

В данном примере я взял краткий отрезок исторических данных цен закрытия индекса ПФТС. Для вычислений, дата не нужна, но я решил ее оставить, чтоб вы могли сверить, если хотите. Что действительно важно, это все остальное. Обратите внимание на отдельные данные под темным разделителем: «среднее» и «всего». Есть столбец с ценой закрытия, столбец с разницами данных и среднего, и квадраты этих разниц.

После вычисления квадратов, мы складываем их, полученную сумму делим на количество элементов выборки (т.к. всего элементов 24, что меньше 30) и из полученного честного вычисляем квадратный корень. Результат округляем до целого, и получаем 69.

Важно заметить, что все эти вычисления дадут нам лишь значение индикатора «стандартное отклонение» в последний день, т.е. 26.09.2008, а для каждой другой даты надо проделывать этот комплекс операций отдельно.

Прикладное значение стандартного отклонения

Напомню, что смысл стандартного отклонения заключается в выявлении степени изменчивости инструмента. Т.е. стандартное отклонение не сможет показать аналитику ничего, кроме волатильности.

Важно отметить, что элементы выборки в среднем отличается от среднего значения на ±СО. Т.е. из примера выше, цены закрытия индекса ПФТС в среднем отличаются от среднего значения на ±69.

Из примера выше, отдельно цифра 69 ничего не скажет, т.к надо ее использовать с другими значениями стандартного отклонения в другие периоды. 69 — относительно немалая волатильность, но если в другие периоды стандартное отклонение будет больше 100, то, естественно, 69 окажется умеренной изменчивостью. Т.е. «все познается в сравнении«.

Вывод

Стандартное отклонение — классический индикатор изменчивости из описательной статистики. Он поможет увидеть, как изменяется волатильность инструмента во времени.

комментария 23

Я уже 4 дня по формулам в интрнете пытаюсь рассчитать СО и вообще понять ЧЕ ЭТО ТАКОЕ.
Вы себе не представляете каким счастливым вы меня сделали!
Статья очень доходчиво написана. Тут и пример есть и программа в Экселе и минимум текста, но за-то каждое слово ценно. СПАСИБО.

Да!! Согласен с Читателем!Статья действительно отличная, как и все остальные на этом сайте!
Спасибо!

В разделе «Вычисление стандартного отклонения» есть такая формулировка:
«Стандартное отклонение можно выразить формулой STD=√[(∑(x-x)2)/n], что звучит как корень из суммы разниц между элементами выборки и средним, деленной на количество элементов в выборке».
Следует читать:
«Стандартное отклонение можно выразить формулой STD=√[(∑(x-x)2)/n], что звучит как корень из суммы квадратов разниц между элементами выборки и средним, деленной на количество элементов в выборке».
Если оценивать материал в целом, то подан он очень добротно (доходчиво).

Вам не кажется, что тут закралась некоторая ошибка?
если для выборки 1,2,3,4,5 брать знаменатель n (=5), то среднеквадратичное отклонение будет 1.5, а не 1.6 как пишется в статье.
По другим источникам, получается наоборот — при малом количестве выборок берется n-1, при большом берется любое — либо n, либо n-1.
Более того этим и отличаются «стандартное отклонение» (n-1) от «среднеквадратичного» (n)

Друзья,спасибо Вам огромное,ВЫ оч оч оч оч оч помогли,я как начинающий пытался долго понять,что это такое и зачем нужно,но в учебниках все одна вода,спасибо за ясность,которую вы внесли в подобного рода коллапс=)
Респект=)

Статья понравилась, иногда даже слишком подробная.

Но вкралась ошибочка:
«Важно отметить, что элементы выборки в среднем отличается от среднего значения на ±СО»

Элементы выборки отличаются в среднем на sum(abs(отклонений от среднего))/n (В excel — СРОТКЛ()), а Стандартное отклонение, как показал мой скромный опыт (могу ошибаться) — более отзывчивый к изменчивости/волатильности индикатор.

n берется если вы вычисляете СКО для генеральной совокупности, если вы имеете дело с выборкой, то берется n-1. А СКО и СО ничем, кроме названия друг от друга не отличаются..

Надо отдать должное автору, статья замечательная, лучшая из всех, с которыми мне приходилось знакомиться, понятная даже школьникам. После таких статей начитаешь любить математику и статистику. На мой взгляд, статья будет полнее, если привести простые и яркие примерами, где это можно применить.

Согласен с Сомневающимся в части 1,5 а не 1,6. Если отбросить данные извне формулы СО и дисперсии, а рассуждать с точки зрения простой логики. Тогда среднее отклонение от среднеарифметического вычисляется как среднеарифметическое модулей разностей отклонений от среднеарифметического, т.е. (мод(3-2)+мод(3-1)+мод(3-4)+ мод(3-5))/4 = 1,5. Что и понятно логически — лежит ровно посередине между 4 и 5 или 1 и 2. И в этом есть геометрический смысл. А по формулам выходит 1,6. Понять не могу. Может, кто-нить просветит?

Отличная статья. Спасибо автору.
А что касается n, то, похоже, действительно неточность. Т.к. при больших n вычитание единицы будет оказывать весьма незначительное воздействие на результат и им можно пренебречь. Т.о. при малых n следует использовать n-1, а при больших — единицу можно не вычитать.

Это просто потрясающая статья. Я по-моему весь интернет перелопатила, чтобы хоть что-нибудь понять.
Огромное спасибо автору.
Было бы по больше нормальных, коротких и понятных статей)))

спасибо Вам, Человек. огромный респектище, даже мне-имбецилу стало понятно. и пох, что мой коммент Вам не всрался, пардон за мой французский

….присоединяюсь к благодарностям, только что очень выручил. Только с этого сайта скатала объяснения нормальные.

Статья прекрасная! Долго не могла найти такого доходчивого и понятного описания. То, что нужно! Спасибо большое автору!

Нормально! Я все поняла!
Спасибо.

Очень доходчивая статья, прочитал на одном дыхании) Все просто и ясно изложена, согласен с Игорем, после прочтения статьи начинаешь больше интересоваться статистикой. Добавляю сайт в закладки. Спасибо!

Мне не совсем понятно утверждение: «элементы выборки в среднем отличается от среднего значения на ±СО.» Насколько я помню, значение искомой величины есть [x]± t*CO/(корень из n), где t-коэф.Стьюдента, n — количество элементов.

например применяется в xyz анализе, для определения классов товаров и для определения по ним страхового запаса ввиде прибавления СКО к среднему значению в условиях неопределенности

спасибо, очень доступное раскрытие сложного математического термина, если это возможно — посмотрите на стандартное отклонение в программе Wealth-Lab Developer 3.01. Написал алгоритм, хочу заавтоматить, но не могу нормальное ТЗ для программиста составить, споткнулся на формуле STDDEV, заранее благодарен.

По приведенной формуле нерационально рассчитывать СО, поскольку она требует два прохода (расчет среднего и дисперсии)формулу можно изменить и считать за один проход (сумму и сумму квадратов). Формулу не привожу, боюсь налажал с n. Надо в Нете поискать.

Отличная статья, но осталось непонятным, как рассчитывается канал Стандарное отклонение в терминале Метатрейдер 4

Спасибо автору статьи. Дело в том что я преподаю Excel для продвинутых пользователей и как раз собирался дат лекцию по стандартному отклонению. Так как моя специальность не статистик нуждался в таком доходчивом объяснении для для таких чайников как я. Отзыв оставляю для того чтобы автор продолжал писать такие статьи.
Привет из Баку!

Глубокоуважаемый автор, спасибо за замечательную статью, но, может быть я ошибаюсь, но в вашем алгоритме пошагового вычисления закралась ошибка.
Пошагово вычисление стандартного отклонения сначала нужно суммировать значения, затем возводить в квадрат, т.к. квадрат даже отрицательного числа будет положительным. В этом случае дисперсное значение будет неверным. Жду ответа.

Источник

Ответы на вопросы

для чего нужно стандартное отклонение

Стандартное отклонение

Использование и интерпретация величины среднеквадратического отклонения

Расчет среднеквадратичного (стандартного) отклонения