У дома - Стени
Как да намерите желаната стойност чрез стандартното отклонение. формула стандартно отклонение в excel

Според извадковото проучване вложителите са групирани според размера на депозита в Сбербанк на града:

Определете:

1) диапазон на вариация;

2) среден размер на депозита;

3) средно линейно отклонение;

4) дисперсия;

5) стандартно отклонение;

6) коефициент на вариация на вноските.

Решение:

Тази серия на разпределение съдържа отворени интервали. В такива серии стойността на интервала от първата група условно се приема за равна на стойността на интервала от следващата, а стойността на интервала от последната група е равна на стойността на интервала от предишната един.

Стойността на интервала на втората група е 200, следователно стойността на първата група също е 200. Стойността на интервала на предпоследната група е 200, което означава, че последният интервал също ще има стойност, равна на 200.

1) Дефинирайте диапазона на вариация като разликата между най-голямата и най-малката стойност на атрибута:

Диапазонът на вариация на размера на вноската е 1000 рубли.

2) Средният размер на вноската се определя по формулата на средноаритметично претеглената стойност.

Нека предварително определим дискретната стойност на атрибута във всеки интервал. За да направим това, използвайки простата формула за средна аритметична стойност, намираме средните точки на интервалите.

Средната стойност на първия интервал ще бъде равна на:

второто - 500 и т.н.

Нека поставим резултатите от изчисленията в таблицата:

Сума на депозита, разтривайте.Брой сътрудници, fСредата на интервала, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Обща сума 400 - 312000

Средният депозит в Сбербанк на града ще бъде 780 рубли:

3) Средното линейно отклонение е средната аритметична стойност на абсолютните отклонения на отделните стойности на атрибута от общата средна стойност:

Процедурата за изчисляване на средното линейно отклонение в серията на интервално разпределение е следната:

1. Средната аритметична претеглена стойност се изчислява, както е показано в параграф 2).

2. Определят се абсолютните отклонения на варианта от средната стойност:

3. Получените отклонения се умножават по честотите:

4. Сумата от претеглените отклонения се намира, без да се взема предвид знакът:

5. Сумата от претеглените отклонения се дели на сумата от честотите:

Удобно е да използвате таблицата с изчислени данни:

Сума на депозита, разтривайте.Брой сътрудници, fСредата на интервала, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Обща сума 400 - - - 81280

Средното линейно отклонение на размера на депозита на клиентите на Сбербанк е 203,2 рубли.

4) Дисперсията е средноаритметичната стойност на квадратите на отклоненията на всяка стойност на характеристиката от средната аритметична стойност.

Изчисляването на дисперсията в серията на интервалното разпределение се извършва по формулата:

Процедурата за изчисляване на дисперсията в този случай е следната:

1. Определете среднопретеглената аритметична стойност, както е показано в параграф 2).

2. Намерете отклонения от средната стойност:

3. Поставяне на квадрат на отклонението на всяка опция от средната стойност:

4. Умножете отклоненията на квадрат по тегла (честоти):

5. Обобщете получените произведения:

6. Получената сума се разделя на сумата от теглата (честотите):

Нека поставим изчисленията в таблица:

Сума на депозита, разтривайте.Брой сътрудници, fСредата на интервала, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Обща сума 400 - - - 23040000

Програмата Excel е високо ценена както от професионалисти, така и от аматьори, тъй като потребител на всяко ниво на обучение може да работи с нея. Например, всеки с минимални умения за "комуникация" с Excel може да начертае проста графика, да направи приличен знак и т.н.

В същото време тази програма дори ви позволява да извършвате различни видове изчисления, например изчисления, но това вече изисква малко по-различно ниво на обучение. Ако обаче току-що сте започнали близко запознаване с тази програма и се интересувате от всичко, което ще ви помогне да станете по-напреднал потребител, тази статия е за вас. Днес ще ви кажа каква е средната стойност стандартно отклонениеформула в excel, защо изобщо е необходима и всъщност кога се използва. Отивам!

Какво е

Да започнем с теорията. Стандартното отклонение се нарича Корен квадратен, получена от средноаритметичната стойност на всички квадратни разлики между наличните стойности, както и тяхната средна аритметична стойност. Между другото, тази стойност обикновено се нарича гръцка буква "сигма". Стандартното отклонение се изчислява по формулата STDEV, съответно програмата го прави за самия потребител.

Същността на тази концепция е да се идентифицира степента на променливост на инструмента, т.е. той по свой начин е показател от описателната статистика. Той разкрива промени в волатилността на инструмента във всеки период от време. С помощта на формулите STDEV можете да оцените стандартното отклонение в извадка, докато логическите и текстови стойностисе игнорират.

Формула

Помага за изчисляване на стандартното отклонение в формула на ексел, който се предоставя автоматично в Excel. За да го намерите, трябва да намерите секцията с формули в Excel и вече там да изберете тази, която има името STDEV, така че е много проста.

След това пред вас ще се появи прозорец, в който ще трябва да въведете данни за изчислението. По-специално, две числа трябва да бъдат въведени в специални полета, след което програмата автоматично ще изчисли стандартното отклонение за извадката.

Несъмнено математическите формули и изчисления са доста сложен въпрос и не всички потребители могат да се справят с него веднага. Въпреки това, ако копаете малко по-дълбоко и разберете проблема малко по-подробно, се оказва, че не всичко е толкова тъжно. Надявам се да сте убедени в това чрез примера за изчисляване на стандартното отклонение.

Видео в помощ

X i -произволни (текущи) стойности;

Хсредната стойност на случайните променливи в извадката се изчислява по формулата:

Така, дисперсията е средният квадрат на отклоненията . Тоест първо се изчислява средната стойност, след което се взема разликата между всяка оригинална и средна стойност, на квадрат , се добавя и след това се разделя на броя на стойностите в дадената популация.

Разликата между индивидуалната стойност и средната стойност отразява мярката на отклонението. Той е на квадрат, така че всички отклонения да станат изключително положителни числаи да се избягва взаимното анулиране на положителните и отрицателните отклонения при сумирането им. След това, като имаме квадратни отклонения, ние просто изчисляваме средната аритметична стойност.

улика вълшебна дума"дисперсия" е само тези три думи: средно - на квадрат - отклонения.

Стандартно отклонение (RMS)

Вземайки корен квадратен от дисперсията, получаваме т.нар. " стандартно отклонение".Има имена "стандартно отклонение" или "сигма" (от името на гръцката буква σ .). Формулата за стандартното отклонение е:

Така, дисперсията е сигма на квадрат или - стандартно отклонение на квадрат.

Стандартното отклонение, очевидно, също характеризира мярката за дисперсия на данните, но сега (за разлика от дисперсията) може да се сравни с оригиналните данни, тъй като те имат същите мерни единици (това е ясно от формулата за изчисление). Диапазонът на вариация е разликата между екстремните стойности. Стандартното отклонение, като мярка за несигурност, също участва в много статистически изчисления. Той определя степента на точност различни оценкии прогнози. Ако вариацията е много голяма, тогава стандартното отклонение също ще бъде голямо, следователно прогнозата ще бъде неточна, което ще бъде изразено например в много широки доверителни интервали.

Ето защо в методите за статистическа обработка на данни при оценките на недвижими имоти, в зависимост от изискваната точност на задачата, се използва правилото на две или три сигми.

За да сравним правилото за две сигми и правилото за три сигми, използваме формулата на Лаплас:

Ж - Ж,

където Ф(х) е функцията на Лаплас;



Минимална стойност

β = максимална стойност

s = сигма стойност (стандартно отклонение)

a = средна стойност

В този случай се използва личен изгледФормули на Лаплас, когато границите на стойностите на α и β случайна величина X е на еднакво разстояние от центъра на разпределение a = M(X) с някаква стойност d: a = a-d, b = a+d. Или (1) Формула (1) определя вероятността за дадено отклонение d на случайна величина X с нормален закон на разпределение от нейното математическо очакване М(X) = a. Ако във формула (1) вземем последователно d = 2s и d = 3s, то получаваме: (2), (3).

Правилото на две сигми

Почти надеждно (с доверителна вероятност от 0,954) може да се твърди, че всички стойности на случайна променлива X с нормален закон на разпределение се отклоняват от нейното математическо очакване M(X) = a със стойност не по-голяма от 2s (два стандартни отклонения). Доверителната вероятност (Pd) е вероятността от събития, които условно се приемат за надеждни (тяхната вероятност е близка до 1).

Нека илюстрираме правилото на две сигми геометрично. На фиг. 6 показва крива на Гаус с център на разпределение а. Площта, ограничена от цялата крива и оста Ox, е 1 (100%), а площта на криволинейния трапец между абсцисите a–2s и a+2s, съгласно правилото на двете сигми, е 0,954 (95,4% от общата площ). Площта на защрихованите зони е равна на 1-0,954 = 0,046 (>5% от общата площ). Тези участъци се наричат ​​критичен диапазон на случайната променлива. Стойностите на случайна променлива, които попадат в критичната област, са малко вероятни и на практика условно се приемат за невъзможни.

Вероятност Условно невъзможни ценностисе нарича ниво на значимост на случайната променлива. Нивото на значимост е свързано с нивото на доверие по формулата:

където q е нивото на значимост, изразено като процент.

Правилото на трите сигми

При решаване на проблеми, които изискват по-голяма надеждност, когато вероятността за доверие (Pd) се приема равна на 0,997 (по-точно 0,9973), вместо правилото за две сигми, съгласно формула (3), се използва правилото три сигма.



Според правило три сигмас ниво на достоверност от 0,9973, критичната област ще бъде областта на стойностите на атрибута извън интервала (a-3s, a+3s). Нивото на значимост е 0,27%.

С други думи, вероятността, че абсолютна стойностотклоненията ще надвишат три пъти стандартното отклонение, е много малко, а именно равно на 0,0027=1-0,9973. Това означава, че само в 0,27% от случаите това може да се случи. Такива събития, въз основа на принципа на невъзможността за малко вероятни събития, могат да се считат за практически невъзможни. Тези. вземане на проби с висока точност.

Това е същността на правилото на трите сигми:

Ако една случайна променлива е нормално разпределена, тогава абсолютната стойност на нейното отклонение от математическото очакване не надвишава три пъти стандартното отклонение (RMS).

На практика правилото на трите сигми се прилага по следния начин: ако разпределението на изследваната случайна променлива е неизвестно, но е изпълнено условието, посочено в горното правило, тогава има основание да се приеме, че изследваната променлива е разпределена нормално; в противен случай не се разпространява нормално.

Нивото на значимост се взема в зависимост от допустимата степен на риск и задачата. За оценките на недвижими имоти обикновено се взема по-малко точна извадка, следвайки правилото на двете сигми.

дисперсия. Стандартно отклонение

дисперсияе средната аритметична стойност на квадратните отклонения на всяка стойност на характеристиката от общата средна стойност. В зависимост от изходните данни дисперсията може да бъде непретеглена (проста) или претеглена.

Дисперсията се изчислява по следните формули:

за негрупирани данни

за групирани данни

Процедурата за изчисляване на претеглената дисперсия:

1. определяне на среднопретеглената аритметична стойност

2. Определят се вариантни отклонения от средната стойност

3. повдигнете на квадрат отклонението на всяка опция от средната стойност

4. умножете отклоненията на квадрат по тегла (честоти)

5. обобщава получените работи

6. получената сума се разделя на сумата от теглата

Формулата за определяне на дисперсията може да се преобразува в следната формула:

- просто

Процедурата за изчисляване на дисперсията е проста:

1. определям средноаритметичното

2. повдигнете на квадрат средното аритметично

3. квадрат всеки ред опция

4. опция за намиране на сумата от квадрати

5. разделете сумата от квадратите на опцията на техния брой, т.е. определяне на средния квадрат

6. определете разликата между средния квадрат на характеристиката и квадрата на средната стойност

Също така формулата за определяне на претеглената дисперсия може да се преобразува в следната формула:

тези. дисперсията е равна на разликата между средната стойност на квадратите на стойностите на характеристиките и квадрата на средната аритметична стойност. Когато се използва трансформираната формула, се изключва допълнителна процедура за изчисляване на отклоненията на отделните стойности на характеристика от x и се изключва грешка в изчислението, свързана с отклонения на закръгляване

Дисперсията има редица свойства, някои от които улесняват изчисляването:

1) дисперсията на постоянна стойност е нула;

2) ако всички варианти на стойностите на атрибута са намалени с едно и също число, тогава дисперсията няма да намалее;

3) ако всички варианти на стойностите на атрибута са намалени с еднакъв брой пъти (пъти), тогава дисперсията ще намалее с фактор

Стандартно отклонение S- е корен квадратен от дисперсията:

За негрупирани данни:

;

За вариационна серия:

Диапазонът на вариация, средното линейно и средното квадратно отклонение са именувани величини. Те имат същите единици като индивидуални ценностизнак.

Дисперсията и стандартното отклонение са най-широко използваните мерки за вариация. Това се обяснява с факта, че те са включени в повечето теореми на теорията на вероятностите, която служи като основа на математическата статистика. В допълнение, дисперсията може да бъде разложена на нейните съставни елементи, което позволява да се оцени ефектът различни факторикоито определят вариацията на признака.

Изчисляването на вариационните показатели за банките, групирани по печалба, е показано в таблицата.

Печалба, милиони рубли Брой банки изчислени показатели
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Обща сума: 121,70 17,640 23,126

Средното линейно и средно квадратично отклонение показват до каква степен стойността на атрибута варира средно за изследваните единици и популацията. Да, в този случай средна стойностколебанията в размера на печалбата са: според средното линейно отклонение от 0,882 милиона рубли; според стандартното отклонение - 1,075 милиона рубли. Стандартното отклонение винаги е по-голямо от средното линейно отклонение. Ако разпределението на признака е близко до нормалното, тогава има връзка между S и d: S=1.25d, или d=0.8S. Стандартното отклонение показва как по-голямата част от единиците на съвкупността са разположени спрямо средната аритметична стойност. Независимо от формата на разпределение, 75 стойности на атрибута попадат в интервала x 2S и най-малко 89 от всички стойности попадат в интервала x 3S (теорема на P.L. Chebyshev).

Корен квадратен от дисперсията се нарича стандартно отклонение от средната стойност, което се изчислява, както следва:

елементарен алгебрична трансформацияформули за стандартното отклонение го води до следния вид:

Тази формула често е по-удобна в практиката на изчисленията.

Стандартното отклонение, както и средното линейно отклонение, показва доколко специфичните стойности на атрибута се отклоняват средно от тяхната средна стойност. Стандартното отклонение винаги е по-голямо от средното линейно отклонение. Между тях има връзка:

Познавайки това съотношение, е възможно да се определи неизвестното от известните показатели, например, но (аз изчисляване и обратно. Стандартното отклонение измерва абсолютния размер на колебанието на атрибута и се изразява в същите единици като стойностите на атрибута (рубли, тонове, години и т.н.). Това е абсолютна мярка за вариация.

За алтернативни функции, например присъствие или отсъствие висше образование, застраховка, дисперсия и формули за стандартно отклонение са:

Ще покажем изчисляването на стандартното отклонение според данните от дискретна серия, характеризираща разпределението на студентите от един от факултетите на университета по възраст (Таблица 6.2).

Таблица 6.2.

Резултатите от спомагателните изчисления са дадени в колони 2-5 на табл. 6.2.

Средната възраст на ученика, години, се определя по формулата за средноаритметично претеглено (колона 2):

В колони 3-4 се съдържат квадратите на отклонението на индивидуалната възраст на ученика от средната, а в колона 5 са ​​произведенията на квадратите на отклоненията по съответните честоти.

Дисперсията на възрастта на учениците, години, намираме по формулата (6.2):

Тогава o \u003d l / 3,43 1,85 * oda, т.е. всяка конкретна стойност на възрастта на ученика се отклонява от средната стойност с 1,85 години.

Коефициентът на вариация

В своята абсолютна стойност стандартното отклонение зависи не само от степента на вариация на признака, но и от абсолютните нива на вариантите и средната стойност. Следователно, за да сравнявате средните стойности стандартни отклонениявариационни серии с различни средни нива не са директно възможни. За да можем да направим такова сравнение, трябва да намерим специфично теглосредното отклонение (линейно или квадратично) в средноаритметичното, изразено като процент, т.е. изчисли относителни показатели за вариация.

Линеен коефициент на вариация изчислено по формулата

Коефициентът на вариация определя се по следната формула:

В коефициентите на вариация се елиминира не само несъвместимостта, свързана с различните мерни единици на изследваната черта, но и несъвместимостта, произтичаща от разликите в стойността на средните аритметични стойности. В допълнение, показателите за вариация дават характеристика на хомогенността на съвкупността. Наборът се счита за хомогенен, ако коефициентът на вариация не надвишава 33%.

Според табл. 6.2 и резултатите от изчисленията, получени по-горе, определяме коефициента на вариация,%, съгласно формулата (6.3):

Ако коефициентът на вариация надвишава 33%, това показва хетерогенността на изследваната популация. Получената стойност в нашия случай показва, че съвкупността от ученици по възраст е хомогенна по състав. По този начин важна функция на обобщаващите показатели за вариация е оценката на надеждността на средните стойности. По-малкото c1, a2 и V, толкова по-хомогенен е резултатният набор от явления и толкова по-надеждна е получената средна стойност. Според „правилото на трите сигми“, разглеждано от математическата статистика, в нормално разпределени или близки до тях серии отклонения от средноаритметичната стойност, непревишаващи ± 3-ти, се срещат в 997 случая от 1000. Така, знаейки, х и a, можете да получите обща първоначална представа за серията вариации. Ако например средната заплатана служител в компанията възлиза на 25 000 рубли, а a е равно на 100 рубли, тогава с вероятност, близка до надеждността, може да се твърди, че заплатите на служителите на компанията варират в рамките на (25 000 ± 3 x 100), т.е. от 24 700 до 25 300 рубли.



 


Прочети:



Ползите и значението на хидроаминокиселината треонин за човешкото тяло Инструкции за употреба на треонин

Ползите и значението на хидроаминокиселината треонин за човешкото тяло Инструкции за употреба на треонин

Той диктува собствените си правила. Хората все повече прибягват до корекция на диетата и, разбира се, спорт, което е разбираемо. В края на краищата, в условията на големи ...

Плодове от копър: полезни свойства, противопоказания, особености на приложение Резене обикновен химически състав

Плодове от копър: полезни свойства, противопоказания, особености на приложение Резене обикновен химически състав

Семейство Сенникоцветни - Apiaceae. Народно наименование: аптечен копър. Използвани части: зрял плод, много рядко корен. Име на аптеката:...

Генерализирана атеросклероза: причини, симптоми и лечение

Генерализирана атеросклероза: причини, симптоми и лечение

Клас 9 Болести на кръвоносната система I70-I79 Болести на артериите, артериолите и капилярите I70 Атеросклероза I70.0 Атеросклероза на аортата I70.1...

Контрактури на различни групи стави, причини, симптоми и методи на лечение

Контрактури на различни групи стави, причини, симптоми и методи на лечение

Травматолозите и ортопедите се занимават с лечение на контрактура на Дюпюитрен. Лечението може да бъде както консервативно, така и хирургично. Избор на методи...

изображение на емисия RSS