реклама

Начало - Стени
Как да намерите желаната стойност с помощта на стандартното отклонение. Стандартно отклонение на формула в excel

Според извадковото проучване вложителите са групирани според размера на техния депозит в Сбербанк на града:

Определете:

1) обхват на вариация;

2) среден размер на депозита;

3) средно линейно отклонение;

4) дисперсия;

5) стандартно отклонение;

6) коефициент на вариация на вноските.

Решение:

Тази серия на разпределение съдържа отворени интервали. В такива серии условно се приема, че стойността на интервала на първата група е равна на стойността на интервала на следващата, а стойността на интервала на последната група е равна на стойността на интервала на предишен.

Стойността на интервала от втората група е равна на 200, следователно стойността на първата група също е равна на 200. Стойността на интервала от предпоследната група е равна на 200, което означава, че последният интервал също ще имат стойност 200.

1) Нека дефинираме диапазона на вариация като разликата между най-голямата и най-малката стойност на атрибута:

Диапазонът на вариация на размера на депозита е 1000 рубли.

2) Средният размер на вноската ще бъде определен с помощта на формулата за среднопретеглено аритметично.

Нека първо определим дискретната стойност на атрибута във всеки интервал. За да направим това, използвайки простата формула за средна аритметична стойност, намираме средните точки на интервалите.

Средната стойност на първия интервал ще бъде:

второто - 500 и т.н.

Нека въведем резултатите от изчислението в таблицата:

Сума на депозита, разтривайте.Брой вложители, еСреда на интервала, хxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Общо 400 - 312000

Средният депозит в Сбербанк на града ще бъде 780 рубли:

3) Средното линейно отклонение е средноаритметичното на абсолютните отклонения на отделните стойности на характеристика от общата средна стойност:

Процедурата за изчисляване на средното линейно отклонение в серията на интервално разпределение е следната:

1. Среднопретеглената аритметична стойност се изчислява, както е показано в параграф 2).

2. Определят се абсолютни отклонения от средната стойност:

3. Получените отклонения се умножават по честоти:

4. Намерете сумата от претеглените отклонения, без да вземете предвид знака:

5. Сумата от претеглените отклонения се дели на сумата от честотите:

Удобно е да използвате таблицата с данни за изчисление:

Сума на депозита, разтривайте.Брой вложители, еСреда на интервала, х
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Общо 400 - - - 81280

Средното линейно отклонение на размера на депозита на клиентите на Сбербанк е 203,2 рубли.

4) Дисперсията е средноаритметичната стойност на квадратните отклонения на всяка стойност на атрибута от средната аритметична стойност.

Изчисляването на дисперсията в сериите на интервално разпределение се извършва по формулата:

Процедурата за изчисляване на дисперсията в този случай е следната:

1. Определете среднопретеглената аритметична стойност, както е показано в параграф 2).

2. Намерете отклонения от средната стойност:

3. Квадратирайте отклонението на всяка опция от средната стойност:

4. Умножете квадратите на отклоненията по теглата (честотите):

5. Обобщете получените продукти:

6. Получената сума се разделя на сумата от теглата (честотите):

Нека поставим изчисленията в таблица:

Сума на депозита, разтривайте.Брой вложители, еСреда на интервала, х
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Общо 400 - - - 23040000

Програмата Excel е високо ценена както от професионалисти, така и от аматьори, тъй като потребители с всяко ниво на умения могат да работят с нея. Например, всеки с минимални „комуникационни“ умения в Excel може да начертае проста графика, да направи прилична табела и т.н.

В същото време тази програма дори ви позволява да извършвате различни видове изчисления, например изчисления, но това изисква малко по-различно ниво на обучение. Ако обаче току-що сте започнали да се запознавате отблизо с тази програма и се интересувате от всичко, което ще ви помогне да станете по-напреднал потребител, тази статия е за вас. Днес ще ви кажа каква е средната стандартно отклонениеформула в Excel, защо изобщо е необходима и, строго погледнато, кога се използва. да тръгваме!

какво е

Да започнем с теорията. Стандартното отклонение обикновено се нарича корен квадратен, получена от средноаритметичната стойност на всички квадратни разлики между наличните количества, както и тяхната средна аритметична стойност.

Същността на тази концепция е да се идентифицира степента на променливост на даден инструмент, т.е. той по свой начин е индикатор, получен от описателна статистика. Той идентифицира промените в променливостта на даден инструмент за определен период от време. С помощта на формулите STANDARDEVAL можете да оцените стандартното отклонение на извадката, докато логично и текстови стойностисе игнорират.

Формула

Помага за изчисляване на стандартното отклонение в формула на ексел, който се предоставя автоматично в Excel. За да го намерите, трябва да намерите секцията с формули в Excel и след това да изберете тази, наречена STANDARDEVAL, така че е много проста.

След това пред вас ще се появи прозорец, в който ще трябва да въведете данни за изчислението. По-специално, две числа трябва да бъдат въведени в специални полета, след което програмата сама ще изчисли стандартното отклонение за извадката.

Несъмнено математическите формули и изчисления са доста сложен въпрос и не всички потребители могат да се справят с него веднага. Въпреки това, ако копаете малко по-дълбоко и разгледате въпроса малко по-подробно, се оказва, че не всичко е толкова тъжно. Надявам се, че сте убедени в това, като използвате примера за изчисляване на стандартното отклонение.

Видео в помощ

X i -случайни (текущи) величини;

средната стойност на случайните променливи за извадката се изчислява по формулата:

така че дисперсията е средният квадрат на отклоненията . Тоест първо се изчислява средната стойност, след което се взема разликата между всяка първоначална и средна стойност се повдига на квадрат , се добавя и след това се разделя на броя на стойностите в популацията.

Разликата между индивидуалната стойност и средната стойност отразява мярката на отклонението. На квадрат, така че всички отклонения да станат изключително положителни числаи да се избягва взаимното унищожаване на положителните и отрицателните отклонения при сумирането им. След това, като имаме квадратни отклонения, ние просто изчисляваме средната аритметична стойност.

Решение вълшебна дума„Дисперсия“ се състои само от тези три думи: средно – квадратно – отклонения.

Стандартно отклонение (MSD)

Вземайки корен квадратен от дисперсията, получаваме т.нар. стандартно отклонение".Има имена "стандартно отклонение" или "сигма" (от името на гръцката буква σ .). Формулата за стандартното отклонение е:

така че дисперсията е сигма на квадрат или стандартното отклонение на квадрат.

Стандартното отклонение, очевидно, също характеризира мярката за дисперсия на данните, но сега (за разлика от дисперсията) може да се сравни с оригиналните данни, тъй като те имат същите мерни единици (това е ясно от формулата за изчисление). Диапазонът на вариация е разликата между екстремните стойности. Стандартното отклонение, като мярка за несигурност, също участва в много статистически изчисления. Използва се за установяване на степента на точност различни оценкии прогнози. Ако вариацията е много голяма, тогава стандартното отклонение също ще бъде голямо и следователно прогнозата ще бъде неточна, което ще се изрази например в много широки доверителни интервали.

Ето защо в методите за статистическа обработка на данни при оценки на недвижими имоти, в зависимост от изискваната точност на задачата, се използва правилото на две или три сигми.

За да сравним правилото за две сигми и правилото за три сигми, използваме формулата на Лаплас:

Ж - Ж ,

където Ф(х) е функцията на Лаплас;



Минимална стойност

β = максимална стойност

s = сигма стойност (стандартно отклонение)

а = средно

В този случай се използва личен изгледФормула на Лаплас, когато границите α и β на стойностите на случайната променлива X са еднакво отдалечени от центъра на разпределението a = M(X) с определена стойност d: a = a-d, b = a+d. или (1) Формула (1) определя вероятността за дадено отклонение d на случайна променлива X c нормален законразпространение от нея математическо очакване M(X) = а.

Ако във формула (1) вземем последователно d = 2s и d = 3s, получаваме: (2), (3).

Правилото на две сигми

Нека илюстрираме правилото на две сигми геометрично. На фиг. Фигура 6 показва крива на Гаус с център на разпределение a. Площта, ограничена от цялата крива и оста Ox, е равна на 1 (100%), а площта на криволинейния трапец между абсцисите a–2s и a+2s, съгласно правилото на две сигми, е равна до 0,954 (95,4% от общата площ). Площта на засенчените зони е 1-0,954 = 0,046 (»5% от общата площ). Тези области се наричат ​​критична област на случайната променлива. Стойностите на случайна променлива, попадащи в критичната област, са малко вероятни и на практика условно се приемат за невъзможни.

Условна вероятност невъзможни ценностисе нарича ниво на значимост на случайна променлива. Нивото на значимост е свързано с вероятността за доверие по формулата:

където q е нивото на значимост, изразено като процент.

Правилото на трите сигми

При решаване на проблеми, които изискват по-голяма надеждност, когато вероятността за доверие (Pd) се приема равна на 0,997 (по-точно 0,9973), вместо правилото за две сигми, съгласно формула (3), се използва правилото три сигма



Според правило три сигмас доверителна вероятност от 0,9973, критичната област ще бъде областта на стойностите на атрибута извън интервала (a-3s, a+3s). Нивото на значимост е 0,27%.

С други думи, вероятността, че абсолютна стойностотклоненията ще надхвърлят три пъти стандартното отклонение, много малко, а именно равно на 0,0027 = 1-0,9973. Това означава, че това ще се случи само в 0,27% от случаите. Такива събития, въз основа на принципа на невъзможността за малко вероятни събития, могат да се считат за практически невъзможни. Тези. вземането на проби е много точно.

Това е същността на правилото на трите сигми:

Ако една случайна променлива е разпределена нормално, тогава абсолютната стойност на нейното отклонение от математическото очакване не надвишава три пъти стандартното отклонение (MSD).

На практика правилото на трите сигми се прилага, както следва: ако разпределението на изследваната случайна променлива е неизвестно, но условието, посочено в горното правило, е изпълнено, тогава има причина да се приеме, че изследваната променлива е нормално разпределена ; в противен случай не се разпространява нормално.

Нивото на значимост се взема в зависимост от допустимата степен на риск и поставената задача. За оценка на недвижими имоти обикновено се приема по-малко прецизна извадка, следвайки правилото за две сигми.

дисперсия. Стандартно отклонение

дисперсияе средноаритметичната стойност на квадратните отклонения на всяка стойност на атрибут от общата средна стойност. В зависимост от изходните данни дисперсията може да бъде непретеглена (проста) или претеглена.

Дисперсията се изчислява по следните формули:

· за негрупирани данни

· за групирани данни

Процедурата за изчисляване на претеглената дисперсия:

1. определяне на средното аритметично претеглено

2. определят се отклонения на варианта от средното

3. повдигнете на квадрат отклонението на всяка опция от средната стойност

4. умножете квадратите на отклоненията по тегла (честоти)

5. обобщете получените продукти

6. получената сума се разделя на сумата от скалите

Формулата за определяне на дисперсията може да се преобразува в следната формула:

- просто

Процедурата за изчисляване на дисперсията е проста:

1. определям средноаритметичното

2. повдигнете на квадрат средното аритметично

3. квадрат всяка опция в реда

4. опция за намиране на сумата от квадрати

5. разделете сумата на квадратите на техния брой, т.е. определяне на средния квадрат

6. определете разликата между средния квадрат на характеристиката и квадрата на средната стойност

Освен това формулата за определяне на претеглената дисперсия може да се преобразува в следната формула:

тези. дисперсията е равна на разликата между средната стойност на квадратните стойности на атрибута и квадрата на средната аритметична стойност. При използване на трансформираната формула се елиминира допълнителната процедура за изчисляване на отклоненията на индивидуалните стойности на характеристика от x и се елиминира грешката в изчислението, свързана със закръгляването на отклоненията

Дисперсията има редица свойства, някои от които улесняват изчисляването:

1) дисперсията на постоянна стойност е нула;

2) ако всички варианти на стойностите на атрибута са намалени с едно и също число, тогава дисперсията няма да намалее;

3) ако всички варианти на стойностите на атрибута са намалени с еднакъв брой пъти (кратно), тогава дисперсията ще намалее с фактор

Стандартно отклонение S- представлява корен квадратен от дисперсията:

· за негрупирани данни:

;

· за вариационната серия:

Диапазонът на вариация, средното линейно и стандартното отклонение са именувани величини. Те имат същите мерни единици като индивидуални ценностизнак.

Дисперсията и стандартното отклонение са най-широко използваните мерки за вариация. Това се обяснява с факта, че те са включени в повечето теореми на теорията на вероятностите, която служи като основа на математическата статистика. В допълнение, дисперсията може да бъде разложена на нейните съставни елементи, което позволява да се оцени влиянието различни фактори, причинявайки вариация на чертата.

Изчисляването на вариационните показатели за банките, групирани по норма на печалба, е показано в таблицата.

Размер на печалбата, милиони рубли. Брой банки изчислени показатели
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Общо: 121,70 17,640 23,126

Средното линейно и стандартно отклонение показват доколко стойността на дадена характеристика се колебае средно между единиците и изследваната популация. И така, в в този случай средна стойностколебанията в размера на печалбата са: според средното линейно отклонение, 0,882 милиона рубли; със стандартно отклонение - 1,075 милиона рубли. Стандартното отклонение винаги е по-голямо от средното линейно отклонение. Ако разпределението на характеристиката е близко до нормалното, тогава има връзка между S и d: S=1.25d, или d=0.8S. Стандартното отклонение показва как по-голямата част от единиците на съвкупността са разположени спрямо средната аритметична стойност. Независимо от формата на разпределението, 75 стойности на атрибута попадат в интервала x 2S и най-малко 89 от всички стойности попадат в интервала x 3S (теорема на P.L. Chebyshev).

Корен квадратен от дисперсията се нарича стандартно отклонение от средната стойност, което се изчислява, както следва:

Елементарно алгебрична трансформацияФормулата за стандартно отклонение го води до следната форма:

Тази формула често се оказва по-удобна в изчислителната практика.

Стандартното отклонение, подобно на средното линейно отклонение, показва колко средно специфични стойности на дадена характеристика се отклоняват от тяхната средна стойност. Стандартното отклонение винаги е по-голямо от средното линейно отклонение. Между тях има следната връзка:

Познавайки това съотношение, можете да използвате известните индикатори, за да определите неизвестното, например, но (аз изчислете а и обратно. Стандартното отклонение измерва абсолютния размер на променливостта на дадена характеристика и се изразява в същите мерни единици като стойностите на характеристиката (рубли, тонове, години и т.н.). Това е абсолютна мярка за вариация.

За алтернативни знаци, например присъствие или отсъствие висше образование, формулите за осигуряване, дисперсия и стандартно отклонение са както следва:

Нека да покажем изчисляването на стандартното отклонение според данните от дискретна серия, характеризираща разпределението на студентите в един от университетските факултети по възраст (Таблица 6.2).

Таблица 6.2.

Резултатите от спомагателните изчисления са дадени в колони 2-5 на табл. 6.2.

Средната възраст на ученика, години, се определя по формулата за средноаритметично претеглено (колона 2):

Квадратните отклонения на индивидуалната възраст на ученика от средната се съдържат в колони 3-4, а произведенията на квадратните отклонения и съответните честоти се съдържат в колона 5.

Намираме дисперсията на възрастта на учениците, години, използвайки формула (6.2):

Тогава o = l/3,43 1,85 *oda, т.е. Всяка конкретна стойност на възрастта на ученика се отклонява от средната с 1,85 години.

Коефициент на вариация

В своята абсолютна стойност стандартното отклонение зависи не само от степента на вариация на характеристиката, но и от абсолютните нива на опциите и средната стойност. Затова сравнете средното стандартни отклоненияВариационни серии с различни средни нива са директно невъзможни. За да можете да направите такова сравнение, трябва да намерите специфично теглосредното отклонение (линейно или квадратично) в средното аритметично, изразено като процент, т.е. изчислявам относителни мерки на вариация.

Линеен коефициент на вариация изчислено по формулата

Коефициент на вариация определя се по следната формула:

В коефициентите на вариация се елиминира не само несравнимостта, свързана с различните мерни единици на изследваната характеристика, но и несравнимостта, която възниква поради разликите в стойността на средните аритметични стойности. В допълнение, показателите за вариация характеризират хомогенността на съвкупността. Популацията се счита за хомогенна, ако коефициентът на вариация не надвишава 33%.

Според таблицата. 6.2 и резултатите от изчисленията, получени по-горе, определяме коефициента на вариация,%, съгласно формула (6.3):

Ако коефициентът на вариация надвишава 33%, това показва хетерогенността на изследваната популация. Получената стойност в нашия случай показва, че съвкупността от ученици по възраст е хомогенна по състав. По този начин важна функция на обобщаващите индикатори за вариация е да се оцени надеждността на средните стойности. Колкото по-малко c1, a2 и V, толкова по-хомогенен е резултатният набор от явления и толкова по-надеждна е получената средна стойност. Според „правилото на трите сигми“, разглеждано от математическата статистика, в нормално разпределени или близки до тях серии, отклонения от средната аритметична стойност, които не надвишават ±3, се срещат в 997 случая от 1000. По този начин, знаейки, X и a, можете да получите обща първоначална представа за серията вариации. Ако например средната заплатислужител в компанията е 25 000 рубли, а a е равно на 100 рубли, тогава с вероятност, близка до сигурността, може да се твърди, че заплатите на служителите на компанията варират в диапазона (25 000 ± ± 3 x 100), т.е. от 24 700 до 25 300 рубли.



 


Прочетете:



Отчитане на разчети с бюджета

Отчитане на разчети с бюджета

Сметка 68 в счетоводството служи за събиране на информация за задължителни плащания към бюджета, удържани както за сметка на предприятието, така и...

Чийзкейкове от извара на тиган - класически рецепти за пухкави чийзкейкове Чийзкейкове от 500 г извара

Чийзкейкове от извара на тиган - класически рецепти за пухкави чийзкейкове Чийзкейкове от 500 г извара

Продукти: (4 порции) 500 гр. извара 1/2 чаша брашно 1 яйце 3 с.л. л. захар 50 гр. стафиди (по желание) щипка сол сода бикарбонат...

Салата Черна перла със сини сливи Салата Черна перла със сини сливи

Салата

Добър ден на всички, които се стремят към разнообразие в ежедневната си диета. Ако сте уморени от еднообразни ястия и искате да зарадвате...

Рецепти за лечо с доматено пюре

Рецепти за лечо с доматено пюре

Много вкусно лечо с доматено пюре, като българско лечо, приготвено за зимата. Така обработваме (и изяждаме!) 1 торба чушки в нашето семейство. И кой бих...

feed-image RSS