У дома - Ще мога сам да направя ремонт
Стандартното отклонение се измерва в. Дисперсия: обща, селективна, коригирана

При статистическо тестване на хипотези, при измерване на линейната връзка между случайни променливи.

Средно аритметично стандартно отклонение:

Стандартно отклонение(оценка на стандартното отклонение на случайната променлива Етаж, стени около нас и таван, хпо отношение на нея математически очакваниявъз основа на безпристрастна оценка на нейната дисперсия):

къде е вариацията; - Под, стени около нас и таван, iй елемент на пробата; - размер на извадката; - средна аритметична стойност на пробата:

Трябва да се отбележи, че и двете оценки са пристрастни. V общ случайневъзможно е да се изгради безпристрастна оценка. Оценката, базирана на оценката на безпристрастната дисперсия, обаче е последователна.

Правилото на трите сигми

Правилото на трите сигми() - почти всички стойности на нормално разпределената случайна величина лежат в интервала. По -строго - с най -малко 99,7% доверие стойността на нормално разпределената случайна променлива се намира в определения интервал (при условие, че стойността е вярна и не е получена в резултат на обработка на извадката).

Ако истинската стойност е неизвестна, тогава трябва да използвате не, а Пода, стените около нас и тавана, с... По този начин правилото на три сигма се трансформира в правилото на три етажа, стени около нас и таван, с .

Тълкуване на стойността на стандартното отклонение

Голяма стойност на стандартното отклонение показва голям разсейване на стойности в представения набор със средната стойност на набора; съответно малка стойност показва, че стойностите в набора са групирани около средната стойност.

Например, имаме три набора от числа: (0, 0, 14, 14), (0, 6, 8, 14) и (6, 6, 8, 8). За трите набора средните стойности са 7, а стандартните отклонения съответно са 7, 5 и 1. Последният набор има малко стандартно отклонение, тъй като стойностите в набора са групирани около средната стойност; първият комплект има най -много голямо значениестандартно отклонение - стойностите в рамките на набора силно се различават от средното.

В общ смисъл стандартното отклонение може да се счита за мярка за несигурност. Например във физиката стандартното отклонение се използва за определяне на грешката на поредица от последователни измервания на величина. Тази стойност е много важна за определяне на вероятността от изследваното явление в сравнение с прогнозираната стойност на теорията: ако средната стойност на измерванията се различава значително от стойностите, предвидени от теорията (голяма стойност на стандартното отклонение) , тогава получените стойности или методът за тяхното получаване трябва да бъдат проверени отново.

Практическа употреба

На практика стандартното отклонение ви позволява да определите колко стойностите в даден набор могат да се различават от средните.

Климат

Да предположим, че има два града със същата средна дневна максимална температура, но единият е на брега, а другият е във вътрешността. Известно е, че крайбрежните градове имат много различни максимални дневни температури по -ниски от вътрешните градове. Следователно стандартното отклонение на максималните дневни температури за крайбрежния град ще бъде по -малко от това за втория град, въпреки факта, че те имат същата средна стойност на тази стойност, което на практика означава, че вероятността максималната температура на въздуха всеки конкретен ден от годината ще бъде по -силен, различен от средния, по -висок за град, разположен във вътрешността на континента.

Спорт

Да предположим, че има няколко футболни отбора, които се оценяват според определен набор от параметри, например броя на отбелязаните и допуснати голове, шансовете за отбелязване и т.н. Най -вероятно най -добрият отбор в тази група ще има най -добрите стойностиНа Повече ▼параметри. Колкото по -малко е стандартното отклонение на екипа за всеки от представените параметри, толкова по -предвидим е резултатът на екипа, такива екипи са балансирани. От друга страна, екипът с страхотна ценастандартното отклонение е трудно да се предвиди резултатът, който от своя страна се дължи на дисбаланс, например силна защита, но слаба атака.

Използването на стандартното отклонение на параметрите на отбора позволява в една или друга степен да се предскаже резултатът от мача на два отбора, като се оценят силните страни и слаби страниекипи, а оттам и избраните методи на борба.

Технически анализ

Вижте също

Литература

* Боровиков, В.СТАТИСТИКА. Изкуството на анализ на данни на компютър: За професионалисти / В. Боровиков. - SPb. : Петър, 2003.- 688 с. -ISBN 5-272-00078-1.

В тази статия ще говоря как как да намерите стандартното отклонение... Този материал е изключително важен за пълно разбиране на математиката, така че преподавателят по математика трябва да посвети отделен урок или дори няколко урока за изучаването му. В тази статия ще намерите връзка към подробен и разбираем видеоурок, който обяснява какво е стандартното отклонение и как да го намерите.

Стандартно отклонениедава възможност да се оцени разпределението на стойностите, получени в резултат на измерване на параметър. Обозначава се със символ (гръцка буква „сигма“).

Формулата за изчисление е доста проста. За да намерите стандартното отклонение, трябва да вземете квадратния корен от дисперсията. Така че сега трябва да попитате: "Какво е вариация?"

Какво е вариация

Определението за вариация звучи така. Дисперсията е средната аритметична стойност на квадратните отклонения на стойностите от средната стойност.

За да намерите отклонението, направете следните изчисления последователно:

  • Определете средната стойност (проста средна аритметична стойност на поредица от стойности).
  • След това извадете средната стойност от всяка от стойностите и квадратирайте получената разлика (имате разлика на квадрат).
  • Следващата стъпка е да се изчисли средната аритметика на получените квадрати на разликите (Защо точно квадратите можете да разберете по -долу).

Нека разгледаме един пример. Да речем, че вие ​​и вашите приятели решавате да измерите височината на вашите кучета (в милиметри). В резултат на измерванията сте получили следните измервания на височината (при холката): 600 мм, 470 мм, 170 мм, 430 мм и 300 мм.

Нека изчислим средната стойност, вариацията и стандартното отклонение.

Първо, намерете средната стойност... Както вече знаете, за това трябва да добавите всички измерени стойности и да разделите на броя на измерванията. Напредък на изчислението:

Среден мм.

Така че средната (средноаритметична) е 394 мм.

Сега трябва да дефинирате отклонение на растежа на всяко от кучетата от средното:

Накрая, за изчисляване на дисперсията, всяка от получените разлики е на квадрат и след това намираме средната аритметична стойност на получените резултати:

Дисперсия mm 2.

По този начин дисперсията е 21704 mm 2.

Как да намерите стандартното отклонение

И така, как сега изчислявате стандартното отклонение, като знаете дисперсията? Както си спомняме, вземете квадратния корен от него. Тоест стандартното отклонение е:

Mm (закръглено до най -близкото цяло число в mm).

Използвайки този метод, установихме, че някои кучета (например ротвайлери) са много големи кучета. Но има и много малки кучета (например дакели, просто не им казвайте това).

Най -интересното е, че стандартното отклонение носи полезна информация... Сега можем да покажем кои от получените измервания на височината са в рамките на интервала, който получаваме, ако отложим стандартното отклонение от средната стойност (от двете му страни).

Тоест, използвайки стандартното отклонение, получаваме „стандартен“ метод, който ви позволява да разберете коя от стойностите е нормална (средна) и коя е изключително голяма или, обратно, малка.

Какво е стандартно отклонение

Но ... всичко ще бъде малко по -различно, ако анализираме вземане на пробиданни. В нашия пример разгледахме общо население.Тоест нашите 5 кучета бяха единствените кучета в света, които ни интересуваха.

Но ако данните са извадка (стойности, които са избрани от голяма популация), тогава изчисленията трябва да се направят по различен начин.

Ако има стойности, тогава:

Всички други изчисления се правят по същия начин, включително определяне на средната стойност.

Например, ако нашите пет кучета са само извадка от общата популация кучета (всички кучета на планетата), трябва да разделим на 4, а не 5,а именно:

Примерна дисперсия = мм 2.

В този случай стандартното отклонение за пробата е mm (закръглено до най -близкото цяло число).

Можем да кажем, че сме направили някаква „корекция“ в случая, когато нашите стойности са само малка извадка.

Забележка. Защо разликите на квадрат?

Но защо, когато изчисляваме дисперсията, вземаме точно квадратите на разликите? Например, когато измервате някакъв параметър, сте получили следния набор от стойности: 4; 4; -4; -4. Ако просто добавим абсолютните отклонения от средната (разликата) помежду си ... отрицателните стойности се анулират с положителни:

.

Оказва се, че тази опция е безполезна. Тогава може би си струва да опитате абсолютните стойности на отклоненията (тоест модулите на тези стойности)?

На пръв поглед се оказва добре (получената стойност, между другото, се нарича средно абсолютно отклонение), но не във всички случаи. Нека опитаме друг пример. Нека резултатът от измерването да бъде следният набор от стойности: 7; 1; -6; -2. Тогава средното абсолютно отклонение е:

По дяволите! Отново резултатът е 4, въпреки че разликите са много по -разпръснати.

Нека сега да видим какво ще се случи, ако квадратираме разликите (и след това вземем квадратния корен от тяхната сума).

За първия пример получавате:

.

За втория пример получавате:

Сега това е съвсем различен въпрос! Стандартното отклонение е колкото по -голямо, толкова по -голямо е разпространението на различията ... към което се стремихме.

Всъщност този метод използва същата идея, както при изчисляване на разстоянието между точките, приложен само по различен начин.

А от математическа гледна точка използването на квадрати и квадратни корени е по -полезно, отколкото бихме могли да получим въз основа на абсолютните стойности на отклоненията, така че стандартното отклонение е приложимо и за други математически проблеми.

Сергей Валериевич ви каза как да намерите стандартното отклонение.

Урок номер 4

Тема: „Описателна статистика. Показатели за разнообразието на характеристиката като цяло "

Основните критерии за разнообразие на признак в статистическа популация са: граница, амплитуда, стандартно отклонение, коефициент на трептене и коефициент на вариация. В предишния урок беше обсъдено, че средните стойности дават само обобщаваща характеристика на изследваната черта като цяло и не отчитат стойностите на отделните й варианти: минималните и максималните стойности, над средните, под средното и т.н.

Пример. Средни стойности на две различни числови последователности: -100; -двайсет; 100; 20 и 0,1; -0,2; 0,1 са абсолютно еднакви и равниО.Обхватите на разсейване на тези последователности на относителна средна стойност са много различни.

Определянето на изброените критерии за разнообразие на даден признак се извършва преди всичко, като се взема предвид неговата стойност за отделни елементи от статистическата популация.

Индикатори за измерване на вариацията на черта са абсолютени роднина... Абсолютните показатели на вариация включват: диапазон на вариация, граница, стандартно отклонение, вариация. Коефициентът на вариация и коефициентът на трептене се отнасят до относителните мерки на вариация.

Ограничение (lim) -това е критерий, който се определя от крайните стойности на варианта във вариационната серия. С други думи, този критерий е ограничен до минималните и максималните стойности на характеристиката:

Амплитуда (Am)или диапазон на вариации -това е разликата между крайните опции. Изчисляването на този критерий се извършва чрез изваждане на минималната му стойност от максималната стойност на характеристиката, което ни позволява да преценим степента на вариация на опцията:

Недостатъкът на границата и амплитудата като критерий на променливост е, че те изцяло зависят от екстремните стойности на характеристиката във вариационната серия. В този случай колебанията в стойностите на характеристиката в рамките на поредицата не се вземат предвид.

Най -пълната характеристика на разнообразието на даден признак в статистическата популация е дадена от стандартно отклонение(сигма), което е обща мярка за отклонението на вариант от неговата средна стойност. Стандартното отклонение често се нарича стандартно отклонение.

Стандартното отклонение се основава на сравнението на всяка опция със средната аритметична стойност на дадена популация. Тъй като в съвкупността винаги ще има опции както по -малко, така и повече от него, сумата от отклонения, които имат знак "", ще бъде изплатена със сумата от отклонения, които имат знака "", т.е. сумата от всички отклонения е нула. За да се избегне влиянието на знаците на разликите, се вземат отклонения от средноаритметичния квадрат, т.е. ... Сумата от квадратите на отклоненията не е нула. За да получите коефициент, който може да измерва променливостта, вземете средната стойност на сумата от квадрати - тази стойност се нарича отклонение:

По отношение на значението, отклонението е средният квадрат на отклоненията на отделните стойности на характеристиката от нейната средна стойност. Дисперсия квадратът на стандартното отклонение.

Дисперсията е измерение (име). Така че, ако вариантите на числовите серии са изразени в метри, тогава вариацията дава квадратни метри; ако опциите са изразени в килограми, тогава дисперсията дава квадрата на тази мярка (kg 2) и т.н.

Стандартно отклонение- квадратен корен на вариация:

, след това при изчисляване на дисперсията и стандартното отклонение в знаменателя на дробата вместое необходимо да се сложи.

Изчисляването на стандартното отклонение може да бъде разделено на шест етапа, които трябва да се извършат в определена последователност:

Прилагане на стандартно отклонение:

а) да се прецени променливостта на поредицата от вариации и сравнителна оценка на типичността (представителността) на средните аритметични стойности. Това е необходимо при диференциалната диагностика при определяне на стабилността на признаците.

б) да се реконструират вариационните серии, т.е. възстановяване на неговата честотна характеристика въз основа на три сигма правила. В интервала (M ± 3σ) 99,7% от всички варианти на поредицата са намерени в интервала (M ± 2σ) - 95,5% и в интервала (M ± 1σ) - 68,3% вариант на ред(Фиг. 1).

в) за идентифициране на опцията „изскачащ прозорец“

г) да се определят параметрите на нормата и патологията с помощта на сигма оценки

д) за изчисляване на коефициента на вариация

е) за изчисляване на средната грешка на средната аритметична стойност.

За характеризиране на всяка обща популация, която иманормален тип разпределение , достатъчно е да знаете два параметъра: средната аритметична стойност и стандартното отклонение.

Фигура 1. Правило за трите сигми

Пример.

В педиатрията стандартното отклонение се използва за оценка на физическото развитие на децата чрез сравняване на данните на конкретно дете със съответните стандартни показатели. Като стандарт се вземат средноаритметичните показатели за физическото развитие на здравите деца. Сравнението на показателите със стандартите се извършва съгласно специални таблици, в които стандартите са дадени заедно със съответните им сигма скали. Счита се, че ако показателят за физическото развитие на детето е в рамките на стандартната (средна аритметична стойност) ± σ, тогава физическо развитиедетето (според този показател) съответства на нормата. Ако показателят е в рамките на стандарта ± 2σ, тогава има леко отклонение от нормата. Ако показателят надхвърли тези граници, тогава физическото развитие на детето рязко се различава от нормата (възможна е патология).

В допълнение към показателите за вариация, изразени в абсолютни стойности, статистическото проучване използва индикатори за вариация, изразени в относителни стойности. Коефициент на трептене -това е съотношението на обхвата на вариация към средната стойност на характеристиката. Коефициентът на вариация -това е съотношението на стандартното отклонение към средната стойност на характеристиката. Обикновено тези стойности се изразяват като процент.

Формули за изчисляване на относителните индекси на вариация:

От горните формули се вижда, че колкото по -голям е коефициентът V близо до нула, колкото по -малко е промяната в стойностите на характеристиката. Колкото повече V, толкова по -променлив е знакът.

В статистическата практика най -често се използва коефициентът на вариация. Използва се не само за сравнителна оценка на вариациите, но и за характеризиране на хомогенността на популацията. Популацията се счита за хомогенна, ако коефициентът на вариация не надвишава 33% (за разпределения, близки до нормалните). Аритметично, съотношението на σ и средната аритметична елиминира влиянието абсолютна стойносттези характеристики и процентът прави коефициента на вариация безразмерна (неназована) стойност.

Получената стойност на коефициента на вариация се оценява в съответствие с приблизителните градации на степента на разнообразие на характеристиката:

Слаби - до 10%

Средно - 10 - 20%

Силен - повече от 20%

Използването на коефициента на вариация е препоръчително в случаите, когато е необходимо да се сравнят характеристики, които са различни по размер и размер.

Разликата между коефициента на вариация и други критерии за разсейване ясно демонстрира пример.

маса 1

Съставът на работниците в индустриално предприятие

Въз основа на статистическите характеристики, дадени в примера, може да се заключи, че възрастовият състав и образователното равнище на служителите в предприятието са относително хомогенни с ниска професионална стабилност на анкетирания контингент. Лесно е да се види, че опитът да се прецени тези социални тенденции по стандартното отклонение би довел до погрешно заключение, а опитът да се сравнят счетоводните атрибути „трудов стаж“ и „възраст“ с счетоводния атрибут „образование“ като цяло би бил неправилно поради хетерогенността на тези характеристики.

Медиана и процентили

За порядъчните (ранг) разпределения, където критерият за средата на поредицата е медианата, стандартното отклонение и дисперсия не могат да служат като характеристики на варианта на разсейване.

Същото важи и за серията с отворени вариации. Това обстоятелство се дължи на факта, че отклоненията, чрез които се изчисляват дисперсията и σ, се отчитат от средната аритметична стойност, която не се изчислява в отворени вариационни серии и в поредицата от разпределения на качествени характеристики. Следователно, за кратко описание на разпределенията, се използва друг параметър на разсейване - квантил(синоним - "нерцентил"), подходящ за описване на качествени и количествени характеристики под всякаква форма на тяхното разпространение. Този параметър може да се използва и за превод на количествени характеристики в качествени. В този случай такива оценки се присвояват в зависимост от това кой ред на квантила съответства на определена опция.

В практиката на биомедицинските изследвания най -често се използват следните квантили:

Медианата е;

, - квартили (квартири), където е долният квартил, горен квартил.

Квантилите разделят площта на възможното изменение на вариант в вариационна серия на определени интервали. Медианата (квантил) е вариант, който е в средата на вариационната серия и разделя тази серия наполовина, на две равни части ( 0,5 и 0,5 ). Квартилът разделя поредицата на четири части: първата част (долният квартил) е опциите, които разделят опциите, чиито числови стойности не надвишават 25% от максимално възможното в тази серия, квартилът разделя опциите с числова стойност до 50% от възможно най -много. Горният квартил () разделя опциите до 75% от максимално възможните стойности.

В случай на асиметрично разпределение променлива спрямо средната аритметична стойност, медианата и квартилите се използват за нейното характеризиране.В този случай се използва следната форма за показване на средната стойност - Аз (;). Например, изследваният знак - „периодът, в който детето е започнало да ходи самостоятелно“ - в изследваната група има асиметрично разпределение. В същото време долният квартил () съответства на началото на ходене - 9,5 месеца, медианата - 11 месеца, а горният квартил () - 12 месеца. Съответно характеристиката на средната тенденция на посочения знак ще бъде представена като 11 (9,5; 12) месеца.

Оценка на статистическата значимост на резултатите от изследванията

Статистическата значимост на данните се разбира като степента на тяхното съответствие с показаната реалност, т.е. статистически значими данни са тези, които не изкривяват и отразяват правилно обективната реалност.

Да се ​​оцени статистическата значимост на резултатите от изследването означава да се определи с каква вероятност е възможно да се прехвърлят резултатите, получени върху извадката, върху цялата обща популация. Оценката на статистическата значимост е необходима, за да се разбере доколко явлението може да се прецени по явлението като цяло и неговите закономерности.

Оценката на статистическата значимост на резултатите от изследването се състои от:

1. грешки на представителността (грешки на средни и относителни стойности) - м;

2. граници на доверие на средни или относителни стойности;

3. надеждността на разликата между средните или относителните стойности според критерия T.

Стандартна грешка на средната аритметична стойностили грешка в представителносттахарактеризира средните колебания. Трябва да се отбележи, че колкото по -голям е размерът на извадката, толкова по -малко е разпространението на средните стойности. Стандартната грешка на средната стойност се изчислява по формулата:

В съвременната научна литература средната аритметична стойност се записва заедно с грешката на представителността:

или заедно със стандартното отклонение:

Като пример, разгледайте данните за 1500 градски поликлиники в страната (общо население). Средният брой пациенти, обслужвани в поликлиника, е 18 150 души. Случайният подбор от 10% от обектите (150 поликлиники) дава среден брой пациенти, равен на 20051 души. Грешката при извадката, очевидно свързана с факта, че не всички 1500 поликлиники са включени в извадката, е равна на разликата между тези средни стойности - общата средна стойност ( Мген) и средна проба ( Мизберете). Ако формираме друга извадка със същия размер от нашата обща популация, тя ще даде различна грешка. Всички тези пробни средства за достатъчно големи проби се разпределят нормално около общата средна стойност за достатъчно големи проби. Голям бройповторения на вземане на проби от същия брой обекти от общата популация. Стандартна грешка на средната стойност ме неизбежното разпръскване на извадката сред общата средна стойност.

В случай, че резултатите от изследването са представени в относителни стойности (например проценти) - той се изчислява споделяне на стандартна грешка:

където P е показателят в%, n е броят на наблюденията.

Резултатът се показва като (P ± m)%. Например,процентът на възстановяване сред пациентите е (95.2 ± 2.5)%.

В случай, че броят на елементите в популацията, след това при изчисляване на стандартните грешки на средната стойност и частта в знаменателя на дробата вместое необходимо да се сложи.

За нормално разпределение (разпределението на извадката е нормално) е известно колко от популацията попада във всеки интервал около средната стойност. В частност:

На практика проблемът е, че не познаваме характеристиките на общата популация и извадката се прави точно с цел тяхната оценка. Това означава, че ако правим проби със същия размер нот общата популация, тогава в 68,3% от случаите интервалът ще съдържа стойността М(ще бъде в интервала в 95,5% от случаите и в интервала в 99,7% от случаите).

Тъй като всъщност е направена само една извадка, това твърдение е формулирано по отношение на вероятността: с вероятност 68,3%средната стойност на даден признак в общата популация е затворена в интервал, с вероятност 95,5% - в интервала и т.н.

На практика около стойността на извадката се изгражда интервал, който с дадена (достатъчно висока) вероятност - ниво на увереност -Ще "покрие" истинската стойност на този параметър в общата популация. Този интервал се нарича доверителен интервал.

Вероятност за довериеP степента на доверие е, че доверителният интервал действително ще съдържа истинската (неизвестна) стойност на параметъра в общата популация.

Например, ако нивото на доверие Rравен на 90%, това означава, че 90 от 100 проби ще дадат правилна оценка на параметъра в общата популация. Съответно вероятността за грешка, т.е. неправилната оценка на общата средна стойност за извадката е равна в проценти на :. За този примертова означава, че 10 от 100 проби ще дадат грешна оценка.

Очевидно степента на доверие (ниво на доверие) зависи от размера на интервала: колкото по -широк е интервалът, толкова по -голяма е увереността, че неизвестна стойност за общата популация ще попадне в него. На практика, за да се изгради доверителния интервал, се взема поне двойна грешка при извадката, за да се гарантира доверие от поне 95,5%.

Определянето на доверителните граници на средните и относителните стойности ни позволява да открием двете им крайни стойности- минималната възможна и максималната възможна, в рамките на която изследваният показател може да се намери в цялата генерална популация. Въз основа на това, граници на доверие (или доверителен интервал)- това са границите на средни или относителни стойности, надхвърлящи които поради случайни колебания има пренебрежимо малка вероятност.

Доверителният интервал може да бъде преписан като :, където T- критерий за доверие.

Границите на доверие на средната аритметична стойност в общата популация се определят по формулата:

М ген = М изберете + т м М

за относителната стойност:

R ген = П изберете + т м R

където М гени R ген- средни и относителни стойности за общата популация; М изберетеи R изберете- стойностите на средните и относителните стойности, получени върху пробната популация; м Ми м P- грешки на средни и относителни стойности; T- критерий за доверие (критерий за точност, който се задава при планиране на проучване и може да бъде равен на 2 или 3); т ме доверителният интервал или Δ е пределната грешка на показателя, получен в извадковото изследване.

Трябва да се отбележи, че стойността на критерия Tдо известна степен свързано с вероятността за безгрешна прогноза (p), изразена в%. Избира се от самия изследовател, воден от необходимостта да се получи резултат с необходимата степен на точност. Така че, за вероятността от прогноза без грешки от 95,5%, стойността на критерия Tе 2, за 99,7% - 3.

Дадените оценки на доверителния интервал са приемливи само за статистически популации с повече от 30 наблюдения.С по -малък размер на популацията (малки извадки) се използват специални таблици за определяне на критерия t. В тези таблици желаната стойност е в пресечната точка на линията, съответстваща на размера на популацията (n-1), и колона, съответстваща на нивото на вероятност за безпогрешна прогноза (95,5%; 99,7%), избрано от изследователя. В медицинските изследвания при установяване на границите на доверие за който и да е показател, вероятността за безгрешна прогноза се приема като 95,5% или повече. Това означава, че стойността на показателя, получена върху извадката популация, трябва да се намери в общата популация най -малко в 95,5% от случаите.

    Въпроси по темата на урока:

    Уместността на показателите за разнообразието на характеристиката в статистическата популация.

    Обща характеристика на абсолютните показатели на вариация.

    Стандартно отклонение, изчисление, приложение.

    Относителни показатели на вариация.

    Средна, квартилна оценка.

    Оценка на статистическата значимост на резултатите от изследването.

    Стандартна грешка на средната аритметична, формула за изчисление, пример за използване.

    Изчисляване на дела и стандартната му грешка.

    Концепция за ниво на доверие, пример за употреба.

10. Понятието за доверителния интервал, неговото приложение.

    Тестови задачи по темата с примерни отговори:

1. АБСОЛЮТНИТЕ ПОКАЗАТЕЛИ НА ВАРИАЦИЯТА, СВЪРЗАНИ С

1) коефициент на вариация

2) коефициент на трептене

4) медиана

2. СВЪРЗАТЕЛНИ ПОКАЗАТЕЛИ НА ВАРИАЦИЯТА, СВЪРЗАНИ С

1) вариация

4) коефициент на вариация

3. КРИТЕРИЙ, КОЙТО СЕ ОПРЕДЕЛЯ ОТ КРАЙНИТЕ СТОЙНОСТИ НА ОПЦИЯТА В РАЗМЕРА НА ВАРИАЦИИТЕ

2) амплитуда

3) вариация

4) коефициент на вариация

4. РАЗЛИКАТА НА ЕКСТРЕМНИТЕ ОПЦИИ Е

2) амплитуда

3) стандартно отклонение

4) коефициент на вариация

5. СРЕДНИЯ КВАДРАТ НА ОТКЛОНЕНИЯТА НА ИНДИВИДУАЛНИТЕ ЗНАЧЕНИЯ НА ХАРАКТЕРА ОТ СРЕДНИТЕ СИ ЗНАЧЕНИЯ Е

1) коефициент на трептене

2) медиана

3) вариация

6. ВРЪЗКА НА СКОРОСТТА НА ВАРИАЦИЯТА СРЕДНАТА СИГНАЛНА СТОЙНОСТ Е

1) коефициент на вариация

2) стандартно отклонение

4) коефициент на трептене

7. СЪОТНОШЕНИЕТО НА СРЕДНОТО КВАДРАТНО ОТКЛОНЕНИЕ КЪМ СРЕДНАТА СТОЙНОСТ НА ЗНАКА Е

1) вариация

2) коефициент на вариация

3) коефициент на трептене

4) амплитуда

8. ВАРИАНТ, КОЙТО Е В СРЕДАТА НА ВАРИАЦИОННИЯ ОБЛАСТ И РАЗДЕЛЯ НА ДВЕ РАВНИ ЧАСТИ - ТОВА Е

1) медиана

3) амплитуда

9. ПРИ МЕДИЦИНСКИ ИЗСЛЕДВАНИЯ, КОГАТО СЕ УСТАНОВЯВАТ ПОВЕРИТЕЛНИ ГРАНИЦИ ЗА ВСЕКИ ПОКАЗАТЕЛ, ВЪЗМОЖНОСТТА НА ПРОГНОЗА без грешки се ПРИЕМА.

10. АКО 90 ПРОБИ ОТ 100 НА ПРЕДОСТАВЯТ ПРАВИЛНАТА ОЦЕНКА НА ПАРАМЕТРА В ОБЩОТО ОБЩО, ТОВА ОЗНАЧАВА, ЧЕ ПОВЕРИТЕЛНОСТТА PРАВНО

11. В СЛУЧАЙ, АКО 10 ПРОБИ ОТ 100 ДАВАТ НЕПРАВИЛНА ОЦЕНКА, ВЕРОЯТНОСТТА НА ГРЕШКА Е РАВНА

12. ГРАНИЦИ НА СРЕДНИ ИЛИ СЪОТВЕТНИ СТОЙНОСТИ, ВЪН КОИТО ПО РАЗЛИЧНИ ВИБРАЦИИ ИМА НЕЗНАЧИМА ВЪЗМОЖНОСТ

1) доверителен интервал

2) амплитуда

4) коефициент на вариация

13. МАЛЪК ПРОБА Е ТОЗИ КОЛЕКЦИЯ, В КОЯТО

1) n е по -малко или равно на 100

2) n е по -малко или равно на 30

3) n е по -малко или равно на 40

4) n е близо до 0

14. ЗА 95% ВЕРОЯТНОСТ НА БЕЗ ГРЕШКИ ПРОГНОЗИРАНЕ НА КРИТЕРИЙНА СТОЙНОСТ TПРАВИ

15. ЗА 99% ВЕРОЯТНОСТ НА БЕЗ ГРЕШКИ ПРОГНОЗЕН КРИТЕРИЙ НА ПРОГНОЗА TПРАВИ

16. ЗА РАЗПРЕДЕЛЕНИЯ, БЛИЗИ КЪМ НОРМАЛНИ, КОЛЕКЦИЯТА СЕ СЕ СЧИТА ЕДИНСТВЕНА, КОЙТО КОЕФИЦИЕНТ НА ​​ВАРИАЦИИТЕ НЕ ПРЕВИШАВА

17. ВАРИАНТНИ ОТДЕЛНИ ОПЦИИ, КОИТО ЧИСЛОВНИ ЗНАЧЕНИЯ НЕ ПРЕВИШАВАТ 25% от МАКСИМАЛНО ВЪЗМОЖНОТО В ТОЗИ ДИАПАЗОН

2) долен квартил

3) горен квартил

4) квартил

18. ДАННИ, КОИТО НЕ ИЗКРИВАТ И ПРАВИЛНО ОТРАЖЯВАТ ЦЕЛЕВАТА РЕАЛНОСТ

1) невъзможно

2) еднакво възможно

3) надежден

4) случаен

19. Съгласно правилото "ТРИ ЗИГМИ", С НОРМАЛНОТО РАЗПРЕДЕЛЕНИЕ НА ХАРАКТЕРИСТИКАТА В ГРАНИЦИТЕ
ЩЕ БЪДЕ НАМЕСТЕН

1) 68,3% опция

Стандартното отклонение е класически индикатор за променливост от описателната статистика.

Стандартно отклонение, стандартно отклонение, RMSD, стандартно отклонение на извадката (английско стандартно отклонение, STD, STDev) - много често срещан индикатор за дисперсия в описателната статистика. Но тъй като техническият анализ е подобен на статистиката, този показател може (и трябва) да се използва в техническия анализ за откриване на степента на разсейване на цената на анализирания инструмент във времето. Той е обозначен с гръцкия символ Sigma "σ".

Благодаря на Карлам Гаус и Пиърсън, че ни предоставиха възможност да използваме стандартното отклонение.

Използвайки стандартно отклонение при технически анализ, обръщаме това Фактор на разсейване„v „Индикатор за променливост“, Запазване на смисъла, но промяна на термините.

Какво е стандартното отклонение

Но в допълнение към междинните спомагателни изчисления, стандартното отклонение е напълно приемливо за самостоятелно изчисляванеи приложения в техническия анализ. Както отбелязва запален читател на нашето списание за репей: „ Все още не разбирам защо RMS не е включен в набора от стандартни показатели на местните дилърски центрове«.

Наистина ли, стандартното отклонение може да измерва променливостта на инструмента по класически и "чист" начин... За съжаление този показател не е толкова често срещан при анализа на ценни книжа.

Прилагане на стандартното отклонение

Ръчното изчисляване на стандартното отклонение не е много интересноно полезно за опит. Стандартното отклонение може да бъде изразенопо формулата STD = √ [(∑ (xx) 2) / n], което звучи като корена на сумата от квадратите на разликите между елементите в извадката и средната стойност, разделена на броя на елементите в извадката .

Ако броят на елементите в извадката надвишава 30, тогава знаменателят на дробата под корена приема стойността n-1. В противен случай се използва n.

Стъпка по стъпка изчисляване на стандартното отклонение:

  1. изчислява средната аритметика на извадката от данни
  2. извадете тази средна стойност от всеки елемент от извадката
  3. всички получени разлики са на квадрат
  4. сумира всички получени квадрати
  5. разделете получената сума на броя на елементите в извадката (или на n-1, ако n> 30)
  6. изчислете квадратния корен от полученото коефициент (т.нар вариация)

Той се определя като обобщаваща характеристика на размера на вариацията на характеристика в съвкупността. Той е равен на квадратния корен от средния квадрат на отклоненията на отделните стойности на признака от средната аритметична, т.е. корена на и може да се намери по следния начин:

1. За основния ред:

2. За вариационната серия:

Преобразуването на формулата за средно квадратно отклонение я довежда до форма, която е по -удобна за практически изчисления:

Средно квадратично отклонениеопределя доколко средно специфичните опции се отклоняват от средната им стойност и освен това е абсолютна мярка за променливостта на даден признак и се изразява в същите единици като опциите и затова се интерпретира добре.

Примери за намиране на стандартното отклонение: ,

За алтернативни характеристики средната формула квадратно отклонениеизглежда така:

където p е делът на единиците в съвкупността, които имат определена характеристика;

q е частта от единици, които нямат тази функция.

Концепция за средно линейно отклонение

Средно линейно отклонениесе определя като средната аритметична стойност на абсолютните стойности на отклоненията на отделните опции от.

1. За основния ред:

2. За вариационната серия:

където сумата n - сумата от честотите на вариационната серия.

Пример за намиране на средното линейно отклонение:

Предимството на средното абсолютно отклонение като мярка за дисперсия над обхвата на вариация е очевидно, тъй като тази мярка се основава на отчитане на всички възможни отклонения. Но този индикатор има значителни недостатъци. Произволното отхвърляне на алгебричните знаци на отклонения може да доведе до факта, че математическите свойства на този индикатор далеч не са елементарни. Това значително усложнява използването на средното абсолютно отклонение при решаване на проблеми, свързани с вероятностни изчисления.

Следователно средното линейно отклонение като мярка за вариация на даден признак рядко се използва в статистическата практика, а именно когато сумирането на показатели, без да се вземат предвид признаците, има икономически смисъл. С негова помощ например се анализират оборотите на външната търговия, съставът на работниците, ритъмът на производство и др.

Корен квадратен

Приложен RMS, например, за да се изчисли средният размер на страните на n квадратни площи, средните диаметри на стволовете, тръбите и т.н. Той е разделен на два типа.

Прост среден квадрат. Ако при замяна на отделни стойности на функция с средно аритметичнонеобходимо е да се запази сумата от квадратите на първоначалните стойности непроменена, тогава средната стойност ще бъде квадратичната средна.

Случайно е тя корен квадратенот коефициента на разделяне на сумата от квадратите на отделните стойности на атрибута по техния брой:

Среднопретегленият квадрат се изчислява по формулата:

където f е знак за тегло.

Средна куб

Прилага се среден кубик, например, при определяне на средната дължина на страната и кубчетата. Той е разделен на два вида.
Средна кубична простота:

При изчисляване на средните стойности и дисперсията в интервалното разпределение, истинските стойности на характеристиката се заменят с централните стойности на интервалите, които са различни от средните аритметични стойностивключени в интервала. Това води до системна грешка при изчисляване на дисперсията. V.F. Шепърд определи това грешка при изчисляване на дисперсиятапричинено от използването на групирани данни е 1/12 от квадрата на стойността на интервала, както нагоре, така и надолу във вариацията.

Изменение на Шеппардтрябва да се използва, ако разпределението е близко до нормалното, се отнася до характеристика с непрекъснат характер на вариация, изградена върху значително количество първоначални данни (n> 500). Изхождайки обаче от факта, че в редица случаи и двете грешки, действащи в различни посоки, се компенсират, понякога може да се откаже да се въведат корекции.

Колкото по -малка е дисперсията и стандартното отклонение, толкова по -хомогенна е популацията и по -типична ще бъде средната стойност.
В практиката на статистиката често е необходимо да се сравняват вариациите на различни характеристики. Например, от голям интерес е да се сравнят разликите във възрастта и квалификацията на работниците, трудовия стаж и размера. заплати, разходи и печалба, стаж и производителност на труда и др. За такива сравнения показателите за абсолютната променливост на характеристиките са неподходящи: невъзможно е да се сравни променливостта на трудовия стаж, изразена в години, с промяната на заплатите, изразена в рубли.

За да се извършат такива сравнения, както и сравнения на променливостта на един и същ атрибут в няколко популации с различна аритметична стойност, се използва относителен индикатор на вариация - коефициентът на вариация.

Структурни средни стойности

За да се характеризира централната тенденция в статистическите разпределения, често е рационално, заедно със средната аритметична, да се използва някаква стойност на атрибута X, който поради определени характеристики на местоположението в разпределителния ред може да характеризира неговото ниво.

Това е особено важно, когато в разпределителните серии крайните стойности на характеристиката имат размити граници. Поради това точно определениесредната аритметична стойност обикновено е невъзможна или много трудна. В такива случаи средното ниво може да се определи, като се вземе например стойността на функция, която се намира в средата на честотния ред или която най -често се намира в текущия ред.

Такива стойности зависят само от естеството на честотите, т.е.от структурата на разпределение. Те са типични по местоположението си в честотния ред, поради което такива стойности се считат за характеристики на разпределителния център и следователно са получили определението за структурни средства. Те се използват за изучаване вътрешна структураи структурата на разпределителните серии на характерните стойности. Тези показатели включват.



 


Прочети:


Ново

Как да възстановите менструалния цикъл след раждането:

Изборът на цвят не е лесна задача Черното винаги е актуално

Изборът на цвят не е лесна задача Черното винаги е актуално

iPhone 6 далеч не е новост, но търсенето за него дори не мисли да падне, по -скоро ще се задържи в топ смартфоните още няколко години, като постепенно ще поевтинява ...

Бебето хълца всеки ден

Бебето хълца всеки ден

Когато бебето хълца, звучи сладко и сладко, но вие се притеснявате за това. Когато мама влезе в позиция, бебето й вече хълцаше. Всичко ...

Как да изберем икона по име и дата на раждане Икони за мъже на име Сергей

Как да изберем икона по име и дата на раждане Икони за мъже на име Сергей

Най -важните небесни покровители на Сергеевите са основателят на Троице -Сергиевата лавра, Сергий Радонежки - един от най -обичаните и ...

Какво е църковно тайнство?

Какво е църковно тайнство?

За нашите читатели: 7 Тайнства на Православната църква накратко с подробни описания от различни източници СЕДЕМ КРАСИВИ НА ПРАВОСЛАВНАТА ЦЪРКВА Свети ...

feed-image Rss