реклама

У дома - Мога да направя ремонта сам
Стандартното отклонение се измерва в. Разлика: обща, примерна, коригирана

При статистическо тестване на хипотези, когато се измерва линейна зависимост между случайни променливи.

Средно аритметично стандартно отклонение:

Стандартно отклонение(оценка на стандартното отклонение на случайната променлива Под, стените около нас и таванът, хпо отношение на нея математическо очакваневъз основа на безпристрастна оценка на неговата дисперсия):

къде е дисперсията; - Подът, стените около нас и таванът, азелемент на селекцията; - размер на извадката; - средно аритметично от извадката:

Трябва да се отбележи, че и двете оценки са пристрастни. IN общ случайНевъзможно е да се изгради безпристрастна оценка. Въпреки това оценката, базирана на безпристрастната оценка на дисперсията, е последователна.

Правилото на трите сигми

Правилото на трите сигми() - почти всички стойности на нормално разпределена случайна променлива лежат в интервала. По-стриктно - с не по-малко от 99,7% доверие, стойността на нормално разпределена случайна променлива се намира в посочения интервал (при условие, че стойността е вярна и не е получена в резултат на обработка на извадката).

Ако истинската стойност е неизвестна, тогава не трябва да използваме, а пода, стените около нас и тавана, с. Така правилото на трите сигми се трансформира в правилото на трите етажа, стените около нас и тавана, с .

Интерпретация на стойността на стандартното отклонение

Голяма стойност на стандартното отклонение показва голямо разпространение на стойностите в представения набор със средната стойност на набора; малка стойност, съответно, показва, че стойностите в набора са групирани около средната стойност.

Например, имаме три набора от числа: (0, 0, 14, 14), (0, 6, 8, 14) и (6, 6, 8, 8). И трите набора имат средни стойности, равни на 7, и стандартни отклонения, съответно равни на 7, 5 и 1. Последният набор има малко стандартно отклонение, тъй като стойностите в набора са групирани около средната стойност; първият набор има най-много голямо значениестандартно отклонение - стойностите в рамките на набора се различават значително от средната стойност.

В общ смисъл стандартното отклонение може да се счита за мярка за несигурност. Например във физиката стандартното отклонение се използва за определяне на грешката на серия от последователни измервания на някаква величина. Тази стойност е много важна за определяне на правдоподобността на изследваното явление в сравнение със стойността, предвидена от теорията: ако средната стойност на измерванията се различава значително от стойностите, предвидени от теорията (голямо стандартно отклонение), тогава получените стойности или методът за получаването им трябва да бъдат проверени отново.

Практическа употреба

На практика стандартното отклонение ви позволява да определите колко стойностите в набор могат да се различават от средната стойност.

Климат

Да предположим, че има два града с еднаква средна максимална дневна температура, но единият е разположен на брега, а другият във вътрешността. Известно е, че градовете, разположени на брега, имат много различни максимални дневни температури, които са по-ниски от градовете, разположени във вътрешността. Следователно стандартното отклонение на максималните дневни температури за крайбрежен град ще бъде по-малко, отколкото за втория град, въпреки факта, че средната им стойност е една и съща, което на практика означава, че вероятността максималната температура на въздуха на всеки определен денна година ще се различава по-силно от средната стойност, по-висока за град, разположен във вътрешността на континента.

спорт

Да приемем, че има няколко футболни отбора, които се оценяват според някакъв набор от параметри, например брой отбелязани и допуснати голове, положения за гол и т.н. Най-вероятно най-добрият отбор в тази група ще има най-добри стойностиот Повече ▼параметри. Колкото по-малко е стандартното отклонение на екипа за всеки от представените параметри, толкова по-предвидим е резултатът на отбора; От друга страна отборът с страхотна ценастандартното отклонение затруднява прогнозирането на резултата, което от своя страна се обяснява с дисбаланс, например силна защита, но слаба атака.

Използването на стандартното отклонение на отборните параметри дава възможност в една или друга степен да се прогнозира резултатът от мач между два отбора, като се преценят силните страни и слаби страникоманди, а следователно и избраните методи на борба.

Технически анализ

Вижте също

Литература

* Боровиков, В.СТАТИСТИКА. Изкуството на анализ на данни на компютър: За професионалисти / В. Боровиков. - Санкт Петербург. : Петър, 2003. - 688 с. - ISBN 5-272-00078-1.

В тази статия ще говоря за как да намерите стандартното отклонение. Този материал е изключително важен за пълното разбиране на математиката, така че учителят по математика трябва да отдели отделен урок или дори няколко за изучаването му. В тази статия ще намерите връзка към подробен и разбираем видео урок, който обяснява какво е стандартно отклонение и как да го намерите.

Стандартно отклонениедава възможност да се оцени разпространението на стойностите, получени в резултат на измерване на определен параметър. Обозначава се със символа (гръцката буква "сигма").

Формулата за изчисление е доста проста. За да намерите стандартното отклонение, трябва да вземете корен квадратен от дисперсията. Така че сега трябва да попитате „Какво е дисперсия?“

Какво е дисперсия

Определението за дисперсия е така. Дисперсията е средната аритметична стойност на квадратните отклонения на стойностите от средната стойност.

За да намерите дисперсията, извършете последователно следните изчисления:

  • Определете средната стойност (проста средна аритметична стойност на поредица от стойности).
  • След това извадете средната стойност от всяка стойност и повдигнете на квадрат получената разлика (получавате разлика на квадрат).
  • Следващата стъпка е да изчислите средноаритметичната стойност на получените квадратни разлики (Можете да разберете защо точно са квадратите по-долу).

Нека разгледаме един пример. Да приемем, че вие ​​и вашите приятели решите да измерите височината на вашите кучета (в милиметри). В резултат на измерванията получихте следните размери на височината (при холката): 600 mm, 470 mm, 170 mm, 430 mm и 300 mm.

Нека изчислим средната стойност, дисперсията и стандартното отклонение.

Първо нека намерим средната стойност. Както вече знаете, за да направите това, трябва да съберете всички измерени стойности и да ги разделите на броя на измерванията. Напредък на изчислението:

Средно мм.

И така, средната (средноаритметична) е 394 mm.

Сега трябва да определим отклонение на височината на всяко куче от средната:

накрая за изчисляване на дисперсията, повдигаме на квадрат всяка от получените разлики и след това намираме средната аритметична стойност на получените резултати:

Дисперсия mm 2 .

Така дисперсията е 21704 mm 2.

Как да намерите стандартното отклонение

И така, как можем сега да изчислим стандартното отклонение, като знаем дисперсията? Както помним, вземете корен квадратен от това. Тоест стандартното отклонение е равно на:

Mm (закръглено до най-близкото цяло число в mm).

Използвайки този метод, открихме, че някои кучета (например ротвайлери) са много големи кучета. Но има и много малки кучета (например дакели, но не трябва да им казвате това).

Най-интересното е, че стандартното отклонение носи със себе си полезна информация. Сега можем да покажем кои от получените резултати от измерване на височината са в интервала, който получаваме, ако начертаем стандартното отклонение от средната (от двете страни на нея).

Тоест, използвайки стандартното отклонение, получаваме „стандартен“ метод, който ни позволява да разберем коя от стойностите е нормална (статистически средна) и коя е изключително голяма или, обратно, малка.

Какво е стандартно отклонение

Но... всичко ще бъде малко по-различно, ако анализираме пробаданни. В нашия пример разгледахме общо население.Тоест нашите 5 кучета бяха единствените кучета в света, които ни интересуваха.

Но ако данните са извадка (стойности, избрани от голяма популация), тогава изчисленията трябва да се направят по различен начин.

Ако има стойности, тогава:

Всички други изчисления се извършват по подобен начин, включително определянето на средната стойност.

Например, ако нашите пет кучета са само извадка от популацията кучета (всички кучета на планетата), трябва да разделим на 4, не 5,а именно:

Дисперсия на извадката = mm 2.

В този случай стандартното отклонение за извадката е равно на mm (закръглено до най-близкото цяло число).

Можем да кажем, че сме направили известна „корекция“ в случай, че нашите стойности са само малка извадка.

Забележка. Защо точно квадратни разлики?

Но защо вземаме точно разликите на квадрат, когато изчисляваме дисперсията? Да кажем, че при измерване на някакъв параметър сте получили следния набор от стойности: 4; 4; -4; -4. Ако просто съберем абсолютните отклонения от средната (разликите) заедно... отрицателните стойности се компенсират с положителните:

.

Оказва се, че тази опция е безполезна. Тогава може би си струва да опитате абсолютните стойности на отклоненията (т.е. модулите на тези стойности)?

На пръв поглед се оказва добре (между другото получената стойност се нарича средно абсолютно отклонение), но не във всички случаи. Нека опитаме друг пример. Нека резултатът от измерването е следният набор от стойности: 7; 1; -6; -2. Тогава средното абсолютно отклонение е:

Еха! Отново получихме резултат 4, въпреки че разликите са с много по-голям спред.

Сега нека видим какво се случва, ако повдигнем на квадрат разликите (и след това извадим корен квадратен от тяхната сума).

За първия пример ще бъде:

.

За втория пример ще бъде:

Сега е съвсем друг въпрос! Колкото по-голямо е разпространението на разликите, толкова по-голямо е стандартното отклонение... което е, към което се стремихме.

Всъщност този метод използва същата идея като при изчисляване на разстоянието между точките, само че се прилага по различен начин.

И от математическа гледна точка, използването на квадрати и квадратни корениосигурява повече полза, отколкото бихме могли да получим от абсолютни стойности на отклонения, което прави стандартното отклонение приложимо към други математически проблеми.

Сергей Валериевич ви каза как да намерите стандартното отклонение

Урок №4

Тема: „Описателна статистика. Индикатори за разнообразие на признаци в съвкупността"

Основните критерии за разнообразието на даден признак в статистическа съвкупност са: граница, амплитуда, стандартно отклонение, коефициент на колебание и коефициент на вариация. В предишния урок беше обсъдено, че средните стойности предоставят само обобщена характеристика на характеристиката, която се изучава в съвкупността и не вземат предвид стойностите на нейните отделни варианти: минимални и максимални стойности, над средното, под средно и т.н.

Пример. Средни стойности на две различни числови последователности: -100; -20; 100; 20 и 0,1; -0,2; 0,1 са абсолютно еднакви и равниОТНОСНО.Въпреки това диапазоните на разсейване на тези данни за относителна средна последователност са много различни.

Определянето на изброените критерии за разнообразието на дадена характеристика се извършва преди всичко, като се вземе предвид нейната стойност в отделни елементи на статистическата съвкупност.

Индикаторите за измерване на вариациите на даден признак са абсолютенИ роднина. Абсолютните показатели за вариация включват: диапазон на вариация, граница, стандартно отклонение, дисперсия. Коефициентът на вариация и коефициентът на колебание се отнасят до относителни мерки за вариация.

Лимит (lim)–Това е критерий, който се определя от екстремните стойности на вариант в серия от варианти. С други думи, този критерий е ограничен от минималните и максималните стойности на атрибута:

Амплитуда (Am)или диапазон на вариация -Това е разликата между екстремните варианти. Изчисляването на този критерий се извършва чрез изваждане на минималната му стойност от максималната стойност на атрибута, което ни позволява да оценим степента на разсейване на опцията:

Недостатъкът на границата и амплитудата като критерии за променливост е, че те напълно зависят от екстремните стойности на характеристиката в вариационната серия. В този случай колебанията в стойностите на атрибутите в рамките на серия не се вземат предвид.

Най-пълното описание на разнообразието на признак в статистическа съвкупност се предоставя от стандартно отклонение(сигма), което е обща мярка за отклонението на дадена опция от нейната средна стойност. Често се нарича стандартно отклонение стандартно отклонение.

Стандартното отклонение се основава на сравнение на всяка опция със средната аритметична стойност на дадена популация. Тъй като в съвкупността винаги ще има опции както по-малко, така и повече от него, сумата от отклонения със знак "" ще се анулира от сумата от отклонения със знак "", т.е. сумата от всички отклонения е нула. За да се избегне влиянието на знаците на разликите, се вземат отклонения от средноаритметичното на квадрат, т.е. . Сумата от квадратите на отклоненията не е равна на нула. За да получите коефициент, който може да измерва променливостта, вземете средната стойност на сумата от квадрати - тази стойност се нарича отклонения:

По същество дисперсията е средният квадрат на отклоненията на отделните стойности на дадена характеристика от нейната средна стойност. дисперсия квадрат на стандартното отклонение.

Дисперсията е размерно количество (наименувано). Така че, ако вариантите на числова серия са изразени в метри, тогава дисперсията дава квадратни метри; ако опциите са изразени в килограми, тогава дисперсията дава квадрат на тази мярка (kg 2) и т.н.

Стандартно отклонение– корен квадратен от дисперсията:

, тогава при изчисляване на дисперсията и стандартното отклонение в знаменателя на дробта, вместотрябва да се постави.

Изчисляването на стандартното отклонение може да бъде разделено на шест етапа, които трябва да се извършват в определена последователност:

Приложение на стандартното отклонение:

а) за преценка на променливостта на вариационните серии и сравнителна оценка на типичността (представителността) на средните аритметични стойности. Това е необходимо при диференциална диагноза при определяне на стабилността на симптомите.

б) да се реконструира вариационната серия, т.е. възстановяване на неговата честотна характеристика въз основа на три сигма правила. В интервала (М±3σ) 99,7% от всички варианти на серията са разположени в интервала (М±2σ) - 95,5% и в диапазона (М±1σ) - 68,3% опция за ред(Фиг. 1).

в) за идентифициране на „изскачащи“ опции

г) да се определят параметрите на нормата и патологията с помощта на сигма оценки

д) да се изчисли коефициентът на вариация

е) да се изчисли средната грешка на средноаритметичното.

За да се характеризира всяка популация, която иманормален тип разпределение , достатъчно е да знаете два параметъра: средно аритметично и стандартно отклонение.

Фигура 1. Правило на трите сигми

Пример.

В педиатрията стандартното отклонение се използва за оценка на физическото развитие на децата чрез сравняване на данните за конкретно дете със съответните стандартни показатели. За стандарт се приема средноаритметичното на физическото развитие на здрави деца. Сравнението на показателите със стандартите се извършва с помощта на специални таблици, в които стандартите са дадени заедно със съответните им сигма скали. Смята се, че ако показателят за физическо развитие на детето е в рамките на стандарта (средно аритметично) ±σ, тогава физическо развитиедетето (според този показател) отговаря на нормата. Ако индикаторът е в рамките на стандарта ±2σ, тогава има леко отклонение от нормата. Ако индикаторът надхвърли тези граници, тогава физическото развитие на детето се различава рязко от нормата (възможна е патология).

В допълнение към вариационните показатели, изразени в абсолютни стойности, статистическите изследвания използват вариационни показатели, изразени в относителни стойности. Коефициент на трептене -това е отношението на диапазона на вариация към средната стойност на признака. Коефициентът на вариация -това е отношението на стандартното отклонение към средната стойност на характеристиката. Обикновено тези стойности се изразяват като проценти.

Формули за изчисляване на показателите за относителна вариация:

От горните формули става ясно, че колкото по-голям е коеф V е по-близо до нула, толкова по-малка е вариацията в стойностите на характеристиката. Колкото повече V, толкова по-променлив е знакът.

В статистическата практика най-често се използва коефициентът на вариация. Използва се не само за сравнителна оценка на вариацията, но и за характеризиране на хомогенността на популацията. Популацията се счита за хомогенна, ако коефициентът на вариация не надвишава 33% (за разпределения, близки до нормалните). Аритметично съотношението на σ и средната аритметична неутрализира влиянието абсолютна стойносттези характеристики, а процентното съотношение прави коефициента на вариация безразмерна (неназована) величина.

Получената стойност на коефициента на вариация се оценява в съответствие с приблизителните градации на степента на разнообразие на признака:

Слаб - до 10%

Средно - 10 - 20%

Силен - повече от 20%

Използването на коефициента на вариация е препоръчително в случаите, когато е необходимо да се сравнят характеристики, които са различни по размер и размер.

Разликата между коефициента на вариация и други критерии за разсейване е ясно демонстрирана пример.

маса 1

Състав на работниците в промишленото предприятие

Въз основа на статистическите характеристики, дадени в примера, можем да направим заключение за относителната хомогенност на възрастовия състав и образователното ниво на служителите на предприятието, като се има предвид ниската професионална стабилност на анкетирания контингент. Лесно е да се види, че опитът да се преценят тези социални тенденции чрез стандартното отклонение би довел до погрешно заключение, а опитът да се сравнят счетоводните характеристики „трудов опит“ и „възраст“ със счетоводния показател „образование“ като цяло би бил неправилно поради разнородността на тези характеристики.

Медиана и процентили

За ординални (рангови) разпределения, където критерият за средата на реда е медианата, стандартното отклонение и дисперсията не могат да служат като характеристики на дисперсията на варианта.

Същото важи и за отворените вариационни серии. Това обстоятелство се дължи на факта, че отклоненията, от които се изчисляват дисперсията и σ, се измерват от средната аритметична стойност, която не се изчислява в отворени вариационни серии и в серии от разпределения на качествени характеристики. Следователно, за компресирано описание на разпределения се използва друг параметър на разсейване - квантил(синоним - „процентил“), подходящ за описание на качествени и количествени характеристики във всякаква форма на тяхното разпределение. Този параметър може да се използва и за преобразуване на количествени характеристики в качествени. В този случай такива рейтинги се присвояват в зависимост от това на кой ред на квантил отговаря дадена опция.

В практиката на биомедицинските изследвания най-често се използват следните квантили:

- Медиана;

, – квартили (четвърти), където – долен квартил, горен квартил.

Квантилите разделят областта на възможните промени в вариационна серия на определени интервали. Медиана (квантил) е опция, която е в средата на вариационна серия и разделя тази серия наполовина на две равни части ( 0,5 И 0,5 ). Квартилът разделя серия на четири части: първата част (долният квартил) е опция, разделяща опции, чиито числени стойности не надвишават 25% от максимално възможните в тази серия, квартил разделя опции с числена стойност до 50% от максималната възможна. Горният квартил () разделя опциите до 75% от максимално възможните стойности.

При асиметрично разпределение променлива спрямо средната аритметична стойност, медианата и квартилите се използват за нейното характеризиране.В този случай се използва следната форма за показване на средната стойност - мех (;). Например, изследваният признак – „периодът, в който детето започва да ходи самостоятелно” – има асиметрично разпределение в изследваната група. В същото време долният квартил () съответства на началото на ходенето - 9,5 месеца, медианата - 11 месеца, горният квартил () - 12 месеца. Съответно, характеристиката на средния тренд на посочения признак ще бъде представена като 11 (9,5; 12) месеца.

Оценка на статистическата значимост на резултатите от изследването

Статистическата значимост на данните се разбира като степента, в която те съответстват на показаната реалност, т.е. статистически значими данни са тези, които не изкривяват и правилно отразяват обективната реалност.

Оценяването на статистическата значимост на резултатите от изследването означава да се определи с каква вероятност е възможно резултатите, получени от извадката от съвкупността, да се прехвърлят към цялата популация. Оценката на статистическата значимост е необходима, за да се разбере каква част от дадено явление може да се използва, за да се прецени явлението като цяло и неговите модели.

Оценката на статистическата значимост на резултатите от изследването се състои от:

1. грешки на представителността (грешки на средни и относителни стойности) - м;

2. доверителни граници на средни или относителни стойности;

3. надеждност на разликата в средните или относителните стойности според критерия T.

Стандартна грешка на средноаритметичната стойностили грешка в представителносттахарактеризира колебанията на средната стойност. Трябва да се отбележи, че колкото по-голям е размерът на извадката, толкова по-малък е разпределението на средните стойности. Стандартната грешка на средната стойност се изчислява по формулата:

В съвременната научна литература средноаритметичната стойност се записва заедно с грешката на представителност:

или заедно със стандартното отклонение:

Като пример, разгледайте данните за 1500 градски клиники в страната (общо население). Средният брой обслужени пациенти в клиниката е 18 150 души. Случайният избор на 10% от обектите (150 клиники) дава среден брой пациенти, равен на 20 051 души. Грешката на извадката, очевидно поради факта, че не всички 1500 клиники са включени в извадката, е равна на разликата между тези средни стойности - общата средна ( Мген) и средно извадка ( Мизбрано). Ако формираме друга извадка със същия размер от нашата популация, тя ще даде различна стойност на грешката. Всички тези извадкови средни с достатъчно големи извадки се разпределят нормално около общата средна с достатъчно големи голямо числоповторения на извадка от същия брой обекти от популация. Стандартна грешка на средната стойност м- това е неизбежното разпръскване на извадковите средни около генералното средно.

В случай, че резултатите от изследването са представени в относителни количества (например проценти) - изчислени стандартна грешка на дроб:

където P е показателят в %, n е броят на наблюденията.

Резултатът се показва като (P ± m)%. Например,процентът на възстановяване сред пациентите е (95,2±2,5)%.

В случай, че броят на елементите на съвкупността, тогава при изчисляване на стандартните грешки на средната и дробта в знаменателя на дробта, вместотрябва да се постави.

За нормално разпределение (разпределението на извадковите средни стойности е нормално), знаем каква част от съвкупността попада във всеки интервал около средната стойност. В частност:

На практика проблемът е, че характеристиките на генералната съвкупност са ни непознати и извадката се прави именно с цел да ги оценим. Това означава, че ако направим проби с еднакъв размер нот общата популация, тогава в 68,3% от случаите интервалът ще съдържа стойността М(в 95,5% от случаите ще бъде на интервала и в 99,7% от случаите – на интервала).

Тъй като всъщност е взета само една извадка, това твърдение е формулирано по отношение на вероятността: с вероятност от 68,3%, средната стойност на атрибута в популацията се намира в интервала, с вероятност от 95,5% - в интервала и т.н.

На практика се изгражда интервал около стойността на извадката, така че с дадена (достатъчно висока) вероятност, вероятност за доверие –ще „покрие“ истинската стойност на този параметър в общата популация. Този интервал се нарича доверителен интервал.

Вероятност за довериеП това е степента на увереност, че доверителният интервал действително ще съдържа истинската (неизвестна) стойност на параметъра в популацията.

Например, ако вероятността за доверие Ре 90%, това означава, че 90 проби от 100 ще дадат правилната оценка на параметъра в популацията. Съответно вероятността от грешка, т.е. неправилна оценка на общата средна стойност за извадката е равна в проценти: . За този примертова означава, че 10 проби от 100 ще дадат неправилна оценка.

Очевидно степента на доверие (вероятност на доверие) зависи от размера на интервала: колкото по-широк е интервалът, толкова по-висока е увереността, че неизвестна стойност за популацията ще попадне в него. На практика най-малко два пъти грешката на извадката се използва за конструиране на доверителен интервал, за да се осигури поне 95,5% увереност.

Определянето на доверителните граници на средните и относителните стойности ни позволява да намерим двете им екстремни стойности - минималната възможна и максималната възможна, в рамките на които изследваният показател може да се появи в цялата популация. Въз основа на това, доверителни граници (или доверителен интервал)- това са границите на средни или относителни стойности, извън които поради случайни колебания има незначителна вероятност.

Доверителният интервал може да бъде пренаписан като: , където T– критерий за доверие.

Доверителните граници на средноаритметичната стойност в популацията се определят по формулата:

М ген = М изберете + t m М

за относителна стойност:

Р ген = П изберете + t m Р

Където М генИ Р ген- стойности на средни и относителни стойности за генералната съвкупност; М изберетеИ Р изберете- стойности на средни и относителни стойности, получени от извадката; м МИ м П- грешки на средни и относителни стойности; T- критерий за доверие (критерий за точност, който се установява при планиране на изследването и може да бъде равен на 2 или 3); t m- това е доверителен интервал или Δ - максималната грешка на показателя, получена при извадково изследване.

Трябва да се отбележи, че стойността на критерия Tдо известна степен свързана с вероятността за безгрешна прогноза (p), изразена в %. Избира се от самия изследовател, ръководен от необходимостта да получи резултата с необходимата степен на точност. По този начин, за вероятността за безгрешна прогноза от 95,5%, стойността на критерия Tе 2, за 99,7% - 3.

Дадените оценки на доверителния интервал са приемливи само за статистически популации с брой наблюдения над 30. При по-малък размер на популацията (малки извадки) се използват специални таблици за определяне на критерия t. В тези таблици желаната стойност се намира в пресечната точка на линията, съответстваща на размера на популацията (n-1)и колона, съответстваща на нивото на вероятност за прогноза без грешки (95,5%; 99,7%), избрана от изследователя. В медицинските изследвания, когато се установяват граници на доверие за всеки индикатор, вероятността за безгрешна прогноза е 95,5% или повече. Това означава, че стойността на показателя, получена от извадковата съвкупност, трябва да бъде намерена в генералната съвкупност в поне 95,5% от случаите.

    Въпроси по темата на урока:

    Уместност на показателите за разнообразие на признаци в статистическа популация.

    Обща характеристика на абсолютните вариационни показатели.

    Стандартно отклонение, изчисление, приложение.

    Относителни мерки на вариация.

    Медиана, квартилен резултат.

    Оценка на статистическата значимост на резултатите от изследването.

    Стандартна грешка на средноаритметичната стойност, формула за изчисление, пример за използване.

    Изчисляване на пропорцията и нейната стандартна грешка.

    Концепцията за доверителна вероятност, пример за използване.

10. Понятието доверителен интервал, неговото приложение.

    Тестови задачи по темата със стандартни отговори:

1. АБСОЛЮТНИТЕ ПОКАЗАТЕЛИ НА ВАРИАЦИЯТА СЕ ОТНАСЯТ КЪМ

1) коефициент на вариация

2) коефициент на трептене

4) медиана

2. ОТНОСИТЕЛНИТЕ ПОКАЗАТЕЛИ НА ВАРИАЦИЯТА СЕ СВЪРЗВАТ

1) дисперсия

4) коефициент на вариация

3. КРИТЕРИИ, КОЙТО СЕ ОПРЕДЕЛЯ ОТ ЕКСТРЕМАЛНИТЕ СТОЙНОСТИ НА ОПЦИЯ В ВАРИАЦИОННА СЕРИЯ

2) амплитуда

3) дисперсия

4) коефициент на вариация

4. РАЗЛИКАТА НА ЕКСТРЕМНИТЕ ВАРИАНТИ Е

2) амплитуда

3) стандартно отклонение

4) коефициент на вариация

5. СРЕДНИЯТ КВАДРАТ НА ОТКЛОНЕНИЯТА НА ИНДИВИДУАЛНИТЕ СТОЙНОСТИ НА ХАРАКТЕРИСТИКА ОТ НЕЙНИТЕ СРЕДНИ СТОЙНОСТИ Е

1) коефициент на трептене

2) медиана

3) дисперсия

6. СЪОТНОШЕНИЕТО НА СКАЛАТА НА ВАРИАЦИЯТА КЪМ СРЕДНАТА СТОЙНОСТ НА ХАРАКТЕРА Е

1) коефициент на вариация

2) стандартно отклонение

4) коефициент на трептене

7. СЪОТНОШЕНИЕТО НА СРЕДНОТО КВАДРАТНО ОТКЛОНЕНИЕ КЪМ СРЕДНАТА СТОЙНОСТ НА ХАРАКТЕРИСТИКАТА Е

1) дисперсия

2) коефициент на вариация

3) коефициент на трептене

4) амплитуда

8. ОПЦИЯТА, КОЯТО Е В СРЕДАТА НА ВАРИАЦИОННАТА СЕРИЯ И Я РАЗДЕЛЯ НА ДВЕ РАВНИ ЧАСТИ Е

1) медиана

3) амплитуда

9. В МЕДИЦИНСКИТЕ ИЗСЛЕДВАНИЯ, ПРИ УСТАНОВЯВАНЕ НА ДОВЕРИТЕЛНИ ГРАНИЦИ ЗА ВСЯК ИНДИКАТОР, СЕ ПРИЕМА ВЕРОЯТНОСТТА ЗА БЕЗГРЕШНА ПРОГНОЗА

10. АКО 90 ПРОБИ ОТ 100 ДАВАТ ПРАВИЛНАТА ОЦЕНКА НА ПАРАМЕТЪР В ПОПУЛАЦИЯТА, ТОВА ОЗНАЧАВА, ЧЕ ВЕРОЯТНОСТТА ЗА ДОВЕРИЕ ПРАВЕН

11. АКО 10 ПРОБИ ОТ 100 ДАВАТ НЕПРАВИЛНА ОЦЕНКА, ВЕРОЯТНОСТТА ЗА ГРЕШКА Е РАВНА

12. ГРАНИЦИ НА СРЕДНИ ИЛИ ОТНОСИТЕЛНИ СТОЙНОСТИ, ПРЕДВИЖДАНЕТО НА КОИТО ПОРАДИ СЛУЧАЙНИ КОЛЕБАНИЯ ИМА МАЛКА ВЕРОЯТНОСТ – ТОВА Е

1) доверителен интервал

2) амплитуда

4) коефициент на вариация

13. ЗА МАЛКА ИЗВАДКА СЕ СЧИТА ТАЗИ ПОПУЛАЦИЯ, В КОЯТО

1) n е по-малко или равно на 100

2) n е по-малко или равно на 30

3) n е по-малко или равно на 40

4) n е близо до 0

14. ЗА ВЕРОЯТНОСТ ЗА БЕЗГРЕШНА ПРОГНОЗА 95% КРИТЕРИЙНА СТОЙНОСТ TЕ

15. ЗА ВЕРОЯТНОСТ ЗА БЕЗГРЕШНА ПРОГНОЗА 99% КРИТЕРИЙНА СТОЙНОСТ TЕ

16. ЗА РАЗПРЕДЕЛЕНИЯ, БЛИЗКИ ДО НОРМАЛНОТО, ПОПУЛАЦИЯТА СЕ СЧИТА ЗА ХОМОГЕННА, АКО КОЕФИЦИЕНТЪТ НА ВАРИАЦИЯ НЕ ПРЕВИШАВА

17. ОПЦИЯ, РАЗДЕЛИТЕЛНИ ОПЦИИ, КОИТО ЧИСЛОВИТЕ СТОЙНОСТИ НЕ ПРЕВИШАВАТ 25% ОТ МАКСИМАЛНО ВЪЗМОЖНИТЕ В ДАДЕНА СЕРИЯ – ТОВА Е

2) долен квартил

3) горен квартил

4) квартил

18. ДАННИ, КОИТО НЕ ИЗКРИВЯВАТ И ПРАВИЛНО ОТРАЗЯВАТ ОБЕКТИВНАТА РЕАЛНОСТ, СЕ НАРИЧАТ

1) невъзможно

2) еднакво възможно

3) надежден

4) случаен

19. СЪГЛАСНО ПРАВИЛОТО НА "ТРИ Сигми", С НОРМАЛНО РАЗПРЕДЕЛЕНИЕ НА ХАРАКТЕРИСТИКА В ВРЪХ
ЩЕ БЪДАТ ЛОКАЛИЗАЦИИ

1) 68,3% опция

Стандартното отклонение е класически индикатор за променливост от описателната статистика.

Стандартно отклонение, стандартно отклонение, Стандартно отклонение, извадково стандартно отклонение (англ. standard deviation, STD, STDev) е много често срещан индикатор за дисперсия в описателната статистика. Но защото техническият анализ е подобен на статистиката; този индикатор може (и трябва) да се използва в техническия анализ за откриване на степента на дисперсия на цената на анализирания инструмент във времето. Означава се с гръцкия символ сигма "σ".

Благодаря на Карл Гаус и Пиърсън, че ни позволиха да използваме стандартно отклонение.

Използвайки стандартно отклонение в техническия анализ, обръщаме това "индекс на дисперсия"" В "индикатор за волатилност“, запазвайки смисъла, но променяйки термините.

Какво е стандартно отклонение

Но освен междинните спомагателни изчисления, стандартното отклонение е доста приемливо за независимо изчислениеи приложения в техническия анализ. Като активен читател на нашето списание репей отбеляза, „ Все още не разбирам защо стандартното отклонение не е включено в набора от стандартни показатели на местните дилинг центрове«.

Наистина ли, стандартното отклонение може да измерва променливостта на даден инструмент по класически и „чист“ начин. Но за съжаление този показател не е толкова често срещан в анализа на ценни книжа.

Прилагане на стандартно отклонение

Ръчното изчисляване на стандартното отклонение не е много интересно, но полезно за опит. Стандартното отклонение може да бъде изразеноформула STD=√[(∑(x-x ) 2)/n] , която звучи като корен от сумата от квадратите на разликите между елементите на извадката и средната стойност, разделена на броя на елементите в извадката.

Ако броят на елементите в извадката надвишава 30, тогава знаменателят на дробта под корена приема стойността n-1. В противен случай се използва n.

Стъпка по стъпка изчисляване на стандартното отклонение:

  1. изчислете средноаритметичната стойност на извадката от данни
  2. извадете тази средна стойност от всеки примерен елемент
  3. повдигаме на квадрат всички получени разлики
  4. сумирайте всички получени квадрати
  5. разделете полученото количество на броя на елементите в пробата (или на n-1, ако n>30)
  6. изчислете корен квадратен от полученото частно (наречено дисперсия)

Дефинира се като обобщаваща характеристика на размера на вариацията на черта в съвкупността. Тя е равна на корен квадратен от средното квадратно отклонение на отделните стойности на атрибута от средноаритметичното, т.е. Коренът на и може да се намери по следния начин:

1. За основния ред:

2. За вариационната серия:

Трансформирането на формулата за стандартно отклонение я привежда във форма, по-удобна за практически изчисления:

Стандартно отклонениеопределя колко средно специфичните опции се отклоняват от тяхната средна стойност и също така е абсолютна мярка за променливостта на характеристика и се изразява в същите единици като опциите и следователно се тълкува добре.

Примери за намиране на стандартното отклонение: ,

За алтернативни характеристики, средната формула квадратно отклонениеизглежда така:

където p е делът на единиците в популацията, които имат определена характеристика;

q е делът на единиците, които нямат тази характеристика.

Концепцията за средно линейно отклонение

Средно линейно отклонениесе определя като средноаритметично от абсолютните стойности на отклоненията на отделните опции от .

1. За основния ред:

2. За вариационната серия:

където сумата n е сума от честотите на вариационните серии.

Пример за намиране на средното линейно отклонение:

Предимството на средното абсолютно отклонение като мярка за дисперсия в диапазона на вариация е очевидно, тъй като тази мярка се основава на отчитане на всички възможни отклонения. Но този индикатор има значителни недостатъци. Произволното отхвърляне на алгебрични знаци за отклонения може да доведе до факта, че математическите свойства на този индикатор далеч не са елементарни. Това прави много трудно използването на средното абсолютно отклонение при решаване на проблеми, включващи вероятностни изчисления.

Следователно средното линейно отклонение като мярка за вариация на характеристика рядко се използва в статистическата практика, а именно когато сумирането на показатели без отчитане на знаци има икономически смисъл. С негова помощ например се анализира текучеството външната търговия, състав на работниците, ритъм на производство и др.

Среден квадрат

Приложен среден квадрат, например за изчисляване на средния размер на страните на n квадратни сечения, средните диаметри на стволове, тръби и др. Разделя се на два вида.

Обикновен среден квадрат. Ако при замяна на отделни стойности на характеристика с средна стойностАко е необходимо сумата от квадратите на първоначалните стойности да се поддържа постоянна, тогава средната стойност ще бъде квадратична средна стойност.

Това е корен квадратен от частното от разделянето на сумата от квадратите на отделните стойности на атрибута на техния брой:

Среднопретегленият квадрат се изчислява по формулата:

където f е знакът за тегло.

Среден куб

Прилага се среден кубичен, например при определяне на средната дължина на страна и кубове. Разделя се на два вида.
Средна кубична проста:

При изчисляване на средни стойности и дисперсия в сериите на интервално разпределение, истинските стойности на атрибута се заменят с централните стойности на интервалите, които са различни от средните аритметични стойностивключени в интервала. Това води до систематична грешка при изчисляване на дисперсията. V.F. Шепард определи това грешка в изчисляването на дисперсията, причинена от използването на групирани данни, е 1/12 от квадрата на стойността на интервала, както в посока на увеличаване, така и в посока на намаляване на величината на дисперсията.

Поправката на Шепардтрябва да се използва, ако разпределението е близко до нормалното, отнася се до характеристика с непрекъснат характер на вариация и се основава на значително количество първоначални данни (n > 500). Въпреки това, въз основа на факта, че в някои случаи и двете грешки, действащи в различни посоки, се компенсират взаимно, понякога е възможно да се откаже въвеждането на корекции.

Колкото по-малки са дисперсията и стандартното отклонение, толкова по-хомогенна е популацията и толкова по-типична ще бъде средната стойност.
В практиката на статистиката често има нужда да се сравняват вариациите на различни характеристики. Например, от голям интерес е да се сравнят вариациите във възрастта на работниците и тяхната квалификация, трудов стаж и размер заплати, себестойност и печалба, трудов стаж и производителност на труда и др. За такива сравнения показателите за абсолютна променливост на характеристиките са неподходящи: невъзможно е да се сравни променливостта на трудовия опит, изразена в години, с промяната на заплатите, изразена в рубли.

За извършване на такива сравнения, както и сравнения на променливостта на една и съща характеристика в няколко популации с различни средни аритметични стойности, се използва относителен показател за вариация - коефициентът на вариация.

Структурни средни

За да се характеризира централната тенденция в статистическите разпределения, често е рационално да се използва заедно със средната аритметична стойност на определена стойност на характеристиката X, която поради определени характеристики на нейното местоположение в серията на разпределение може да характеризира нейното ниво.

Това е особено важно, когато в серия на разпределение екстремните стойности на дадена характеристика имат неясни граници. Поради това точно определениеСредно аритметичното обикновено е невъзможно или много трудно. В такива случаи средното ниво може да се определи, като се вземе например стойността на характеристиката, която се намира в средата на честотната серия или която се среща най-често в текущата серия.

Такива стойности зависят само от естеството на честотите, т.е. от структурата на разпределението. Те са типични по местоположение в серия от честоти, поради което такива стойности се считат за характеристики на центъра на разпределението и следователно са получили дефиницията на структурни средни стойности. Те се използват за учене вътрешна структураи структурата на серията за разпределение на стойностите на атрибутите. Такива показатели включват:



 


Прочети:



Отчитане на разчети с бюджета

Отчитане на разчети с бюджета

Сметка 68 в счетоводството служи за събиране на информация за задължителни плащания към бюджета, удържани както за сметка на предприятието, така и...

Чийзкейкове от извара на тиган - класически рецепти за пухкави чийзкейкове Чийзкейкове от 500 г извара

Чийзкейкове от извара на тиган - класически рецепти за пухкави чийзкейкове Чийзкейкове от 500 г извара

Продукти: (4 порции) 500 гр. извара 1/2 чаша брашно 1 яйце 3 с.л. л. захар 50 гр. стафиди (по желание) щипка сол сода бикарбонат...

Салата Черна перла със сини сливи Салата Черна перла със сини сливи

Салата

Добър ден на всички, които се стремят към разнообразие в ежедневната си диета. Ако сте уморени от еднообразни ястия и искате да зарадвате...

Рецепти за лечо с доматено пюре

Рецепти за лечо с доматено пюре

Много вкусно лечо с доматено пюре, като българско лечо, приготвено за зимата. Така обработваме (и изяждаме!) 1 торба чушки в нашето семейство. И кой бих...

feed-image RSS