У дома - Всъщност не става въпрос за ремонт
Тестване на хипотезата за незначителността на асиметрията и куртозата. Асиметрия и куртоза на разпределение на случайна величина. Оценка на съществеността на асиметрията

Определение. Мода M 0 дискретна случайна величина се нарича нейната най -вероятна стойност. За непрекъсната произволна променлива режимът е стойността на случайната променлива, при която плътността на разпределение има максимум.

Ако разпределителният полигон за дискретна случайна променлива или кривата на разпределение за непрекъсната случайна величина има два или повече максимума, тогава такова разпределение се нарича бимодаленили мултимодален.

Ако разпределението има минимум, но няма максимум, тогава се извиква антимодален.

Определение. Медиана M D на случайна променлива X се нарича нейната стойност, спрямо която е еднакво вероятно да се получи по -голяма или по -малка стойност на случайната променлива.

Геометрично медианата е абсцисата на точката, в която областта, ограничена от кривата на разпределение, е наполовина.

Обърнете внимание, че ако разпределението е унимодално, тогава режимът и медианата съвпадат с математическото очакване.

Определение. Отправната точкапоръчка к случайна променлива X се нарича математическото очакване на стойността X к .

За дискретна случайна променлива :.

.

Началният момент на първата поръчка е равен на математическото очакване.

Определение. Централна точкапоръчка кслучайна променлива X се нарича математическото очакване на стойността

За дискретна случайна променлива: .

За непрекъсната произволна променлива: .

Централният момент от първи ред винаги е нула, а централният момент от втори ред е равен на дисперсията. Централният момент от третия ред характеризира асиметрията на разпределението.

Определение. Извиква се съотношението на централния момент от трети ред към стандартното отклонение от трета степен коефициент на асиметрия.

Определение. За да се характеризира върховостта и плоскостта на разпределението, се нарича количество, наречено куртоза.

В допълнение към разглежданите количества се използват и така наречените абсолютни моменти:

Абсолютна отправна точка :.

Абсолютна централна точка: .

Квантил съответстващи на дадено ниво на вероятност R, се нарича такава стойност, при която разпределителната функция приема стойност, равна на R, т.е. където R- дадено ниво на вероятност.

С други думи квантил има стойност на случайна променлива, при която

Вероятност Rдадено като процент, дава име на съответния квантил, например, той се нарича 40% квантил.

20. Математическо очакване и вариация на броя на събитията в независими експерименти.

Определение. Математическо очакваненепрекъсната произволна величина X, чиито възможни стойности принадлежат на интервал, се нарича определен интеграл

Ако възможните стойности на случайна величина се вземат предвид по цялата числова ос, тогава математическото очакване се намира по формулата:

В този случай, разбира се, се приема, че неправилният интеграл се сближава.

Математическо очакванеДискретна случайна величина е сумата от произведенията на възможните й стойности от съответните вероятности:

М(NS) =NS 1 R 1 +NS 2 R 2 + … +NS NS R NS . (7.1)

Ако броят на възможните стойности на произволна променлива е безкраен, тогава
ако получената серия се сближи абсолютно.

Забележка 1.Понякога се нарича математическото очакване среднопретеглена, тъй като е приблизително равна на средната аритметична стойност на наблюдаваните стойности на случайната величина за голям брой експерименти.

Забележка 2.От дефиницията на математическото очакване следва, че неговата стойност не е по -малка от възможно най -малката стойност на случайна величина и не повече от най -голямата.

Забележка 3.Математическото очакване на дискретна случайна величина е никакво съвпадение(постоянно. В следващото ще видим, че същото важи и за непрекъснатите случайни променливи.

Свойства на математическите очаквания.

    Математическото очакване на константа е равно на най -константата:

М(С) =С.(7.2)

Доказателство. Имайки в предвид Скато дискретна случайна променлива, приемаща само една стойност Сс вероятност R= 1, тогава М(С) =С 1 = С.

    Постоянният фактор може да бъде изваден от знака на математическото очакване:

М(SH) =СМ(NS). (7.3)

Доказателство. Ако случайна променлива NSдадено от серия разпределение

х i

х н

стр i

стр н

след това дистрибуционната серия за SHизглежда като:

Сх i

Сх 1

Сх 2

Сх н

стр i

стр н

Тогава М(SH) =Cx 1 R 1 +Cx 2 R 2 + … +Cx NS R NS =С(NS 1 R 1 +NS 2 R 2 + … +NS NS R NS) =СМ(NS).

Математическо очакванесе нарича непрекъсната случайна величина

(7.13)

Забележка 1.Общото определение на дисперсията за непрекъсната случайна променлива е същото като за дискретна (деф. 7.5), а формулата за изчисляването й има формата:

(7.14)

Стандартното отклонение се изчислява по формулата (7.12).

Забележка 2.Ако всички възможни стойности на непрекъсната произволна променлива не надхвърлят интервала [ а, б], тогава интегралите във формули (7.13) и (7.14) се изчисляват в тези граници.

Теорема. Дисперсията на броя на събитията в независими изпитвания е равна на произведението на броя на изпитванията от вероятността за възникване и невъзникване на събитие в едно изпитване :.

Доказателство. Позволявам е броят на събитията в независими опити. Тя е равна на сумата от настъпилите събития във всеки опит :. Тъй като тестовете са независими, тогава случайните променливи - следователно са независими.

Както е показано по -горе, и.

Тогава, докато .

В този случай, както бе споменато по -рано, стандартното отклонение.

58. Коефициенти на асиметрия и куртоза.

Разпределение на централните моменти

За по -нататъшно проучване на естеството на вариацията се използват средните стойности на различни степени на отклонения на отделни стойности на атрибута от средната му аритметична стойност. Тези показатели се наричат фокусни точки разпределения на реда, съответстващи на степента, до която се увеличават отклоненията, или просто моменти.

Показатели за формуляри за разпространение

Асиметрия на разпределение


Показателят на Пирсън зависи от степента на асиметрия в средната част на разпределителната серия, а индексът на асиметрия, въз основа на момента от третия ред, от екстремните стойности на характеристиката.

Оценка на съществеността на асиметрията

За да се оцени значимостта на асиметрията, се изчислява средната квадратна грешка на коефициента на асиметрия

Ако отношението има стойност по -голяма от 2, тогава това показва значителен характер на асиметрията

Разпространение kurtosis

Индикатор за куртоза
представлява отклонението на върха на емпиричното разпределение нагоре или надолу ("прохлада") от върха на нормалната крива на разпределение, НО! Графиката на разпределение може да изглежда произволно стръмна в зависимост от силата на вариацията на чертата: колкото по -слабо е вариацията, толкова по -стръмна е кривата на разпределение в дадена скала. Да не говорим за факта, че чрез промяна на скалите по осите на абсцисата и ордината всяко разпределение може да бъде изкуствено направено „стръмно“ и „плоско“. За да се покаже от какво се състои разпределението kurtosis и да се интерпретира правилно, е необходимо да се сравнят сериите със същата сила на вариация (същата стойност на σ) и различни индекси на kurtosis. За да не се обърка куртоза с асиметрия, всички сравнени редове трябва да са симетрични. Това сравнение е показано на фиг.

Тъй като куртозата на нормалното разпределение е 3, индексът на куртоза се изчислява по формулата


Оценка на съществеността на куртозата

За да се оцени значимостта на куртозата, се изчислява показателят за нейната средноквадратична грешка

Ако отношението има стойност над 3, тогава това показва значителен характер на излишъка

Коефициент на асиметрияпоказва "изкривяването" на разпределителната серия спрямо центъра:

къде е централният момент на третия ред;

- куб със стандартно отклонение.

За този метод на изчисление: ако в разпределението има дясна (положителна асиметрия), ако в разпределението има лява (отрицателна асиметрия)

В допълнение към централния момент, асиметрията може да бъде изчислена с помощта на режим или медиана:

или, (6.69)

За този метод на изчисление: ако в разпределението има дясна (положителна асиметрия), ако в разпределението има лява (отрицателна асиметрия) (фиг. 4).


Ориз. 4. Асиметрични разпределения

Извиква се стойността, показваща "стръмността" на разпределението куртоза:

Ако в разпределението има върховост - куртозата е положителна, ако в разпределението има плоскост - куртозата е отрицателна (фиг. 5).

Ориз. 5. Излишъци от разпространение

Пример 5.Има данни за броя на овцете в областните стопанства (Таблица 9).

1. Среден брой овце на домакинство.

3. Медиана.

4. Показатели за вариация

· Дисперсия;

· стандартно отклонение;

· Коефициентът на вариация.

5. Показатели за асиметрия и куртоза.

Решение.

1. Тъй като стойността на опциите в съвкупността се повтаря няколко пъти, с определена честота за изчисляване на средната стойност, използваме формулата за средно претеглена аритметика:

2. Този ред е дискретен, така че режимът ще бъде опцията с най -висока честота -.

3. Тази серия е четна, в този случай медианата за дискретната серия се намира по формулата:

Тоест, половината от домакинствата в изследваното население имат броя на овцете до 4,75 хиляди глави. и наполовина повече от това число.

4. За да изчислим показателите за вариация, ще съставим таблица 10, в която ще изчислим отклоненията, квадратите на тези отклонения, изчислението може да се извърши, като се използват както прости, така и претеглени формули за изчисление (в примера използваме проста едно):

Таблица 10

2,00 -2,42 5,84
2,50 -1,92 3,67
2,50 -1,92 3,67
3,00 -1,42 2,01
3,00 -1,42 2,01
4,00 -0,42 0,17
5,50 1,08 1,17
5,50 1,08 1,17
5,50 1,08 1,17
6,00 1,58 2,51
6,50 2,08 4,34
7,00 2,58 6,67
Обща сума 53,00 0,00 34,42
Средно аритметично 4,4167

Нека изчислим дисперсията:

Нека изчислим стандартното отклонение:

Нека изчислим коефициента на вариация:

5. За да изчислим показателите за асиметрия и куртоза, конструираме таблица 11, в която изчисляваме ,,

Таблица 11

2,00 -2,42 -14,11 34,11
2,50 -1,92 -7,04 13,50
2,50 -1,92 -7,04 13,50
3,00 -1,42 -2,84 4,03
3,00 -1,42 -2,84 4,03
4,00 -0,42 -0,07 0,03
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
6,00 1,58 3,97 6,28
6,50 2,08 9,04 18,84
7,00 2,58 17,24 44,53
Обща сума 53,00 0,00 0,11 142,98
Средно аритметично 4,4167

Асиметрията на разпределението е равна на:

Това означава, че се наблюдава лява асиметрия, тъй като, което се потвърждава от изчислението по формулата:

В този случай, което за тази формула също показва лявостранна асиметрия

Куртозата на разпределение е равна на:

В нашия случай куртозата е отрицателна, тоест се наблюдава плоскост.

Пример 6... За фермата са представени данни за заплатите на работниците (табл. 12)

Решение.

За интервални вариационни режими режимът се изчислява по формулата:

където модален интервал - интервалът с най-висока честота, в нашия случай 3600-3800, с честота

Минималната граница на модалния интервал (3600);

Стойността на модалния интервал (200);

Честотата на интервала, предхождащ модалния интервал (25);

Честотата на следващия модален интервал (29);

Честота на модален интервал (68).

Таблица 12

За серия от интервални вариации медианата се изчислява по формулата:

където среден интервал това е интервал, чиято кумулативна (натрупана) честота е равна или по-голяма от половината от сумата от честоти, в нашия пример е 3600-3800.

Минималната граница на медианния интервал (3600);

Стойността на медианния интервал (200);

Сумата от честотите на поредицата (154);

Сумата от натрупаните честоти, всички интервали, предхождащи медианата (57);

Дали е честотата на средния интервал (68).

Пример 7.За три ферми в един регион има информация за капиталоемкостта на производството (броя на разходите за дълготрайни активи на 1 рубла произведена продукция): I - 1,29 рубли, II - 1,32 рубли, III - 1,27 рубли. Необходимо е да се изчисли средният капиталов интензитет.

Решение... Тъй като капиталоемкостта е обратен показател за оборота на капитала, използваме простата формула за хармонична средна стойност.

Пример 8.За три стопанства в един регион има данни за брутната реколта от зърно и средния добив (Таблица 13).

Решение... Изчисляването на средния добив чрез средната аритметична стойност е невъзможно, тъй като няма информация за броя на засетите площи, затова използваме формулата за хармонично претеглена средна стойност:

Пример 9.Има данни за средния добив на картофи в отделни парцели и броя на хълмовете (Таблица 14)

Таблица 14

Нека групираме данните (Таблица 15):

Таблица 15

Групиране на парцелите според "броя на плевенето"

1. Нека изчислим общата дисперсия на извадката (Таблица 16).

2.6 Асиметрия и куртоза

В математическата статистика, за да се установи геометричната форма на вероятностната плътност на случайна величина, се използват две числени характеристики, свързани с централните моменти на третия и четвъртия ред.

Определение 2.22 Примерен коефициент на изкривяванех 1 , х 2 , …, х не число, равно на отношението на централния момент на вземане на проби от трети ред към куба на стандартното отклонение С:

Тъй като и , тогава коефициентът на асиметрия се изразява чрез централните моменти чрез следната формула:

Това дава формула, изразяваща коефициента на асиметрия по отношение на началните моменти:

което улеснява практическите изчисления.

Съответната теоретична характеристика се въвежда с помощта на теоретични точки.

Определение 2.23 Коефициентът на асиметрия на случайна величинахизвика номераравно на съотношението на централния момент от трети редкъм куба със стандартно отклонение:

Ако случайна величина X има симетрично разпределение по отношение на математическото очакване μ, тогава нейният теоретичен коефициент на изкривяване е 0, но ако вероятностното разпределение е асиметрично, тогава коефициентът на коса е ненулев. Положителната стойност на коефициента на изкривяване показва, че повечето от стойностите на случайната променлива се намират вдясно от математическото очакване, тоест десният клон на кривата на плътността на вероятностите е по -продълговат от левия. Отрицателната стойност на коефициента на изкривяване показва, че по -дългата част от кривата е разположена вляво. Това изявление е илюстрирано на следната фигура.

Фигура 2.1 - Положителна и отрицателна асиметрия

разпределения

Пример 2.29Нека да намерим примерния коефициент на асиметрия според изследването на стресови ситуации от пример 2.28.

Използвайки предварително изчислените стойности на централните моменти на вземане на проби, получаваме

.

Закръглено = 0,07. Намерената ненулева стойност на коефициента на изкривяване показва изкривяването на разпределението спрямо средната стойност. Положителна стойност показва, че по -дългият клон на кривата на плътността на вероятностите е вдясно.

Характеристиките на разпределението на стойности на произволна променлива около нейните модални стойности X режими се характеризират със следната константа.

Определение 2.24 Вземане на проби от Kurtosisх 1 , х 2 , …, х низвика номера , равен

,

където- селективен централен момент от четвърти ред,

С 4 - четвъртата степен на стандартаотклоненияС.

Теоретичната концепция за куртозата е аналогична на селективната куртоза.

Определение 2.25 Чрез куртоза на случайна променливахизвика номера д,равен

,

къдетотеоретична централна точка от четвърти ред,

четвърта степен на стандартно отклонение.

Значението на kurtosis дхарактеризира относителната стръмност на върха на кривата на плътност на разпределение около максималната точка. Ако куртозата е положително число, съответната крива на разпределение има по -остър връх. Разпределението с отрицателна куртоза има по -гладък и плосък връх. Следващата фигура илюстрира възможните случаи.

Фигура 2.2 - Разпределения с положителни, нулеви и отрицателни стойности на куртоза

Асиметрията се изчислява чрез функцията SKOS. Неговият аргумент е диапазонът от клетки с данни, например = RMS (A1: A100), ако данните се съдържат в диапазона от клетки от A1 до A100.

Куртозата се изчислява чрез функцията EXCESS, чийто аргумент са числови данни, посочени като правило под формата на интервал от клетки, например: = EXCESS (A1: A100).

§2.3. Инструмент за анализ Описателна статистика

V Excelвъзможно е да се изчислят всички точкови характеристики на пробата наведнъж с помощта на инструмента за анализ Описателна статистикакойто се съдържа в Пакет за анализ.

Описателна статистикасъздава таблица с основни статистически данни за набора от данни. Тази таблица ще съдържа следните характеристики: средна стойност, стандартна грешка, дисперсия, стандартно отклонение, режим, медиана, обхват на вариация на интервала, максимални и минимални стойности, наклон, куртоза, размер на популацията, сума от всички елементи на популацията, доверителен интервал (ниво на надеждност ). Инструмент Описателна статистиказначително опростява статистическия анализ, като елиминира необходимостта от извикване на всяка функция за изчисляване на статистическите характеристики поотделно.

За да се обадите Описателна статистика, следва:

1) в менюто Обслужванеизберете екип Анализ на данни;

2) в списъка Инструменти за анализдиалогов прозорец Анализ на данниизберете инструмент Описателна статистикаи натиснете ДОБРЕ.

В прозореца Описателна статистиканеобходимо:

· В група Въведете даннив полето Интервал на въвежданезадайте диапазона от клетки, съдържащи данни;

Ако първият ред в диапазона за въвеждане съдържа заглавие на колона, тогава в полето Labels на първия редпоставете отметка в квадратчето;

· В група Опции за изходактивирайте превключвателя (поставете отметка в квадратчето) Обобщена статистикаако имате нужда от пълен списък с характеристики;

Активирайте превключвателя Ниво на надеждности посочете надеждността в%, ако е необходимо да се изчисли доверителния интервал (по подразбиране надеждността е 95%). Щракнете ДОБРЕ.

В резултат на това ще се появи таблица с изчислените стойности на горните статистически характеристики. Незабавно, без да изчистите избора на тази таблица, изпълнете командата Формат® Колона® AutoFit Width.

Изглед на диалогово поле Описателна статистика:

Практически задачи

2.1. Изчисляване на основна статистика на точки с помощта на стандартни функции Excel

Същият волтметър измерва напрежението във веригата 25 пъти. В резултат на експериментите бяха получени следните стойности на напрежение във волта:

32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35,

34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30.

Намерете средната стойност, извадката и коригираната дисперсия, стандартното отклонение, обхват, режим, медиана. Проверете отклонението от нормалното разпределение, като изчислите наклон и куртоза.

Изпълнете следните стъпки, за да завършите тази задача.

1. Въведете резултатите от експеримента си в колона А.

2. В клетка В1 въведете „Средно“, в В2 - „Избрана вариация“, в В3 - „Стандартно отклонение“, в В4 - „Коригирана вариация“, в В5 - „Коригирано стандартно отклонение“, в В6 - „Максимално“ , в B7 - „Минимално“, в B8 - „Обхват на вариация“, в B9 - „Режим“, в B10 - „Средно“, в B11 - „Асиметрия“, в B12 - „Излишък“.

3. Подравнете ширината на тази колона с AutoFitширина.

4. Изберете клетка C1 и кликнете върху бутона със знака "=" в лентата с формули. Като се използва Съветници за функциив категория Статистическинамерете функцията AVERAGE, след това маркирайте диапазона от клетки с данни и натиснете ДОБРЕ.

5. Изберете клетка C2 и кликнете върху знака = в лентата с формули. Като се използва Съветници за функциив категория Статистическинамерете функцията VARP, след това маркирайте диапазона от клетки с данни и натиснете ДОБРЕ.

6. Направете същото за себе си, за да изчислите останалите характеристики.

7. За да изчислите обхвата на вариация в клетка C8, въведете формулата: = C6-C7.

8. Добавете един ред пред таблицата си, в който въведете заглавията на съответните колони: „Име на характеристики“ и „Числови стойности“.



 


Прочети:



Презентация на тема "творчеството на Леонардо да Винчи"

Презентация по темата

"Винсент ван Гог" - Умира в 1:30 сутринта на 29 юли 1890 г. Автопортрет на Винсент ван Гог. Винсент Вилем ван Гог. Винсент, въпреки че е роден ...

Презентация на тема „Равенство между половете в контекста на правата на човека“

Презентация по темата

Цел на урока: запознаване с концепцията за пола, различията между пола и пола, общите полови стереотипи, проблемите на пола ...

Презентация "теоретични основи на рационалното управление на природата" Основи на представяне на рационалното управление на природата

Презентация

Нали, днес на планетата, Където и да хвърлиш поглед, където и да погледнеш, Животът умира. Кой е отговорен за това? Какво очаква хората след векове ...

Икона от четири части, икони на Божията майка Омекотяване на злите сърца (Ченстохова), Успокояване на моите скърби, Избавяне на страданията от беди, Възстановяване на изгубените

Икона от четири части, икони на Божията майка Омекотяване на злите сърца (Ченстохова), Успокояване на моите скърби, Избавяне на страданията от беди, Възстановяване на изгубените

Към тази икона е приложен документ - изпит на Националния изследователски институт за изследване и оценка на обекти от историята и културата ...

feed-image Rss