doma - Ne gre za prenovo
Testiranje hipoteze o nepomembnosti asimetrije in kurtoze. Asimetrija in kurtoza porazdelitve naključne spremenljivke. Ocena pomembnosti asimetrije

Opredelitev. Moda M 0 diskretna naključna spremenljivka se imenuje njena najverjetnejša vrednost. Za neprekinjeno naključno spremenljivko je način vrednost naključne spremenljivke, pri kateri ima porazdelitvena gostota največ.

Če ima razdelilni poligon za diskretno naključno spremenljivko ali krivulja porazdelitve za neprekinjeno naključno spremenljivko dva ali več maksimumov, se takšna porazdelitev imenuje bimodalni ali multimodalno.

Če ima distribucija minimum, nima pa maksimuma, se imenuje antimodalno.

Opredelitev. Mediana M D naključne spremenljivke X se imenuje njena vrednost, glede na katero je enako verjetno, da se dobi večja ali manjša vrednost naključne spremenljivke.

Geometrijsko je mediana abscisa točke, pri kateri se območje, omejeno s krivuljo porazdelitve, prepolovi.

Upoštevajte, da če je porazdelitev unimodalna, potem način in mediana sovpadata z matematičnim pričakovanjem.

Opredelitev. Izhodišče naročilo k naključne spremenljivke X se imenuje matematično pričakovanje količine X k .

Za diskretno naključno spremenljivko :.

.

Začetni trenutek prvega reda je enak matematičnemu pričakovanju.

Opredelitev. Osrednja točka naročilo k naključna spremenljivka X se imenuje matematično pričakovanje vrednosti

Za diskretno naključno spremenljivko: .

Za neprekinjeno naključno spremenljivko: .

Osrednji moment prvega reda je vedno nič, osrednji moment drugega reda pa je enak varianci. Osrednji moment tretjega reda označuje asimetričnost porazdelitve.

Opredelitev. Imenuje se razmerje med osrednjim momentom tretjega reda in standardnim odklonom tretje stopnje koeficient asimetrije.

Opredelitev. Za označevanje vrha in ravnosti porazdelitve se imenuje količina, imenovana kurtoza.

Poleg upoštevanih količin se uporabljajo tudi tako imenovani absolutni momenti:

Absolutno izhodišče :.

Absolutna središčna točka: .

Kvantil ki ustreza dani ravni verjetnosti R, se imenuje taka vrednost, pri kateri funkcija distribucije prevzame vrednost, ki je enaka R, tj. kje R- dano stopnjo verjetnosti.

Z drugimi besedami kvantil obstaja vrednost naključne spremenljivke, pri kateri

Verjetnost R v odstotkih daje ime ustreznemu kvantilu, na primer se imenuje 40% kvantil.

20. Matematično pričakovanje in variacija števila dogodkov dogodka v neodvisnih poskusih.

Opredelitev. Matematično pričakovanje neprekinjeno naključno spremenljivko X, katere možne vrednosti pripadajo intervalu, imenujemo določen integral

Če se na celotni numerični osi upoštevajo možne vrednosti naključne spremenljivke, potem matematično pričakovanje po formuli:

V tem primeru seveda predpostavljamo, da nepravilni integral konvergira.

Matematično pričakovanje diskretna naključna spremenljivka je vsota produktov njenih možnih vrednosti z ustreznimi verjetnostmi:

M(NS) =NS 1 R 1 +NS 2 R 2 + … +NS NS R NS . (7.1)

Če je število možnih vrednosti naključne spremenljivke neskončno, potem
če nastala serija popolnoma konvergira.

Opomba 1. Včasih se imenuje tudi matematično pričakovanje Povprečna teža, saj je pri velikem številu poskusov približno enaka aritmetični sredini opazovanih vrednosti naključne spremenljivke.

Opomba 2. Iz opredelitve matematičnega pričakovanja izhaja, da njegova vrednost ni manjša od najmanjše možne vrednosti naključne spremenljivke in ne večja od največje.

Opomba 3. Matematično pričakovanje diskretne naključne spremenljivke je ni naključja(konstantno. V nadaljevanju bomo videli, da enako velja za neprekinjene naključne spremenljivke.

Lastnosti matematičnih pričakovanj.

    Matematično pričakovanje konstante je enako najbolj konstantnemu:

M(Z) =Z.(7.2)

Dokaz. Ob upoštevanju Z kot diskretna naključna spremenljivka, ki ima samo eno vrednost Z z verjetnostjo R= 1, potem M(Z) =Z 1 = Z.

    Konstantan faktor lahko vzamemo iz znaka matematičnega pričakovanja:

M(SH) =CM(NS). (7.3)

Dokaz. Če je naključna spremenljivka NS podano po distribucijski seriji

x jaz

x n

str jaz

str n

nato distribucijska serija za SH izgleda kot:

Zx jaz

Zx 1

Zx 2

Zx n

str jaz

str n

Potem M(SH) =Cx 1 R 1 +Cx 2 R 2 + … +Cx NS R NS =Z(NS 1 R 1 +NS 2 R 2 + … +NS NS R NS) =CM(NS).

Matematično pričakovanje se imenuje neprekinjena naključna spremenljivka

(7.13)

Opomba 1. Splošna definicija variance za neprekinjeno naključno spremenljivko je enaka kot za diskretno (def. 7.5), formula za izračun pa ima obliko:

(7.14)

Standardni odklon se izračuna po formuli (7.12).

Opomba 2.Če vse možne vrednosti neprekinjene naključne spremenljivke ne presegajo intervala [ a, b], nato se v teh mejah izračunajo integrali v formulah (7.13) in (7.14).

Izrek. Različica števila dogodkov dogodka v neodvisnih preskušanjih je enaka zmnožku števila poskusov na verjetnost, da se bo dogodek pojavil in ne pojavil v enem preskusu :.

Dokaz. Naj bo število pojavitev dogodka v neodvisnih preskušanjih. Enaka je vsoti dogodkov dogodka v vsakem preskušanju :. Ker so testi neodvisni, so naključne spremenljivke - so torej neodvisni.

Kot je prikazano zgoraj, in.

Potem, medtem ko .

V tem primeru, kot smo že omenili, standardni odklon.

58. Koeficienti asimetrije in kurtoze.

Osrednji trenutki distribucije

Za nadaljnjo študijo narave variacije se uporabljajo povprečne vrednosti različnih stopenj odstopanj posameznih vrednosti atributa od njegove aritmetične sredine. Ti kazalniki se imenujejo kontaktne točke porazdelitve reda, ki ustrezajo stopnji dviga odstopanj, ali preprosto trenutke.

Kazalniki distribucijskih obrazcev

Porazdelitvena asimetrija


Pearsonov eksponent je odvisen od stopnje asimetrije v srednjem delu distribucijske serije, indeks asimetrije pa glede na moment tretjega reda od ekstremnih vrednosti lastnosti.

Ocena pomembnosti asimetrije

Za oceno pomembnosti asimetrije se izračuna povprečna kvadratna napaka koeficienta asimetrije

Če odnos ima vrednost večjo od 2, potem to kaže na pomembno naravo asimetrije

Distribucijska kurtoza

Indikator kurtoze
predstavlja odstopanje vrha empirične porazdelitve navzgor ali navzdol ("hladnost") od vrha normalne porazdelitvene krivulje, ALI! Graf porazdelitve je lahko videti poljubno strm, odvisno od jakosti variacije lastnosti: šibkejša kot je variacija, bolj strma je krivulja porazdelitve na določeni lestvici. Da ne omenjam dejstva, da je mogoče s spreminjanjem lestvic vzdolž osi abscise in ordinate umetno narediti kakršno koli porazdelitev "strmo" in "ravno". Da bi pokazali, v čem je sestavljena distribucijska kurtoza, in jo pravilno interpretirali, je treba primerjati serije z enako jakostjo variacije (isto vrednost σ) in različnimi indeksi kurtoze. Da ne bi zamenjali kurtoze z asimetrijo, morajo biti vse primerjane vrstice simetrične. Ta primerjava je prikazana na sl.

Ker je kurtoza normalne porazdelitve 3, se indeks kurtoze izračuna po formuli


Ocena pomembnosti kurtoze

Za oceno pomembnosti kurtoze se izračuna indikator njene korenske napake

Če odnos ima vrednost več kot 3, potem to kaže na pomembno naravo presežka

Koeficient asimetrije prikazuje "ukrivljenost" distribucijske serije glede na sredino:

kje je osrednji trenutek tretjega reda;

- kocka standardnega odklona.

Za to metodo izračuna: če je porazdelitev desno (pozitivna asimetrija), če je porazdelitev leva (negativna asimetrija)

Poleg osrednjega trenutka lahko asimetrijo izračunamo tudi z načinom ali srednjo vrednostjo:

ali, (6.69)

Za to metodo izračuna: če je v porazdelitvi desna stran (pozitivna asimetrija), če je v porazdelitvi leva stran (negativna asimetrija) (slika 4).


Riž. 4. Asimetrične porazdelitve

Vrednost, ki prikazuje "strmino" porazdelitve, se imenuje kurtoza:

Če v distribuciji obstaja vrhovnost - kurtoza je pozitivna, če v distribuciji obstaja ravnost - kurtoza je negativna (slika 5).

Riž. 5. Presežki distribucije

Primer 5. Obstajajo podatki o številu ovac na okrajnih kmetijah (tabela 9).

1. Povprečno število ovac na gospodinjstvo.

3. Mediana.

4. Kazalniki variacije

· Variabilnost;

· standardni odklon;

· Koeficient variacije.

5. Kazalniki asimetrije in kurtoze.

Rešitev.

1. Ker se vrednost možnosti v agregatu večkrat ponovi z določeno frekvenco za izračun povprečne vrednosti, uporabimo formulo za tehtano aritmetično sredino:

2. Ta vrstica je diskretna, zato bo način z najvišjo frekvenco možnost -.

3. Ta niz je enakomeren, v tem primeru mediano za diskretno vrsto po formuli:

To pomeni, da ima polovica gospodinjstev v anketirani populaciji število ovac do 4,75 tisoč glav. in pol več kot to število.

4. Za izračun kazalnikov variacije bomo sestavili tabelo 10, v kateri bomo izračunali odstopanja, kvadrate teh odstopanj, izračun lahko izvedemo tako z enostavnimi kot ponderiranimi izračunskimi formulami (v primeru uporabljamo preprosto ena):

Tabela 10

2,00 -2,42 5,84
2,50 -1,92 3,67
2,50 -1,92 3,67
3,00 -1,42 2,01
3,00 -1,42 2,01
4,00 -0,42 0,17
5,50 1,08 1,17
5,50 1,08 1,17
5,50 1,08 1,17
6,00 1,58 2,51
6,50 2,08 4,34
7,00 2,58 6,67
Skupaj 53,00 0,00 34,42
Povprečno 4,4167

Izračunajmo varianco:

Izračunajmo standardni odklon:

Izračunajmo koeficient variacije:

5. Za izračun kazalnikov asimetrije in kurtoze sestavimo tabelo 11, v kateri izračunamo ,,

Tabela 11

2,00 -2,42 -14,11 34,11
2,50 -1,92 -7,04 13,50
2,50 -1,92 -7,04 13,50
3,00 -1,42 -2,84 4,03
3,00 -1,42 -2,84 4,03
4,00 -0,42 -0,07 0,03
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
6,00 1,58 3,97 6,28
6,50 2,08 9,04 18,84
7,00 2,58 17,24 44,53
Skupaj 53,00 0,00 0,11 142,98
Povprečno 4,4167

Asimetrija porazdelitve je enaka:

To pomeni, da opazimo levostransko asimetrijo, kar potrjuje izračun po formuli:

V tem primeru, kar za to formulo označuje tudi levostransko asimetrijo

Kurtoza distribucije je enaka:

V našem primeru je kurtoza negativna, torej opazimo ravno ploskev.

Primer 6... Za kmetijo so predstavljeni podatki o plačah delavcev (tab. 12)

Rešitev.

Za intervalno variacijsko vrsto se način izračuna po formuli:

kje modalni interval - interval z najvišjo frekvenco, v našem primeru 3600-3800, s frekvenco

Najmanjša meja modalnega intervala (3600);

Vrednost modalnega intervala (200);

Pogostost intervala pred modalnim intervalom (25);

Pogostost naslednjega modalnega intervala (29);

Frekvenca modalnega intervala (68).

Tabela 12

Za intervalno variacijsko serijo se mediana izračuna po formuli:

kje srednji interval to je interval, katerega kumulativna (akumulirana) frekvenca je enaka ali večja od polovice vsote frekvenc, v našem primeru je 3600-3800.

Najmanjša meja medianega intervala (3600);

Vrednost medianega intervala (200);

Vsota frekvenc serije (154);

Vsota nabranih frekvenc, vseh intervalov pred srednjo vrednostjo (57);

Je frekvenca medianega intervala (68).

Primer 7. Za tri kmetije v eni regiji obstajajo podatki o kapitalski intenzivnosti proizvodnje (število stroškov osnovnih sredstev na 1 rubelj proizvedenih izdelkov): I - 1,29 rubljev, II - 1,32 rubljev, III - 1,27 rubljev. Izračunati je treba povprečno kapitalsko intenzivnost.

Rešitev... Ker je kapitalska intenzivnost obraten kazalnik prometa kapitala, uporabljamo preprosto formulo harmoničnega povprečja.

Primer 8. Za tri kmetije v eni regiji obstajajo podatki o bruto letini in povprečnem pridelku (tabela 13).

Rešitev... Izračun povprečnega pridelka po aritmetični sredini je nemogoč, saj ni podatkov o številu posejanih površin, zato uporabljamo formulo za harmonično tehtano povprečje:

Primer 9. Obstajajo podatki o povprečnem pridelku krompirja na posameznih parcelah in številu hribov (Tabela 14)

Tabela 14

Razvrstimo podatke (tabela 15):

Tabela 15

Razvrščanje parcel glede na "število plevela"

1. Izračunajmo skupno varianco vzorca (tabela 16).

2.6 Asimetrija in kurtoza

V matematični statistiki se za določitev geometrijske oblike verjetnostne gostote naključne spremenljivke uporabljata dve numerični značilnosti, povezani z osrednjimi trenutki tretjega in četrtega reda.

Opredelitev 2.22 Vzorec koeficienta nagibax 1 , x 2 , …, x n je število, ki je enako razmerju osrednjega vzorčevalnega momenta tretjega reda do kocke standardnega odklona S:

Od in , potem je koeficient asimetrije izražen v smislu osrednjih momentov z naslednjo formulo:

To daje formulo, ki izraža koeficient asimetrije v smislu začetnih trenutkov:

kar olajša praktične izračune.

Ustrezna teoretična značilnost se uvede s pomočjo teoretičnih točk.

Opredelitev 2.23 Koeficient asimetrije naključne spremenljivkeXpoklical številkoenako razmerju osrednjega trenutka tretjega redana kocko standardnega odklona:

Če ima naključna spremenljivka X simetrično porazdelitev glede na matematično pričakovanje μ, potem je njen teoretični koeficient poševnosti 0, če pa je porazdelitev verjetnosti asimetrična, potem koeficient poševnosti ni nič. Pozitivna vrednost koeficienta nagiba kaže, da se večina vrednosti naključne spremenljivke nahaja desno od matematičnega pričakovanja, torej je desna veja krivulje gostote verjetnosti bolj podolgovata kot leva. Negativna vrednost koeficienta nagiba kaže, da se daljši del krivulje nahaja na levi strani. Ta izjava je prikazana na naslednji sliki.

Slika 2.1 - Pozitivna in negativna asimetrija

distribucije

Primer 2.29 Poiščimo vzorčni koeficient asimetrije glede na študijo stresnih situacij iz primera 2.28.

Z uporabo predhodno izračunanih vrednosti osrednjih momentov vzorčenja dobimo

.

Zaokroženo = 0,07. Ugotovljena vrednost, ki ni enaka nič, koeficienta poševnosti kaže na poševnino porazdelitve glede na srednjo vrednost. Pozitivna vrednost označuje, da je daljša veja krivulje gostote verjetnosti na desni.

Za značilnosti porazdelitve vrednosti naključne spremenljivke okoli njenih načinov modalne vrednosti X je značilna naslednja konstanta.

Opredelitev 2.24 Vzorčenje kurtozex 1 , x 2 , …, x npoklical številko , enako

,

kje- selektivni osrednji moment četrtega reda,

S 4 - četrta stopnja standardaodstopanjaS.

Teoretični koncept kurtoze je analogen selektivni kurtozi.

Opredelitev 2.25 S kurtozo naključne spremenljivkeXpoklical številko e, enako

,

kjeteoretična osrednja točka četrtega reda,

četrta stopnja standardnega odklona.

Pomen kurtoze e označuje relativno strmino vrha krivulje porazdelitvene gostote okoli največje točke. Če je kurtoza pozitivno število, ima ustrezna porazdelitvena krivulja ostrejši vrh. Porazdelitev z negativno kurtozo ima bolj gladek in bolj raven vrh. Naslednja slika prikazuje možne primere.

Slika 2.2 - Porazdelki s pozitivnimi, ničelnimi in negativnimi vrednostmi kurtoze

Asimetrijo izračuna funkcija SKOS. Njegov argument je obseg celic s podatki, na primer = RMS (A1: A100), če so podatki v območju celic od A1 do A100.

Kurtozo izračuna funkcija EXCESS, katere argument so numerični podatki, ki so praviloma podani v obliki intervala celic, na primer: = EXCESS (A1: A100).

§2.3. Orodje za analizo Opisna statistika

V Excel z orodjem za analizo je mogoče hkrati izračunati vse točkovne značilnosti vzorca Opisna statistika ki je vsebovan v Paket analiz.

Opisna statistika ustvari tabelo osnovnih statistik za nabor podatkov. Ta tabela bo vsebovala naslednje značilnosti: povprečje, standardna napaka, varianca, standardni odklon, način, mediana, obseg variacije intervala, največje in najmanjše vrednosti, nagnjenost, kurtoza, velikost populacije, vsota vseh elementov populacije, interval zaupanja (stopnja zanesljivosti ). Orodje Opisna statistika močno poenostavi statistično analizo, saj odpravlja potrebo po klicu vsake funkcije za izračun statističnih značilnosti posebej.

Če želite poklicati Opisna statistika, sledi:

1) v meniju Storitev izberite ekipo Analiza podatkov;

2) na seznamu Orodja za analizo pogovorno okno Analiza podatkov izberite orodje Opisna statistika in pritisnite V REDU.

V oknu Opisna statistika potrebno:

· V skupini Vnos podatkov na terenu Vnosni interval določite obseg celic, ki vsebujejo podatke;

Če prva vrstica v obsegu vnosa vsebuje naslov stolpca, potem v polje Oznake v prvi vrstici potrdite polje;

· V skupini Izhodne možnosti aktivirajte stikalo (potrdite polje) Povzetek statistikeče potrebujete celoten seznam značilnosti;

Aktivirajte stikalo Stopnja zanesljivosti in navedite zanesljivost v%, če je potrebno izračunati interval zaupanja (privzeto je zanesljivost 95%). Kliknite V REDU.

Posledično se prikaže tabela z izračunanimi vrednostmi zgornjih statističnih značilnosti. Takoj, ne da bi počistili izbiro te tabele, zaženite ukaz Oblika® Stolpec® Širina samodejnega prilagajanja.

Pogled pogovornega okna Opisna statistika:

Praktične naloge

2.1. Izračun osnovne statistike točk s standardnimi funkcijami Excel

Isti voltmeter je 25 -krat izmeril napetost v vezju. Kot rezultat poskusov smo dobili naslednje vrednosti napetosti v voltih:

32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35,

34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30.

Poiščite povprečje, vzorčeno in popravljeno varianco, standardni odklon, obseg, način, srednjo vrednost. Preverite odstopanje od normalne porazdelitve z izračunom nagiba in kurtoze.

Za dokončanje te naloge opravite naslednje korake.

1. Rezultate poskusa vnesite v stolpec A.

2. V celico B1 vnesite »Povprečje«, v B2 - »Izbrano odstopanje«, v B3 - »Standardni odklon«, v B4 - »Popravljeno odstopanje«, v B5 - »Popravljeno standardno odstopanje«, v B6 - »Največje« , v B7 - "Minimum", v B8 - "Območje variacije", v B9 - "Način", v B10 - "Mediana", v B11 - "Asimetrija", v B12 - "Presežek".

3. Poravnajte širino tega stolpca z Samodejno prilagodi premer.

4. Izberite celico C1 in kliknite gumb z znakom "=" v vrstici s formulo. Z uporabo Čarovniki za funkcije v kategoriji Statistični poiščite funkcijo AVERAGE, označite obseg podatkovnih celic in pritisnite V REDU.

5. Izberite celico C2 in kliknite znak = v vrstici s formulo. Z uporabo Čarovniki za funkcije v kategoriji Statistični poiščite funkcijo VARP, nato označite obseg podatkovnih celic in pritisnite V REDU.

6. Enako naredite sami, da izračunate preostale lastnosti.

7. Za izračun obsega variacije v celici C8 vnesite formulo: = C6-C7.

8. Pred svojo tabelo dodajte eno vrstico, v katero vnesite naslove ustreznih stolpcev: "Ime lastnosti" in "Številčne vrednosti".



 


Preberite:



Ikona iz štirih delov, ikone Matere Božje Mehčanje zlih src (Czestochowa), Pomiritev mojih žalosti, Reševanje trpljenja zaradi težav, Obnova izgubljenih

Ikona iz štirih delov, ikone Matere Božje Mehčanje zlih src (Czestochowa), Pomiritev mojih žalosti, Reševanje trpljenja zaradi težav, Obnova izgubljenih

Tej ikoni je priložen dokument - pregled Nacionalnega raziskovalnega inštituta za pregled in oceno predmetov zgodovine in kulture ...

Izbira barve ni lahka naloga Črna je vedno pomembna

Izbira barve ni lahka naloga Črna je vedno pomembna

iPhone 6 še zdaleč ni novost, a povpraševanje po njem niti ne pomisli, da bo v vrhunskih pametnih telefonih zdržalo še nekaj let, postopoma postajalo cenejše ...

Otrok vsak dan kolca

Otrok vsak dan kolca

Ko dojenček kolca, se sliši srčkano in sladko, vendar vas to skrbi. Ko je mama hodila v položaju, je njen otrok že kolcal. Vse...

Kako izbrati ikono po imenu in datumu rojstva Ikone za moške po imenu sergey

Kako izbrati ikono po imenu in datumu rojstva Ikone za moške po imenu sergey

Najpomembnejši nebeški pokrovitelji Sergejevih so ustanovitelj Trojice -Sergijeve lavre, Sergije iz Radoneža - enega najbolj ljubljenih in ...

feed-image Rss