Dom - Ne radi se o obnovi
Testiranje hipoteze o beznačajnosti asimetrije i kurtoze. Asimetrija i kurtoza u raspodjeli slučajne varijable. Procjena materijalnosti asimetrije

Definicija. Moda M 0 diskretna slučajna varijabla naziva se njezina najvjerojatnija vrijednost. Za kontinuiranu slučajnu varijablu način je vrijednost slučajne varijable pri kojoj gustoća distribucije ima maksimum.

Ako distribucijski poligon za diskretnu slučajnu varijablu ili distribucijska krivulja za kontinuiranu slučajnu varijablu ima dva ili više maksimuma, tada se takva raspodjela naziva bimodalni ili multimodalni.

Ako distribucija ima minimum, ali nema maksimum, tada se naziva antimodalno.

Definicija. Medijan M D slučajne varijable X naziva se njezina vrijednost u odnosu na koju je jednako vjerojatno da se dobije veća ili manja vrijednost slučajne varijable.

Geometrijski, medijana je apscisa točke u kojoj se područje omeđeno distribucijskom krivuljom prepolovi.

Imajte na umu da ako je distribucija unimodalna, tada se način i medijana podudaraju s matematičkim očekivanjima.

Definicija. Polazište narudžba k slučajna varijabla X naziva se matematičko očekivanje vrijednosti X k .

Za diskretnu slučajnu varijablu :.

.

Početni trenutak prvog reda jednak je matematičkom očekivanju.

Definicija. Središnja točka narudžba k slučajna varijabla X naziva se matematičko očekivanje vrijednosti

Za diskretnu slučajnu varijablu: .

Za kontinuiranu slučajnu varijablu: .

Središnji moment prvog reda uvijek je nula, a središnji moment drugog reda jednak je varijanci. Središnji trenutak trećeg reda karakterizira asimetriju distribucije.

Definicija. Naziva se omjer središnjeg momenta trećeg reda prema standardnoj devijaciji trećeg stupnja koeficijent asimetrije.

Definicija. Kako bi se okarakterizirala vrhunac i ravnost distribucije, potrebna je količina tzv kurtosis.

Osim razmatranih količina, koriste se i takozvani apsolutni momenti:

Apsolutno polazište :.

Apsolutna središnja točka: .

Kvantil odgovara datoj razini vjerojatnosti R, naziva se takva vrijednost pri kojoj funkcija raspodjele poprima vrijednost jednaku R, tj. gdje R- zadanu razinu vjerojatnosti.

Drugim riječima kvantil postoji vrijednost slučajne varijable pri kojoj

Vjerojatnost R dati kao postotak, daje naziv odgovarajućem kvantilu, na primjer, naziva se kvantil od 40%.

20. Matematičko očekivanje i varijacija broja pojavljivanja događaja u neovisnim pokusima.

Definicija. Matematičko očekivanje kontinuirana slučajna varijabla X, čije moguće vrijednosti pripadaju intervalu, naziva se određeni integral

Ako se moguće vrijednosti slučajne varijable razmotre na cijeloj numeričkoj osi, tada se matematičko očekivanje nalazi po formuli:

Naravno, u ovom slučaju se pretpostavlja da nepravilni integral konvergira.

Matematičko očekivanje diskretna slučajna varijabla zbroj je umnožaka njezinih mogućih vrijednosti prema odgovarajućim vjerojatnostima:

M(NS) =NS 1 R 1 +NS 2 R 2 + … +NS NS R NS . (7.1)

Ako je broj mogućih vrijednosti slučajne varijable beskonačan, tada
ako se rezultirajući niz apsolutno konvergira.

Napomena 1. Matematičko očekivanje ponekad se naziva prosječne težine, budući da je približno jednaka aritmetičkoj sredini promatranih vrijednosti slučajne varijable za veliki broj pokusa.

Napomena 2. Iz definicije matematičkog očekivanja proizlazi da njegova vrijednost nije manja od najmanje moguće vrijednosti slučajne varijable i ne veća od najveće.

Napomena 3. Matematičko očekivanje diskretne slučajne varijable je nema slučajnosti(konstantno. U nastavku ćemo vidjeti da isto vrijedi i za kontinuirane slučajne varijable.

Svojstva matematičkih očekivanja.

    Matematičko očekivanje konstante jednako je najvećoj konstanti:

M(S) =S.(7.2)

Dokaz. S obzirom S kao diskretna slučajna varijabla koja uzima samo jednu vrijednost S s vjerojatnošću R= 1, onda M(S) =S 1 = S.

    Konstantan faktor može se izvaditi iz predznaka matematičkog očekivanja:

M(SH) =CM(NS). (7.3)

Dokaz. Ako je slučajna varijabla NS dan distribucijskom serijom

x i

x n

str i

str n

zatim distribucijske serije za SH izgleda kao:

Sx i

Sx 1

Sx 2

Sx n

str i

str n

Zatim M(SH) =Cx 1 R 1 +Cx 2 R 2 + … +Cx NS R NS =S(NS 1 R 1 +NS 2 R 2 + … +NS NS R NS) =CM(NS).

Matematičko očekivanje naziva se kontinuirana slučajna varijabla

(7.13)

Napomena 1. Opća definicija varijance za kontinuiranu slučajnu varijablu ista je kao i za diskretnu (def. 7.5), a formula za njezin izračun ima oblik:

(7.14)

Standardna devijacija izračunava se formulom (7.12).

Napomena 2. Ako sve moguće vrijednosti kontinuirane slučajne varijable ne prelaze interval [ a, b], tada se u tim granicama izračunavaju integrali u formulama (7.13) i (7.14).

Teorema. Varijansa broja pojavljivanja događaja u neovisnim ispitivanjima jednaka je umnošku broja pokusa na vjerojatnost pojavljivanja i nepojavljivanja događaja u jednom ispitivanju :.

Dokaz. Dopustiti je broj pojavljivanja događaja u neovisnim ispitivanjima. Jednako je zbroju događaja u svakom ispitivanju :. Budući da su testovi neovisni, tada su slučajne varijable - neovisni su, dakle.

Kao što je gore prikazano, i.

Zatim, dok .

U ovom slučaju, kao što je ranije spomenuto, standardna devijacija.

58. Koeficijenti asimetrije i kurtoze.

Središnji momenti distribucije

Za daljnje proučavanje prirode varijacije koriste se prosječne vrijednosti različitih stupnjeva odstupanja pojedinih vrijednosti atributa od njegove aritmetičke sredine. Ti se pokazatelji nazivaju žarišta raspodjele redoslijeda koji odgovaraju stupnju do kojeg su odstupanja porasla, ili jednostavno trenuci.

Pokazatelji obrasca distribucije

Asimetrija distribucije


Pearsonov eksponent ovisi o stupnju asimetrije u srednjem dijelu distribucijskog niza, a indeks asimetrije, temeljen na momentu trećeg reda, o ekstremnim vrijednostima značajke.

Procjena materijalnosti asimetrije

Za procjenu značaja asimetrije izračunava se srednja kvadratna pogreška koeficijenta asimetrije

Ako stav ima vrijednost veću od 2, to ukazuje na značajnu prirodu asimetrije

Distribucijska kurtoza

Pokazatelj kurtoze
predstavlja odstupanje vrha empirijske distribucije gore ili dolje ("hladnoća") od vrha normalne krivulje raspodjele, ALI! Grafikon raspodjele može izgledati proizvoljno strmo, ovisno o jačini varijacije svojstva: što je varijacija slabija, to je krivulja raspodjele strmija na određenom mjerilu. Da ne spominjemo činjenicu da se promjenom mjerila po osi apscisa i ordinata bilo koja raspodjela može umjetno učiniti "strmom" i "ravnom". Da bi se pokazalo u čemu se sastoji distribucijska kurtoza i kako bi se to ispravno protumačilo, potrebno je usporediti nizove s istom jakošću varijacije (istu vrijednost σ) i različitim indeksima kurtoze. Kako se kurtoza ne bi zamijenila s asimetrijom, svi uspoređeni redovi moraju biti simetrični. Ta je usporedba prikazana na Sl.

Budući da je kurtoza normalne distribucije 3, indeks kurtoze izračunava se formulom


Procjena materijalnosti kurtoze

Kako bi se procijenio značaj kurtoze, izračunava se pokazatelj njezine srednje-kvadratne pogreške

Ako stav ima vrijednost veću od 3, onda to ukazuje na značajnu prirodu viška

Koeficijent asimetrije prikazuje "iskrivljenost" distribucijske serije u odnosu na središte:

gdje je središnji trenutak trećeg reda;

- kocka standardne devijacije.

Za ovu metodu izračuna: if, distribucija je desno (pozitivna asimetrija), if, distribucija je lijeva (negativna asimetrija)

Osim središnjeg trenutka, asimetrija se može izračunati pomoću moda ili medijane:

ili, (6.69)

Za ovu metodu izračuna: ako u distribuciji postoji desna strana (pozitivna asimetrija), ako u distribuciji postoji lijeva strana (negativna asimetrija) (slika 4).


Riža. 4. Asimetrične raspodjele

Vrijednost koja pokazuje "strmost" distribucije naziva se kurtosis:

Ako u distribuciji postoji vrhunac - kurtoza je pozitivna ako u distribuciji postoji ravnost - kurtoza je negativna (slika 5).

Riža. 5. Viškovi distribucije

Primjer 5. Postoje podaci o broju ovaca na područnim farmama (Tablica 9).

1. Prosječan broj ovaca po domaćinstvu.

3. Medijan.

4. Pokazatelji varijacije

Varijansa;

· Standardna devijacija;

· Koeficijent varijacije.

5. Pokazatelji asimetrije i kurtoze.

Riješenje.

1. Budući da se vrijednost opcija u agregatu ponavlja nekoliko puta, s određenom učestalošću za izračun prosječne vrijednosti, koristimo formulu ponderirane aritmetičke sredine:

2. Ovaj je red diskretan, pa će način rada biti opcija s najvećom frekvencijom -.

3. Ovaj niz je paran, u ovom slučaju medijana za diskretni niz se nalazi po formuli:

Odnosno, polovica kućanstava u anketiranoj populaciji ima broj ovaca do 4,75 tisuća grla. i upola više od ovog broja.

4. Za izračun pokazatelja varijacije sastavit ćemo tablicu 10, u kojoj ćemo izračunati odstupanja, kvadrate tih odstupanja, izračun se može provesti i pomoću jednostavnih i ponderiranih izračunskih formula (u primjeru koristimo jednostavnu jedan):

Tablica 10

2,00 -2,42 5,84
2,50 -1,92 3,67
2,50 -1,92 3,67
3,00 -1,42 2,01
3,00 -1,42 2,01
4,00 -0,42 0,17
5,50 1,08 1,17
5,50 1,08 1,17
5,50 1,08 1,17
6,00 1,58 2,51
6,50 2,08 4,34
7,00 2,58 6,67
Ukupno 53,00 0,00 34,42
Prosječno 4,4167

Izračunajmo varijansu:

Izračunajmo standardnu ​​devijaciju:

Izračunajmo koeficijent varijacije:

5. Za izračun pokazatelja asimetrije i kurtoze konstruiramo tablicu 11 u kojoj izračunavamo ,,

Tablica 11

2,00 -2,42 -14,11 34,11
2,50 -1,92 -7,04 13,50
2,50 -1,92 -7,04 13,50
3,00 -1,42 -2,84 4,03
3,00 -1,42 -2,84 4,03
4,00 -0,42 -0,07 0,03
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
6,00 1,58 3,97 6,28
6,50 2,08 9,04 18,84
7,00 2,58 17,24 44,53
Ukupno 53,00 0,00 0,11 142,98
Prosječno 4,4167

Asimetrija distribucije jednaka je:

Odnosno, uočava se lijeva asimetrija, što potvrđuje izračun prema formuli:

U ovom slučaju, što za ovu formulu također označava lijevu asimetriju

Kurtoza distribucije jednaka je:

U našem slučaju kurtoza je negativna, odnosno opaža se ravnost.

Primjer 6... Za farmu su prikazani podaci o plaćama radnika (tab. 12)

Riješenje.

Za intervalne varijacijske nizove način se izračunava formulom:

gdje modalni interval - interval s najvećom frekvencijom, u našem slučaju 3600-3800, s frekvencijom

Minimalna granica modalnog intervala (3600);

Vrijednost modalnog intervala (200);

Učestalost intervala koji prethodi modalnom intervalu (25);

Učestalost sljedećeg modalnog intervala (29);

Frekvencija modalnih intervala (68).

Tablica 12

Za intervalnu varijacijsku seriju medijana se izračunava formulom:

gdje srednji interval ovo je interval čija je kumulativna (akumulirana) frekvencija jednaka ili veća od polovice zbroja frekvencija, u našem primjeru je 3600-3800.

Minimalna granica medijalnog intervala (3600);

Vrijednost medijalnog intervala (200);

Zbroj frekvencija serije (154);

Zbroj akumuliranih frekvencija, svi intervali koji prethode medijani (57);

Je li učestalost medijalnog intervala (68).

Primjer 7. Za tri farme u jednoj regiji postoje podaci o kapitalnom intenzitetu proizvodnje (broj troškova stalnih sredstava po 1 rublji proizvedenih proizvoda): I - 1,29 rubalja, II - 1,32 rubalja, III - 1,27 rubalja. Potrebno je izračunati prosječni kapitalni intenzitet.

Riješenje... Budući da je intenzitet kapitala obrnuti pokazatelj prometa kapitala, koristimo se formulom jednostavnog harmonijskog prosjeka.

Primjer 8. Za tri farme u jednoj regiji postoje podaci o bruto berbi žitarica i prosječnom prinosu (Tablica 13).

Riješenje... Izračun prosječnog prinosa po aritmetičkoj sredini nemoguć je, jer nema podataka o broju zasijanih površina, pa se za harmonički ponderirani prosjek koristimo formulom:

Primjer 9. Postoje podaci o prosječnom prinosu krumpira na pojedinim parcelama i broju brežuljaka (tablica 14)

Tablica 14

Skupimo podatke (tablica 15):

Tablica 15

Grupiranje parcela prema "broju korova"

1. Izračunajmo ukupnu varijansu uzorka (tablica 16).

2.6 Asimetrija i kurtoza

U matematičkoj statistici, kako bi se doznao geometrijski oblik gustoće vjerojatnosti slučajne varijable, koriste se dvije numeričke karakteristike povezane sa središnjim momentima trećeg i četvrtog reda.

Definicija 2.22 Koeficijent iskrivljenosti uzorkax 1 , x 2 , …, x n je broj jednak omjeru središnjeg momenta uzorkovanja trećeg reda prema kocki standardne devijacije S:

Budući da i , tada se koeficijent asimetrije izražava u smislu središnjih momenata sljedećom formulom:

To daje formulu koja izražava koeficijent asimetrije u smislu početnih momenata:

što olakšava praktične izračune.

Odgovarajuća teorijska karakteristika uvodi se uz pomoć teoretskih točaka.

Definicija 2.23 Koeficijent asimetrije slučajne varijablexpozvao brojjednak omjeru središnjeg momenta trećeg redana kocku standardne devijacije:

Ako slučajna varijabla X ima simetričnu raspodjelu u odnosu na matematičko očekivanje μ, tada je njezin teorijski koeficijent iskrivljenosti 0, ako je raspodjela vjerojatnosti asimetrična, tada je koeficijent iskrivljenosti različit od nule. Pozitivna vrijednost koeficijenta iskrivljenosti ukazuje na to da se većina vrijednosti slučajne varijable nalazi desno od matematičkog očekivanja, odnosno da je desna grana krivulje gustoće vjerojatnosti produženija od lijeve. Negativna vrijednost koeficijenta iskrivljenosti ukazuje da se duži dio krivulje nalazi lijevo. Ova izjava ilustrirana je na sljedećoj slici.

Slika 2.1 - Pozitivna i negativna asimetrija

distribucije

Primjer 2.29 Pronađimo koeficijent uzorka asimetrije prema proučavanju stresnih situacija iz primjera 2.28.

Koristeći prethodno izračunate vrijednosti središnjih momenata uzorkovanja, dobivamo

.

Zaokruženo = 0,07. Nađena vrijednost različita od nule koeficijenta iskrivljenosti pokazuje iskrivljenost distribucije u odnosu na srednju vrijednost. Pozitivna vrijednost označava da je dulja grana krivulje gustoće vjerojatnosti s desne strane.

Značajke raspodjele vrijednosti slučajne varijable oko načina rada s modalnom vrijednošću X karakteriziraju sljedeća konstanta.

Definicija 2.24 Uzorkovanje kurtozex 1 , x 2 , …, x npozvao broj , jednak

,

gdje- selektivni središnji trenutak četvrtog reda,

S 4 - četvrti stupanj standardaodstupanjaS.

Teorijski koncept kurtoze analogan je selektivnoj kurtozi.

Definicija 2.25 Kurtozom slučajne varijablexpozvao broj e, jednak

,

gdjeteorijska središnja točka četvrtog reda,

četvrti stupanj standardne devijacije.

Značenje kurtoze e karakterizira relativnu strminu vrha krivulje distribucijske gustoće oko maksimalne točke. Ako je kurtoza pozitivan broj, tada odgovarajuća krivulja distribucije ima oštriji vrh. Raspodjela s negativnom kurtozom ima glatkiji i ravniji vrh. Sljedeća slika prikazuje moguće slučajeve.

Slika 2.2 - Raspodjela s pozitivnom, nultom i negativnom vrijednošću kurtoze

Asimetrija se izračunava pomoću funkcije SKOS. Njegov argument je raspon ćelija s podacima, na primjer = RMS (A1: A100) ako su podaci sadržani u rasponu ćelija od A1 do A100.

Kurtoza se izračunava pomoću funkcije EXCESS, čiji je argument numerički podatak, naveden u pravilu u obliku intervala ćelija, na primjer: = VIŠINA (A1: A100).

§2.3. Alat za analizu Opisne statistike

V. Excel moguće je odjednom izračunati sve točke značajke uzorka pomoću alata za analizu Opisne statistike koji je sadržan u Paket analiza.

Opisne statistike stvara tablicu osnovnih statistika za skup podataka. Ova će tablica sadržavati sljedeće karakteristike: srednja vrijednost, standardna pogreška, varijansa, standardna devijacija, način rada, medijana, raspon varijacija intervala, maksimalne i minimalne vrijednosti, nagib, kurtoza, veličina populacije, zbroj svih elemenata populacije, interval pouzdanosti (razina pouzdanosti ). Alat Opisne statistike uvelike pojednostavljuje statističku analizu eliminirajući potrebu pozivanja svake funkcije za zasebno izračunavanje statističkih karakteristika.

Da biste nazvali Opisne statistike, slijedi:

1) u izborniku Servis izabrati tim Analiza podataka;

2) na popisu Alati za analizu dijaloški okvir Analiza podataka izabrati alat Opisne statistike i pritisnite U REDU.

U prozoru Opisne statistike potrebno:

· U grupi Ulazni podaci na terenu Ulazni interval odrediti raspon ćelija koje sadrže podatke;

Ako prvi redak u rasponu unosa sadrži naslov stupca, tada u polje Labels u prvom retku potvrdite okvir;

· U grupi Opcije izlaza aktivirajte prekidač (označite okvir) Zbirna statistika ako trebate potpuni popis karakteristika;

Aktivirajte prekidač Razina pouzdanosti i naznačite pouzdanost u% ako je potrebno izračunati interval pouzdanosti (prema zadanim postavkama pouzdanost je 95%). Klik U REDU.

Kao rezultat toga, pojavit će se tablica s izračunatim vrijednostima gornjih statističkih karakteristika. Odmah, bez brisanja odabira ove tablice, pokrenite naredbu Format® Stupac® Širina automatskog prilagođavanja.

Prikaz dijaloškog okvira Opisne statistike:

Praktični zadaci

2.1. Izračun osnovne statistike bodova pomoću standardnih funkcija Excel

Isti je voltmetar mjerio napon u krugu 25 puta. Kao rezultat pokusa dobivene su sljedeće vrijednosti napona u voltima:

32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35,

34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30.

Pronađite srednju vrijednost, uzorkovanu i ispravljenu varijansu, standardnu ​​devijaciju, raspon, način rada, medijanu. Provjerite odstupanje od normalne raspodjele izračunavanjem iskrivljenosti i kurtoze.

Dovršite sljedeće korake da biste dovršili ovaj zadatak.

1. Upišite rezultate eksperimenta u stupac A.

2. U ćeliju B1 upišite "Prosjek", u B2 - "Odabrana varijansa", u B3 - "Standardna devijacija", u B4 - "Ispravljena varijansa", u B5 - "Ispravljena standardna devijacija", u B6 - "Maksimalna" , u B7 - "Minimum", u B8 - "Raspon varijacije", u B9 - "Način rada", u B10 - "Medijan", u B11 - "Asimetrija", u B12 - "Višak".

3. Poravnajte širinu ovog stupca s Automatsko prilagođavanješirina.

4. Odaberite ćeliju C1 i kliknite gumb sa znakom "=" na traci s formulama. Pomoću Čarobnjaci za funkcije u kategoriji Statistički pronađite funkciju AVERAGE, zatim označite raspon ćelija podataka i pritisnite U REDU.

5. Odaberite ćeliju C2 i kliknite znak = na traci s formulama. Pomoću Čarobnjaci za funkcije u kategoriji Statistički pronađite funkciju VARP, zatim označite raspon ćelija podataka i pritisnite U REDU.

6. Učinite isto za sebe kako biste izračunali ostale karakteristike.

7. Za izračun raspona varijacije u ćeliji C8, unesite formulu: = C6-C7.

8. Dodajte jedan redak ispred tablice u koji upišite naslove odgovarajućih stupaca: "Naziv karakteristika" i "Numeričke vrijednosti".



 


Čitati:



Ikona iz četiri dijela, ikone Majke Božje Umirujuća zla srca (Czestochowa), Smiri moje tuge, Izbavljanje patnje od nevolja, Vraćanje izgubljenih

Ikona iz četiri dijela, ikone Majke Božje Umirujuća zla srca (Czestochowa), Smiri moje tuge, Izbavljanje patnje od nevolja, Vraćanje izgubljenih

Ovoj ikoni priložen je dokument - pregled Nacionalnog istraživačkog instituta za ispitivanje i procjenu predmeta povijesti i kulture ...

Odabir boje nije lak zadatak Crna je uvijek relevantna

Odabir boje nije lak zadatak Crna je uvijek relevantna

iPhone 6 daleko je od novosti, ali potražnja za njim ni ne misli padati, već će se izdržati u vrhu pametnih telefona još nekoliko godina, postupno postajući sve jeftiniji ...

Beba štuca svaki dan

Beba štuca svaki dan

Kad beba štuca zvuči slatko i slatko, ali vi ste zabrinuti zbog toga. Kad je mama hodala u položaju, njezino je dijete već štucalo. Sve...

Kako odabrati ikonu prema imenu i datumu rođenja Ikone za muškarce po imenu sergey

Kako odabrati ikonu prema imenu i datumu rođenja Ikone za muškarce po imenu sergey

Najvažniji nebeski zaštitnici Sergejeva su utemeljitelj Trojice -Sergijeve lavre, Sergije Radoneški - jedan od najomiljenijih i ...

feed-image Rss