Dom - Mogu sam popraviti
Standardna devijacija se mjeri u. Disperzija: opća, ogledna, ispravljena

Kod statističkog testiranja hipoteza, kod mjerenja linearnog odnosa između slučajnih varijabli.

Srednji standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable Pod, zidovi oko nas i strop, x u vezi s njom matematičko očekivanje na temelju nepristrane procjene njegove varijance):

gdje je - varijanca; - Pod, zidovi oko nas i strop, ja-th element uzorka; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrane. U opći slučaj nemoguće je konstruirati nepristranu procjenu. Međutim, procjena temeljena na nepristranoj procjeni varijance je dosljedna.

pravilo tri sigme

pravilo tri sigme() - gotovo sve vrijednosti normalno distribuirane slučajne varijable leže u intervalu . Strože rečeno – s ne manjom sigurnošću od 99,7%, vrijednost normalno distribuirane slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita, a ne dobivena kao rezultat obrade uzorka).

Ako je prava vrijednost nepoznata, onda ne treba koristiti, nego pod, zidove oko nas i strop, s. Tako se pravilo tri sigme prevodi u pravilo tri poda, zidova oko nas i stropa, s .

Tumačenje vrijednosti standardne devijacije

Velika vrijednost standardne devijacije pokazuje veliki raspon vrijednosti u prikazanom skupu s prosječnom vrijednošću skupa; mala vrijednost, odnosno, označava da su vrijednosti u skupu grupirane oko prosječne vrijednosti.

Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti od 7 i standardne devijacije od 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju jer su vrijednosti u skupu grupirane oko prosjeka; prvi set ima najviše veliki značaj standardna devijacija - vrijednosti unutar skupa jako odstupaju od srednje vrijednosti.

U općem smislu, standardna devijacija se može smatrati mjerom nesigurnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje pogreške niza uzastopnih mjerenja neke veličine. Ova je vrijednost vrlo važna za određivanje vjerodostojnosti fenomena koji se proučava u usporedbi s vrijednošću koju predviđa teorija: ako se srednja vrijednost mjerenja jako razlikuje od vrijednosti predviđenih teorijom (velika standardna devijacija), tada dobivene vrijednosti ili način njihova dobivanja treba ponovno provjeriti.

Praktična upotreba

U praksi, standardna devijacija vam omogućuje da odredite koliko se vrijednosti u skupu mogu razlikovati od prosječne vrijednosti.

Klima

Pretpostavimo da postoje dva grada s istom prosječnom dnevnom maksimalnom temperaturom, ali se jedan nalazi na obali, a drugi u unutrašnjosti. Poznato je da obalni gradovi imaju mnogo različitih dnevnih maksimalnih temperatura nižih od gradova u unutrašnjosti. Stoga će standardna devijacija maksimalnih dnevnih temperatura u obalnom gradu biti manja nego u drugom gradu, unatoč tome što imaju istu prosječnu vrijednost te vrijednosti, što u praksi znači da je vjerojatnost da maksimalna temperatura zraka od svaki pojedini dan u godini će se jače razlikovati od prosječne vrijednosti, više za grad unutar kontinenta.

Sport

Pretpostavimo da postoji nekoliko nogometnih momčadi koje su rangirane prema nekom skupu parametara, na primjer, broju postignutih i primljenih golova, prilikama za postizanje pogotka itd. Najvjerojatnije je da će najbolja momčad u ovoj skupini imati najbolje vrijednosti Po više parametri. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji, takvi timovi su uravnoteženiji. S druge strane, ekipa sa velika vrijednost standardna devijacija, teško je predvidjeti rezultat, što se pak objašnjava neravnotežom, npr. jaka obrana, ali slab napad.

Korištenje standardne devijacije parametara momčadi omogućuje predviđanje rezultata utakmice između dvije momčadi u određenoj mjeri, procjenjujući snagu i slabe strane zapovijedi, a time i odabrane metode borbe.

Tehnička analiza

vidi također

Književnost

* Borovikov, V. STATISTIKA. Umjetnost računalne analize podataka: Za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

U ovom ću članku govoriti o kako pronaći standardnu ​​devijaciju. Ovaj materijal je izuzetno važan za potpuno razumijevanje matematike, tako da nastavnik matematike treba posvetiti zasebnu lekciju ili čak nekoliko za njegovo proučavanje. U ovom ćete članku pronaći poveznicu na detaljan i razumljiv video vodič koji objašnjava što je standardna devijacija i kako je pronaći.

standardna devijacija omogućuje procjenu raspona vrijednosti dobivenih kao rezultat mjerenja određenog parametra. Označava se simbolom (grčko slovo "sigma").

Formula za izračun je prilično jednostavna. Da biste pronašli standardnu ​​devijaciju, trebate izvaditi kvadratni korijen varijance. Dakle, sada morate pitati: "Što je varijanca?"

Što je disperzija

Definicija varijance je sljedeća. Disperzija je aritmetička sredina kvadrata odstupanja vrijednosti od sredine.

Da biste pronašli varijancu, izvršite sljedeće izračune uzastopno:

  • Odredite srednju vrijednost (jednostavnu aritmetičku sredinu niza vrijednosti).
  • Zatim od svake vrijednosti oduzmite prosjek i kvadrirajte dobivenu razliku (dobili smo razlika na kvadrat).
  • Sljedeći korak je izračunavanje aritmetičke sredine kvadrata dobivenih razlika (zašto su točno kvadrati možete saznati u nastavku).

Pogledajmo primjer. Recimo da vi i vaši prijatelji odlučite izmjeriti visinu svojih pasa (u milimetrima). Kao rezultat mjerenja dobili ste sljedeće mjere visine (u grebenu): 600 mm, 470 mm, 170 mm, 430 mm i 300 mm.

Izračunajmo srednju vrijednost, varijancu i standardnu ​​devijaciju.

Prvo pronađimo prosjek. Kao što već znate, za ovo morate zbrojiti sve izmjerene vrijednosti i podijeliti s brojem mjerenja. Napredak izračuna:

Prosječni mm.

Dakle, prosjek (aritmetička sredina) je 394 mm.

Sada moramo definirati odstupanje visine svakog od pasa od prosjeka:

Konačno, za izračunavanje varijance, svaku od dobivenih razlika kvadriramo, a zatim nalazimo aritmetičku sredinu dobivenih rezultata:

Raspršenost mm 2 .

Dakle, disperzija je 21704 mm 2 .

Kako pronaći standardnu ​​devijaciju

Pa kako sada izračunati standardnu ​​devijaciju, znajući varijancu? Kao što se sjećamo, izvucite kvadratni korijen. Odnosno, standardna devijacija je:

mm (zaokruženo na najbliži cijeli broj u mm).

Koristeći ovu metodu, otkrili smo da su neki psi (npr. rotvajleri) vrlo veliki psi. Ali postoje i vrlo mali psi (na primjer, jazavčari, ali im to ne biste trebali reći).

Najzanimljivije je što standardna devijacija nosi korisna informacija. Sada možemo pokazati koji su od dobivenih rezultata mjerenja rasta unutar intervala koji dobijemo ako od prosjeka (s obje njegove strane) izdvojimo standardnu ​​devijaciju.

Odnosno, koristeći standardnu ​​devijaciju, dobivamo "standardnu" metodu koja vam omogućuje da saznate koja je od vrijednosti normalna (statistički prosjek), a koja je izuzetno velika ili, obrnuto, mala.

Što je standardna devijacija

Ali ... stvari će biti malo drugačije ako analiziramo uzorkovanje podaci. U našem smo primjeru razmotrili općoj populaciji. Odnosno, naših 5 pasa bili su jedini psi na svijetu koji su nas zanimali.

Ali ako su podaci uzorak (vrijednosti odabrane iz velike populacije), tada se izračuni moraju napraviti drugačije.

Ako postoje vrijednosti, tada:

Svi ostali izračuni rade se na isti način, uključujući i određivanje prosjeka.

Na primjer, ako je naših pet pasa samo uzorak populacije pasa (svi psi na planetu), moramo podijeliti s 4 umjesto 5 naime:

Varijanca uzorka = mm 2 .

U ovom slučaju, standardna devijacija za uzorak jednaka je mm (zaokruženo na najbliži cijeli broj).

Možemo reći da smo napravili neke "ispravke" u slučaju kada su naše vrijednosti samo mali uzorak.

Bilješka. Zašto baš kvadrati razlika?

Ali zašto uzimamo kvadrate razlika kada računamo varijancu? Priznajmo da ste pri mjerenju nekog parametra dobili sljedeći skup vrijednosti: 4; 4; -4; -4. Ako samo zbrojimo apsolutna odstupanja od srednje (razlike) među sobom ... negativne vrijednosti se poništavaju s pozitivnima:

.

Ispostavilo se da je ova opcija beskorisna. Onda možda vrijedi isprobati apsolutne vrijednosti odstupanja (odnosno module tih vrijednosti)?

Na prvi pogled, ispada da nije loše (rezultirajuća vrijednost, usput, naziva se srednja apsolutna devijacija), ali ne u svim slučajevima. Pokušajmo s drugim primjerom. Neka rezultat mjerenja bude sljedeći skup vrijednosti: 7; 1; -6; -2. Tada je srednja apsolutna devijacija:

Wow! Ponovno smo dobili rezultat 4, iako su razlike znatno veće.

Pogledajmo sada što se događa ako kvadriramo razlike (a zatim izvadimo kvadratni korijen njihovog zbroja).

Za prvi primjer dobivate:

.

Za drugi primjer dobivate:

Sada je to sasvim druga stvar! Srednjekvadratno odstupanje je to veće što su razlike veće... čemu smo težili.

Zapravo, ova metoda koristi istu ideju kao kod izračuna udaljenosti između točaka, samo primijenjenu na drugačiji način.

A s matematičkog gledišta, korištenje kvadrata i kvadratnog korijena korisnije je nego što bismo mogli dobiti na temelju apsolutnih vrijednosti odstupanja, zbog čega je standardna devijacija primjenjiva na druge matematičke probleme.

Sergey Valerievich vam je rekao kako pronaći standardnu ​​devijaciju

Lekcija broj 4

Tema: “Opisna statistika. Pokazatelji raznolikosti svojstva u agregatu "

Glavni kriteriji za raznolikost svojstva u statističkoj populaciji su: granica, amplituda, standardna devijacija, koeficijent oscilacije i koeficijent varijacije. U prethodnoj lekciji raspravljalo se o tome da prosječne vrijednosti daju samo generalizirajuću karakteristiku proučavane osobine u agregatu i ne uzimaju u obzir vrijednosti njegovih pojedinačnih varijanti: minimalne i maksimalne vrijednosti, iznad prosjeka , ispod prosjeka itd.

Primjer. Prosječne vrijednosti dva različita brojčana niza: -100; -20; 100; 20 i 0,1; -0,2; 0,1 su potpuno isti i jednakiOKO.Međutim, rasponi raspršenosti podataka ovih relativnih srednjih nizova vrlo su različiti.

Definiranje navedenih kriterija za raznolikost svojstva prvenstveno se provodi uzimajući u obzir njegovu vrijednost za pojedine elemente statističke populacije.

Pokazatelji mjerenja varijacije svojstva su apsolutni I relativna. U apsolutne pokazatelje varijacije spadaju: raspon varijacije, granica, standardna devijacija, varijanca. Koeficijent varijacije i koeficijent oscilacije odnose se na relativne mjere varijacije.

Limit (lim)– ovo je kriterij koji je određen ekstremnim vrijednostima varijante u nizu varijacija. Drugim riječima, ovaj kriterij ograničen je minimalnim i maksimalnim vrijednostima atributa:

Amplituda (Am) ili raspon varijacija - ovo je razlika između krajnosti. Izračun ovog kriterija provodi se oduzimanjem njegove minimalne vrijednosti od maksimalne vrijednosti atributa, što omogućuje procjenu stupnja disperzije varijante:

Nedostatak limita i amplitude kao kriterija varijabilnosti je što u potpunosti ovise o ekstremnim vrijednostima svojstva u varijacijskom nizu. U ovom slučaju, fluktuacije u vrijednostima atributa unutar niza se ne uzimaju u obzir.

Najcjelovitiju karakterizaciju raznolikosti svojstva u statističkoj populaciji daje standardna devijacija(sigma), što je opća mjera odstupanja varijante od njezine srednje vrijednosti. Standardna devijacija se također često naziva standardna devijacija.

Osnova standardne devijacije je usporedba svake opcije s aritmetičkom sredinom ove populacije. Budući da će u agregatu uvijek biti opcija i manje i više od njega, tada će zbroj odstupanja s predznakom "" biti otplaćen zbrojem odstupanja s predznakom "", tj. zbroj svih odstupanja je nula. Da bi se izbjegao utjecaj predznaka razlika, uzimaju se odstupanja varijante od kvadrata aritmetičke sredine, tj. . Zbroj kvadrata odstupanja nije jednak nuli. Da biste dobili koeficijent koji može mjeriti varijabilnost, uzmite prosjek zbroja kvadrata - ta se vrijednost naziva disperzija:

Prema definiciji, varijanca je srednji kvadrat odstupanja pojedinačnih vrijednosti obilježja od njegove srednje vrijednosti. Disperzija kvadrat standardne devijacije .

Disperzija je dimenzionalna veličina (nazvana). Dakle, ako su varijante niza brojeva izražene u metrima, tada disperzija daje kvadratne metre; ako su varijante izražene u kilogramima, tada varijanca daje kvadrat ove mjere (kg 2), i tako dalje.

Standardna devijacija je kvadratni korijen varijance:

, tada pri izračunavanju varijance i standardne devijacije u nazivniku razlomka, umjestopotrebno je staviti.

Izračun standardne devijacije može se podijeliti u šest faza, koje se moraju provesti određenim redoslijedom:

Primjena standardne devijacije:

a) prosuditi kolebanje varijacijskih nizova i usporednu ocjenu tipičnosti (reprezentativnosti) aritmetičkih sredina. To je potrebno u diferencijalnoj dijagnozi pri određivanju stabilnosti znakova.

b) za rekonstrukciju varijacijskog niza, tj. obnavljanje njegovog frekvencijskog odziva na temelju pravila tri sigme. U intervalu (M±3σ) nalazi se 99,7% svih varijanti niza, u intervalu (M±2σ) - 95,5% iu intervalu (M±1σ) - 68,3% opcija reda(Sl. 1).

c) za prepoznavanje "skočnih" opcija

d) odrediti parametre norme i patologije pomoću sigma procjena

e) izračunati koeficijent varijacije

e) izračunati prosječnu grešku aritmetičke sredine.

Za karakterizaciju bilo koje opće populacije koja imatip normalne distribucije , dovoljno je znati dva parametra: aritmetičku sredinu i standardnu ​​devijaciju.

Slika 1. Pravilo tri sigme

Primjer.

U pedijatriji se standardna devijacija koristi za procjenu tjelesnog razvoja djece usporedbom podataka određenog djeteta s odgovarajućim standardnim pokazateljima. Kao standard uzeti su aritmetički srednji pokazatelji tjelesnog razvoja zdrave djece. Usporedba pokazatelja sa standardima provodi se prema posebnim tablicama, u kojima su navedeni standardi zajedno s pripadajućim sigma skalama. Smatra se da ako je pokazatelj tjelesnog razvoja djeteta unutar standarda (aritmetička sredina) ±σ, tada tjelesni razvoj dijete (prema ovom pokazatelju) odgovara normi. Ako je pokazatelj unutar standarda ±2σ, tada postoji malo odstupanje od norme. Ako pokazatelj prelazi ove granice, tada se fizički razvoj djeteta oštro razlikuje od norme (patologija je moguća).

Osim pokazatelja varijacije izraženih u apsolutnim vrijednostima, u statističkim istraživanjima koriste se i pokazatelji varijacije izraženi u relativnim vrijednostima. Koeficijent oscilacije - ovo je omjer raspona varijacije i prosječne vrijednosti svojstva. Koeficijent varijacije - ovo je omjer standardne devijacije i prosječne vrijednosti obilježja. Obično se te vrijednosti izražavaju u postocima.

Formule za izračunavanje relativnih pokazatelja varijacije:

Iz gornjih formula se vidi da što je veći koeficijent V blizu nule, manja je varijacija vrijednosti svojstva. Više V, što je predznak promjenjiviji.

U statističkoj praksi najčešće se koristi koeficijent varijacije. Koristi se ne samo za komparativnu procjenu varijacije, već i za karakterizaciju homogenosti populacije. Skup se smatra homogenim ako koeficijent varijacije ne prelazi 33% (za distribucije bliske normalnim). Aritmetički gledano, omjer σ i aritmetičke sredine eliminira utjecaj apsolutna vrijednost ovih karakteristika, a postotak čini koeficijent varijacije bezdimenzionalnom (neimenovanom) vrijednošću.

Dobivena vrijednost koeficijenta varijacije procjenjuje se u skladu s približnim gradacijama stupnja raznolikosti svojstva:

Slab - do 10%

Prosjek - 10 - 20%

Snažan - više od 20%

Korištenje koeficijenta varijacije preporučljivo je u slučajevima kada je potrebno usporediti značajke koje se razlikuju po veličini i dimenzijama.

Razlika između koeficijenta varijacije i drugih kriterija raspršenosti jasno je prikazana na primjer.

stol 1

Sastav zaposlenih u industrijskom poduzeću

Na temelju statističkih karakteristika navedenih u primjeru može se zaključiti da su dobni sastav i obrazovna razina zaposlenika poduzeća relativno homogeni, uz nisku profesionalnu stabilnost ispitanog kontingenta. Lako je vidjeti da bi pokušaj prosuđivanja ovih društvenih trendova standardnom devijacijom doveo do pogrešnog zaključka, a pokušaj usporedbe računovodstvenih značajki "radno iskustvo" i "dob" s računovodstvenom značajkom "obrazovanje" općenito bi bio netočna zbog heterogenosti ovih značajki.

Medijan i percentili

Za ordinalne (rang) distribucije, gdje je kriterij za sredinu niza medijan, standardna devijacija i varijanca ne mogu poslužiti kao karakteristike disperzije varijante.

Isto vrijedi i za otvorene varijacijske serije. Ova okolnost je zbog činjenice da se odstupanja, prema kojima se izračunavaju disperzija i σ, računaju od aritmetičke sredine, koja se ne izračunava u otvorenim varijacijskim serijama i u serijama distribucija kvalitativnih značajki. Stoga se za komprimirani opis distribucija koristi drugi parametar raspršenja - kvantil(sinonim - "percentil"), pogodan za opisivanje kvalitativnih i kvantitativnih karakteristika u bilo kojem obliku njihove distribucije. Ovaj se parametar također može koristiti za pretvaranje kvantitativnih značajki u kvalitativne. U ovom slučaju, takvi se rezultati dodjeljuju ovisno o tome koji redoslijed kvantila odgovara jednoj ili drugoj specifičnoj opciji.

U praksi biomedicinskih istraživanja najčešće se koriste sljedeći kvantili:

– medijan;

, su kvartili (četvrtine), gdje je donji kvartil, gornji kvartil.

Kvantili dijele područje mogućih promjena u varijacijskom nizu na određene intervale. Medijan (kvantil) je varijanta koja se nalazi u sredini varijacijskog niza i dijeli ga na pola, na dva jednaka dijela ( 0,5 I 0,5 ). Kvartil dijeli niz na četiri dijela: prvi dio (donji kvartil) je opcija koja razdvaja opcije čije brojčane vrijednosti ne prelaze 25% maksimalno moguće u ovaj red, kvartil odvaja opcije s numeričkom vrijednošću do 50% najveće moguće. Gornji kvartil () odvaja opcije do 75% maksimalnih mogućih vrijednosti.

U slučaju asimetrične distribucije varijabla u odnosu na aritmetičku sredinu, medijan i kvartili koriste se za njezino obilježavanje. U ovom slučaju koristi se sljedeći oblik prikaza prosječne vrijednosti - Mi (;). Na primjer, ispitivana osobina - "razdoblje u kojem je dijete počelo samostalno hodati" - u ispitivanoj skupini ima asimetričnu distribuciju. U isto vrijeme, donji kvartil () odgovara početku hodanja - 9,5 mjeseci, medijan - 11 mjeseci, gornji kvartil () - 12 mjeseci. Sukladno tome, karakteristika prosječnog trenda navedenog atributa bit će prikazana kao 11 (9,5; 12) mjeseci.

Procjena statističke značajnosti rezultata istraživanja

Pod statističkom značajnošću podataka podrazumijeva se stupanj njihove podudarnosti prikazanoj stvarnosti, tj. Statistički značajni podaci su oni koji ne iskrivljuju i ispravno odražavaju objektivnu stvarnost.

Ocijeniti statističku značajnost rezultata istraživanja znači utvrditi s kojom je vjerojatnošću moguće prenijeti rezultate dobivene na uzorku populacije na cjelokupnu populaciju. Procjena statističke značajnosti neophodna je kako bi se razumjelo koliko se dio fenomena može koristiti za prosudbu fenomena kao cjeline i njegovih obrazaca.

Procjena statističke značajnosti rezultata istraživanja sastoji se od:

1. pogreške reprezentativnosti (pogreške prosječnih i relativnih vrijednosti) - m;

2. granice pouzdanosti prosječnih ili relativnih vrijednosti;

3. pouzdanost razlike između prosječnih ili relativnih vrijednosti prema kriteriju t.

Standardna greška aritmetičke sredine ili pogreška reprezentativnosti karakterizira fluktuacije u prosjeku. Treba napomenuti da što je veći uzorak, to je manji raspon prosječnih vrijednosti. Standardna pogreška srednje vrijednosti izračunava se formulom:

U modernoj znanstvenoj literaturi aritmetička sredina se piše zajedno s pogreškom reprezentativnosti:

ili zajedno sa standardnom devijacijom:

Kao primjer, razmotrite podatke za 1500 gradskih poliklinika u zemlji (opća populacija). Prosječan broj pacijenata opsluženih u poliklinici je 18150 osoba. Slučajnim odabirom 10% objekata (150 poliklinika) prosječan broj pacijenata iznosi 20051 osoba. Pogreška uzorka, očito povezana s činjenicom da u uzorak nije uključeno svih 1500 poliklinika, jednaka je razlici između tih prosjeka - općeg prosjeka ( M gen) i srednja vrijednost uzorka ( M sb). Ako formiramo drugi uzorak iste veličine iz naše populacije, to će dati različitu količinu pogreške. Sve ove srednje vrijednosti uzorka za dovoljno velike uzorke normalno su raspoređene oko opće srednje vrijednosti za dovoljno veliki brojevi ponavljanja uzorka od istog broja objekata iz opće populacije. Standardna pogreška srednje vrijednosti m je neizbježno širenje uzoraka srednjih vrijednosti oko opće sredine.

U slučaju kada su rezultati studije predstavljeni relativnim vrijednostima (na primjer, postocima), podijeli standardnu ​​pogrešku:

gdje je P indikator u %, n je broj opažanja.

Rezultat se prikazuje kao (P ± m)%. Na primjer, postotak oporavka među pacijentima bio je (95,2±2,5)%.

Ako broj elemenata u populaciji, tada pri izračunavanju standardnih pogrešaka sredine i udjela u nazivniku razlomka, umjestopotrebno je staviti.

Za normalnu distribuciju (distribucija srednjih vrijednosti uzorka je normalna), poznato je koliko populacije spada unutar bilo kojeg intervala oko srednje vrijednosti. Posebno:

U praksi, problem je u tome što su nam karakteristike opće populacije nepoznate, a uzorak se radi upravo u svrhu njihove procjene. To znači da ako uzmemo uzorke iste veličine n iz opće populacije, tada će u 68,3% slučajeva interval sadržavati vrijednost M(bit će na intervalu u 95,5% slučajeva i na intervalu u 99,7% slučajeva).

Budući da je zapravo napravljen samo jedan uzorak, ova tvrdnja je formulirana u terminima vjerojatnosti: s vjerojatnošću od 68,3%, prosječna vrijednost atributa u općoj populaciji sadržana je u intervalu, s vjerojatnošću od 95,5% - u intervalu itd.

U praksi se takav interval gradi oko vrijednosti uzorka, koja bi sa zadanom (dovoljno visokom) vjerojatnošću - vjerojatnost povjerenja - bi “pokrila” pravu vrijednost ovog parametra u općoj populaciji. Taj se interval naziva interval pouzdanosti.

Vjerojatnost povjerenjaP je stupanj pouzdanosti da će interval pouzdanosti doista sadržavati pravu (nepoznatu) vrijednost parametra u populaciji.

Na primjer, ako je razina povjerenja R jednako 90%, to znači da će 90 uzoraka od 100 dati točnu procjenu parametra u općoj populaciji. Prema tome, vjerojatnost pogreške, tj. netočna procjena općeg prosjeka za uzorak, jednaka je u postocima: . Za ovaj primjer to znači da će 10 uzoraka od 100 dati pogrešnu procjenu.

Očito, stupanj pouzdanosti (vjerojatnost povjerenja) ovisi o veličini intervala: što je interval širi, veća je pouzdanost da će nepoznata vrijednost za opću populaciju pasti u njega. U praksi se uzima najmanje dvostruko veća pogreška uzorkovanja da bi se konstruirao interval pouzdanosti kako bi se osiguralo najmanje 95,5% pouzdanosti.

Određivanje granica pouzdanosti prosječnih i relativnih vrijednosti omogućuje nam da pronađemo njihove dvije ekstremne vrijednosti - najmanju moguću i najveću moguću, unutar kojih se pokazatelj koji se proučava može pojaviti u cijeloj općoj populaciji. Na temelju toga, granice pouzdanosti (ili interval pouzdanosti)- to su granice prosječnih ili relativnih vrijednosti, odlazak preko kojih zbog slučajnih fluktuacija ima beznačajnu vjerojatnost.

Interval pouzdanosti može se prepisati kao: , gdje t je kriterij povjerenja.

Granice pouzdanosti aritmetičke sredine u općoj populaciji određene su formulom:

M gen = M Izaberi + t m M

za relativnu vrijednost:

R gen = P Izaberi + t m R

Gdje M gen I R gen- vrijednosti prosječnih i relativnih vrijednosti za opću populaciju; M Izaberi I R Izaberi- vrijednosti prosječnih i relativnih vrijednosti dobivenih na uzorku populacije; m M I m P- pogreške prosječnih i relativnih vrijednosti; t- kriterij povjerenja (kriterij točnosti koji se postavlja pri planiranju studije i može biti jednak 2 ili 3); t m- ovo je interval pouzdanosti ili Δ - granična pogreška pokazatelja dobivenog u istraživanju uzorka.

Treba napomenuti da je vrijednost kriterija t u određenoj je mjeri povezana s vjerojatnošću prognoze bez pogreške (p), izraženom u%. Odabire ga sam istraživač, vodeći se potrebom da dobije rezultat s potrebnim stupnjem točnosti. Dakle, za vjerojatnost prognoze bez pogreške od 95,5%, vrijednost kriterija t je 2, za 99,7% - 3.

Navedene procjene intervala pouzdanosti prihvatljive su samo za statističke populacije s više od 30 promatranja, a kod manje populacije (mali uzorci) koriste se posebne tablice za određivanje kriterija t. U tim se tablicama željena vrijednost nalazi na sjecištu crte koja odgovara veličini populacije (n-1), i stupac koji odgovara razini vjerojatnosti prognoze bez pogreške (95,5%; 99,7%) koju je odabrao istraživač. U medicinskim istraživanjima, pri utvrđivanju granica pouzdanosti za bilo koji pokazatelj, vjerojatnost prognoze bez pogreške je 95,5% ili više. To znači da se vrijednost pokazatelja dobivena na uzorku populacije mora naći u općoj populaciji u najmanje 95,5% slučajeva.

    Pitanja o temi lekcije:

    Relevantnost pokazatelja raznolikosti svojstva u statističkoj populaciji.

    Opće karakteristike apsolutnih pokazatelja varijacije.

    Standardna devijacija, proračun, primjena.

    Relativni pokazatelji varijacije.

    Medijan, rezultat kvartila.

    Procjena statističke značajnosti rezultata istraživanja.

    Standardna pogreška aritmetičke sredine, formula za izračun, primjer uporabe.

    Izračun udjela i njegove standardne pogreške.

    Pojam vjerojatnosti povjerenja, primjer uporabe.

10. Pojam intervala povjerenja, njegova primjena.

    Testni zadaci na temu s oglednim odgovorima:

1. APSOLUTNI POKAZATELJI VARIJACIJE SU

1) koeficijent varijacije

2) koeficijent oscilacije

4) medijan

2. RELATIVNI POKAZATELJI VARIJACIJE SU

1) disperzija

4) koeficijent varijacije

3. KRITERIJ ODREĐEN EKSTREMNIM VRIJEDNOSTIMA VARIJANTE U NIZU VARIJACIJA

2) amplituda

3) disperzija

4) koeficijent varijacije

4. RAZLIKA EKSTREMNE OPCIJE JE

2) amplituda

3) standardna devijacija

4) koeficijent varijacije

5. SREDNJI KVADRAT ODSTUPANJA POJEDINIH ZNAČAJNIH VRIJEDNOSTI OD NJEGOVE PROSJEČNE VRIJEDNOSTI JE

1) koeficijent oscilacije

2) medijan

3) disperzija

6. OMJER RASPONA VARIJACIJE I PROSJEČNE VRIJEDNOSTI ZNAČAJKE JE

1) koeficijent varijacije

2) standardna devijacija

4) koeficijent oscilacije

7. OMJER SREDNJE KVADRATNE DEVIJACIJE I PROSJEČNE VRIJEDNOSTI OBILJEŽJA JE

1) disperzija

2) koeficijent varijacije

3) koeficijent oscilacije

4) amplituda

8. VARIJANTA KOJA JE U SREDINI NIZA VARIJACIJA I DIJELI GA NA DVA JEDNAKA DIJELA JE

1) medijan

3) amplituda

9. U MEDICINSKIM ISTRAŽIVANJIMA, KOD UTVRĐIVANJA GRANICA POVJERENJA BILO KOG POKAZATELJA, PRIHVAĆA SE VJEROJATNOST PREDVIĐANJA BEZ POGREŠAKA

10. AKO 90 UZORAKA OD 100 DAJE ISPRAVNU PROCJENU PARAMETRA U OPĆOJ POPULACIJI, ONDA TO ZNAČI DA JE VJEROJATNOST POVJERENJA P JEDNAK

11. U SLUČAJU AKO 10 OD 100 UZORAKA DA NETOČNU PROCJENU, VJEROJATNOST POGREŠKE JE

12. GRANICE PROSJEČNIH ILI RELATIVNIH VRIJEDNOSTI, POSTOJI MALA VJEROJATNOST DA SE IZLAZI IZNAD GRANICA ZBOG NASUOMIČNIH OSCILACIJA - OVO

1) interval pouzdanosti

2) amplituda

4) koeficijent varijacije

13. MALIM UZORKOM SMATRA SE POPULACIJA U KOJOJ

1) n je manji ili jednak 100

2) n je manji ili jednak 30

3) n je manji ili jednak 40

4) n je blizu 0

14. ZA VJEROJATNOST PROGNOZE BEZ POGREŠKE 95% KRITERIJSKA VRIJEDNOST t KOMPONIRA

15. ZA VJEROJATNOST PROGNOZE BEZ POGREŠKE 99% KRITERIJSKA VRIJEDNOST t KOMPONIRA

16. ZA DISTRIBUCIJU BLIZU NORMALNE, POPULACIJA SE SMATRA HOMOGENOM AKO KOEFICIJENT VARIJACIJE NE PRELAZI

17. OPCIJA RAZDJELJIVANJA VARIJANTI ČIJE BROJČANE VRIJEDNOSTI NE PRELAZE 25% OD MAKSIMALNO MOGUĆIH U OVOM RETU JE

2) donji kvartil

3) gornji kvartil

4) kvartil

18. PODACI KOJI NE ISKRIVLJAJU I ISPRAVNO ODRAŽAVAJU OBJEKTIVNU STVARNOST ZV.

1) nemoguće

2) jednako moguće

3) pouzdan

4) slučajni

19. PREMA PRAVILU TRI ZNAKA, UZ NORMALNU DISTRIBUCIJU ZNAKA UNUTAR
ĆE SE NALAZITI

1) 68,3% opcija

Standardna devijacija je klasičan pokazatelj varijabilnosti iz deskriptivne statistike.

Standardna devijacija, standardna devijacija, RMS, standardna devijacija uzorka (engleski standard deviation, STD, STDev) je vrlo česta mjera disperzije u deskriptivnoj statistici. Ali zbog tehnička analiza je slična statistici, ovaj se pokazatelj može (i treba) koristiti u tehničkoj analizi za otkrivanje stupnja disperzije cijene analiziranog instrumenta tijekom vremena. Označava se grčkim simbolom sigma "σ".

Hvala Karlu Gaussu i Pearsonu što imamo priliku koristiti standardnu ​​devijaciju.

Korištenje standardna devijacija u tehničkoj analizi, okrećemo ovo "indeks raspršenosti" V "indikator volatilnosti“Zadržavajući značenje, ali mijenjajući uvjete.

Što je standardna devijacija

No, pored posrednih pomoćnih izračuna, standardna devijacija je sasvim prihvatljiva za samoizračun i primjene u tehničkoj analizi. Kao što je primijetio aktivni čitatelj našeg časopisa čičak, " Još uvijek ne razumijem zašto RMS nije uključen u skup standardnih pokazatelja domaćih prodajnih centara«.

Stvarno, standardna devijacija može na klasičan i "čist" način mjeriti varijabilnost instrumenta. No, nažalost, ovaj pokazatelj nije tako čest u analizi vrijednosnih papira.

Primjena standardne devijacije

Ručno izračunavanje standardne devijacije nije baš zanimljivo. ali korisno za iskustvo. Standardna devijacija se može izraziti formula STD=√[(∑(x-x) 2)/n], koja zvuči kao korijen zbroja kvadrata razlika između stavki uzorka i srednje vrijednosti, podijeljen s brojem stavki u uzorku.

Ako je broj elemenata u uzorku veći od 30, tada nazivnik razlomka pod korijenom poprima vrijednost n-1. Inače se koristi n.

korak po korak izračun standardne devijacije:

  1. izračunati aritmetičku sredinu uzorka podataka
  2. oduzmite ovaj prosjek od svakog elementa uzorka
  3. sve dobivene razlike su na kvadrat
  4. zbroji sve dobivene kvadrate
  5. podijelite dobiveni zbroj s brojem elemenata u uzorku (ili s n-1 ako je n>30)
  6. izračunajte kvadratni korijen dobivenog kvocijenta (tzv disperzija)

Definira se kao generalizirajuća karakteristika veličine varijacije svojstva u agregatu. Jednak je kvadratnom korijenu prosječnog kvadrata odstupanja pojedinačnih vrijednosti obilježja od aritmetičke sredine, tj. korijen i može se pronaći ovako:

1. Za primarni red:

2. Za seriju varijacija:

Transformacija formule standardne devijacije dovodi je do oblika pogodnijeg za praktične izračune:

Standardna devijacija određuje koliko u prosjeku pojedine opcije odstupaju od svoje prosječne vrijednosti, a osim toga, ona je apsolutna mjera fluktuacije svojstva i izražava se u istim jedinicama kao i opcije, te se stoga dobro interpretira.

Primjeri pronalaženja standardne devijacije: ,

Za alternativna obilježja, formula srednje vrijednosti standardna devijacija izgleda ovako:

gdje je p udio jedinica u populaciji koje imaju određeni atribut;

q - udio jedinica koje nemaju ovu značajku.

Pojam srednjeg linearnog odstupanja

Prosječno linearno odstupanje definira se kao aritmetička sredina apsolutnih vrijednosti odstupanja pojedinih opcija od .

1. Za primarni red:

2. Za seriju varijacija:

gdje je zbroj n zbroj frekvencija niza varijacija.

Primjer pronalaženja prosječnog linearnog odstupanja:

Prednost srednjeg apsolutnog odstupanja kao mjere disperzije u rasponu varijacije je očita, jer se ova mjera temelji na uzimanju u obzir svih mogućih odstupanja. Ali ovaj pokazatelj ima značajne nedostatke. Proizvoljno odbacivanje algebarskih znakova odstupanja može dovesti do činjenice da su matematička svojstva ovog pokazatelja daleko od elementarnih. To uvelike komplicira korištenje srednjeg apsolutnog odstupanja u rješavanju problema povezanih s probabilističkim izračunima.

Stoga se prosječno linearno odstupanje kao mjera varijacije obilježja rijetko koristi u statističkoj praksi, naime kada zbrajanje pokazatelja bez uzimanja u obzir predznaka ima ekonomskog smisla. Pomoću njega analizira se, primjerice, promet vanjske trgovine, sastav zaposlenih, ritam proizvodnje itd.

korijen znači kvadrat

Primijenjen RMS, na primjer, za izračunavanje prosječne veličine stranica n kvadratnih dijelova, prosječnih promjera debla, cijevi itd. Dijeli se na dvije vrste.

Srednji kvadratni korijen je jednostavan. Ako, prilikom zamjene pojedinačnih vrijednosti značajke s Prosječna vrijednost potrebno je održavati zbroj kvadrata izvornih vrijednosti konstantnim, tada će prosjek biti kvadratni prosjek.

Slučajno je korijen iz kvocijenta dijeljenja zbroja kvadrata pojedinačnih vrijednosti obilježja njihovim brojem:

Ponderirani srednji kvadrat izračunava se formulom:

gdje je f znak težine.

Prosječna kubna

Primijenjen prosječni kubni, na primjer, pri određivanju prosječne duljine stranice i kocke. Dijeli se na dvije vrste.
Prosječna kubna jednostavna:

Prilikom izračunavanja srednjih vrijednosti i varijance u seriji intervalne distribucije, prave vrijednosti atributa zamjenjuju se središnjim vrijednostima intervala, koje se razlikuju od prosjeka aritmetičke vrijednosti uključeni u interval. To dovodi do sustavne pogreške u izračunu varijance. V.F. Sheppard je to utvrdio greška u izračunu varijance, uzrokovan primjenom grupiranih podataka, iznosi 1/12 kvadrata vrijednosti intervala, prema gore i prema dolje u veličini varijance.

Sheppardov amandman treba koristiti ako je distribucija blizu normalne, odnosi se na značajku s kontinuiranom prirodom varijacije, izgrađenu na značajnoj količini početnih podataka (n> 500). Međutim, na temelju činjenice da se u nizu slučajeva obje pogreške, djelujući u različitim smjerovima, kompenziraju jedna drugu, ponekad je moguće odbiti uvođenje izmjena.

Što su manja varijanca i standardna devijacija, to će populacija biti homogenija i prosjek će biti tipičniji.
U praksi statistike često postaje potrebno usporediti varijacije različitih značajki. Na primjer, od velikog je interesa usporediti varijacije u dobi radnika i njihovim kvalifikacijama, radnom stažu i veličini plaće, trošak i dobit, radni staž i produktivnost rada itd. Za takve usporedbe pokazatelji apsolutne varijabilnosti karakteristika nisu prikladni: nemoguće je usporediti varijabilnost radnog iskustva, izraženu u godinama, s varijabilnošću plaća, izraženu u rubljima.

Za provođenje takvih usporedbi, kao i usporedbi fluktuacije istog svojstva u više populacija s različitim aritmetičkim sredinama, koristi se relativni pokazatelj varijacije - koeficijent varijacije.

Strukturni prosjeci

Za karakterizaciju središnjeg trenda u statističkim distribucijama često je racionalno koristiti, zajedno s aritmetičkom sredinom, određenu vrijednost atributa X, koji, zbog određenih značajki svog položaja u nizu distribucije, može karakterizirati njegovu razinu.

Ovo je posebno važno kada ekstremne vrijednosti značajke u seriji distribucije imaju nejasne granice. Zbog ovoga precizna definicija aritmetička sredina je u pravilu nemoguća ili vrlo teška. U takvim slučajevima, prosječna razina može se odrediti uzimanjem, na primjer, vrijednosti značajke koja se nalazi u sredini serije frekvencija ili koja se najčešće pojavljuje u trenutnoj seriji.

Takve vrijednosti ovise samo o prirodi frekvencija, tj. o strukturi distribucije. One su tipične u smislu položaja u seriji frekvencija, stoga se takve vrijednosti smatraju karakteristikama distribucijskog centra i stoga su definirane kao strukturni prosjeci. Koriste se za učenje unutarnja struktura i strukturu serija distribucije vrijednosti atributa. Ovi pokazatelji uključuju.



 


Čitati:



Koji su zahtjevi za copywritera?

Koji su zahtjevi za copywritera?

Glupo je pretpostaviti da su sve stranice s informacijama pune svojih vlasnika. Kada stranice imaju tisuće članaka, a postoji oko godinu dana, ...

Zašto srebro mijenja boju kada se nosi na tijelu?

Zašto srebro mijenja boju kada se nosi na tijelu?

Događa se da vaš omiljeni srebrni nakit odjednom počne naglo crniti. U pravilu nema posebnih vidljivih razloga za to, ali srebro je ipak...

Ljekoviti zeleni čaj. Što je štetan zeleni čaj. Kako pripremiti zeleni čaj

Ljekoviti zeleni čaj.  Što je štetan zeleni čaj.  Kako pripremiti zeleni čaj

Danas postoji mnogo informacija o prednostima zelenog čaja, ali može li se vjerovati? Doista, činjenica da ovo piće pomaže u borbi s ...

O “božićnom gatanju” i kartama Istina, djeca ne bi trebala igrati karte

O “božićnom gatanju” i kartama Istina, djeca ne bi trebala igrati karte

Narodna praznovjerja i znakovi o zabrani kartaških igara U svako doba ljudi su smišljali neku vrstu zabave za sebe kako bi se odvratili od sivila i ...

feed slike RSS