Dom - Mogu sama obaviti popravke
Standardna devijacija se mjeri u. Varijanca: općenito, uzorak, ispravljeno

U statističkom testiranju hipoteza, kada se mjeri linearni odnos između slučajnih varijabli.

Prosjek standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable Pod, zidovi oko nas i strop, x u vezi s njom matematičko očekivanje na temelju nepristrane procjene njegove varijance):

gdje je disperzija; - Pod, zidovi oko nas i strop, ja element selekcije; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrane. U opći slučaj Nemoguće je konstruirati nepristranu procjenu. Međutim, procjena temeljena na nepristranoj procjeni varijance je dosljedna.

Pravilo tri sigme

Pravilo tri sigme() - gotovo sve vrijednosti normalno distribuirane slučajne varijable leže u intervalu. Strože – s pouzdanošću ne manjom od 99,7%, vrijednost normalno distribuirane slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita i da nije dobivena kao rezultat obrade uzorka).

Ako je prava vrijednost nepoznata, onda ne bismo trebali koristiti, nego pod, zidove oko nas i strop, s. Tako se pravilo tri sigme pretvara u pravilo tri poda, zidova oko nas i stropa, s .

Tumačenje vrijednosti standardne devijacije

Velika vrijednost standardne devijacije pokazuje veliki raspon vrijednosti u prikazanom skupu s prosječnom vrijednošću skupa; mala vrijednost, prema tome, pokazuje da su vrijednosti u skupu grupirane oko srednje vrijednosti.

Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti jednake 7, odnosno standardne devijacije jednake 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju, budući da su vrijednosti u skupu grupirane oko srednje vrijednosti; prvi set ima najviše veliki značaj standardna devijacija - vrijednosti unutar skupa uvelike odstupaju od prosječne vrijednosti.

U općem smislu, standardna devijacija se može smatrati mjerom nesigurnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje pogreške niza uzastopnih mjerenja neke veličine. Ova je vrijednost vrlo važna za određivanje vjerodostojnosti fenomena koji se proučava u usporedbi s vrijednošću koju predviđa teorija: ako se prosječna vrijednost mjerenja jako razlikuje od vrijednosti predviđenih teorijom (velika standardna devijacija), tada treba ponovno provjeriti dobivene vrijednosti ili način njihova dobivanja.

Praktična upotreba

U praksi, standardna devijacija vam omogućuje da odredite koliko se vrijednosti u skupu mogu razlikovati od prosječne vrijednosti.

Klima

Pretpostavimo da postoje dva grada s istom prosječnom maksimalnom dnevnom temperaturom, ali se jedan nalazi na obali, a drugi u unutrašnjosti. Poznato je da gradovi koji se nalaze na obali imaju mnogo različitih maksimalnih dnevnih temperatura koje su niže od gradova u unutrašnjosti. Dakle, standardna devijacija maksimalnih dnevnih temperatura za obalni grad bit će manja nego za drugi grad, unatoč činjenici da je prosječna vrijednost te vrijednosti ista, što u praksi znači da je vjerojatnost da će maksimalna temperatura zraka na bilo koji dan u godini bit će veća razlika od prosječne vrijednosti, veća za grad koji se nalazi u unutrašnjosti.

Sport

Pretpostavimo da postoji nekoliko nogometnih momčadi koje se vrednuju prema nekom skupu parametara, na primjer, broju postignutih i primljenih golova, prilikama za postizanje pogotka itd. Najvjerojatnije je da će najbolja momčad u ovoj skupini imati najbolje vrijednosti Po više parametri. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji; takvi timovi su uravnoteženi. S druge strane, ekipa sa velika vrijednost standardna devijacija otežava predviđanje rezultata, što se pak objašnjava neravnotežom, npr. jaka obrana, ali slab napad.

Korištenje standardne devijacije parametara momčadi omogućuje, u jednoj ili drugoj mjeri, predviđanje rezultata utakmice između dvije momčadi, procjenjujući snagu i slabe strane zapovijedi, a samim tim i odabranih metoda borbe.

Tehnička analiza

vidi također

Književnost

* Borovikov, V. STATISTIKA. Umjetnost analize podataka na računalu: Za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

U ovom ću članku govoriti o kako pronaći standardnu ​​devijaciju. Ovaj materijal je izuzetno važan za potpuno razumijevanje matematike, tako da nastavnik matematike treba posvetiti zasebnu lekciju ili čak nekoliko za njegovo proučavanje. U ovom ćete članku pronaći poveznicu na detaljan i razumljiv video vodič koji objašnjava što je standardna devijacija i kako je pronaći.

Standardna devijacija omogućuje procjenu raspona vrijednosti dobivenih kao rezultat mjerenja određenog parametra. Označava se simbolom (grčko slovo "sigma").

Formula za izračun je vrlo jednostavna. Da biste pronašli standardnu ​​devijaciju, trebate izvaditi kvadratni korijen varijance. Dakle, sada morate pitati: "Što je varijanca?"

Što je varijanca

Definicija varijance ide ovako. Disperzija je aritmetička sredina kvadrata odstupanja vrijednosti od sredine.

Da biste pronašli varijancu, izvršite sljedeće izračune uzastopno:

  • Odredite prosjek (jednostavni aritmetički prosjek niza vrijednosti).
  • Zatim oduzmite prosjek od svake vrijednosti i kvadrirajte dobivenu razliku (dobićete kvadrat razlike).
  • Sljedeći korak je izračunati aritmetičku sredinu dobivenih kvadrata razlike (zašto točno kvadrati možete saznati u nastavku).

Pogledajmo primjer. Recimo da vi i vaši prijatelji odlučite izmjeriti visinu svojih pasa (u milimetrima). Kao rezultat mjerenja dobili ste sljedeće mjere visine (u grebenu): 600 mm, 470 mm, 170 mm, 430 mm i 300 mm.

Izračunajmo srednju vrijednost, varijancu i standardnu ​​devijaciju.

Najprije pronađimo prosječnu vrijednost. Kao što već znate, da biste to učinili, morate zbrojiti sve izmjerene vrijednosti i podijeliti s brojem mjerenja. Napredak izračuna:

Prosječni mm.

Dakle, prosjek (aritmetička sredina) je 394 mm.

Sada moramo odrediti odstupanje visine svakog psa od prosjeka:

Konačno, izračunati varijancu, kvadriramo svaku od dobivenih razlika, a zatim nalazimo aritmetičku sredinu dobivenih rezultata:

Raspršenost mm 2 .

Dakle, disperzija je 21704 mm 2.

Kako pronaći standardnu ​​devijaciju

Dakle, kako sada možemo izračunati standardnu ​​devijaciju, znajući varijancu? Kao što se sjećamo, izvucite kvadratni korijen. Odnosno, standardna devijacija je jednaka:

Mm (zaokruženo na najbliži cijeli broj u mm).

Koristeći ovu metodu, otkrili smo da su neki psi (na primjer, Rottweileri) vrlo veliki psi. Ali postoje i vrlo mali psi (na primjer, jazavčari, ali im to ne biste trebali reći).

Najzanimljivije je to što standardna devijacija nosi sa sobom korisna informacija. Sada možemo pokazati koji su od dobivenih rezultata mjerenja visine unutar intervala koji dobijemo ako unesemo standardnu ​​devijaciju od prosjeka (s obje njegove strane).

To jest, koristeći standardnu ​​devijaciju, dobivamo "standardnu" metodu koja nam omogućuje da saznamo koja je od vrijednosti normalna (statistički prosjek), a koja je izuzetno velika ili, obrnuto, mala.

Što je standardna devijacija

Ali... sve će biti malo drugačije ako analiziramo uzorak podaci. U našem primjeru koji smo razmotrili opća populacija. Odnosno, naših 5 pasa bili su jedini psi na svijetu koji su nas zanimali.

Ali ako su podaci uzorak (vrijednosti odabrane iz velike populacije), tada se izračuni moraju napraviti drugačije.

Ako postoje vrijednosti, tada:

Svi ostali izračuni provode se na sličan način, uključujući određivanje prosjeka.

Na primjer, ako je naših pet pasa samo uzorak populacije pasa (svi psi na planetu), moramo podijeliti s 4, ne 5, naime:

Varijanca uzorka = mm 2.

U ovom slučaju, standardna devijacija za uzorak jednaka je mm (zaokruženo na najbliži cijeli broj).

Možemo reći da smo napravili neke "ispravke" u slučaju kada su naše vrijednosti samo mali uzorak.

Bilješka. Zašto točno kvadrat razlike?

Ali zašto uzimamo točno kvadrat razlike kada računamo varijancu? Recimo da ste prilikom mjerenja nekog parametra dobili sljedeći skup vrijednosti: 4; 4; -4; -4. Ako jednostavno zbrojimo apsolutna odstupanja od srednje vrijednosti (razlike)... negativne vrijednosti se poništavaju s pozitivnima:

.

Ispostavilo se da je ova opcija beskorisna. Onda možda vrijedi isprobati apsolutne vrijednosti odstupanja (odnosno module ovih vrijednosti)?

Na prvi pogled ispada dobro (rezultirajuća vrijednost se, usput, naziva srednja apsolutna devijacija), ali ne u svim slučajevima. Pokušajmo s drugim primjerom. Neka rezultat mjerenja bude sljedeći skup vrijednosti: 7; 1; -6; -2. Tada je prosječno apsolutno odstupanje:

Wow! Opet smo dobili rezultat 4, iako razlike imaju puno veći raspon.

Pogledajmo sada što se događa ako kvadriramo razlike (a zatim izvadimo kvadratni korijen njihovog zbroja).

Za prvi primjer to će biti:

.

Za drugi primjer to će biti:

Sada je to sasvim druga stvar! Što je veće širenje razlika, veća je standardna devijacija... što je ono čemu smo težili.

Zapravo, ova metoda koristi istu ideju kao kod izračuna udaljenosti između točaka, samo primijenjenu na drugačiji način.

A s matematičkog gledišta, korištenje kvadrata i kvadratnog korijena daje više koristi nego što bismo mogli dobiti od apsolutnih vrijednosti odstupanja, čineći standardnu ​​devijaciju primjenjivom na druge matematičke probleme.

Sergey Valerievich vam je rekao kako pronaći standardnu ​​devijaciju

Lekcija br. 4

Tema: “Opisna statistika. Indikatori raznolikosti svojstava u agregatu"

Glavni kriteriji za različitost obilježja u statističkoj populaciji su: granica, amplituda, standardna devijacija, koeficijent oscilacije i koeficijent varijacije. U prethodnoj lekciji raspravljalo se o tome da prosječne vrijednosti daju samo generaliziranu karakteristiku karakteristike koja se proučava u agregatu i ne uzimaju u obzir vrijednosti njegovih pojedinačnih varijanti: minimalne i maksimalne vrijednosti, iznad prosjeka, ispod prosjek, itd.

Primjer. Prosječne vrijednosti dva različita niza brojeva: -100; -20; 100; 20 i 0,1; -0,2; 0,1 su apsolutno identični i jednakiOKO.Međutim, rasponi raspršenosti ovih relativnih srednjih podataka o nizu su vrlo različiti.

Utvrđivanje navedenih kriterija za raznolikost obilježja prvenstveno se provodi uzimajući u obzir njegovu vrijednost u pojedinim elementima statističke populacije.

Indikatori za mjerenje varijacije svojstva su apsolutni I relativna. Apsolutni pokazatelji varijacije su: raspon varijacije, granica, standardna devijacija, disperzija. Koeficijent varijacije i koeficijent oscilacije odnose se na relativne mjere varijacije.

Limit (lim)– Ovo je kriterij koji je određen ekstremnim vrijednostima varijante u nizu varijacija. Drugim riječima, ovaj kriterij ograničen je minimalnim i maksimalnim vrijednostima atributa:

Amplituda (Am) ili raspon varijacija – Ovo je razlika između ekstremnih opcija. Izračun ovog kriterija provodi se oduzimanjem njegove minimalne vrijednosti od maksimalne vrijednosti atributa, što nam omogućuje procjenu stupnja raspršenosti opcije:

Nedostatak limita i amplitude kao kriterija varijabilnosti je što u potpunosti ovise o ekstremnim vrijednostima obilježja u nizu varijacija. U ovom slučaju, fluktuacije vrijednosti atributa unutar niza se ne uzimaju u obzir.

Najpotpuniji opis raznolikosti svojstva u statističkoj populaciji daje standardna devijacija(sigma), što je opća mjera odstupanja opcije od njezine prosječne vrijednosti. Standardna devijacija se često naziva standardna devijacija.

Standardna devijacija temelji se na usporedbi svake opcije s aritmetičkom sredinom određene populacije. Budući da će u agregatu uvijek biti opcija i manje i više od njega, zbroj odstupanja s predznakom "" poništit će se zbrojem odstupanja s predznakom "", tj. zbroj svih odstupanja je nula. Da bi se izbjegao utjecaj predznaka razlika, uzimaju se odstupanja od kvadrata aritmetičke sredine, tj. . Zbroj kvadrata odstupanja nije jednak nuli. Da biste dobili koeficijent koji može mjeriti varijabilnost, uzmite prosjek zbroja kvadrata - ta se vrijednost naziva odstupanja:

U biti, disperzija je prosječni kvadrat odstupanja pojedinih vrijednosti neke karakteristike od njezine prosječne vrijednosti. Disperzija kvadrat standardne devijacije.

Varijanca je dimenzionalna veličina (nazvana). Dakle, ako su varijante niza brojeva izražene u metrima, tada varijanca daje kvadratne metre; ako su opcije izražene u kilogramima, tada varijanca daje kvadrat ove mjere (kg 2), itd.

Standardna devijacija– kvadratni korijen varijance:

, tada pri izračunavanju disperzije i standardne devijacije u nazivniku razlomka, umjestomora se staviti.

Izračun standardne devijacije može se podijeliti u šest faza, koje se moraju provesti određenim redoslijedom:

Primjena standardne devijacije:

a) za prosudbu varijabilnosti varijacijskih serija i komparativnu ocjenu tipičnosti (reprezentativnosti) aritmetičkih prosjeka. To je potrebno u diferencijalnoj dijagnozi pri određivanju stabilnosti simptoma.

b) rekonstruirati varijacijsku seriju, tj. obnavljanje njegovog frekvencijskog odziva na temelju pravila tri sigme. U intervalu (M±3σ) 99,7% svih varijanti serije nalazi se u intervalu (M±2σ) - 95,5% iu rasponu (M±1σ) - 68,3% opcija reda(Sl. 1).

c) za prepoznavanje "skočnih" opcija

d) odrediti parametre norme i patologije koristeći sigma procjene

e) izračunati koeficijent varijacije

f) izračunati prosječnu grešku aritmetičke sredine.

Za karakterizaciju bilo koje populacije koja imatip normalne distribucije , dovoljno je znati dva parametra: aritmetičku sredinu i standardnu ​​devijaciju.

Slika 1. Pravilo tri sigme

Primjer.

U pedijatriji se standardna devijacija koristi za procjenu tjelesnog razvoja djece usporedbom podataka određenog djeteta s odgovarajućim standardnim pokazateljima. Za standard se uzima aritmetički prosjek tjelesnog razvoja zdrave djece. Usporedba pokazatelja sa standardima provodi se pomoću posebnih tablica u kojima su navedeni standardi zajedno s pripadajućim sigma ljestvicama. Vjeruje se da ako je pokazatelj tjelesnog razvoja djeteta unutar standarda (aritmetička sredina) ±σ, tada tjelesni razvoj dijete (prema ovom pokazatelju) odgovara normi. Ako je pokazatelj unutar standarda ±2σ, tada postoji malo odstupanje od norme. Ako pokazatelj prelazi ove granice, tada se djetetov fizički razvoj oštro razlikuje od norme (moguća je patologija).

Osim pokazatelja varijacije izraženih u apsolutnim vrijednostima, u statističkim istraživanjima koriste se i pokazatelji varijacije izraženi u relativnim vrijednostima. Koeficijent oscilacije - ovo je omjer raspona varijacije i prosječne vrijednosti svojstva. Koeficijent varijacije - ovo je omjer standardne devijacije i prosječne vrijednosti karakteristike. Obično se ove vrijednosti izražavaju u postocima.

Formule za izračunavanje pokazatelja relativne varijacije:

Iz gornjih formula je jasno da što je veći koeficijent V je bliže nuli, manja je varijacija u vrijednostima karakteristike. Više V, što je predznak promjenjiviji.

U statističkoj praksi najčešće se koristi koeficijent varijacije. Koristi se ne samo za komparativnu procjenu varijacije, već i za karakterizaciju homogenosti populacije. Populacija se smatra homogenom ako koeficijent varijacije ne prelazi 33% (za distribucije bliske normalnoj). Aritmetički, omjer σ i aritmetičke sredine neutralizira utjecaj apsolutna vrijednost te karakteristike, a postotni omjer čini koeficijent varijacije bezdimenzionalnom (neimenovanom) veličinom.

Rezultirajuća vrijednost koeficijenta varijacije procjenjuje se u skladu s približnim gradacijama stupnja raznolikosti svojstva:

Slab - do 10%

Prosjek - 10 - 20%

Snažan - više od 20%

Korištenje koeficijenta varijacije preporučljivo je u slučajevima kada je potrebno usporediti karakteristike koje se razlikuju po veličini i dimenziji.

Jasno je prikazana razlika između koeficijenta varijacije i ostalih kriterija raspršenja primjer.

stol 1

Sastav radnika industrijskog poduzeća

Na temelju statističkih karakteristika navedenih u primjeru, možemo zaključiti o relativnoj homogenosti dobnog sastava i obrazovne razine zaposlenika poduzeća, s obzirom na nisku profesionalnu stabilnost ispitanog kontingenta. Lako je vidjeti da bi pokušaj prosuđivanja ovih društvenih trendova standardnom devijacijom doveo do pogrešnog zaključka, a pokušaj usporedbe računovodstvenih obilježja “radno iskustvo” i “dob” s računovodstvenim pokazateljem “obrazovanje” općenito bi bio netočna zbog heterogenosti ovih karakteristika.

Medijan i percentili

Za ordinalne (rang) distribucije, gdje je kriterij za sredinu niza medijan, standardna devijacija i disperzija ne mogu poslužiti kao karakteristike disperzije varijante.

Isto vrijedi i za serije otvorenih varijacija. Ova okolnost je zbog činjenice da se odstupanja iz kojih se računaju varijanca i σ mjere iz aritmetičke sredine, koja se ne izračunava u otvorenim varijacijskim serijama i serijama distribucija kvalitativnih karakteristika. Stoga se za komprimirani opis distribucija koristi drugi parametar raspršenja - kvantil(sinonim - "percentil"), pogodan za opisivanje kvalitativnih i kvantitativnih karakteristika u bilo kojem obliku njihove distribucije. Ovaj parametar također se može koristiti za pretvaranje kvantitativnih karakteristika u kvalitativne. U ovom slučaju, takve se ocjene dodjeljuju ovisno o tome kojem redu kvantila određena opcija odgovara.

U praksi biomedicinskih istraživanja najčešće se koriste sljedeći kvantili:

– medijan;

, – kvartili (četvrtine), gdje je – donji kvartil, gornji kvartil.

Kvantili dijele područje mogućih promjena u nizu varijacija na određene intervale. Medijan (kvantil) je opcija koja se nalazi u sredini niza varijacija i dijeli ovaj niz na pola na dva jednaka dijela ( 0,5 I 0,5 ). Kvartil dijeli niz na četiri dijela: prvi dio (donji kvartil) je opcija koja razdvaja opcije čije numeričke vrijednosti ne prelaze 25% maksimalno moguće u ovu seriju, kvartil odvaja opcije s numeričkom vrijednošću do 50% od najveće moguće. Gornji kvartil () odvaja opcije do 75% maksimalnih mogućih vrijednosti.

U slučaju asimetrične distribucije varijabla u odnosu na aritmetičku sredinu, medijan i kvartili koriste se za njezino obilježavanje. U ovom slučaju koristi se sljedeći oblik prikaza prosječne vrijednosti - Meh (;). Na primjer, proučavana značajka – “razdoblje u kojem je dijete počelo samostalno hodati” – ima asimetričnu distribuciju u ispitivanoj skupini. U isto vrijeme, donji kvartil () odgovara početku hodanja - 9,5 mjeseci, medijan - 11 mjeseci, gornji kvartil () - 12 mjeseci. Sukladno tome, karakteristika prosječnog trenda navedenog atributa bit će prikazana kao 11 (9,5; 12) mjeseci.

Procjena statističke značajnosti rezultata istraživanja

Pod statističkom značajnošću podataka podrazumijeva se stupanj u kojem oni odgovaraju prikazanoj stvarnosti, tj. statistički značajni podaci su oni koji ne iskrivljuju i ispravno odražavaju objektivnu stvarnost.

Procjena statističke značajnosti rezultata istraživanja znači utvrđivanje s kojom je vjerojatnošću moguće rezultate dobivene iz uzorka populacije prenijeti na cjelokupnu populaciju. Procjena statističke značajnosti neophodna je za razumijevanje koliko se fenomena može koristiti za prosudbu fenomena kao cjeline i njegovih obrazaca.

Procjena statističke značajnosti rezultata istraživanja sastoji se od:

1. pogreške reprezentativnosti (pogreške prosječnih i relativnih vrijednosti) - m;

2. granice pouzdanosti prosječnih ili relativnih vrijednosti;

3. pouzdanost razlike u prosječnim ili relativnim vrijednostima prema kriteriju t.

Standardna greška aritmetičke sredine ili pogreška reprezentativnosti karakterizira fluktuacije prosjeka. Treba napomenuti da što je veći uzorak, to je manji raspon prosječnih vrijednosti. Standardna pogreška srednje vrijednosti izračunava se pomoću formule:

U modernoj znanstvenoj literaturi aritmetička sredina se piše zajedno s pogreškom reprezentativnosti:

ili zajedno sa standardnom devijacijom:

Kao primjer, razmotrite podatke o 1500 gradskih klinika u zemlji (opća populacija). Prosječan broj pacijenata opsluženih u klinici je 18.150 ljudi. Nasumični odabir 10% mjesta (150 klinika) daje prosječan broj pacijenata od 20 051 osoba. Pogreška uzorka, očito zbog činjenice da u uzorak nije uključeno svih 1500 klinika, jednaka je razlici između tih prosjeka - općeg prosjeka ( M gen) i srednja vrijednost uzorka ( M odabran). Ako formiramo drugi uzorak iste veličine iz naše populacije, to će dati drugačiju vrijednost pogreške. Sve te srednje vrijednosti uzorka s dovoljno velikim uzorcima normalno su raspoređene oko opće srednje vrijednosti s dovoljno velikim veliki broj ponavljanja uzorka od istog broja objekata iz populacije. Standardna pogreška srednje vrijednosti m- ovo je neizbježno širenje uzoraka srednjih vrijednosti oko opće sredine.

U slučaju kada su rezultati istraživanja prikazani u relativnim količinama (npr. postocima) – izračunati standardna pogreška razlomka:

gdje je P indikator u %, n je broj opažanja.

Rezultat se prikazuje kao (P ± m)%. Na primjer, postotak oporavka među pacijentima bio je (95,2±2,5)%.

U slučaju da broj elemenata populacije, tada pri izračunavanju standardnih pogrešaka sredine i razlomka u nazivniku razlomka, umjestomora se staviti.

Za normalnu distribuciju (distribucija srednjih vrijednosti uzorka je normalna), znamo koji dio populacije spada unutar bilo kojeg intervala oko srednje vrijednosti. Posebno:

U praksi je problem što su nam karakteristike opće populacije nepoznate, a uzorak se radi upravo u svrhu njihove procjene. To znači da ako napravimo uzorke iste veličine n iz opće populacije, tada će u 68,3% slučajeva interval sadržavati vrijednost M(u 95,5% slučajeva to će biti na intervalu, au 99,7% slučajeva – na intervalu).

Budući da je zapravo uzet samo jedan uzorak, ova tvrdnja je formulirana u smislu vjerojatnosti: s vjerojatnošću od 68,3%, prosječna vrijednost atributa u populaciji nalazi se u intervalu, s vjerojatnošću od 95,5% - u intervalu itd.

U praksi, interval se gradi oko vrijednosti uzorka tako da, uz danu (dovoljno visoku) vjerojatnost, vjerojatnost povjerenja – bi “pokrila” pravu vrijednost ovog parametra u općoj populaciji. Taj se interval naziva interval pouzdanosti.

Vjerojatnost povjerenjaP ovo je stupanj pouzdanosti da će interval pouzdanosti zapravo sadržavati pravu (nepoznatu) vrijednost parametra u populaciji.

Na primjer, ako je vjerojatnost povjerenja R iznosi 90%, to znači da će 90 uzoraka od 100 dati točnu procjenu parametra u populaciji. Prema tome, vjerojatnost pogreške, tj. netočna procjena općeg prosjeka za uzorak jednaka je u postocima: . Za ovaj primjer to znači da će 10 uzoraka od 100 dati netočnu procjenu.

Očito, stupanj pouzdanosti (vjerojatnost povjerenja) ovisi o veličini intervala: što je interval širi, veća je pouzdanost da će nepoznata vrijednost za populaciju pasti u njega. U praksi se koristi najmanje dvostruka pogreška uzorkovanja za konstrukciju intervala pouzdanosti kako bi se osiguralo najmanje 95,5% pouzdanosti.

Određivanje granica pouzdanosti prosjeka i relativnih vrijednosti omogućuje nam da pronađemo njihove dvije ekstremne vrijednosti - najmanju moguću i najveću moguću, unutar kojih se proučavani pokazatelj može pojaviti u cijeloj populaciji. Na temelju toga, granice pouzdanosti (ili interval pouzdanosti)- to su granice prosječnih ili relativnih vrijednosti, izvan kojih zbog slučajnih fluktuacija postoji beznačajna vjerojatnost.

Interval pouzdanosti može se prepisati kao: , gdje t– kriterij povjerenja.

Granice pouzdanosti aritmetičke sredine u populaciji određene su formulom:

M gen = M Izaberi + t m M

za relativnu vrijednost:

R gen = P Izaberi + t m R

Gdje M gen I R gen- vrijednosti prosječnih i relativnih vrijednosti za opću populaciju; M Izaberi I R Izaberi- vrijednosti prosječnih i relativnih vrijednosti dobivenih iz uzorka populacije; m M I m P- pogreške prosječnih i relativnih vrijednosti; t- kriterij povjerenja (kriterij točnosti koji se utvrđuje pri planiranju studije i može biti jednak 2 ili 3); t m- ovo je interval pouzdanosti ili Δ - najveća pogreška pokazatelja dobivena u istraživanju uzorka.

Treba napomenuti da je vrijednost kriterija t u određenoj mjeri povezano s vjerojatnošću prognoze bez pogreške (p), izraženo u %. Odabire ga sam istraživač, vodeći se potrebom da dobije rezultat s potrebnim stupnjem točnosti. Dakle, za vjerojatnost prognoze bez pogreške od 95,5%, vrijednost kriterija t je 2, za 99,7% - 3.

Navedene procjene intervala pouzdanosti prihvatljive su samo za statističke populacije s više od 30 opažanja.Kod manje populacije (mali uzorci) koriste se posebne tablice za određivanje t kriterija. U tim se tablicama željena vrijednost nalazi na sjecištu crte koja odgovara veličini populacije (n-1) i stupac koji odgovara razini vjerojatnosti prognoze bez pogreške (95,5%; 99,7%) koju je odabrao istraživač. U medicinskim istraživanjima, pri utvrđivanju granica pouzdanosti za bilo koji pokazatelj, vjerojatnost prognoze bez pogreške je 95,5% ili više. To znači da se vrijednost pokazatelja dobivena iz uzorka populacije mora naći u općoj populaciji u najmanje 95,5% slučajeva.

    Pitanja o temi lekcije:

    Relevantnost pokazatelja raznolikosti svojstava u statističkoj populaciji.

    Opće karakteristike pokazatelja apsolutne varijacije.

    Standardna devijacija, proračun, primjena.

    Relativne mjere varijacije.

    Medijan, rezultat kvartila.

    Procjena statističke značajnosti rezultata istraživanja.

    Standardna pogreška aritmetičke sredine, formula za izračun, primjer uporabe.

    Izračunavanje udjela i njegove standardne pogreške.

    Pojam vjerojatnosti povjerenja, primjer uporabe.

10. Pojam intervala povjerenja, njegova primjena.

    Testni zadaci na temu sa standardnim odgovorima:

1. APSOLUTNI POKAZATELJI VARIJACIJE ODNOSE SE NA

1) koeficijent varijacije

2) koeficijent oscilacije

4) medijan

2. RELATIVNI POKAZATELJI VARIJACIJE ODNOSE SE

1) disperzija

4) koeficijent varijacije

3. KRITERIJ KOJI JE ODREĐEN EKSTREMNIM VRIJEDNOSTIMA OPCIJE U NIZU VARIJACIJA

2) amplituda

3) disperzija

4) koeficijent varijacije

4. RAZLIKA EKSTREMNIH OPCIJA JE

2) amplituda

3) standardna devijacija

4) koeficijent varijacije

5. PROSJEČNI KVADRAT ODSTUPANJA POJEDINIH VRIJEDNOSTI KARAKTERISTIKE OD NJENIH PROSJEČNIH VRIJEDNOSTI JE

1) koeficijent oscilacije

2) medijan

3) disperzija

6. OMJER LJESTVA VARIJACIJE I PROSJEČNE VRIJEDNOSTI KARAKTERA JE

1) koeficijent varijacije

2) standardna devijacija

4) koeficijent oscilacije

7. OMJER PROSJEČNOG KVADRATNOG ODSTUPANJA I PROSJEČNE VRIJEDNOSTI KARAKTERISTIKE JE

1) disperzija

2) koeficijent varijacije

3) koeficijent oscilacije

4) amplituda

8. OPCIJA KOJA JE U SREDINI NIZA VARIJACIJA I DIJELI GA NA DVA JEDNAKA DIJELA JE

1) medijan

3) amplituda

9. U MEDICINSKOM ISTRAŽIVANJU, KADA SE ODREĐUJU GRANICE POVJERENJA ZA BILO KOJI POKAZATELJ, PRIHVAĆA SE VJEROJATNOST PREDVIĐANJA BEZ POGREŠAKA

10. AKO 90 OD 100 UZORAKA DAJE ISPRAVNU PROCJENU PARAMETRA U POPULACIJI, TO ZNAČI DA JE VJEROJATNOST POVJERENJE P JEDNAK

11. AKO 10 UZORAKA OD 100 DAJE NETOČNU PROCJENU, VJEROJATNOST POGREŠKE JE JEDNAKA

12. GRANICE PROSJEČNIH ILI RELATIVNIH VRIJEDNOSTI, IZLAZAK IZNAD KOJIH ZBOG SLUČAJNIH OSCILACIJA IMA NEZNAČAJNU VJEROJATNOST – OVO JE

1) interval pouzdanosti

2) amplituda

4) koeficijent varijacije

13. MALIM UZORKOM SMATRA SE POPULACIJA U KOJOJ

1) n je manji ili jednak 100

2) n je manji ili jednak 30

3) n je manji ili jednak 40

4) n je blizu 0

14. ZA VJEROJATNOST PROGNOZE BEZ POGREŠKE 95% KRITERIJSKA VRIJEDNOST t JE

15. ZA VJEROJATNOST PROGNOZE BEZ POGREŠKE 99% KRITERIJSKA VRIJEDNOST t JE

16. ZA DISTRIBUCIJU BLIZU NORMALNE, POPULACIJA SE SMATRA HOMOGENOM AKO KOEFICIJENT VARIJACIJE NE PRELAZI

17. OPCIJA, RAZDJELJIVANJE OPCIJA ČIJE BROJČANE VRIJEDNOSTI NE PRELAZE 25% OD MAKSIMALNO MOGUĆIH U DATOJ NIZU – OVO JE

2) donji kvartil

3) gornji kvartil

4) kvartil

18. PODACI KOJI NE ISKRIVLJAJU I ISPRAVNO ODRAŽAVAJU OBJEKTIVNU STVARNOST ZV.

1) nemoguće

2) jednako moguće

3) pouzdan

4) slučajni

19. PREMA PRAVILU "TRI SIGME", UZ NORMALNU DISTRIBUCIJU KARAKTERISTIKE UNUTAR
ĆE SE NALAZITI

1) 68,3% opcija

Standardna devijacija je klasičan pokazatelj varijabilnosti iz deskriptivne statistike.

Standardna devijacija, standardna devijacija, Standardna devijacija, standardna devijacija uzorka (eng. standard deviation, STD, STDev) vrlo je čest pokazatelj disperzije u deskriptivnoj statistici. Ali zbog tehnička analiza je slična statistici; ovaj se pokazatelj može (i treba) koristiti u tehničkoj analizi za otkrivanje stupnja disperzije cijene analiziranog instrumenta tijekom vremena. Označava se grčkim simbolom sigma "σ".

Hvala Karlu Gaussu i Pearsonu što su nam omogućili korištenje standardne devijacije.

Korištenje standardna devijacija u tehničkoj analizi, okrećemo ovo "indeks disperzije"" V "indikator volatilnosti“, zadržavajući značenje, ali mijenjajući pojmove.

Što je standardna devijacija

Ali osim posrednih pomoćnih izračuna, standardna devijacija je sasvim prihvatljiva za neovisni izračun i primjene u tehničkoj analizi. Kao što je aktivni čitatelj našeg časopisa čičak primijetio, " I dalje mi nije jasno zašto standardna devijacija nije uključena u skup standardnih pokazatelja domaćih trgovačkih centara«.

Stvarno, standardna devijacija može mjeriti varijabilnost instrumenta na klasičan i "čist" način. No, nažalost, ovaj pokazatelj nije tako čest u analizi vrijednosnih papira.

Primjena standardne devijacije

Ručno izračunavanje standardne devijacije nije baš zanimljivo, ali korisno za iskustvo. Standardna devijacija se može izraziti formula STD=√[(∑(x-x ) 2)/n] , koja zvuči kao korijen zbroja kvadrata razlika između elemenata uzorka i srednje vrijednosti, podijeljen s brojem elemenata u uzorku.

Ako je broj elemenata u uzorku veći od 30, tada nazivnik razlomka ispod korijena ima vrijednost n-1. Inače se koristi n.

Korak po korak izračun standardne devijacije:

  1. izračunati aritmetičku sredinu uzorka podataka
  2. oduzmite ovaj prosjek od svakog elementa uzorka
  3. sve dobivene razlike kvadriramo
  4. zbroji sve dobivene kvadrate
  5. podijelite dobiveni iznos s brojem elemenata u uzorku (ili s n-1, ako je n>30)
  6. izračunajte kvadratni korijen dobivenog kvocijenta (tzv disperzija)

Definira se kao generalizirajuća karakteristika veličine varijacije svojstva u agregatu. Jednak je kvadratnom korijenu prosječnog kvadratnog odstupanja pojedinačnih vrijednosti atributa od aritmetičke sredine, tj. Korijen i može se pronaći ovako:

1. Za primarni red:

2. Za seriju varijacija:

Transformacija formule standardne devijacije dovodi je u oblik pogodniji za praktične izračune:

Standardna devijacija određuje koliko u prosjeku određene opcije odstupaju od svoje prosječne vrijednosti, a također je i apsolutna mjera varijabilnosti obilježja i izražava se u istim jedinicama kao i opcije, te se stoga dobro tumači.

Primjeri pronalaženja standardne devijacije: ,

Za alternativne karakteristike, prosječna formula kvadratno odstupanje izgleda ovako:

gdje je p udio jedinica u populaciji koje imaju određenu karakteristiku;

q je udio jedinica koje nemaju ovo svojstvo.

Pojam prosječnog linearnog odstupanja

Prosječno linearno odstupanje definira se kao aritmetička sredina apsolutnih vrijednosti odstupanja pojedinih opcija od .

1. Za primarni red:

2. Za seriju varijacija:

gdje je zbroj n zbroj učestalosti varijacijskih nizova.

Primjer pronalaženja prosječnog linearnog odstupanja:

Prednost srednjeg apsolutnog odstupanja kao mjere disperzije u rasponu varijacije je očita, jer se ova mjera temelji na uzimanju u obzir svih mogućih odstupanja. Ali ovaj pokazatelj ima značajne nedostatke. Proizvoljno odbacivanje algebarskih znakova odstupanja može dovesti do činjenice da su matematička svojstva ovog pokazatelja daleko od elementarnih. Zbog toga je vrlo teško koristiti srednju apsolutnu devijaciju pri rješavanju problema koji uključuju probabilističke izračune.

Stoga se prosječno linearno odstupanje kao mjera varijacije obilježja rijetko koristi u statističkoj praksi, naime kada zbrajanje pokazatelja bez uzimanja u obzir predznaka ima ekonomskog smisla. Pomoću njega analizira se npr. promet vanjske trgovine, sastav radnika, ritam proizvodnje itd.

Glavni trg

Primijenjen srednji kvadrat, na primjer, za izračunavanje prosječne veličine stranica n kvadratnih dijelova, prosječnih promjera debla, cijevi itd. Dijeli se na dvije vrste.

Jednostavan srednji kvadrat. Ako, prilikom zamjene pojedinačnih vrijednosti karakteristike s Prosječna vrijednost Ako je potrebno održati zbroj kvadrata izvornih vrijednosti konstantnim, tada će prosjek biti kvadratna prosječna vrijednost.

Slučajno je korijen iz kvocijenta dijeljenja zbroja kvadrata pojedinačnih vrijednosti obilježja njihovim brojem:

Ponderirani srednji kvadrat izračunava se pomoću formule:

gdje je f znak težine.

Prosječna kubna

Primjenjuje se prosječni kubni, na primjer, pri određivanju prosječne duljine stranice i kocke. Dijeli se na dvije vrste.
Prosječna kubna jednostavna:

Pri izračunavanju prosječnih vrijednosti i disperzije u serijama intervalne distribucije, prave vrijednosti atributa zamjenjuju se središnjim vrijednostima intervala, koje se razlikuju od prosjeka aritmetičke vrijednosti uključeni u interval. To dovodi do sustavne pogreške pri izračunavanju varijance. V.F. Sheppard je to utvrdio greška u izračunu varijance, uzrokovan korištenjem grupiranih podataka, iznosi 1/12 kvadrata vrijednosti intervala, kako u smjeru povećanja tako iu smjeru smanjenja veličine disperzije.

Sheppardov amandman treba koristiti ako je distribucija blizu normalne, odnosi se na karakteristiku s kontinuiranom prirodom varijacije i temelji se na značajnoj količini početnih podataka (n > 500). Međutim, na temelju činjenice da se u nekim slučajevima obje pogreške, djelujući u različitim smjerovima, kompenziraju jedna drugu, ponekad je moguće odbiti uvođenje ispravaka.

Što su manja varijanca i standardna devijacija, to će populacija biti homogenija i prosjek će biti tipičniji.
U praksi statistike često postoji potreba za usporedbom varijacija različitih karakteristika. Na primjer, od velikog je interesa usporediti varijacije u dobi radnika i njihovim kvalifikacijama, radnom stažu i veličini plaće, trošak i dobit, radni staž i produktivnost rada itd. Za takve usporedbe pokazatelji apsolutne varijabilnosti karakteristika nisu prikladni: nemoguće je usporediti varijabilnost radnog iskustva, izraženu u godinama, s varijabilnošću plaća, izraženu u rubljima.

Za provođenje takvih usporedbi, kao i usporedbi varijabilnosti istog svojstva u više populacija s različitim aritmetičkim prosjecima, koristi se relativni pokazatelj varijacije - koeficijent varijacije.

Strukturni prosjeci

Za karakterizaciju središnje tendencije u statističkim distribucijama često je racionalno koristiti, zajedno s aritmetičkom sredinom, određenu vrijednost karakteristike X, koja, zbog određenih značajki svog položaja u seriji distribucije, može karakterizirati njezinu razinu.

Ovo je posebno važno kada u seriji distribucije ekstremne vrijednosti karakteristike imaju nejasne granice. Zbog ovoga precizna definicija Aritmetička sredina je obično nemoguća ili vrlo teška. U takvim slučajevima, prosječna razina se može odrediti uzimajući, na primjer, vrijednost značajke koja se nalazi u sredini serije frekvencija ili koja se najčešće pojavljuje u trenutnoj seriji.

Takve vrijednosti ovise samo o prirodi frekvencija, tj. o strukturi distribucije. Tipične su lokacije u nizu frekvencija, stoga se takve vrijednosti smatraju karakteristikama središta distribucije i stoga su dobile definiciju strukturnih prosjeka. Koriste se za učenje unutarnja struktura i struktura niza distribucije vrijednosti atributa. Takvi pokazatelji uključuju:



 


Čitati:



Tumačenje tarot karte đavo u odnosima Što znači laso đavo

Tumačenje tarot karte đavo u odnosima Što znači laso đavo

Tarot karte vam omogućuju da saznate ne samo odgovor na uzbudljivo pitanje. Također mogu predložiti pravo rješenje u teškoj situaciji. Dovoljno za učenje...

Ekološki scenariji za ljetni kamp Kvizovi za ljetni kamp

Ekološki scenariji za ljetni kamp Kvizovi za ljetni kamp

Kviz o bajkama 1. Tko je poslao ovaj telegram: “Spasi me! Pomozite! Pojeo nas je Sivi Vuk! Kako se zove ova bajka? (Djeca, "Vuk i...

Kolektivni projekt "Rad je osnova života"

Kolektivni projekt

Prema definiciji A. Marshalla, rad je „svaki mentalni i fizički napor poduzet djelomično ili u cijelosti s ciljem postizanja nekog...

DIY hranilica za ptice: izbor ideja Hranilica za ptice iz kutije za cipele

DIY hranilica za ptice: izbor ideja Hranilica za ptice iz kutije za cipele

Napraviti vlastitu hranilicu za ptice nije teško. Zimi su ptice u velikoj opasnosti, treba ih hraniti. Zato ljudi...

feed-image RSS