Dom - Povijest popravka
Definicija standardne devijacije. standardna devijacija

Lekcija broj 4

Tema: “Opisna statistika. Pokazatelji raznolikosti svojstva u agregatu "

Glavni kriteriji za raznolikost svojstva u statističkoj populaciji su: granica, amplituda, prosjek standardna devijacija, koeficijent oscilacije i koeficijent varijacije. U prethodnoj lekciji raspravljalo se o tome da prosječne vrijednosti daju samo generalizirajuću karakteristiku proučavane osobine u agregatu i ne uzimaju u obzir vrijednosti njegovih pojedinačnih varijanti: minimalne i maksimalne vrijednosti, iznad prosjeka, ispod prosjeka itd.

Primjer. Prosječne vrijednosti dva različita brojčana niza: -100; -20; 100; 20 i 0,1; -0,2; 0,1 su potpuno isti i jednakiOKO.Međutim, rasponi raspršenosti podataka ovih relativnih srednjih nizova vrlo su različiti.

Definiranje navedenih kriterija za raznolikost svojstva prvenstveno se provodi uzimajući u obzir njegovu vrijednost za pojedine elemente statističke populacije.

Pokazatelji mjerenja varijacije svojstva su apsolutni I relativna. U apsolutne pokazatelje varijacije spadaju: raspon varijacije, granica, standardna devijacija, varijanca. Koeficijent varijacije i koeficijent oscilacije odnose se na relativne mjere varijacije.

Limit (lim)– ovo je kriterij koji je određen ekstremnim vrijednostima varijante u nizu varijacija. Drugim riječima, ovaj kriterij ograničen je minimalnim i maksimalnim vrijednostima atributa:

Amplituda (Am) ili raspon varijacija - ovo je razlika između krajnosti. Izračun ovog kriterija provodi se oduzimanjem njegove minimalne vrijednosti od maksimalne vrijednosti atributa, što omogućuje procjenu stupnja disperzije varijante:

Nedostatak limita i amplitude kao kriterija varijabilnosti je što u potpunosti ovise o ekstremnim vrijednostima svojstva u varijacijskom nizu. U ovom slučaju, fluktuacije u vrijednostima atributa unutar niza se ne uzimaju u obzir.

Najcjelovitiju karakterizaciju raznolikosti svojstva u statističkoj populaciji daje standardna devijacija(sigma), što je opća mjera odstupanja varijante od njezine srednje vrijednosti. Standardna devijacija se također često naziva standardna devijacija.

Osnova standardne devijacije je usporedba svake opcije s aritmetičkom sredinom ove populacije. Budući da će u agregatu uvijek biti opcija i manje i više od njega, tada će zbroj odstupanja s predznakom "" biti otplaćen zbrojem odstupanja s predznakom "", tj. zbroj svih odstupanja je nula. Da bi se izbjegao utjecaj predznaka razlika, uzimaju se odstupanja varijante od kvadrata aritmetičke sredine, tj. . Zbroj kvadrata odstupanja nije jednak nuli. Da biste dobili koeficijent koji može mjeriti varijabilnost, uzmite prosjek zbroja kvadrata - ta se vrijednost naziva disperzija:

Prema definiciji, varijanca je srednji kvadrat odstupanja pojedinačnih vrijednosti obilježja od njegove srednje vrijednosti. Disperzija kvadrat standardne devijacije .

Disperzija je dimenzionalna veličina (nazvana). Dakle, ako su varijante niza brojeva izražene u metrima, tada disperzija daje kvadratne metre; ako su varijante izražene u kilogramima, tada varijanca daje kvadrat ove mjere (kg 2), i tako dalje.

Standardna devijacija je kvadratni korijen varijance:

, tada pri izračunavanju varijance i standardne devijacije u nazivniku razlomka, umjestopotrebno je staviti.

Izračun standardne devijacije može se podijeliti u šest faza, koje se moraju provesti određenim redoslijedom:

Primjena standardne devijacije:

a) prosuditi kolebanje varijacijskih nizova i usporednu ocjenu tipičnosti (reprezentativnosti) aritmetičkih sredina. To je potrebno u diferencijalnoj dijagnozi pri određivanju stabilnosti znakova.

b) za rekonstrukciju varijacijskog niza, tj. obnavljanje njegovog frekvencijskog odziva na temelju pravila tri sigme. U intervalu (M±3σ) nalazi se 99,7% svih varijanti niza, u intervalu (M±2σ) - 95,5% iu intervalu (M±1σ) - 68,3% opcija reda(Sl. 1).

c) za prepoznavanje "skočnih" opcija

d) odrediti parametre norme i patologije pomoću sigma procjena

e) izračunati koeficijent varijacije

e) izračunati prosječnu grešku aritmetičke sredine.

Za karakterizaciju bilo koje opće populacije koja imatip normalne distribucije , dovoljno je znati dva parametra: aritmetičku sredinu i standardnu ​​devijaciju.

Slika 1. Pravilo tri sigme

Primjer.

U pedijatriji se standardna devijacija koristi za procjenu tjelesnog razvoja djece usporedbom podataka određenog djeteta s odgovarajućim standardnim pokazateljima. Kao standard uzeti su aritmetički srednji pokazatelji tjelesnog razvoja zdrave djece. Usporedba pokazatelja sa standardima provodi se prema posebnim tablicama, u kojima su navedeni standardi zajedno s pripadajućim sigma skalama. Smatra se da ako je pokazatelj tjelesnog razvoja djeteta unutar standarda (aritmetička sredina) ±σ, tada tjelesni razvoj dijete (prema ovom pokazatelju) odgovara normi. Ako je pokazatelj unutar standarda ±2σ, tada postoji malo odstupanje od norme. Ako pokazatelj prelazi ove granice, tada se fizički razvoj djeteta oštro razlikuje od norme (patologija je moguća).

Osim pokazatelja varijacije izraženih u apsolutnim vrijednostima, u statističkim istraživanjima koriste se i pokazatelji varijacije izraženi u relativnim vrijednostima. Koeficijent oscilacije - ovo je omjer raspona varijacije i prosječne vrijednosti svojstva. Koeficijent varijacije - je omjer standardne devijacije prema prosjek znak. Obično se te vrijednosti izražavaju u postocima.

Formule za izračunavanje relativnih pokazatelja varijacije:

Iz gornjih formula se vidi da što je veći koeficijent V blizu nule, manja je varijacija vrijednosti svojstva. Više V, što je predznak promjenjiviji.

U statističkoj praksi najčešće se koristi koeficijent varijacije. Koristi se ne samo za komparativnu procjenu varijacije, već i za karakterizaciju homogenosti populacije. Skup se smatra homogenim ako koeficijent varijacije ne prelazi 33% (za distribucije bliske normalnim). Aritmetički gledano, omjer σ i aritmetičke sredine eliminira utjecaj apsolutna vrijednost ovih karakteristika, a postotak čini koeficijent varijacije bezdimenzionalnom (neimenovanom) vrijednošću.

Dobivena vrijednost koeficijenta varijacije procjenjuje se u skladu s približnim gradacijama stupnja raznolikosti svojstva:

Slab - do 10%

Prosjek - 10 - 20%

Snažan - više od 20%

Korištenje koeficijenta varijacije preporučljivo je u slučajevima kada je potrebno usporediti značajke koje se razlikuju po veličini i dimenzijama.

Razlika između koeficijenta varijacije i drugih kriterija raspršenosti jasno je prikazana na primjer.

stol 1

Sastav zaposlenih u industrijskom poduzeću

Na temelju statističkih karakteristika navedenih u primjeru može se zaključiti da su dobni sastav i obrazovna razina zaposlenika poduzeća relativno homogeni, uz nisku profesionalnu stabilnost ispitanog kontingenta. Lako je uočiti da bi pokušaj prosuđivanja ovih društvenih kretanja standardnom devijacijom doveo do pogrešnog zaključka, a pokušaj usporedbe računovodstvenih obilježja "radno iskustvo" i "dob" s računovodstvenim obilježjem "obrazovanje" općenito bi bio netočan zbog heterogenosti tih obilježja.

Medijan i percentili

Za ordinalne (rang) distribucije, gdje je kriterij za sredinu niza medijan, standardna devijacija i varijanca ne mogu poslužiti kao karakteristike disperzije varijante.

Isto vrijedi i za otvorene varijacijske serije. Ova okolnost je zbog činjenice da se odstupanja, prema kojima se izračunavaju disperzija i σ, računaju od aritmetičke sredine, koja se ne izračunava u otvorenim varijacijskim serijama i u serijama distribucija kvalitativnih značajki. Stoga se za komprimirani opis distribucija koristi drugi parametar raspršenja - kvantil(sinonim - "percentil"), pogodan za opisivanje kvalitativnih i kvantitativnih karakteristika u bilo kojem obliku njihove distribucije. Ovaj se parametar također može koristiti za pretvaranje kvantitativnih značajki u kvalitativne. U ovom slučaju, takvi se rezultati dodjeljuju ovisno o tome koji redoslijed kvantila odgovara jednoj ili drugoj specifičnoj opciji.

U praksi biomedicinskih istraživanja najčešće se koriste sljedeći kvantili:

– medijan;

, su kvartili (četvrtine), gdje je donji kvartil, gornji kvartil.

Kvantili dijele područje mogućih promjena u varijacijskom nizu na određene intervale. Medijan (kvantil) je varijanta koja se nalazi u sredini varijacijskog niza i dijeli ga na pola, na dva jednaka dijela ( 0,5 I 0,5 ). Kvartil dijeli niz na četiri dijela: prvi dio (donji kvartil) je opcija koja razdvaja opcije čije brojčane vrijednosti ne prelaze 25% maksimalno moguće u ovaj red, kvartil odvaja opcije s numeričkom vrijednošću do 50% najveće moguće. Gornji kvartil () odvaja opcije do 75% maksimalnih mogućih vrijednosti.

U slučaju asimetrične distribucije varijabla u odnosu na aritmetičku sredinu, medijan i kvartili koriste se za njezino obilježavanje. U ovom slučaju koristi se sljedeći oblik prikaza prosječne vrijednosti - Mi (;). Na primjer, ispitivana osobina - "razdoblje u kojem je dijete počelo samostalno hodati" - u ispitivanoj skupini ima asimetričnu distribuciju. U isto vrijeme, donji kvartil () odgovara početku hodanja - 9,5 mjeseci, medijan - 11 mjeseci, gornji kvartil () - 12 mjeseci. Sukladno tome, karakteristika prosječnog trenda navedenog atributa bit će prikazana kao 11 (9,5; 12) mjeseci.

Procjena statističke značajnosti rezultata istraživanja

Pod statističkom značajnošću podataka podrazumijeva se stupanj njihove podudarnosti prikazanoj stvarnosti, tj. Statistički značajni podaci su oni koji ne iskrivljuju i ispravno odražavaju objektivnu stvarnost.

Ocijeniti statističku značajnost rezultata istraživanja znači utvrditi s kojom je vjerojatnošću moguće prenijeti rezultate dobivene na uzorku populacije na cjelokupnu populaciju. Procjena statističke značajnosti neophodna je kako bi se razumjelo koliko se dio fenomena može koristiti za prosudbu fenomena kao cjeline i njegovih obrazaca.

Procjena statističke značajnosti rezultata istraživanja sastoji se od:

1. pogreške reprezentativnosti (pogreške prosječnih i relativnih vrijednosti) - m;

2. granice pouzdanosti prosječnih ili relativnih vrijednosti;

3. pouzdanost razlike između prosječnih ili relativnih vrijednosti prema kriteriju t.

Standardna greška aritmetičke sredine ili pogreška reprezentativnosti karakterizira fluktuacije u prosjeku. Treba napomenuti da što je veći uzorak, to je manji raspon prosječnih vrijednosti. Standardna pogreška srednje vrijednosti izračunava se formulom:

U modernoj znanstvenoj literaturi aritmetička sredina se piše zajedno s pogreškom reprezentativnosti:

ili zajedno sa standardnom devijacijom:

Kao primjer, razmotrite podatke za 1500 gradskih poliklinika u zemlji (opća populacija). Prosječan broj pacijenata opsluženih u poliklinici je 18150 osoba. Slučajnim odabirom 10% objekata (150 poliklinika) prosječan broj pacijenata iznosi 20051 osoba. Pogreška uzorka, očito povezana s činjenicom da u uzorak nije uključeno svih 1500 poliklinika, jednaka je razlici između tih prosjeka - općeg prosjeka ( M gen) i srednja vrijednost uzorka ( M sb). Ako formiramo drugi uzorak iste veličine iz naše populacije, to će dati različitu količinu pogreške. Sve ove srednje vrijednosti uzorka za dovoljno velike uzorke normalno su raspoređene oko opće srednje vrijednosti za dovoljno veliki brojevi ponavljanja uzorka od istog broja objekata iz opće populacije. Standardna pogreška srednje vrijednosti m je neizbježno širenje uzoraka srednjih vrijednosti oko opće sredine.

U slučaju kada su rezultati studije predstavljeni relativnim vrijednostima (na primjer, postocima), podijeli standardnu ​​pogrešku:

gdje je P indikator u %, n je broj opažanja.

Rezultat se prikazuje kao (P ± m)%. Na primjer, postotak oporavka među pacijentima bio je (95,2±2,5)%.

Ako broj elemenata u populaciji, tada pri izračunavanju standardnih pogrešaka sredine i udjela u nazivniku razlomka, umjestopotrebno je staviti.

Za normalnu distribuciju (distribucija srednjih vrijednosti uzorka je normalna), poznato je koliko populacije spada unutar bilo kojeg intervala oko srednje vrijednosti. Posebno:

U praksi, problem je u tome što su nam karakteristike opće populacije nepoznate, a uzorak se radi upravo u svrhu njihove procjene. To znači da ako uzmemo uzorke iste veličine n iz opće populacije, tada će u 68,3% slučajeva interval sadržavati vrijednost M(bit će na intervalu u 95,5% slučajeva i na intervalu u 99,7% slučajeva).

Budući da je zapravo napravljen samo jedan uzorak, ova tvrdnja je formulirana u terminima vjerojatnosti: s vjerojatnošću od 68,3%, prosječna vrijednost atributa u općoj populaciji sadržana je u intervalu, s vjerojatnošću od 95,5% - u intervalu itd.

U praksi se takav interval gradi oko vrijednosti uzorka, koja bi sa zadanom (dovoljno visokom) vjerojatnošću - vjerojatnost povjerenja - bi “pokrila” pravu vrijednost ovog parametra u općoj populaciji. Taj se interval naziva interval pouzdanosti.

Vjerojatnost povjerenjaP je stupanj pouzdanosti da će interval pouzdanosti doista sadržavati pravu (nepoznatu) vrijednost parametra u populaciji.

Na primjer, ako je razina povjerenja R jednako 90%, to znači da će 90 uzoraka od 100 dati točnu procjenu parametra u općoj populaciji. Prema tome, vjerojatnost pogreške, tj. netočna procjena općeg prosjeka za uzorak, jednaka je u postocima: . Za ovaj primjer to znači da će 10 uzoraka od 100 dati netočnu procjenu.

Očito, stupanj pouzdanosti (vjerojatnost povjerenja) ovisi o veličini intervala: što je interval širi, veća je pouzdanost da će nepoznata vrijednost za opću populaciju pasti u njega. U praksi se uzima najmanje dvostruko veća pogreška uzorkovanja da bi se konstruirao interval pouzdanosti kako bi se osiguralo najmanje 95,5% pouzdanosti.

Određivanje granica pouzdanosti prosječnih i relativnih vrijednosti omogućuje nam da pronađemo njihove dvije ekstremne vrijednosti - najmanju moguću i najveću moguću, unutar kojih se pokazatelj koji se proučava može pojaviti u cijeloj općoj populaciji. Na temelju toga, granice pouzdanosti (ili interval pouzdanosti)- to su granice prosječnih ili relativnih vrijednosti, odlazak preko kojih zbog slučajnih fluktuacija ima beznačajnu vjerojatnost.

Interval pouzdanosti može se prepisati kao: , gdje t je kriterij povjerenja.

Granice pouzdanosti aritmetičke sredine u općoj populaciji određene su formulom:

M gen = M Izaberi + t m M

za relativnu vrijednost:

R gen = P Izaberi + t m R

Gdje M gen I R gen- vrijednosti prosječnih i relativnih vrijednosti za opću populaciju; M Izaberi I R Izaberi- vrijednosti prosječnih i relativnih vrijednosti dobivenih na uzorku populacije; m M I m P- pogreške prosječnih i relativnih vrijednosti; t- kriterij povjerenja (kriterij točnosti koji se postavlja pri planiranju studije i može biti jednak 2 ili 3); t m- ovo je interval pouzdanosti ili Δ - granična pogreška pokazatelja dobivenog u istraživanju uzorka.

Treba napomenuti da je vrijednost kriterija t u određenoj je mjeri povezana s vjerojatnošću prognoze bez pogreške (p), izraženom u %. Odabire ga sam istraživač, vodeći se potrebom da dobije rezultat s potrebnim stupnjem točnosti. Dakle, za vjerojatnost prognoze bez pogreške od 95,5%, vrijednost kriterija t je 2, za 99,7% - 3.

Navedene procjene intervala pouzdanosti prihvatljive su samo za statističke populacije s više od 30 promatranja, a kod manje populacije (mali uzorci) koriste se posebne tablice za određivanje kriterija t. U tim se tablicama željena vrijednost nalazi na sjecištu crte koja odgovara veličini populacije (n-1), i stupac koji odgovara razini vjerojatnosti prognoze bez pogreške (95,5%; 99,7%) koju je odabrao istraživač. U medicinskim istraživanjima, pri utvrđivanju granica pouzdanosti za bilo koji pokazatelj, vjerojatnost prognoze bez pogreške je 95,5% ili više. To znači da se vrijednost pokazatelja dobivena na uzorku populacije mora naći u općoj populaciji u najmanje 95,5% slučajeva.

    Pitanja o temi lekcije:

    Relevantnost pokazatelja raznolikosti svojstva u statističkoj populaciji.

    Opće karakteristike apsolutnih pokazatelja varijacije.

    Standardna devijacija, proračun, primjena.

    Relativni pokazatelji varijacije.

    Medijan, rezultat kvartila.

    Procjena statističke značajnosti rezultata istraživanja.

    Standardna pogreška aritmetičke sredine, formula za izračun, primjer uporabe.

    Izračun udjela i njegove standardne pogreške.

    Pojam vjerojatnosti povjerenja, primjer uporabe.

10. Pojam intervala povjerenja, njegova primjena.

    Testni zadaci na temu s oglednim odgovorima:

1. APSOLUTNI POKAZATELJI VARIJACIJE SU

1) koeficijent varijacije

2) koeficijent oscilacije

4) medijan

2. RELATIVNI POKAZATELJI VARIJACIJE SU

1) disperzija

4) koeficijent varijacije

3. KRITERIJ ODREĐEN EKSTREMNIM VRIJEDNOSTIMA VARIJANTE U NIZU VARIJACIJA

2) amplituda

3) disperzija

4) koeficijent varijacije

4. RAZLIKA EKSTREMNE OPCIJE JE

2) amplituda

3) prosječan standardna devijacija

4) koeficijent varijacije

5. SREDNJI KVADRAT ODSTUPANJA POJEDINIH ZNAČAJNIH VRIJEDNOSTI OD NJEGOVE PROSJEČNE VRIJEDNOSTI JE

1) koeficijent oscilacije

2) medijan

3) disperzija

6. OMJER RASPONA VARIJACIJE I PROSJEČNE VRIJEDNOSTI ZNAČAJKE JE

1) koeficijent varijacije

2) standardna devijacija

4) koeficijent oscilacije

7. OMJER SREDNJE KVADRATNE DEVIJACIJE I PROSJEČNE VRIJEDNOSTI OBILJEŽJA JE

1) disperzija

2) koeficijent varijacije

3) koeficijent oscilacije

4) amplituda

8. VARIJANTA KOJA JE U SREDINI NIZA VARIJACIJA I DIJELI GA NA DVA JEDNAKA DIJELA JE

1) medijan

3) amplituda

9. U MEDICINSKIM ISTRAŽIVANJIMA, KOD UTVRĐIVANJA GRANICA POVJERENJA BILO KOG POKAZATELJA, PRIHVAĆA SE VJEROJATNOST PREDVIĐANJA BEZ POGREŠAKA

10. AKO 90 UZORAKA OD 100 DAJE ISPRAVNU PROCJENU PARAMETRA U OPĆOJ POPULACIJI, ONDA TO ZNAČI DA JE VJEROJATNOST POVJERENJA P JEDNAK

11. U SLUČAJU AKO 10 OD 100 UZORAKA DA NETOČNU PROCJENU, VJEROJATNOST POGREŠKE JE

12. GRANICE PROSJEČNIH ILI RELATIVNIH VRIJEDNOSTI, POSTOJI MALA VJEROJATNOST DA SE IZLAZI IZNAD GRANICA ZBOG NASUOMIČNIH OSCILACIJA - OVO

1) interval pouzdanosti

2) amplituda

4) koeficijent varijacije

13. MALIM UZORKOM SMATRA SE POPULACIJA U KOJOJ

1) n je manji ili jednak 100

2) n je manji ili jednak 30

3) n je manji ili jednak 40

4) n je blizu 0

14. ZA VJEROJATNOST PROGNOZE BEZ POGREŠKE 95% KRITERIJSKA VRIJEDNOST t KOMPONIRA

15. ZA VJEROJATNOST PROGNOZE BEZ POGREŠKE 99% KRITERIJSKA VRIJEDNOST t KOMPONIRA

16. ZA DISTRIBUCIJU BLIZU NORMALNE, POPULACIJA SE SMATRA HOMOGENOM AKO KOEFICIJENT VARIJACIJE NE PRELAZI

17. OPCIJA RAZDJELJIVANJA VARIJANTI ČIJE BROJČANE VRIJEDNOSTI NE PRELAZE 25% OD MAKSIMALNO MOGUĆIH U OVOM RETU JE

2) donji kvartil

3) gornji kvartil

4) kvartil

18. PODACI KOJI NE ISKRIVLJAJU I ISPRAVNO ODRAŽAVAJU OBJEKTIVNU STVARNOST ZV.

1) nemoguće

2) jednako moguće

3) pouzdan

4) slučajni

19. PREMA PRAVILU TRI ZNAKA, UZ NORMALNU DISTRIBUCIJU ZNAKA UNUTAR
ĆE SE NALAZITI

1) 68,3% opcija

Standardna devijacija je klasičan pokazatelj varijabilnosti iz deskriptivne statistike.

Standardna devijacija, standardna devijacija, RMS, standardna devijacija uzorka (engleski standard deviation, STD, STDev) je vrlo česta mjera disperzije u deskriptivnoj statistici. Ali zbog tehnička analiza je slična statistici, ovaj se pokazatelj može (i treba) koristiti u tehničkoj analizi za otkrivanje stupnja disperzije cijene analiziranog instrumenta tijekom vremena. Označava se grčkim simbolom sigma "σ".

Hvala Karlu Gaussu i Pearsonu što imamo priliku koristiti standardnu ​​devijaciju.

Korištenje standardna devijacija u tehničkoj analizi, okrećemo ovo "indeks raspršenosti" V "indikator volatilnosti“Zadržavajući značenje, ali mijenjajući uvjete.

Što je standardna devijacija

No, pored posrednih pomoćnih izračuna, standardna devijacija je sasvim prihvatljiva za samoizračun i primjene u tehničkoj analizi. Kao što je primijetio aktivni čitatelj našeg časopisa čičak, " Još uvijek ne razumijem zašto RMS nije uključen u skup standardnih pokazatelja domaćih prodajnih centara«.

Stvarno, standardna devijacija može na klasičan i "čist" način mjeriti varijabilnost instrumenta. No, nažalost, ovaj pokazatelj nije tako čest u analizi vrijednosnih papira.

Primjena standardne devijacije

Ručno izračunavanje standardne devijacije nije baš zanimljivo. ali korisno za iskustvo. Standardna devijacija se može izraziti formula STD=√[(∑(x-x) 2)/n], koja zvuči kao korijen zbroja kvadrata razlika između stavki uzorka i srednje vrijednosti, podijeljen s brojem stavki u uzorku.

Ako je broj elemenata u uzorku veći od 30, tada nazivnik razlomka pod korijenom poprima vrijednost n-1. Inače se koristi n.

korak po korak izračun standardne devijacije:

  1. izračunati aritmetičku sredinu uzorka podataka
  2. oduzmite ovaj prosjek od svakog elementa uzorka
  3. sve dobivene razlike su na kvadrat
  4. zbroji sve dobivene kvadrate
  5. podijelite dobiveni zbroj s brojem elemenata u uzorku (ili s n-1 ako je n>30)
  6. izračunajte kvadratni korijen dobivenog kvocijenta (tzv disperzija)

Najsavršenija karakteristika varijacije je standardna devijacija, koja se naziva standard (ili standardna devijacija). Standardna devijacija() jednak je kvadratnom korijenu srednje kvadratne vrijednosti odstupanja pojedinih vrijednosti obilježja od aritmetičke sredine:

Standardna devijacija je jednostavna:

Ponderirana standardna devijacija primjenjuje se za grupirane podatke:

Između srednje kvadratne i srednje linearne devijacije u uvjetima normalne distribucije postoji odnos: ~ 1,25.

Standardna devijacija, kao glavna apsolutna mjera varijacije, koristi se u određivanju vrijednosti ordinata krivulje normalne distribucije, u izračunima koji se odnose na organizaciju promatranja uzorka i utvrđivanju točnosti karakteristika uzorka, kao iu procjeni granica varijacije svojstva u homogenoj populaciji.

Disperzija, njezine vrste, standardna devijacija.

Varijanca slučajne varijable- mjera širenja dane slučajne varijable, tj. njezino odstupanje od matematičkog očekivanja. U statistici se često koristi oznaka ili. Korijen varijance naziva se standardna devijacija, standardna devijacija ili standardni raspon.

Ukupna varijanca (σ2) mjeri varijaciju svojstva u cijeloj populaciji pod utjecajem svih čimbenika koji su uzrokovali tu varijaciju. Istovremeno, zahvaljujući metodi grupiranja, moguće je izolirati i izmjeriti varijaciju zbog značajke grupiranja, te varijaciju koja nastaje pod utjecajem neuračunatih čimbenika.

Međugrupna varijanca (σ 2 m.gr) karakterizira sustavnu varijaciju, tj. razlike u veličini proučavanog svojstva koje nastaju pod utjecajem svojstva - faktora koji je u osnovi grupiranja.

standardna devijacija(sinonimi: standardna devijacija, standardna devijacija, standardna devijacija; slični pojmovi: standardna devijacija, standardno širenje) - u teoriji vjerojatnosti i statistici najčešći pokazatelj disperzije vrijednosti slučajne varijable u odnosu na njezino matematičko očekivanje. Kod ograničenih nizova uzoraka vrijednosti umjesto matematičkog očekivanja koristi se aritmetička sredina skupa uzoraka.

Standardna devijacija se mjeri u jedinicama same slučajne varijable i koristi se kada se izračunava standardna pogreška aritmetičke sredine, kada se konstruiraju intervali pouzdanosti, kada se statistički testiraju hipoteze, kada se mjeri linearni odnos između slučajne varijable. Definira se kao kvadratni korijen varijance slučajne varijable.


Standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable x u odnosu na svoje matematičko očekivanje temeljeno na nepristranoj procjeni njegove varijance):

gdje je disperzija; — ja-th element uzorka; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrane. U opći slučaj nemoguće je konstruirati nepristranu procjenu. Međutim, procjena temeljena na nepristranoj procjeni varijance je dosljedna.

Bit, opseg i postupak određivanja modusa i medijana.

Uz prosjeke zakona potencije u statistici za relativnu karakteristiku veličine varijabilnog atributa i unutarnja struktura serije distribucije koriste strukturne prosjeke, koji su predstavljeni uglavnom način i medijan.

Moda- Ovo je najčešća varijanta serije. Moda se koristi, primjerice, u određivanju veličine odjeće, obuće, za kojima su kupci najtraženiji. Način rada za diskretnu seriju je varijanta s najvećom frekvencijom. Prilikom izračunavanja moda za seriju varijacija intervala, prvo morate odrediti modalni interval (po maksimalnoj frekvenciji), a zatim vrijednost modalne vrijednosti atributa prema formuli:

- - modna vrijednost

- - donja granica modalnog intervala

- - vrijednost intervala

- - frekvencija modalnog intervala

- - frekvencija intervala koji prethodi modalnom

- - frekvencija intervala koji slijedi nakon modala

Medijan - ovo je vrijednost značajke koja je u osnovi rangirane serije i dijeli ovu seriju na dva jednaka dijela.

Da biste odredili medijan u diskretnom nizu u prisutnosti frekvencija, prvo izračunajte poluzbroj frekvencija, a zatim odredite koja vrijednost varijante pada na njega. (Ako sortirani redak sadrži neparan broj značajki, tada se srednji broj izračunava formulom:

M e \u003d (n (broj značajki u agregatu) + 1) / 2,

u slučaju parnog broja obilježja, medijan će biti jednak prosjeku dvaju obilježja u sredini reda).

Pri proračunu medijani za niz intervalnih varijacija najprije odredite interval medijana unutar kojeg se medijan nalazi, a zatim vrijednost medijana prema formuli:

- je željeni medijan

- je donja granica intervala koji sadrži medijan

- - vrijednost intervala

- - zbroj učestalosti ili broj članova niza

Zbroj akumuliranih frekvencija intervala koji prethode medijanu

- je frekvencija srednjeg intervala

Primjer. Pronađite modus i medijan.

Riješenje:
U ovaj primjer modalni interval je unutar dobne skupine od 25-30 godina, budući da ovaj interval ima najveću učestalost (1054).

Izračunajmo vrijednost moda:

To znači da je modalna dob učenika 27 godina.

Izračunajte medijan. Interval medijana je u dobnoj skupini od 25-30 godina, jer unutar ovog intervala postoji varijanta koja populaciju dijeli na dva jednaka dijela (Σf i /2 = 3462/2 = 1731). Zatim zamijenimo potrebne numeričke podatke u formulu i dobijemo vrijednost medijana:

To znači da je polovica studenata mlađa od 27,4 godine, a druga polovica starija od 27,4 godine.

Osim modusa i medijana, mogu se koristiti indikatori kao što su kvartili, koji dijele rangirani niz na 4 jednaka dijela, decili- 10 dijelova i percentila - na 100 dijelova.

Pojam selektivnog promatranja i njegov opseg.

Selektivno promatranje primjenjuje se pri primjeni kontinuiranog promatranja fizički nemoguće zbog velike količine podataka ili ekonomski nepraktično. Fizička nemogućnost javlja se, primjerice, pri proučavanju protoka putnika, tržišnih cijena, obiteljskih proračuna. Ekonomska nesvrsishodnost javlja se pri procjeni kvalitete robe povezane s njihovim uništenjem, na primjer, kušanjem, ispitivanjem opeke na čvrstoću itd.

Statističke jedinice odabrane za promatranje čine uzorak ili uzorak, a cijeli njihov niz - opću populaciju (GS). U ovom slučaju, broj jedinica u uzorku označava n, au cijelom HS - N. Stav n/n naziva se relativna veličina ili udio uzorka.

Kvaliteta rezultata uzorkovanja ovisi o reprezentativnosti uzorka, odnosno koliko je reprezentativan u HS-u. Da bi se osigurala reprezentativnost uzorka, potrebno je promatrati princip slučajnog odabira jedinica, što pretpostavlja da na uključivanje HS jedinice u uzorak ne može utjecati niti jedan drugi čimbenik osim slučajnosti.

postoji 4 načina slučajnog odabira uzorkovati:

  1. Zapravo nasumično selekcija ili "metoda lutrije", kada se statističkim vrijednostima, upisanim na određene objekte (primjerice, bačve), dodjeljuju serijski brojevi, koji se zatim miješaju u nekoj posudi (primjerice u vrećici) i nasumično biraju. U praksi se ova metoda provodi pomoću generatora slučajni brojevi ili matematičke tablice slučajnih brojeva.
  2. Mehanički izbor, prema kojem svaki ( N/n)-tu vrijednost opće populacije. Na primjer, ako sadrži 100 000 vrijednosti, a vi želite odabrati 1000, tada će svaka 100 000 / 1000 = 100. vrijednost pasti u uzorak. Štoviše, ako nisu rangirani, tada se prvi odabire nasumično od prvih sto, a brojevi ostalih bit će sto veći. Na primjer, ako je jedinica broj 19 bila prva, onda bi broj 119 trebao biti sljedeći, zatim broj 219, zatim broj 319, i tako dalje. Ako su jedinice populacije rangirane, prvo se odabire #50, zatim #150, zatim #250 i tako dalje.
  3. Izvodi se odabir vrijednosti iz heterogenog niza podataka stratificiran(stratificirana) metoda, kada se opća populacija prethodno podijeli u homogene skupine, na koje se primjenjuje slučajna ili mehanička selekcija.
  4. Posebna metoda uzorkovanja je serijski selekcija, pri kojoj se nasumično ili mehanički ne biraju pojedinačne veličine, već njihove serije (nizovi od nekog broja do nekog uzastopnog), unutar kojih se provodi kontinuirano promatranje.

Kvaliteta promatranja uzorka također ovisi o vrsta uzorkovanja: ponovljeno ili neponavljajuće.

Na ponovni odabir statističke vrijednosti ili njihove serije koje su ušle u uzorak vraćaju se općoj populaciji nakon upotrebe, imajući priliku ući u novi uzorak. Istodobno, sve vrijednosti opće populacije imaju jednaku vjerojatnost da budu uključene u uzorak.

Odabir koji se ne ponavlja znači da se statističke vrijednosti ili njihove serije uključene u uzorak ne vraćaju općoj populaciji nakon upotrebe, pa se stoga povećava vjerojatnost ulaska u sljedeći uzorak za preostale vrijednosti potonjeg.

Uzorkovanje koje se ne ponavlja daje točnije rezultate, pa se češće koristi. Ali postoje situacije kada se ne može primijeniti (proučavanje tokova putnika, potražnje potrošača itd.) i tada se provodi ponovni odabir.

Granična pogreška uzorka promatranja, prosječna pogreška uzorka, redoslijed kojim su izračunate.

Razmotrimo detaljno gore navedene metode formiranja uzorka populacije i pogreške koje se pojavljuju u ovom slučaju. reprezentativnost .
Zapravo-nasumično uzorak se temelji na slučajnom odabiru jedinica iz opće populacije bez ikakvih elemenata dosljednosti. Tehnički, pravilan slučajni odabir provodi se izvlačenjem ždrijeba (na primjer, lutrija) ili pomoću tablice slučajnih brojeva.

Stvarno-slučajni odabir "u svom čistom obliku" u praksi selektivnog promatranja rijetko se koristi, ali je početni među ostalim vrstama odabira, njime se implementiraju temeljna načela selektivnog promatranja. Razmotrimo neka pitanja teorije metode uzorkovanja i formule pogreške za jednostavan slučajni uzorak.

Pogreška uzorkovanja- to je razlika između vrijednosti parametra u općoj populaciji i njegove vrijednosti izračunate iz rezultata promatranja uzorka. Za prosječno kvantitativno obilježje, pogreška uzorkovanja određena je

Pokazatelj se naziva granična pogreška uzorkovanja.
Srednja vrijednost uzorka je slučajna varijabla koja može uzeti razna značenja ovisno o tome koje su jedinice bile uključene u uzorak. Stoga su greške uzorkovanja također slučajne varijable i mogu poprimiti različite vrijednosti. Stoga se određuje prosjek moguće greške - srednja pogreška uzorkovanja, što ovisi o:

Veličina uzorka: što je veći broj, to je manja prosječna pogreška;

Stupanj promjene proučavanog svojstva: što je manja varijacija svojstva, a time i varijanca, to je manja prosječna pogreška uzorkovanja.

Na slučajni ponovni odabir izračunava se prosječna greška:
.
U praksi, opća varijanca nije točno poznata, ali u teorija vjerojatnosti dokazao da
.
Budući da je vrijednost za dovoljno veliki n blizu 1, možemo pretpostaviti da je . Tada se može izračunati srednja pogreška uzorkovanja:
.
Ali u slučajevima malog uzorka (za br<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Na slučajno uzorkovanje zadane formule ispravljaju se za vrijednost . Tada je prosječna pogreška neuzorkovanja:
I .
Jer je uvijek manji od , tada je faktor () uvijek manji od 1. To znači da je prosječna pogreška u neponavljajućem odabiru uvijek manja nego u ponovljenom odabiru.
Mehaničko uzorkovanje koristi se kada je opća populacija na neki način poredana (primjerice, popisi birača po abecedi, telefonski brojevi, kućni brojevi, stanovi). Odabir jedinica provodi se u određenom intervalu, koji je jednak recipročnoj vrijednosti postotka uzorka. Dakle, s uzorkom od 2% odabire se svakih 50 jedinica = 1 / 0,02, s 5% svakih 1 / 0,05 = 20 jedinica opće populacije.

Ishodište se bira na različite načine: nasumično, iz sredine intervala, s promjenom ishodišta. Glavna stvar je izbjeći sustavnu pogrešku. Na primjer, s uzorkom od 5%, ako je 13. izabran kao prva jedinica, onda sljedećih 33, 53, 73 itd.

U smislu točnosti, mehanički odabir je blizak ispravnom slučajnom uzorkovanju. Stoga se za određivanje prosječne pogreške mehaničkog uzorkovanja koriste formule pravilnog slučajnog odabira.

Na tipičan izbor ispitana populacija je preliminarno podijeljena u homogene grupe jednog tipa. Na primjer, kada se anketiraju poduzeća, to mogu biti industrije, podsektori, dok se proučava stanovništvo - područja, društvene ili dobne skupine. Zatim se vrši neovisni odabir iz svake skupine na mehanički ili odgovarajući slučajni način.

Tipično uzorkovanje daje točnije rezultate od drugih metoda. Tipizacijom opće populacije osigurava se zastupljenost svake tipološke skupine u uzorku, čime je moguće isključiti utjecaj međugrupne varijance na prosječnu pogrešku uzorka. Stoga, pri pronalaženju pogreške tipičnog uzorka prema pravilu zbrajanja varijanci (), potrebno je uzeti u obzir samo prosjek varijanci grupe. Tada je srednja vrijednost greške uzorkovanja:
u ponovnom odabiru
,
s odabirom koji se ne ponavlja
,
Gdje je srednja vrijednost varijanci unutar grupe u uzorku.

Serijski (ili ugniježđeni) odabir koristi se kada je populacija podijeljena u serije ili skupine prije početka istraživanja uzorka. Ove serije mogu biti paketi gotovih proizvoda, studentskih grupa, timova. Serije za ispitivanje odabiru se mehanički ili slučajno, a unutar serije provodi se kompletan pregled jedinica. Stoga prosječna pogreška uzorkovanja ovisi samo o međugrupnoj (međuserijskoj) varijanci koja se izračunava po formuli:

gdje je r broj odabranih serija;
- prosjek i-te serije.

Prosječna pogreška serijskog uzorkovanja izračunava se:

pri ponovnom odabiru:
,
s odabirom koji se ne ponavlja:
,
gdje je R ukupan broj serija.

Kombinirano izbor je kombinacija razmatranih metoda selekcije.

Prosječna pogreška uzorkovanja za bilo koju metodu odabira ovisi uglavnom o apsolutnoj veličini uzorka i, u manjoj mjeri, o postotku uzorka. Pretpostavimo da je u prvom slučaju napravljeno 225 promatranja iz populacije od 4500 jedinica, au drugom slučaju od 225000 jedinica. Varijance u oba slučaja jednake su 25. Tada će u prvom slučaju, s izborom od 5%, pogreška uzorkovanja biti:

U drugom slučaju, s izborom od 0,1%, to će biti jednako:


Tako, sa smanjenjem postotka uzorka za 50 puta, pogreška uzorka se malo povećala, budući da se veličina uzorka nije promijenila.
Pretpostavimo da je veličina uzorka povećana na 625 opažanja. U ovom slučaju, greška uzorkovanja je:

Povećanje uzorka za 2,8 puta uz istu veličinu opće populacije smanjuje veličinu greške uzorkovanja za više od 1,6 puta.

Metode i sredstva formiranja uzorka populacije.

U statistici se koriste različite metode formiranja skupova uzoraka, što je određeno ciljevima istraživanja i ovisi o specifičnostima predmeta proučavanja.

Glavni uvjet za provođenje istraživanja uzorka je spriječiti pojavu sustavnih pogrešaka koje proizlaze iz kršenja načela jednakih mogućnosti svake jedinice opće populacije da uđe u uzorak. Sprječavanje sustavnih pogrešaka postiže se korištenjem znanstveno utemeljenih metoda za formiranje uzorka populacije.

Postoje sljedeći načini odabira jedinica iz opće populacije:

1) individualni odabir - u uzorak se biraju pojedine jedinice;

2) grupni odabir - u uzorak ulaze kvalitativno homogene skupine ili nizovi jedinica koje se proučavaju;

3) kombinirana selekcija je kombinacija individualne i grupne selekcije.
Metode odabira određene su pravilima za formiranje populacije za uzorkovanje.

Uzorak može biti:

  • pravilan slučajan sastoji se u tome što uzorak nastaje kao rezultat slučajnog (nenamjernog) odabira pojedinih jedinica iz opće populacije. U tom slučaju, broj odabranih jedinica u skupu uzoraka obično se određuje na temelju prihvaćenog udjela uzorka. Udio uzorka je omjer broja jedinica u uzorkovanoj populaciji n prema broju jedinica u općoj populaciji N, tj.
  • mehanički sastoji se u tome što se odabir jedinica u uzorak vrši iz opće populacije, podijeljene u jednake intervale (skupine). U tom je slučaju veličina intervala u općoj populaciji jednaka recipročnoj vrijednosti udjela uzorka. Dakle, kod uzorka od 2% bira se svaka 50. jedinica (1:0,02), kod uzorka od 5% svaka 20. jedinica (1:0,05) itd. Dakle, u skladu s prihvaćenim omjerom selekcije, opća populacija je takoreći mehanički podijeljena u jednake skupine. Iz svake skupine u uzorku bira se samo jedna jedinica.
  • tipično - u kojoj se opća populacija prvo dijeli na homogene tipične skupine. Zatim se iz svake tipične skupine slučajnim ili mehaničkim uzorkom vrši pojedinačni odabir jedinica u uzorak. Važna značajka tipičnog uzorka je da daje preciznije rezultate u usporedbi s drugim metodama odabira jedinica u uzorku;
  • serijski- u kojoj je opća populacija podijeljena u skupine iste veličine - serije. Serije su odabrane u skupu uzoraka. Unutar niza provodi se kontinuirano promatranje jedinica koje su ušle u niz;
  • kombinirani- uzorkovanje može biti dvostupanjsko. U tom se slučaju opća populacija prvo dijeli na skupine. Zatim se odabiru skupine, a unutar njih pojedine jedinice.

U statistici se razlikuju sljedeće metode odabira jedinica u uzorku::

  • jednostupanjska uzorak - svaka odabrana jedinica odmah se podvrgava proučavanju na zadanoj osnovi (zapravo slučajni i serijski uzorci);
  • višestupanjski uzorkovanje - odabir se vrši iz opće populacije pojedinih skupina, a iz skupina se biraju pojedine jedinice (tipičan uzorak s mehaničkim načinom odabira jedinica u uzorku populacije).

Osim toga, postoje:

  • ponovni odabir- prema shemi vraćene lopte. U tom slučaju, svaka jedinica ili serija koja je ušla u uzorak vraća se u opću populaciju i stoga ima priliku ponovno biti uključena u uzorak;
  • odabir koji se ne ponavlja- prema shemi nevraćene lopte. Ima preciznije rezultate za istu veličinu uzorka.

Određivanje potrebne veličine uzorka (koristeći Studentovu tablicu).

Jedno od znanstvenih načela u teoriji uzorkovanja je osigurati odabir dovoljnog broja jedinica. Teoretski, potreba za poštivanjem ovog načela prikazana je u dokazima graničnih teorema teorije vjerojatnosti, koji vam omogućuju da utvrdite koliko jedinica treba odabrati iz opće populacije tako da bude dovoljno i osigura reprezentativnost uzorka.

Smanjenje standardne pogreške uzorka, a time i povećanje točnosti procjene, uvijek je povezano s povećanjem veličine uzorka, stoga je već u fazi organiziranja promatranja uzorka potrebno odlučiti kolika bi trebala biti veličina uzorka kako bi se osigurala potrebna točnost rezultata promatranja. Izračun potrebne veličine uzorka izgrađen je pomoću formula izvedenih iz formula za granične pogreške uzorkovanja (A), koje odgovaraju jednoj ili drugoj vrsti i metodi odabira. Dakle, za nasumično ponovljenu veličinu uzorka (n), imamo:

Bit ove formule je da je slučajnim ponovnim odabirom traženog broja veličina uzorka izravno proporcionalna kvadratu koeficijenta pouzdanosti (t2) i varijance značajke varijacije (?2) i obrnuto je proporcionalna kvadratu granične pogreške uzorkovanja (?2). Konkretno, udvostručenjem granične pogreške potrebna veličina uzorka može se smanjiti za faktor četiri. Od tri parametra, dva (t i?) postavlja istraživač.

Istodobno, istraživač Za potrebe uzorkovanja potrebno je postaviti pitanje u kojoj kvantitativnoj kombinaciji je bolje uključiti te parametre kako bi se dobila optimalna varijanta? U jednom slučaju može biti zadovoljniji pouzdanošću dobivenih rezultata (t) nego mjerom točnosti (?), u drugom - obrnuto. Teže je riješiti pitanje vrijednosti granične pogreške uzorkovanja, budući da istraživač nema ovaj pokazatelj u fazi izrade uzorka, stoga je u praksi uobičajeno postaviti graničnu pogrešku uzorkovanja, u pravilu, unutar 10% očekivane prosječne razine svojstva. Utvrđivanju pretpostavljene prosječne razine može se pristupiti na različite načine: korištenjem podataka iz sličnih prethodnih istraživanja ili korištenjem podataka iz okvira uzorkovanja i uzimanjem malog pilot uzorka.

Najteže je utvrditi pri izradi promatranja uzorka treći parametar u formuli (5.2) - varijancu uzorka populacije. U tom slučaju potrebno je koristiti sve podatke dostupne istraživaču, dobivene iz prethodnih sličnih i pilot istraživanja.

Pitanje definicije Potrebna veličina uzorka postaje kompliciranija ako ispitivanje uzorka uključuje proučavanje nekoliko značajki jedinica uzorkovanja. U ovom slučaju, prosječne razine svake od karakteristika i njihova varijacija, u pravilu, su različite, pa je moguće odlučiti kojoj disperziji koje od karakteristika dati prednost samo uzimajući u obzir svrhu i ciljeve istraživanja.

Prilikom izrade uzorka promatranja pretpostavlja se unaprijed određena vrijednost dopuštene pogreške uzorkovanja u skladu s ciljevima pojedinog istraživanja i vjerojatnosti zaključaka na temelju rezultata promatranja.

Općenito, formula za graničnu pogrešku srednje vrijednosti uzorka omogućuje određivanje:

Veličina mogućih odstupanja pokazatelja opće populacije od pokazatelja uzorka populacije;

Potrebna veličina uzorka, koja osigurava traženu točnost, u kojoj granice moguće pogreške neće premašiti određenu specificiranu vrijednost;

Vjerojatnost da će greška u uzorku imati zadanu granicu.

Raspodjela studenata u teoriji vjerojatnosti, to je jednoparametarska obitelj apsolutno kontinuiranih distribucija.

Niz dinamike (interval, moment), zatvaranje niza dinamike.

Serija dinamike- to su vrijednosti statističkih pokazatelja koji su prikazani u određenom kronološkom slijedu.

Svaka vremenska serija sadrži dvije komponente:

1) pokazatelji vremenskih razdoblja (godine, kvartali, mjeseci, dani ili datumi);

2) pokazatelji koji karakteriziraju predmet koji se proučava za vremenska razdoblja ili na odgovarajuće datume, koji se nazivaju razinama serije.

Izražene su razine serije i apsolutne i prosječne ili relativne vrijednosti. Ovisno o prirodi pokazatelja, grade se dinamički nizovi apsolutnih, relativnih i prosječnih vrijednosti. Dinamički nizovi relativnih i prosječnih vrijednosti izgrađeni su na temelju izvedenih nizova apsolutnih vrijednosti. Postoje intervalni i momentni nizovi dinamike.

Dinamičke intervalne serije sadrži vrijednosti pokazatelja za određena vremenska razdoblja. U intervalnom nizu razine se mogu zbrajati čime se dobiva obujam pojave za dulje razdoblje ili tzv. akumulirani zbrojevi.

Niz dinamičkih trenutaka odražava vrijednosti pokazatelja u određenom trenutku (datum vremena). U trenutnim nizovima, istraživača može zanimati samo razlika pojava, koja odražava promjenu razine niza između određenih datuma, budući da zbroj razina ovdje nema pravi sadržaj. Ovdje se ne računaju kumulativni zbrojevi.

Najvažniji uvjet za ispravnu konstrukciju dinamičkih serija je usporedivost razina serija koje se odnose na različita razdoblja. Razine trebaju biti prikazane u homogenim količinama, treba postojati ista cjelovitost obuhvata različitih dijelova fenomena.

Da bi Kako bi se izbjeglo iskrivljavanje stvarne dinamike, u statističkoj studiji (zatvaranje vremenske serije) provode se preliminarni izračuni koji prethode statističkoj analizi vremenske serije. Zatvaranje vremenske serije podrazumijeva se spajanje dvije ili više serija u jednu seriju, čije su razine izračunate prema različitoj metodologiji ili ne odgovaraju teritorijalnim granicama itd. Zatvaranje dinamičkog niza može podrazumijevati i redukciju apsolutnih razina dinamičkog niza na zajedničku osnovu, čime se otklanja nekompatibilnost razina dinamičkog niza.

Pojam usporedivosti vremenskih serija, koeficijenata, rasta i stopa rasta.

Serija dinamike- to su nizovi statističkih pokazatelja koji karakteriziraju razvoj prirodnih i društvenih pojava u vremenu. Statističke zbirke koje objavljuje Državni odbor za statistiku Rusije sadrže veliki broj vremenskih serija u tabelarnom obliku. Nizovi dinamike omogućuju otkrivanje obrazaca razvoja proučavanih fenomena.

Vremenske serije sadrže dvije vrste indikatora. Indikatori vremena(godine, kvartali, mjeseci itd.) ili točke u vremenu (na početku godine, na početku svakog mjeseca itd.). Indikatori razine retka. Pokazatelji razina vremenskih serija mogu se izraziti u apsolutnim vrijednostima (proizvodnja proizvoda u tonama ili rubljima), relativnim vrijednostima (udio gradskog stanovništva u%) i prosječnim vrijednostima (prosječne plaće radnika u industriji po godinama itd.). U tabelarnom obliku vremenska serija sadrži dva stupca ili dva retka.

Ispravna konstrukcija vremenske serije uključuje ispunjenje niza zahtjeva:

  1. svi pokazatelji niza dinamike moraju biti znanstveno potkrijepljeni, pouzdani;
  2. indikatori niza dinamike trebaju biti vremenski usporedivi, tj. moraju se izračunati za ista vremenska razdoblja ili na iste datume;
  3. indikatori niza dinamika trebaju biti usporedivi na cijelom teritoriju;
  4. pokazatelji niza dinamike trebaju biti sadržajno usporedivi, tj. izračunati prema jedinstvenoj metodologiji, na isti način;
  5. pokazatelji niza dinamika trebali bi biti usporedivi u nizu razmatranih farmi. Sve pokazatelje niza dinamike treba dati u istim mjernim jedinicama.

Statistički pokazatelji može karakterizirati ili rezultate procesa koji se proučava tijekom određenog vremenskog razdoblja ili stanje fenomena koji se proučava u određenom trenutku u vremenu, tj. indikatori mogu biti intervalni (periodični) i trenutni. Prema tome, inicijalni niz dinamike može biti ili interval ili trenutak. Trenutni nizovi dinamike pak mogu biti s jednakim i nejednakim vremenskim intervalima.

Početni niz dinamike može se pretvoriti u niz prosječnih vrijednosti i niz relativnih vrijednosti (lanac i baza). Takve vremenske serije nazivaju se izvedene vremenske serije.

Metoda izračuna prosječne razine u nizu dinamike je različita, ovisno o vrsti niza dinamike. Na primjerima razmotrite vrste vremenskih serija i formule za izračun prosječne razine.

Apsolutni dobici (Δy) pokazuju koliko se jedinica promijenila sljedeća razina niza u odnosu na prethodnu (stupac 3. - lančani apsolutni prirast) ili u odnosu na početnu razinu (stupac 4. - osnovni apsolutni prirast). Formule za izračun mogu se napisati na sljedeći način:

Sa smanjenjem apsolutnih vrijednosti serije, doći će do "smanjenja", odnosno "smanjenja".

Pokazatelji apsolutnog rasta govore da je, primjerice, u 1998. godini proizvodnja proizvoda "A" porasla za 4.000 tona u odnosu na 1997. godinu, odnosno za 34.000 tona u odnosu na 1994. godinu; za ostale godine vidi tablicu. 11,5 gr. 3 i 4.

Faktor rasta pokazuje koliko se puta razina serije promijenila u odnosu na prethodnu (stupac 5 - lančani faktori rasta ili pada) ili u odnosu na početnu razinu (stupac 6 - osnovni faktori rasta ili pada). Formule za izračun mogu se napisati na sljedeći način:

Stope rasta pokazuju koliko je postotna sljedeća razina niza u usporedbi s prethodnom (stupac 7 - lančane stope rasta) ili u usporedbi s početnom razinom (stupac 8 - osnovne stope rasta). Formule za izračun mogu se napisati na sljedeći način:

Tako je, na primjer, u 1997. godini obujam proizvodnje proizvoda "A" u odnosu na 1996. godinu iznosio 105,5% (

Brzina rasta pokazati za koliko posto se povećala razina izvještajnog razdoblja u odnosu na prethodno (stupac 9 - lančane stope rasta) ili u odnosu na početnu razinu (stupac 10 - osnovne stope rasta). Formule za izračun mogu se napisati na sljedeći način:

T pr \u003d T p - 100% ili T pr \u003d apsolutno povećanje / razina prethodnog razdoblja * 100%

Tako je, primjerice, 1996. godine u odnosu na 1995. godinu proizvedeno više proizvoda "A" za 3,8% (103,8% - 100%) ili (8:210) x 100%, au odnosu na 1994. godinu - za 9% (109% - 100%).

Ako se apsolutne razine u nizu smanje, tada će stopa biti manja od 100% i, sukladno tome, doći će do stope pada (stopa rasta s predznakom minus).

Apsolutna vrijednost povećanja od 1%.(stupac 11) pokazuje koliko je jedinica potrebno proizvesti u određenom razdoblju da bi se razina prethodnog razdoblja povećala za 1%. U našem primjeru 1995. godine bilo je potrebno proizvesti 2,0 tisuće tona, a 1998. godine 2,3 tisuće tona, tj. puno veći.

Postoje dva načina za određivanje veličine apsolutne vrijednosti rasta od 1%:

Razinu prethodnog razdoblja podijelite sa 100;

Podijelite apsolutne stope rasta lanca s odgovarajućim stopama rasta lanca.

Apsolutna vrijednost povećanja od 1% =

U dinamici, posebno u dužem razdoblju, važno je zajednički analizirati stopu rasta sa sadržajem svakog postotka povećanja ili smanjenja.

Imajte na umu da je razmatrana metoda za analizu vremenskih serija primjenjiva i za vremenske serije, čije su razine izražene u apsolutnim vrijednostima (t, tisuća rubalja, broj zaposlenih itd.), I za vremenske serije, čije su razine izražene u relativnim pokazateljima (% otpadaka, % sadržaja pepela u ugljenu itd.) ili prosječnim vrijednostima (prosječni prinos u c/ha, prosječne plaće itd.).

Uz razmatrane analitičke pokazatelje izračunate za svaku godinu u usporedbi s prethodnom ili početnom razinom, pri analizi vremenske serije potrebno je izračunati prosječne analitičke pokazatelje za razdoblje: prosječnu razinu serije, prosječni godišnji apsolutni porast (pad) i prosječnu godišnju stopu rasta i stopu rasta.

Metode za izračunavanje prosječne razine niza dinamike raspravljene su gore. U intervalnom nizu dinamike koji razmatramo, prosječna razina niza izračunava se formulom jednostavne aritmetičke sredine:

Prosječna godišnja proizvodnja proizvoda za 1994.-1998. iznosio 218,4 tisuća tona.

Prosječni godišnji apsolutni porast također se izračunava po formuli jednostavne aritmetičke sredine:

Godišnji apsolutni prirast varirao je kroz godine od 4 do 12 tisuća tona (vidi gr. 3), a prosječni godišnji porast proizvodnje za razdoblje 1995.-1998. iznosio 8,5 tisuća tona.

Metode za izračunavanje prosječne stope rasta i prosječne stope rasta zahtijevaju detaljnije razmatranje. Razmotrimo ih na primjeru godišnjih pokazatelja razine serije danih u tablici.

Srednja razina raspona dinamike.

Serije dinamike (ili vremenske serije)- to su numeričke vrijednosti određenog statističkog pokazatelja u uzastopnim trenucima ili vremenskim razdobljima (tj. poredane kronološkim redom).

Brojčane vrijednosti određenog statističkog pokazatelja koji čini niz dinamike nazivaju se razine broja a obično se označava slovom g. Prvi član serije y 1 naziva se početnim ili Osnovna linija, i posljednji y n - konačni. Trenuci ili razdoblja na koje se razine odnose označeni su sa t.

Dinamičke serije, u pravilu, prikazane su u obliku tablice ili grafikona, a vremenska ljestvica izgrađena je duž x-osi. t, a duž ordinate - ljestvica razina niza g.

Prosječni pokazatelji niza dinamike

Svaki niz dinamike može se smatrati određenim skupom n vremenski promjenjivi pokazatelji koji se mogu sažeti kao prosjeci. Takvi generalizirani (prosječni) pokazatelji posebno su potrebni kada se uspoređuju promjene jednog ili drugog pokazatelja u različitim razdobljima, u različitim zemljama itd.

Generalizirana karakteristika niza dinamike može biti, prije svega, prosječna razina reda. Način izračuna prosječne razine ovisi o tome radi li se o momentnom nizu ili intervalnom (periodnom) nizu.

Kada interval niza, njegova prosječna razina određena je formulom jednostavne aritmetičke sredine razina niza, tj.

=
Ako je dostupno trenutak red koji sadrži n razine ( y1, y2, …, yn) s jednakim intervalima između datuma (točaka vremena), tada se takav niz može lako pretvoriti u niz prosječnih vrijednosti. Pritom je pokazatelj (razina) na početku svakog razdoblja ujedno i pokazatelj na kraju prethodnog razdoblja. Tada se prosječna vrijednost indikatora za svako razdoblje (interval između datuma) može izračunati kao poluzbroj vrijednosti na na početku i na kraju razdoblja, tj. kako . Broj takvih prosjeka bit će . Kao što je ranije spomenuto, za nizove prosjeka, prosječna razina izračunava se iz aritmetičkog prosjeka.

Stoga možemo napisati:
.
Nakon pretvorbe brojnika dobivamo:
,

Gdje Y1 I Yn- prva i zadnja razina serije; Yi- srednje razine.

Taj je prosjek u statistici poznat kao prosječno kronološki za seriju trenutaka. Ime je dobila od riječi "cronos" (vrijeme, lat.), jer se izračunava iz pokazatelja koji se mijenjaju tijekom vremena.

U slučaju nejednakih intervalima između datuma, kronološki prosjek za seriju trenutaka može se izračunati kao aritmetički prosjek prosječnih vrijednosti razina za svaki par trenutaka, ponderiranih udaljenostima (vremenskim intervalima) između datuma, tj.
.
U ovom slučaju pretpostavlja se da su u intervalima između datuma razine poprimile različite vrijednosti, a mi smo od dvije poznate ( yi I yi+1) utvrđujemo prosjeke iz kojih zatim izračunavamo ukupni prosjek za cijelo analizirano razdoblje.
Ako se pretpostavi da svaka vrijednost yi ostaje nepromijenjen do sljedećeg (i+ 1)- trenutak, tj. ako je poznat točan datum promjene razina, tada se izračun može izvesti pomoću formule ponderirane aritmetičke sredine:
,

gdje je vrijeme tijekom kojeg je razina ostala nepromijenjena.

Osim prosječne razine u seriji dinamike, izračunavaju se i drugi prosječni pokazatelji - prosječna promjena razina serije (osnovna i lančana metoda), prosječna stopa promjene.

Osnovna vrijednost apsolutne promjene je kvocijent posljednje osnovne apsolutne promjene podijeljen s brojem promjena. To je

Lanac znači apsolutnu promjenu razine niza je kvocijent dijeljenja zbroja svih lančanih apsolutnih promjena s brojem promjena, tj.

Prema predznaku prosječnih apsolutnih promjena prosječno se prosuđuje i priroda promjene pojave: rast, opadanje ili stabilnost.

Iz pravila kontrole osnovne i lančane apsolutne promjene proizlazi da osnovna i lančana prosječna promjena moraju biti jednake.

Uz prosječnu apsolutnu promjenu izračunava se i prosječna relativna osnovnom i lančanom metodom.

Osnovna prosječna relativna promjena određuje se formulom:

Lančana srednja relativna promjena određuje se formulom:

Naravno, osnovne i lančane prosječne relativne promjene trebaju biti iste, a usporedbom s kriterijskom vrijednošću 1 zaključuje se o prirodi promjene pojave u prosjeku: rast, pad ili stabilnost.
Oduzimanjem 1 od osnovne ili lančane prosječne relativne promjene, odgovarajući prosječna stopa promjene, prema čijem se znaku također može prosuditi priroda promjene u fenomenu koji se proučava, što se odražava u ovom nizu dinamike.

Sezonska kolebanja i indeksi sezonalnosti.

Sezonske fluktuacije su stabilne unutargodišnje fluktuacije.

Osnovno načelo upravljanja za postizanje maksimalnog učinka je maksimiziranje prihoda i minimiziranje troškova. Proučavanjem sezonskih kolebanja rješava se problem jednadžbe maksimuma u svakoj razini godine.

Pri proučavanju sezonskih fluktuacija rješavaju se dva međusobno povezana zadatka:

1. Identifikacija specifičnosti razvoja fenomena u unutargodišnjoj dinamici;

2. Mjerenje sezonskih kolebanja s konstrukcijom modela sezonskih valova;

Sezonski purani obično se broje kako bi se izmjerila sezonalnost. Općenito, određuju se omjerom izvornih jednadžbi niza dinamike prema teorijskim jednadžbama koje služe kao osnova za usporedbu.

Budući da su slučajna odstupanja superponirana sezonskim fluktuacijama, indeksi sezonalnosti su prosječni kako bi ih se eliminiralo.

U ovom slučaju, za svako razdoblje godišnjeg ciklusa utvrđuju se generalizirani pokazatelji u obliku prosječnih sezonskih indeksa:

Prosječni indeksi sezonskih kolebanja oslobođeni su utjecaja slučajnih odstupanja glavnog trenda razvoja.

Ovisno o prirodi trenda, formula za prosječni indeks sezonalnosti može imati sljedeće oblike:

1.Za serije međugodišnje dinamike s izraženim glavnim trendom razvoja:

2. Za niz međugodišnjih dinamika u kojima nema uzlaznog ili silaznog trenda ili je beznačajan:

Gdje je opći prosjek;

Metode za analizu glavnog trenda.

Na razvoj pojava tijekom vremena utječu čimbenici različiti po prirodi i snazi ​​utjecaja. Neki od njih su slučajne prirode, drugi imaju gotovo konstantan učinak i tvore određeni trend razvoja u nizu dinamike.

Važan zadatak statistike je identificirati trend u nizu dinamike, oslobođen djelovanja različitih slučajnih čimbenika. U tu svrhu vremenske serije se obrađuju metodama intervalnog povećanja, pomičnog prosjeka i analitičkog poravnanja itd.

Metoda ogrubljivanja intervala temelji se na proširenju vremenskih razdoblja, koja uključuju razine niza dinamike, tj. je zamjena podataka koji se odnose na mala vremenska razdoblja podacima iz većih razdoblja. Posebno je učinkovit kada su početne razine niza kratke vremenske periode. Na primjer, nizovi indikatora koji se odnose na dnevne događaje zamjenjuju se nizovima koji se odnose na tjedne, mjesečne itd. To će se jasnije pokazati "Os razvoja fenomena". Prosjek, izračunat na temelju povećanih intervala, omogućuje prepoznavanje smjera i karaktera (ubrzanje ili usporavanje rasta) glavnog trenda razvoja.

metoda pokretnog prosjeka sličan prethodnom, ali se u ovom slučaju stvarne razine zamjenjuju prosječnim razinama izračunatim za uzastopno pomicanje (klizenje) povećanih intervala koji pokrivaju m razine redova.

Na primjer ako se prihvati m=3, zatim se prvo izračuna prosjek prve tri razine serije, zatim - od istog broja razina, ali počevši od druge po redu, zatim - počevši od treće, itd. Dakle, prosjek, takoreći, "klizi" nizom dinamike, krećući se za jedno razdoblje. Izračunato iz mčlanovi pomičnih prosjeka odnose se na sredinu (središte) svakog intervala.

Ova metoda eliminira samo slučajne fluktuacije. Ako niz ima sezonski val, on će ostati nakon izglađivanja metodom pomičnog prosjeka.

Analitičko usklađivanje. Kako bi se eliminirale slučajne fluktuacije i identificirao trend, razine serije su usklađene prema analitičkim formulama (ili analitičkom poravnanju). Njegova bit je zamjena empirijskih (stvarnih) razina teorijskim, koje se izračunavaju prema određenoj jednadžbi, uzetoj kao matematički model trenda, pri čemu se teorijske razine promatraju u funkciji vremena: . U ovom slučaju, svaka stvarna razina smatra se zbrojem dviju komponenti: , gdje je sustavna komponenta i izražena određenom jednadžbom, a slučajna varijabla koja uzrokuje fluktuacije oko trenda.

Zadatak analitičkog usklađivanja je sljedeći:

1. Određivanje na temelju stvarnih podataka vrste hipotetske funkcije koja može najadekvatnije odražavati trend razvoja pokazatelja koji se proučava.

2. Određivanje parametara navedene funkcije (jednadžbe) iz empirijskih podataka

3. Izračun prema pronađenoj jednadžbi teorijskih (niveliranih) razina.

Izbor pojedine funkcije provodi se, u pravilu, na temelju grafičkog prikaza empirijskih podataka.

Modeli su regresijske jednadžbe čiji su parametri izračunati metodom najmanjih kvadrata

Ispod su najčešće korištene regresijske jednadžbe za izravnavanje vremenskih nizova, pokazujući koje razvojne trendove su najprikladnije za odražavanje.

Za pronalaženje parametara gornjih jednadžbi postoje posebni algoritmi i računalni programi. Konkretno, za pronalaženje parametara jednadžbe ravne linije može se koristiti sljedeći algoritam:

Ako se periode ili trenutke vremena numerira tako da se dobije St = 0, tada će se gornji algoritmi značajno pojednostaviti i pretvoriti u

Usklađene razine na grafikonu nalazit će se na jednoj ravnoj liniji koja prolazi na najbližoj udaljenosti od stvarnih razina ove dinamičke serije. Zbroj kvadrata odstupanja odraz je utjecaja slučajnih faktora.

Uz njegovu pomoć izračunavamo prosječnu (standardnu) pogrešku jednadžbe:

Ovdje je n broj opažanja, a m je broj parametara u jednadžbi (imamo dva od njih - b 1 i b 0).

Glavni trend (trend) pokazuje kako sustavni čimbenici utječu na razine niza dinamike, a fluktuacija razina oko trenda () služi kao mjera utjecaja rezidualnih čimbenika.

Za procjenu kvalitete korištenog modela vremenske serije također se koristi Fisherov F test. To je omjer dviju varijanci, odnosno omjer varijance uzrokovane regresijom, tj. proučavani faktor, na disperziju uzrokovanu slučajnim uzrocima, tj. rezidualna varijanca:

U proširenom obliku, formula za ovaj kriterij može se prikazati na sljedeći način:

gdje je n broj opažanja, tj. broj razina redova,

m je broj parametara u jednadžbi, y je stvarna razina niza,

Usklađena razina reda, - prosječna razina reda.

Uspješniji od drugih, model ne mora uvijek biti dovoljno zadovoljavajući. Može se prepoznati kao takav samo ako kriterij F za njega prijeđe određenu kritičnu granicu. Ova granica je postavljena pomoću F distribucijskih tablica.

Bit i klasifikacija indeksa.

Indeks se u statistici shvaća kao relativni pokazatelj koji karakterizira promjenu veličine neke pojave u vremenu, prostoru ili u usporedbi s bilo kojim standardom.

Glavni element indeksne relacije je indeksirana vrijednost. Indeksirana vrijednost shvaća se kao vrijednost znaka statističke populacije čija je promjena predmet proučavanja.

Indeksi služe u tri glavne svrhe:

1) procjena promjena u složenoj pojavi;

2) utvrđivanje utjecaja pojedinih čimbenika na promjenu složene pojave;

3) usporedba veličine neke pojave s veličinom prošlog razdoblja, veličinom drugog teritorija, kao i sa standardima, planovima, prognozama.

Indeksi su klasificirani prema 3 kriterija:

2) po stupnju obuhvata elemenata stanovništva;

3) metodama izračunavanja općih indeksa.

Po sadržaju indeksiranih vrijednosti, indeksi se dijele na indekse kvantitativnih (volumetrijskih) pokazatelja i indekse kvalitativnih pokazatelja. Indeksi kvantitativnih pokazatelja - indeksi fizičkog obujma industrijske proizvodnje, fizičkog obujma prodaje, broja i dr. Indeksi kvalitativnih pokazatelja - indeksi cijena, troškova, proizvodnosti rada, prosječnih plaća i dr.

Prema stupnju obuhvata jedinica populacije indeksi se dijele u dvije klase: pojedinačne i opće. Kako bismo ih okarakterizirali, uvodimo sljedeće konvencije usvojene u praksi primjene metode indeksa:

q- količina (volumen) bilo kojeg proizvoda u naravi ; R- jedinična cijena proizvodnje; z- jedinični trošak proizvodnje; t- vrijeme utrošeno na proizvodnju jedinice outputa (intenzitet rada) ; w- proizvodni učinak u vrijednosnom izrazu po jedinici vremena; v- učinak u fizičkom smislu po jedinici vremena; T- ukupno utrošeno vrijeme ili broj zaposlenih.

Kako bi se razlikovalo kojem razdoblju ili objektu pripadaju indeksirane vrijednosti, uobičajeno je da se nakon odgovarajućeg simbola u donjem desnom kutu stavljaju indeksi. Tako se, primjerice, u indeksima dinamike u pravilu za uspoređivana (tekuća, izvještajna) razdoblja koristi indeks 1, a za razdoblja s kojima se uspoređuje,

Individualni indeksi služe za karakterizaciju promjene pojedinih elemenata složene pojave (na primjer, promjena obujma proizvodnje jedne vrste proizvoda). Predstavljaju relativne vrijednosti dinamike, ispunjenje obveza, usporedbu indeksiranih vrijednosti.

Utvrđuje se pojedinačni indeks fizičkog obujma proizvodnje

S analitičkog gledišta, dani pojedinačni indeksi dinamike slični su koeficijentima (stopama) rasta i karakteriziraju promjenu indeksirane vrijednosti u tekućem razdoblju u odnosu na bazno, odnosno pokazuju koliko je puta porasla (smanjila) odnosno koliko posto je njen rast (smanjenje). Vrijednosti indeksa izražavaju se u koeficijentima ili postocima.

Opći (kompozitni) indeks odražava promjenu svih elemenata složene pojave.

Zbirni indeks je osnovni oblik indeksa. Naziva se agregat jer su njegov brojnik i nazivnik skup "agregata"

Prosječni indeksi, njihova definicija.

Osim agregatnih indeksa, u statistici se koristi još jedan njihov oblik - ponderirani prosječni indeksi. Njihovom se izračunu pribjegava kada raspoložive informacije ne dopuštaju izračun općeg agregatnog indeksa. Dakle, ako nema podataka o cijenama, ali postoji podatak o troškovima proizvoda u tekućem razdoblju i poznati su pojedinačni indeksi cijena za svaki proizvod, tada se opći indeks cijena ne može odrediti kao zbirni, već ga je moguće izračunati kao prosjek pojedinačnih. Na isti način, ako nisu poznate količine pojedinačnih proizvedenih proizvoda, ali su poznati pojedinačni indeksi i troškovi proizvodnje baznog razdoblja, tada se ukupni indeks fizičkog obujma proizvodnje može odrediti kao ponderirani prosjek.

Prosječni indeks - Ovaj indeks izračunat kao prosjek pojedinačnih indeksa. Zbirni indeks je osnovni oblik općeg indeksa, pa prosječni indeks mora biti identičan zbirnom indeksu. Pri izračunavanju prosječnih indeksa koriste se dva oblika prosjeka: aritmetički i harmonijski.

Indeks aritmetičke sredine identičan je agregatnom indeksu ako su ponderi pojedinačnih indeksa članovi nazivnika agregatnog indeksa. Samo u tom slučaju vrijednost indeksa izračunata formulom aritmetičke sredine bit će jednaka zbirnom indeksu.

Za izračunavanje jednostavne geometrijske sredine koristi se formula:

geometrijski ponderirani

Za određivanje geometrijskog ponderiranog prosjeka koristi se formula:

Prosječni promjeri kotača, cijevi, prosječne stranice kvadrata određuju se koristeći korijen srednje vrijednosti kvadrata.

RMS vrijednosti se koriste za izračun nekih pokazatelja, kao što je koeficijent varijacije, koji karakterizira ritam proizvodnje. Ovdje se standardna devijacija od planiranog outputa za određeno razdoblje određuje sljedećom formulom:

Ove vrijednosti točno karakteriziraju promjenu ekonomskih pokazatelja u usporedbi s njihovom osnovnom vrijednošću, uzetom u svojoj prosječnoj vrijednosti.

Kvadratno jednostavno

Prosječni srednji kvadrat izračunava se formulom:

Kvadratno ponderirano

Ponderirana sredina kvadrata je:

22. Apsolutne mjere varijacije uključuju:

raspon varijacije

srednje linearno odstupanje

disperzija

standardna devijacija

Raspon varijacije (r)

Varijacija raspona je razlika između maksimalne i minimalne vrijednosti atributa

Prikazuje granice u kojima se mijenja vrijednost atributa u proučavanoj populaciji.

Radno iskustvo pet kandidata na prethodnom radnom mjestu je: 2,3,4,7 i 9 godina. Rješenje: raspon varijacije = 9 - 2 = 7 godina.

Za generaliziranu karakteristiku razlika u vrijednostima atributa, prosječni pokazatelji varijacije izračunavaju se na temelju dopuštenja za odstupanja od aritmetičke sredine. Razlika se uzima kao odstupanje od srednje vrijednosti.

U isto vrijeme, kako bi se izbjeglo pretvaranje u nulu zbroja odstupanja opcija osobina od sredine (nulto svojstvo sredine), potrebno je ili zanemariti predznake odstupanja, odnosno uzeti ovaj zbroj modulo , ili kvadrirati vrijednosti odstupanja

Srednja linearna i kvadratna devijacija

Prosječno linearno odstupanje je aritmetička sredina apsolutnih odstupanja pojedinačnih vrijednosti svojstva od sredine.

Prosječno linearno odstupanje je jednostavno:

Radno iskustvo pet kandidata na prethodnom radnom mjestu je: 2,3,4,7 i 9 godina.

U našem primjeru: godine;

Odgovor: 2,4 godine.

Prosječno linearno odstupanje ponderirano odnosi se na grupirane podatke:

Prosječno linearno odstupanje, zbog svoje konvencionalnosti, relativno se rijetko koristi u praksi (osobito za karakterizaciju ispunjenja ugovornih obveza u smislu ravnomjernosti isporuke; u analizi kvalitete proizvoda, uzimajući u obzir tehnološke značajke proizvodnje).

Standardna devijacija

Najsavršenija karakteristika varijacije je standardna devijacija, koja se naziva standard (ili standardna devijacija). Standardna devijacija() jednak je kvadratnom korijenu srednjeg kvadrata odstupanja pojedinačnih vrijednosti obilježja od aritmetičke sredine:

Standardna devijacija je jednostavna:

Ponderirana standardna devijacija primjenjuje se za grupirane podatke:

Između srednje kvadratne i srednje linearne devijacije u uvjetima normalne distribucije postoji odnos: ~ 1,25.

Standardna devijacija, kao glavna apsolutna mjera varijacije, koristi se u određivanju vrijednosti ordinata krivulje normalne distribucije, u izračunima koji se odnose na organizaciju promatranja uzorka i utvrđivanju točnosti karakteristika uzorka, kao iu procjeni granica varijacije svojstva u homogenoj populaciji.

Vrijednosti dobivene iskustvom neizbježno sadrže pogreške zbog niza razloga. Među njima treba razlikovati sustavne i slučajne pogreške. Sustavne pogreške nastaju zbog uzroka koji djeluju na vrlo specifičan način i uvijek se mogu eliminirati ili uzeti u obzir s dovoljnom točnošću. Slučajne pogreške uzrokovane su vrlo velikim brojem pojedinačnih uzroka koji se ne mogu točno objasniti i djeluju drugačije u svakom pojedinačnom mjerenju. Te se pogreške ne mogu potpuno isključiti; mogu se uzeti u obzir samo u prosjeku, za što je potrebno poznavati zakonitosti kojima podliježu slučajne pogreške.

Mjernu vrijednost označit ćemo s A, a slučajnu pogrešku u mjerenju x. Budući da pogreška x može poprimiti bilo koju vrijednost, to je kontinuirana slučajna varijabla, koja je u potpunosti karakterizirana vlastitim zakonom raspodjele.

Najjednostavnije i najtočnije odražava stvarnost (u velikoj većini slučajeva) je tzv normalna raspodjela grešaka:

Ovaj zakon raspodjele može se dobiti iz različitih teorijskih premisa, posebno iz zahtjeva da je najvjerojatnija vrijednost nepoznate veličine za koju se izravnim mjerenjem dobiva niz vrijednosti s istim stupnjem točnosti aritmetička sredina tih vrijednosti. Poziva se vrijednost 2 disperzija ovog normalnog zakona.

Prosjek

Određivanje disperzije prema eksperimentalnim podacima. Ako se za bilo koju količinu A izravnim mjerenjem dobije n vrijednosti a i s istim stupnjem točnosti i ako su pogreške u količini A podložne normalnom zakonu raspodjele, tada će najvjerojatnija vrijednost A biti prosjek:

a - aritmetička sredina,

a i - izmjerena vrijednost u i-tom koraku.

Odstupanje promatrane vrijednosti (za svako opažanje) a i vrijednosti A od aritmetička sredina: a i - a.

Za određivanje disperzije normalne raspodjele pogrešaka u ovom slučaju upotrijebite formulu:

2 - disperzija,
a - aritmetička sredina,
n je broj mjerenja parametara,

standardna devijacija

standardna devijacija pokazuje apsolutno odstupanje izmjerenih vrijednosti od aritmetička sredina. U skladu s formulom za mjeru točnosti linearne kombinacije korijen srednje kvadratne pogreške aritmetička sredina određena je formulom:

, Gdje


a - aritmetička sredina,
n je broj mjerenja parametara,
a i - izmjerena vrijednost u i-tom koraku.

Koeficijent varijacije

Koeficijent varijacije karakterizira relativni stupanj odstupanja izmjerenih vrijednosti od aritmetička sredina:

, Gdje

V - koeficijent varijacije,
- standardna devijacija,
a - aritmetička sredina.

Što je vrijednost veća koeficijent varijacije, što je raspršenje relativno veće i što je manje uniformnost proučavanih vrijednosti. Ako koeficijent varijacije manje od 10%, smatra se da je varijabilnost niza varijacija beznačajna, od 10% do 20% odnosi se na prosjek, više od 20% i manje od 33% na značajnu, a ako koeficijent varijacije prelazi 33%, što ukazuje na heterogenost informacija i potrebu isključivanja najvećih i najmanjih vrijednosti.

Prosječno linearno odstupanje

Jedan od pokazatelja raspona i intenziteta varijacije je srednje linearno odstupanje(prosječni modul odstupanja) od aritmetičke sredine. Prosječno linearno odstupanje izračunava se formulom:

, Gdje

_
a - prosječno linearno odstupanje,
a - aritmetička sredina,
n je broj mjerenja parametara,
a i - izmjerena vrijednost u i-tom koraku.

Za provjeru usklađenosti proučavanih vrijednosti sa zakonom normalne distribucije koristi se odnos indeks asimetrije na svoju grešku i stav pokazatelj kurtoze na njegovu grešku.

Indeks asimetrije

Indeks asimetrije(A) i njegova pogreška (m a) izračunava se pomoću sljedećih formula:

, Gdje

A - indikator asimetrije,
- standardna devijacija,
a - aritmetička sredina,
n je broj mjerenja parametara,
a i - izmjerena vrijednost u i-tom koraku.

Indikator kurtoze

Indikator kurtoze(E) i njegova pogreška (m e) izračunava se pomoću sljedećih formula:

, Gdje



 


Čitati:



Tumačenje tarot karte vrag u vezi Što znači laso vrag

Tumačenje tarot karte vrag u vezi Što znači laso vrag

Tarot karte vam omogućuju da saznate ne samo odgovor na uzbudljivo pitanje. Oni također mogu predložiti pravu odluku u teškoj situaciji. Dovoljno za učenje...

Ekološki scenariji za kvizove u ljetnom kampu

Ekološki scenariji za kvizove u ljetnom kampu

Bajkoviti kviz 1. Tko je poslao takav telegram: „Spasi me! Pomozite! Pojeo nas je Sivi Vuk! Kako se zove ova bajka? (Djeca, "Vuk i...

Kolektivni projekt "Rad je osnova života"

Kolektivni projekt

Prema definiciji A. Marshalla, rad je „svaki mentalni i fizički napor poduzet djelomično ili u cijelosti s ciljem postizanja nekog ...

DIY hranilica za ptice: izbor ideja Hranilica za ptice iz kutije za cipele

DIY hranilica za ptice: izbor ideja Hranilica za ptice iz kutije za cipele

Napraviti vlastitu hranilicu za ptice nije teško. Zimi su ptice u velikoj opasnosti, treba ih hraniti. Za to osoba ...

feed slike RSS