Dom - Povijest popravka
Određivanje standardne devijacije. Standardna devijacija

Lekcija br. 4

Tema: “Opisna statistika. Indikatori raznolikosti svojstava u agregatu"

Glavni kriteriji za raznolikost svojstva u statističkoj populaciji su: granica, amplituda, prosjek standardna devijacija, koeficijent oscilacije i koeficijent varijacije. U prethodnoj lekciji raspravljalo se o tome da prosječne vrijednosti daju samo generaliziranu karakteristiku karakteristike koja se proučava u agregatu i ne uzimaju u obzir vrijednosti njegovih pojedinačnih varijanti: minimalne i maksimalne vrijednosti, iznad prosjeka, ispod prosjek, itd.

Primjer. Prosječne vrijednosti dva različita niza brojeva: -100; -20; 100; 20 i 0,1; -0,2; 0,1 su apsolutno identični i jednakiOKO.Međutim, rasponi raspršenosti ovih relativnih srednjih podataka o nizu su vrlo različiti.

Utvrđivanje navedenih kriterija za raznolikost obilježja prvenstveno se provodi uzimajući u obzir njegovu vrijednost u pojedinim elementima statističke populacije.

Indikatori za mjerenje varijacije svojstva su apsolutni I relativna. Apsolutni pokazatelji varijacije su: raspon varijacije, granica, standardna devijacija, disperzija. Koeficijent varijacije i koeficijent oscilacije odnose se na relativne mjere varijacije.

Limit (lim)– Ovo je kriterij koji je određen ekstremnim vrijednostima varijante u nizu varijacija. Drugim riječima, ovaj kriterij ograničen je minimalnim i maksimalnim vrijednostima atributa:

Amplituda (Am) ili raspon varijacija – Ovo je razlika između ekstremnih opcija. Izračun ovog kriterija provodi se oduzimanjem njegove minimalne vrijednosti od maksimalne vrijednosti atributa, što nam omogućuje procjenu stupnja raspršenosti opcije:

Nedostatak limita i amplitude kao kriterija varijabilnosti je što u potpunosti ovise o ekstremnim vrijednostima obilježja u nizu varijacija. U ovom slučaju, fluktuacije vrijednosti atributa unutar niza se ne uzimaju u obzir.

Najpotpuniji opis raznolikosti svojstva u statističkoj populaciji daje standardna devijacija(sigma), što je opća mjera odstupanja opcije od njezine prosječne vrijednosti. Standardna devijacija se često naziva standardna devijacija.

Standardna devijacija temelji se na usporedbi svake opcije s aritmetičkom sredinom određene populacije. Budući da će u agregatu uvijek biti opcija i manje i više od njega, zbroj odstupanja s predznakom "" poništit će se zbrojem odstupanja s predznakom "", tj. zbroj svih odstupanja je nula. Da bi se izbjegao utjecaj predznaka razlika, uzimaju se odstupanja od kvadrata aritmetičke sredine, tj. . Zbroj kvadrata odstupanja nije jednak nuli. Da biste dobili koeficijent koji može mjeriti varijabilnost, uzmite prosjek zbroja kvadrata - ta se vrijednost naziva odstupanja:

U biti, disperzija je prosječni kvadrat odstupanja pojedinih vrijednosti neke karakteristike od njezine prosječne vrijednosti. Disperzija kvadrat standardne devijacije.

Varijanca je dimenzionalna veličina (nazvana). Dakle, ako su varijante niza brojeva izražene u metrima, tada varijanca daje kvadratne metre; ako su opcije izražene u kilogramima, tada varijanca daje kvadrat ove mjere (kg 2), itd.

Standardna devijacija– kvadratni korijen varijance:

, tada pri izračunavanju disperzije i standardne devijacije u nazivniku razlomka, umjestomora se staviti.

Izračun standardne devijacije može se podijeliti u šest faza, koje se moraju provesti određenim redoslijedom:

Primjena standardne devijacije:

a) za prosudbu varijabilnosti varijacijskih serija i komparativnu ocjenu tipičnosti (reprezentativnosti) aritmetičkih prosjeka. To je potrebno u diferencijalnoj dijagnozi pri određivanju stabilnosti simptoma.

b) rekonstruirati varijacijsku seriju, tj. obnavljanje njegovog frekvencijskog odziva na temelju pravila tri sigme. U intervalu (M±3σ) 99,7% svih varijanti serije nalazi se u intervalu (M±2σ) - 95,5% iu rasponu (M±1σ) - 68,3% opcija reda(Sl. 1).

c) za prepoznavanje "skočnih" opcija

d) odrediti parametre norme i patologije koristeći sigma procjene

e) izračunati koeficijent varijacije

f) izračunati prosječnu grešku aritmetičke sredine.

Za karakterizaciju bilo koje populacije koja imatip normalne distribucije , dovoljno je znati dva parametra: aritmetičku sredinu i standardnu ​​devijaciju.

Slika 1. Pravilo tri sigme

Primjer.

U pedijatriji se standardna devijacija koristi za procjenu tjelesnog razvoja djece usporedbom podataka određenog djeteta s odgovarajućim standardnim pokazateljima. Za standard se uzima aritmetički prosjek tjelesnog razvoja zdrave djece. Usporedba pokazatelja sa standardima provodi se pomoću posebnih tablica u kojima su navedeni standardi zajedno s pripadajućim sigma ljestvicama. Vjeruje se da ako je pokazatelj tjelesnog razvoja djeteta unutar standarda (aritmetička sredina) ±σ, tada tjelesni razvoj dijete (prema ovom pokazatelju) odgovara normi. Ako je pokazatelj unutar standarda ±2σ, tada postoji malo odstupanje od norme. Ako pokazatelj prelazi ove granice, tada se djetetov fizički razvoj oštro razlikuje od norme (moguća je patologija).

Osim pokazatelja varijacije izraženih u apsolutnim vrijednostima, u statističkim istraživanjima koriste se i pokazatelji varijacije izraženi u relativnim vrijednostima. Koeficijent oscilacije - ovo je omjer raspona varijacije i prosječne vrijednosti svojstva. Koeficijent varijacije - je omjer standardne devijacije prema prosjek znak. Obično se ove vrijednosti izražavaju u postocima.

Formule za izračunavanje pokazatelja relativne varijacije:

Iz gornjih formula je jasno da što je veći koeficijent V je bliže nuli, manja je varijacija u vrijednostima karakteristike. Više V, što je predznak promjenjiviji.

U statističkoj praksi najčešće se koristi koeficijent varijacije. Koristi se ne samo za komparativnu procjenu varijacije, već i za karakterizaciju homogenosti populacije. Populacija se smatra homogenom ako koeficijent varijacije ne prelazi 33% (za distribucije bliske normalnoj). Aritmetički, omjer σ i aritmetičke sredine neutralizira utjecaj apsolutna vrijednost te karakteristike, a postotni omjer čini koeficijent varijacije bezdimenzionalnom (neimenovanom) veličinom.

Rezultirajuća vrijednost koeficijenta varijacije procjenjuje se u skladu s približnim gradacijama stupnja raznolikosti svojstva:

Slab - do 10%

Prosjek - 10 - 20%

Snažan - više od 20%

Korištenje koeficijenta varijacije preporučljivo je u slučajevima kada je potrebno usporediti karakteristike koje se razlikuju po veličini i dimenziji.

Jasno je prikazana razlika između koeficijenta varijacije i ostalih kriterija raspršenja primjer.

stol 1

Sastav radnika industrijskog poduzeća

Na temelju statističkih karakteristika navedenih u primjeru, možemo zaključiti o relativnoj homogenosti dobnog sastava i obrazovne razine zaposlenika poduzeća, s obzirom na nisku profesionalnu stabilnost ispitanog kontingenta. Lako je vidjeti da bi pokušaj prosuđivanja ovih društvenih trendova standardnom devijacijom doveo do pogrešnog zaključka, a pokušaj usporedbe računovodstvenih obilježja “radno iskustvo” i “dob” s računovodstvenim pokazateljem “obrazovanje” općenito bi bio netočna zbog heterogenosti ovih karakteristika.

Medijan i percentili

Za ordinalne (rang) distribucije, gdje je kriterij za sredinu niza medijan, standardna devijacija i disperzija ne mogu poslužiti kao karakteristike disperzije varijante.

Isto vrijedi i za serije otvorenih varijacija. Ova okolnost je zbog činjenice da se odstupanja iz kojih se računaju varijanca i σ mjere iz aritmetičke sredine, koja se ne izračunava u otvorenim varijacijskim serijama i serijama distribucija kvalitativnih karakteristika. Stoga se za komprimirani opis distribucija koristi drugi parametar raspršenja - kvantil(sinonim - "percentil"), pogodan za opisivanje kvalitativnih i kvantitativnih karakteristika u bilo kojem obliku njihove distribucije. Ovaj parametar također se može koristiti za pretvaranje kvantitativnih karakteristika u kvalitativne. U ovom slučaju, takve se ocjene dodjeljuju ovisno o tome kojem redu kvantila određena opcija odgovara.

U praksi biomedicinskih istraživanja najčešće se koriste sljedeći kvantili:

– medijan;

, – kvartili (četvrtine), gdje je – donji kvartil, gornji kvartil.

Kvantili dijele područje mogućih promjena u nizu varijacija na određene intervale. Medijan (kvantil) je opcija koja se nalazi u sredini niza varijacija i dijeli ovaj niz na pola na dva jednaka dijela ( 0,5 I 0,5 ). Kvartil dijeli niz na četiri dijela: prvi dio (donji kvartil) je opcija koja razdvaja opcije čije numeričke vrijednosti ne prelaze 25% maksimalno moguće u ovu seriju, kvartil odvaja opcije s numeričkom vrijednošću do 50% od najveće moguće. Gornji kvartil () odvaja opcije do 75% maksimalnih mogućih vrijednosti.

U slučaju asimetrične distribucije varijabla u odnosu na aritmetičku sredinu, medijan i kvartili koriste se za njezino obilježavanje. U ovom slučaju koristi se sljedeći oblik prikaza prosječne vrijednosti - Meh (;). Na primjer, proučavana značajka – “razdoblje u kojem je dijete počelo samostalno hodati” – ima asimetričnu distribuciju u ispitivanoj skupini. U isto vrijeme, donji kvartil () odgovara početku hodanja - 9,5 mjeseci, medijan - 11 mjeseci, gornji kvartil () - 12 mjeseci. Sukladno tome, karakteristika prosječnog trenda navedenog atributa bit će prikazana kao 11 (9,5; 12) mjeseci.

Procjena statističke značajnosti rezultata istraživanja

Pod statističkom značajnošću podataka podrazumijeva se stupanj u kojem oni odgovaraju prikazanoj stvarnosti, tj. statistički značajni podaci su oni koji ne iskrivljuju i ispravno odražavaju objektivnu stvarnost.

Procjena statističke značajnosti rezultata istraživanja znači utvrđivanje s kojom je vjerojatnošću moguće rezultate dobivene iz uzorka populacije prenijeti na cjelokupnu populaciju. Procjena statističke značajnosti neophodna je za razumijevanje koliko se fenomena može koristiti za prosudbu fenomena kao cjeline i njegovih obrazaca.

Procjena statističke značajnosti rezultata istraživanja sastoji se od:

1. pogreške reprezentativnosti (pogreške prosječnih i relativnih vrijednosti) - m;

2. granice pouzdanosti prosječnih ili relativnih vrijednosti;

3. pouzdanost razlike u prosječnim ili relativnim vrijednostima prema kriteriju t.

Standardna greška aritmetičke sredine ili pogreška reprezentativnosti karakterizira fluktuacije prosjeka. Treba napomenuti da što je veći uzorak, to je manji raspon prosječnih vrijednosti. Standardna pogreška srednje vrijednosti izračunava se pomoću formule:

U modernoj znanstvenoj literaturi aritmetička sredina se piše zajedno s pogreškom reprezentativnosti:

ili zajedno sa standardnom devijacijom:

Kao primjer, razmotrite podatke o 1500 gradskih klinika u zemlji (opća populacija). Prosječan broj pacijenata opsluženih u klinici je 18.150 ljudi. Nasumični odabir 10% mjesta (150 klinika) daje prosječan broj pacijenata od 20 051 osoba. Pogreška uzorka, očito zbog činjenice da u uzorak nije uključeno svih 1500 klinika, jednaka je razlici između tih prosjeka - općeg prosjeka ( M gen) i srednja vrijednost uzorka ( M odabran). Ako formiramo drugi uzorak iste veličine iz naše populacije, to će dati drugačiju vrijednost pogreške. Sve te srednje vrijednosti uzorka s dovoljno velikim uzorcima normalno su raspoređene oko opće srednje vrijednosti s dovoljno velikim veliki broj ponavljanja uzorka od istog broja objekata iz populacije. Standardna pogreška srednje vrijednosti m- ovo je neizbježno širenje uzoraka srednjih vrijednosti oko opće sredine.

U slučaju kada su rezultati istraživanja prikazani u relativnim količinama (npr. postocima) – izračunati standardna pogreška razlomka:

gdje je P indikator u %, n je broj opažanja.

Rezultat se prikazuje kao (P ± m)%. Na primjer, postotak oporavka među pacijentima bio je (95,2±2,5)%.

U slučaju da broj elemenata populacije, tada pri izračunavanju standardnih pogrešaka sredine i razlomka u nazivniku razlomka, umjestomora se staviti.

Za normalnu distribuciju (distribucija srednjih vrijednosti uzorka je normalna), znamo koji dio populacije spada unutar bilo kojeg intervala oko srednje vrijednosti. Posebno:

U praksi je problem što su nam karakteristike opće populacije nepoznate, a uzorak se radi upravo u svrhu njihove procjene. To znači da ako napravimo uzorke iste veličine n iz opće populacije, tada će u 68,3% slučajeva interval sadržavati vrijednost M(u 95,5% slučajeva to će biti na intervalu, au 99,7% slučajeva – na intervalu).

Budući da je zapravo uzet samo jedan uzorak, ova tvrdnja je formulirana u smislu vjerojatnosti: s vjerojatnošću od 68,3%, prosječna vrijednost atributa u populaciji nalazi se u intervalu, s vjerojatnošću od 95,5% - u intervalu itd.

U praksi, interval se gradi oko vrijednosti uzorka tako da, uz danu (dovoljno visoku) vjerojatnost, vjerojatnost povjerenja – bi “pokrila” pravu vrijednost ovog parametra u općoj populaciji. Taj se interval naziva interval pouzdanosti.

Vjerojatnost povjerenjaP ovo je stupanj pouzdanosti da će interval pouzdanosti zapravo sadržavati pravu (nepoznatu) vrijednost parametra u populaciji.

Na primjer, ako je vjerojatnost povjerenja R iznosi 90%, to znači da će 90 uzoraka od 100 dati točnu procjenu parametra u populaciji. Prema tome, vjerojatnost pogreške, tj. netočna procjena općeg prosjeka za uzorak jednaka je u postocima: . Za ovaj primjer to znači da će 10 uzoraka od 100 dati netočnu procjenu.

Očito, stupanj pouzdanosti (vjerojatnost povjerenja) ovisi o veličini intervala: što je interval širi, veća je pouzdanost da će nepoznata vrijednost za populaciju pasti u njega. U praksi se koristi najmanje dvostruka pogreška uzorkovanja za konstrukciju intervala pouzdanosti kako bi se osiguralo najmanje 95,5% pouzdanosti.

Određivanje granica pouzdanosti prosjeka i relativnih vrijednosti omogućuje nam da pronađemo njihove dvije ekstremne vrijednosti - najmanju moguću i najveću moguću, unutar kojih se proučavani pokazatelj može pojaviti u cijeloj populaciji. Na temelju toga, granice pouzdanosti (ili interval pouzdanosti)- to su granice prosječnih ili relativnih vrijednosti, izvan kojih zbog slučajnih fluktuacija postoji beznačajna vjerojatnost.

Interval pouzdanosti može se prepisati kao: , gdje t– kriterij povjerenja.

Granice pouzdanosti aritmetičke sredine u populaciji određene su formulom:

M gen = M Izaberi + t m M

za relativnu vrijednost:

R gen = P Izaberi + t m R

Gdje M gen I R gen- vrijednosti prosječnih i relativnih vrijednosti za opću populaciju; M Izaberi I R Izaberi- vrijednosti prosječnih i relativnih vrijednosti dobivenih iz uzorka populacije; m M I m P- pogreške prosječnih i relativnih vrijednosti; t- kriterij povjerenja (kriterij točnosti koji se utvrđuje pri planiranju studije i može biti jednak 2 ili 3); t m- ovo je interval pouzdanosti ili Δ - najveća pogreška pokazatelja dobivena u istraživanju uzorka.

Treba napomenuti da je vrijednost kriterija t u određenoj mjeri povezano s vjerojatnošću prognoze bez pogreške (p), izraženo u %. Odabire ga sam istraživač, vodeći se potrebom da dobije rezultat s potrebnim stupnjem točnosti. Dakle, za vjerojatnost prognoze bez pogreške od 95,5%, vrijednost kriterija t je 2, za 99,7% - 3.

Navedene procjene intervala pouzdanosti prihvatljive su samo za statističke populacije s više od 30 opažanja.Kod manje populacije (mali uzorci) koriste se posebne tablice za određivanje t kriterija. U tim se tablicama željena vrijednost nalazi na sjecištu crte koja odgovara veličini populacije (n-1) i stupac koji odgovara razini vjerojatnosti prognoze bez pogreške (95,5%; 99,7%) koju je odabrao istraživač. U medicinskim istraživanjima, pri utvrđivanju granica pouzdanosti za bilo koji pokazatelj, vjerojatnost prognoze bez pogreške je 95,5% ili više. To znači da se vrijednost pokazatelja dobivena iz uzorka populacije mora naći u općoj populaciji u najmanje 95,5% slučajeva.

    Pitanja o temi lekcije:

    Relevantnost pokazatelja raznolikosti svojstava u statističkoj populaciji.

    Opće karakteristike pokazatelja apsolutne varijacije.

    Standardna devijacija, proračun, primjena.

    Relativne mjere varijacije.

    Medijan, rezultat kvartila.

    Procjena statističke značajnosti rezultata istraživanja.

    Standardna pogreška aritmetičke sredine, formula za izračun, primjer uporabe.

    Izračunavanje udjela i njegove standardne pogreške.

    Pojam vjerojatnosti povjerenja, primjer uporabe.

10. Pojam intervala povjerenja, njegova primjena.

    Testni zadaci na temu sa standardnim odgovorima:

1. APSOLUTNI POKAZATELJI VARIJACIJE ODNOSE SE NA

1) koeficijent varijacije

2) koeficijent oscilacije

4) medijan

2. RELATIVNI POKAZATELJI VARIJACIJE ODNOSE SE

1) disperzija

4) koeficijent varijacije

3. KRITERIJ KOJI JE ODREĐEN EKSTREMNIM VRIJEDNOSTIMA OPCIJE U NIZU VARIJACIJA

2) amplituda

3) disperzija

4) koeficijent varijacije

4. RAZLIKA EKSTREMNIH OPCIJA JE

2) amplituda

3) prosječan standardna devijacija

4) koeficijent varijacije

5. PROSJEČNI KVADRAT ODSTUPANJA POJEDINIH VRIJEDNOSTI KARAKTERISTIKE OD NJENIH PROSJEČNIH VRIJEDNOSTI JE

1) koeficijent oscilacije

2) medijan

3) disperzija

6. OMJER LJESTVA VARIJACIJE I PROSJEČNE VRIJEDNOSTI KARAKTERA JE

1) koeficijent varijacije

2) standardna devijacija

4) koeficijent oscilacije

7. OMJER PROSJEČNOG KVADRATNOG ODSTUPANJA I PROSJEČNE VRIJEDNOSTI KARAKTERISTIKE JE

1) disperzija

2) koeficijent varijacije

3) koeficijent oscilacije

4) amplituda

8. OPCIJA KOJA JE U SREDINI NIZA VARIJACIJA I DIJELI GA NA DVA JEDNAKA DIJELA JE

1) medijan

3) amplituda

9. U MEDICINSKOM ISTRAŽIVANJU, KADA SE ODREĐUJU GRANICE POVJERENJA ZA BILO KOJI POKAZATELJ, PRIHVAĆA SE VJEROJATNOST PREDVIĐANJA BEZ POGREŠAKA

10. AKO 90 OD 100 UZORAKA DAJE ISPRAVNU PROCJENU PARAMETRA U POPULACIJI, TO ZNAČI DA JE VJEROJATNOST POVJERENJE P JEDNAK

11. AKO 10 UZORAKA OD 100 DAJE NETOČNU PROCJENU, VJEROJATNOST POGREŠKE JE JEDNAKA

12. GRANICE PROSJEČNIH ILI RELATIVNIH VRIJEDNOSTI, IZLAZAK IZNAD KOJIH ZBOG SLUČAJNIH OSCILACIJA IMA NEZNAČAJNU VJEROJATNOST – OVO JE

1) interval pouzdanosti

2) amplituda

4) koeficijent varijacije

13. MALIM UZORKOM SMATRA SE POPULACIJA U KOJOJ

1) n je manji ili jednak 100

2) n je manji ili jednak 30

3) n je manji ili jednak 40

4) n je blizu 0

14. ZA VJEROJATNOST PROGNOZE BEZ POGREŠKE 95% KRITERIJSKA VRIJEDNOST t JE

15. ZA VJEROJATNOST PROGNOZE BEZ POGREŠKE 99% KRITERIJSKA VRIJEDNOST t JE

16. ZA DISTRIBUCIJU BLIZU NORMALNE, POPULACIJA SE SMATRA HOMOGENOM AKO KOEFICIJENT VARIJACIJE NE PRELAZI

17. OPCIJA, RAZDJELJIVANJE OPCIJA ČIJE BROJČANE VRIJEDNOSTI NE PRELAZE 25% OD MAKSIMALNO MOGUĆIH U DATOJ NIZU – OVO JE

2) donji kvartil

3) gornji kvartil

4) kvartil

18. PODACI KOJI NE ISKRIVLJAJU I ISPRAVNO ODRAŽAVAJU OBJEKTIVNU STVARNOST ZV.

1) nemoguće

2) jednako moguće

3) pouzdan

4) slučajni

19. PREMA PRAVILU "TRI SIGME", UZ NORMALNU DISTRIBUCIJU KARAKTERISTIKE UNUTAR
ĆE SE NALAZITI

1) 68,3% opcija

Standardna devijacija je klasičan pokazatelj varijabilnosti iz deskriptivne statistike.

Standardna devijacija, standardna devijacija, Standardna devijacija, standardna devijacija uzorka (eng. standard deviation, STD, STDev) vrlo je čest pokazatelj disperzije u deskriptivnoj statistici. Ali zbog tehnička analiza je slična statistici; ovaj se pokazatelj može (i treba) koristiti u tehničkoj analizi za otkrivanje stupnja disperzije cijene analiziranog instrumenta tijekom vremena. Označava se grčkim simbolom sigma "σ".

Hvala Karlu Gaussu i Pearsonu što su nam omogućili korištenje standardne devijacije.

Korištenje standardna devijacija u tehničkoj analizi, okrećemo ovo "indeks disperzije"" V "indikator volatilnosti“, zadržavajući značenje, ali mijenjajući pojmove.

Što je standardna devijacija

Ali osim posrednih pomoćnih izračuna, standardna devijacija je sasvim prihvatljiva za neovisni izračun i primjene u tehničkoj analizi. Kao što je aktivni čitatelj našeg časopisa čičak primijetio, " I dalje mi nije jasno zašto standardna devijacija nije uključena u skup standardnih pokazatelja domaćih trgovačkih centara«.

Stvarno, standardna devijacija može mjeriti varijabilnost instrumenta na klasičan i "čist" način. No, nažalost, ovaj pokazatelj nije tako čest u analizi vrijednosnih papira.

Primjena standardne devijacije

Ručno izračunavanje standardne devijacije nije baš zanimljivo, ali korisno za iskustvo. Standardna devijacija se može izraziti formula STD=√[(∑(x-x ) 2)/n] , koja zvuči kao korijen zbroja kvadrata razlika između elemenata uzorka i srednje vrijednosti, podijeljen s brojem elemenata u uzorku.

Ako je broj elemenata u uzorku veći od 30, tada nazivnik razlomka ispod korijena ima vrijednost n-1. Inače se koristi n.

Korak po korak izračun standardne devijacije:

  1. izračunati aritmetičku sredinu uzorka podataka
  2. oduzmite ovaj prosjek od svakog elementa uzorka
  3. sve dobivene razlike kvadriramo
  4. zbroji sve dobivene kvadrate
  5. podijelite dobiveni iznos s brojem elemenata u uzorku (ili s n-1, ako je n>30)
  6. izračunajte kvadratni korijen dobivenog kvocijenta (tzv disperzija)

Najsavršenija karakteristika varijacije je srednja kvadratna devijacija, koja se naziva standard (ili standardna devijacija). Standardna devijacija() jednak je kvadratnom korijenu prosječnog kvadratnog odstupanja pojedinačnih vrijednosti atributa od aritmetičke sredine:

Standardna devijacija je jednostavna:

Ponderirana standardna devijacija primjenjuje se na grupirane podatke:

Između korijena srednjeg kvadrata i srednjeg linearnog odstupanja u uvjetima normalne distribucije postoji sljedeći omjer: ~ 1,25.

Standardna devijacija, kao glavna apsolutna mjera varijacije, koristi se u određivanju ordinatnih vrijednosti krivulje normalne distribucije, u proračunima koji se odnose na organizaciju promatranja uzorka i utvrđivanje točnosti karakteristika uzorka, kao i u procjeni granice varijacije obilježja u homogenoj populaciji.

Disperzija, njezine vrste, standardna devijacija.

Varijanca slučajne varijable— mjera širenja dane slučajne varijable, tj. njezino odstupanje od matematičkog očekivanja. U statistici se često koristi oznaka ili. Korijen varijance naziva se standardna devijacija, standardna devijacija ili standardni raspon.

Ukupna varijanca (σ 2) mjeri varijaciju svojstva u cijelosti pod utjecajem svih čimbenika koji su uzrokovali tu varijaciju. U isto vrijeme, zahvaljujući metodi grupiranja, moguće je identificirati i mjeriti varijaciju zbog karakteristike grupiranja i varijaciju koja nastaje pod utjecajem neobračunatih čimbenika.

Međugrupna varijanca (σ 2 m.gr) karakterizira sustavnu varijaciju, tj. razlike u vrijednosti svojstva koje se proučava koje nastaju pod utjecajem obilježja - faktora koji čini osnovu grupe.

Standardna devijacija(sinonimi: standardna devijacija, standardna devijacija, kvadratna devijacija; srodni pojmovi: standardna devijacija, standardno širenje) - u teoriji vjerojatnosti i statistici, najčešći pokazatelj disperzije vrijednosti slučajne varijable u odnosu na njezino matematičko očekivanje. Kod ograničenih nizova uzoraka vrijednosti umjesto matematičkog očekivanja koristi se aritmetička sredina skupa uzoraka.

Standardna devijacija se mjeri u mjernim jedinicama same slučajne varijable i koristi se kada se izračunava standardna pogreška aritmetičke sredine, kada se konstruiraju intervali pouzdanosti, kada se statistički testiraju hipoteze, kada se mjeri linearni odnos između slučajne varijable. Definira se kao kvadratni korijen varijance slučajne varijable.


Standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable x u odnosu na svoje matematičko očekivanje temeljeno na nepristranoj procjeni njegove varijance):

gdje je disperzija; — ja element selekcije; - veličina uzorka; — aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrane. U opći slučaj Nemoguće je konstruirati nepristranu procjenu. Međutim, procjena temeljena na nepristranoj procjeni varijance je dosljedna.

Bit, opseg i postupak određivanja modusa i medijana.

Osim prosječnih snaga u statistici za relativna obilježja vrijednosti varirajućeg obilježja i unutarnja struktura serije distribucije koriste strukturne prosjeke, koji su predstavljeni uglavnom moda i medijan.

Moda- Ovo je najčešća varijanta serije. Moda se koristi, primjerice, pri određivanju veličine odjeće i obuće koji su najtraženiji među kupcima. Način rada za diskretnu seriju je onaj s najvećom frekvencijom. Prilikom izračunavanja moda za niz varijacija intervala, prvo morate odrediti modalni interval (na temelju maksimalne frekvencije), a zatim vrijednost modalne vrijednosti atributa pomoću formule:

- - modna vrijednost

- — donja granica modalnog intervala

- — veličina intervala

- — frekvencija modalnog intervala

- — frekvencija intervala koji prethodi modalnom

- — učestalost intervala koji slijedi nakon modalnog

Medijan - ovo je vrijednost atributa koji je u osnovi rangirane serije i dijeli ovu seriju na dva jednaka dijela.

Da biste odredili medijan u diskretnom nizu u prisutnosti frekvencija, prvo izračunajte poluzbroj frekvencija, a zatim odredite koja vrijednost varijante pada na njega. (Ako sortirani niz sadrži neparan broj značajki, tada se srednji broj izračunava pomoću formule:

M e = (n (ukupan broj značajki) + 1)/2,

u slučaju parnog broja obilježja, medijan će biti jednak prosjeku dvaju obilježja u sredini reda).

Pri proračunu medijani za niz intervalnih varijacija, prvo odredite srednji interval unutar kojeg se medijan nalazi, a zatim odredite vrijednost medijana pomoću formule:

- — traženi medijan

- - donja granica intervala koji sadrži medijan

- — veličina intervala

- — zbroj učestalosti ili broj članova serije

Zbroj akumuliranih frekvencija intervala koji prethode medijanu

- — učestalost srednjeg intervala

Primjer. Pronađite modus i medijan.

Riješenje:
U u ovom primjeru modalni interval je unutar dobne skupine od 25-30 godina, budući da ovaj interval ima najveću učestalost (1054).

Izračunajmo veličinu moda:

To znači da je modalna dob učenika 27 godina.

Izračunajmo medijan. Interval medijana je u dobnoj skupini od 25-30 godina, jer unutar ovog intervala postoji opcija koja populaciju dijeli na dva jednaka dijela (Σf i /2 = 3462/2 = 1731). Zatim zamijenimo potrebne numeričke podatke u formulu i dobijemo srednju vrijednost:

To znači da je polovica studenata mlađa od 27,4 godine, a druga polovica starija od 27,4 godine.

Osim moda i medijana, mogu se koristiti indikatori kao što su kvartili, koji dijele rangirani niz na 4 jednaka dijela, decili- 10 dijelova i percentila - na 100 dijelova.

Pojam selektivnog promatranja i njegov opseg.

Selektivno promatranje primjenjuje se kada se koristi kontinuirani nadzor fizički nemoguće zbog velike količine podataka ili nije ekonomski izvedivo. Fizička nemogućnost javlja se, primjerice, pri proučavanju tokova putnika, tržišnih cijena i obiteljskih proračuna. Ekonomska nesvrsishodnost javlja se pri procjeni kvalitete robe povezane s njihovim uništenjem, na primjer, kušanjem, ispitivanjem opeke na čvrstoću itd.

Statističke jedinice odabrane za promatranje čine okvir uzorkovanja ili uzorak, a cijeli njihov niz čini opću populaciju (GS). U ovom slučaju, broj jedinica u uzorku je označen sa n, au cijelom HS - N. Stav n/N naziva se relativna veličina ili udio uzorka.

Kvaliteta rezultata promatranja uzorka ovisi o reprezentativnosti uzorka, odnosno o tome koliko je reprezentativan u HS-u. Kako bi se osigurala reprezentativnost uzorka potrebno je pridržavati se princip slučajnog odabira jedinica, što pretpostavlja da na uključivanje HS jedinice u uzorak ne može utjecati niti jedan čimbenik osim slučajnosti.

postoji 4 načina slučajnog odabira uzorkovati:

  1. Zapravo nasumično selekcija ili “metoda lutrije”, kada se statističkim količinama dodjeljuju serijski brojevi, bilježe na određenim predmetima (npr. bačve), koje se zatim miješaju u nekoj posudi (npr. u vrećici) i nasumično odabiru. U praksi se ova metoda provodi pomoću generatora slučajni brojevi ili matematičke tablice slučajnih brojeva.
  2. Mehanički izbor prema kojem svaki ( N/n)-tu vrijednost opće populacije. Na primjer, ako sadrži 100.000 vrijednosti, a trebate odabrati 1.000, tada će svaka 100.000 / 1000 = 100. vrijednost biti uključena u uzorak. Štoviše, ako nisu rangirani, prvi se odabire slučajnim odabirom od prvih sto, a brojevi ostalih bit će sto veći. Na primjer, ako je prva jedinica bila broj 19, onda bi sljedeća trebala biti broj 119, zatim broj 219, zatim broj 319 itd. Ako su jedinice populacije rangirane, tada se prvo bira broj 50, zatim broj 150, zatim broj 250 i tako dalje.
  3. Izvodi se odabir vrijednosti iz heterogenog niza podataka stratificiran(stratificirana) metoda, kada se populacija najprije podijeli u homogene skupine na koje se primjenjuje slučajna ili mehanička selekcija.
  4. Posebna metoda uzorkovanja je serijski selekcija, pri kojoj se nasumično ili mehanički odabiru ne pojedinačne vrijednosti, već njihove serije (nizovi od nekog broja do nekog broja u nizu), unutar kojih se provodi kontinuirano promatranje.

Kvaliteta promatranja uzorka također ovisi o vrsta uzorka: ponovljeno ili neponovljiv.

Na ponovni odabir Statističke vrijednosti ili njihove serije uključene u uzorak vraćaju se općoj populaciji nakon upotrebe, s mogućnošću uključivanja u novi uzorak. Štoviše, sve vrijednosti u populaciji imaju istu vjerojatnost uključivanja u uzorak.

Izbor koji se ne ponavlja znači da se statističke vrijednosti ili njihove serije uključene u uzorak ne vraćaju u opću populaciju nakon uporabe, pa se stoga za preostale vrijednosti potonjih povećava vjerojatnost da budu uključene u sljedeći uzorak.

Uzorkovanje koje se ne ponavlja daje točnije rezultate, pa se češće koristi. Ali postoje situacije kada se ne može primijeniti (proučavanje tokova putnika, potražnje potrošača itd.) i tada se provodi ponovljena selekcija.

Maksimalna pogreška uzorkovanja promatranja, prosječna pogreška uzorkovanja, postupak njihova izračuna.

Razmotrimo detaljno gore navedene metode formiranja uzorka populacije i pogreške koje pri tome nastaju. reprezentativnost .
Ispravno nasumično uzorkovanje se temelji na odabiru jedinica iz populacije nasumično bez ikakvih sustavnih elemenata. Tehnički gledano, stvarni slučajni odabir provodi se izvlačenjem ždrijeba (na primjer, lutrija) ili korištenjem tablice slučajnih brojeva.

Ispravan slučajni odabir “u svom čistom obliku” rijetko se koristi u praksi selektivnog promatranja, ali je original među ostalim vrstama odabira, implementira osnovne principe selektivnog promatranja. Razmotrimo neka pitanja teorije metode uzorkovanja i formule pogreške za jednostavan slučajni uzorak.

Pristranost uzorkovanja je razlika između vrijednosti parametra u općoj populaciji i njegove vrijednosti izračunate iz rezultata promatranja uzorka. Za prosječno kvantitativno obilježje, pogreška uzorkovanja određena je

Pokazatelj se naziva granična pogreška uzorkovanja.
Srednja vrijednost uzorka je slučajna varijabla koja može uzeti različita značenja ovisno o tome koje su jedinice bile uključene u uzorak. Stoga su greške uzorkovanja također slučajne varijable i mogu poprimiti različite vrijednosti. Stoga odredite prosjek od moguće greške - prosječna greška uzorkovanja, što ovisi o:

Veličina uzorka: što je veći broj, to je manja prosječna pogreška;

Stupanj promjene svojstva koje se proučava: što je manja varijacija obilježja, a time i disperzija, to je manja prosječna pogreška uzorkovanja.

Na slučajni ponovni odabir izračunava se prosječna greška:
.
U praksi, opća varijanca nije točno poznata, ali u teorija vjerojatnosti dokazano je da
.
Budući da je vrijednost za dovoljno veliki n blizu 1, možemo pretpostaviti da je . Tada se može izračunati prosječna pogreška uzorkovanja:
.
Ali u slučajevima malog uzorka (s n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Na slučajno uzorkovanje bez ponavljanja zadane formule su prilagođene vrijednosti . Tada je prosječna greška uzorkovanja koja se ne ponavlja:
I .
Jer uvijek manji, tada je množitelj () uvijek manji od 1. To znači da je prosječna pogreška tijekom neponavljajućeg odabira uvijek manja nego tijekom ponovljenog odabira.
Mehaničko uzorkovanje koristi se kada je opća populacija na neki način poredana (primjerice, abecedni popisi birača, telefonski brojevi, kućni brojevi, brojevi stanova). Odabir jedinica provodi se u određenom intervalu, koji je obrnut postotku uzorkovanja. Dakle, s uzorkom od 2% odabire se svakih 50 jedinica = 1/0,02, s uzorkom od 5% svakih 1/0,05 = 20 jedinica opće populacije.

Referentna točka se bira na različite načine: nasumično, od sredine intervala, s promjenom referentne točke. Glavna stvar je izbjeći sustavnu pogrešku. Na primjer, s uzorkom od 5%, ako je prva jedinica 13., onda su sljedeće 33, 53, 73 itd.

U pogledu točnosti, mehanički odabir je blizak stvarnom slučajnom uzorkovanju. Stoga se za određivanje prosječne pogreške mehaničkog uzorkovanja koriste odgovarajuće formule za slučajni odabir.

Na tipičan izbor populacija koja se ispituje preliminarno je podijeljena u homogene, slične skupine. Na primjer, kada se istražuju poduzeća, to mogu biti industrije, podsektori; kada se proučava stanovništvo, to mogu biti regije, društvene ili dobne skupine. Zatim se neovisni odabir iz svake skupine vrši mehanički ili čisto nasumično.

Tipično uzorkovanje daje točnije rezultate od drugih metoda. Tipizacijom opće populacije osigurava se zastupljenost svake tipološke skupine u uzorku, čime je moguće eliminirati utjecaj međugrupne varijance na prosječnu pogrešku uzorkovanja. Posljedično, pri pronalaženju pogreške tipičnog uzorka prema pravilu zbrajanja varijanci (), potrebno je uzeti u obzir samo prosjek grupnih varijanci. Tada je prosječna greška uzorkovanja:
pri ponovnom odabiru
,
s odabirom koji se ne ponavlja
,
Gdje - prosjek varijanci unutar grupe u uzorku.

Izbor serije (ili gnijezda). koristi se kada je populacija podijeljena u serije ili skupine prije početka istraživanja uzorka. Ove serije mogu biti pakiranja gotovih proizvoda, studentskih grupa, timova. Serije za ispitivanje odabiru se mehanički ili čisto slučajno, a unutar serije provodi se kontinuirano ispitivanje jedinica. Stoga prosječna pogreška uzorkovanja ovisi samo o međugrupnoj (međuserijskoj) varijanci koja se izračunava pomoću formule:

gdje je r broj odabranih serija;
- prosjek i-te serije.

Prosječna pogreška serijskog uzorkovanja izračunava se:

nakon ponovnog odabira:
,
s odabirom koji se ne ponavlja:
,
gdje je R ukupan broj epizoda.

Kombinirano izbor je kombinacija razmatranih metoda selekcije.

Prosječna pogreška uzorkovanja za bilo koju metodu uzorkovanja ovisi uglavnom o apsolutnoj veličini uzorka i, u manjoj mjeri, o postotku uzorka. Pretpostavimo da je u prvom slučaju napravljeno 225 opažanja iz populacije od 4500 jedinica, au drugom iz populacije od 225000 jedinica. Varijance u oba slučaja jednake su 25. Tada će u prvom slučaju, s odabirom od 5%, pogreška uzorkovanja biti:

U drugom slučaju, s odabirom od 0,1%, to će biti jednako:


Tako, sa smanjenjem postotka uzorkovanja za 50 puta, pogreška uzorkovanja se malo povećala, budući da se veličina uzorka nije promijenila.
Pretpostavimo da je veličina uzorka povećana na 625 opažanja. U ovom slučaju, greška uzorkovanja je:

Povećanje uzorka za 2,8 puta uz istu veličinu populacije smanjuje veličinu pogreške uzorkovanja za više od 1,6 puta.

Metode i metode formiranja uzorka populacije.

U statistici se koriste različite metode formiranja uzoraka populacija, što je određeno ciljevima istraživanja i ovisi o specifičnostima predmeta proučavanja.

Glavni uvjet za provođenje istraživanja uzorka je spriječiti pojavu sustavnih pogrešaka koje proizlaze iz kršenja načela jednakih mogućnosti za svaku jedinicu opće populacije koja bi bila uključena u uzorak. Prevencija sustavnih pogrešaka postiže se korištenjem znanstveno utemeljenih metoda formiranja uzorka populacije.

Postoje sljedeće metode za odabir jedinica iz populacije:

1) individualni odabir - za uzorak se biraju pojedine jedinice;

2) grupni odabir - uzorak uključuje kvalitativno homogene skupine ili nizove jedinica koje se proučavaju;

3) kombinirana selekcija je kombinacija individualne i grupne selekcije.
Metode odabira određene su pravilima za formiranje uzorka populacije.

Uzorak može biti:

  • zapravo nasumično sastoji se u tome što je uzorak populacije nastao kao rezultat slučajnog (nenamjernog) odabira pojedinih jedinica iz opće populacije. U tom se slučaju broj jedinica odabranih u uzorku populacije obično određuje na temelju prihvaćenog udjela uzorka. Omjer uzorka je omjer broja jedinica u uzorkovanoj populaciji n prema broju jedinica u općoj populaciji N, tj.
  • mehanički sastoji se u tome što se izbor jedinica u uzorku populacije vrši iz opće populacije, podijeljene na jednake intervale (skupine). U tom je slučaju veličina intervala u populaciji jednaka obrnutoj proporciji uzorka. Dakle, kod uzorka od 2% bira se svaka 50. jedinica (1:0,02), kod uzorka od 5% svaka 20. jedinica (1:0,05) itd. Dakle, u skladu s prihvaćenim omjerom selekcije, opća populacija je takoreći mehanički podijeljena u skupine jednake veličine. Iz svake skupine odabire se samo jedna jedinica za uzorak.
  • tipično - u kojoj se opća populacija prvo dijeli na homogene tipične skupine. Zatim se iz svake tipične skupine koristi čisto slučajni ili mehanički uzorak za pojedinačni odabir jedinica u populaciju uzorka. Važna značajka tipičnog uzorka je da daje preciznije rezultate u usporedbi s drugim metodama odabira jedinica u uzorku populacije;
  • serijski- u kojoj je opća populacija podijeljena u skupine jednake veličine - serije. Serije su odabrane u uzorku populacije. Unutar niza provodi se kontinuirano promatranje jedinica uključenih u niz;
  • kombinirani- uzorkovanje može biti dvostupanjsko. U ovom slučaju, populacija se najprije podijeli u skupine. Zatim se odabiru skupine, a unutar njih pojedine jedinice.

U statistici se razlikuju sljedeće metode za odabir jedinica u uzorku populacije::

  • jednostupanjska uzorkovanje - svaka odabrana jedinica odmah se podvrgava proučavanju prema zadanom kriteriju (pravilno slučajno i serijsko uzorkovanje);
  • višestupanjski uzorkovanje - vrši se selekcija iz opće populacije pojedinih skupina, a iz skupina odabiru pojedine jedinice (tipično uzorkovanje mehaničkom metodom odabira jedinica u uzorku populacije).

Osim toga, postoje:

  • ponovni odabir- prema shemi vraćene lopte. U tom slučaju, svaka jedinica ili serija uključena u uzorak vraća se općoj populaciji i stoga ima priliku ponovno biti uključena u uzorak;
  • ponoviti odabir- prema shemi nevraćene lopte. Ima preciznije rezultate s istom veličinom uzorka.

Određivanje potrebne veličine uzorka (koristeći Studentovu t-tablicu).

Jedno od znanstvenih načela u teoriji uzorkovanja je osigurati odabir dovoljnog broja jedinica. Teoretski, potreba poštivanja ovog načela prikazana je u dokazima graničnih teorema u teoriji vjerojatnosti, koji omogućuju utvrđivanje koliki volumen jedinica treba odabrati iz populacije da bude dovoljan i da osigura reprezentativnost uzorka.

Smanjenje standardne pogreške uzorkovanja, a time i povećanje točnosti procjene, uvijek je povezano s povećanjem veličine uzorka, stoga je već u fazi organiziranja promatranja uzorka potrebno odlučiti koja je veličina uzorkovana populacija treba biti kako bi se osigurala potrebna točnost rezultata promatranja. Izračun potrebne veličine uzorka konstruira se pomoću formula izvedenih iz formula za najveće pogreške uzorkovanja (A), koje odgovaraju određenoj vrsti i metodi odabira. Dakle, za nasumično ponovljenu veličinu uzorka (n) imamo:

Bit ove formule je da je slučajnim ponovljenim odabirom traženog broja veličina uzorka izravno proporcionalna kvadratu koeficijenta pouzdanosti. (t2) i varijance varijacijske karakteristike (?2) i obrnuto je proporcionalna kvadratu najveće pogreške uzorkovanja (?2). Konkretno, s povećanjem najveće pogreške za faktor dva, potrebna veličina uzorka može se smanjiti za faktor četiri. Od tri parametra, dva (t i?) postavlja istraživač.

Pritom je istraživač na temelju Iz svrhe i ciljeva uzorka istraživanja mora se razriješiti pitanje: u kojoj kvantitativnoj kombinaciji je bolje uključiti te parametre da bi se osigurala optimalna opcija? U jednom slučaju može biti zadovoljniji pouzdanošću dobivenih rezultata (t) nego mjerom točnosti (?), u drugom - obrnuto. Teže je riješiti pitanje vrijednosti maksimalne pogreške uzorkovanja, budući da istraživač ne raspolaže ovim pokazateljem u fazi projektiranja promatranja uzorka, stoga je u praksi uobičajeno odrediti vrijednost maksimalne pogreške uzorkovanja, obično unutar 10% očekivane prosječne razine atributa. Utvrđivanju procijenjenog prosjeka može se pristupiti na različite načine: korištenjem podataka iz sličnih prethodnih istraživanja ili korištenjem podataka iz okvira uzorkovanja i provođenjem malog pilot uzorka.

Najteže je utvrditi kod izrade uzorka promatranja treći parametar u formuli (5.2) - disperziju uzorka populacije. U tom slučaju potrebno je koristiti sve podatke kojima istraživač raspolaže, a dobivene u prethodno provedenim sličnim i pilot istraživanjima.

Pitanje o definiciji potrebna veličina uzorka postaje kompliciranija ako istraživanje uzorkovanja uključuje proučavanje nekoliko karakteristika jedinica uzorkovanja. U ovom slučaju, prosječne razine svake od karakteristika i njihove varijacije, u pravilu, su različite, pa je stoga odlučivanje kojoj varijanci od kojih karakteristika dati prednost moguće samo uzimajući u obzir svrhu i ciljeve pregled.

Pri izradi uzorka promatranja pretpostavlja se unaprijed određena vrijednost dopuštene pogreške uzorkovanja u skladu s ciljevima pojedine studije i vjerojatnosti zaključaka na temelju rezultata promatranja.

Općenito, formula za najveću pogrešku prosjeka uzorka omogućuje nam da odredimo:

Veličina mogućih odstupanja pokazatelja opće populacije od pokazatelja uzorka populacije;

Potrebna veličina uzorka, koja osigurava traženu točnost, pri kojoj granice moguće pogreške neće premašiti određenu specificiranu vrijednost;

Vjerojatnost da će greška u uzorku imati određenu granicu.

Distribucija učenika u teoriji vjerojatnosti, to je jednoparametarska obitelj apsolutno kontinuiranih distribucija.

Dinamički niz (interval, moment), završni dinamički niz.

Dinamička serija- to su vrijednosti statističkih pokazatelja koji su prikazani u određenom kronološkom slijedu.

Svaka vremenska serija sadrži dvije komponente:

1) pokazatelji vremenskih razdoblja (godine, kvartali, mjeseci, dani ili datumi);

2) pokazatelji koji karakteriziraju predmet koji se proučava za vremenska razdoblja ili odgovarajuće datume, koji se nazivaju razinama serije.

Izražene su razine serije i apsolutne i prosječne ili relativne vrijednosti. Ovisno o prirodi pokazatelja, konstruiraju se vremenski nizovi apsolutnih, relativnih i prosječnih vrijednosti. Dinamički nizovi iz relativnih i prosječnih vrijednosti konstruirani su na temelju izvedenih nizova apsolutnih vrijednosti. Postoje intervalni i momentni nizovi dinamike.

Dinamičke intervalne serije sadrži vrijednosti indikatora za određena vremenska razdoblja. U intervalnom nizu, razine se mogu zbrajati kako bi se dobio volumen fenomena tijekom duljeg razdoblja ili takozvani akumulirani ukupni iznosi.

Niz dinamičkih trenutaka odražava vrijednosti pokazatelja u određenom trenutku (datum vremena). U trenutnim nizovima istraživača može zanimati samo razlika u pojavama koja odražava promjenu razine niza između određenih datuma, budući da zbroj razina ovdje nema pravi sadržaj. Ovdje se ne računaju kumulativni zbrojevi.

Najvažniji uvjet za ispravnu konstrukciju vremenske serije je usporedivost razina serije koje pripadaju različitim razdobljima. Razine moraju biti prikazane u homogenim količinama, te mora postojati jednaka cjelovitost obuhvata različitih dijelova fenomena.

Da bi Kako bi se izbjeglo iskrivljenje stvarne dinamike, u statističkoj studiji provode se preliminarni izračuni (zatvaranje dinamičke serije), koji prethode statističkoj analizi vremenske serije. Zatvaranje dinamičke serije podrazumijeva se spajanje u jednu seriju dvije ili više serija, čije su razine izračunate različitim metodologijama ili ne odgovaraju teritorijalnim granicama itd. Zatvaranje dinamičkog niza također može značiti dovođenje apsolutnih razina dinamičkog niza na zajedničku osnovu, čime se neutralizira neusporedivost razina dinamičkog niza.

Pojam usporedivosti dinamičkih nizova, koeficijenata, rasta i stopa rasta.

Dinamička serija- to je niz statističkih pokazatelja koji karakteriziraju razvoj prirodnih i društvenih pojava tijekom vremena. Statističke zbirke koje objavljuje Državni odbor za statistiku Rusije sadrže veliki broj dinamičkih serija u tabelarnom obliku. Dinamički nizovi omogućuju prepoznavanje obrazaca razvoja fenomena koji se proučavaju.

Dinamičke serije sadrže dvije vrste indikatora. Indikatori vremena(godine, kvartali, mjeseci itd.) ili točke u vremenu (na početku godine, na početku svakog mjeseca itd.). Indikatori razine retka. Pokazatelji razina dinamičke serije mogu se izraziti u apsolutnim vrijednostima (proizvodnja proizvoda u tonama ili rubljima), relativnim vrijednostima (udio gradskog stanovništva u %) i prosječnim vrijednostima (prosječne plaće radnika u industriji po godinama , itd.). U tabelarnom obliku, vremenska serija sadrži dva stupca ili dva retka.

Ispravna konstrukcija vremenske serije zahtijeva ispunjenje niza zahtjeva:

  1. svi pokazatelji niza dinamike moraju biti znanstveno utemeljeni i pouzdani;
  2. pokazatelji niza dinamike moraju biti usporedivi tijekom vremena, tj. moraju se izračunati za ista vremenska razdoblja ili na iste datume;
  3. indikatori niza dinamika moraju biti usporedivi na cijelom teritoriju;
  4. pokazatelji niza dinamike moraju biti sadržajno usporedivi, tj. izračunati prema jedinstvenoj metodologiji, na isti način;
  5. pokazatelji brojnih dinamika trebali bi biti usporedivi u nizu farmi koje se uzimaju u obzir. Svi pokazatelji niza dinamike moraju biti navedeni u istim mjernim jedinicama.

Statistički pokazatelji može karakterizirati ili rezultate procesa koji se proučava tijekom određenog vremenskog razdoblja ili stanje fenomena koji se proučava u određenom trenutku u vremenu, tj. pokazatelji mogu biti intervalni (periodični) i trenutni. Prema tome, početno dinamički niz može biti interval ili trenutak. Nizovi dinamike trenutaka pak mogu biti s jednakim ili nejednakim vremenskim intervalima.

Izvorni dinamički niz može se transformirati u niz prosječnih vrijednosti i niz relativnih vrijednosti (lančanih i osnovnih). Takve vremenske serije nazivaju se izvedene vremenske serije.

Metodologija za izračun prosječne razine u dinamičkom nizu je različita, ovisno o vrsti dinamičkog niza. Koristeći primjere, razmotrit ćemo vrste dinamičkih serija i formule za izračun prosječne razine.

Apsolutna povećanja (Δy) pokazuju koliko se jedinica promijenila sljedeća razina niza u odnosu na prethodnu (gr. 3. - lančana apsolutna povećanja) ili u odnosu na početnu razinu (gr. 4. - osnovna apsolutna povećanja). Formule za izračun mogu se napisati na sljedeći način:

Kada se apsolutne vrijednosti niza smanje, doći će do "smanjenja" odnosno "smanjenja".

Pokazatelji apsolutnog rasta pokazuju da je, primjerice, u 1998. godini proizvodnja proizvoda “A” povećana za 4 tisuće tona u odnosu na 1997. godinu, odnosno za 34 tisuće tona u odnosu na 1994. godinu; za ostale godine vidi tablicu. 11,5 gr. 3 i 4.

Brzina rasta pokazuje koliko se puta razina niza promijenila u odnosu na prethodnu (gr. 5 - lančani koeficijenti rasta ili pada) ili u odnosu na početnu razinu (gr. 6 - osnovni koeficijenti rasta ili pada). Formule za izračun mogu se napisati na sljedeći način:

Stope rasta pokazuju koliki je postotak sljedeća razina niza u usporedbi s prethodnom (gr. 7 - lančane stope rasta) ili u usporedbi s početnom razinom (gr. 8 - osnovne stope rasta). Formule za izračun mogu se napisati na sljedeći način:

Tako je, na primjer, 1997. godine obujam proizvodnje proizvoda "A" u odnosu na 1996. godinu bio 105,5% (

Brzina rasta pokazuju za koliko se postotaka povećala razina izvještajnog razdoblja u odnosu na prethodno (stupac 9 - lančane stope rasta) ili u odnosu na početnu razinu (stupac 10 - osnovne stope rasta). Formule za izračun mogu se napisati na sljedeći način:

T pr = T r - 100% ili T pr = apsolutni rast / razina prethodnog razdoblja * 100%

Tako je, na primjer, 1996. godine u odnosu na 1995. proizvod “A” proizveden za 3,8% (103,8% - 100%) ili (8:210)x100% više, au odnosu na 1994. godinu - za 9% (109% - 100%).

Ako se apsolutne razine u nizu smanjuju, tada će stopa biti manja od 100% i, sukladno tome, doći će do stope pada (stopa porasta s predznakom minus).

Apsolutna vrijednost povećanja od 1%.(stupac 11) pokazuje koliko se jedinica mora proizvesti u određenom razdoblju da se razina prethodnog razdoblja poveća za 1%. U našem primjeru 1995. godine bilo je potrebno proizvesti 2,0 tisuće tona, a 1998. godine 2,3 tisuće tona, tj. puno veći.

Apsolutna vrijednost rasta od 1% može se odrediti na dva načina:

Razina prethodnog razdoblja podijeljena je sa 100;

Apsolutna lančana povećanja dijele se s odgovarajućim lančanim stopama rasta.

Apsolutna vrijednost povećanja od 1% =

U dinamici, osobito u dugom razdoblju, važna je zajednička analiza stope rasta sa sadržajem svakog postotka povećanja ili smanjenja.

Imajte na umu da je razmatrana metodologija za analizu vremenskih serija primjenjiva i za vremenske serije, čije su razine izražene u apsolutnim vrijednostima (t, tisuća rubalja, broj zaposlenika itd.), i za vremenske serije, čije su razine izražavaju se u relativnim pokazateljima (% nedostataka, % sadržaja pepela u ugljenu itd.) ili prosječnim vrijednostima (prosječni prinos u c/ha, prosječna plaća itd.).

Uz razmatrane analitičke pokazatelje, izračunate za svaku godinu u usporedbi s prethodnom ili početnom razinom, pri analizi serije dinamike potrebno je izračunati prosječne analitičke pokazatelje za razdoblje: prosječnu razinu serije, prosječni godišnji apsolutni porast (smanjenje) te prosječna godišnja stopa rasta i stopa rasta.

Metode za izračunavanje prosječne razine niza dinamike raspravljene su gore. U intervalnoj dinamičkoj seriji koju razmatramo, prosječna razina serije izračunava se pomoću jednostavne formule aritmetičke sredine:

Prosječna godišnja proizvodnja proizvoda za 1994-1998. iznosio 218,4 tisuća tona.

Prosječni godišnji apsolutni rast također se izračunava korištenjem jednostavne formule aritmetičkog prosjeka:

Godišnji apsolutni porast varirao je kroz godine od 4 do 12 tisuća tona (vidi stupac 3), a prosječni godišnji porast proizvodnje za razdoblje 1995.-1998. iznosio 8,5 tisuća tona.

Metode za izračunavanje prosječne stope rasta i prosječne stope rasta zahtijevaju detaljnije razmatranje. Razmotrimo ih na primjeru pokazatelja razine godišnjih serija danih u tablici.

Prosječna razina dinamičke serije.

Dinamički niz (ili vremenski niz)- to su numeričke vrijednosti određenog statističkog pokazatelja u uzastopnim trenucima ili vremenskim razdobljima (tj. poredane kronološkim redom).

Nazivaju se numeričke vrijednosti jednog ili drugog statističkog pokazatelja koji čini dinamičku seriju razine serije a obično se označava slovom g. Prvi termin serije y 1 naziva se početnim ili osnovna razina, i posljednji y n - konačni. Trenuci ili razdoblja na koje se razine odnose označeni su sa t.

Dinamički nizovi obično se prikazuju u obliku tablice ili grafikona, a vremenska skala se konstruira duž apscisne osi t, a duž ordinatne osi - ljestvica razina serije g.

Prosječni pokazatelji dinamičke serije

Svaki niz dinamike može se smatrati određenim skupom n vremenski promjenjivi pokazatelji koji se mogu sažeti kao prosjeci. Takvi generalizirani (prosječni) pokazatelji posebno su potrebni kada se uspoređuju promjene pojedinog pokazatelja u različitim razdobljima, u različitim zemljama itd.

Generalizirana karakteristika niza dinamike može poslužiti, prije svega, razina srednjeg reda. Metoda za izračunavanje prosječne razine ovisi o tome je li serija trenutna ili intervalna (periodična).

Kada interval niza, njegova prosječna razina određena je formulom jednostavne aritmetičke sredine razina niza, tj.

=
Ako je dostupno trenutak red koji sadrži n razine ( y1, y2, …, yn) s jednakim razmacima između datuma (vremena), tada se takav niz može lako pretvoriti u niz prosječnih vrijednosti. U ovom slučaju pokazatelj (razina) na početku svakog razdoblja istovremeno je pokazatelj na kraju prethodnog razdoblja. Tada se prosječna vrijednost indikatora za svako razdoblje (razmak između datuma) može izračunati kao polovica zbroja vrijednosti na na početku i na kraju razdoblja, tj. kako . Broj takvih prosjeka bit će . Kao što je ranije navedeno, za niz prosječnih vrijednosti, prosječna razina izračunava se pomoću aritmetičke sredine.

Stoga možemo napisati:
.
Nakon transformacije brojnika dobivamo:
,

Gdje Y1 I Yn— prva i zadnja razina reda; Yi— srednje razine.

Ovaj prosjek je u statistici poznat kao prosječno kronološki za seriju trenutaka. Ime je dobio od riječi "cronos" (vrijeme, latinski), jer se izračunava iz pokazatelja koji se mijenjaju tijekom vremena.

U slučaju nejednakih intervalima između datuma, kronološki prosjek za niz trenutaka može se izračunati kao aritmetička sredina prosječnih vrijednosti razina za svaki par trenutaka, ponderiranih udaljenostima (vremenskim intervalima) između datuma, tj.
.
U ovom slučaju pretpostavlja se da su u intervalima između datuma razine poprimile različite vrijednosti, a mi smo jedna od dvije poznate ( yi I yi+1) utvrđujemo prosjeke iz kojih zatim izračunavamo ukupni prosjek za cijelo analizirano razdoblje.
Ako se pretpostavi da svaka vrijednost yi ostaje nepromijenjen do sljedećeg (i+ 1)- trenutak, tj. Ako je poznat točan datum promjene razina, izračun se može izvesti pomoću formule ponderirane aritmetičke sredine:
,

gdje je vrijeme tijekom kojeg je razina ostala nepromijenjena.

Osim prosječne razine u dinamičkoj seriji, izračunavaju se i drugi prosječni pokazatelji - prosječna promjena razina serije (osnovna i lančana metoda), prosječna stopa promjene.

Osnovna vrijednost apsolutne promjene je kvocijent zadnje temeljne apsolutne promjene podijeljen s brojem promjena. To je

Lanac znači apsolutnu promjenu razine niza je kvocijent dijeljenja zbroja svih lančanih apsolutnih promjena s brojem promjena, tj.

Znak prosječnih apsolutnih promjena također se koristi za prosuđivanje prirode promjene u nekoj pojavi u prosjeku: rast, pad ili stabilnost.

Iz pravila kontrole osnovne i lančane apsolutne promjene proizlazi da osnovna i lančana prosječna promjena moraju biti jednake.

Uz prosječnu apsolutnu promjenu, bazičnom i lančanom metodom izračunava se i relativni prosjek.

Osnovna prosječna relativna promjena određuje se formulom:

Prosječna relativna promjena u lancu određuje se formulom:

Naravno, osnovne i lančane prosječne relativne promjene moraju biti iste, a usporedbom s kriterijskom vrijednošću 1 zaključuje se kakva je priroda promjene pojave u prosjeku: rast, pad ili stabilnost.
Oduzimanjem 1 od osnovne ili lančane prosječne relativne promjene, odgovarajući prosječna stopa promjene, prema čijem se znaku također može prosuditi priroda promjene u fenomenu koji se proučava, što se odražava u ovom nizu dinamike.

Sezonska kolebanja i indeksi sezonalnosti.

Sezonske fluktuacije su stabilne unutargodišnje fluktuacije.

Osnovno načelo upravljanja za postizanje maksimalnog učinka je maksimiziranje prihoda i minimiziranje troškova. Proučavanjem sezonskih kolebanja rješava se problem jednadžbe maksimuma na svakoj razini godine.

Pri proučavanju sezonskih fluktuacija rješavaju se dva međusobno povezana problema:

1. Identifikacija specifičnosti razvoja fenomena u unutargodišnjoj dinamici;

2. Mjerenje sezonskih fluktuacija s izgradnjom modela sezonskih valova;

Za mjerenje sezonskih varijacija obično se broje sezonski purani. Općenito, određuju se omjerom početnih jednadžbi dinamičkog niza i teoretskih jednadžbi, koje služe kao osnova za usporedbu.

Budući da su slučajna odstupanja superponirana sezonskim fluktuacijama, indeksi sezonalnosti su prosječni kako bi ih se eliminiralo.

U ovom slučaju, za svako razdoblje godišnjeg ciklusa utvrđuju se generalizirani pokazatelji u obliku prosječnih sezonskih indeksa:

Prosječni indeksi sezonskih fluktuacija oslobođeni su utjecaja slučajnih odstupanja glavnog trenda razvoja.

Ovisno o prirodi trenda, formula za prosječni indeks sezonalnosti može imati sljedeće oblike:

1.Za nizove međugodišnje dinamike s jasno izraženim glavnim trendom razvoja:

2. Za serije unutargodišnje dinamike u kojima nema trenda rasta ili pada ili je beznačajan:

Gdje je ukupni prosjek;

Metode za analizu glavnog trenda.

Na razvoj pojava tijekom vremena utječu čimbenici različite naravi i jačine utjecaja. Neki od njih su slučajne prirode, drugi imaju gotovo konstantan utjecaj i tvore određeni trend razvoja u dinamici.

Važan zadatak statistike je identificirati dinamiku trenda u serijama, oslobođene utjecaja različitih slučajnih čimbenika. U tu svrhu vremenske serije se obrađuju metodama ukrupnjavanja intervala, pomičnog prosjeka i analitičkog niveliranja itd.

Metoda povećanja intervala temelji se na proširenju vremenskih razdoblja, koja uključuju razine niza dinamike, tj. je zamjena podataka koji se odnose na mala vremenska razdoblja podacima za veća razdoblja. Posebno je učinkovit kada se početne razine serije odnose na kratka vremenska razdoblja. Na primjer, nizovi indikatora koji se odnose na dnevne događaje zamjenjuju se nizovima koji se odnose na tjedne, mjesečne itd. To će se jasnije pokazati “os razvoja fenomena”. Prosjek, izračunat u povećanim intervalima, omogućuje nam da identificiramo smjer i prirodu (ubrzanje ili usporavanje rasta) glavnog trenda razvoja.

Metoda pomičnog prosjeka sličan prethodnom, ali u ovom slučaju stvarne razine zamijenjene su prosječnim razinama izračunatim za sekvencijalno pomične (klizne) povećane intervale koji pokrivaju m razine serije.

Na primjer, ako prihvatimo m=3, zatim se prvo izračuna prosjek prve tri razine serije, zatim - od istog broja razina, ali počevši od druge, zatim - počevši od treće, itd. Dakle, prosjek "klizi" duž niza dinamike, pomičući se za jedan član. Izračunato iz mčlanova, pomični prosjeci odnose se na sredinu (središte) svakog intervala.

Ova metoda eliminira samo slučajne fluktuacije. Ako niz ima sezonski val, on će postojati čak i nakon izglađivanja metodom pomičnog prosjeka.

Analitičko usklađivanje. Kako bi se eliminirale slučajne fluktuacije i identificirao trend, koristi se niveliranje razina serija pomoću analitičkih formula (ili analitičko niveliranje). Njegova bit je zamjena empirijskih (stvarnih) razina s teorijskim, koje se izračunavaju pomoću određene jednadžbe usvojene kao matematički model trenda, gdje se teorijske razine razmatraju kao funkcija vremena: . U ovom slučaju, svaka stvarna razina smatra se zbrojem dviju komponenti: , gdje je sustavna komponenta i izražena određenom jednadžbom, a slučajna varijabla koja uzrokuje fluktuacije oko trenda.

Zadatak analitičkog usklađivanja svodi se na sljedeće:

1. Određivanje, na temelju stvarnih podataka, vrste hipotetske funkcije koja može najadekvatnije odražavati trend razvoja pokazatelja koji se proučava.

2. Određivanje parametara navedene funkcije (jednadžbe) iz empirijskih podataka

3. Izračun pomoću pronađene jednadžbe teorijskih (usklađenih) razina.

Izbor pojedine funkcije provodi se, u pravilu, na temelju grafičkog prikaza empirijskih podataka.

Modeli su regresijske jednadžbe čiji su parametri izračunati metodom najmanjih kvadrata

Ispod su najčešće korištene regresijske jednadžbe za usklađivanje vremenskih nizova, s naznakom za koje su specifične razvojne trendove najprikladnije odražavati.

Za pronalaženje parametara gornjih jednadžbi postoje posebni algoritmi i računalni programi. Konkretno, za pronalaženje parametara jednadžbe pravocrtne linije može se koristiti sljedeći algoritam:

Ako se periode ili trenutke vremena numerira tako da je St = 0, tada će se gornji algoritmi značajno pojednostaviti i pretvoriti u

Poravnane razine na grafikonu nalazit će se na jednoj ravnoj liniji, koja prolazi na najbližoj udaljenosti od stvarnih razina ovog dinamičkog niza. Zbroj kvadrata odstupanja odraz je utjecaja slučajnih faktora.

Pomoću njega izračunavamo prosječnu (standardnu) pogrešku jednadžbe:

Ovdje je n broj opažanja, a m je broj parametara u jednadžbi (imamo dva od njih - b 1 i b 0).

Glavna tendencija (trend) pokazuje kako sustavni čimbenici utječu na razine niza dinamike, a fluktuacija razina oko trenda () služi kao mjera utjecaja rezidualnih čimbenika.

Za procjenu kvalitete korištenog modela vremenske serije također se koristi Fisherov F test. To je omjer dviju varijanci, odnosno omjer varijance uzrokovane regresijom, tj. faktor koji se proučava, na varijancu uzrokovanu slučajnim razlozima, tj. zaostala disperzija:

U proširenom obliku, formula za ovaj kriterij može se prikazati na sljedeći način:

gdje je n broj opažanja, tj. broj razina redova,

m je broj parametara u jednadžbi, y je stvarna razina niza,

Poravnana razina reda - razina srednjeg reda.

Model koji je uspješniji od drugih ne mora uvijek biti dovoljno zadovoljavajući. Može se prepoznati kao takav samo u slučaju kada njegov kriterij F prijeđe poznatu kritičnu granicu. Ova granica se utvrđuje pomoću tablica F-distribucije.

Bit i klasifikacija indeksa.

U statistici, indeks se shvaća kao relativni pokazatelj koji karakterizira promjenu veličine fenomena u vremenu, prostoru ili u usporedbi s bilo kojim standardom.

Glavni element indeksne relacije je indeksirana vrijednost. Indeksirana vrijednost shvaća se kao vrijednost obilježja statističke populacije čija je promjena predmet proučavanja.

Pomoću indeksa rješavaju se tri glavna zadatka:

1) procjena promjena u složenoj pojavi;

2) utvrđivanje utjecaja pojedinih čimbenika na promjene složene pojave;

3) usporedba veličine pojave s veličinom prošlog razdoblja, veličinom drugog teritorija, kao i sa standardima, planovima i prognozama.

Indeksi su klasificirani prema 3 kriterija:

2) prema stupnju obuhvata elemenata stanovništva;

3) prema metodama za izračunavanje općih indeksa.

Po sadržaju indeksiranih veličina, indeksi se dijele na indekse kvantitativnih (volumenskih) pokazatelja i indekse kvalitativnih pokazatelja. Indeksi kvantitativnih pokazatelja - indeksi fizičkog obujma industrijskih proizvoda, fizičkog obujma prodaje, broja zaposlenih i dr. Indeksi kvalitativnih pokazatelja - indeksi cijena, troškova, proizvodnosti rada, prosječnih plaća i dr.

Prema stupnju obuhvata populacijskih jedinica indeksi se dijele u dvije klase: pojedinačne i opće. Kako bismo ih okarakterizirali, uvodimo sljedeće konvencije usvojene u praksi korištenja metode indeksa:

q- količina (volumen) bilo kojeg proizvoda u fizičkom smislu ; R- jedinična cijena; z- jedinični trošak proizvodnje; t— vrijeme utrošeno na proizvodnju jedinice proizvoda (intenzitet rada) ; w- proizvodnja vrijednosnih proizvoda po jedinici vremena; v- učinak proizvodnje u fizičkom smislu po jedinici vremena; T— ukupno utrošeno vrijeme ili broj zaposlenih.

Kako bi se razlučilo kojem razdoblju ili predmetu pripadaju indeksirane količine, uobičajeno je da se indeksi stavljaju u donjem desnom kutu odgovarajućeg simbola. Tako se npr. kod indeksa dinamike u pravilu indeks 1 koristi za razdoblja koja se uspoređuju (tekuće, izvještajno) i za razdoblja s kojima se vrši usporedba,

Individualni indeksi služe za karakterizaciju promjena pojedinih elemenata složene pojave (na primjer, promjena obujma proizvodnje jedne vrste proizvoda). Predstavljaju relativne vrijednosti dinamike, ispunjenje obveza, usporedbu indeksiranih vrijednosti.

Određuje se pojedinačni indeks fizičkog obujma proizvoda

S analitičkog gledišta, navedeni pojedinačni indeksi dinamike slični su koeficijentima (stopama) rasta i karakteriziraju promjenu indeksirane vrijednosti u tekućem razdoblju u odnosu na bazno razdoblje, tj. pokazuju koliko je puta porasla (smanjila) ili u kojem postotku je to rast (smanjenje). Vrijednosti indeksa izražavaju se u koeficijentima ili postocima.

Opći (kompozitni) indeks odražava promjene u svim elementima složene pojave.

Zbirni indeks je osnovni oblik indeksa. Naziva se agregat jer su njegov brojnik i nazivnik skup "agregata"

Prosječni indeksi, njihova definicija.

Osim agregatnih indeksa, u statistici se koristi još jedan njihov oblik - ponderirani prosječni indeksi. Njihovom se izračunu pribjegava kada raspoložive informacije ne dopuštaju izračunavanje općeg agregatnog indeksa. Dakle, ako nema podataka o cijenama, ali postoji podatak o troškovima proizvoda u tekućem razdoblju i poznati su pojedinačni indeksi cijena za svaki proizvod, tada se opći indeks cijena ne može odrediti kao zbirni, ali je moguće izračunati ga kao prosjek pojedinačnih. Na isti način, ako nisu poznate količine pojedinih proizvedenih vrsta proizvoda, ali su poznati pojedinačni indeksi i trošak proizvodnje baznog razdoblja, tada se opći indeks fizičkog obujma proizvodnje može odrediti kao ponderirani prosjek vrijednost.

Prosječni indeks - Ovaj indeks izračunat kao prosjek pojedinačnih indeksa. Zbirni indeks osnovni je oblik općeg indeksa, pa prosječni indeks mora biti identičan zbirnom indeksu. Pri izračunavanju prosječnih indeksa koriste se dva oblika prosjeka: aritmetički i harmonijski.

Indeks aritmetičke sredine identičan je agregatnom indeksu ako su ponderi pojedinačnih indeksa članovi nazivnika agregatnog indeksa. Samo u tom slučaju vrijednost indeksa izračunata pomoću formule aritmetičke sredine bit će jednaka zbirnom indeksu.

Za izračun jednostavne geometrijske sredine koristi se formula:

Geometrijski ponderirani

Za određivanje ponderirane geometrijske sredine koristi se formula:

Prosječni promjeri kotača, cijevi i prosječne stranice kvadrata određuju se pomoću srednjeg kvadrata.

Korijenske srednje kvadratne vrijednosti koriste se za izračun nekih pokazatelja, na primjer, koeficijenta varijacije, koji karakterizira ritam proizvodnje. Ovdje se standardna devijacija od planirane proizvodnje za određeno razdoblje određuje pomoću sljedeće formule:

Ove vrijednosti točno karakteriziraju promjenu ekonomskih pokazatelja u usporedbi s njihovom osnovnom vrijednošću, uzetom u svojoj prosječnoj vrijednosti.

Kvadratno jednostavno

Srednji kvadrat izračunava se pomoću formule:

Kvadratno ponderirano

Ponderirani srednji kvadrat jednak je:

22. Apsolutni pokazatelji varijacije uključuju:

raspon varijacije

prosječno linearno odstupanje

disperzija

standardna devijacija

Raspon varijacije (r)

Raspon varijacije- je razlika između maksimalne i minimalne vrijednosti atributa

Pokazuje granice unutar kojih se vrijednost karakteristike mijenja u populaciji koja se proučava.

Radno iskustvo pet prijavljenih u dosadašnjem radu je: 2,3,4,7 i 9 godina. Rješenje: raspon varijacije = 9 - 2 = 7 godina.

Za generalizirani opis razlika u vrijednostima atributa, prosječni pokazatelji varijacije izračunavaju se na temelju uzimanja u obzir odstupanja od aritmetičke sredine. Razlika se uzima kao odstupanje od prosjeka.

U ovom slučaju, kako bi se izbjeglo da se zbroj odstupanja varijanti karakteristike od prosjeka pretvori u nulu (nulto svojstvo prosjeka), treba ili zanemariti predznake odstupanja, odnosno uzeti ovaj zbroj modulo , ili kvadrirajte vrijednosti odstupanja

Prosječno linearno i kvadratno odstupanje

Prosječno linearno odstupanje je aritmetička sredina apsolutnih odstupanja pojedinih vrijednosti obilježja od prosjeka.

Prosječno linearno odstupanje je jednostavno:

Radno iskustvo pet prijavljenih u dosadašnjem radu je: 2,3,4,7 i 9 godina.

U našem primjeru: godine;

Odgovor: 2,4 godine.

Prosječno linearno odstupanje ponderirano odnosi se na grupirane podatke:

Zbog svoje konvencionalnosti, prosječno linearno odstupanje se u praksi relativno rijetko koristi (osobito za karakterizaciju ispunjenja ugovornih obveza u pogledu ravnomjernosti isporuke; u analizi kvalitete proizvoda, uzimajući u obzir tehnološke značajke proizvodnje).

Standardna devijacija

Najsavršenija karakteristika varijacije je srednja kvadratna devijacija, koja se naziva standard (ili standardna devijacija). Standardna devijacija() jednak je kvadratnom korijenu prosječnog kvadratnog odstupanja pojedinačnih vrijednosti aritmetičkog prosjeka:

Standardna devijacija je jednostavna:

Ponderirana standardna devijacija primjenjuje se na grupirane podatke:

Između korijena srednjeg kvadrata i srednjeg linearnog odstupanja u uvjetima normalne distribucije postoji sljedeći omjer: ~ 1,25.

Standardna devijacija, kao glavna apsolutna mjera varijacije, koristi se u određivanju ordinatnih vrijednosti krivulje normalne distribucije, u proračunima koji se odnose na organizaciju promatranja uzorka i utvrđivanje točnosti karakteristika uzorka, kao i u procjeni granice varijacije obilježja u homogenoj populaciji.

Vrijednosti dobivene iskustvom neizbježno sadrže pogreške zbog niza razloga. Među njima treba razlikovati sustavne i slučajne pogreške. Sustavne pogreške uzrokovane su razlozima koji djeluju na vrlo specifičan način, te se uvijek mogu otkloniti ili sasvim točno uzeti u obzir. Slučajne pogreške uzrokovane su vrlo velikim brojem pojedinačnih uzroka koji se ne mogu točno objasniti i djeluju na različite načine u svakom pojedinačnom mjerenju. Te se pogreške ne mogu potpuno isključiti; mogu se uzeti u obzir samo u prosjeku, za što je potrebno poznavati zakonitosti koje vladaju kod slučajnih pogrešaka.

Mjernu veličinu označit ćemo s A, a slučajnu pogrešku u mjerenju s x. Budući da pogreška x može poprimiti bilo koju vrijednost, to je kontinuirana slučajna varijabla, koja je u potpunosti karakterizirana svojim zakonom raspodjele.

Najjednostavnije i najtočnije odražava stvarnost (u velikoj većini slučajeva) je tzv zakon normalne distribucije pogreške:

Ovaj zakon raspodjele može se dobiti iz različitih teorijskih premisa, posebno iz zahtjeva da je najvjerojatnija vrijednost nepoznate veličine za koju se izravnim mjerenjem dobiva niz vrijednosti s istim stupnjem točnosti aritmetička sredina ove vrijednosti. Poziva se količina 2 disperzija ovog normalnog zakona.

Prosjek

Određivanje disperzije iz eksperimentalnih podataka. Ako se za bilo koju vrijednost A, n vrijednosti a i dobije izravnim mjerenjem s istim stupnjem točnosti i ako su pogreške vrijednosti A podložne normalnom zakonu raspodjele, tada će najvjerojatnija vrijednost A biti prosjek:

a - aritmetička sredina,

a i - izmjerena vrijednost u i-tom koraku.

Odstupanje opažene vrijednosti (za svako opažanje) a i vrijednosti A od aritmetička sredina: a i - a.

Da biste odredili varijancu normalnog zakona raspodjele pogreške u ovom slučaju, upotrijebite formulu:

2 - disperzija,
a - aritmetička sredina,
n - broj mjerenja parametara,

Standardna devijacija

Standardna devijacija pokazuje apsolutno odstupanje izmjerenih vrijednosti od aritmetička sredina. U skladu s formulom za mjeru točnosti linearne kombinacije srednja kvadratna greška Aritmetička sredina određena je formulom:

, Gdje


a - aritmetička sredina,
n - broj mjerenja parametara,
a i - izmjerena vrijednost u i-tom koraku.

Koeficijent varijacije

Koeficijent varijacije karakterizira relativnu mjeru odstupanja izmjerenih vrijednosti od aritmetička sredina:

, Gdje

V - koeficijent varijacije,
- standardna devijacija,
a - aritmetička sredina.

Što je vrijednost veća koeficijent varijacije, to je relativno veća raspršenost i manja uniformnost proučavanih vrijednosti. Ako koeficijent varijacije manje od 10%, tada se varijabilnost niza varijacija smatra beznačajnom, od 10% do 20% smatra se prosječnom, više od 20% i manje od 33% smatra se značajnom i ako koeficijent varijacije prelazi 33%, što ukazuje na heterogenost informacija i potrebu isključivanja najvećih i najmanjih vrijednosti.

Prosječno linearno odstupanje

Jedan od pokazatelja opsega i intenziteta varijacije je prosječno linearno odstupanje(modul prosječnog odstupanja) od aritmetičke sredine. Prosječno linearno odstupanje izračunava se formulom:

, Gdje

_
a - prosječno linearno odstupanje,
a - aritmetička sredina,
n - broj mjerenja parametara,
a i - izmjerena vrijednost u i-tom koraku.

Za provjeru usklađenosti proučavanih vrijednosti sa zakonom normalne distribucije koristi se odnos indikator asimetrije na svoju grešku i stav pokazatelj kurtoze na njegovu grešku.

Indikator asimetrije

Indikator asimetrije(A) i njegova pogreška (m a) izračunava se pomoću sljedećih formula:

, Gdje

A - indikator asimetrije,
- standardna devijacija,
a - aritmetička sredina,
n - broj mjerenja parametara,
a i - izmjerena vrijednost u i-tom koraku.

Indikator kurtoze

Indikator kurtoze(E) i njegova pogreška (m e) izračunava se pomoću sljedećih formula:

, Gdje



 


Čitati:



Tumačenje tarot karte đavo u odnosima Što znači laso đavo

Tumačenje tarot karte đavo u odnosima Što znači laso đavo

Tarot karte vam omogućuju da saznate ne samo odgovor na uzbudljivo pitanje. Također mogu predložiti pravo rješenje u teškoj situaciji. Dovoljno za učenje...

Ekološki scenariji za ljetni kamp Kvizovi za ljetni kamp

Ekološki scenariji za ljetni kamp Kvizovi za ljetni kamp

Kviz o bajkama 1. Tko je poslao ovaj telegram: “Spasi me! Pomozite! Pojeo nas je Sivi Vuk! Kako se zove ova bajka? (Djeca, "Vuk i...

Kolektivni projekt "Rad je osnova života"

Kolektivni projekt

Prema definiciji A. Marshalla, rad je „svaki mentalni i fizički napor poduzet djelomično ili u cijelosti s ciljem postizanja nekog...

DIY hranilica za ptice: izbor ideja Hranilica za ptice iz kutije za cipele

DIY hranilica za ptice: izbor ideja Hranilica za ptice iz kutije za cipele

Napraviti vlastitu hranilicu za ptice nije teško. Zimi su ptice u velikoj opasnosti, treba ih hraniti. Zato ljudi...

feed-image RSS