doma - Zgodovina popravil
Določanje povprečnega kvadratnega odklona. Standardni odklon

Lekcija številka 4

Tema: »Opisna statistika. Indikatorji raznolikosti lastnosti v agregatu "

Glavna merila za raznolikost lastnosti v statistični populaciji so: meja, amplituda, povprečje standardni odklon, koeficient nihanja in koeficient variacije. V prejšnji lekciji je bilo govora o tem, da povprečne vrednosti dajejo le posploševalno značilnost preučevane lastnosti v celoti in ne upoštevajo vrednosti njenih posameznih variant: najmanjše in največje vrednosti, nad povprečjem, pod povprečjem itd.

Primer. Povprečne vrednosti dveh različnih številskih zaporedij: -100; -dvajset; 100; 20 in 0,1; -0,2; 0,1 sta popolnoma enaka in enakaO.Vendar so razponi razpršenosti teh zaporedij relativne srednje vrednosti zelo različni.

Opredelitev naštetih kriterijev za raznovrstnost lastnosti se izvaja predvsem ob upoštevanju njene vrednosti za posamezne elemente statistične populacije.

Indikatorji za merjenje variacije lastnosti so absolutno in relativno... Absolutni kazalniki variacije vključujejo: obseg variacije, mejo, standardni odklon, varianco. Koeficient variacije in koeficient nihanja se nanašata na relativne mere variacije.

Omejitev (lim) - to je merilo, ki ga določajo skrajne vrednosti variant v nizu variacij. Z drugimi besedami, to merilo je omejeno na najmanjšo in največjo vrednost funkcije:

amplituda (Am) oz razpon variacij - to je razlika med skrajnimi možnostmi. Izračun tega merila se izvede tako, da se njegova najmanjša vrednost odšteje od največje vrednosti atributa, kar nam omogoča, da ocenimo stopnjo variacije možnosti:

Pomanjkljivost meje in amplitude kot merila variabilnosti je, da sta popolnoma odvisni od ekstremnih vrednosti lastnosti v variacijski seriji. V tem primeru se nihanja vrednosti lastnosti znotraj serije ne upoštevajo.

Najbolj popolno značilnost raznolikosti lastnosti v statistični populaciji podaja standardni odklon(sigma), ki je splošno merilo odstopanja različice od njene srednje vrednosti. Standardni odklon se pogosto imenuje standardni odklon.

Standardna deviacija temelji na primerjavi vsake možnosti z aritmetično sredino dane populacije. Ker bo v agregatu vedno možnosti tako manj kot več od njega, se bo vsota odstopanj, ki imajo predznak "" poplačala z vsoto odstopanj, ki imajo predznak "", tj. vsota vseh odstopanj je nič. Da bi se izognili vplivu predznakov razlik, se vzamejo odstopanja od aritmetične sredine na kvadrat, t.j. ... Vsota kvadratov odstopanj ni nič. Če želite dobiti koeficient, ki lahko meri variabilnost, vzemite povprečje vsote kvadratov - ta vrednost se imenuje varianca:

V smislu pomena je varianca srednji kvadrat odstopanj posameznih vrednosti lastnosti od njene srednje vrednosti. Disperzija kvadrat standardnega odklona.

Varianca je dimenzija (imenovana). Torej, če so različice številske serije izražene v metrih, potem varianca daje kvadratne metre; če so možnosti izražene v kilogramih, potem varianca daje kvadrat te mere (kg 2) itd.

Standardni odklon- kvadratni koren variance:

, nato pri izračunu variance in standardnega odklona v imenovalcu ulomka namestoje treba dati.

Izračun standardnega odklona lahko razdelimo na šest stopenj, ki jih je treba izvesti v določenem zaporedju:

Uporaba standardnega odklona:

a) presojati variabilnost niza variacij in primerjalno oceno tipičnosti (reprezentativnosti) aritmetičnih srednjih vrednosti. To je potrebno pri diferencialni diagnostiki pri ugotavljanju stabilnosti znakov.

b) za rekonstrukcijo variacijske serije, t.j. obnova njegovega frekvenčnega odziva na podlagi tri sigma pravila. V intervalu (M ± 3σ) 99,7 % vseh različic serije najdemo v intervalu (M ± 2σ) - 95,5 % in v intervalu (M ± 1σ) - 68,3 % vrstična različica(slika 1).

c) za prepoznavanje možnosti "pop-up".

d) določiti parametre norme in patologije z uporabo sigma ocen

e) za izračun koeficienta variacije

f) za izračun povprečne napake aritmetične sredine.

Za karakterizacijo katere koli splošne populacije, ki imatip normalne distribucije , dovolj je poznati dva parametra: aritmetično sredino in standardni odklon.

Slika 1. Pravilo treh sigm

Primer.

V pediatriji se standardni odklon uporablja za oceno telesnega razvoja otrok s primerjavo podatkov določenega otroka z ustreznimi standardnimi kazalniki. Kot standard se vzamejo kazalniki aritmetične sredine telesnega razvoja zdravih otrok. Primerjava kazalnikov s standardi se izvaja po posebnih tabelah, v katerih so standardi podani skupaj z ustreznimi sigma lestvicami. Šteje se, da če je kazalnik telesnega razvoja otroka znotraj standardne (aritmetične sredine) ± σ, potem fizični razvoj otrok (glede na ta indikator) ustreza normi. Če je kazalnik znotraj standarda ± 2σ, obstaja rahlo odstopanje od norme. Če indikator presega te meje, se otrokov telesni razvoj močno razlikuje od norme (možna je patologija).

Poleg kazalnikov variabilnosti, izraženih v absolutnih vrednostih, statistična študija uporablja kazalnike variacije, izražene v relativnih vrednostih. Koeficient nihanja - je razmerje med obsegom variacije in povprečno vrednostjo lastnosti. Koeficient variacije - je razmerje med standardnim odklonom in povprečno znak. Običajno so te vrednosti izražene v odstotkih.

Formule za izračun relativnih indeksov variacije:

Iz zgornjih formul je razvidno, da je večji koeficient V blizu nič, manjša je razlika v vrednostih lastnosti. Bolj V, bolj spremenljiv je znak.

V statistični praksi se najpogosteje uporablja koeficient variacije. Uporablja se ne le za primerjalno oceno variabilnosti, ampak tudi za karakterizacijo homogenosti populacije. Populacija se šteje za homogeno, če koeficient variacije ne presega 33 % (za porazdelitve blizu normalne). Aritmetično razmerje med σ in aritmetično sredino odpravlja vpliv absolutna vrednost teh značilnosti, odstotek pa naredi koeficient variacije brezdimenzionalno (neimenovano) vrednost.

Dobljena vrednost koeficienta variacije se oceni v skladu s približnimi gradacijami stopnje raznovrstnosti lastnosti:

šibko - do 10%

povprečje - 10 - 20 %

Močan - več kot 20%

Uporaba koeficienta variacije je priporočljiva v primerih, ko je treba primerjati značilnosti, ki se razlikujejo po velikosti in dimenziji.

Razlika med koeficientom variacije in drugimi merili razpršenosti jasno kaže primer.

Tabela 1

Sestava delavcev v industrijskem podjetju

Na podlagi statističnih značilnosti, podanih v primeru, lahko sklepamo, da sta starostna sestava in izobrazbena raven zaposlenih v podjetju relativno homogena z nizko poklicno stabilnostjo anketiranega kontingenta. Zlahka je videti, da bi poskus presojanja teh družbenih tendenc s standardnim odklonom pripeljal do napačnega zaključka, poskus primerjave akreditivov »delovne izkušnje« in »starost« z računovodskim atributom »izobrazba« pa bi bil na splošno napačen. zaradi heterogenosti teh značilnosti.

Mediana in percentili

Za ordinalne (rank) porazdelitve, kjer je merilo za sredino serije mediana, standardna deviacija in varianca ne moreta služiti kot značilnosti razpršilne variante.

Enako velja za serije odprtih variacij. Ta okoliščina je posledica dejstva, da se odstopanja, s katerimi se izračunata varianca in σ, štejejo od aritmetične sredine, ki se ne izračuna v odprtih variacijskih serijah in v seriji porazdelitev kvalitativnih značilnosti. Zato se za jedrnat opis distribucij uporablja še en parameter razpršenosti - kvantil(sinonim - "nercentile"), primeren za opis kvalitativnih in kvantitativnih značilnosti v kateri koli obliki njihove porazdelitve. Ta parameter se lahko uporablja tudi za prevajanje kvantitativnih značilnosti v kvalitativne. V tem primeru so takšne ocene dodeljene glede na to, kateri vrstni red kvantila ustreza določeni možnosti.

V praksi biomedicinskih raziskav se najpogosteje uporabljajo naslednji kvantili:

Je mediana;

, - kvartili (četrtline), kjer je spodnji kvartil, zgornji kvartil.

Kvantili delijo območje možne variacije variacije v nizu variacij na določene intervale. Mediana (kvantil) je varianta, ki je na sredini variacijske serije in deli to serijo na polovico, na dva enaka dela ( 0,5 in 0,5 ). Kvartil deli serijo na štiri dele: prvi del (spodnji kvartil) so možnosti, ki ločujejo možnosti, katerih številčne vrednosti ne presegajo 25% največjega možnega v ta serija, kvartil ločuje možnosti s številčno vrednostjo do 50 % največje možne vrednosti. Zgornji kvartil () ločuje možnosti do 75 % največjih možnih vrednosti.

V primeru asimetrične porazdelitve spremenljivka glede na aritmetično sredino, se za njeno karakterizacijo uporabljajo mediana in kvartili. V tem primeru se uporablja naslednja oblika prikaza povprečne vrednosti - jaz (;). Na primer, ima preučevani znak - "obdobje, v katerem je otrok začel samostojno hoditi" - v študijski skupini asimetrično porazdelitev. Hkrati spodnji kvartil () ustreza začetku hoje - 9,5 meseca, mediana - 11 mesecev, zgornji kvartil () - 12 mesecev. V skladu s tem bo značilnost povprečnega trenda označenega znaka predstavljena kot 11 (9,5; 12) mesecev.

Ocena statistične pomembnosti rezultatov raziskav

Pod statistično pomembnostjo podatkov razumemo stopnjo, v kateri ustrezajo prikazani realnosti, t.j. statistično pomembni podatki so tisti, ki ne izkrivljajo in pravilno odražajo objektivne realnosti.

Oceniti statistično pomembnost rezultatov raziskave pomeni ugotoviti, s kakšno verjetnostjo je mogoče rezultate, pridobljene na vzorčni populaciji, prenesti na celotno splošno populacijo. Ocenjevanje statistične pomembnosti je potrebno, da bi razumeli, kolikšen del pojava je mogoče presojati o pojavu kot celoti in njegovih vzorcih.

Oceno statistične pomembnosti rezultatov raziskave sestavljajo:

1. napake reprezentativnosti (napake srednjih in relativnih vrednosti) - m;

2. meje zaupanja povprečnih ali relativnih vrednosti;

3.zanesljivost razlike med srednjimi ali relativnimi vrednostmi glede na kriterij t.

Standardna napaka aritmetične sredine oz napaka reprezentativnosti označuje nihanja v povprečju. Treba je opozoriti, da večja kot je velikost vzorca, manjši je razpon srednjih vrednosti. Standardna napaka srednje vrednosti se izračuna po formuli:

V sodobni znanstveni literaturi je aritmetična sredina zapisana skupaj z napako reprezentativnosti:

ali skupaj s standardnim odklonom:

Kot primer vzemimo podatke za 1.500 mestnih poliklinik v državi (splošna populacija). Povprečno število pacientov, oskrbljenih v polikliniki, je 18150 ljudi. Naključna izbira 10 % objektov (150 poliklinik) daje povprečno število bolnikov, ki je enako 20051 oseb. Napaka vzorčenja, očitno povezana z dejstvom, da v vzorec ni bilo vključenih vseh 1500 poliklinik, je enaka razliki med temi povprečji - splošno povprečje ( M gen) in povprečje vzorca ( M izberite). Če iz naše splošne populacije oblikujemo drug vzorec enake velikosti, bo dal drugačno količino napake. Vsa ta vzorčna srednja vrednost za dovolj velike vzorce so normalno porazdeljena okoli splošnega povprečja za dovolj velike vzorce. veliko število ponovitve vzorčenja enakega števila predmetov iz splošne populacije. Standardna napaka povprečja m je neizogibna razpršitev vzorčne sredine okoli splošnega povprečja.

V primeru, ko so rezultati raziskave predstavljeni v relativnih vrednostih (na primer v odstotkih) - se izračuna deli standardno napako:

kjer je P indikator v %, n je število opazovanj.

Rezultat je prikazan kot (P ± m)%. na primer odstotek okrevanja med bolniki je bil (95,2 ± 2,5)%.

V primeru, da je število elementov v populaciji, nato pri izračunu standardnih napak srednje vrednosti in ulomka v imenovalcu ulomka namestoje treba dati.

Za normalno porazdelitev (razporeditev vzorčnih srednjih vrednosti je normalna) je znano, koliko populacije spada v kateri koli interval okoli povprečja. Še posebej:

V praksi je težava v tem, da ne poznamo značilnosti splošne populacije, vzorec pa je narejen prav za namen njihove ocene. To pomeni, da če izdelamo vzorce enake velikosti n iz splošne populacije, potem bo v 68,3 % primerov interval vseboval vrednost M(v intervalu bo v 95,5 % primerov in v intervalu v 99,7 % primerov).

Ker je dejansko narejen samo en vzorec, je ta trditev oblikovana z verjetnostjo: z verjetnostjo 68,3 % je povprečna vrednost lastnosti v splošni populaciji zaprta v interval z verjetnostjo 95,5 %. - v intervalu itd.

V praksi se okoli vrednosti vzorca zgradi interval, ki bi z dano (dovolj veliko) verjetnostjo - stopnja zaupanja - Bi "pokrili" pravo vrednost tega parametra v splošni populaciji. Ta interval se imenuje interval zaupanja.

Verjetnost zaupanjaP to je stopnja zaupanja, da bo interval zaupanja dejansko vseboval pravo (neznano) vrednost parametra v splošni populaciji.

Na primer, če je raven zaupanja R enako 90%, to pomeni, da bo 90 vzorcev od 100 dalo pravilno oceno parametra v splošni populaciji. V skladu s tem je verjetnost napake, t.j. napačna ocena splošnega povprečja za vzorec je v odstotkih enaka:. V tem primeru to pomeni, da bo 10 vzorcev od 100 dalo napačno oceno.

Očitno je stopnja zaupanja (stopnja zaupanja) odvisna od velikosti intervala: širši kot je interval, večje je zaupanje, da bo vanj padla neznana vrednost za splošno populacijo. V praksi se za konstruiranje intervala zaupanja vzame vsaj dvakratna napaka vzorčenja, da se zagotovi zaupanje vsaj 95,5 %.

Določanje meja zaupanja povprečnih in relativnih vrednosti vam omogoča, da najdete njuni dve skrajni vrednosti - najmanjšo možno in največjo možno, znotraj katerih je mogoče najti preučevani kazalnik v celotni splošni populaciji. Na podlagi tega, meje zaupanja (ali interval zaupanja)- to so meje povprečnih ali relativnih vrednosti, preko katerih je zaradi naključnih nihanj zanemarljiva verjetnost.

Interval zaupanja lahko prepišemo kot:, kje t- merilo zaupanja.

Meje zaupanja aritmetične sredine v splošni populaciji so določene s formulo:

M gen = M izberite + t m M

za relativno vrednost:

R gen = P izberite + t m R

kje M gen in R gen- srednje in relativne vrednosti za splošno populacijo; M izberite in R izberite- vrednosti povprečnih in relativnih vrednosti, dobljenih na vzorčni populaciji; m M in m P- napake povprečnih in relativnih vrednosti; t- merilo zaupanja (merilo natančnosti, ki se določi pri načrtovanju študije in je lahko enako 2 ali 3); t m je interval zaupanja ali Δ mejna napaka kazalnika, dobljena v vzorčni študiji.

Treba je opozoriti, da je vrednost merila t do določene mere povezano z verjetnostjo napovedi brez napak (p), izraženo v %. Izbere ga raziskovalec sam, ki ga vodi potreba po pridobitvi rezultata z zahtevano stopnjo natančnosti. Torej, za verjetnost napovedi brez napak 95,5 % je vrednost merila t je 2, za 99,7 % - 3.

Navedene ocene intervala zaupanja so sprejemljive le za statistične populacije z več kot 30 opazovanji.Pri manjši velikosti populacije (majhni vzorci) se za določitev t kriterija uporabljajo posebne tabele. V teh tabelah je želena vrednost na presečišču črte, ki ustreza velikosti populacije (n-1) in stolpec, ki ustreza stopnji verjetnosti nenapačne napovedi (95,5 %; 99,7 %), ki jo je izbral raziskovalec. V medicinskih raziskavah je pri določanju meja zaupanja za kateri koli kazalnik verjetnost napovedi brez napak sprejeta kot 95,5 % ali več. To pomeni, da je treba vrednost kazalnika, pridobljenega na vzorčni populaciji, najti v splošni populaciji vsaj v 95,5 % primerov.

    Vprašanja na temo lekcije:

    Relevantnost kazalnikov raznolikosti značilnosti v statistični populaciji.

    Splošne značilnosti absolutnih kazalnikov variacije.

    Standardni odklon, izračun, uporaba.

    Relativni kazalniki variacije.

    Mediana, kvartilna ocena.

    Ocena statistične pomembnosti rezultatov raziskave.

    Standardna napaka aritmetične sredine, formula za izračun, primer uporabe.

    Izračun deleža in njegove standardne napake.

    Koncept ravni zaupanja, primer uporabe.

10. Koncept intervala zaupanja, njegova uporaba.

    Testne naloge na temo z vzorčnimi odgovori:

1. ABSOLUTNI KAZALNIKI VARIACIJE, POVEZANE NA

1) koeficient variacije

2) koeficient nihanja

4) mediana

2. RELATIVNI KAZALNIKI SPREMEMB, POVEZANE Z

1) variance

4) koeficient variacije

3. KRITERIJ, KI GA DOLOČAJO EKSTREMNE VREDNOSTI VARIANTA V VARIacijskem območju

2) amplituda

3) variance

4) koeficient variacije

4. RAZLIKA EKSTREMNIH MOŽNOSTI JE

2) amplituda

3) povprečje standardni odklon

4) koeficient variacije

5. POVPREČNI KVADRAT ODSTOPANJ POSAMEZNIH VREDNOSTI ZNAKA OD NJEGOVIH POVPREČNIH VREDNOSTI JE

1) koeficient nihanja

2) mediana

3) variance

6. RAZMERJE HITROSTI VARICIJE OD POVPREČNE VREDNOSTI SIGNAL JE

1) koeficient variacije

2) standardni odklon

4) koeficient nihanja

7. RAZMERJE POVPREČNEGA KVADRATNEGA ODSTOPA OD POVPREČNE VREDNOSTI ZNAČILNOSTI JE

1) variance

2) koeficient variacije

3) koeficient nihanja

4) amplituda

8. MOŽNOST, KI JE SREDI VARICIJSKEGA OBMOČJA IN GA DELI NA DVA ENAKA DELA - TO JE

1) mediana

3) amplituda

9. V MEDICINSKIH RAZISKAVAH JE PRI VZPOSTAVITVI ZAUPNIH MEJ KATERIH KOLI KAZATELJ SPREJETA VERJETNOST NAPOVEDE BREZ NAPAK

10. ČE 90 VZORCEV OD 100 ZAGOTAVLJA PRAVO OCENO PARAMETRA V SPLOŠNEM SKUPEM, TO POMENI, DA JE ZAUPNOST P ENAKO

11. V PRIMERU, ČE 10 VZORCEV OD 100 DAJE NAPAČNO OCENA, JE VERJETNOST NAPAKE ENAKA

12. MEJE POVPREČNIH ALI RELATIVNIH VREDNOSTI, ZUNAJ KATERE IMA ZARADI NAKLJUČNIH VIBRACIJ NEMOMEMBNO VERJETNOST JE

1) interval zaupanja

2) amplituda

4) koeficient variacije

13. MAJHEN VZOREC JE TISTA ZBIRKA, V KATERI

1) n je manjši ali enak 100

2) n je manjši ali enak 30

3) n je manjši ali enak 40

4) n je blizu 0

14. ZA 95-ODSTOTNO VERJETNOST VREDNOSTI KRITERIJA BREZ NAPAKE t IZDELA

15. ZA 99-ODSTOTNO VERJETNOST KRITERIJ NAVREDNE VREDNOSTI BREZ NAPAK t IZDELA

16. ZA RAZDELITEV BLIZU NORMALNE SE ZBIRANJE ŠTEJE ZA ENOTNO, RAZEN, ČE KOEFICIENT VARICIJE NE PRESEGA

17. VARIANTNE MOŽNOSTI LOČITEV, KI SO ŠTEVIČNE VREDNOSTI NE PRESEŽE 25 % NAJVEČ MOŽNEGA V TEM RAZPONU JE

2) spodnji kvartil

3) zgornji kvartil

4) kvartil

18. PODATKI, KI SE NE RAZLIKUJO IN PRAVILNO ODRAŽAJO OBJEKTIVNO RESNIČNOST, se Imenuje

1) nemogoče

2) enako možno

3) zanesljiv

4) naključno

19. PO PRAVILU "TRI SIGME", Z NORMALNO RAZPODELITEV ZNAČILNOSTI V MEJAH
BO LOCIRANO

1) 68,3-odstotna možnost

Standardni odklon je klasičen kazalnik volatilnosti iz deskriptivne statistike.

Standardni odklon, standardni odklon, RMSD, vzorčna standardna deviacija (angleško standardna deviacija, STD, STDev) je zelo pogost indikator disperzije v deskriptivni statistiki. Ampak odkar tehnična analiza je podobna statistiki, ta indikator se lahko (in bi moral) uporabiti v tehnični analizi za odkrivanje stopnje razpršenosti cene analiziranega instrumenta skozi čas. Označen je z grškim simbolom Sigma "σ".

Hvala Karlamu Gaussu in Pearsonu, da sta nam dala možnost, da uporabimo standardni odklon.

Uporaba standardno odstopanje v tehnični analizi, to obrnemo Faktor razpršitve" v "Indikator volatilnosti«, Ohraniti pomen, vendar spremeniti izraze.

Kaj je standardni odklon

Toda poleg vmesnih pomožnih izračunov, standardna deviacija je povsem sprejemljiva za samoizračun in aplikacije v tehnični analizi. Kot je zapisal navdušen bralec naše revije o repincu: » Še vedno ne razumem, zakaj RMS ni vključen v nabor standardnih kazalnikov domačih trgovskih centrov«.

res, standardni odklon lahko meri volatilnost instrumenta na klasičen in "čist" način... Na žalost ta kazalnik ni tako pogost pri analizi vrednostnih papirjev.

Uporaba standardnega odklona

Ročno izračunavanje standardnega odklona ni zelo zanimivo ampak koristno za izkušnje. Standardno odstopanje je mogoče izraziti po formuli STD = √ [(∑ (xx) 2) / n], ki zveni kot koren vsote kvadratov razlik med predmeti v vzorcu in povprečjem, deljeno s številom elementov v vzorcu .

Če število elementov v vzorcu presega 30, potem imenovalec ulomka pod korenom prevzame vrednost n-1. V nasprotnem primeru se uporablja n.

Korak za korakom izračun standardnega odklona:

  1. izračunajte aritmetično sredino vzorca podatkov
  2. odštejte to povprečje od vsakega elementa vzorca
  3. vse nastale razlike so na kvadrat
  4. seštejte vse nastale kvadrate
  5. dobljeno vsoto delite s številom elementov v vzorcu (ali z n-1, če je n> 30)
  6. izračunajte kvadratni koren nastalega količnika (imenovanega variance)

Najbolj popolna značilnost variacije je standardni odklon, ki se imenuje standard (ali standardni odklon). Standardni odklon() je enak kvadratnemu korenu srednjega kvadrata odstopanj posameznih vrednosti lastnosti od aritmetične sredine:

Standardno odstopanje je preprosto:

Tehtani standardni odklon se uporablja za združene podatke:

Med srednjim kvadratom in standardnim linearnim odklonom v normalnih pogojih porazdelitve obstaja naslednja povezava: ~ 1,25.

Standardna deviacija, ki je glavno absolutno merilo variacije, se uporablja za določanje vrednosti ordinat krivulje normalne porazdelitve pri izračunih, povezanih z organizacijo opazovanja vzorca in ugotavljanjem točnosti značilnosti vzorca, kot tudi pri ocenjevanju meje variacije lastnosti v homogeni populaciji.

Disperzija, njene vrste, standardni odklon.

Varianca naključne spremenljivke- merilo razširjenosti dane naključne spremenljivke, to je njenega odstopanja od matematičnega pričakovanja. V statistiki se pogosto uporablja oznaka ali. Kvadratni koren variance imenujemo standardni odklon, standardni odklon ali standardni odklon.

Skupna varianca (σ 2) meri variacijo lastnosti v agregatu pod vplivom vseh dejavnikov, ki so to variacijo povzročili. Hkrati je z metodo združevanja mogoče izolirati in izmeriti variacijo zaradi lastnosti združevanja in variacijo, ki nastane pod vplivom neupoštevanih dejavnikov.

Medskupinska varianca (σ 2 mg) označuje sistematično variacijo, to je razlike v vrednosti preučevane lastnosti, ki nastanejo pod vplivom lastnosti - dejavnika, na katerem temelji združevanje.

Standardni odklon(sinonimi: standardni odklon, standardni odklon, kvadratni odklon; podobni izrazi: standardni odklon, standardni razpon) - v teoriji verjetnosti in statistiki je najpogostejši indikator disperzije vrednosti naključne spremenljivke glede na njeno matematično pričakovanje. Pri omejenih nizih vzorcev vrednosti se namesto matematičnega pričakovanja uporablja aritmetična sredina populacije vzorcev.

Standardni odklon se meri v merskih enotah same naključne spremenljivke in se uporablja za izračun standardne napake aritmetične sredine, pri gradnji intervalov zaupanja, pri statističnem testiranju hipotez, pri merjenju linearnega razmerja med naključne spremenljivke... Določeno kot kvadratni koren variance naključne spremenljivke.


Standardni odklon:

Standardni odklon(ocena standardnega odklona naključne spremenljivke x glede na njegovo matematično pričakovanje, ki temelji na nepristranski oceni njegove variance):

kje je varianca; - jaz th element vzorca; - Velikost vzorca; - aritmetična sredina vzorca:

Treba je opozoriti, da sta obe oceni pristranski. V splošni primer nemogoče je sestaviti nepristransko oceno. Vendar pa je ocena, ki temelji na oceni nepristranske variance, skladna.

Bistvo, obseg in postopek za določitev načina in mediane.

Poleg povprečij po stopnjah v statistiki za relativne značilnosti velikosti variabilnega atributa in notranja struktura distribucijske serije uporabljajo strukturna povprečja, ki so predstavljena predvsem moda in mediana.

Moda- to je najpogostejša različica vrstice. Moda se na primer uporablja pri določanju velikosti oblačil, čevljev, po katerih je med kupci največje povpraševanje. Način za diskretno serijo je tisti z najvišjo frekvenco. Pri izračunu načina za niz intervalnih variacij je treba najprej določiti modalni interval (z največjo frekvenco), nato pa - vrednost modalne vrednosti lastnosti po formuli:

- - modna vrednost

- - spodnja meja modalnega intervala

- - vrednost intervala

- - frekvenca modalnega intervala

- je frekvenca intervala pred modalnim

- je frekvenca intervala, ki sledi modalu

Mediana - to je vrednost lastnosti, ki je osnova uvrščene serije in jo deli na dva enaka dela.

Če želite določiti mediano v diskretni seriji ob prisotnosti frekvenc, najprej izračunajte polovično vsoto frekvenc in nato določite, kakšna vrednost variante pade nanjo. (Če razvrščena serija vsebuje liho število lastnosti, se mediano število izračuna po formuli:

M e = (n (število lastnosti v agregatu) + 1) / 2,

v primeru sodega števila lastnosti bo mediana enaka povprečju obeh lastnosti na sredini vrstice).

Pri izračunu mediane za niz intervalnih variacij najprej določite mediani interval, znotraj katerega se nahaja mediana, in nato srednjo vrednost s formulo:

- - zahtevana mediana

- - spodnja meja intervala, ki vsebuje mediano

- - vrednost intervala

- - vsota frekvenc ali število članov serije

Vsota nabranih frekvenc intervalov pred mediano

- - frekvenca medianega intervala

Primer... Poiščite modo in mediano.

Rešitev:
V ta primer modalni interval je v starostni skupini 25-30 let, saj ima ta interval največjo frekvenco (1054).

Izračunajmo velikost načina:

To pomeni, da je modalna starost študentov 27 let.

Izračunamo mediano... Mediani interval je v starostni skupini 25-30 let, saj znotraj tega intervala obstaja varianta, ki populacijo deli na dva enaka dela (Σf i / 2 = 3462/2 = 1731). Nato v formulo nadomestimo potrebne številčne podatke in dobimo srednjo vrednost:

To pomeni, da je ena polovica študentov mlajša od 27,4 leta, druga pa nad 27,4 leta.

Poleg načina in mediane se lahko uporabljajo kazalniki, kot so kvartili, ki delijo razvrščeno serijo na 4 enake dele, decili- 10 delov in percentili - na 100 delov.

Pojem selektivnega opazovanja in njegov obseg.

Selektivno opazovanje velja, kadar se uporablja neprekinjen nadzor fizično nemogoče zaradi velike količine podatkov, oz ekonomsko nepraktična... Fizična nezmožnost se pojavi na primer pri preučevanju tokov potnikov, tržnih cen, družinskih proračunov. Ekonomska neprimernost se pojavi pri ocenjevanju kakovosti blaga, povezanega z njihovim uničenjem, na primer pri degustaciji, testiranju trdnosti opek itd.

Statistične enote, izbrane za opazovanje, sestavljajo vzorčno populacijo oziroma vzorec, njihov celoten niz pa – splošno populacijo (HS). V tem primeru označuje število enot v vzorcu n, in v celotnem HS - N... Odnos n/N imenujemo relativna velikost ali frakcija vzorca.

Kakovost rezultatov opazovanja vzorca je odvisna od reprezentativnosti vzorca, torej od tega, kako reprezentativen je v HS. Za zagotovitev reprezentativnosti vzorca je treba opazovati naključni izbor enot, ki predpostavlja, da na vključitev enote HS v vzorec ne more vplivati ​​noben drug dejavnik kot primer.

Obstaja 4 načini za naključno izbiro na vzorec:

  1. Pravzaprav naključno izbor ali "metoda loto", ko se statističnim količinam dodelijo serijske številke, zabeležene na določenih artiklih (na primer sodih), ki se nato pomešajo v posodi (na primer v vreči) in naključno izberejo. V praksi se ta metoda izvaja z generatorjem naključna števila ali matematične tabele naključnih števil.
  2. Mehanski izbor, po katerem vsak ( N/n) -th vrednost splošne populacije. Na primer, če vsebuje 100.000 vrednosti in želite izbrati 1.000, bo vsaka 100.000 / 1000 = 100. vrednost vključena v vzorec. Poleg tega, če niso razvrščeni, se prvi izbere naključno izmed prvih sto, številk ostalih pa bo še sto več. Na primer, če se je izkazalo, da je enota # 19 prva, bi morala biti naslednja # 119, nato # 219, nato # 319 in tako naprej. Če so enote splošne populacije razvrščene, potem je najprej izbrano # 50, nato # 150, nato # 250 itd.
  3. Izvede se izbor vrednosti iz heterogenega nabora podatkov stratificirano(stratificiran) način, ko je splošna populacija vnaprej razdeljena na homogene skupine, za katere se uporablja naključna ali mehanska selekcija.
  4. Poseben način vzorčenja je serijsko selekcija, pri kateri niso naključno ali mehansko izbrane posamezne količine, temveč njihove serije (zaporedja od nekega števila do nekaj zapored), znotraj katerega se izvaja neprekinjeno opazovanje.

Kakovost vzorčnih opazovanj je odvisna tudi od tip vzorca: ponovil oz neponovljiv.

Ob ponovna izbira Statistične količine, ki so prišle v vzorec ali njihove serije po uporabi, se vrnejo v splošno populacijo in imajo možnost vstopiti v nov vzorec. Poleg tega imajo vse vrednosti splošne populacije enako verjetnost, da bodo vključene v vzorec.

Neponovljiva izbira pomeni, da se statistične količine, ki so vključene v vzorec ali njihove serije po uporabi, ne vrnejo v splošno populacijo, zato se za preostale količine slednje verjetnost, da padejo v naslednji vzorec, poveča.

Ponavljajoče vzorčenje daje natančnejše rezultate, zato se uporablja pogosteje. Toda obstajajo situacije, ko ga ni mogoče uporabiti (študija tokov potnikov, povpraševanja potrošnikov itd.), nato pa se izvede ponovna izbira.

Mejna vzorčna napaka opazovanja, povprečna vzorčna napaka, vrstni red njihovega izračuna.

Podrobneje razmislimo o zgornjih metodah oblikovanja vzorčne populacije in o napakah, ki nastanejo v tem primeru. reprezentativnost .
Pravzaprav naključno vzorec temelji na naključnem izboru enot iz splošne populacije brez sistematičnih elementov. Tehnično je pravilna naključna izbira izvedena z žrebanjem (na primer žrebanjem loterije) ali po tabeli naključnih števil.

Pravzaprav se naključna selekcija "v svoji čisti obliki" redko uporablja v praksi selektivnega opazovanja, je pa začetna med drugimi vrstami selekcije, izvaja osnovna načela selektivnega opazovanja. Razmislimo o nekaterih vprašanjih teorije metode vzorčenja in formuli napake za preprost naključni vzorec.

Napaka opazovanja vzorca je razlika med vrednostjo parametra v splošni populaciji in njegovo vrednostjo, izračunano iz rezultatov opazovanja vzorca. Za povprečno kvantitativno značilnost se določi napaka vzorčenja

Kazalnik se imenuje mejna napaka vzorčenja.
Povprečna vrednost vzorca je naključna spremenljivka, ki jo lahko prevzame različne pomene odvisno od tega, katere enote so bile vključene v vzorec. Zato so tudi napake vzorčenja naključne vrednosti in lahko prevzamejo različne vrednosti. Zato je povprečje možne napake - povprečna napaka vzorčenja kar je odvisno od:

Velikost vzorca: večje kot je število, nižja je vrednost povprečne napake;

Stopnja spremembe preučevane lastnosti: manjša kot je varianca lastnosti in posledično varianca, manjša je povprečna napaka vzorčenja.

Ob naključna ponovna izbira povprečna napaka se izračuna:
.
V praksi splošna varianca ni natančno znana, ampak v teorija verjetnosti dokazal to
.
Ker je vrednost za dovolj velik n blizu 1, lahko domnevamo, da. Nato se lahko izračuna povprečna napaka vzorčenja:
.
Toda v primerih majhnega vzorca (za n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Ob naključni neponovljiv vzorec dane formule so popravljene z vrednostjo. Potem je povprečna neponavljajoča se napaka vzorčenja:
in .
Ker je vedno manjši, potem je množitelj () vedno manjši od 1. To pomeni, da je povprečna napaka pri neponavljajoči se izbiri vedno manjša kot pri ponavljajoči se izbiri.
Mehansko vzorčenje uporablja se, ko je splošna populacija na nek način urejena (na primer abecedni seznami volivcev, telefonske številke, številke hiš, stanovanj). Izbor enot se izvaja v določenem intervalu, ki je enak vzajemnemu odstotku vzorca. Torej, z 2-odstotnim vzorcem je izbranih vsakih 50 enot = 1 / 0,02, s 5 % vsak 1 / 0,05 = 20 enot splošne populacije.

Referenčna točka je izbrana na različne načine: naključno, od sredine intervala, s spremembo referenčne točke. Glavna stvar je, da se izognete sistematičnim napakam. Na primer, pri 5% vzorcu, če je prva enota 13, potem naslednja 33, 53, 73 itd.

V smislu natančnosti je mehanska izbira blizu samemu naključnemu vzorčenju. Zato se za določitev povprečne napake mehanskega vzorčenja uporabljajo formule pravilnega naključnega izbora.

Ob tipičen izbor anketirana populacija je predhodno razdeljena na homogene skupine istega tipa. Na primer, pri anketiranju podjetij so to lahko panoge, podsektorji, pri preučevanju prebivalstva pa regije, družbene ali starostne skupine. Nato se iz vsake skupine izvede neodvisen izbor, bodisi mehansko bodisi povsem naključno.

Tipično vzorčenje daje natančnejše rezultate kot druge metode. Tipizacija splošne populacije zagotavlja, da je v vzorcu zastopana vsaka tipološka skupina, kar omogoča izključitev vpliva medskupinske variance na povprečno vzorčno napako. Posledično je treba pri iskanju napake tipičnega vzorca po pravilu za seštevanje variance () upoštevati le povprečje skupinskih variance. Nato povprečna napaka vzorčenja:
ob ponovni izbiri
,
brez ponovne izbire
,
kje je povprečje variance znotraj skupine v vzorcu.

Serijska (ali ugnezdena) izbira velja v primeru, ko je splošna populacija pred začetkom vzorčnega raziskovanja razdeljena na serije ali skupine. Te serije so lahko embalaže končnih izdelkov, študentskih skupin, brigad. Serije za raziskovanje so izbrane mehansko ali povsem naključno, znotraj serije pa se izvaja neprekinjeno raziskovanje enot. Zato je povprečna napaka vzorčenja odvisna samo od medskupinske (medserijske) variance, ki se izračuna po formuli:

kjer je r število izbranih serij;
- povprečje i-te serije.

Povprečna serijska napaka vzorčenja se izračuna:

ob ponovni izbiri:
,
z neponovljivo izbiro:
,
kjer je R skupno število serij.

Kombinirano izbor je kombinacija obravnavanih izbirnih metod.

Povprečna napaka vzorčenja za katero koli izbirno metodo je odvisna predvsem od absolutne velikosti vzorca in v manjši meri od odstotka vzorca. Recimo, da se v prvem primeru izvede 225 opazovanj iz splošne populacije 4500 enot, v drugem pa iz 225000 enot. Variance v obeh primerih so enake 25. Potem bo v prvem primeru pri 5 % vzorčenju napaka vzorčenja:

V drugem primeru bo z izbiro 0,1 % enako:


Tako, z zmanjšanjem odstotka vzorca za 50-krat se je napaka vzorčenja neznatno povečala, saj se velikost vzorca ni spremenila.
Recimo, da se velikost vzorca poveča na 625 opazovanj. V tem primeru je napaka vzorčenja:

Povečanje vzorca za faktor 2,8 pri enaki velikosti splošne populacije zmanjša velikost vzorčne napake za več kot 1,6-krat.

Metode in načini oblikovanja vzorca.

V statistiki se uporabljajo različne metode oblikovanja vzorčnih sklopov, ki so določeni s cilji raziskave in so odvisni od posebnosti predmeta preučevanja.

Glavni pogoj za izvedbo vzorčnega raziskovanja je preprečiti pojav sistematičnih napak, ki izhajajo iz kršitve načela enakih možnosti za vsako enoto splošne populacije, ki se vključi v vzorec. Preprečevanje sistematičnih napak je doseženo z uporabo znanstveno utemeljenih metod oblikovanja vzorčne populacije.

Obstajajo naslednji načini za izbiro enot iz splošne populacije:

1) individualni izbor - posamezne enote se izberejo v vzorcu;

2) skupinski izbor - v vzorec sodijo kvalitativno homogene skupine ali serije preučevanih enot;

3) kombinirana selekcija je kombinacija individualne in skupinske selekcije.
Metode izbire določajo pravila za oblikovanje vzorčne populacije.

Vzorec je lahko:

  • pravilno naključno je v tem, da vzorčna populacija nastane kot posledica naključnega (nenamernega) izbora posameznih enot iz splošne populacije. V tem primeru se število enot, izbranih za vzorčno populacijo, običajno določi na podlagi sprejetega deleža vzorca. Delež vzorca je razmerje med številom enot v vzorcu n in številom enot v splošni populaciji N, t.j.
  • mehansko je v tem, da se v vzorčni populaciji izberejo enote iz splošne populacije, razdeljene na enake intervale (skupine). Poleg tega je velikost intervala v splošni populaciji enaka recipročni vrednosti deleža vzorca. Torej, pri 2-odstotnem vzorcu je izbrana vsaka 50. enota (1: 0,02), pri 5-odstotnem vzorcu pa vsaka 20. enota (1: 0,05) itd. Tako je v skladu s sprejetim deležem selekcije generalna populacija tako rekoč mehansko razdeljena na enako velike skupine. Iz vsake skupine je izbrana samo ena enota.
  • tipično - pri katerem je splošna populacija najprej razdeljena na homogene tipične skupine. Nato se iz vsake tipične skupine z ustreznim naključnim ali mehanskim vzorčenjem izvede individualna selekcija enot v vzorčno populacijo. Pomembna značilnost tipičnega vzorca je, da daje natančnejše rezultate v primerjavi z drugimi metodami izbire enot v vzorcu;
  • serijsko- pri katerem je splošna populacija razdeljena na skupine enake velikosti - serije. Za vzorec so izbrane serije. Znotraj serije se izvaja stalno opazovanje enot, vključenih v serijo;
  • kombinirano- vzorec je lahko dvostopenjski. V tem primeru je splošna populacija najprej razdeljena na skupine. Nato se izberejo skupine, znotraj slednjih pa se izberejo posamezne enote.

V statistiki ločimo naslednje metode izbire enot v vzorčni populaciji:

  • enostopenjski vzorčenje - vsaka izbrana enota se takoj pregleda po danem kriteriju (pravilno naključno in serijsko vzorčenje);
  • večstopenjski vzorčenje - selekcija se opravi iz splošne populacije posameznih skupin, posamezne enote pa se izberejo iz skupin (tipično vzorčenje z mehansko metodo izbire enot v vzorčni populaciji).

Poleg tega se razlikuje med:

  • ponovna izbira- po shemi vrnjene žoge. Poleg tega se vsaka enota ali serija, ki je prišla v vzorec, vrne v splošno populacijo in ima zato možnost, da ponovno pride v vzorec;
  • neponovljiva izbira- po shemi nevrnjene žoge. Ima natančnejše rezultate z enako velikostjo vzorca.

Določitev zahtevane velikosti vzorca (z uporabo študentske tabele).

Eno od znanstvenih načel v teoriji vzorčenja je zagotoviti zadostno število vzorčenih enot. Teoretično je potreba po spoštovanju tega načela predstavljena v dokazih mejnih izrekov teorije verjetnosti, ki omogočajo ugotoviti, kakšen obseg enot je treba izbrati iz splošne populacije, da bo zadosten in da se zagotovi reprezentativnost vzorca.

Zmanjšanje standardne napake vzorca in posledično povečanje natančnosti ocene je vedno povezano s povečanjem velikosti vzorca, zato se je treba že v fazi organiziranja opazovanja vzorca odločiti vprašanje, kakšna naj bo velikost vzorčne populacije, da se zagotovi zahtevana natančnost rezultatov opazovanja. Izračun zahtevane velikosti vzorca je zgrajen z uporabo formul, izpeljanih iz formul za mejne vzorčne napake (A), ki ustrezajo določeni vrsti in metodi izbire. Torej, za naključno ponovljeno velikost vzorca (n) imamo:

Bistvo te formule je, da je pri naključnem ponavljajočem se izboru zahtevane velikosti velikost vzorca neposredno sorazmerna s kvadratom koeficienta zaupanja (t2) in varianca variacijske značilnosti (? 2) in je obratno sorazmerna s kvadratom mejne vzorčne napake (? 2). Zlasti z podvojitvijo mejne napake se lahko zahtevana velikost vzorca zmanjša za faktor štiri. Od treh parametrov dva (t in?) nastavi raziskovalec.

V tem primeru postopek raziskovalca za namene ciljev vzorčne raziskave bi morala rešiti vprašanje: v kakšno kvantitativno kombinacijo je bolje vključiti te parametre, da se zagotovi optimalna možnost? V enem primeru je morda bolj zadovoljen z zanesljivostjo dobljenih rezultatov (t) kot z mero natančnosti (?), v drugem - obratno. Težje je rešiti vprašanje glede vrednosti mejne vzorčne napake, saj raziskovalec v fazi načrtovanja opazovanja vzorca nima tega kazalnika, zato je v praksi običajno, da se mejna vzorčna napaka določi kot pravilo, znotraj do 10 % pričakovane povprečne ravni lastnosti. Določevanju domnevnega povprečja je mogoče pristopiti na različne načine: z uporabo podatkov iz podobnih prejšnjih raziskav ali z uporabo podatkov iz vzorčnega okvira in izdelavo majhnega poskusnega vzorca.

Pri načrtovanju vzorčnega opazovanja je v formuli (5.2) najtežje določiti tretji parameter – varianco vzorčne populacije. V tem primeru je treba uporabiti vse informacije, ki so na voljo raziskovalcu, pridobljene v prejšnjih podobnih in pilotnih raziskavah.

Vprašanje opredelitve zahtevana velikost vzorca je zapletena, če vzorčna raziskava vključuje preučevanje več značilnosti vzorčnih enot. V tem primeru so povprečne ravni vsakega od znakov in njihova variacija praviloma različni, zato se je mogoče odločiti za vprašanje variance, kateremu znaku dati prednost, le ob upoštevanju namen in cilje raziskave.

Pri načrtovanju vzorčnega opazovanja se predpostavlja vnaprej določena vrednost dovoljene vzorčne napake v skladu z nalogami posamezne študije in verjetnostjo sklepov na podlagi rezultatov opazovanja.

Na splošno formula za mejno napako srednje vrednosti vzorca omogoča določitev:

Količina možnih odstopanj kazalnikov splošne populacije od kazalnikov vzorčne populacije;

Zahtevana velikost vzorca, ki zagotavlja zahtevano natančnost, pri kateri meje možne napake ne presegajo določene določene vrednosti;

Verjetnost, da bo imela napaka v vzorcu določeno mejo.

Študentova t porazdelitev v teoriji verjetnosti je enoparametrska družina absolutno neprekinjenih porazdelitev.

Niz dinamike (interval, moment), zapiranje vrstic dinamike.

Vrstice dinamike- to so vrednosti statističnih kazalnikov, ki so predstavljeni v določenem kronološkem vrstnem redu.

Vsaka časovna serija vsebuje dve komponenti:

1) kazalniki časovnih obdobij (leta, četrtletja, meseci, dnevi ali datumi);

2) kazalniki, ki označujejo preučevani objekt za časovna obdobja ali za ustrezne datume, ki se imenujejo ravni serije.

Serijske ravni so izražene tako absolutne kot povprečne ali relativne vrednosti. Glede na naravo kazalnikov se gradijo dinamične serije absolutnih, relativnih in povprečnih vrednosti. Serija dinamike iz relativnih in povprečnih vrednosti se gradi na podlagi izpeljanih nizov absolutnih vrednosti. Razlikovati med intervalno in trenutno serijo dinamike.

Dinamična intervalna serija vsebuje vrednosti kazalnikov za določena časovna obdobja. V intervalni seriji lahko ravni seštejemo, tako da dobimo obseg pojava v daljšem obdobju ali tako imenovane akumulirane vsote.

Serija dinamičnega navora odraža vrednosti kazalnikov v določenem trenutku (datum v času). V seriji trenutkov raziskovalca lahko zanima le razlika pojavov, ki odraža spremembo nivoja serije med določenimi datumi, saj vsota stopenj tukaj nima prave vsebine. Akumulirane vsote tukaj niso izračunane.

Najpomembnejši pogoj za pravilno konstrukcijo časovnih vrst je primerljivost ravni nizov, ki pripadajo različnim obdobjem. Ravni morajo biti predstavljene v homogenih količinah, različni deli pojava pa morajo biti enako obsežni.

Za da bi se izognili izkrivljanju realne dinamike, se v statistični študiji izvedejo predhodni izračuni (zapiranje niza dinamike), ki so pred statistično analizo časovne vrste. Zapiranje serije dinamike se razume kot združitev dveh ali več serij v eni vrsti, katerih ravni so izračunane po različni metodologiji ali ne ustrezajo teritorialnim mejam itd. Konvergenca serije dinamike lahko pomeni tudi približevanje absolutnih nivojev niza dinamike na skupno bazo, kar odpravlja neprimerljivost ravni niza dinamike.

Koncept primerljivosti nizov dinamike, koeficientov, rasti in stopenj rasti.

Vrstice dinamike- niz statističnih kazalnikov, ki označujejo razvoj naravnih in družbenih pojavov v času. Statistične zbirke, ki jih je objavil Goskomstat Rusije, vsebujejo veliko serij dinamike v obliki tabele. Niz dinamike omogoča razkrivanje vzorcev razvoja preučenih pojavov.

Serija dinamike vsebuje dve vrsti kazalnikov. Časovni indikatorji(leta, četrtletja, meseci itd.) ali časovne točke (na začetku leta, na začetku vsakega meseca itd.). Indikatorji ravni vrstic... Indikatorje ravni serije dinamike je mogoče izraziti v absolutnih vrednostih (proizvodnja izdelka v tonah ali rubljih), relativnih vrednostih (delež mestnega prebivalstva v %) in povprečnih vrednostih (povprečje plače delavcev v panogi po letih itd.). V obliki tabele dinamična vrstica vsebuje dva stolpca ali dve vrstici.

Pravilna konstrukcija serije dinamike predpostavlja izpolnjevanje številnih zahtev:

  1. vsi kazalniki določene dinamike morajo biti znanstveno utemeljeni, zanesljivi;
  2. kazalniki številne dinamike bi morali biti časovno primerljivi, t.j. je treba izračunati za ista časovna obdobja ali za iste datume;
  3. kazalniki številnih dinamik bi morali biti primerljivi na celotnem ozemlju;
  4. kazalniki številne dinamike bi morali biti vsebinsko primerljivi, t.j. izračunano po enotni metodologiji na enak način;
  5. kazalniki številnih dinamik bi morali biti primerljivi za vse obravnavane kmetije. Vse kazalnike številnih dinamik je treba podati v istih merskih enotah.

Statistični kazalniki lahko označuje bodisi rezultate preučevanega procesa v določenem časovnem obdobju bodisi stanje preučevanega pojava v določenem trenutku, t.j. kazalniki so lahko intervalni (periodični) in trenutni. V skladu s tem je začetna serija dinamike lahko intervalna ali trenutna. Trenutna serija dinamike pa je lahko z enakimi in neenakimi časovnimi intervali.

Prvotno serijo dinamike je mogoče pretvoriti v niz povprečnih vrednosti in niz relativnih vrednosti (verižne in osnovne). Takšne vrste dinamike se imenujejo izpeljane serije dinamike.

Metodologija za izračun povprečne ravni v seriji dinamike je drugačna, zaradi vrste serije dinamike. Na primerih bomo obravnavali vrste serij dinamike in formule za izračun povprečne ravni.

Absolutni dobički (Δy) prikazuje, koliko enot se je spremenila naslednja raven serije v primerjavi s prejšnjo (stolpec 3. - absolutni prirast verige) ali v primerjavi z začetno stopnjo (stolpec 4. - osnovni absolutni prirast). Formule za izračun lahko zapišemo na naslednji način:

Z zmanjšanjem absolutnih vrednosti serije bo prišlo do "zmanjšanje", "zmanjšanje".

Indeksi absolutne rasti kažejo, da se je na primer v letu 1998 proizvodnja proizvoda "A" v primerjavi z letom 1997 povečala za 4 tisoč ton, glede na leto 1994 pa za 34 tisoč ton; za preostala leta glej tabelo. 11,5 g 3 in 4.

Stopnja rasti prikazuje, kolikokrat se je raven serije spremenila v primerjavi s prejšnjo (stolpec 5 - verižni koeficienti rasti ali upadanja) ali v primerjavi z začetno ravnjo (stolpec 6 - osnovni koeficienti rasti ali upadanja). Formule za izračun lahko zapišemo na naslednji način:

Stopnje rasti pokaže, koliko odstotkov je naslednja raven serije v primerjavi s prejšnjo (stolpec 7 - stopnje rasti verige) ali v primerjavi z začetno ravnjo (stolpec 8 - osnovne stopnje rasti). Formule za izračun lahko zapišemo na naslednji način:

Tako je na primer leta 1997 obseg proizvodnje izdelka "A" v primerjavi z letom 1996 znašal 105,5% (

Stopnja rasti prikazujejo, za koliko odstotkov se je povečala raven poročevalskega obdobja v primerjavi s prejšnjim (stolpec 9 - verižne stopnje rasti) ali v primerjavi z začetno ravnjo (stolpec 10 - osnovne stopnje rasti). Formule za izračun lahko zapišemo na naslednji način:

T pr = T p - 100 % ali T pr = absolutno povečanje / raven prejšnjega obdobja * 100 %

Tako je bil na primer leta 1996 v primerjavi z letom 1995 izdelek "A" proizveden za 3,8% (103,8% - 100%) ali (8:210) x100%, v primerjavi z letom 1994 pa za 9% (109% - 100). %).

Če se absolutne ravni v vrsti zmanjšajo, bo stopnja manjša od 100% in s tem bo prišlo do stopnje upada (stopnja rasti s predznakom minus).

Absolutna vrednost 1% dobička(stolpec 11) prikazuje, koliko enot je treba izdelati v določenem obdobju, da se raven prejšnjega obdobja poveča za 1 %. V našem primeru je bilo treba leta 1995 proizvesti 2,0 tisoč ton, leta 1998 pa 2,3 tisoč ton, t.j. veliko večji.

Obstajata dva načina za določitev velikosti absolutne vrednosti 1-odstotnega povečanja:

Raven prejšnjega obdobja delite s 100;

Absolutne prirastke verige delite z ustreznimi stopnjami rasti verige.

Absolutna vrednost 1% dobička =

V dinamiki, predvsem v daljšem obdobju, je pomembna skupna analiza stopenj rasti z vsebino vsakega odstotka povečanja ali zmanjšanja.

Upoštevajte, da je obravnavana metoda analize serije dinamike uporabna tako za serijo dinamike, katere ravni so izražene v absolutnih vrednostih (t, tisoč rubljev, število zaposlenih itd.), Kot za serijo dinamike, katere ravni so izražene z relativnimi kazalniki (% ostanka, % pepela v premogu itd.) ali povprečnimi vrednostmi (povprečni pridelek v centnih / ha, povprečne plače itd.).

Poleg obravnavanih analitičnih kazalnikov, izračunanih za vsako leto v primerjavi s prejšnjim ali začetnim nivojem, je treba pri analizi serije dinamike izračunati povprečne analitične kazalnike za obdobje: povprečno raven serije, povprečno letno absolutni porast (padec) ter povprečna letna stopnja rasti in stopnja rasti.

Metode za izračun povprečne ravni serije dinamike so bile obravnavane zgoraj. V intervalni seriji dinamike, ki jo obravnavamo, se povprečna raven serije izračuna z uporabo preproste aritmetične srednje formule:

Povprečna letna proizvodnja izdelka za obdobje 1994-1998 znašala 218,4 tisoč ton.

Povprečna letna absolutna rast se izračuna tudi po formuli preproste aritmetične sredine:

Letni absolutni prirastki so se skozi leta gibali od 4 do 12 tisoč ton (glej stolpec 3), povprečno letno povečanje proizvodnje pa za obdobje 1995 - 1998. znašala 8,5 tisoč ton.

Metode za izračun povprečne stopnje rasti in povprečne stopnje rasti zahtevajo podrobnejšo obravnavo. Poglejmo jih na primeru letnih kazalnikov ravni serije, prikazanih v tabeli.

Povprečna raven številne dinamike.

Niz dinamike (ali časovne vrste) so številčne vrednosti določene statistike v zaporednih trenutkih ali časovnih obdobjih (tj. razporejene v kronološkem vrstnem redu).

Imenujejo se številčne vrednosti enega ali drugega statističnega kazalnika, ki sestavlja serijo dinamike ravni in je običajno označena s črko y... Prvi član serije y 1 imenujemo začetni oz osnovno linijo in zadnji y n - konec... Skozi so označeni trenutki ali časovna obdobja, na katera se ravni nanašajo t.

Serija dinamike je praviloma predstavljena v obliki tabele ali grafa, časovna lestvica pa je izrisana vzdolž abscisne osi. t, na ordinati pa - lestvica ravni serije y.

Povprečni kazalniki številne dinamike

Vsako vrstico dinamike lahko gledamo kot nekakšen agregat nčasovno spreminjajočih se kazalnikov, ki jih lahko povzamemo kot povprečja. Takšni posplošeni (povprečni) kazalniki so še posebej potrebni pri primerjavi sprememb posameznega kazalnika v različnih obdobjih, v različnih državah itd.

Splošna značilnost številnih dinamik je lahko predvsem srednji nivo vrstice... Način izračuna povprečnega nivoja je odvisen od tega, ali gre za trenutno serijo ali za intervalno (obdobno) serijo.

Kdaj interval serije je njen povprečni nivo določen s formulo enostavne aritmetične sredine iz nivojev serije, t.j.

=
Če obstaja trenutek vrstica, ki vsebuje n ravni ( y1, y2,…, yn) z enakimi intervali med datumi (časovnimi točkami), potem lahko takšno serijo enostavno pretvorimo v niz povprečij. V tem primeru je indikator (raven) na začetku vsakega obdobja hkrati indikator na koncu prejšnjega obdobja. Nato lahko povprečno vrednost kazalnika za vsako obdobje (interval med datumi) izračunamo kot polovično vsoto vrednosti pri na začetku in koncu obdobja, t.j. kako . Število takšnih povprečij bo. Kot smo že omenili, se za niz povprečij povprečna raven izračuna iz aritmetične sredine.

Zato lahko zapišemo:
.
Po pretvorbi števca dobimo:
,

kje Y1 in Yn- prvi in ​​zadnji nivo vrstice; Yi- vmesne stopnje.

To povprečje je v statistiki znano kot povprečno kronološko za trenutne serije. To ime je dobil po besedi "cronos" (čas, lat.), saj se izračuna iz kazalnikov, ki se sčasoma spreminjajo.

V primeru neenakopravnosti intervalov med datumi, se lahko kronološko povprečje trenutne serije izračuna kot aritmetično povprečje povprečnih vrednosti nivojev za vsak par trenutkov, tehtanih z razdaljo (časovnimi intervali) med datumi, t.j.
.
V tem primeru domneva se, da so v intervalih med datumi ravni dobile različne vrednosti in smo od dveh znanih ( yi in yi + 1) določimo povprečja, iz katerih nato izračunamo skupno povprečje za celotno analizirano obdobje.
Če se domneva, da je vsaka vrednost yi ostane nespremenjen do naslednjega (i + 1)- th trenutek, tj. znan je točen datum spremembe ravni, potem se lahko izračun izvede po formuli aritmetičnega tehtanega povprečja:
,

kjer je čas, v katerem je raven ostala nespremenjena.

Poleg povprečne ravni v seriji dinamike se izračunajo tudi drugi povprečni kazalniki - povprečna sprememba ravni serije (po osnovni in verižni metodi), povprečna stopnja spremembe.

Izhodišče pomeni absolutno spremembo je količnik zadnje osnovne absolutne spremembe, deljen s številom sprememb. to je

Veriga pomeni absolutno spremembo ravni niza je količnik deljenja vsote vseh absolutnih sprememb verige s številom sprememb, tj.

Znak povprečnih absolutnih sprememb se uporablja tudi za presojo narave spremembe pojava v povprečju: rast, upadanje ali stabilnost.

Iz pravila nadzora osnovnih in verižnih absolutnih sprememb izhaja, da morata biti osnovna in verižna srednja sprememba enaka.

Poleg povprečne absolutne spremembe se z osnovnimi in verižnimi metodami izračuna tudi relativno povprečje.

Izhodiščna povprečna relativna sprememba določeno s formulo:

Veriga pomeni relativno spremembo določeno s formulo:

Seveda bi morale biti osnovne in verižne srednje relativne spremembe enake in s primerjavo z vrednostjo kriterija 1 sklepamo o naravi spremembe pojava v povprečju: rast, upad ali stabilnost.
Z odštevanjem 1 od osnovnega ali verižnega povprečja relativne spremembe dobimo ustrezno povprečna stopnja spremembe, po znaku katerega je mogoče presojati tudi naravo spremembe preučevanega pojava, ki se odraža v dani seriji dinamike.

Sezonska nihanja in indeksi sezonskosti.

Sezonska nihanja so stalna medletna nihanja.

Glavno načelo doseganja največjega učinka je maksimiranje dohodka in zmanjšanje stroškov. S proučevanjem sezonskih nihanj je problem enačbe maksimuma rešen na vsaki ravni leta.

Pri preučevanju sezonskih nihanj se rešujeta dve medsebojno povezani nalogi:

1. Razkrivanje posebnosti razvoja pojava v znotrajletni dinamiki;

2. Merjenje sezonskih nihanj z izgradnjo modela sezonskega valovanja;

Za merjenje sezonskih nihanj se pri puranih običajno upošteva sezonskost. Na splošno jih določa razmerje med začetnimi enačbami številnih dinamik in teoretičnimi enačbami, ki služijo kot osnova za primerjavo.

Ker so naključna odstopanja prekrita z sezonskimi nihanji, se indeksi sezonskosti povprečijo za njihovo odpravo.

V tem primeru se za vsako obdobje letnega cikla določijo posplošeni kazalniki v obliki povprečnih sezonskih indeksov:

Povprečni indeksi sezonskih nihanj so brez vpliva naključnih odstopanj glavnega trenda razvoja.

Glede na naravo trenda ima lahko formula za povprečni indeks sezonskosti naslednje oblike:

1.Za serijo znotrajletne dinamike z izrazitim glavnim razvojnim trendom:

2. Za vrsto medletne dinamike, pri kateri ni naraščajočega ali padajočega trenda ali je nepomembna:

Kje je splošno povprečje;

Metode za analizo glavnega trenda.

Na razvoj pojavov v času vplivajo dejavniki različne narave in moči vpliva. Nekateri od njih so naključne narave, drugi imajo skoraj stalen vpliv in tvorijo določen razvojni trend v vrstah dinamike.

Pomembna naloga statistike je prepoznavanje dinamike trenda v seriji, ki je osvobojena delovanja različnih naključnih dejavnikov. V ta namen se serije dinamike obdelujejo z metodami konsolidacije intervalov, drseče povprečje in analitične poravnave itd.

Intervalna metoda hrapavosti temelji na širitvi časovnih obdobij, ki jim pripadajo ravni številnih dinamik, t.j. je zamenjava podatkov, povezanih z majhnimi časovnimi obdobji, s podatki iz večjih obdobij. Še posebej je učinkovit, če so začetne ravni serije za kratka obdobja. Na primer, vrstice kazalnikov, povezanih z dnevnimi dogodki, se nadomestijo z vrsticami, ki se nanašajo na tedenske, mesečne itd. To vam bo omogočilo bolj jasno prikazovanje "Os razvoja fenomena"... Povprečje, izračunano na povečanih intervalih, omogoča identifikacijo smeri in narave (pospeševanje ali upočasnitev rasti) glavnega trenda razvoja.

Metoda drsečega povprečja je podoben prejšnjemu, vendar se v tem primeru dejanske ravni nadomestijo s povprečnimi ravnmi, izračunanimi za zaporedno premikajoče (drseče) povečane intervale, ki pokrivajo m serijske ravni.

Na primerče sprejmeš m = 3, nato se najprej izračuna povprečje prvih treh stopenj serije, nato iz enakega števila stopenj, vendar od drugega zaporedoma, nato od tretjega itd. Tako povprečje tako rekoč "drsi" po številni dinamiki in se premika za eno obdobje. Izračunano iz m izrazi drseča povprečja se nanašajo na sredino (središče) vsakega intervala.

Ta metoda odpravlja le naključna nihanja. Če ima serija sezonski val, bo ostal po glajenju z metodo drsečega povprečja.

Analitična uskladitev. Za odpravo naključnih nihanj in prepoznavanje trenda se uporabi poravnava ravni serije z analitičnimi formulami (ali analitična poravnava). Njegovo bistvo je v zamenjavi empiričnih (dejanskih) ravni s teoretičnimi, ki se izračunajo po določeni enačbi, sprejeti kot model matematičnega trenda, kjer se teoretične ravni obravnavajo kot funkcija časa:. V tem primeru se vsaka dejanska raven obravnava kot vsota dveh komponent: kjer je sistematična komponenta in izražena z določeno enačbo, in je naključna spremenljivka, ki povzroča nihanja okoli trenda.

Naloga analitične poravnave se zmanjša na naslednje:

1. Določanje na podlagi dejanskih podatkov vrste hipotetične funkcije, ki lahko najbolj ustrezno odraža trend razvoja preučevanega kazalnika.

2. Iskanje parametrov določene funkcije (enačbe) iz empiričnih podatkov

3. Izračun po najdeni enačbi teoretičnih (poravnanih) nivojev.

Izbira določene funkcije se praviloma izvaja na podlagi grafičnega prikaza empiričnih podatkov.

Kot modeli se uporabljajo regresijske enačbe, katerih parametri so izračunani po metodi najmanjših kvadratov

Spodaj so najpogosteje uporabljene regresijske enačbe za izravnavo časovnih vrst, ki kažejo, kateri razvojni trendi so najprimernejši za odraz.

Za iskanje parametrov zgornjih enačb obstajajo posebni algoritmi in računalniški programi. Zlasti za iskanje parametrov enačbe ravne črte se lahko uporabi naslednji algoritem:

Če so obdobja ali trenutki časa oštevilčeni tako, da je St = 0, se bodo zgornji algoritmi bistveno poenostavili in spremenili v

Poravnane ravni na grafikonu bodo nameščene na eni ravni črti, ki poteka na najbližji razdalji od dejanskih nivojev te časovne serije. Vsota kvadratov odstopanj je odraz vpliva naključnih faktorjev.

Z njeno pomočjo izračunamo povprečno (standardno) napako enačbe:

Tukaj je n število opazovanj, m pa število parametrov v enačbi (imamo jih dva - b 1 in b 0).

Glavna težnja (trend) kaže, kako sistematični dejavniki vplivajo na nivoje številne dinamike, nihanja ravni okoli trenda () pa služijo kot merilo vpliva preostalih dejavnikov.

Za oceno kakovosti uporabljenega modela časovne vrste se uporablja tudi ta Fisherjev F test... Gre za razmerje dveh variance, in sicer razmerje variance, ki ga povzroča regresija, t.j. preučevanega faktorja, do variance, ki jo povzročajo naključni vzroki, t.j. preostala disperzija:

V razširjeni obliki lahko formulo za to merilo predstavimo na naslednji način:

kjer je n število opazovanj, t.j. število stopenj v vrsti,

m je število parametrov v enačbi, y je dejanska raven serije,

Poravnana raven vrstice - srednja raven vrstice.

Uspešnejši od drugih model morda ni vedno dovolj zadovoljiv. Kot takega ga je mogoče prepoznati le, če merilo F zanj prečka znano kritično mejo. Ta meja je določena s pomočjo F porazdelitvenih tabel.

Bistvo in klasifikacija indeksov.

Indeks v statistiki razumemo kot relativni kazalnik, ki označuje spremembo velikosti pojava v času, prostoru ali v primerjavi s katerim koli standardom.

Glavni element indeksnega razmerja je indeksirana vrednost. Indeksirana vrednost se razume kot vrednost atributa statistične populacije, katere sprememba je predmet preučevanja.

Obstajajo tri glavne naloge z indeksi:

1) ocena sprememb kompleksnega pojava;

2) ugotavljanje vpliva posameznih dejavnikov na spremembo kompleksnega pojava;

3) primerjava obsega nekega pojava z velikostjo preteklega obdobja, velikostjo za drugo ozemlje, pa tudi s standardi, načrti, napovedmi.

Indeksi so razvrščeni po 3 kriterijih:

2) glede na stopnjo pokritosti elementov populacije;

3) po metodah izračunavanja splošnih indeksov.

Po vsebini indeksiranih vrednosti so indeksi razdeljeni na indekse kvantitativnih (volumetričnih) kazalnikov in indekse kvalitativnih kazalnikov. Indeksi kvantitativnih kazalnikov - indeksi fizičnega obsega industrijske proizvodnje, fizičnega obsega prodaje, števila zaposlenih itd. Indeksi kvalitativnih kazalnikov - indeksi cen, proizvodnih stroškov, produktivnosti dela, povprečne plače itd.

Glede na stopnjo pokritosti enot prebivalstva so indeksi razdeljeni v dva razreda: individualne in splošne. Za njihovo karakterizacijo uvajamo naslednje konvencije, sprejete v praksi uporabe indeksne metode:

q- količino (volumen) katerega koli izdelka v naravnem izražanju ; R- cena na enoto; z- stroški na enoto proizvodnje; t- čas, porabljen za proizvodnjo enote proizvodnje (intenzivnost dela) ; w- proizvodnja izdelkov v vrednostnem smislu na enoto časa; v- proizvodnja proizvodov v naravi na enoto časa; T- skupni porabljen čas oziroma število zaposlenih.

Da bi razločili, kateremu obdobju ali predmetu pripadajo indeksirane vrednosti, je običajno, da se podnaslovi postavijo spodaj desno za ustreznim simbolom. Tako se na primer v indeksih dinamike praviloma za primerjana (tekoča, poročevalska) obdobja uporablja indeks 1 in za obdobja, s katerimi se primerja,

Posamezni indeksi služijo za karakterizacijo sprememb v posameznih elementih kompleksnega pojava (na primer sprememba obsega proizvodnje ene vrste izdelka). Predstavljajo relativne vrednosti dinamike, izpolnjevanja obveznosti, primerjavo indeksiranih vrednosti.

Določi se individualni indeks fizičnega obsega proizvodnje

Z analitičnega vidika so navedeni posamezni indeksi dinamike podobni stopnjam (stopnjam) rasti in označujejo spremembo indeksirane vrednosti v tekočem obdobju glede na izhodišče, torej kažejo, kolikokrat se je povečala (znižala). ) oziroma za koliko odstotkov gre za rast (padec). Vrednosti indeksov so izražene v koeficientih ali odstotkih.

Splošno (zbirno) kazalo odraža spremembo vseh elementov kompleksnega pojava.

Agregatni indeks je glavna oblika indeksa. Imenuje se agregat, ker sta njegov števec in imenovalec niz "agregatov"

Povprečni indeksi, njihova definicija.

Poleg agregatnih indeksov statistika uporablja svojo drugo obliko – tehtane povprečne indekse. Uporabljajo se, kadar razpoložljive informacije ne omogočajo izračuna skupnega agregatnega indeksa. Torej, če ni podatkov o cenah, obstajajo pa podatki o stroških izdelkov v tekočem obdobju in so znani posamezni indeksi cen za vsak izdelek, potem splošnega indeksa cen ni mogoče določiti kot agregat, je pa mogoče izračunaj kot povprečje posameznih. Na enak način, če količine posameznih vrst proizvedenih izdelkov niso znane, so pa znani posamezni indeksi in stroški proizvodov za bazno obdobje, se lahko splošni indeks fizičnega obsega proizvodnje določi kot tehtano povprečje. .

Povprečni indeks - to je indeks, izračunan kot povprečje posameznih indeksov. Agregatni indeks je glavna oblika splošnega indeksa, zato mora biti povprečni indeks enak agregatnemu indeksu. Pri izračunu povprečja se uporabljata dve obliki povprečja: aritmetična in harmonična.

Indeks aritmetične sredine je enak agregatnemu indeksu, če so uteži posameznih indeksov izrazi imenovalca združenega indeksa. Samo v tem primeru bo vrednost indeksa, izračunana po formuli aritmetične sredine, enaka agregatnemu indeksu.

Za preprost izračun geometrijske sredine se uporablja formula:

Geometrijsko uteženo

Za določitev geometrijskega tehtanega povprečja se uporabi formula:

Povprečni premeri koles, cevi, povprečne stranice kvadratov se določijo s povprečnim kvadratom.

Vrednosti RMS se uporabljajo za izračun nekaterih kazalnikov, na primer koeficienta variacije, ki označuje ritem proizvodnje. Tukaj se standardni odmik od načrtovane proizvodnje za določeno obdobje določi z naslednjo formulo:

Te vrednosti natančno označujejo spremembo ekonomskih kazalnikov v primerjavi z njihovo osnovno vrednostjo, vzeto v njeni povprečni vrednosti.

Kvadratno preprosto

Srednji kvadratni koren preprost se izračuna po formuli:

Uteženi kvadrat

Tehtani srednji kvadrat je:

22. Absolutni kazalniki variacije vključujejo:

obseg variacije

povprečno linearno odstopanje

variance

standardni odklon

Različica zamaha (r)

Različica s potegom je razlika med največjo in najmanjšo vrednostjo značilnosti

Prikazuje meje, v katerih se vrednost lastnosti spreminja v preučevani populaciji.

Delovne izkušnje petih prijavljenih v predhodnem delu so: 2,3,4,7 in 9 let. Rešitev: razpon variacije = 9 - 2 = 7 let.

Za posplošeno karakteristiko razlik v vrednostih značilnosti se povprečni kazalniki variacije izračunajo na podlagi upoštevanja odstopanj od aritmetične sredine. Razlika se vzame kot odstopanje od povprečja.

Hkrati je treba, da bi se izognili vsoti odstopanj možnosti lastnosti od povprečja (ničelna lastnost povprečja), bodisi ne upoštevati znakov odstopanja, torej vzeti tega vsota po modulu ali za kvadratiranje odstopanj na nič.

Povprečna linearna in standardna deviacija

Povprečno linearno odstopanje- to je aritmetična sredina absolutnih odstopanj posameznih vrednosti atributa od srednje vrednosti.

Povprečno linearno odstopanje je preprosto:

Delovne izkušnje petih prijavljenih v predhodnem delu so: 2,3,4,7 in 9 let.

V našem primeru: leta;

Odgovor: 2,4 leta.

Uteženo povprečno linearno odstopanje velja za združene podatke:

Povprečno linearno odstopanje se zaradi svoje konvencije v praksi uporablja razmeroma redko (zlasti za označevanje izpolnjevanja pogodbenih obveznosti za enotnost dobave; pri analizi kakovosti izdelkov ob upoštevanju tehnoloških značilnosti proizvodnje).

Standardni odklon

Najbolj popolna značilnost variacije je standardni odklon, ki se imenuje standard (ali standardni odklon). Standardni odklon() je enak kvadratnemu korenu srednjega kvadrata odstopanj posameznih vrednosti atributa od aritmetične sredine:

Standardno odstopanje je preprosto:

Tehtani standardni odklon se uporablja za združene podatke:

Med srednjim kvadratom in standardnim linearnim odklonom v normalnih pogojih porazdelitve obstaja naslednja povezava: ~ 1,25.

Standardna deviacija, ki je glavno absolutno merilo variacije, se uporablja za določanje vrednosti ordinat krivulje normalne porazdelitve pri izračunih, povezanih z organizacijo opazovanja vzorca in ugotavljanjem točnosti značilnosti vzorca, kot tudi pri ocenjevanju meje variacije lastnosti v homogeni populaciji.

Vrednosti, pridobljene iz izkušenj, neizogibno vsebujejo napake zaradi najrazličnejših razlogov. Med njimi je treba razlikovati med sistematičnimi in naključnimi napakami. Sistematske napake povzročajo razlogi, ki delujejo na zelo določen način in jih je vedno mogoče odpraviti ali natančno upoštevati. Naključne napake povzroča zelo veliko število ločenih vzrokov, ki jih ni mogoče natančno upoštevati in delujejo v vsaki ločeni dimenziji na različne načine. Teh napak ni mogoče popolnoma izključiti; jih je mogoče upoštevati le v povprečju, za kar je treba poznati zakonitosti, ki urejajo naključne napake.

Izmerjeno vrednost bomo označili z A, naključno napako pri meritvi x. Ker lahko napaka x sprejme poljubne vrednosti, je to neprekinjena naključna spremenljivka, za katero je v celoti značilen lasten zakon porazdelitve.

Najenostavnejša in najbolj natančno odraža resničnost (v veliki večini primerov) je t.i. normalna porazdelitev napak:

Ta zakon porazdelitve je mogoče pridobiti iz različnih teoretičnih predpostavk, zlasti iz zahteve, da je najverjetnejša vrednost neznane količine, za katero se z neposrednim merjenjem z enako stopnjo natančnosti pridobi več vrednosti, aritmetična povprečje teh vrednosti. Količina 2 se imenuje variance tega običajnega zakona.

povprečno

Določanje variance iz eksperimentalnih podatkov. Če je za katero koli količino A z neposredno meritvijo pridobljenih n vrednosti a i z enako stopnjo natančnosti in če so napake količine A podvržene zakonu normalne porazdelitve, bo najverjetnejša vrednost A povprečno:

a - aritmetična sredina,

a i - izmerjena vrednost na i-tem koraku.

Odmik opazovane vrednosti (za vsako opazovanje) a i vrednosti A od aritmetična sredina: a i - a.

Za določitev variance normalne porazdelitve napak v tem primeru uporabite formulo:

2 - varianca,
a - aritmetična sredina,
n je število meritev parametra,

Standardni odklon

Standardni odklon prikazuje absolutno odstopanje izmerjenih vrednosti od aritmetična sredina... Po formuli za mero natančnosti linearne kombinacije povprečna kvadratna napaka aritmetična sredina je določena s formulo:

, kje


a - aritmetična sredina,
n je število meritev parametra,
a i - izmerjena vrednost na i-tem koraku.

Koeficient variacije

Koeficient variacije označuje relativno mero odstopanja izmerjenih vrednosti od aritmetična sredina:

, kje

V je koeficient variacije,
- standardni odklon,
a - aritmetična sredina.

Večja kot je vrednost koeficient variacije, sorazmerno večji je razpršitev in manjša enotnost preiskovanih vrednosti. Če koeficient variacije manj kot 10 %, potem se variabilnost serije variacij šteje za nepomembno, od 10 % do 20 % se nanaša na povprečje, več kot 20 % in manj kot 33 % za pomembno in če koeficient variacije presega 33 %, to kaže na heterogenost informacij in potrebo po izločitvi največje in najmanjše vrednosti.

Povprečno linearno odstopanje

Eden od indikatorjev obsega in intenzivnosti variacije - povprečno linearno odstopanje(povprečni modul odstopanja) od aritmetične sredine. Povprečno linearno odstopanje izračunano po formuli:

, kje

_
a - srednji linearni odklon,
a - aritmetična sredina,
n je število meritev parametra,
a i - izmerjena vrednost na i-tem koraku.

Če želite preveriti skladnost raziskanih vrednosti z zakonom normalne porazdelitve, uporabite razmerje indeks asimetrije na njegovo napako in odnos stopnja ekscesa na njegovo napako.

Indeks asimetrije

Indeks asimetrije(A) in njena napaka (m a) se izračuna z naslednjimi formulami:

, kje

A - indikator asimetrije,
- standardni odklon,
a - aritmetična sredina,
n je število meritev parametra,
a i - izmerjena vrednost na i-tem koraku.

Indikator kurtoze

Indikator kurtoze(E) in njena napaka (m e) se izračuna z naslednjimi formulami:

, kje



 


Preberite:



Splošna psihologija Stolyarenko a m

Splošna psihologija Stolyarenko a m

Bistvo psihe in miselnosti. Znanost je družbeni pojav, sestavni del družbene zavesti, oblika človekovega poznavanja narave, ...

Vserusko testno delo za osnovnošolski tečaj

Vserusko testno delo za osnovnošolski tečaj

VLOOKUP. Ruski jezik. 25 možnosti za tipična opravila. Volkova E.V. et al. M.: 2017 - 176 str. Ta priročnik je v celoti skladen z ...

Človeška fiziologija splošna športna starost

Človeška fiziologija splošna športna starost

Trenutna stran: 1 (knjiga ima skupaj 54 strani) [odlomek na voljo za branje: 36 strani] Pisava: 100% + Alexey Solodkov, Elena ...

Predavanja o metodiki poučevanja ruskega jezika in književnosti v metodičnem razvoju osnovnih šol na temo

Predavanja o metodiki poučevanja ruskega jezika in književnosti v metodičnem razvoju osnovnih šol na temo

Priročnik vsebuje sistematičen tečaj pouka slovnice, branja, književnosti, pravopisa in razvoja govora za mlajše učence. Najdeno v njem ...

feed-image Rss