bahay - Pag-ayos ng kasaysayan
Pagpapasiya ng ibig sabihin ng square deviation. Karaniwang lihis

Aralin bilang 4

Paksa: “Mga istatistikal na naglalarawan. Mga tagapagpahiwatig ng pagkakaiba-iba ng katangian sa pinagsama-samang "

Ang pangunahing pamantayan para sa pagkakaiba-iba ng isang katangian sa isang istatistikal na populasyon ay: limitasyon, amplitude, average karaniwang lihis, coefficient ng oscillation at coefficient ng variation. Sa nakaraang aralin, tinalakay na ang average na mga halaga ay nagbibigay lamang ng isang pangkalahatang katangian ng pinag-aralan na katangian sa pinagsama-samang at hindi isinasaalang-alang ang mga halaga ng mga indibidwal na variant nito: ang minimum at maximum na mga halaga, sa itaas ng average, mas mababa sa average, atbp.

Halimbawa. Mga average na halaga ng dalawang magkaibang pagkakasunud-sunod ng numero: -100; -dalawampu; 100; 20 at 0.1; -0.2; 0.1 ay ganap na pareho at pantayO.Gayunpaman, ang mga saklaw ng scatter ng mga sequence na ito ng relative mean ay ibang-iba.

Ang kahulugan ng nakalistang pamantayan para sa pagkakaiba-iba ng isang tampok ay pangunahing isinasagawa na isinasaalang-alang ang halaga nito para sa mga indibidwal na elemento ng istatistikal na populasyon.

Ang mga tagapagpahiwatig para sa pagsukat ng pagkakaiba-iba ng isang katangian ay ganap at kamag-anak... Ang mga ganap na tagapagpahiwatig ng pagkakaiba-iba ay kinabibilangan ng: ang hanay ng pagkakaiba-iba, limitasyon, karaniwang paglihis, pagkakaiba-iba. Ang coefficient ng variation at coefficient ng oscillation ay tumutukoy sa mga relatibong sukat ng variation.

Limitasyon (lim) - ito ay isang criterion na tinutukoy ng matinding halaga ng variant sa serye ng variation. Sa madaling salita, ang pamantayang ito ay limitado sa minimum at maximum na mga halaga ng tampok:

Amplitude (Am) o saklaw ng pagkakaiba-iba - ito ang pagkakaiba sa pagitan ng mga matinding opsyon. Ang pagkalkula ng pamantayang ito ay isinasagawa sa pamamagitan ng pagbabawas ng pinakamababang halaga nito mula sa pinakamataas na halaga ng katangian, na nagbibigay-daan sa amin upang masuri ang antas ng pagkakaiba-iba ng opsyon:

Ang kawalan ng limitasyon at amplitude bilang isang criterion ng pagkakaiba-iba ay ganap silang umaasa sa mga matinding halaga ng katangian sa serye ng pagkakaiba-iba. Sa kasong ito, ang mga pagbabago sa mga halaga ng isang katangian sa loob ng isang serye ay hindi isinasaalang-alang.

Ang pinakakumpletong katangian ng pagkakaiba-iba ng isang katangian sa isang istatistikal na populasyon ay ibinibigay ng karaniwang lihis(sigma), na isang pangkalahatang sukatan ng paglihis ng isang variant mula sa mean nito. Ang karaniwang paglihis ay madalas na tinutukoy bilang karaniwang lihis.

Ang standard deviation ay batay sa paghahambing ng bawat opsyon sa arithmetic mean ng ibinigay na populasyon. Dahil sa pinagsama-samang mayroong palaging mga pagpipilian na parehong mas mababa at higit pa kaysa dito, ang kabuuan ng mga paglihis na may sign na "" ay babayaran ng kabuuan ng mga deviations na mayroong sign "", i.e. ang kabuuan ng lahat ng deviations ay zero. Upang maiwasan ang impluwensya ng mga palatandaan ng mga pagkakaiba, ang mga paglihis ay kinuha mula sa arithmetic mean squared, i.e. ... Ang kabuuan ng mga parisukat ng mga deviations ay hindi zero. Upang makakuha ng isang koepisyent na maaaring masukat ang pagkakaiba-iba, kunin ang average ng kabuuan ng mga parisukat - ang halagang ito ay tinatawag pagkakaiba-iba:

Sa mga tuntunin ng kahulugan, ang pagkakaiba-iba ay ang ibig sabihin ng parisukat ng mga paglihis ng mga indibidwal na halaga ng isang tampok mula sa ibig sabihin nito. Pagpapakalat ang parisukat ng karaniwang paglihis.

Ang pagkakaiba ay isang dimensyon (pinangalanan). Kaya, kung ang mga variant ng serye ng numero ay ipinahayag sa metro, kung gayon ang pagkakaiba ay nagbibigay ng square meters; kung ang mga opsyon ay ipinahayag sa kilo, ang pagkakaiba ay nagbibigay ng parisukat ng sukat na ito (kg 2), atbp.

Karaniwang lihis- square root ng variance:

, pagkatapos ay kapag kinakalkula ang pagkakaiba at karaniwang paglihis sa denominator ng fraction sa halip nakailangang ilagay.

Ang pagkalkula ng karaniwang paglihis ay maaaring nahahati sa anim na yugto, na dapat isagawa sa isang tiyak na pagkakasunud-sunod:

Application ng standard deviation:

a) upang hatulan ang pagkakaiba-iba ng serye ng mga pagkakaiba-iba at isang paghahambing na pagtatasa ng typicality (representativeness) ng arithmetic mean values. Ito ay kinakailangan sa differential diagnostics kapag tinutukoy ang katatagan ng mga palatandaan.

b) upang muling buuin ang serye ng variation, i.e. pagpapanumbalik ng frequency response nito batay sa tatlong sigma panuntunan. Sa pagitan (M ± 3σ) 99.7% ng lahat ng variant ng serye ay matatagpuan, sa pagitan (M ± 2σ) - 95.5% at sa pagitan (M ± 1σ) - 68.3% variant ng row(fig. 1).

c) upang matukoy ang "pop-up" na opsyon

d) upang matukoy ang mga parameter ng pamantayan at patolohiya gamit ang mga pagtatantya ng sigma

e) upang kalkulahin ang koepisyent ng pagkakaiba-iba

f) upang kalkulahin ang mean error ng arithmetic mean.

Upang makilala ang anumang pangkalahatang populasyon na mayroonnormal na uri ng pamamahagi , sapat na upang malaman ang dalawang parameter: ang arithmetic mean at ang standard deviation.

Figure 1. Ang Three Sigma Rule

Halimbawa.

Sa pediatrics, ang standard deviation ay ginagamit upang masuri ang pisikal na pag-unlad ng mga bata sa pamamagitan ng paghahambing ng data ng isang partikular na bata na may kaukulang standard indicator. Ang arithmetic mean indicator ng pisikal na pag-unlad ng malulusog na bata ay kinuha bilang pamantayan. Ang paghahambing ng mga tagapagpahiwatig na may mga pamantayan ay isinasagawa ayon sa mga espesyal na talahanayan, kung saan ang mga pamantayan ay ibinibigay kasama ng kanilang kaukulang mga sukat ng sigma. Itinuturing na kung ang tagapagpahiwatig ng pisikal na pag-unlad ng bata ay nasa loob ng pamantayan (arithmetic mean) ± σ, kung gayon pisikal na kaunlaran ang bata (ayon sa tagapagpahiwatig na ito) ay tumutugma sa pamantayan. Kung ang tagapagpahiwatig ay nasa loob ng pamantayang ± 2σ, pagkatapos ay mayroong isang bahagyang paglihis mula sa pamantayan. Kung ang tagapagpahiwatig ay lumampas sa mga hangganan na ito, kung gayon ang pisikal na pag-unlad ng bata ay naiiba nang husto mula sa pamantayan (posible ang patolohiya).

Bilang karagdagan sa mga tagapagpahiwatig ng pagkakaiba-iba, na ipinahayag sa mga ganap na halaga, ang istatistikal na pag-aaral ay gumagamit ng mga tagapagpahiwatig ng pagkakaiba-iba, na ipinahayag sa mga kamag-anak na halaga. Oscillation coefficient - ito ay ang ratio ng hanay ng pagkakaiba-iba sa average na halaga ng katangian. Ang koepisyent ng pagkakaiba-iba - ay ang ratio ng standard deviation sa karaniwan tanda. Karaniwan, ang mga halagang ito ay ipinahayag bilang isang porsyento.

Mga formula para sa pagkalkula ng mga kaugnay na indeks ng variation:

Makikita mula sa mga formula sa itaas na mas malaki ang koepisyent V malapit sa zero, mas mababa ang pagkakaiba-iba sa mga halaga ng tampok. Ang higit pa V, mas nababago ang tanda.

Sa pagsasanay sa istatistika, ang koepisyent ng pagkakaiba-iba ay kadalasang ginagamit. Ginagamit ito hindi lamang para sa paghahambing na pagtatasa ng pagkakaiba-iba, kundi pati na rin para sa pagkilala sa homogeneity ng populasyon. Ang populasyon ay itinuturing na homogenous kung ang koepisyent ng variation ay hindi lalampas sa 33% (para sa mga distribusyon na malapit sa normal). Sa aritmetika, ang ratio ng σ at ang arithmetic mean ay nag-aalis ng impluwensya ganap na halaga ng mga katangiang ito, at ginagawa ng porsyento ang coefficient ng variation bilang isang walang sukat (walang pangalan) na halaga.

Ang nakuhang halaga ng koepisyent ng pagkakaiba-iba ay tinatantya alinsunod sa mga tinatayang gradasyon ng antas ng pagkakaiba-iba ng katangian:

Mahina - hanggang 10%

Average - 10 - 20%

Malakas - higit sa 20%

Ang paggamit ng koepisyent ng pagkakaiba-iba ay ipinapayong sa mga kaso kung kailan kinakailangan upang ihambing ang mga tampok na naiiba sa laki at sukat.

Malinaw na ipinapakita ang pagkakaiba sa pagitan ng koepisyent ng pagkakaiba-iba at iba pang pamantayan ng scatter halimbawa.

Talahanayan 1

Ang komposisyon ng mga manggagawa sa isang pang-industriya na negosyo

Batay sa mga istatistikal na katangian na ibinigay sa halimbawa, maaari itong tapusin na ang komposisyon ng edad at antas ng edukasyon ng mga empleyado ng enterprise ay medyo homogenous na may mababang propesyonal na katatagan ng surveyed contingent. Madaling makita na ang isang pagtatangka na hatulan ang mga panlipunang tendensiyang ito sa pamamagitan ng karaniwang paglihis ay hahantong sa isang maling konklusyon, at ang pagtatangkang paghambingin ang mga kredensyal na "karanasan sa trabaho" at "edad" sa katangian ng accounting na "edukasyon" ay karaniwang hindi tama. dahil sa heterogeneity ng mga katangiang ito.

Median at percentiles

Para sa ordinal (ranggo) na mga distribusyon, kung saan ang criterion para sa gitna ng serye ay ang median, ang standard deviation at variance ay hindi maaaring magsilbi bilang mga katangian ng scattering na variant.

Ang parehong ay totoo para sa open variation serye. Ang pangyayaring ito ay dahil sa katotohanan na ang mga paglihis kung saan kinakalkula ang variance at σ ay binibilang mula sa arithmetic mean, na hindi kinakalkula sa bukas na serye ng variational at sa serye ng mga distribusyon ng mga katangiang husay. Samakatuwid, para sa isang maigsi na paglalarawan ng mga distribusyon, isa pang parameter ng scatter ang ginagamit - dami(kasingkahulugan - "nercentile"), na angkop para sa paglalarawan ng mga katangian ng husay at dami sa anumang anyo ng kanilang pamamahagi. Magagamit din ang parameter na ito upang isalin ang mga quantitative na katangian sa mga qualitative. Sa kasong ito, ang mga naturang pagtatantya ay itinalaga depende sa kung aling pagkakasunud-sunod ng dami ang tumutugma sa isang partikular na opsyon.

Sa pagsasagawa ng biomedical na pananaliksik, ang mga sumusunod na dami ay kadalasang ginagamit:

Ay ang panggitna;

, - quartile (quartile), nasaan ang lower quartile, itaas na quartile.

Hinahati ng quantiles ang lugar ng posibleng variation ng isang variant sa isang variation series sa ilang partikular na agwat. Ang median (quantile) ay isang variant na nasa gitna ng serye ng variation at hinahati ang seryeng ito sa kalahati, sa dalawang pantay na bahagi ( 0,5 at 0,5 ). Hinahati ng quartile ang serye sa apat na bahagi: ang unang bahagi (lower quartile) ay ang mga opsyon na naghihiwalay sa mga opsyon, ang mga numerical na halaga na hindi lalampas sa 25% ng maximum na posible sa ang seryeng ito, pinaghihiwalay ng quartile ang mga opsyon na may numerical na halaga hanggang 50% ng maximum na posible. Ang itaas na quartile () ay naghihiwalay ng mga opsyon hanggang sa 75% ng maximum na posibleng mga halaga.

Sa kaso ng asymmetric distribution isang variable na may kaugnayan sa arithmetic mean, ang median at quartiles ay ginagamit upang makilala ito. Sa kasong ito, ang sumusunod na anyo ng pagpapakita ng average na halaga ay ginagamit - Ako (;). Halimbawa, ang pinag-aralan na tanda - "ang panahon kung saan ang bata ay nagsimulang lumakad nang nakapag-iisa" - sa pangkat ng pag-aaral ay may walang simetrya na pamamahagi. Kasabay nito, ang mas mababang quartile () ay tumutugma sa simula ng paglalakad - 9.5 na buwan, ang median - 11 buwan, at ang itaas na quartile () - 12 buwan. Alinsunod dito, ang katangian ng average na kalakaran ng ipinahiwatig na tanda ay ipapakita bilang 11 (9.5; 12) na buwan.

Pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pananaliksik

Ang istatistikal na kahalagahan ng data ay nauunawaan bilang ang antas kung saan tumutugma ang mga ito sa ipinakitang katotohanan, i.e. Ang data na makabuluhang istatistika ay ang mga hindi nakakasira at wastong sumasalamin sa layunin ng katotohanan.

Upang suriin ang istatistikal na kahalagahan ng mga resulta ng pananaliksik ay nangangahulugan na matukoy kung ano ang posibilidad na mailipat ang mga resulta na nakuha sa sample na populasyon sa buong pangkalahatang populasyon. Ang pagtatasa ng istatistikal na kahalagahan ay kinakailangan upang maunawaan kung gaano kalaki ang kababalaghan na maaaring hatulan sa kababalaghan sa kabuuan at sa mga pattern nito.

Ang pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pananaliksik ay binubuo ng:

1. mga pagkakamali ng pagiging kinatawan (mga pagkakamali ng mean at kamag-anak na mga halaga) - m;

2. mga limitasyon ng kumpiyansa ng karaniwan o kamag-anak na mga halaga;

3.ang pagiging maaasahan ng pagkakaiba sa pagitan ng mean o kamag-anak na mga halaga ayon sa pamantayan t.

Standard error ng arithmetic mean o pagkakamali ng pagiging kinatawan nailalarawan ang mga pagbabago sa average. Dapat tandaan na kung mas malaki ang laki ng sample, mas maliit ang pagkalat ng mga mean na halaga. Ang karaniwang error ng mean ay kinakalkula ng formula:

Sa modernong siyentipikong panitikan, ang arithmetic mean ay isinulat kasama ng error sa representasyon:

o kasama ang karaniwang paglihis:

Bilang halimbawa, isaalang-alang ang data para sa 1,500 urban polyclinics sa bansa (pangkalahatang populasyon). Ang average na bilang ng mga pasyenteng nagsilbi sa isang polyclinic ay 18150 katao. Ang random na pagpili ng 10% ng mga bagay (150 polyclinics) ay nagbibigay ng average na bilang ng mga pasyente na katumbas ng 20051 tao. Ang error sa sampling, malinaw na nauugnay sa katotohanan na hindi lahat ng 1500 polyclinics ay kasama sa sample, ay katumbas ng pagkakaiba sa pagitan ng mga average na ito - ang pangkalahatang average ( M gene) at sample mean ( M piliin). Kung bubuo kami ng isa pang sample na may parehong laki mula sa aming pangkalahatang populasyon, magbibigay ito ng ibang dami ng error. Ang lahat ng sample na ito para sa sapat na malalaking sample ay karaniwang ipinamamahagi sa paligid ng pangkalahatang average para sa sapat na malalaking sample. isang malaking bilang pag-uulit ng pag-sample ng parehong bilang ng mga bagay mula sa pangkalahatang populasyon. Standard error ng mean m ay ang hindi maiiwasang scatter ng sample na ibig sabihin sa paligid ng pangkalahatang average.

Sa kaso kung ang mga resulta ng pananaliksik ay ipinakita sa mga kamag-anak na halaga (halimbawa, mga porsyento) - ito ay kinakalkula ibahagi ang karaniwang error:

kung saan ang P ay ang indicator sa%, n ang bilang ng mga obserbasyon.

Ang resulta ay ipinapakita bilang (P ± m)%. Halimbawa, ang porsyento ng paggaling sa mga pasyente ay (95.2 ± 2.5)%.

Sa kaganapan na ang bilang ng mga elemento sa populasyon, pagkatapos ay kapag kinakalkula ang mga karaniwang error ng mean at ang fraction sa denominator ng fraction sa halip nakailangang ilagay.

Para sa normal na distribusyon (normal ang distribusyon ng sample na paraan), alam kung gaano karami ang populasyon sa loob ng anumang pagitan sa paligid ng mean. Sa partikular:

Sa pagsasagawa, ang problema ay hindi natin alam ang mga katangian ng pangkalahatang populasyon, at ang sample ay ginawa nang tumpak para sa layunin ng pagtatasa sa kanila. Nangangahulugan ito na kung gumawa tayo ng mga sample ng parehong laki n mula sa pangkalahatang populasyon, pagkatapos ay sa 68.3% ng mga kaso ang pagitan ay maglalaman ng halaga M(ito ay nasa pagitan sa 95.5% ng mga kaso at sa pagitan sa 99.7% ng mga kaso).

Dahil isang sample lamang ang aktwal na ginawa, ang pahayag na ito ay nabuo sa mga tuntunin ng posibilidad: na may posibilidad na 68.3%, ang average na halaga ng isang tampok sa pangkalahatang populasyon ay nakapaloob sa isang pagitan, na may posibilidad na 95.5% - sa pagitan, atbp.

Sa pagsasagawa, ang isang agwat ay binuo sa paligid ng sample na halaga, na kung saan ay, na may ibinigay na (sapat na mataas) na posibilidad - antas ng kumpiyansa -"Sasaklawin" ba ang tunay na halaga ng parameter na ito sa pangkalahatang populasyon. Ang agwat na ito ay tinatawag agwat ng kumpiyansa.

Posibilidad ng kumpiyansaP ito ay ang antas ng kumpiyansa na ang agwat ng kumpiyansa ay talagang maglalaman ng tunay (hindi kilalang) halaga ng parameter sa pangkalahatang populasyon.

Halimbawa, kung ang antas ng kumpiyansa R katumbas ng 90%, nangangahulugan ito na 90 sample sa 100 ang magbibigay ng tamang pagtatantya ng parameter sa pangkalahatang populasyon. Alinsunod dito, ang posibilidad ng pagkakamali, i.e. ang maling pagtatantya ng pangkalahatang average para sa sample ay katumbas ng porsyento sa:. Para sa halimbawang ito, nangangahulugan ito na ang 10 sample sa 100 ay magbibigay ng maling pagtatantya.

Malinaw, ang antas ng kumpiyansa (antas ng kumpiyansa) ay nakasalalay sa laki ng pagitan: mas malawak ang pagitan, mas mataas ang kumpiyansa na mahuhulog dito ang isang hindi kilalang halaga para sa pangkalahatang populasyon. Sa pagsasagawa, upang mabuo ang agwat ng kumpiyansa, hindi bababa sa dalawang beses ang sampling error ay kinuha upang matiyak ang isang kumpiyansa na hindi bababa sa 95.5%.

Ang pagpapasiya ng mga limitasyon ng kumpiyansa ng average at kamag-anak na mga halaga ay nagbibigay-daan sa iyo upang mahanap ang kanilang dalawang matinding halaga - ang pinakamababang posible at ang maximum na posible, kung saan ang pinag-aralan na tagapagpahiwatig ay matatagpuan sa buong pangkalahatang populasyon. Batay sa mga ito, mga limitasyon ng kumpiyansa (o agwat ng kumpiyansa)- ito ang mga hangganan ng average o kamag-anak na mga halaga, na lumalampas sa kung saan dahil sa mga random na pagbabagu-bago ay may maliit na posibilidad.

Ang agwat ng kumpiyansa ay maaaring muling isulat bilang:, kung saan t- pamantayan ng kumpiyansa.

Ang mga limitasyon ng kumpiyansa ng arithmetic mean sa pangkalahatang populasyon ay tinutukoy ng formula:

M gene = M pumili + t m M

para sa relatibong halaga:

R gene = P pumili + t m R

saan M gene at R gene- ibig sabihin at kamag-anak na mga halaga para sa pangkalahatang populasyon; M pumili at R pumili- ang mga halaga ng average at kamag-anak na mga halaga na nakuha sa sample na populasyon; m M at m P- mga error ng average at kamag-anak na mga halaga; t- Pamantayan ng kumpiyansa (katumpakan na pamantayan, na itinakda kapag nagpaplano ng pag-aaral at maaaring katumbas ng 2 o 3); t m ay ang confidence interval o Δ ay ang marginal error ng indicator na nakuha sa sample study.

Dapat pansinin na ang halaga ng criterion t sa isang tiyak na lawak na nauugnay sa posibilidad ng isang walang error na pagtataya (p), na ipinahayag sa%. Pinili ito ng mismong mananaliksik, ginagabayan ng pangangailangang makakuha ng resulta na may kinakailangang antas ng katumpakan. Kaya, para sa posibilidad ng isang walang error na forecast na 95.5%, ang halaga ng criterion t ay 2, para sa 99.7% - 3.

Ang mga ibinigay na pagtatantya ng agwat ng kumpiyansa ay katanggap-tanggap lamang para sa mga istatistikal na populasyon na may higit sa 30 na mga obserbasyon. Sa mas maliit na laki ng populasyon (maliit na sample), ang mga espesyal na talahanayan ay ginagamit upang matukoy ang t criterion. Sa mga talahanayang ito, ang gustong halaga ay nasa intersection ng linya na tumutugma sa laki ng populasyon (n-1), at isang column na tumutugma sa antas ng posibilidad ng isang hindi nagkakamali na hula (95.5%; 99.7%) na pinili ng mananaliksik. Sa medikal na pananaliksik, kapag nagtatatag ng mga limitasyon sa kumpiyansa para sa anumang tagapagpahiwatig, ang posibilidad ng isang walang error na hula ay tinatanggap bilang 95.5% o higit pa. Nangangahulugan ito na ang halaga ng indicator na nakuha sa sample na populasyon ay dapat matagpuan sa pangkalahatang populasyon sa hindi bababa sa 95.5% ng mga kaso.

    Mga tanong sa paksa ng aralin:

    Ang kaugnayan ng mga tagapagpahiwatig ng pagkakaiba-iba ng isang tampok sa istatistikal na populasyon.

    Pangkalahatang katangian ng ganap na mga tagapagpahiwatig ng pagkakaiba-iba.

    Standard deviation, pagkalkula, aplikasyon.

    Mga kamag-anak na tagapagpahiwatig ng pagkakaiba-iba.

    Median, quartile na pagtatantya.

    Pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pananaliksik.

    Standard error ng arithmetic mean, formula ng pagkalkula, halimbawa ng paggamit.

    Pagkalkula ng proporsyon at ang karaniwang error nito.

    Konsepto sa antas ng kumpiyansa, halimbawa ng paggamit.

10. Ang konsepto ng agwat ng kumpiyansa, ang aplikasyon nito.

    Mga takdang-aralin sa pagsubok sa paksa na may mga sample na sagot:

1. ANG GANAP NA MGA INDICATOR NG VARIATION NA KAUGNAY SA

1) koepisyent ng pagkakaiba-iba

2) koepisyent ng oscillation

4) panggitna

2. MGA RELATIVE INDICATOR NG VARIATION NA KAUGNAY SA

1) pagkakaiba-iba

4) koepisyent ng pagkakaiba-iba

3. CRITERION NA TINUTUKOY NG MGA SOBRANG HALAGA ISANG VARIANT SA ISANG VARIATION RANGE

2) amplitude

3) pagkakaiba-iba

4) koepisyent ng pagkakaiba-iba

4. ANG PAGKAKAIBA NG MGA SOBRANG OPTION AY

2) amplitude

3) karaniwan karaniwang lihis

4) koepisyent ng pagkakaiba-iba

5. ANG AVERAGE SQUARE NG MGA PAGLILIHIS NG INDIVIDUAL NA HALAGA NG TAUHAN MULA SA AVERAGE NA HALAGA NITO AY

1) koepisyent ng oscillation

2) panggitna

3) pagkakaiba-iba

6. KAUGNAYAN NG BILIS NG VARIATION SA AVERAGE NA VALUE NG SIGNAL AY

1) koepisyent ng pagkakaiba-iba

2) karaniwang paglihis

4) koepisyent ng oscillation

7. ANG RATIO NG AVERAGE SQUARE DEVIATION SA AVERAGE VALUE NG FEATURE AY

1) pagkakaiba-iba

2) koepisyent ng pagkakaiba-iba

3) koepisyent ng oscillation

4) amplitude

8. OPTION, NA NASA GITNA NG VARIATION RANGE AT HINATI ITO SA DALAWANG PANTAY NA BAHAGI - ITO

1) panggitna

3) amplitude

9. SA MEDIKAL NA PANANALIKSIK, KAPAG NAGTATAG NG KUMPIDENSYAL NA MGA HANGGANAN NG ANUMANG INDICATOR, ANG PROBABILIDAD NG WALANG ERROR na PAGTATAYA AY TINANGGAP

10. KUNG 90 NA MGA SAMPLE SA 100 ANG NAGBIBIGAY NG TAMANG TANTA NG PARAMETER SA PANGKALAHATANG KABUUAN, IBIG SABIHIN NITO ANG ISANG PAGTITIWALA P PANTAY

11. KUNG KUNG 10 SAMPLE SA 100 ANG MAGBIGAY NG MALING PAGTAYA, ANG PROBABILIDAD NG ISANG ERROR AY PANTAY.

12. MGA HANGGANAN NG AVERAGE O KAUGNAY NA MGA HALAGA, SA LABAS NA DAHIL SA RANDOM VIBRATION AY MAY HINDI MAHALAGANG PROBABILIDAD AY

1) agwat ng kumpiyansa

2) amplitude

4) koepisyent ng pagkakaiba-iba

13. ISANG MALIIT NA SAMPLE AY ANG KOLEKSIYON NA KUNG SAAN

1) ang n ay mas mababa sa o katumbas ng 100

2) ang n ay mas mababa sa o katumbas ng 30

3) ang n ay mas mababa sa o katumbas ng 40

4) n ay malapit sa 0

14. PARA SA 95% PROBABILIDAD NG ERROR-FREE FORECASTING CRITERION VALUE t GINAWA

15. PARA SA 99% PROBABILITY NG WALANG ERROR-FRECAST VALUE CRITERION t GINAWA

16. PARA SA MGA DISTRIBUTION NA MALAPIT SA NORMAL, ANG KOLEKSIYON AY Itinuturing na uniporme MALIBAN KUNG ANG VARIATION COEFFICIENT AY HINDI HIGIT SA

17. VARIANT SEPARATING OPTIONS NA HINDI HIGIT SA 25% NG MAXIMUM POSSIBLE SA RANGE NA ITO AY

2) mas mababang quartile

3) upper quartile

4) quartile

18. MGA DATOS NA HINDI NAGBABALIK AT TAMA NA NAGSASALIN ANG LAYUNIN NA REALIDAD AY TINATAWAG

1) imposible

2) pantay na posible

3) maaasahan

4) random

19. AYON SA PANUNTUNAN "THREE SIGMA", NA MAY NORMAL NA DISTRIBUTION NG FEATURE SA MGA LIMITASYON
MATATAGPUAN

1) 68.3% na opsyon

Ang standard deviation ay isang klasikong indicator ng volatility mula sa mga descriptive statistics.

Karaniwang lihis, karaniwang lihis, RMSD, sample na standard deviation (English standard deviation, STD, STDev) - isang napakakaraniwang indicator ng dispersion sa mga deskriptibong istatistika. Pero dahil Ang teknikal na pagsusuri ay katulad ng mga istatistika, ang tagapagpahiwatig na ito ay maaaring (at dapat) gamitin sa teknikal na pagsusuri upang makita ang antas ng pagpapakalat ng presyo ng nasuri na instrumento sa paglipas ng panahon. Ito ay itinalaga ng simbolong Griyego na Sigma "σ".

Salamat kina Karlam Gauss at Pearson sa pagbibigay sa amin ng pagkakataong gamitin ang standard deviation.

Gamit standard deviation sa teknikal na pagsusuri, iikot natin ito Salik ng pagkakalat"v "Indikasyon ng pagkasumpungin“, Pinapanatili ang kahulugan, ngunit binabago ang mga termino.

Ano ang standard deviation

Ngunit bilang karagdagan sa mga intermediate auxiliary na kalkulasyon, ang karaniwang paglihis ay medyo katanggap-tanggap para sa pagkalkula sa sarili at mga aplikasyon sa teknikal na pagsusuri. Tulad ng sinabi ng isang masugid na mambabasa ng aming burdock magazine, " Hindi ko pa rin maintindihan kung bakit hindi kasama ang RMS sa hanay ng mga karaniwang indicator ng mga domestic dealing center«.

Talaga, masusukat ng standard deviation ang pagkasumpungin ng instrumento sa klasikal at "puro" na paraan... Sa kasamaang palad, ang tagapagpahiwatig na ito ay hindi pangkaraniwan sa pagsusuri ng mga mahalagang papel.

Paglalapat ng standard deviation

Ang manu-manong pagkalkula ng standard deviation ay hindi masyadong interesante ngunit kapaki-pakinabang para sa karanasan. Maaaring ipahayag ang karaniwang paglihis sa pamamagitan ng formula STD = √ [(∑ (xx) 2) / n], na parang ugat ng kabuuan ng mga parisukat ng mga pagkakaiba sa pagitan ng mga item sa sample at ng mean na hinati sa bilang ng mga item sa sample .

Kung ang bilang ng mga elemento sa sample ay lumampas sa 30, kung gayon ang denominator ng fraction sa ilalim ng ugat ay kukuha ng halaga n-1. Kung hindi, n ay ginagamit.

Hakbang-hakbang pagkalkula ng standard deviation:

  1. kalkulahin ang arithmetic mean ng sample ng data
  2. ibawas ang average na ito sa bawat elemento ng sample
  3. ang lahat ng mga resultang pagkakaiba ay parisukat
  4. buuin ang lahat ng resultang mga parisukat
  5. hatiin ang resultang kabuuan sa bilang ng mga elemento sa sample (o sa n-1, kung n> 30)
  6. kalkulahin ang square root ng nagresultang quotient (tinatawag na pagkakaiba-iba)

Ang pinakaperpektong katangian ng variation ay ang standard deviation, na tinatawag na standard (o standard deviation). Karaniwang lihis() ay katumbas ng square root ng mean square ng mga deviations ng mga indibidwal na halaga ng feature mula sa arithmetic mean:

Ang karaniwang paglihis ay simple:

Ginagamit ang weighted standard deviation para sa pinagsama-samang data:

Sa pagitan ng mean square at standard linear deviations sa ilalim ng normal na kondisyon ng distribution, ang sumusunod na relasyon ay nagaganap: ~ 1.25.

Ang karaniwang paglihis, bilang pangunahing ganap na sukatan ng pagkakaiba-iba, ay ginagamit upang matukoy ang mga halaga ng mga ordinate ng normal na curve ng pamamahagi, sa mga kalkulasyon na nauugnay sa pag-aayos ng sample na pagmamasid at pagtatatag ng katumpakan ng mga katangian ng sample, pati na rin kapag tinatasa ang mga hangganan ng pagkakaiba-iba ng isang tampok sa isang homogenous na populasyon.

Ang pagpapakalat, mga uri nito, karaniwang paglihis.

Pagkakaiba-iba ng isang random na variable- isang sukatan ng pagkalat ng isang naibigay na random na variable, ibig sabihin, ang paglihis nito mula sa inaasahan sa matematika. Sa mga istatistika, ang pagtatalaga o ay kadalasang ginagamit. Kuwadrado na ugat ng pagkakaiba ay tinatawag na standard deviation, standard deviation, o standard deviation.

Kabuuang pagkakaiba (σ 2) sinusukat ang pagkakaiba-iba ng isang katangian sa pinagsama-samang sa ilalim ng impluwensya ng lahat ng mga salik na naging sanhi ng pagkakaiba-iba na ito. Kasabay nito, salamat sa paraan ng pagpapangkat, posibleng ihiwalay at sukatin ang pagkakaiba-iba dahil sa katangian ng pagpapangkat at ang pagkakaiba-iba na nagmumula sa ilalim ng impluwensya ng hindi natukoy na mga kadahilanan.

pagkakaiba-iba sa pagitan ng pangkat (σ 2 mg) ay nagpapakilala sa sistematikong pagkakaiba-iba, ibig sabihin, mga pagkakaiba sa halaga ng katangiang pinag-aaralan na lumitaw sa ilalim ng impluwensya ng isang katangian - isang salik na pinagbabatayan ng pagpapangkat.

Karaniwang lihis(kasingkahulugan: standard deviation, standard deviation, square deviation; katulad na termino: standard deviation, standard spread) - sa probability theory at statistics, ang pinakakaraniwang indicator ng dispersion ng mga value ng random variable na nauugnay sa matematikal na inaasahan nito. Sa limitadong array ng mga sample ng mga value, sa halip na ang mathematical expectation, ang arithmetic mean ng populasyon ng mga sample ang ginagamit.

Ang karaniwang paglihis ay sinusukat sa mga yunit ng pagsukat ng random na variable mismo at ginagamit upang kalkulahin ang karaniwang error ng arithmetic mean, kapag bumubuo ng mga agwat ng kumpiyansa, kapag sinusukat ng istatistika ang mga hypotheses, kapag sinusukat ang linear na relasyon sa pagitan mga random na variable... Tinukoy bilang square root ng variance ng random variable.


Karaniwang lihis:

Karaniwang lihis(pagtantiya ng karaniwang paglihis ng isang random na variable x kaugnay sa inaasahan sa matematika nito batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba nito):

nasaan ang pagkakaiba; - i ika elemento ng sample; - laki ng sample; - arithmetic mean ng sample:

Dapat tandaan na ang parehong mga pagtatantya ay may kinikilingan. V pangkalahatang kaso imposibleng bumuo ng walang pinapanigan na pagtatantya. Gayunpaman, ang pagtatantya batay sa pagtatantya ng walang pinapanigan na pagkakaiba ay pare-pareho.

Kakanyahan, saklaw at pamamaraan para sa pagtukoy ng mode at median.

Bilang karagdagan sa mga average ng power-law sa mga istatistika para sa mga kaugnay na katangian ng laki ng iba't ibang katangian at panloob na istraktura Ang mga serye ng pamamahagi ay gumagamit ng mga istrukturang average, na pangunahing kinakatawan fashion at median.

Fashion- ito ang pinakakaraniwang variant ng row. Ang fashion ay ginagamit, halimbawa, sa pagtukoy ng laki ng mga damit, sapatos, na nasa pinakamalaking demand sa mga customer. Ang mode para sa discrete series ay ang may pinakamataas na frequency. Kapag kinakalkula ang mode para sa serye ng pagkakaiba-iba ng agwat, kailangan munang matukoy ang agwat ng modal (sa pamamagitan ng maximum na dalas), at pagkatapos - ang halaga ng halaga ng modal ng tampok ayon sa formula:

- - halaga ng fashion

- - ang lower bound ng modal interval

- - ang halaga ng pagitan

- - ang dalas ng modal interval

- ay ang dalas ng pagitan bago ang modal

- ay ang dalas ng agwat kasunod ng modal

Median - ito ang halaga ng katangian, na sumasailalim sa ranggo na serye at hinahati ang seryeng ito sa dalawang magkapantay na bahagi.

Upang matukoy ang median sa isang discrete na serye sa pagkakaroon ng mga frequency, kalkulahin muna ang kalahating kabuuan ng mga frequency, at pagkatapos ay tukuyin kung anong halaga ng variant ang nahuhulog dito. (Kung ang pinagsunod-sunod na serye ay naglalaman ng kakaibang bilang ng mga feature, ang median na numero ay kinakalkula ng formula:

M e = (n (bilang ng mga tampok sa pinagsama-samang) + 1) / 2,

sa kaso ng pantay na bilang ng mga feature, ang median ay magiging katumbas ng average ng dalawang feature sa gitna ng row).

Kapag nagkalkula median para sa isang serye ng pagkakaiba-iba ng pagitan, tukuyin muna ang median na pagitan kung saan matatagpuan ang median, at pagkatapos ay ang median na halaga gamit ang formula:

- - ang kinakailangang median

- - ang lower bound ng interval na naglalaman ng median

- - ang halaga ng pagitan

- - ang kabuuan ng mga frequency o ang bilang ng mga miyembro ng serye

Ang kabuuan ng mga naipon na frequency ng mga pagitan bago ang median

- - dalas ng median na pagitan

Halimbawa... Maghanap ng fashion at median.

Solusyon:
V halimbawang ito ang modal interval ay nasa loob ng pangkat ng edad na 25-30 taon, dahil ang interval na ito ay may pinakamataas na frequency (1054).

Kalkulahin natin ang magnitude ng mode:

Nangangahulugan ito na ang modal age ng mga mag-aaral ay 27 taon.

Kinakalkula namin ang median... Ang median interval ay nasa pangkat ng edad na 25-30 taon, dahil sa loob ng agwat na ito mayroong isang variant na naghahati sa populasyon sa dalawang pantay na bahagi (Σf i / 2 = 3462/2 = 1731). Susunod, pinapalitan namin ang kinakailangang numerical data sa formula at makuha ang median na halaga:

Nangangahulugan ito na ang kalahati ng mga mag-aaral ay wala pang 27.4 taong gulang, at ang isa ay higit sa 27.4 taong gulang.

Bilang karagdagan sa mode at median, maaaring gamitin ang mga indicator tulad ng mga quartile na naghahati sa ranggo na serye sa 4 na pantay na bahagi, decile- 10 bahagi at porsyento - bawat 100 bahagi.

Ang konsepto ng selective observation at saklaw nito.

Selective observation nalalapat kapag ang aplikasyon ng patuloy na pagsubaybay pisikal na imposible dahil sa malaking halaga ng data, o hindi praktikal sa ekonomiya... Ang pisikal na imposibilidad ay nangyayari, halimbawa, kapag pinag-aaralan ang mga daloy ng pasahero, mga presyo sa merkado, mga badyet ng pamilya. Ang kawalan ng kakayahang pang-ekonomiya ay nangyayari kapag tinatasa ang kalidad ng mga kalakal na nauugnay sa kanilang pagkasira, halimbawa, pagtikim, pagsubok ng mga brick para sa lakas, atbp.

Ang mga istatistikal na yunit na pinili para sa pagmamasid ay bumubuo ng isang sample na populasyon o sample, at ang kanilang buong hanay - ang pangkalahatang populasyon (HS). Sa kasong ito, ang bilang ng mga yunit sa sample ay nagpapahiwatig n, at sa buong HS - N... Saloobin n / N tinatawag na relatibong laki o fraction ng sample.

Ang kalidad ng mga resulta ng obserbasyon ng sample ay nakasalalay sa pagiging kinatawan ng sample, iyon ay, kung gaano ito kinatawan sa HS. Upang matiyak ang pagiging kinatawan ng sample, kinakailangan na obserbahan random na pagpili ng mga yunit, na ipinapalagay na ang pagsasama ng isang unit ng HS sa sample ay hindi maaaring maimpluwensyahan ng anumang kadahilanan maliban sa kaso.

Umiiral 4 na paraan upang random na pumili sa sample:

  1. Talagang random pagpili o "paraan ng lotto", kapag ang mga istatistikal na dami ay itinalaga ng mga serial number, naitala sa ilang partikular na item (halimbawa, mga bariles), na pagkatapos ay ihalo sa isang lalagyan (halimbawa, sa isang bag) at pinili nang random. Sa pagsasagawa, ang pamamaraang ito ay isinasagawa gamit ang isang generator random na mga numero o mga mathematical table ng mga random na numero.
  2. Mekanikal pagpili, ayon sa kung saan ang bawat ( N / n) -ang halaga ng pangkalahatang populasyon. Halimbawa, kung naglalaman ito ng 100,000 value, at gusto mong pumili ng 1,000, isasama sa sample ang bawat 100,000 / 1000 = 100th value. Bukod dito, kung hindi sila niraranggo, ang una ay pinili nang random mula sa unang daan, at ang mga bilang ng iba ay magiging isang daan pa. Halimbawa, kung ang unit # 19 ay naging una, ang susunod ay dapat na # 119, pagkatapos ay # 219, pagkatapos ay # 319, at iba pa. Kung ang mga yunit ng pangkalahatang populasyon ay niraranggo, pagkatapos ay # 50 ang pipiliin muna, pagkatapos ay # 150, pagkatapos ay # 250, at iba pa.
  3. Ang pagpili ng mga halaga mula sa isang heterogenous na set ng data ay isinasagawa pinagsasapin-sapin(stratified) na paraan, kapag ang pangkalahatang populasyon ay paunang nahahati sa mga homogenous na grupo, kung saan inilalapat ang random o mekanikal na pagpili.
  4. Ang isang espesyal na paraan ng sampling ay serye pagpili, kung saan hindi indibidwal na dami ang random o mekanikal na pinili, ngunit ang kanilang mga serye (mga pagkakasunud-sunod mula sa ilang numero hanggang sa ilang sunod-sunod), kung saan isinasagawa ang patuloy na pagmamasid.

Ang kalidad ng mga sample na obserbasyon ay nakasalalay din sa uri ng sample: paulit-ulit o hindi nauulit.

Sa muling pagpili Ang mga istatistikal na dami na nakapasok sa sample o sa kanilang serye pagkatapos gamitin ay ibinabalik sa pangkalahatang populasyon, na may pagkakataong makapasok sa isang bagong sample. Bukod dito, ang lahat ng mga halaga ng pangkalahatang populasyon ay may parehong posibilidad na maisama sa sample.

Hindi paulit-ulit na pagpili nangangahulugan na ang mga istatistikal na dami na kasama sa sample o sa kanilang mga serye pagkatapos gamitin ay hindi ibinalik sa pangkalahatang populasyon, at samakatuwid, para sa natitirang mga dami ng huli, ang posibilidad na mahulog sa susunod na sample ay tumataas.

Ang paulit-ulit na sampling ay nagbibigay ng mas tumpak na mga resulta, samakatuwid ito ay ginagamit nang mas madalas. Ngunit may mga sitwasyon na hindi ito mailalapat (pag-aaral ng mga daloy ng pasahero, demand ng mga mamimili, atbp.) at pagkatapos ay isinasagawa ang muling pagpili.

Marginal sampling error ng pagmamasid, average sampling error, ang pagkakasunud-sunod ng kanilang pagkalkula.

Isaalang-alang natin nang detalyado ang mga pamamaraan sa itaas ng pagbuo ng sample na populasyon at ang mga pagkakamali na lumitaw sa kasong ito. pagiging kinatawan .
Talagang random ang sample ay batay sa isang random na pagpili ng mga yunit mula sa pangkalahatang populasyon nang walang anumang sistematikong elemento. Sa teknikal na paraan, ang wastong random na pagpili ay isinasagawa sa pamamagitan ng pagguhit ng mga lot (halimbawa, mga draw sa lottery) o ayon sa isang talahanayan ng mga random na numero.

Sa totoo lang, ang random na pagpili "sa dalisay nitong anyo" ay bihirang ginagamit sa pagsasanay ng pumipili na pagmamasid, ngunit ito ang paunang isa sa iba pang mga uri ng pagpili, ipinapatupad nito ang mga pangunahing prinsipyo ng pumipili na pagmamasid. Isaalang-alang natin ang ilang mga katanungan ng teorya ng paraan ng sampling at ang formula ng error para sa isang simpleng random na sample.

Sample na obserbasyon error ay ang pagkakaiba sa pagitan ng halaga ng parameter sa pangkalahatang populasyon, at ang halaga nito na kinakalkula mula sa mga resulta ng sample na pagmamasid. Para sa isang average na quantitative na katangian, ang sampling error ay tinutukoy

Ang tagapagpahiwatig ay tinatawag na marginal sampling error.
Ang sample mean ay isang random na variable na maaaring tumagal iba't ibang kahulugan depende sa kung aling mga unit ang kasama sa sample. Samakatuwid, ang mga error sa sampling ay mga random na halaga din at maaaring tumagal sa iba't ibang mga halaga. Samakatuwid, ang average ng posibleng pagkakamali - ibig sabihin ng sampling error na nakasalalay sa:

Laki ng sample: mas malaki ang numero, mas mababa ang halaga ng average na error;

Ang antas ng pagbabago ng katangiang pinag-aaralan: mas maliit ang pagkakaiba ng katangian, at, dahil dito, ang pagkakaiba, mas maliit ang average na error sa sampling.

Sa random na muling pagpili ang ibig sabihin ng error ay kinakalkula:
.
Sa pagsasagawa, ang pangkalahatang pagkakaiba ay hindi alam nang eksakto, ngunit sa teorya ng posibilidad napatunayan na
.
Dahil ang halaga para sa sapat na malaking n ay malapit sa 1, maaari nating ipagpalagay na. Pagkatapos ay maaaring kalkulahin ang mean sampling error:
.
Ngunit sa mga kaso ng isang maliit na sample (para sa n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Sa random na di-replicate na sample ang mga ibinigay na formula ay itinatama ng halaga. Kung gayon ang ibig sabihin ng hindi paulit-ulit na sampling error ay:
at .
kasi ay palaging mas mababa, pagkatapos ang multiplier () ay palaging mas mababa sa 1. Nangangahulugan ito na ang average na error sa hindi paulit-ulit na pagpili ay palaging mas mababa kaysa sa paulit-ulit na pagpili.
Mechanical sampling ito ay ginagamit kapag ang pangkalahatang populasyon ay inayos sa ilang paraan (halimbawa, mga alpabetikong listahan ng mga botante, mga numero ng telepono, mga numero ng mga bahay, mga apartment). Ang pagpili ng mga yunit ay isinasagawa sa isang tiyak na agwat, na katumbas ng katumbas ng porsyento ng sample. Kaya, na may 2% sample, ang bawat 50 unit = 1 / 0.02 ay pinili, na may 5% bawat 1 / 0.05 = 20 unit ng pangkalahatang populasyon.

Ang reference point ay pinili sa iba't ibang paraan: random, mula sa gitna ng interval, na may pagbabago sa reference point. Ang pangunahing bagay dito ay upang maiwasan ang sistematikong pagkakamali. Halimbawa, na may 5% sample, kung ang unang unit ay 13, pagkatapos ay ang susunod na 33, 53, 73, atbp.

Sa mga tuntunin ng katumpakan, ang mekanikal na pagpili ay malapit sa random sampling mismo. Samakatuwid, upang matukoy ang average na error ng mechanical sampling, ang mga formula ng tamang random na pagpili ay ginagamit.

Sa tipikal na seleksyon ang na-survey na populasyon ay paunang nahahati sa magkakatulad na mga grupo ng parehong uri. Halimbawa, kapag nagsusuri ng mga negosyo, ang mga ito ay maaaring mga industriya, mga sub-sektor; kapag pinag-aaralan ang populasyon, ito ay maaaring mga rehiyon, panlipunan o mga pangkat ng edad. Pagkatapos, ang isang independiyenteng pagpili ay ginawa mula sa bawat pangkat, alinman sa mekanikal o sa isang random na paraan.

Ang karaniwang sampling ay nagbibigay ng mas tumpak na mga resulta kaysa sa iba pang mga pamamaraan. Ang pag-type ng pangkalahatang populasyon ay nagsisiguro na ang bawat typological na pangkat ay kinakatawan sa sample, na ginagawang posible na ibukod ang impluwensya ng pagkakaiba-iba ng intergroup sa mean sampling error. Dahil dito, kapag hinahanap ang error ng isang tipikal na sample ayon sa panuntunan para sa pagdaragdag ng mga pagkakaiba-iba (), kinakailangang isaalang-alang lamang ang average ng mga pagkakaiba-iba ng pangkat. Pagkatapos ang average na sampling error:
sa muling pagpili
,
na walang muling pagpili
,
saan ay ang average ng mga pagkakaiba-iba sa loob ng pangkat sa sample.

Serial (o nested) na seleksyon nalalapat sa kaso kapag ang pangkalahatang populasyon ay nahahati sa mga serye o mga grupo bago magsimula ang sample na survey. Ang mga seryeng ito ay maaaring packaging ng mga natapos na produkto, mga grupo ng mag-aaral, mga brigada. Ang mga serye para sa survey ay pinili nang mekanikal o sa isang purong random na paraan, at sa loob ng serye, isang tuluy-tuloy na survey ng mga yunit ay isinasagawa. Samakatuwid, ang mean sampling error ay nakasalalay lamang sa intergroup (inter-series) variance, na kinakalkula ng formula:

kung saan ang r ay ang bilang ng napiling serye;
- average ng i-th series.

Ang average na serial sampling error ay kinakalkula:

sa muling pagpili:
,
na may hindi paulit-ulit na pagpili:
,
kung saan ang R ay ang kabuuang bilang ng mga serye.

pinagsama-sama pagpili ay isang kumbinasyon ng mga itinuturing na paraan ng pagpili.

Ang average na error sa pag-sample para sa anumang paraan ng pagpili ay higit sa lahat ay nakasalalay sa ganap na laki ng sample at, sa mas mababang lawak, sa porsyento ng sample. Ipagpalagay na 225 obserbasyon ay isinasagawa sa unang kaso mula sa isang pangkalahatang populasyon na 4500 mga yunit at sa pangalawa mula sa 225000 mga yunit. Ang mga pagkakaiba sa parehong mga kaso ay katumbas ng 25. Pagkatapos, sa unang kaso, na may 5% sampling, ang sampling error ay magiging:

Sa pangalawang kaso, na may 0.1% na pagpili, ito ay magiging katumbas ng:


Sa gayon, na may pagbaba sa porsyento ng sample ng 50 beses, ang sampling error ay tumaas nang hindi gaanong mahalaga, dahil ang laki ng sample ay hindi nagbago.
Ipagpalagay na ang laki ng sample ay nadagdagan sa 625 na mga obserbasyon. Sa kasong ito, ang sampling error ay:

Ang pagtaas sa sample ng isang factor na 2.8 na may parehong laki ng pangkalahatang populasyon ay binabawasan ang laki ng error sa sampling ng higit sa 1.6 na beses.

Mga pamamaraan at paraan ng pagbuo ng sample.

Sa mga istatistika, ginagamit ang iba't ibang paraan ng pagbuo ng mga sample set, na tinutukoy ng mga layunin ng pananaliksik at nakasalalay sa mga detalye ng object ng pag-aaral.

Ang pangunahing kondisyon para sa pagsasagawa ng sample na survey ay upang maiwasan ang paglitaw ng mga sistematikong pagkakamali na nagmumula sa paglabag sa prinsipyo ng pantay na pagkakataon para sa bawat yunit ng pangkalahatang populasyon na maisama sa sample. Ang pag-iwas sa mga sistematikong pagkakamali ay nakakamit bilang isang resulta ng paggamit ng mga pamamaraang nakabatay sa siyentipikong pagbubuo ng isang sample na populasyon.

Mayroong mga sumusunod na paraan upang pumili ng mga yunit mula sa pangkalahatang populasyon:

1) indibidwal na pagpili - ang mga indibidwal na yunit ay pinili sa sample;

2) pagpili ng grupo - ang mga qualitatively homogenous na mga grupo o serye ng mga pinag-aralan na yunit ay nahulog sa sample;

3) pinagsamang pagpili ay isang kumbinasyon ng indibidwal at pangkat na pagpili.
Ang mga paraan ng pagpili ay tinutukoy ng mga patakaran para sa pagbuo ng sample na populasyon.

Ang sample ay maaaring:

  • tamang aksidente ay binubuo sa katotohanan na ang sample na populasyon ay nabuo bilang isang resulta ng isang random (hindi sinasadya) na pagpili ng mga indibidwal na yunit mula sa pangkalahatang populasyon. Sa kasong ito, ang bilang ng mga yunit na napili para sa sample na populasyon ay karaniwang tinutukoy batay sa tinatanggap na proporsyon ng sample. Ang proporsyon ng sample ay ang ratio ng bilang ng mga yunit sa sample n sa bilang ng mga yunit sa pangkalahatang populasyon N, i.e.
  • mekanikal binubuo sa katotohanan na ang pagpili ng mga yunit sa sample na populasyon ay ginawa mula sa pangkalahatang populasyon, na nahahati sa pantay na pagitan (mga grupo). Bukod dito, ang laki ng pagitan sa pangkalahatang populasyon ay katumbas ng kapalit ng proporsyon ng sample. Kaya, na may 2% sample, bawat ika-50 na unit (1: 0.02) ay pinipili, na may 5% na sample, bawat ika-20 na unit (1: 0.05), atbp. Kaya, alinsunod sa tinatanggap na bahagi ng pagpili, ang pangkalahatang populasyon ay, bilang ito ay, mekanikal na nahahati sa mga grupo ng pantay na laki. Isang unit lamang ang pipiliin mula sa bawat pangkat.
  • tipikal - kung saan ang pangkalahatang populasyon ay unang nahahati sa homogenous na tipikal na mga grupo. Pagkatapos, mula sa bawat karaniwang pangkat, sa pamamagitan ng wastong random o mekanikal na sampling, isang indibidwal na seleksyon ng mga yunit ang ginawa sa sample na populasyon. Ang isang mahalagang katangian ng tipikal na sample ay ang pagbibigay nito ng mas tumpak na mga resulta kumpara sa iba pang mga paraan ng pagpili ng mga yunit sa sample;
  • serye- kung saan ang pangkalahatang populasyon ay nahahati sa mga grupo ng parehong laki - serye. Pinili ang mga serye para sa sample. Sa loob ng serye, isinasagawa ang patuloy na pagmamasid sa mga yunit na kasama sa serye;
  • pinagsama-sama- ang sample ay maaaring dalawang yugto. Sa kasong ito, ang pangkalahatang populasyon ay nahahati muna sa mga grupo. Pagkatapos ay pipiliin ang mga grupo, at sa loob ng huli, pipiliin ang mga indibidwal na unit.

Sa mga istatistika, ang mga sumusunod na paraan ng pagpili ng mga yunit sa isang sample na populasyon ay nakikilala:

  • iisang yugto sampling - ang bawat napiling unit ay agad na sinusuri ayon sa isang ibinigay na criterion (tamang random at serial sampling);
  • multistage sampling - ang pagpili ay ginawa mula sa pangkalahatang populasyon ng mga indibidwal na grupo, at ang mga indibidwal na yunit ay pinili mula sa mga grupo (karaniwang sampling na may mekanikal na paraan ng pagpili ng mga yunit sa sample na populasyon).

Bilang karagdagan, ang pagkakaiba ay ginawa sa pagitan ng:

  • muling pagpili- ayon sa ibinalik na bola scheme. Bukod dito, ang bawat yunit o serye na nakapasok sa sample ay babalik sa pangkalahatang populasyon at samakatuwid ay may pagkakataong makapasok muli sa sample;
  • hindi paulit-ulit na pagpili- ayon sa pamamaraan ng isang hindi naibalik na bola. Mayroon itong mas tumpak na mga resulta na may parehong laki ng sample.

Pagpapasiya ng kinakailangang laki ng sample (gamit ang talahanayan ng Mag-aaral).

Isa sa mga siyentipikong prinsipyo sa teorya ng sampling ay upang matiyak ang isang sapat na bilang ng mga sample na yunit. Theoretically, ang pangangailangan na sumunod sa prinsipyong ito ay ipinakita sa mga patunay ng limitasyon ng theorems ng probability theory, na ginagawang posible upang maitaguyod kung anong dami ng mga yunit ang dapat piliin mula sa pangkalahatang populasyon upang ito ay maging sapat at upang matiyak ang pagiging kinatawan ng sample.

Ang pagbaba sa karaniwang error ng sample, at, dahil dito, ang pagtaas sa katumpakan ng pagtatantya ay palaging nauugnay sa isang pagtaas sa laki ng sample, samakatuwid, nasa yugto na ng pag-aayos ng isang sample na pagmamasid, kinakailangan na magpasya ang tanong kung ano ang dapat na sukat ng sample na populasyon upang matiyak ang kinakailangang katumpakan ng mga resulta ng pagmamasid. Ang pagkalkula ng kinakailangang laki ng sample ay binuo gamit ang mga formula na nagmula sa mga formula para sa marginal sampling error (A), na tumutugma sa isang partikular na uri at paraan ng pagpili. Kaya, para sa isang random na paulit-ulit na laki ng sample (n) mayroon kaming:

Ang kakanyahan ng formula na ito ay na sa isang random na paulit-ulit na pagpili ng kinakailangang laki, ang laki ng sample ay direktang proporsyonal sa parisukat ng koepisyent ng kumpiyansa. (t2) at ang pagkakaiba-iba ng tampok na variation (? 2) at inversely proportional sa square ng marginal sampling error (? 2). Sa partikular, sa pagdodoble ng marginal error, ang kinakailangang laki ng sample ay maaaring bawasan ng apat na salik. Sa tatlong parameter, dalawa (t at?) ang itinakda ng mananaliksik.

Sa kasong ito, nagpapatuloy ang mananaliksik para sa layunin ng mga layunin ng sample na survey, dapat itong malutas ang tanong: sa anong dami ng kumbinasyon ang mas mahusay na isama ang mga parameter na ito upang matiyak ang pinakamainam na opsyon? Sa isang kaso, maaaring mas nasiyahan siya sa pagiging maaasahan ng mga resulta na nakuha (t) kaysa sa isang sukatan ng katumpakan (?), Sa kabilang banda - sa kabilang banda. Mas mahirap lutasin ang isyu patungkol sa halaga ng marginal sampling error, dahil ang mananaliksik ay walang indicator na ito sa yugto ng disenyo ng sample observation, samakatuwid, sa pagsasagawa, kaugalian na itakda ang marginal sampling error, bilang isang panuntunan, sa loob ng hanggang 10% ng inaasahang average na antas ng feature. Ang pagtatatag ng isang ipinapalagay na average ay maaaring lapitan sa iba't ibang paraan: gamit ang data mula sa mga katulad na nakaraang survey, o paggamit ng data mula sa isang sampling frame at paggawa ng maliit na sample ng pagsubok.

Kapag nagdidisenyo ng sample na obserbasyon, pinakamahirap itatag ang ikatlong parameter sa formula (5.2) - ang pagkakaiba ng sample na populasyon. Sa kasong ito, kinakailangang gamitin ang lahat ng impormasyong magagamit ng mananaliksik, na nakuha sa mga nakaraang katulad at pilot na survey.

Ang tanong ng pagtukoy ang kinakailangang laki ng sample ay kumplikado kung ang sample na survey ay nagsasangkot ng pag-aaral ng ilang mga katangian ng mga sampling unit. Sa kasong ito, ang mga average na antas ng bawat isa sa mga palatandaan at ang kanilang pagkakaiba-iba ay, bilang isang panuntunan, naiiba, at samakatuwid posible na magpasya sa tanong ng pagkakaiba-iba kung alin sa mga palatandaan ang bibigyan ng kagustuhan, isinasaalang-alang lamang ang layunin at layunin ng sarbey.

Kapag nagdidisenyo ng isang sample na pagmamasid, ang isang paunang natukoy na halaga ng pinapayagang sampling error ay ipinapalagay alinsunod sa mga gawain ng isang partikular na pag-aaral at ang posibilidad ng mga konklusyon batay sa mga resulta ng obserbasyon.

Sa pangkalahatan, ginagawang posible ng formula para sa marginal error ng sample mean na matukoy:

Ang dami ng posibleng paglihis ng mga indicator ng pangkalahatang populasyon mula sa mga indicator ng sample na populasyon;

Ang kinakailangang laki ng sample, na nagbibigay ng kinakailangang katumpakan, kung saan ang mga limitasyon ng posibleng error ay hindi lalampas sa isang tiyak na tinukoy na halaga;

Ang posibilidad na ang error sa sample ay magkakaroon ng tinukoy na limitasyon.

Pamamahagi ng t mag-aaral sa probability theory, ito ay isang isang-parameter na pamilya ng ganap na tuluy-tuloy na mga distribusyon.

Serye ng dynamics (interval, moment), pagsasara ng mga row ng dynamics.

Mga hilera ng dynamics- ito ang mga halaga ng mga istatistikal na tagapagpahiwatig, na ipinakita sa isang tiyak na pagkakasunud-sunod na magkakasunod.

Ang bawat serye ng oras ay naglalaman ng dalawang bahagi:

1) mga tagapagpahiwatig ng mga yugto ng panahon (taon, quarters, buwan, araw o petsa);

2) mga tagapagpahiwatig na nagpapakilala sa bagay na pinag-aaralan para sa mga yugto ng panahon o para sa mga kaukulang petsa, na tinatawag na mga antas ng serye.

Ang mga antas ng serye ay ipinahayag parehong absolute at average o relatibong mga halaga. Depende sa likas na katangian ng mga tagapagpahiwatig, ang mga dinamikong serye ng ganap, kamag-anak at average na mga halaga ay binuo. Ang mga serye ng dynamics mula sa mga kamag-anak at average na halaga ay binuo batay sa nagmula na serye ng mga ganap na halaga. Matukoy ang pagkakaiba sa pagitan ng pagitan at sandali ng serye ng mga dinamika.

Mga serye ng dynamic na pagitan naglalaman ng mga halaga ng mga tagapagpahiwatig para sa mga tiyak na tagal ng panahon. Sa serye ng agwat, ang mga antas ay maaaring summed up, pagkuha ng dami ng phenomenon sa mas mahabang panahon, o ang tinatawag na accumulated totals.

Dynamic na serye ng metalikang kuwintas sumasalamin sa mga halaga ng mga tagapagpahiwatig sa isang tiyak na punto ng oras (petsa ng oras). Sa serye ng sandali, maaari lamang maging interesado ang mananaliksik sa pagkakaiba ng mga phenomena, na sumasalamin sa pagbabago sa antas ng serye sa pagitan ng ilang partikular na petsa, dahil ang kabuuan ng mga antas dito ay walang tunay na nilalaman. Ang mga naipon na kabuuan ay hindi kinakalkula dito.

Ang pinakamahalagang kondisyon para sa tamang pagtatayo ng serye ng oras ay ang pagkakahambing ng mga antas ng serye na kabilang sa iba't ibang panahon. Ang mga antas ay dapat ipakita sa magkakatulad na dami, at ang iba't ibang bahagi ng kababalaghan ay dapat na pantay na komprehensibo.

Upang upang maiwasan ang pagbaluktot ng tunay na dinamika, sa istatistikal na pag-aaral ang mga paunang kalkulasyon ay isinasagawa (pagsasara ng serye ng mga dinamika), na nauuna sa istatistikal na pagsusuri ng serye ng oras. Ang pagsasara ng serye ng mga dinamika ay nauunawaan bilang ang pag-iisa ng dalawa o higit pang mga serye sa isang hilera, ang mga antas nito ay kinakalkula ayon sa iba't ibang pamamaraan o hindi tumutugma sa mga hangganan ng teritoryo, atbp. Ang convergence ng serye ng dynamics ay maaari ding magpahiwatig ng pagdadala ng ganap na antas ng serye ng dynamics sa isang karaniwang base, na nag-aalis ng hindi pagkakatulad ng mga antas ng serye ng dynamics.

Ang konsepto ng comparability ng serye ng dynamics, coefficients, growth at growth rate.

Mga hilera ng dynamics- isang serye ng mga istatistikal na tagapagpahiwatig na nagpapakilala sa pag-unlad ng natural at panlipunang mga phenomena sa oras. Ang mga pagsasama-sama ng istatistika na inilathala ng Goskomstat ng Russia ay naglalaman ng isang malaking bilang ng mga serye ng mga dinamika sa anyong tabular. Ginagawang posible ng serye ng mga dinamika na ipakita ang mga pattern ng pag-unlad ng mga phenomena na pinag-aaralan.

Ang serye ng mga dinamika ay naglalaman ng dalawang uri ng mga tagapagpahiwatig. Mga tagapagpahiwatig ng oras(mga taon, quarter, buwan, atbp.) o mga punto sa oras (sa simula ng taon, sa simula ng bawat buwan, atbp.). Mga tagapagpahiwatig ng antas ng hilera... Ang mga tagapagpahiwatig ng mga antas ng serye ng mga dinamika ay maaaring ipahayag sa ganap na mga halaga (produksyon ng isang produkto sa tonelada o rubles), mga kamag-anak na halaga (bahagi ng populasyon ng lunsod sa%) at mga average na halaga (average na sahod ng manggagawa sa industriya ayon sa mga taon, atbp.). Sa tabular form, ang isang dynamic na row ay naglalaman ng dalawang column o dalawang row.

Ang tamang pagtatayo ng serye ng dynamics ay nagsasaad ng katuparan ng isang bilang ng mga kinakailangan:

  1. lahat ng mga tagapagpahiwatig ng isang bilang ng mga dinamika ay dapat na batay sa siyensya, maaasahan;
  2. ang mga tagapagpahiwatig ng isang bilang ng mga dinamika ay dapat na maihahambing sa oras, i.e. dapat kalkulahin para sa parehong mga yugto ng panahon o para sa parehong mga petsa;
  3. ang mga tagapagpahiwatig ng isang bilang ng mga dinamika ay dapat na maihahambing sa buong teritoryo;
  4. ang mga tagapagpahiwatig ng isang bilang ng mga dinamika ay dapat na maihahambing sa nilalaman, i.e. kinakalkula ayon sa isang pinag-isang pamamaraan, sa parehong paraan;
  5. ang mga tagapagpahiwatig ng isang bilang ng mga dinamika ay dapat na maihambing sa hanay ng mga itinuturing na sakahan. Ang lahat ng mga tagapagpahiwatig ng isang bilang ng mga dinamika ay dapat ibigay sa parehong mga yunit ng pagsukat.

Mga tagapagpahiwatig ng istatistika maaaring makilala ang alinman sa mga resulta ng prosesong pinag-aaralan sa loob ng isang yugto ng panahon, o ang estado ng hindi pangkaraniwang bagay na pinag-aaralan sa isang tiyak na punto ng panahon, i.e. Ang mga tagapagpahiwatig ay maaaring agwat (pana-panahon) at panandalian. Alinsunod dito, ang paunang serye ng mga dinamika ay maaaring alinman sa pagitan o panandalian. Ang panandaliang serye ng dynamics, sa turn, ay maaaring may pantay at hindi pantay na agwat ng oras.

Ang orihinal na serye ng mga dinamika ay maaaring mabago sa isang serye ng mga average na halaga at isang serye ng mga kamag-anak na halaga (chain at basic). Ang nasabing serye ng mga dinamika ay tinatawag na nagmula na serye ng mga dinamika.

Ang pamamaraan para sa pagkalkula ng average na antas sa serye ng dynamics ay iba, dahil sa uri ng serye ng dynamics. Gamit ang mga halimbawa, isasaalang-alang namin ang mga uri ng serye ng mga dinamika at mga formula para sa pagkalkula ng average na antas.

Ganap na mga nadagdag (Δy) ipakita kung gaano karaming mga yunit ang nabago sa susunod na antas ng serye kumpara sa nauna (hanay 3. - chain absolute increments) o kung ihahambing sa unang antas (column 4. - basic absolute increments). Ang mga formula ng pagkalkula ay maaaring isulat bilang mga sumusunod:

Sa isang pagbawas sa ganap na mga halaga ng serye, magkakaroon, ayon sa pagkakabanggit, "pagbaba", "pagbaba".

Ang mga indeks ng ganap na paglago ay nagpapahiwatig na, halimbawa, noong 1998 ang produksyon ng produkto na "A" ay tumaas ng 4 na libong tonelada kumpara noong 1997, at sa pamamagitan ng 34 na libong tonelada kumpara noong 1994; para sa natitirang mga taon tingnan ang talahanayan. 11.5 g 3 at 4.

Rate ng paglago ipinapakita kung gaano karaming beses na nagbago ang antas ng serye kumpara sa nauna (column 5 - chain growth o decline coefficients) o kumpara sa unang level (column 6 - basic growth o decline coefficients). Ang mga formula ng pagkalkula ay maaaring isulat bilang mga sumusunod:

Mga rate ng paglago ipakita kung gaano karaming porsyento ang susunod na antas ng serye kung ihahambing sa nauna (kolumna 7 - mga rate ng paglago ng chain) o kung ihahambing sa paunang antas (kolumna 8 - mga pangunahing rate ng paglago). Ang mga formula ng pagkalkula ay maaaring isulat bilang mga sumusunod:

Kaya, halimbawa, noong 1997 ang dami ng paggawa ng produkto na "A" kumpara sa 1996 ay umabot sa 105.5% (

Rate ng paglago ipakita kung gaano karaming porsyento ang pagtaas ng antas ng panahon ng pag-uulat kumpara sa nauna (kolumna 9 - mga rate ng paglago ng chain) o kung ihahambing sa paunang antas (kolumna 10 - mga pangunahing rate ng paglago). Ang mga formula ng pagkalkula ay maaaring isulat bilang mga sumusunod:

T pr = T p - 100% o T pr = ganap na pagtaas / antas ng nakaraang panahon * 100%

Kaya, halimbawa, noong 1996, kumpara noong 1995, ang produktong "A" ay ginawa ng 3.8% (103.8% - 100%) o (8: 210) x 100%, at kumpara noong 1994 - ng 9% (109% - 100%).

Kung ang mga ganap na antas sa isang hilera ay bababa, ang rate ay magiging mas mababa sa 100% at, nang naaayon, magkakaroon ng isang rate ng pagtanggi (rate ng paglago na may minus sign).

Ganap na halaga ng 1% na nakuha(column 11) ay nagpapakita kung gaano karaming mga yunit ang dapat gawin sa isang partikular na panahon upang ang antas ng nakaraang panahon ay tumaas ng 1%. Sa aming halimbawa, noong 1995 kinakailangan na gumawa ng 2.0 libong tonelada, at noong 1998 - 2.3 libong tonelada, i.e. mas malaki.

Mayroong dalawang paraan upang matukoy ang laki ng ganap na halaga ng isang 1% na pagtaas:

Hatiin ang antas ng nakaraang panahon ng 100;

Hatiin ang mga absolute increment ng chain sa mga katumbas na rate ng paglago ng chain.

Ganap na halaga ng 1% na nakuha =

Sa dinamika, lalo na sa mahabang panahon, mahalaga ang pinagsamang pagsusuri ng mga rate ng paglago kasama ang nilalaman ng bawat porsyento ng pagtaas o pagbaba.

Tandaan na ang isinasaalang-alang na paraan ng pagsusuri sa serye ng mga dinamika ay naaangkop kapwa para sa serye ng mga dinamika, ang mga antas ng kung saan ay ipinahayag sa mga ganap na halaga (t, libong rubles, ang bilang ng mga empleyado, atbp.), At para sa serye ng dinamika, ang mga antas nito ay ipinahayag ng mga kamag-anak na tagapagpahiwatig (% ng scrap ,% ng nilalaman ng abo ng karbon, atbp.) o mga average na halaga (average na ani sa centners / ha, average na sahod, atbp.).

Kasama ang mga analytical indicator na isinasaalang-alang, na kinakalkula para sa bawat taon kumpara sa nauna o paunang antas, kapag sinusuri ang serye ng mga dinamika, kinakailangang kalkulahin ang average na analytical indicator para sa panahon: ang average na antas ng serye, ang average na taunang ganap na pagtaas (pagbaba) at ang average na taunang rate ng paglago at rate ng paglago.

Ang mga pamamaraan para sa pagkalkula ng average na antas ng isang serye ng mga dinamika ay tinalakay sa itaas. Sa pagitan ng serye ng dynamics na aming isinasaalang-alang, ang average na antas ng serye ay kinakalkula gamit ang simpleng arithmetic mean formula:

Average na taunang produksyon ng isang produkto para sa 1994-1998 umabot sa 218.4 libong tonelada.

Ang average na taunang ganap na paglago ay kinakalkula din gamit ang simpleng arithmetic mean formula:

Ang taunang ganap na mga pagtaas ay nag-iba sa mga taon mula 4 hanggang 12 libong tonelada (tingnan ang column 3), at ang average na taunang pagtaas ng produksyon para sa panahon ng 1995 - 1998. umabot sa 8.5 libong tonelada.

Ang mga pamamaraan para sa pagkalkula ng average na rate ng paglago at average na rate ng paglago ay nangangailangan ng mas detalyadong pagsasaalang-alang. Isaalang-alang natin ang mga ito gamit ang halimbawa ng taunang mga tagapagpahiwatig ng antas ng serye na ipinapakita sa talahanayan.

Ang average na antas ng isang bilang ng mga dynamics.

Isang serye ng mga dinamika (o serye ng oras) ay ang mga numerical na halaga ng isang partikular na istatistika sa magkakasunod na sandali o yugto ng panahon (ibig sabihin, nakaayos ayon sa pagkakasunod-sunod ng mga pangyayari).

Ang mga numerical na halaga ng isa o isa pang istatistikal na tagapagpahiwatig na bumubuo sa isang serye ng mga dinamika ay tinatawag mga antas ng at karaniwang tinutukoy ng titik y... Unang miyembro ng serye y 1 tinatawag na inisyal o baseline at ang huli y n - ang pangwakas... Ang mga sandali o tagal ng panahon kung saan ang mga antas ay tinutukoy t.

Ang serye ng mga dinamika, bilang panuntunan, ay ipinakita sa anyo ng isang talahanayan o graph, at ang sukat ng oras ay naka-plot kasama ang abscissa axis t, at sa ordinate - ang sukat ng mga antas ng serye y.

Mga average na tagapagpahiwatig ng isang bilang ng mga dinamika

Ang bawat hilera ng dynamics ay maaaring tingnan bilang isang uri ng pinagsama-samang n mga tagapagpahiwatig ng pagkakaiba-iba ng oras na maaaring ibuod bilang mga average. Ang mga naturang pangkalahatan (average) na mga tagapagpahiwatig ay kinakailangan lalo na kapag inihahambing ang mga pagbabago sa isang partikular na tagapagpahiwatig sa iba't ibang mga panahon, sa iba't ibang mga bansa, atbp.

Ang isang pangkalahatang katangian ng isang bilang ng mga dinamika ay maaaring pangunahin gitnang antas ng hilera... Ang paraan ng pagkalkula ng average na antas ay depende sa kung ito ay isang serye ng sandali o isang serye ng pagitan (panahon).

Kailan pagitan ng serye, ang average na antas nito ay tinutukoy ng formula ng isang simpleng arithmetic mean mula sa mga antas ng serye, i.e.

=
Kung meron sandali hilera na naglalaman ng n antas ( y1, y2,…, yn) na may pantay na pagitan sa pagitan ng mga petsa (mga punto sa oras), kung gayon ang naturang serye ay madaling ma-convert sa isang serye ng mga average. Sa kasong ito, ang indicator (level) sa simula ng bawat panahon ay sabay-sabay na indicator sa pagtatapos ng nakaraang panahon. Pagkatapos ay ang average na halaga ng indicator para sa bawat panahon (interval sa pagitan ng mga petsa) ay maaaring kalkulahin bilang kalahating kabuuan ng mga halaga sa sa simula at katapusan ng panahon, i.e. paano . Ang bilang ng mga naturang average ay magiging. Tulad ng nabanggit kanina, para sa serye ng mga average, ang average na antas ay kinakalkula mula sa arithmetic mean.

Samakatuwid, maaari tayong sumulat:
.
Pagkatapos ma-convert ang numerator, nakukuha natin ang:
,

saan Y1 at Yn- ang una at huling mga antas ng hilera; Yi- mga intermediate na antas.

Ang average na ito ay kilala sa mga istatistika bilang average na kronolohikal para sa mga serye ng sandali. Nakuha nito ang pangalang ito mula sa salitang "cronos" (oras, lat.), Dahil kinakalkula ito mula sa mga tagapagpahiwatig na nagbabago sa paglipas ng panahon.

Sa kaso ng hindi pantay ng mga agwat sa pagitan ng mga petsa, ang chronological average para sa isang sandali na serye ay maaaring kalkulahin bilang ang arithmetic average ng mga average na halaga ng mga antas para sa bawat pares ng mga sandali, na natimbang ng distansya (mga agwat ng oras) sa pagitan ng mga petsa, i.e.
.
Sa kasong ito ipinapalagay na sa pagitan ng mga petsa ang mga antas ay kumuha ng iba't ibang halaga, at tayo ay kabilang sa dalawang kilala ( yi at yi + 1) tinutukoy namin ang mga average, kung saan namin kinakalkula ang pangkalahatang average para sa buong nasuri na panahon.
Kung ito ay ipinapalagay na ang bawat halaga yi nananatiling hindi nagbabago hanggang sa susunod (ako + 1)- ang sandali, i.e. ang eksaktong petsa ng pagbabago sa mga antas ay kilala, kung gayon ang pagkalkula ay maaaring isagawa ayon sa formula ng arithmetic weighted average:
,

kung saan ang oras kung saan ang antas ay nanatiling hindi nagbabago.

Bilang karagdagan sa average na antas sa serye ng mga dinamika, ang iba pang mga average na tagapagpahiwatig ay kinakalkula - ang average na pagbabago sa mga antas ng serye (sa pamamagitan ng basic at chain method), ang average na rate ng pagbabago.

Ang ibig sabihin ng baseline ay ganap na pagbabago ay ang quotient ng huling pangunahing ganap na pagbabago na hinati sa bilang ng mga pagbabago. Yan ay

Ang kadena ay nangangahulugang ganap na pagbabago Ang mga antas ng isang serye ay ang quotient ng paghahati sa kabuuan ng lahat ng mga ganap na pagbabago sa chain sa bilang ng mga pagbabago, iyon ay

Ang tanda ng average na ganap na mga pagbabago ay ginagamit din upang hatulan ang likas na katangian ng pagbabago sa phenomenon sa karaniwan: paglago, pagbaba o katatagan.

Mula sa panuntunan ng kontrol ng basic at chain absolute na mga pagbabago ay sumusunod na ang basic at chain mean na pagbabago ay dapat na pantay.

Kasama ang average na ganap na pagbabago, ang relatibong average ay kinakalkula din gamit ang mga basic at chain na pamamaraan.

Ang ibig sabihin ng baseline ay relatibong pagbabago tinutukoy ng formula:

Ang ibig sabihin ng chain ay relatibong pagbabago tinutukoy ng formula:

Naturally, ang baseline at chain ay dapat na magkapareho at sa pamamagitan ng paghahambing ng mga ito sa criterion value 1, ang isang konklusyon ay iginuhit tungkol sa likas na katangian ng pagbabago sa phenomenon sa karaniwan: paglago, pagbaba o katatagan.
Sa pamamagitan ng pagbabawas ng 1 mula sa baseline o chain average ng relatibong pagbabago, ang katumbas average na rate ng pagbabago, sa pamamagitan ng tanda kung saan posible ring hatulan ang kalikasan ng pagbabago sa pinag-aralan na kababalaghan, na sinasalamin ng ibinigay na serye ng mga dinamika.

Mga pagbabago sa pana-panahon at mga indeks ng seasonality.

Ang mga pana-panahong pagbabagu-bago ay mga tuluy-tuloy na intra-taunang pagbabagu-bago.

Ang pangunahing prinsipyo ng pamamahala upang makuha ang pinakamataas na epekto ay upang i-maximize ang kita at mabawasan ang mga gastos. Sa pamamagitan ng pag-aaral ng mga pana-panahong pagbabagu-bago, ang problema ng pinakamataas na equation ay nalulutas sa bawat antas ng taon.

Kapag nag-aaral ng mga pana-panahong pagbabagu-bago, dalawang magkakaugnay na gawain ang malulutas:

1. Pagbubunyag ng mga detalye ng pag-unlad ng phenomenon sa intra-taunang dinamika;

2. Pagsukat ng mga seasonal na pagbabago-bago sa pagbuo ng isang seasonal wave model;

Upang sukatin ang mga pana-panahong pagbabagu-bago, ang mga turkey ay karaniwang binibilang sa seasonality. Sa pangkalahatan, ang mga ito ay tinutukoy ng ratio ng mga paunang equation ng isang bilang ng mga dinamika sa mga teoretikal na equation, na nagsisilbing batayan para sa paghahambing.

Dahil ang mga random na paglihis ay nakapatong sa mga pana-panahong pagbabagu-bago, ang mga indeks ng seasonality ay ina-average upang maalis ang mga ito.

Sa kasong ito, para sa bawat panahon ng taunang cycle, ang mga pangkalahatang tagapagpahiwatig ay tinutukoy sa anyo ng mga average na pana-panahong mga indeks:

Ang mga average na indeks ng mga pana-panahong pagbabago ay libre mula sa impluwensya ng mga random na paglihis ng pangunahing trend ng pag-unlad.

Depende sa likas na katangian ng trend, ang formula para sa average na seasonality index ay maaaring magkaroon ng mga sumusunod na anyo:

1.Para sa serye ng intra-taunang dinamika na may malinaw na pangunahing trend ng pag-unlad:

2. Para sa serye ng intra-taunang dinamika kung saan walang tumataas o bumababa na trend, o hindi gaanong mahalaga:

Nasaan ang pangkalahatang average;

Mga pamamaraan para sa pagsusuri ng pangunahing kalakaran.

Ang pag-unlad ng mga phenomena sa oras ay naiimpluwensyahan ng mga kadahilanan ng iba't ibang kalikasan at lakas ng impluwensya. Ang ilan sa kanila ay random sa kalikasan, ang iba ay may halos pare-parehong epekto at bumubuo ng isang tiyak na kalakaran sa pag-unlad sa mga ranggo ng dinamika.

Ang isang mahalagang gawain ng mga istatistika ay upang tukuyin ang dynamics ng trend sa serye, napalaya mula sa pagkilos ng iba't ibang mga random na kadahilanan. Para sa layuning ito, ang serye ng mga dinamika ay pinoproseso ng mga pamamaraan ng pagsasama-sama ng mga agwat, paglipat ng average at analytical alignment, atbp.

Pamamaraan ng interval coarsening batay sa pagpapalaki ng mga yugto ng panahon kung saan nabibilang ang mga antas ng isang bilang ng mga dinamika, i.e. ay ang pagpapalit ng data na nauugnay sa maliliit na yugto ng panahon ng data mula sa mas malalaking yugto. Ito ay lalong epektibo kapag ang mga unang antas ng serye ay para sa maikling panahon. Halimbawa, ang mga row ng indicator na nauugnay sa mga pang-araw-araw na kaganapan ay pinapalitan ng mga row na nauugnay sa lingguhan, buwanan, atbp. Ito ay magbibigay-daan sa iyo upang mas malinaw na ipakita "Axis ng pag-unlad ng phenomenon"... Ang average, na kinakalkula sa mga pinalaki na agwat, ay ginagawang posible upang matukoy ang direksyon at kalikasan (pagpabilis o pagbabawas ng paglago) ng pangunahing kalakaran ng pag-unlad.

Moving average na paraan ay katulad ng nauna, ngunit sa kasong ito, ang mga aktwal na antas ay pinapalitan ng mga karaniwang antas na kinakalkula para sa sunud-sunod na paglipat (pag-slide) na pinalaki na mga pagitan na sumasaklaw sa m mga antas ng serye.

Halimbawa kung tatanggapin mo m = 3, pagkatapos ay kalkulahin muna ang average ng unang tatlong antas ng serye, pagkatapos ay mula sa parehong bilang ng mga antas, ngunit nagsisimula sa pangalawa nang magkakasunod, pagkatapos ay nagsisimula sa pangatlo, atbp. Kaya, ang average, bilang ito ay, "slide" kasama ang isang bilang ng mga dynamics, na gumagalaw sa pamamagitan ng isang panahon. Kinakalkula mula sa m Ang mga terminong moving average ay tumutukoy sa gitna (gitna) ng bawat pagitan.

Ang pamamaraang ito ay nag-aalis lamang ng mga random na pagbabagu-bago. Kung ang serye ay may pana-panahong alon, pagkatapos ay mananatili ito pagkatapos ng pagpapakinis sa pamamagitan ng moving average na paraan.

Analytical alignment. Upang maalis ang mga random na pagbabagu-bago at matukoy ang isang trend, ang pagkakahanay ng mga antas ng serye sa pamamagitan ng analytical formula (o analytical alignment) ay inilalapat. Ang kakanyahan nito ay binubuo sa pagpapalit ng mga empirical (aktwal) na antas ng mga teoretikal, na kinakalkula ayon sa isang tiyak na equation na pinagtibay bilang isang modelo ng trend ng matematika, kung saan ang mga antas ng teoretikal ay itinuturing bilang isang function ng oras:. Sa kasong ito, ang bawat aktwal na antas ay itinuturing bilang kabuuan ng dalawang bahagi:, nasaan ang sistematikong bahagi at ipinahayag ng isang tiyak na equation, at ito ay isang random na variable na nagdudulot ng mga pagbabago sa paligid ng trend.

Ang gawain ng analytical alignment ay bumababa sa mga sumusunod:

1. Pagpapasiya, batay sa aktwal na data, ng uri ng hypothetical function na pinaka-sapat na sumasalamin sa trend ng pag-unlad ng indicator na pinag-aaralan.

2. Paghahanap ng mga parameter ng tinukoy na function (equation) mula sa empirical data

3. Pagkalkula ayon sa nahanap na equation ng theoretical (aligned) levels.

Ang pagpili ng isang partikular na function ay isinasagawa, bilang panuntunan, batay sa isang graphical na representasyon ng empirical data.

Ang mga equation ng regression ay ginagamit bilang mga modelo, ang mga parameter na kung saan ay kinakalkula gamit ang least squares method

Nasa ibaba ang pinakakaraniwang ginagamit na mga equation ng regression para sa pag-level ng serye ng oras, na nagsasaad kung aling mga trend ng pag-unlad ang pinakaangkop para sa pagpapakita.

Upang mahanap ang mga parameter ng mga equation sa itaas, mayroong mga espesyal na algorithm at mga programa sa computer. Sa partikular, upang mahanap ang mga parameter ng equation ng isang tuwid na linya, maaaring gamitin ang sumusunod na algorithm:

Kung ang mga tuldok o sandali ng oras ay binibilang upang St = 0, kung gayon ang mga algorithm sa itaas ay magiging makabuluhang pinasimple at magiging

Ang mga nakahanay na antas sa chart ay matatagpuan sa isang tuwid na linya na dumadaan sa pinakamalapit na distansya sa mga aktwal na antas ng serye ng oras na ito. Ang kabuuan ng mga parisukat ng mga paglihis ay isang salamin ng impluwensya ng mga random na kadahilanan.

Sa tulong nito, kinakalkula namin ang average (standard) na error ng equation:

Narito ang n ay ang bilang ng mga obserbasyon, at ang m ay ang bilang ng mga parameter sa equation (mayroon kaming dalawa sa kanila - b 1 at b 0).

Ang pangunahing tendency (trend) ay nagpapakita kung paano nakakaapekto ang sistematikong mga salik sa mga antas ng isang bilang ng mga dynamics, at ang mga pagbabagu-bago ng mga antas sa paligid ng trend () ay nagsisilbing sukatan ng epekto ng mga natitirang salik.

Upang masuri ang kalidad ng modelo ng serye ng oras na ginamit, ginagamit din ito Fisher's F test... Ito ay ang ratio ng dalawang variances, katulad ng ratio ng variance na dulot ng regression, i.e. ang pinag-aralan na kadahilanan, sa pagkakaiba-iba na dulot ng mga random na sanhi, i.e. natitirang pagpapakalat:

Sa pinalawak na anyo, ang pormula para sa pamantayang ito ay maaaring katawanin bilang mga sumusunod:

kung saan ang n ay ang bilang ng mga obserbasyon, i.e. bilang ng mga antas sa isang hilera,

m ay ang bilang ng mga parameter sa equation, y ay ang aktwal na antas ng serye,

Naka-align na antas ng hilera - antas ng gitnang hilera.

Mas matagumpay kaysa sa iba, ang isang modelo ay maaaring hindi palaging sapat na kasiya-siya. Makikilala lamang ito kung ang criterion F para dito ay lumampas sa kilalang kritikal na hangganan. Ang hangganang ito ay itinatag gamit ang mga talahanayan ng pamamahagi ng F.

Kakanyahan at pag-uuri ng mga indeks.

Ang isang index sa mga istatistika ay nauunawaan bilang isang kamag-anak na tagapagpahiwatig na nagpapakita ng pagbabago sa laki ng isang kababalaghan sa oras, espasyo, o kung ihahambing sa anumang pamantayan.

Ang pangunahing elemento ng index ratio ay ang na-index na halaga. Ang na-index na halaga ay nauunawaan bilang ang halaga ng katangian ng istatistikal na populasyon, ang pagbabago kung saan ay ang object ng pag-aaral.

Mayroong tatlong pangunahing gawain na may mga index:

1) pagtatasa ng mga pagbabago sa isang kumplikadong kababalaghan;

2) pagpapasiya ng impluwensya ng mga indibidwal na kadahilanan sa pagbabago sa isang kumplikadong kababalaghan;

3) paghahambing ng magnitude ng ilang phenomenon sa magnitude ng nakaraang panahon, ang magnitude para sa isa pang teritoryo, pati na rin sa mga pamantayan, plano, pagtataya.

Ang mga indeks ay inuri ayon sa 3 pamantayan:

2) ayon sa antas ng saklaw ng mga elemento ng populasyon;

3) ayon sa mga pamamaraan ng pagkalkula ng mga pangkalahatang indeks.

Sa pamamagitan ng nilalaman ng mga na-index na halaga, ang mga indeks ay nahahati sa mga indeks ng quantitative (volumetric) na mga tagapagpahiwatig at mga indeks ng mga tagapagpahiwatig ng husay. Mga indeks ng quantitative indicator - mga indeks ng pisikal na dami ng pang-industriyang produksyon, pisikal na dami ng mga benta, headcount, atbp. Mga indeks ng qualitative indicator - mga indeks ng mga presyo, mga gastos sa produksyon, produktibidad ng paggawa, average na sahod, atbp.

Ayon sa antas ng saklaw ng mga yunit ng populasyon, ang mga indeks ay nahahati sa dalawang klase: indibidwal at pangkalahatan. Upang makilala ang mga ito, ipinakilala namin ang mga sumusunod na kombensiyon na pinagtibay sa pagsasanay ng paggamit ng paraan ng index:

q- ang halaga (volume) ng anumang produkto sa natural na pagpapahayag ; R- presyo ng isang piraso; z- halaga ng yunit ng produksyon; t- ang oras na ginugol sa produksyon ng isang yunit ng produksyon (labor intensity) ; w- produksyon ng mga produkto sa mga tuntunin ng halaga bawat yunit ng oras; v- produksyon ng mga produkto sa uri bawat yunit ng oras; T- ang kabuuang oras na ginugol o ang bilang ng mga empleyado.

Upang makilala kung aling panahon o bagay ang nabibilang sa mga na-index na halaga, kaugalian na maglagay ng mga subscript sa ibabang kanan pagkatapos ng kaukulang simbolo. Kaya, halimbawa, sa mga indeks ng dinamika, bilang panuntunan, para sa mga panahon ng paghahambing (kasalukuyan, pag-uulat), ang subscript 1 ay ginagamit at para sa mga panahon kung saan ginawa ang paghahambing,

Mga indibidwal na index nagsisilbi upang makilala ang mga pagbabago sa mga indibidwal na elemento ng isang kumplikadong kababalaghan (halimbawa, pagbabago sa dami ng output ng isang uri ng produkto). Kinakatawan nila ang mga kamag-anak na halaga ng dinamika, katuparan ng mga obligasyon, paghahambing ng mga na-index na halaga.

Natutukoy ang indibidwal na index ng pisikal na dami ng produksyon

Mula sa isang analytical na pananaw, ang binanggit na indibidwal na mga indeks ng dinamika ay katulad ng mga rate ng paglago (rate) at nailalarawan ang pagbabago sa na-index na halaga sa kasalukuyang panahon kumpara sa baseline, ibig sabihin, ipinapakita nila kung gaano karaming beses itong tumaas (bumababa ) o kung gaano karaming porsyento ang paglago (pagbaba). Ang mga halaga ng index ay ipinahayag sa mga coefficient o porsyento.

Pangkalahatang (buod) index sumasalamin sa pagbabago sa lahat ng elemento ng isang komplikadong phenomenon.

Pinagsama-samang index ay ang pangunahing anyo ng index. Tinatawag itong aggregate dahil ang numerator at denominator nito ay isang set ng "aggregate"

Average na mga indeks, ang kanilang kahulugan.

Bilang karagdagan sa mga pinagsama-samang indeks, ginagamit ng mga istatistika ang kanilang iba pang anyo - weighted average na mga indeks. Ginagamit ang mga ito kapag hindi pinapayagan ng magagamit na impormasyon ang kabuuang pinagsama-samang index na kalkulahin. Kaya, kung walang data sa mga presyo, ngunit mayroong impormasyon tungkol sa halaga ng mga produkto sa kasalukuyang panahon at ang mga indibidwal na indeks ng presyo para sa bawat produkto ay kilala, kung gayon ang pangkalahatang indeks ng presyo ay hindi maaaring matukoy bilang isang pinagsama-samang, ngunit posible na kalkulahin ito bilang average ng mga indibidwal. Sa parehong paraan, kung ang mga dami ng mga indibidwal na uri ng mga produktong ginawa ay hindi alam, ngunit ang mga indibidwal na indeks at ang halaga ng mga produkto para sa batayang panahon ay kilala, kung gayon ang pangkalahatang indeks ng pisikal na dami ng produksyon ay maaaring matukoy bilang isang timbang na average .

Average na index - ito ay index na kinakalkula bilang average ng mga indibidwal na indeks. Ang pinagsama-samang index ay ang pangunahing anyo ng pangkalahatang index, kaya ang average na index ay dapat na kapareho ng pinagsama-samang index. Kapag kinakalkula ang mga average, dalawang anyo ng mga average ang ginagamit: arithmetic at harmonic.

Ang arithmetic mean index ay magkapareho sa pinagsama-samang index kung ang mga timbang ng mga indibidwal na indeks ay ang mga termino ng denominator ng pinagsama-samang index. Sa kasong ito lamang ang halaga ng index, na kinakalkula ayon sa formula ng arithmetic mean, ay magiging katumbas ng pinagsama-samang index.

Upang kalkulahin ang geometric mean simple, ginagamit ang formula:

Geometric na may timbang

Upang matukoy ang geometric weighted average, inilapat ang formula:

Ang average na diameters ng mga gulong, tubo, ang average na gilid ng mga parisukat ay tinutukoy gamit ang ibig sabihin ng parisukat.

Ang mga halaga ng RMS ay ginagamit upang kalkulahin ang ilang mga tagapagpahiwatig, halimbawa, ang koepisyent ng pagkakaiba-iba, na nagpapakilala sa ritmo ng produksyon. Dito, ang karaniwang paglihis mula sa nakaplanong output para sa isang tiyak na panahon ay tinutukoy gamit ang sumusunod na formula:

Ang mga halagang ito ay tumpak na nagpapakilala sa pagbabago sa mga tagapagpahiwatig ng ekonomiya kumpara sa kanilang batayang halaga, na kinuha sa average na halaga nito.

Quadratic simple

Ang root mean square simple ay kinakalkula ng formula:

Timbang parisukat

Ang weighted mean square ay:

22. Ang mga ganap na tagapagpahiwatig ng pagkakaiba-iba ay kinabibilangan ng:

saklaw ng pagkakaiba-iba

ibig sabihin ng linear deviation

pagkakaiba-iba

karaniwang lihis

Variation ng swing (r)

I-swipe ang pagkakaiba-iba ay ang pagkakaiba sa pagitan ng maximum at minimum na mga halaga ng katangian

Ipinapakita nito ang mga limitasyon kung saan nagbabago ang halaga ng katangian sa pinag-aralan na populasyon.

Ang karanasan sa trabaho ng limang aplikante sa nakaraang trabaho ay: 2,3,4,7 at 9 na taon. Solusyon: hanay ng variation = 9 - 2 = 7 taon.

Para sa isang pangkalahatang katangian ng mga pagkakaiba sa mga halaga ng katangian, ang average na mga tagapagpahiwatig ng pagkakaiba-iba ay kinakalkula batay sa pagsasaalang-alang sa mga paglihis mula sa arithmetic mean. Ang pagkakaiba ay kinuha bilang paglihis mula sa mean.

Kasabay nito, upang maiwasan ang kabuuan ng mga paglihis ng mga pagpipilian ng isang tampok mula sa mean (zero na pag-aari ng ibig sabihin), kinakailangan alinman na huwag isaalang-alang ang mga palatandaan ng paglihis, iyon ay, kunin ito. sum modulo, o i-square ang mga deviations sa zero.

Average na linear at standard deviation

Average na linear deviation- ito ang arithmetic mean ng ganap na paglihis ng mga indibidwal na halaga ng katangian mula sa mean.

Ang average na linear deviation ay simple:

Ang karanasan sa trabaho ng limang aplikante sa nakaraang trabaho ay: 2,3,4,7 at 9 na taon.

Sa ating halimbawa: taon;

Sagot: 2.4 na taon.

Weighted mean linear deviation nalalapat sa pinagsama-samang data:

Ang average na linear deviation, dahil sa convention nito, ay ginagamit sa pagsasanay na medyo bihira (sa partikular, upang makilala ang katuparan ng mga obligasyong kontraktwal para sa pagkakapareho ng paghahatid; sa pagsusuri ng kalidad ng produkto, isinasaalang-alang ang mga teknolohikal na tampok ng produksyon).

Karaniwang lihis

Ang pinakaperpektong katangian ng variation ay ang standard deviation, na tinatawag na standard (o standard deviation). Karaniwang lihis() ay katumbas ng square root ng mean square ng mga paglihis ng mga indibidwal na halaga ng katangian mula sa arithmetic mean:

Ang karaniwang paglihis ay simple:

Ginagamit ang weighted standard deviation para sa pinagsama-samang data:

Sa pagitan ng mean square at standard linear deviations sa ilalim ng normal na kondisyon ng distribution, ang sumusunod na relasyon ay nagaganap: ~ 1.25.

Ang karaniwang paglihis, bilang pangunahing ganap na sukatan ng pagkakaiba-iba, ay ginagamit upang matukoy ang mga halaga ng mga ordinate ng normal na curve ng pamamahagi, sa mga kalkulasyon na nauugnay sa pag-aayos ng sample na pagmamasid at pagtatatag ng katumpakan ng mga katangian ng sample, pati na rin kapag tinatasa ang mga hangganan ng pagkakaiba-iba ng isang tampok sa isang homogenous na populasyon.

Ang mga halaga na nakuha mula sa karanasan ay hindi maiiwasang naglalaman ng mga pagkakamali dahil sa iba't ibang mga kadahilanan. Kabilang sa mga ito, ang isa ay dapat na makilala sa pagitan ng sistematiko at random na mga pagkakamali. Ang mga sistematikong error ay sanhi ng mga dahilan na kumikilos sa isang napaka-tiyak na paraan, at maaaring palaging maalis o tumpak na isinasaalang-alang. Ang mga random na error ay sanhi ng napakaraming magkakahiwalay na dahilan na hindi tumpak na matutugunan at kumilos sa bawat hiwalay na dimensyon sa iba't ibang paraan. Ang mga pagkakamaling ito ay hindi maaaring ganap na maalis; maaari silang isaalang-alang lamang sa karaniwan, kung saan kinakailangang malaman ang mga batas na namamahala sa mga random na pagkakamali.

Ipapahiwatig namin ang sinusukat na halaga ng A, at ang random na error sa pagsukat ng x. Dahil ang error na x ay maaaring tumagal ng anumang mga halaga, ito ay isang tuluy-tuloy na random variable, na ganap na nailalarawan ng sarili nitong batas sa pamamahagi.

Ang pinakasimpleng at pinakatumpak na sumasalamin sa katotohanan (sa karamihan ng mga kaso) ay ang tinatawag na normal na pamamahagi ng mga error:

Ang batas sa pamamahagi na ito ay maaaring makuha mula sa iba't ibang teoretikal na lugar, lalo na, mula sa pangangailangan na ang pinaka-malamang na halaga ng isang hindi kilalang dami, kung saan ang isang bilang ng mga halaga ay nakuha sa pamamagitan ng direktang pagsukat na may parehong antas ng katumpakan, ay ang aritmetika. ibig sabihin ng mga halagang ito. Ang dami 2 ay tinatawag pagkakaiba-iba ng normal na batas na ito.

Katamtaman

Pagpapasiya ng pagkakaiba mula sa pang-eksperimentong data. Kung para sa anumang dami ng isang direktang pagsukat na nakuha n mga halaga ng a i na may parehong antas ng katumpakan at kung ang mga pagkakamali ng dami A ay napapailalim sa normal na batas sa pamamahagi, kung gayon ang pinaka-malamang na halaga ng A ay magiging karaniwan:

a - ibig sabihin ng aritmetika,

a i - sinusukat na halaga sa i-th na hakbang.

Ang paglihis ng naobserbahang halaga (para sa bawat pagmamasid) a i ng halaga A mula sa ibig sabihin ng aritmetika: a i - a.

Upang matukoy ang pagkakaiba-iba ng normal na distribusyon ng mga error sa kasong ito, gamitin ang formula:

2 - pagkakaiba-iba,
a - ibig sabihin ng aritmetika,
n ay ang bilang ng mga sukat ng parameter,

Karaniwang lihis

Karaniwang lihis nagpapakita ng ganap na paglihis ng mga sinusukat na halaga mula sa ibig sabihin ng aritmetika... Ayon sa formula para sa sukat ng katumpakan ng isang linear na kumbinasyon root mean square error ang arithmetic mean ay tinutukoy ng formula:

, saan


a - ibig sabihin ng aritmetika,
n ay ang bilang ng mga sukat ng parameter,
a i - sinusukat na halaga sa i-th na hakbang.

Ang koepisyent ng pagkakaiba-iba

Ang koepisyent ng pagkakaiba-iba nailalarawan ang kamag-anak na sukat ng paglihis ng mga sinusukat na halaga mula sa ibig sabihin ng aritmetika:

, saan

Ang V ay ang koepisyent ng pagkakaiba-iba,
- karaniwang lihis,
a - ibig sabihin ng aritmetika.

Mas malaki ang halaga koepisyent ng pagkakaiba-iba, mas malaki ang scatter at mas kaunting pagkakapareho ng mga inimbestigahang value. Kung ang koepisyent ng pagkakaiba-iba mas mababa sa 10%, kung gayon ang pagkakaiba-iba ng serye ng variation ay itinuturing na hindi gaanong mahalaga, mula 10% hanggang 20% ​​ay tumutukoy sa average, higit sa 20% at mas mababa sa 33% sa makabuluhan at kung ang koepisyent ng pagkakaiba-iba lumampas sa 33%, ito ay nagpapahiwatig ng heterogeneity ng impormasyon at ang pangangailangan na ibukod ang pinakamalaki at pinakamaliit na halaga.

Average na linear deviation

Isa sa mga tagapagpahiwatig ng saklaw at intensity ng pagkakaiba-iba - ibig sabihin ng linear deviation(mean modulus of deviation) mula sa arithmetic mean. Average na linear deviation kinakalkula ng formula:

, saan

_
a - ibig sabihin ng linear deviation,
a - ibig sabihin ng aritmetika,
n ay ang bilang ng mga sukat ng parameter,
a i - sinusukat na halaga sa i-th na hakbang.

Upang suriin ang pagsusulatan ng mga sinisiyasat na halaga sa batas ng normal na pamamahagi, ilapat ang kaugnayan index ng kawalaan ng simetrya sa kanyang pagkakamali at ugali rate ng kurtosis sa kanyang pagkakamali.

Asymmetry index

Asymmetry index Ang (A) at ang error nito (m a) ay kinakalkula gamit ang mga sumusunod na formula:

, saan

A - isang tagapagpahiwatig ng kawalaan ng simetrya,
- karaniwang lihis,
a - ibig sabihin ng aritmetika,
n ay ang bilang ng mga sukat ng parameter,
a i - sinusukat na halaga sa i-th na hakbang.

Tagapagpahiwatig ng kurtosis

Tagapagpahiwatig ng kurtosis(E) at ang error nito (m e) ay kinakalkula gamit ang mga sumusunod na formula:

, saan



 


Basahin:



Pangkalahatang sikolohiya stolyarenko a m

Pangkalahatang sikolohiya stolyarenko a m

Ang kakanyahan ng psyche at mental. Ang agham ay isang panlipunang kababalaghan, isang mahalagang bahagi ng kamalayan sa lipunan, isang anyo ng kaalaman ng tao sa kalikasan, ...

All-Russian test work para sa kursong primaryang paaralan

All-Russian test work para sa kursong primaryang paaralan

VLOOKUP. wikang Ruso. 25 mga pagpipilian para sa mga karaniwang gawain. Volkova E.V. et al. M .: 2017 - 176 p. Ang manwal na ito ay ganap na sumusunod sa ...

Pangkalahatang edad ng sports ng pisyolohiya ng tao

Pangkalahatang edad ng sports ng pisyolohiya ng tao

Kasalukuyang pahina: 1 (ang aklat ay may kabuuang 54 na pahina) [magagamit na sipi para sa pagbabasa: 36 na pahina] Font: 100% + Alexey Solodkov, Elena ...

Mga lektura sa pamamaraan ng pagtuturo ng wikang Ruso at panitikan sa pag-unlad ng pamamaraan ng elementarya sa paksa

Mga lektura sa pamamaraan ng pagtuturo ng wikang Ruso at panitikan sa pag-unlad ng pamamaraan ng elementarya sa paksa

Ang manwal ay naglalaman ng isang sistematikong kurso sa pagtuturo ng gramatika, pagbasa, panitikan, pagbabaybay at pag-unlad ng pagsasalita para sa mga batang mag-aaral. Natagpuan sa loob nito ...

feed-image Rss