Bahay - Pag-ayos ng kasaysayan
Pagpapasiya ng karaniwang paglihis. Standard deviation

Aralin Blg. 4

Paksa: “Mga istatistikal na naglalarawan. Mga tagapagpahiwatig ng pagkakaiba-iba ng katangian sa pinagsama-samang"

Ang pangunahing pamantayan para sa pagkakaiba-iba ng isang katangian sa isang istatistikal na populasyon ay: limitasyon, amplitude, average karaniwang paglihis, coefficient ng oscillation at coefficient ng variation. Sa nakaraang aralin, tinalakay na ang mga average na halaga ay nagbibigay lamang ng isang pangkalahatang katangian ng katangian na pinag-aaralan sa pinagsama-samang at hindi isinasaalang-alang ang mga halaga ng mga indibidwal na variant nito: minimum at maximum na mga halaga, sa itaas ng average, sa ibaba karaniwan, atbp.

Halimbawa. Mga average na halaga ng dalawang magkaibang pagkakasunud-sunod ng numero: -100; -20; 100; 20 at 0.1; -0.2; 0.1 ay ganap na magkapareho at pantayTUNGKOL SA.Gayunpaman, ang mga scatter range ng relatibong mean sequence data na ito ay ibang-iba.

Ang pagpapasiya ng nakalistang pamantayan para sa pagkakaiba-iba ng isang katangian ay pangunahing isinasagawa na isinasaalang-alang ang halaga nito sa mga indibidwal na elemento ng istatistikal na populasyon.

Ang mga tagapagpahiwatig para sa pagsukat ng pagkakaiba-iba ng isang katangian ay ganap At kamag-anak. Ang mga ganap na tagapagpahiwatig ng variation ay kinabibilangan ng: hanay ng variation, limitasyon, standard deviation, dispersion. Ang coefficient ng variation at ang coefficient ng oscillation ay tumutukoy sa mga relatibong sukat ng variation.

Limitasyon (lim)– Ito ay isang criterion na tinutukoy ng matinding halaga ng isang variant sa isang variation series. Sa madaling salita, ang pamantayang ito ay nililimitahan ng pinakamababa at pinakamataas na halaga ng katangian:

Amplitude (Am) o saklaw ng pagkakaiba-iba - Ito ang pagkakaiba sa pagitan ng mga matinding opsyon. Ang pagkalkula ng pamantayang ito ay isinasagawa sa pamamagitan ng pagbabawas ng pinakamababang halaga nito mula sa pinakamataas na halaga ng katangian, na nagpapahintulot sa amin na tantiyahin ang antas ng scatter ng opsyon:

Ang kawalan ng limitasyon at amplitude bilang pamantayan ng pabagu-bago ay ganap silang umaasa sa mga matinding halaga ng katangian sa serye ng pagkakaiba-iba. Sa kasong ito, ang mga pagbabago sa mga halaga ng katangian sa loob ng isang serye ay hindi isinasaalang-alang.

Ang pinakakumpletong paglalarawan ng pagkakaiba-iba ng isang katangian sa isang istatistikal na populasyon ay ibinigay ng karaniwang paglihis(sigma), na isang pangkalahatang sukatan ng paglihis ng isang opsyon mula sa average na halaga nito. Ang karaniwang paglihis ay madalas na tinatawag karaniwang paglihis.

Ang standard deviation ay batay sa isang paghahambing ng bawat opsyon sa arithmetic mean ng isang naibigay na populasyon. Dahil sa pinagsama-samang mayroong mga pagpipilian na parehong mas mababa at higit pa kaysa dito, ang kabuuan ng mga paglihis na may sign na "" ay kakanselahin ng kabuuan ng mga deviations na may sign "", i.e. ang kabuuan ng lahat ng deviations ay zero. Upang maiwasan ang impluwensya ng mga palatandaan ng mga pagkakaiba, ang mga paglihis mula sa arithmetic mean squared ay kinuha, i.e. . Ang kabuuan ng mga squared deviations ay hindi katumbas ng zero. Upang makakuha ng isang koepisyent na may kakayahang sukatin ang pagkakaiba-iba, kunin ang average ng kabuuan ng mga parisukat - ang halagang ito ay tinatawag mga pagkakaiba-iba:

Sa esensya, ang pagpapakalat ay ang average na parisukat ng mga paglihis ng mga indibidwal na halaga ng isang katangian mula sa average na halaga nito. Pagpapakalat parisukat ng karaniwang paglihis.

Ang pagkakaiba ay isang dimensional na dami (pinangalanan). Kaya, kung ang mga variant ng isang serye ng numero ay ipinahayag sa metro, kung gayon ang pagkakaiba ay nagbibigay ng square meters; kung ang mga opsyon ay ipinahayag sa kilo, kung gayon ang pagkakaiba ay nagbibigay ng parisukat ng panukalang ito (kg 2), atbp.

Standard deviation– square root ng variance:

, at kapag kinakalkula ang dispersion at standard deviation sa denominator ng fraction, sa halip nadapat ilagay.

Ang pagkalkula ng karaniwang paglihis ay maaaring nahahati sa anim na yugto, na dapat isagawa sa isang tiyak na pagkakasunud-sunod:

Application ng standard deviation:

a) para sa paghusga sa pagkakaiba-iba ng mga serye ng variation at paghahambing na pagtatasa ng typicality (representativeness) ng mga arithmetic average. Ito ay kinakailangan sa differential diagnosis kapag tinutukoy ang katatagan ng mga sintomas.

b) upang muling buuin ang serye ng variation, i.e. pagpapanumbalik ng frequency response nito batay sa tatlong sigma panuntunan. Sa pagitan (М±3σ) 99.7% ng lahat ng variant ng serye ay matatagpuan sa pagitan (М±2σ) - 95.5% at nasa hanay (М±1σ) - 68.3% na opsyon sa hilera(Larawan 1).

c) upang matukoy ang mga opsyon na "pop-up".

d) upang matukoy ang mga parameter ng pamantayan at patolohiya gamit ang mga pagtatantya ng sigma

e) upang kalkulahin ang koepisyent ng pagkakaiba-iba

f) upang kalkulahin ang average na error ng arithmetic mean.

Upang makilala ang anumang populasyon na mayroonnormal na uri ng pamamahagi , sapat na upang malaman ang dalawang parameter: ang arithmetic mean at ang standard deviation.

Figure 1. Three Sigma rule

Halimbawa.

Sa pediatrics, ang standard deviation ay ginagamit upang masuri ang pisikal na pag-unlad ng mga bata sa pamamagitan ng paghahambing ng data ng isang partikular na bata na may kaukulang standard indicator. Ang average na arithmetic ng pisikal na pag-unlad ng malusog na mga bata ay kinuha bilang pamantayan. Ang paghahambing ng mga tagapagpahiwatig na may mga pamantayan ay isinasagawa gamit ang mga espesyal na talahanayan kung saan ang mga pamantayan ay ibinibigay kasama ang kanilang kaukulang mga sukat ng sigma. Ito ay pinaniniwalaan na kung ang tagapagpahiwatig ng pisikal na pag-unlad ng bata ay nasa loob ng pamantayan (aritmetika mean) ±σ, kung gayon pisikal na pag-unlad ang bata (ayon sa tagapagpahiwatig na ito) ay tumutugma sa pamantayan. Kung ang tagapagpahiwatig ay nasa loob ng pamantayan ± 2σ, pagkatapos ay mayroong isang bahagyang paglihis mula sa pamantayan. Kung ang tagapagpahiwatig ay lumampas sa mga limitasyong ito, kung gayon ang pisikal na pag-unlad ng bata ay naiiba nang husto mula sa pamantayan (posible ang patolohiya).

Bilang karagdagan sa mga tagapagpahiwatig ng pagkakaiba-iba na ipinahayag sa mga ganap na halaga, ang istatistikal na pananaliksik ay gumagamit ng mga tagapagpahiwatig ng pagkakaiba-iba na ipinahayag sa mga kaugnay na halaga. Oscillation coefficient - ito ang ratio ng hanay ng variation sa average na halaga ng katangian. Koepisyent ng pagkakaiba-iba - ay ang ratio ng standard deviation sa karaniwan tanda. Karaniwan, ang mga halagang ito ay ipinahayag bilang mga porsyento.

Mga formula para sa pagkalkula ng mga relatibong tagapagpahiwatig ng pagkakaiba-iba:

Mula sa mga formula sa itaas ay malinaw na mas malaki ang koepisyent V ay mas malapit sa zero, mas maliit ang pagkakaiba-iba sa mga halaga ng katangian. Ang higit pa V, mas maraming variable ang sign.

Sa pagsasanay sa istatistika, ang koepisyent ng pagkakaiba-iba ay kadalasang ginagamit. Ito ay ginagamit hindi lamang para sa isang paghahambing na pagtatasa ng pagkakaiba-iba, ngunit din upang makilala ang homogeneity ng populasyon. Ang populasyon ay itinuturing na homogenous kung ang koepisyent ng variation ay hindi lalampas sa 33% (para sa mga distribusyon na malapit sa normal). Sa aritmetika, ang ratio ng σ at ang arithmetic mean ay neutralisahin ang impluwensya ganap na halaga ang mga katangiang ito, at ang ratio ng porsyento ay gumagawa ng coefficient ng variation bilang isang walang sukat (walang pangalan) na dami.

Ang resultang halaga ng koepisyent ng pagkakaiba-iba ay tinatantya alinsunod sa mga tinatayang gradasyon ng antas ng pagkakaiba-iba ng katangian:

Mahina - hanggang 10%

Average - 10 - 20%

Malakas - higit sa 20%

Ang paggamit ng koepisyent ng pagkakaiba-iba ay ipinapayong sa mga kaso kung saan kinakailangan upang ihambing ang mga katangian na naiiba sa laki at sukat.

Ang pagkakaiba sa pagitan ng koepisyent ng pagkakaiba-iba at iba pang pamantayan ng scatter ay malinaw na ipinakita halimbawa.

Talahanayan 1

Komposisyon ng mga manggagawa sa negosyong pang-industriya

Batay sa mga istatistikal na katangian na ibinigay sa halimbawa, maaari tayong gumawa ng isang konklusyon tungkol sa kamag-anak na homogeneity ng komposisyon ng edad at antas ng edukasyon ng mga empleyado ng negosyo, dahil sa mababang propesyonal na katatagan ng surveyed contingent. Madaling makita na ang isang pagtatangka na hatulan ang mga panlipunang uso sa pamamagitan ng karaniwang paglihis ay hahantong sa isang maling konklusyon, at ang pagtatangkang ihambing ang mga katangian ng accounting na "karanasan sa trabaho" at "edad" sa tagapagpahiwatig ng accounting na "edukasyon" ay karaniwang magiging. hindi tama dahil sa heterogeneity ng mga katangiang ito.

Median at percentiles

Para sa ordinal (ranggo) na mga distribusyon, kung saan ang criterion para sa gitna ng serye ay ang median, ang standard deviation at dispersion ay hindi maaaring magsilbi bilang mga katangian ng dispersion ng variant.

Ang parehong ay totoo para sa bukas na serye ng variation. Ang pangyayaring ito ay dahil sa katotohanan na ang mga paglihis kung saan ang pagkakaiba at σ ay kinakalkula ay sinusukat mula sa arithmetic mean, na hindi kinakalkula sa bukas na serye ng variation at sa serye ng mga distribusyon ng mga katangiang husay. Samakatuwid, para sa isang naka-compress na paglalarawan ng mga distribusyon, isa pang parameter ng scatter ang ginagamit - dami(kasingkahulugan - "percentile"), na angkop para sa paglalarawan ng mga katangian ng husay at dami sa anumang anyo ng kanilang pamamahagi. Magagamit din ang parameter na ito upang i-convert ang mga quantitative na katangian sa mga qualitative. Sa kasong ito, ang mga naturang rating ay itinalaga depende sa kung anong pagkakasunud-sunod ng dami ng isang partikular na opsyon ay tumutugma.

Sa pagsasagawa ng biomedical na pananaliksik, ang mga sumusunod na dami ay kadalasang ginagamit:

– panggitna;

, – quartile (quartile), kung saan – lower quartile, tuktok na kuwarts.

Hinahati ng mga quantile ang lugar ng mga posibleng pagbabago sa isang serye ng variation sa ilang mga agwat. Ang Median (quantile) ay isang opsyon na nasa gitna ng isang variation series at hinahati ang seryeng ito sa kalahati sa dalawang pantay na bahagi ( 0,5 At 0,5 ). Hinahati ng isang quartile ang isang serye sa apat na bahagi: ang unang bahagi (lower quartile) ay isang opsyon na naghihiwalay sa mga opsyon na ang mga numerical na halaga ay hindi lalampas sa 25% ng maximum na posible sa seryeng ito, pinaghihiwalay ng quartile ang mga opsyon na may numerical na halaga hanggang 50% ng maximum na posible. Ang itaas na quartile () ay naghihiwalay ng mga opsyon hanggang sa 75% ng maximum na posibleng mga halaga.

Sa kaso ng asymmetric distribution variable na may kaugnayan sa arithmetic mean, ang median at quartiles ay ginagamit upang makilala ito. Sa kasong ito, ang sumusunod na anyo ng pagpapakita ng average na halaga ay ginagamit - Meh (;). Halimbawa, ang pinag-aralan na tampok - "ang panahon kung saan ang bata ay nagsimulang lumakad nang nakapag-iisa" - ay may walang simetrya na pamamahagi sa pangkat ng pag-aaral. Kasabay nito, ang mas mababang quartile () ay tumutugma sa simula ng paglalakad - 9.5 na buwan, ang median - 11 buwan, ang itaas na quartile () - 12 buwan. Alinsunod dito, ang katangian ng average na trend ng tinukoy na katangian ay ipapakita bilang 11 (9.5; 12) na buwan.

Pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pag-aaral

Ang istatistikal na kahalagahan ng data ay nauunawaan bilang ang antas kung saan ito tumutugma sa ipinakitang katotohanan, i.e. Ang data na makabuluhang istatistika ay ang mga hindi nakakasira at wastong sumasalamin sa layunin ng katotohanan.

Ang pagtatasa sa istatistikal na kahalagahan ng mga resulta ng pananaliksik ay nangangahulugan ng pagtukoy sa kung anong posibilidad na mailipat ang mga resultang nakuha mula sa sample na populasyon sa buong populasyon. Ang pagtatasa ng istatistikal na kabuluhan ay kinakailangan upang maunawaan kung gaano karami ng isang phenomenon ang maaaring gamitin upang hatulan ang phenomenon sa kabuuan at ang mga pattern nito.

Ang pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pananaliksik ay binubuo ng:

1. mga error sa pagiging kinatawan (mga error ng average at relative values) - m;

2. mga limitasyon ng kumpiyansa ng average o kamag-anak na mga halaga;

3. pagiging maaasahan ng pagkakaiba sa average o kamag-anak na mga halaga ayon sa pamantayan t.

Standard error ng arithmetic mean o pagkakamali sa pagiging kinatawan nailalarawan ang pagbabagu-bago ng average. Dapat tandaan na kung mas malaki ang laki ng sample, mas maliit ang pagkalat ng mga average na halaga. Ang karaniwang error ng mean ay kinakalkula gamit ang formula:

Sa modernong siyentipikong panitikan, ang arithmetic mean ay isinulat kasama ng error sa representasyon:

o kasama ng karaniwang paglihis:

Bilang halimbawa, isaalang-alang ang data sa 1,500 urban clinics sa bansa (pangkalahatang populasyon). Ang average na bilang ng mga pasyente na nagsilbi sa klinika ay 18,150 katao. Ang random na pagpili ng 10% ng mga site (150 klinika) ay nagbibigay ng average na bilang ng mga pasyente na katumbas ng 20,051 katao. Ang error sa sampling, malinaw naman dahil sa katotohanan na hindi lahat ng 1500 na klinika ay kasama sa sample, ay katumbas ng pagkakaiba sa pagitan ng mga average na ito - ang pangkalahatang average ( M gene) at sample mean ( M napili). Kung bubuo tayo ng isa pang sample na may parehong laki mula sa ating populasyon, magbibigay ito ng ibang halaga ng error. Ang lahat ng sample na ito ay nangangahulugan na may sapat na malalaking sample ay karaniwang ipinamamahagi sa paligid ng pangkalahatang mean na may sapat na malaki malaking bilang pag-uulit ng isang sample ng parehong bilang ng mga bagay mula sa isang populasyon. Standard error ng mean m- ito ang hindi maiiwasang pagkalat ng sample na paraan sa paligid ng pangkalahatang mean.

Sa kaso kapag ang mga resulta ng pananaliksik ay ipinakita sa mga kamag-anak na dami (halimbawa, mga porsyento) - kinakalkula karaniwang error ng fraction:

kung saan ang P ay ang indicator sa %, n ay ang bilang ng mga obserbasyon.

Ang resulta ay ipinapakita bilang (P ± m)%. Halimbawa, ang porsyento ng paggaling sa mga pasyente ay (95.2±2.5)%.

Sa kaganapan na ang bilang ng mga elemento ng populasyon, pagkatapos ay kapag kinakalkula ang mga karaniwang error ng mean at ang fraction sa denominator ng fraction, sa halip nadapat ilagay.

Para sa isang normal na distribusyon (normal ang distribusyon ng sample na paraan), alam natin kung anong bahagi ng populasyon ang nasa loob ng anumang pagitan sa paligid ng ibig sabihin. Sa partikular:

Sa pagsasagawa, ang problema ay ang mga katangian ng pangkalahatang populasyon ay hindi alam sa amin, at ang sample ay ginawa nang tumpak para sa layunin ng pagtantya sa kanila. Nangangahulugan ito na kung gumawa tayo ng mga sample ng parehong laki n mula sa pangkalahatang populasyon, pagkatapos ay sa 68.3% ng mga kaso ang pagitan ay maglalaman ng halaga M(sa 95.5% ng mga kaso ito ay nasa pagitan at sa 99.7% ng mga kaso - sa pagitan).

Dahil isang sample lamang ang aktwal na kinuha, ang pahayag na ito ay nabuo sa mga tuntunin ng posibilidad: na may posibilidad na 68.3%, ang average na halaga ng katangian sa populasyon ay nasa pagitan, na may posibilidad na 95.5% - sa pagitan, atbp.

Sa pagsasagawa, ang isang pagitan ay binuo sa paligid ng sample na halaga na, na may ibinigay na (sapat na mataas) na posibilidad, posibilidad ng kumpiyansa -"sasaklawin" ang tunay na halaga ng parameter na ito sa pangkalahatang populasyon. Ang agwat na ito ay tinatawag agwat ng kumpiyansa.

probabilidad ng kumpiyansaP ito ang antas ng kumpiyansa na ang agwat ng kumpiyansa ay talagang maglalaman ng tunay (hindi kilalang) halaga ng parameter sa populasyon.

Halimbawa, kung ang posibilidad ng kumpiyansa R ay 90%, nangangahulugan ito na 90 sample sa 100 ang magbibigay ng tamang pagtatantya ng parameter sa populasyon. Alinsunod dito, ang posibilidad ng pagkakamali, i.e. maling pagtatantya ng pangkalahatang average para sa sample ay katumbas ng porsyento: . Para sa halimbawang ito, nangangahulugan ito na ang 10 sample sa 100 ay magbibigay ng maling pagtatantya.

Malinaw, ang antas ng kumpiyansa (confidence probability) ay nakasalalay sa laki ng agwat: mas malawak ang pagitan, mas mataas ang kumpiyansa na mahuhulog dito ang isang hindi kilalang halaga para sa populasyon. Sa pagsasagawa, hindi bababa sa dalawang beses ang sampling error ay ginagamit upang bumuo ng isang confidence interval upang magbigay ng hindi bababa sa 95.5% kumpiyansa.

Ang pagtukoy sa mga limitasyon ng kumpiyansa ng mga average at kamag-anak na mga halaga ay nagbibigay-daan sa amin upang mahanap ang kanilang dalawang matinding halaga - ang pinakamababang posible at ang maximum na posible, kung saan ang pinag-aralan na tagapagpahiwatig ay maaaring mangyari sa buong populasyon. Batay dito, mga limitasyon ng kumpiyansa (o agwat ng kumpiyansa)- ito ang mga hangganan ng average o kamag-anak na mga halaga, na higit sa kung saan dahil sa mga random na pagbabagu-bago ay mayroong isang hindi gaanong posibilidad.

Ang agwat ng kumpiyansa ay maaaring muling isulat bilang: , kung saan t– pamantayan ng kumpiyansa.

Ang mga limitasyon ng kumpiyansa ng arithmetic mean sa populasyon ay tinutukoy ng formula:

M gene = M pumili + t m M

para sa relatibong halaga:

R gene = P pumili + t m R

saan M gene At R gene- mga halaga ng average at kamag-anak na mga halaga para sa pangkalahatang populasyon; M pumili At R pumili- mga halaga ng average at kamag-anak na mga halaga na nakuha mula sa sample na populasyon; m M At m P- mga error ng average at kamag-anak na mga halaga; t- criterion ng kumpiyansa (criterion ng katumpakan, na itinatag kapag nagpaplano ng pag-aaral at maaaring katumbas ng 2 o 3); t m- ito ay isang confidence interval o Δ - ang pinakamataas na error ng indicator na nakuha sa isang sample na pag-aaral.

Dapat pansinin na ang halaga ng criterion t sa isang tiyak na lawak na nauugnay sa posibilidad ng isang walang error na pagtataya (p), na ipinahayag sa %. Pinili ito ng mismong mananaliksik, ginagabayan ng pangangailangang makuha ang resulta na may kinakailangang antas ng katumpakan. Kaya, para sa posibilidad ng isang walang error na pagtataya na 95.5%, ang halaga ng pamantayan ay t ay 2, para sa 99.7% - 3.

Ang ibinigay na mga pagtatantya sa pagitan ng kumpiyansa ay tinatanggap lamang para sa mga istatistikal na populasyon na may higit sa 30 mga obserbasyon Sa mas maliit na laki ng populasyon (maliit na mga sample), ang mga espesyal na talahanayan ay ginagamit upang matukoy ang t criterion. Sa mga talahanayang ito, ang nais na halaga ay matatagpuan sa intersection ng linya na tumutugma sa laki ng populasyon (n-1), at isang column na tumutugma sa antas ng posibilidad ng isang walang error na pagtataya (95.5%; 99.7%) na pinili ng mananaliksik. Sa medikal na pananaliksik, kapag nagtatatag ng mga limitasyon ng kumpiyansa para sa anumang tagapagpahiwatig, ang posibilidad ng isang walang error na pagtataya ay 95.5% o higit pa. Nangangahulugan ito na ang halaga ng indicator na nakuha mula sa sample na populasyon ay dapat matagpuan sa pangkalahatang populasyon sa hindi bababa sa 95.5% ng mga kaso.

    Mga tanong sa paksa ng aralin:

    Kaugnayan ng mga tagapagpahiwatig ng pagkakaiba-iba ng katangian sa isang istatistikal na populasyon.

    Pangkalahatang katangian ng mga tagapagpahiwatig ng ganap na pagkakaiba-iba.

    Standard deviation, pagkalkula, aplikasyon.

    Mga kamag-anak na sukat ng pagkakaiba-iba.

    Median, quartile na marka.

    Pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pag-aaral.

    Standard error ng arithmetic mean, formula ng pagkalkula, halimbawa ng paggamit.

    Pagkalkula ng proporsyon at ang karaniwang error nito.

    Ang konsepto ng posibilidad ng kumpiyansa, isang halimbawa ng paggamit.

10. Ang konsepto ng isang agwat ng kumpiyansa, ang aplikasyon nito.

    Subukan ang mga gawain sa paksa na may karaniwang mga sagot:

1. MGA GANAP NA INDICATOR NG VARIATION AY TUNGKOL SA

1) koepisyent ng pagkakaiba-iba

2) koepisyent ng oscillation

4) panggitna

2. MGA RELATIVE INDICATOR NG VARIATION RELATE

1) pagpapakalat

4) koepisyent ng pagkakaiba-iba

3. CRITERION NA TINUTUKOY NG MGA SOBRANG HALAGA NG ISANG OPTION SA ISANG VARIATION SERIES

2) amplitude

3) pagpapakalat

4) koepisyent ng pagkakaiba-iba

4. ANG PAGKAKAIBA NG MGA SOBRANG OPSYON AY

2) amplitude

3) karaniwan karaniwang paglihis

4) koepisyent ng pagkakaiba-iba

5. ANG AVERAGE SQUARE NG MGA PAGLILIHIS NG INDIBIDWAL NA HALAGA NG ISANG KATANGIAN MULA SA AVERAGE NA HALAGA NITO AY

1) koepisyent ng oscillation

2) panggitna

3) pagpapakalat

6. ANG RATIO NG SCALE OF VARIATION SA AVERAGE VALUE NG ISANG CHARACTER AY

1) koepisyent ng pagkakaiba-iba

2) karaniwang paglihis

4) koepisyent ng oscillation

7. ANG RATIO NG AVERAGE SQUARE DEVIATION SA AVERAGE VALUE NG ISANG KATANGIAN AY

1) pagpapakalat

2) koepisyent ng pagkakaiba-iba

3) koepisyent ng oscillation

4) amplitude

8. ANG OPTION NA NASA GITNA NG VARIATION SERIES AT HINATI ITO SA DALAWANG PANTAY NA BAHAGI AY

1) panggitna

3) amplitude

9. SA MEDIKAL NA PANANALIKSIK, KAPAG NAGTATATAG NG MGA LIMITASYON NG PAGTIWALA PARA SA ANUMANG INDICATOR, ANG PROBABILIDAD NG WALANG ERROR NA PREDICTION AY TATANGGAP.

10. KUNG 90 SAMPLE SA 100 ANG NAGBIBIGAY NG TAMANG TANTA NG ISANG PARAMETER SA POPULASYON, IBIG SABIHIN NITO NA ANG PROBABILIDAD NG PAGTIWALA P PANTAY

11. KUNG 10 SAMPLE SA 100 ANG MAGBIBIGAY NG MALING PAGTAYA, ANG PROBABILIDAD NG ERROR AY PANTAY.

12. MGA LIMITASYON NG AVERAGE O KAUGNAY NA MGA HALAGA, HIGIT PA NA DAHIL SA RANDOM OSCILLATIONS AY MAY MALIIT NA PROBABILIDAD – ITO AY

1) agwat ng kumpiyansa

2) amplitude

4) koepisyent ng pagkakaiba-iba

13. ISANG MALIIT NA HALIMBAWA AY ITINURAD NA POPULASYON NA KUNG SAAN

1) ang n ay mas mababa sa o katumbas ng 100

2) ang n ay mas mababa sa o katumbas ng 30

3) ang n ay mas mababa sa o katumbas ng 40

4) n ay malapit sa 0

14. PARA SA PROBABILIDAD NG WALANG ERROR na PAGTATAYA 95% NA HALAGA NG CRITERION t AY

15. PARA SA PROBABILIDAD NG WALANG ERROR FORECAST 99% CRITERION VALUE t AY

16. PARA SA MGA DISTRIBUTION NA MALAPIT SA NORMAL, ANG POPULASYON AY ITINUTURING HOMOGENEOUS KUNG ANG COEFFICIENT OF VARIATION AY HINDI HIGIT SA

17. OPTION, SEPARATING OPTIONS, NUMERICAL VALUES NA HINDI HIGIT SA 25% NG MAXIMUM POSSIBLE SA ISANG BIGAY NA SERYE – ITO AY

2) mas mababang quartile

3) itaas na quartile

4) quartile

18. ANG DATOS NA HINDI NAKAKABITI AT TAMA NA NAGSASALIN ANG LAYUNIN NA REALIDAD AY TINATAWAG

1) imposible

2) pantay na posible

3) maaasahan

4) random

19. AYON SA PANUNTUNAN NG "THREE Sigma", NA MAY NORMAL NA PAGHAHATID NG KATANGIAN SA LOOB.
MATATAGPUAN

1) 68.3% na opsyon

Ang karaniwang paglihis ay isang klasikong tagapagpahiwatig ng pagkakaiba-iba mula sa mga istatistikang naglalarawan.

Standard Deviation, karaniwang paglihis, Standard deviation, sample standard deviation (eng. standard deviation, STD, STDev) ay isang napakakaraniwang indicator ng dispersion sa mga deskriptibong istatistika. Pero, kasi ang teknikal na pagsusuri ay katulad ng mga istatistika; ang tagapagpahiwatig na ito ay maaaring (at dapat) gamitin sa teknikal na pagsusuri upang makita ang antas ng pagpapakalat ng presyo ng nasuri na instrumento sa paglipas ng panahon. Tinutukoy ng simbolong Griyego na Sigma "σ".

Salamat kina Carl Gauss at Pearson sa pagpapahintulot sa amin na gumamit ng standard deviation.

Gamit standard deviation sa teknikal na pagsusuri, iikot natin ito "index ng pagpapakalat""V "tagapagpahiwatig ng pagkasumpungin", pinapanatili ang kahulugan, ngunit binabago ang mga termino.

Ano ang standard deviation

Ngunit bukod sa mga intermediate auxiliary kalkulasyon, ang standard deviation ay medyo katanggap-tanggap para sa independiyenteng pagkalkula at mga aplikasyon sa teknikal na pagsusuri. Bilang isang aktibong mambabasa ng aming magazine burdock nabanggit, " Hindi ko pa rin maintindihan kung bakit hindi kasama ang standard deviation sa set ng standard indicators ng domestic dealing centers«.

talaga, masusukat ng standard deviation ang pagkakaiba-iba ng isang instrumento sa isang klasiko at "dalisay" na paraan. Ngunit sa kasamaang palad, ang tagapagpahiwatig na ito ay hindi pangkaraniwan sa pagsusuri ng mga mahalagang papel.

Paglalapat ng standard deviation

Ang manu-manong pagkalkula ng standard deviation ay hindi masyadong interesante, ngunit kapaki-pakinabang para sa karanasan. Maaaring ipahayag ang standard deviation formula STD=√[(∑(x-x ) 2)/n] , na parang ugat ng kabuuan ng mga parisukat ng mga pagkakaiba sa pagitan ng mga elemento ng sample at ng mean, na hinati sa bilang ng mga elemento sa sample.

Kung ang bilang ng mga elemento sa sample ay lumampas sa 30, kung gayon ang denominator ng fraction sa ilalim ng ugat ay kukuha ng halaga n-1. Kung hindi n ay ginagamit.

Hakbang-hakbang karaniwang pagkalkula ng paglihis:

  1. kalkulahin ang arithmetic mean ng sample ng data
  2. ibawas ang average na ito mula sa bawat sample na elemento
  3. parisukat namin ang lahat ng mga resultang pagkakaiba
  4. buuin ang lahat ng resultang mga parisukat
  5. hatiin ang nagresultang halaga sa bilang ng mga elemento sa sample (o sa n-1, kung n>30)
  6. kalkulahin ang square root ng nagresultang quotient (tinatawag na pagpapakalat)

Ang pinakaperpektong katangian ng variation ay ang mean square deviation, na tinatawag na standard (o standard deviation). Standard deviation() ay katumbas ng square root ng average na square deviation ng mga indibidwal na halaga ng attribute mula sa arithmetic mean:

Ang karaniwang paglihis ay simple:

Inilapat ang weighted standard deviation sa nakagrupong data:

Sa pagitan ng mean square at mean linear deviations sa ilalim ng mga kundisyon normal na pamamahagi ang sumusunod na ratio ay nagaganap: ~ 1.25.

Ang karaniwang paglihis, bilang pangunahing ganap na sukatan ng pagkakaiba-iba, ay ginagamit sa pagtukoy ng mga ordinate na halaga ng isang normal na curve ng pamamahagi, sa mga kalkulasyon na may kaugnayan sa organisasyon ng sample na pagmamasid at pagtatatag ng katumpakan ng mga katangian ng sample, pati na rin sa pagtatasa ng mga limitasyon ng pagkakaiba-iba ng isang katangian sa isang homogenous na populasyon.

Ang pagpapakalat, mga uri nito, karaniwang paglihis.

Pagkakaiba-iba ng isang random na variable— isang sukatan ng pagkalat ng isang ibinigay na random variable, ibig sabihin, ang paglihis nito mula sa inaasahan sa matematika. Sa mga istatistika, ang notasyon o ay kadalasang ginagamit. Kuwadrado na ugat ng variance ay tinatawag na standard deviation, standard deviation, o standard spread.

Kabuuang pagkakaiba (σ 2) sinusukat ang pagkakaiba-iba ng isang katangian sa kabuuan nito sa ilalim ng impluwensya ng lahat ng mga salik na naging sanhi ng pagkakaiba-iba na ito. Kasabay nito, salamat sa paraan ng pagpapangkat, posibleng kilalanin at sukatin ang pagkakaiba-iba dahil sa katangian ng pagpapangkat at ang pagkakaiba-iba na nagmumula sa ilalim ng impluwensya ng hindi natukoy na mga kadahilanan.

pagkakaiba-iba sa pagitan ng pangkat (σ 2 m.gr) ay nagpapakilala sa sistematikong pagkakaiba-iba, ibig sabihin, mga pagkakaiba sa halaga ng pinag-aralan na katangian na lumitaw sa ilalim ng impluwensya ng katangian - ang kadahilanan na bumubuo sa batayan ng grupo.

Standard deviation(kasingkahulugan: standard deviation, standard deviation, square deviation; kaugnay na termino: standard deviation, standard spread) - sa probability theory at statistics, ang pinakakaraniwang indicator ng dispersion ng mga value ng random variable na nauugnay sa matematikal na inaasahan nito. Sa limitadong array ng mga sample value, ginagamit ang arithmetic mean ng set ng mga sample sa halip na ang mathematical expectation.

Ang karaniwang paglihis ay sinusukat sa mga yunit ng pagsukat ng random na variable mismo at ginagamit kapag kinakalkula ang karaniwang error ng arithmetic mean, kapag bumubuo ng mga pagitan ng kumpiyansa, kapag sinusukat ng istatistika ang mga hypotheses, kapag sinusukat ang linear na relasyon sa pagitan ng mga random na variable. Tinukoy bilang square root ng variance ng isang random variable.


Standard deviation:

Standard Deviation(pagtantiya ng karaniwang paglihis ng isang random na variable x kaugnay sa inaasahan sa matematika nito batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba nito):

nasaan ang pagpapakalat; — i ika elemento ng pagpili; - laki ng sample; — arithmetic mean ng sample:

Dapat tandaan na ang parehong mga pagtatantya ay may kinikilingan. SA pangkalahatang kaso Imposibleng bumuo ng walang pinapanigan na pagtatantya. Gayunpaman, ang pagtatantya batay sa walang pinapanigan na pagtatantya ng pagkakaiba ay pare-pareho.

Kakanyahan, saklaw at pamamaraan para sa pagtukoy ng mode at median.

Bilang karagdagan sa mga average ng kapangyarihan sa mga istatistika para sa mga kamag-anak na katangian ng halaga ng iba't ibang katangian at panloob na istraktura Ang mga serye ng pamamahagi ay gumagamit ng mga istrukturang average, na pangunahing kinakatawan ng fashion at median.

Fashion- Ito ang pinakakaraniwang variant ng serye. Ang fashion ay ginagamit, halimbawa, sa pagtukoy ng laki ng mga damit at sapatos na pinaka-in demand sa mga customer. Ang mode para sa isang discrete series ay ang may pinakamataas na frequency. Kapag kinakalkula ang mode para sa isang serye ng pagkakaiba-iba ng pagitan, kailangan mo munang matukoy ang modal interval (batay sa maximum na dalas), at pagkatapos ay ang halaga ng modal value ng attribute gamit ang formula:

- - halaga ng fashion

- — mas mababang limitasyon ng modal interval

- — halaga ng pagitan

- — dalas ng agwat ng modal

- — dalas ng agwat bago ang modal

- — dalas ng agwat kasunod ng modal

Median - ito ang halaga ng attribute na sumasailalim sa ranggo na serye at hinahati ang seryeng ito sa dalawang magkapantay na bahagi.

Upang matukoy ang median sa isang discrete na serye sa pagkakaroon ng mga frequency, kalkulahin muna ang kalahating kabuuan ng mga frequency at pagkatapos ay tukuyin kung aling halaga ng variant ang nahuhulog dito. (Kung ang pinagsunod-sunod na serye ay naglalaman ng kakaibang bilang ng mga tampok, ang median na numero ay kinakalkula gamit ang formula:

M e = (n (bilang ng mga feature sa kabuuan) + 1)/2,

sa kaso ng pantay na bilang ng mga feature, ang median ay magiging katumbas ng average ng dalawang feature sa gitna ng row).

Kapag nagkalkula median para sa isang serye ng pagkakaiba-iba ng pagitan, tukuyin muna ang median interval kung saan matatagpuan ang median, at pagkatapos ay tukuyin ang halaga ng median gamit ang formula:

- — ang kinakailangang median

- - mas mababang limitasyon ng pagitan na naglalaman ng median

- — halaga ng pagitan

- — kabuuan ng mga frequency o bilang ng mga termino ng serye

Kabuuan ng mga naipon na frequency ng mga pagitan bago ang median

- — dalas ng median interval

Halimbawa. Hanapin ang mode at median.

Solusyon:
SA sa halimbawang ito ang modal interval ay nasa loob ng pangkat ng edad na 25-30 taon, dahil ang agwat na ito ay tumutukoy sa pinakamataas na dalas (1054).

Kalkulahin natin ang magnitude ng mode:

Nangangahulugan ito na ang modal age ng mga mag-aaral ay 27 taon.

Kalkulahin natin ang median. Ang median interval ay nasa pangkat ng edad na 25-30 taon, dahil sa loob ng agwat na ito mayroong isang opsyon na naghahati sa populasyon sa dalawang pantay na bahagi (Σf i /2 = 3462/2 = 1731). Susunod, pinapalitan namin ang kinakailangang numerical data sa formula at makuha ang median na halaga:

Nangangahulugan ito na ang kalahati ng mga mag-aaral ay wala pang 27.4 taong gulang, at ang kalahati ay higit sa 27.4 taong gulang.

Bilang karagdagan sa mode at median, ang mga tagapagpahiwatig tulad ng mga quartile ay maaaring gamitin, na naghahati sa ranggo na serye sa 4 na pantay na bahagi, deciles- 10 bahagi at porsyento - bawat 100 bahagi.

Ang konsepto ng selective observation at saklaw nito.

Selective observation nalalapat kapag ang paggamit ng patuloy na pagsubaybay pisikal na imposible dahil sa malaking halaga ng data o hindi magagawa sa ekonomiya. Ang pisikal na imposibilidad ay nangyayari, halimbawa, kapag pinag-aaralan ang mga daloy ng pasahero, mga presyo sa merkado, at mga badyet ng pamilya. Ang kakulangan sa ekonomiya ay nangyayari kapag tinatasa ang kalidad ng mga kalakal na nauugnay sa kanilang pagkasira, halimbawa, pagtikim, pagsubok ng mga brick para sa lakas, atbp.

Ang mga statistical unit na pinili para sa pagmamasid ay bumubuo sa sampling frame o sample, at ang kanilang buong array ay bumubuo sa pangkalahatang populasyon (GS). Sa kasong ito, ang bilang ng mga yunit sa sample ay tinutukoy ng n, at sa buong HS - N. Saloobin n/N tinatawag na relatibong laki o proporsyon ng sample.

Ang kalidad ng mga resulta ng obserbasyon ng sample ay nakasalalay sa pagiging kinatawan ng sample, iyon ay, kung gaano ito kinatawan sa HS. Upang matiyak ang pagiging kinatawan ng sample, kinakailangan na sumunod prinsipyo ng random na pagpili ng mga yunit, na ipinapalagay na ang pagsasama ng isang unit ng HS sa sample ay hindi maaaring maimpluwensyahan ng anumang kadahilanan maliban sa pagkakataon.

Umiiral 4 na paraan ng random na pagpili para sample:

  1. Talagang random pagpili o ang "paraan ng lotto", kapag ang mga istatistikal na dami ay itinalaga ng mga serial number, naitala sa ilang partikular na bagay (halimbawa, mga bariles), na pagkatapos ay ihalo sa ilang lalagyan (halimbawa, sa isang bag) at pinili nang random. Sa pagsasagawa, ang pamamaraang ito ay isinasagawa gamit ang isang generator random na mga numero o mga mathematical table ng mga random na numero.
  2. Mekanikal pagpili ayon sa kung saan ang bawat ( N/n)-ika halaga ng pangkalahatang populasyon. Halimbawa, kung naglalaman ito ng 100,000 value, at kailangan mong pumili ng 1,000, isasama sa sample ang bawat 100,000 / 1000 = 100th value. Bukod dito, kung hindi sila niraranggo, ang una ay pinili nang random mula sa unang daan, at ang mga bilang ng iba ay magiging isang daan na mas mataas. Halimbawa, kung ang unang yunit ay No. 19, ang susunod ay dapat na No. 119, pagkatapos ay No. 219, pagkatapos ay No. 319, atbp. Kung ang mga yunit ng populasyon ay niraranggo, pagkatapos ay ang No. 50 ay napili muna, pagkatapos ay ang No. 150, pagkatapos ay ang No. 250, at iba pa.
  3. Ang pagpili ng mga halaga mula sa isang magkakaibang hanay ng data ay isinasagawa pinagsasapin-sapin(stratified) na paraan, kapag ang populasyon ay unang nahahati sa magkakatulad na mga grupo kung saan inilalapat ang random o mekanikal na pagpili.
  4. Ang isang espesyal na paraan ng sampling ay serial pagpili, kung saan random o mekanikal na pinipili nila hindi ang mga indibidwal na halaga, ngunit ang kanilang mga serye (mga pagkakasunud-sunod mula sa ilang numero hanggang sa ilang numero sa isang hilera), kung saan isinasagawa ang patuloy na pagmamasid.

Ang kalidad ng mga sample na obserbasyon ay nakasalalay din sa uri ng sample: paulit-ulit o hindi na mauulit.

Sa muling pagpili Ang mga istatistikal na halaga o ang kanilang serye na kasama sa sample ay ibinabalik sa pangkalahatang populasyon pagkatapos gamitin, na may pagkakataong maisama sa isang bagong sample. Bukod dito, ang lahat ng mga halaga sa populasyon ay may parehong posibilidad ng pagsasama sa sample.

Hindi paulit-ulit na pagpili nangangahulugan na ang mga istatistikal na halaga o ang kanilang mga serye na kasama sa sample ay hindi babalik sa pangkalahatang populasyon pagkatapos gamitin, at samakatuwid para sa natitirang mga halaga ng huli ang posibilidad na mapabilang sa susunod na pagtaas ng sample.

Ang hindi paulit-ulit na sampling ay nagbibigay ng mas tumpak na mga resulta, kaya mas madalas itong ginagamit. Ngunit may mga sitwasyon na hindi ito mailalapat (pag-aaral ng mga daloy ng pasahero, demand ng consumer, atbp.) at pagkatapos ay isinasagawa ang paulit-ulit na pagpili.

Maximum na observation sampling error, average sampling error, procedure para sa kanilang pagkalkula.

Isaalang-alang natin nang detalyado ang mga paraan ng pagbuo ng isang sample na populasyon na nakalista sa itaas at ang mga error na lumabas kapag ginagawa ito. pagiging kinatawan .
Tamang random Ang sampling ay batay sa pagpili ng mga yunit mula sa populasyon nang random nang walang anumang sistematikong elemento. Sa teknikal, ang aktwal na random na pagpili ay isinasagawa sa pamamagitan ng pagguhit ng mga lot (halimbawa, mga lottery) o paggamit ng talahanayan ng mga random na numero.

Ang wastong random na pagpili "sa dalisay nitong anyo" ay bihirang ginagamit sa pagsasanay ng pumipili na pagmamasid, ngunit ito ang orihinal sa iba pang mga uri ng pagpili, ipinapatupad nito ang mga pangunahing prinsipyo ng pumipili na pagmamasid. Isaalang-alang natin ang ilang mga katanungan ng teorya ng paraan ng sampling at ang formula ng error para sa isang simpleng random na sample.

Sampling bias ay ang pagkakaiba sa pagitan ng halaga ng parameter sa pangkalahatang populasyon at ang halaga nito na kinakalkula mula sa mga resulta ng sample na pagmamasid. Para sa isang average na quantitative na katangian, ang sampling error ay tinutukoy ng

Ang tagapagpahiwatig ay tinatawag na marginal sampling error.
Ang sample mean ay isang random na variable na maaaring tumagal iba't ibang kahulugan depende sa kung aling mga yunit ang kasama sa sample. Samakatuwid, ang mga sampling error ay mga random na variable din at maaaring tumagal sa iba't ibang mga halaga. Samakatuwid, tukuyin ang average ng posibleng mga pagkakamali - average sampling error, na depende sa:

Laki ng sample: mas malaki ang numero, mas maliit ang average na error;

Ang antas ng pagbabago sa katangiang pinag-aaralan: mas maliit ang pagkakaiba-iba ng katangian, at, dahil dito, ang dispersion, mas maliit ang average na error sa sampling.

Sa random na muling pagpili ang average na error ay kinakalkula:
.
Sa pagsasagawa, ang pangkalahatang pagkakaiba ay hindi tiyak na kilala, ngunit sa teorya ng posibilidad napatunayan na yan
.
Dahil ang halaga para sa sapat na malaking n ay malapit sa 1, maaari nating ipagpalagay na . Pagkatapos ay maaaring kalkulahin ang average na sampling error:
.
Ngunit sa mga kaso ng isang maliit na sample (na may n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Sa random na hindi paulit-ulit na sampling ang mga ibinigay na formula ay inaayos ayon sa halaga . Kung gayon ang karaniwang hindi paulit-ulit na sampling error ay:
At .
kasi ay palaging mas mababa, pagkatapos ang multiplier () ay palaging mas mababa sa 1. Nangangahulugan ito na ang average na error sa panahon ng hindi paulit-ulit na pagpili ay palaging mas mababa kaysa sa paulit-ulit na pagpili.
Mechanical sampling ay ginagamit kapag ang pangkalahatang populasyon ay inayos sa ilang paraan (halimbawa, mga alpabetikong listahan ng mga botante, mga numero ng telepono, mga numero ng bahay, mga numero ng apartment). Ang pagpili ng mga yunit ay isinasagawa sa isang tiyak na agwat, na katumbas ng kabaligtaran ng porsyento ng sampling. Kaya, na may 2% sample, bawat 50 unit = 1/0.02 ay pinili, na may 5% sample, bawat 1/0.05 = 20 unit ng pangkalahatang populasyon.

Ang reference point ay pinili sa iba't ibang paraan: random, mula sa gitna ng interval, na may pagbabago sa reference point. Ang pangunahing bagay ay upang maiwasan ang sistematikong pagkakamali. Halimbawa, na may 5% na sample, kung ang unang yunit ay ang ika-13, kung gayon ang mga susunod ay 33, 53, 73, atbp.

Sa mga tuntunin ng katumpakan, ang mekanikal na pagpili ay malapit sa aktwal na random sampling. Samakatuwid, upang matukoy ang average na error ng mechanical sampling, ang tamang random na mga formula ng pagpili ay ginagamit.

Sa tipikal na seleksyon ang populasyong sinusuri ay paunang nahahati sa magkakatulad, katulad na mga grupo. Halimbawa, kapag nagsusuri ng mga negosyo, ang mga ito ay maaaring mga industriya, mga sub-sektor kapag pinag-aaralan ang populasyon, ito ay maaaring mga rehiyon, panlipunan o mga pangkat ng edad; Pagkatapos ay ang isang independiyenteng pagpili mula sa bawat pangkat ay ginawa nang mekanikal o puro random.

Ang karaniwang sampling ay gumagawa ng mas tumpak na mga resulta kaysa sa iba pang mga pamamaraan. Ang pag-type ng pangkalahatang populasyon ay tumitiyak na ang bawat typological na pangkat ay kinakatawan sa sample, na ginagawang posible na alisin ang impluwensya ng pagkakaiba-iba ng intergroup sa average na error sa sampling. Dahil dito, kapag nahanap ang error ng isang tipikal na sample ayon sa panuntunan ng pagdaragdag ng mga pagkakaiba-iba (), kinakailangang isaalang-alang lamang ang average ng mga pagkakaiba-iba ng pangkat. Kung gayon ang average na sampling error ay:
sa muling pagpili
,
na may hindi paulit-ulit na pagpili
,
saan - ang average ng mga pagkakaiba-iba sa loob ng pangkat sa sample.

Serial (o pugad) na seleksyon ginagamit kapag ang populasyon ay nahahati sa serye o mga grupo bago magsimula ang sample survey. Ang mga seryeng ito ay maaaring packaging ng mga natapos na produkto, mga grupo ng mag-aaral, mga koponan. Ang mga serye para sa pagsusuri ay pinipili nang wala sa loob o puro random, at sa loob ng serye ay isinasagawa ang tuluy-tuloy na pagsusuri ng mga yunit. Samakatuwid, ang average sampling error ay nakasalalay lamang sa intergroup (interseries) variance, na kinakalkula gamit ang formula:

kung saan ang r ay ang bilang ng napiling serye;
- average ng i-th series.

Kinakalkula ang average na serial sampling error:

sa muling pagpili:
,
na may hindi paulit-ulit na pagpili:
,
kung saan ang R ay ang kabuuang bilang ng mga episode.

pinagsama-sama pagpili ay isang kumbinasyon ng mga itinuturing na paraan ng pagpili.

Ang average na error sa sampling para sa anumang paraan ng sampling ay pangunahing nakasalalay sa ganap na laki ng sample at, sa isang mas mababang lawak, sa porsyento ng sample. Ipagpalagay natin na 225 obserbasyon ang ginawa sa unang kaso mula sa populasyon na 4,500 units at sa pangalawa mula sa populasyon na 225,000 units. Ang mga pagkakaiba sa parehong mga kaso ay katumbas ng 25. Pagkatapos, sa unang kaso, na may 5% na pagpili, ang sampling error ay:

Sa pangalawang kaso, na may 0.1% na pagpili, ito ay magiging katumbas ng:


Sa gayon, na may pagbaba sa porsyento ng sampling ng 50 beses, bahagyang tumaas ang error sa sampling, dahil hindi nagbago ang laki ng sample.
Ipagpalagay natin na ang laki ng sample ay nadagdagan sa 625 na mga obserbasyon. Sa kasong ito, ang sampling error ay:

Ang pagtaas ng sample ng 2.8 beses na may parehong laki ng populasyon ay binabawasan ang laki ng sampling error ng higit sa 1.6 na beses.

Mga pamamaraan at pamamaraan para sa pagbuo ng sample na populasyon.

Sa mga istatistika, ginagamit ang iba't ibang paraan ng pagbubuo ng mga sample na populasyon, na tinutukoy ng mga layunin ng pag-aaral at nakasalalay sa mga detalye ng object ng pag-aaral.

Ang pangunahing kondisyon para sa pagsasagawa ng isang sample na survey ay upang maiwasan ang paglitaw ng mga sistematikong pagkakamali na lumitaw bilang isang resulta ng paglabag sa prinsipyo ng pantay na pagkakataon para sa bawat yunit ng pangkalahatang populasyon na maisama sa sample. Ang pag-iwas sa mga sistematikong pagkakamali ay nakakamit sa pamamagitan ng paggamit ng mga pamamaraang nakabatay sa siyentipiko para sa pagbuo ng sample na populasyon.

Mayroong mga sumusunod na pamamaraan para sa pagpili ng mga yunit mula sa populasyon:

1) indibidwal na pagpili - ang mga indibidwal na yunit ay pinili para sa sample;

2) pagpili ng grupo - ang sample ay kinabibilangan ng qualitatively homogenous na mga grupo o serye ng mga yunit na pinag-aaralan;

3) pinagsamang pagpili ay isang kumbinasyon ng indibidwal at pangkat na pagpili.
Ang mga paraan ng pagpili ay tinutukoy ng mga patakaran para sa pagbuo ng sample na populasyon.

Ang sample ay maaaring:

  • random talaga ay binubuo sa katotohanan na ang sample na populasyon ay nabuo bilang isang resulta ng random (hindi sinasadya) na pagpili ng mga indibidwal na yunit mula sa pangkalahatang populasyon. Sa kasong ito, ang bilang ng mga yunit na napili sa sample na populasyon ay karaniwang tinutukoy batay sa tinatanggap na sample na proporsyon. Ang sample na proporsyon ay ang ratio ng bilang ng mga yunit sa sample na populasyon n sa bilang ng mga yunit sa pangkalahatang populasyon N, i.e.
  • mekanikal ay binubuo sa katotohanan na ang pagpili ng mga yunit sa sample na populasyon ay ginawa mula sa pangkalahatang populasyon, na nahahati sa pantay na pagitan (mga grupo). Sa kasong ito, ang laki ng pagitan sa populasyon ay katumbas ng kabaligtaran ng sample na proporsyon. Kaya, na may 2% sample, bawat ika-50 na unit ay pinipili (1:0.02), na may 5% na sample, bawat ika-20 na unit (1:0.05), atbp. Kaya, alinsunod sa tinatanggap na proporsyon ng pagpili, ang pangkalahatang populasyon ay, bilang ito ay, mekanikal na nahahati sa mga grupo ng pantay na laki. Mula sa bawat pangkat, isang yunit lamang ang pipiliin para sa sample.
  • tipikal - kung saan ang pangkalahatang populasyon ay unang nahahati sa homogenous na tipikal na mga grupo. Pagkatapos, mula sa bawat tipikal na pangkat, isang random o mekanikal na sample ang ginagamit upang indibidwal na pumili ng mga unit sa sample na populasyon. Ang isang mahalagang katangian ng isang tipikal na sample ay ang pagbibigay nito ng mas tumpak na mga resulta kumpara sa iba pang mga paraan ng pagpili ng mga yunit sa sample na populasyon;
  • serye- kung saan ang pangkalahatang populasyon ay nahahati sa mga grupo ng pantay na laki - serye. Pinili ang mga serye sa sample na populasyon. Sa loob ng serye, isinasagawa ang patuloy na pagmamasid sa mga yunit na kasama sa serye;
  • pinagsama-sama- Ang sampling ay maaaring dalawang yugto. Sa kasong ito, ang populasyon ay unang nahahati sa mga grupo. Pagkatapos ay pipiliin ang mga grupo, at sa loob ng huli ay pipiliin ang mga indibidwal na yunit.

Sa mga istatistika, mayroong mga sumusunod na pamamaraan para sa pagpili ng mga yunit sa isang sample na populasyon::

  • iisang yugto sampling - ang bawat napiling yunit ay agad na sasailalim sa pag-aaral ayon sa isang ibinigay na pamantayan (wastong random at serial sampling);
  • maraming yugto sampling - ang pagpili ay ginawa mula sa pangkalahatang populasyon ng mga indibidwal na grupo, at ang mga indibidwal na yunit ay pinili mula sa mga grupo (karaniwang sampling na may mekanikal na paraan ng pagpili ng mga yunit sa sample na populasyon).

Bilang karagdagan, mayroong:

  • muling pagpili- ayon sa scheme ng ibinalik na bola. Sa kasong ito, ang bawat yunit o serye na kasama sa sample ay ibinalik sa pangkalahatang populasyon at samakatuwid ay may pagkakataong maisama muli sa sample;
  • ulitin ang pagpili- ayon sa hindi naibalik na bola scheme. Mayroon itong mas tumpak na mga resulta na may parehong laki ng sample.

Pagtukoy sa kinakailangang laki ng sample (gamit ang t-table ng Mag-aaral).

Ang isa sa mga siyentipikong prinsipyo sa teorya ng sampling ay upang matiyak na ang isang sapat na bilang ng mga yunit ay napili. Theoretically, ang pangangailangan na sumunod sa prinsipyong ito ay ipinakita sa mga patunay ng limitasyon ng mga theorems sa probability theory, na ginagawang posible upang maitaguyod kung anong dami ng mga yunit ang dapat piliin mula sa populasyon upang ito ay sapat at matiyak ang pagiging kinatawan ng sample.

Ang pagbaba sa karaniwang error sa sampling, at samakatuwid ay isang pagtaas sa katumpakan ng pagtatantya, ay palaging nauugnay sa isang pagtaas sa laki ng sample, samakatuwid, nasa yugto na ng pag-aayos ng sample na pagmamasid, kinakailangan upang magpasya kung ano ang laki ng ang sample na populasyon ay dapat na upang matiyak ang kinakailangang katumpakan ng mga resulta ng pagmamasid. Ang pagkalkula ng kinakailangang laki ng sample ay binuo gamit ang mga formula na nagmula sa mga formula para sa maximum na mga error sa sampling (A), na naaayon sa isang partikular na uri at paraan ng pagpili. Kaya, para sa isang random na paulit-ulit na laki ng sample (n) mayroon kaming:

Ang kakanyahan ng formula na ito ay na sa isang random na paulit-ulit na pagpili ng kinakailangang numero, ang laki ng sample ay direktang proporsyonal sa parisukat ng koepisyent ng kumpiyansa (t2) at pagkakaiba-iba ng variational na katangian (?2) at inversely proportional sa parisukat ng maximum sampling error (?2). Sa partikular, na may pagtaas sa maximum na error sa pamamagitan ng isang kadahilanan ng dalawa, ang kinakailangang laki ng sample ay maaaring bawasan ng isang kadahilanan ng apat. Sa tatlong parameter, dalawa (t at?) ang itinakda ng mananaliksik.

Kasabay nito, ang mananaliksik, batay sa Mula sa layunin at layunin ng sample na survey, ang tanong ay dapat malutas: sa anong dami ng kumbinasyon ay mas mahusay na isama ang mga parameter na ito upang matiyak ang pinakamainam na opsyon? Sa isang kaso, maaaring mas nasiyahan siya sa pagiging maaasahan ng mga resulta na nakuha (t) kaysa sa sukat ng katumpakan (?), sa isa pa - vice versa. Mas mahirap lutasin ang isyu tungkol sa halaga ng maximum sampling error, dahil ang mananaliksik ay walang indicator na ito sa yugto ng pagdidisenyo ng sample na obserbasyon, samakatuwid, sa pagsasagawa, kaugalian na itakda ang halaga ng maximum sampling error, karaniwang nasa loob ng 10% ng inaasahang average na antas ng katangian. Ang pagtatatag ng tinantyang average ay maaaring lapitan sa iba't ibang paraan: gamit ang data mula sa mga katulad na nakaraang survey, o paggamit ng data mula sa sampling frame at pagsasagawa ng maliit na pilot sample.

Ang pinakamahirap na bagay na itatag kapag nagdidisenyo ng isang sample na pagmamasid ay ang ikatlong parameter sa formula (5.2) - ang pagpapakalat ng sample na populasyon. Sa kasong ito, kinakailangang gamitin ang lahat ng impormasyon sa pagtatapon ng mananaliksik, na nakuha sa dati nang isinagawa na katulad at pilot na mga survey.

Tanong tungkol sa kahulugan ang kinakailangang laki ng sample ay nagiging mas kumplikado kung ang sampling survey ay nagsasangkot ng pag-aaral ng ilang katangian ng sampling units. Sa kasong ito, ang mga average na antas ng bawat isa sa mga katangian at ang kanilang pagkakaiba-iba, bilang panuntunan, ay naiiba, at samakatuwid, ang pagpapasya kung aling pagkakaiba-iba ng kung alin sa mga katangian ang bibigyan ng kagustuhan ay posible lamang na isinasaalang-alang ang layunin at layunin ng survey.

Kapag nagdidisenyo ng isang sample na pagmamasid, ang isang paunang natukoy na halaga ng pinahihintulutang sampling error ay ipinapalagay alinsunod sa mga layunin ng isang partikular na pag-aaral at ang posibilidad ng mga konklusyon batay sa mga resulta ng pagmamasid.

Sa pangkalahatan, ang formula para sa maximum na error ng sample na average ay nagbibigay-daan sa amin upang matukoy:

Ang laki ng mga posibleng paglihis ng pangkalahatang mga tagapagpahiwatig ng populasyon mula sa mga sample na tagapagpahiwatig ng populasyon;

Ang kinakailangang laki ng sample, na tinitiyak ang kinakailangang katumpakan, kung saan ang mga limitasyon ng posibleng error ay hindi lalampas sa isang tiyak na tinukoy na halaga;

Ang posibilidad na ang error sa sample ay magkakaroon ng tinukoy na limitasyon.

Pamamahagi ng mag-aaral sa probability theory, ito ay isang isang-parameter na pamilya ng ganap na tuluy-tuloy na mga distribusyon.

Dynamic na serye (interval, moment), pagsasara ng dynamic na serye.

Serye ng dinamika- ito ang mga halaga ng mga istatistikal na tagapagpahiwatig na ipinakita sa isang tiyak na pagkakasunud-sunod na magkakasunod.

Ang bawat serye ng oras ay naglalaman ng dalawang bahagi:

1) mga tagapagpahiwatig ng mga yugto ng panahon (taon, quarters, buwan, araw o petsa);

2) mga tagapagpahiwatig na nagpapakilala sa bagay na pinag-aaralan para sa mga yugto ng panahon o sa kaukulang mga petsa, na tinatawag na mga antas ng serye.

Ang mga antas ng serye ay ipinahayag parehong absolute at average o relative values. Depende sa likas na katangian ng mga tagapagpahiwatig, ang serye ng oras ng ganap, kamag-anak at average na mga halaga ay binuo. Ang mga dinamikong serye mula sa mga kamag-anak at average na mga halaga ay itinayo batay sa nagmula na serye ng mga ganap na halaga. Mayroong agwat at sandali na serye ng dynamics.

Mga serye ng dynamic na pagitan naglalaman ng mga halaga ng tagapagpahiwatig para sa ilang mga tagal ng panahon. Sa isang serye ng agwat, maaaring buuin ang mga antas upang makuha ang dami ng phenomenon sa mas mahabang panahon, o ang tinatawag na mga naipon na kabuuan.

Mga serye ng dinamikong sandali sumasalamin sa mga halaga ng mga tagapagpahiwatig sa isang tiyak na punto ng oras (petsa ng oras). Sa serye ng sandali, maaaring interesado lang ang mananaliksik sa pagkakaiba sa mga phenomena na nagpapakita ng pagbabago sa antas ng serye sa pagitan ng ilang partikular na petsa, dahil ang kabuuan ng mga antas dito ay walang tunay na nilalaman. Ang mga pinagsama-samang kabuuan ay hindi kinakalkula dito.

Ang pinakamahalagang kondisyon para sa tamang pagtatayo ng serye ng oras ay ang pagiging maihahambing ng mga antas ng serye na kabilang sa iba't ibang panahon. Ang mga antas ay dapat na iharap sa magkakatulad na dami, at dapat mayroong pantay na pagkakumpleto ng saklaw ng iba't ibang bahagi ng kababalaghan.

Upang Upang maiwasan ang pagbaluktot ng tunay na dinamika, sa isang istatistikal na pag-aaral ang mga paunang kalkulasyon ay isinasagawa (pagsasara ng serye ng dinamika), na nauuna sa istatistikal na pagsusuri ng serye ng oras. Ang pagsasara ng dynamic na serye ay nauunawaan bilang kumbinasyon sa isang serye ng dalawa o higit pang serye, ang mga antas nito ay kinakalkula gamit ang iba't ibang pamamaraan o hindi tumutugma sa mga hangganan ng teritoryo, atbp. Ang pagsasara ng serye ng dynamics ay maaari ring magpahiwatig ng pagdadala ng mga ganap na antas ng serye ng dynamics sa isang karaniwang batayan, na neutralisahin ang hindi pagkakatulad ng mga antas ng serye ng dynamics.

Ang konsepto ng comparability ng dynamics series, coefficients, growth at growth rate.

Serye ng dinamika— ito ay isang serye ng mga istatistikal na tagapagpahiwatig na nagpapakilala sa pag-unlad ng natural at panlipunang phenomena sa paglipas ng panahon. Ang mga koleksyon ng istatistika na inilathala ng Komite ng Istatistika ng Estado ng Russia ay naglalaman ng isang malaking bilang ng mga serye ng dinamika sa anyo ng tabular. Ginagawang posible ng dinamikong serye na matukoy ang mga pattern ng pagbuo ng mga phenomena na pinag-aaralan.

Ang serye ng Dynamics ay naglalaman ng dalawang uri ng mga indicator. Mga tagapagpahiwatig ng oras(mga taon, quarter, buwan, atbp.) o mga punto sa oras (sa simula ng taon, sa simula ng bawat buwan, atbp.). Mga tagapagpahiwatig ng antas ng hilera. Ang mga tagapagpahiwatig ng mga antas ng serye ng dinamika ay maaaring ipahayag sa mga ganap na halaga (produksyon ng produkto sa tonelada o rubles), mga kamag-anak na halaga (bahagi ng populasyon ng lunsod sa %) at mga average na halaga (average na sahod ng mga manggagawa sa industriya ayon sa taon. , atbp.). Sa anyong tabular, ang isang serye ng oras ay naglalaman ng dalawang column o dalawang row.

Ang tamang pagtatayo ng time series ay nangangailangan ng katuparan ng ilang mga kinakailangan:

  1. ang lahat ng mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat na batay sa siyensya at maaasahan;
  2. ang mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat na maihahambing sa paglipas ng panahon, i.e. dapat kalkulahin para sa parehong mga yugto ng panahon o sa parehong mga petsa;
  3. ang mga tagapagpahiwatig ng isang bilang ng mga dinamika ay dapat na maihahambing sa buong teritoryo;
  4. ang mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat na maihahambing sa nilalaman, i.e. kinakalkula ayon sa isang solong pamamaraan, sa parehong paraan;
  5. ang mga tagapagpahiwatig ng isang bilang ng mga dinamika ay dapat na maihahambing sa hanay ng mga sakahan na isinasaalang-alang. Ang lahat ng mga tagapagpahiwatig ng isang serye ng mga dinamika ay dapat ibigay sa parehong mga yunit ng pagsukat.

Mga tagapagpahiwatig ng istatistika maaaring makilala ang alinman sa mga resulta ng prosesong pinag-aaralan sa loob ng isang yugto ng panahon, o ang estado ng phenomenon na pinag-aaralan sa isang tiyak na punto ng panahon, i.e. Ang mga tagapagpahiwatig ay maaaring agwat (pana-panahon) at panandalian. Alinsunod dito, sa simula ang serye ng dynamics ay maaaring alinman sa pagitan o panandalian. Ang serye ng moment dynamics, sa turn, ay maaaring may pantay o hindi pantay na agwat ng oras.

Ang paunang serye ng mga dinamika ay maaaring mabago sa isang serye ng mga average na halaga at isang serye ng mga kamag-anak na halaga (chain at basic). Ang nasabing serye ng oras ay tinatawag na derived time series.

Ang pamamaraan para sa pagkalkula ng average na antas sa dynamics series ay iba, depende sa uri ng dynamics series. Gamit ang mga halimbawa, isasaalang-alang namin ang mga uri ng serye ng dynamics at mga formula para sa pagkalkula ng average na antas.

Ganap na pagtaas (Δy) ipakita kung gaano karaming mga yunit ang kasunod na antas ng serye ay nagbago kumpara sa nauna (gr. 3. - chain absolute increases) o kumpara sa unang level (gr. 4. - basic absolute increases). Ang mga formula ng pagkalkula ay maaaring isulat tulad ng sumusunod:

Kapag bumaba ang ganap na halaga ng serye, magkakaroon ng "pagbaba" o "pagbaba", ayon sa pagkakabanggit.

Ang mga ganap na tagapagpahiwatig ng paglago ay nagpapahiwatig na, halimbawa, noong 1998, ang produksyon ng produkto na "A" ay tumaas ng 4 na libong tonelada kumpara noong 1997, at ng 34 na libong tonelada kumpara noong 1994; para sa iba pang mga taon, tingnan ang talahanayan. 11.5 gr. 3 at 4.

Rate ng paglago nagpapakita kung gaano karaming beses ang antas ng serye ay nagbago kumpara sa nauna (gr. 5 - chain coefficients ng paglago o pagbaba) o kumpara sa paunang antas (gr. 6 - mga pangunahing coefficient ng paglago o pagbaba). Ang mga formula ng pagkalkula ay maaaring isulat tulad ng sumusunod:

Rate ng paglago ipakita kung anong porsyento ang susunod na antas ng serye ay inihambing sa nauna (gr. 7 - chain growth rate) o kumpara sa unang antas (gr. 8 - basic growth rate). Ang mga formula ng pagkalkula ay maaaring isulat tulad ng sumusunod:

Kaya, halimbawa, noong 1997, ang dami ng produksyon ng produkto na "A" kumpara noong 1996 ay 105.5% (

Rate ng paglago ipakita sa kung anong porsyento ang pagtaas ng antas ng panahon ng pag-uulat kumpara sa nauna (kolumna 9 - mga rate ng paglago ng chain) o kumpara sa paunang antas (kolumna 10 - pangunahing mga rate ng paglago). Ang mga formula ng pagkalkula ay maaaring isulat tulad ng sumusunod:

T pr = T r - 100% o T pr = ganap na paglago / antas ng nakaraang panahon * 100%

Kaya, halimbawa, noong 1996, kumpara sa 1995, ang produktong "A" ay ginawa ng 3.8% (103.8% - 100%) o (8:210)x100% higit pa, at kumpara noong 1994 - ng 9% (109% - 100%).

Kung ang mga ganap na antas sa serye ay bumaba, ang rate ay magiging mas mababa sa 100% at, nang naaayon, magkakaroon ng isang rate ng pagtanggi (ang rate ng pagtaas na may minus sign).

Ganap na halaga ng 1% na pagtaas(column 11) ay nagpapakita kung gaano karaming mga yunit ang dapat gawin sa isang naibigay na panahon upang ang antas ng nakaraang panahon ay tumaas ng 1%. Sa aming halimbawa, noong 1995 kinakailangan na gumawa ng 2.0 libong tonelada, at noong 1998 - 2.3 libong tonelada, i.e. marami pang iba.

Ang ganap na halaga ng 1% na paglago ay maaaring matukoy sa dalawang paraan:

Ang antas ng nakaraang panahon ay hinati sa 100;

Ang mga ganap na pagtaas ng chain ay hinati sa katumbas na mga rate ng paglago ng chain.

Ganap na halaga ng 1% na pagtaas =

Sa dinamika, lalo na sa mahabang panahon, mahalaga ang pinagsamang pagsusuri ng rate ng paglago na may nilalaman ng bawat pagtaas o pagbaba ng porsyento.

Tandaan na ang itinuturing na pamamaraan para sa pagsusuri ng mga serye ng oras ay naaangkop kapwa para sa mga serye ng oras, ang mga antas ng kung saan ay ipinahayag sa mga ganap na halaga (t, libong rubles, bilang ng mga empleyado, atbp.), At para sa serye ng oras, ang mga antas kung saan ay ipinahayag sa mga kamag-anak na tagapagpahiwatig (% ng mga depekto , % abo na nilalaman ng karbon, atbp.) o mga average na halaga (average na ani sa c/ha, average na sahod, atbp.).

Kasama ang mga itinuturing na analytical indicator, na kinakalkula para sa bawat taon kung ihahambing sa nauna o paunang antas, kapag sinusuri ang serye ng dynamics, kinakailangang kalkulahin ang average na analytical indicator para sa panahon: ang average na antas ng serye, ang average na taunang ganap na pagtaas (pagbaba) at ang average na taunang rate ng paglago at rate ng paglago.

Ang mga pamamaraan para sa pagkalkula ng average na antas ng isang serye ng mga dinamika ay tinalakay sa itaas. Sa serye ng interval dynamics na aming isinasaalang-alang, ang average na antas ng serye ay kinakalkula gamit ang simpleng arithmetic mean formula:

Average na taunang dami ng produksyon ng produkto para sa 1994-1998. umabot sa 218.4 libong tonelada.

Ang average na taunang absolute growth ay kinakalkula din gamit ang simpleng arithmetic average formula:

Ang taunang ganap na pagtaas ay iba-iba sa mga taon mula 4 hanggang 12 libong tonelada (tingnan ang column 3), at ang average na taunang pagtaas ng produksyon para sa panahon ng 1995 - 1998. umabot sa 8.5 libong tonelada.

Ang mga pamamaraan para sa pagkalkula ng average na rate ng paglago at average na rate ng paglago ay nangangailangan ng mas detalyadong pagsasaalang-alang. Isaalang-alang natin ang mga ito gamit ang halimbawa ng taunang mga tagapagpahiwatig ng antas ng serye na ibinigay sa talahanayan.

Average na antas ng serye ng dynamics.

Dynamic na serye (o serye ng oras)- ito ang mga numerical na halaga ng isang tiyak na istatistikal na tagapagpahiwatig sa magkakasunod na sandali o yugto ng panahon (i.e., nakaayos sa pagkakasunud-sunod ng pagkakasunod-sunod).

Ang mga numerical na halaga ng isa o isa pang istatistikal na tagapagpahiwatig na bumubuo sa serye ng dinamika ay tinatawag mga antas ng serye at kadalasang tinutukoy ng titik y. Unang termino ng serye y 1 tinatawag na inisyal o pangunahing antas, at ang huli y n - pangwakas. Ang mga sandali o yugto ng panahon kung saan nauugnay ang mga antas ay itinalaga ng t.

Ang mga serye ng dinamika ay karaniwang ipinakita sa anyo ng isang talahanayan o graph, at isang sukat ng oras ay itinayo sa kahabaan ng abscissa axis t, at kasama ang ordinate axis - ang sukat ng mga antas ng serye y.

Mga average na tagapagpahiwatig ng serye ng dynamics

Ang bawat serye ng dynamics ay maaaring ituring bilang isang tiyak na hanay n mga tagapagpahiwatig na nag-iiba-iba ng oras na maaaring ibuod bilang mga average. Ang mga naturang pangkalahatan (average) na mga tagapagpahiwatig ay kinakailangan lalo na kapag naghahambing ng mga pagbabago sa isang partikular na tagapagpahiwatig sa iba't ibang panahon, sa iba't ibang bansa, atbp.

Ang isang pangkalahatang katangian ng serye ng dinamika ay maaaring magsilbi, una sa lahat, antas ng gitnang hilera. Ang paraan para sa pagkalkula ng average na antas ay depende sa kung ang serye ay panandalian o pagitan (pana-panahon).

Kung sakali pagitan ng isang serye, ang average na antas nito ay tinutukoy ng formula ng isang simpleng arithmetic average ng mga antas ng serye, i.e.

=
Kung magagamit sandali hilera na naglalaman ng n antas ( y1, y2, …, yn) na may pantay na agwat sa pagitan ng mga petsa (mga oras), kung gayon ang naturang serye ay madaling ma-convert sa isang serye ng mga average na halaga. Sa kasong ito, ang tagapagpahiwatig (antas) sa simula ng bawat panahon ay sabay-sabay na tagapagpahiwatig sa pagtatapos ng nakaraang panahon. Pagkatapos ay ang average na halaga ng indicator para sa bawat panahon (ang agwat sa pagitan ng mga petsa) ay maaaring kalkulahin bilang kalahati ng kabuuan ng mga halaga sa sa simula at katapusan ng panahon, i.e. Paano . Ang bilang ng naturang mga average ay magiging . Gaya ng nasabi kanina, para sa serye ng mga average na halaga, ang average na antas ay kinakalkula gamit ang arithmetic mean.

Samakatuwid, maaari tayong sumulat:
.
Matapos baguhin ang numerator nakukuha natin:
,

saan Y1 At Yn— una at huling mga antas ng hilera; Yi- mga intermediate na antas.

Ang average na ito ay kilala sa mga istatistika bilang average na kronolohikal para sa moment series. Natanggap nito ang pangalan nito mula sa salitang "cronos" (oras, Latin), dahil kinakalkula ito mula sa mga tagapagpahiwatig na nagbabago sa paglipas ng panahon.

Sa kaso ng hindi pantay pagitan sa pagitan ng mga petsa, ang kronolohikal na average para sa isang sandali na serye ay maaaring kalkulahin bilang arithmetic mean ng mga average na halaga ng mga antas para sa bawat pares ng mga sandali, na natimbang ng mga distansya (mga agwat ng oras) sa pagitan ng mga petsa, i.e.
.
Sa kasong ito ipinapalagay na sa mga pagitan sa pagitan ng mga petsa ang mga antas ay kumuha ng iba't ibang mga halaga, at kami ay isa sa dalawang kilala ( yi At yi+1) tinutukoy namin ang mga average, kung saan namin pagkatapos ay kinakalkula ang pangkalahatang average para sa buong nasuri na panahon.
Kung ito ay ipinapalagay na ang bawat halaga yi nananatiling hindi nagbabago hanggang sa susunod (i+ 1)- ang sandali, i.e. Kung ang eksaktong petsa ng pagbabago sa mga antas ay alam, kung gayon ang pagkalkula ay maaaring isagawa gamit ang weighted arithmetic average na formula:
,

kung saan ang oras kung saan ang antas ay nanatiling hindi nagbabago.

Bilang karagdagan sa average na antas sa serye ng dinamika, ang iba pang mga average na tagapagpahiwatig ay kinakalkula - ang average na pagbabago sa mga antas ng serye (basic at chain method), ang average na rate ng pagbabago.

Ang ibig sabihin ng baseline ay ganap na pagbabago ay ang quotient ng huling pinagbabatayan na ganap na pagbabago na hinati sa bilang ng mga pagbabago. Iyon ay

Ang kadena ay nangangahulugang ganap na pagbabago Ang mga antas ng serye ay ang quotient ng paghahati sa kabuuan ng lahat ng mga ganap na pagbabago sa chain sa bilang ng mga pagbabago, iyon ay

Ang tanda ng average na ganap na mga pagbabago ay ginagamit din upang hatulan ang likas na katangian ng pagbabago sa isang kababalaghan sa karaniwan: paglago, pagbaba o katatagan.

Mula sa panuntunan para sa pagkontrol sa basic at chain absolute na mga pagbabago, sumusunod na ang basic at chain average na mga pagbabago ay dapat na pantay.

Kasama ang average na ganap na pagbabago, ang relatibong average ay kinakalkula din gamit ang basic at chain method.

Baseline average na relatibong pagbabago tinutukoy ng formula:

Chain average na kamag-anak na pagbabago tinutukoy ng formula:

Naturally, ang mga pangunahing at chain average na kamag-anak na mga pagbabago ay dapat na pareho, at sa pamamagitan ng paghahambing ng mga ito sa criterion value 1, ang isang konklusyon ay iginuhit tungkol sa likas na katangian ng pagbabago sa phenomenon sa karaniwan: paglago, pagbaba o katatagan.
Sa pamamagitan ng pagbabawas ng 1 mula sa base o chain average na relatibong pagbabago, ang katumbas average na rate ng pagbabago, sa pamamagitan ng tanda kung saan maaari ring hatulan ng isa ang likas na pagbabago sa hindi pangkaraniwang bagay na pinag-aaralan, na sinasalamin ng seryeng ito ng dinamika.

Mga pagbabago sa pana-panahon at mga indeks ng seasonality.

Ang mga seasonal fluctuation ay stable intra-annual fluctuation.

Ang pangunahing prinsipyo ng pamamahala para sa pagkuha ng pinakamataas na epekto ay upang mapakinabangan ang kita at mabawasan ang mga gastos. Sa pamamagitan ng pag-aaral ng mga pana-panahong pagbabagu-bago, ang problema ng pinakamataas na equation ay malulutas sa bawat antas ng taon.

Kapag nag-aaral ng mga pana-panahong pagbabagu-bago, dalawang magkakaugnay na problema ang malulutas:

1. Pagkilala sa mga detalye ng pag-unlad ng kababalaghan sa intra-taunang dinamika;

2. Pagsukat ng mga seasonal fluctuation sa pagbuo ng seasonal wave model;

Upang sukatin ang pana-panahong pagkakaiba-iba, ang mga pana-panahong turkey ay karaniwang binibilang. Sa pangkalahatan, natutukoy ang mga ito sa pamamagitan ng ratio ng orihinal na mga equation ng serye ng dinamika sa mga teoretikal na equation, na nagsisilbing batayan para sa paghahambing.

Dahil ang mga random na paglihis ay nakapatong sa mga seasonal na pagbabagu-bago, ang mga indeks ng seasonality ay ina-average upang maalis ang mga ito.

Sa kasong ito, para sa bawat panahon ng taunang cycle, ang mga pangkalahatang tagapagpahiwatig ay tinutukoy sa anyo ng mga average na pana-panahong mga indeks:

Ang average na seasonal fluctuation index ay libre mula sa impluwensya ng random deviations ng pangunahing trend ng development.

Depende sa likas na katangian ng trend, ang formula para sa average na seasonality index ay maaaring magkaroon ng mga sumusunod na anyo:

1.Para sa mga serye ng intra-taunang dinamika na may malinaw na ipinahayag na pangunahing takbo ng pag-unlad:

2. Para sa mga serye ng intra-taunang dinamika kung saan walang pagtaas o pagbaba ng trend o hindi gaanong mahalaga:

Nasaan ang pangkalahatang average;

Mga pamamaraan para sa pagsusuri ng pangunahing kalakaran.

Ang pag-unlad ng mga phenomena sa paglipas ng panahon ay naiimpluwensyahan ng mga salik ng iba't ibang kalikasan at lakas ng impluwensya. Ang ilan sa kanila ay random sa kalikasan, ang iba ay may halos pare-parehong epekto at bumubuo ng isang tiyak na kalakaran sa pag-unlad sa dinamika.

Ang isang mahalagang gawain ng mga istatistika ay upang matukoy ang mga dinamika ng trend sa serye, na napalaya mula sa impluwensya ng iba't ibang mga random na kadahilanan. Para sa layuning ito, ang serye ng oras ay pinoproseso ng mga pamamaraan ng pagpapalaki ng mga agwat, paglipat ng average at analytical leveling, atbp.

Paraan ng pagpapalaki ng pagitan ay batay sa pagpapalaki ng mga yugto ng panahon, na kinabibilangan ng mga antas ng isang serye ng mga dinamika, i.e. ay ang pagpapalit ng data na nauugnay sa maliliit na yugto ng panahon na may data para sa mas malalaking panahon. Ito ay lalong epektibo kapag ang mga unang antas ng serye ay nauugnay sa mga maikling yugto ng panahon. Halimbawa, ang mga serye ng mga tagapagpahiwatig na nauugnay sa mga pang-araw-araw na kaganapan ay pinapalitan ng mga serye na nauugnay sa lingguhan, buwanan, atbp. Ito ay magpapakita ng mas malinaw "axis ng pag-unlad ng phenomenon". Ang average, na kinakalkula sa mga pinalaki na agwat, ay nagbibigay-daan sa amin upang matukoy ang direksyon at kalikasan (pagpabilis o pagbagal ng paglago) ng pangunahing trend ng pag-unlad.

Moving average na paraan katulad ng nauna, ngunit sa kasong ito, ang mga aktwal na antas ay pinapalitan ng mga average na antas na kinakalkula para sa sunud-sunod na paglipat (pag-slide) na pinalaki na mga pagitan na sumasaklaw sa m mga antas ng serye.

Halimbawa, kung tatanggapin natin m=3, pagkatapos ay una ang average ng unang tatlong antas ng serye ay kinakalkula, pagkatapos - mula sa parehong bilang ng mga antas, ngunit simula sa pangalawa, pagkatapos - simula sa pangatlo, atbp. Kaya, ang average na "mga slide" sa kahabaan ng serye ng dynamics, na gumagalaw sa isang termino. Kinakalkula mula sa m miyembro, ang mga moving average ay tumutukoy sa gitna (gitna) ng bawat pagitan.

Ang pamamaraang ito ay nag-aalis lamang ng mga random na pagbabagu-bago. Kung ang serye ay may pana-panahong alon, magpapatuloy ito kahit na matapos ang pagpapakinis gamit ang moving average na paraan.

Analytical alignment. Upang maalis ang mga random na pagbabagu-bago at matukoy ang isang trend, ang pag-level ng mga antas ng serye gamit ang mga analytical formula (o analytical leveling) ay ginagamit. Ang kakanyahan nito ay palitan ang mga empirical (aktwal) na antas ng mga teoretikal, na kinakalkula gamit ang isang tiyak na equation na pinagtibay bilang isang modelo ng trend ng matematika, kung saan ang mga antas ng teoretikal ay itinuturing bilang isang function ng oras: . Sa kasong ito, ang bawat aktwal na antas ay itinuturing bilang kabuuan ng dalawang bahagi: , kung saan ay isang sistematikong bahagi at ipinahayag ng isang tiyak na equation, at ito ay isang random na variable na nagdudulot ng mga pagbabago sa paligid ng trend.

Ang gawain ng analytical alignment ay bumaba sa mga sumusunod:

1. Pagpapasiya, batay sa aktwal na data, ng uri ng hypothetical function na pinaka-sapat na sumasalamin sa trend ng pag-unlad ng indicator na pinag-aaralan.

2. Paghahanap ng mga parameter ng tinukoy na function (equation) mula sa empirical data

3. Pagkalkula gamit ang nahanap na equation ng theoretical (aligned) levels.

Ang pagpili ng isang partikular na function ay isinasagawa, bilang panuntunan, batay sa isang graphical na representasyon ng empirical data.

Ang mga modelo ay regression equation, ang mga parameter ay kinakalkula gamit ang least squares method

Nasa ibaba ang pinakakaraniwang ginagamit na mga equation ng regression para sa pag-align ng mga serye ng oras, na nagsasaad kung aling mga trend ng pag-unlad ang pinakaangkop para sa pagpapakita.

Upang mahanap ang mga parameter ng mga equation sa itaas, mayroong mga espesyal na algorithm at mga programa sa computer. Sa partikular, upang mahanap ang mga parameter ng isang straight line equation, maaaring gamitin ang sumusunod na algorithm:

Kung ang mga tuldok o sandali ng oras ay binibilang upang St = 0, kung gayon ang mga algorithm sa itaas ay magiging makabuluhang pinasimple at magiging

Ang mga nakahanay na antas sa chart ay matatagpuan sa isang tuwid na linya, na dumadaan sa pinakamalapit na distansya mula sa mga aktwal na antas ng dynamic na seryeng ito. Ang kabuuan ng mga squared deviations ay isang salamin ng impluwensya ng mga random na kadahilanan.

Gamit ito, kinakalkula namin ang average (standard) na error ng equation:

Narito ang n ay ang bilang ng mga obserbasyon, at ang m ay ang bilang ng mga parameter sa equation (mayroon kaming dalawa sa kanila - b 1 at b 0).

Ang pangunahing tendency (trend) ay nagpapakita kung paano naiimpluwensyahan ng mga sistematikong salik ang mga antas ng isang serye ng dynamics, at ang pagbabagu-bago ng mga antas sa paligid ng trend () ay nagsisilbing sukatan ng impluwensya ng mga natitirang salik.

Upang masuri ang kalidad ng modelo ng serye ng oras na ginamit, ginagamit din ito Fisher's F test. Ito ay ang ratio ng dalawang pagkakaiba-iba, lalo na ang ratio ng pagkakaiba-iba na dulot ng regression, i.e. ang kadahilanan na pinag-aaralan, sa pagkakaiba-iba na dulot ng mga random na dahilan, i.e. natitirang pagpapakalat:

Sa pinalawak na anyo, ang pormula para sa pamantayang ito ay maaaring ipakita tulad ng sumusunod:

kung saan ang n ay ang bilang ng mga obserbasyon, i.e. bilang ng mga antas ng hilera,

m ay ang bilang ng mga parameter sa equation, y ay ang aktwal na antas ng serye,

Naka-align na antas ng hilera - antas ng gitnang hilera.

Ang isang modelo na mas matagumpay kaysa sa iba ay maaaring hindi palaging sapat na kasiya-siya. Maaari lamang itong kilalanin bilang ganoon sa kaso kapag ang criterion F nito ay lumampas sa alam na kritikal na limitasyon. Ang hangganan na ito ay itinatag gamit ang F-distribution tables.

Kakanyahan at pag-uuri ng mga indeks.

Sa mga istatistika, ang isang index ay nauunawaan bilang isang kamag-anak na tagapagpahiwatig na nagpapakita ng pagbabago sa laki ng isang kababalaghan sa oras, espasyo, o kung ihahambing sa anumang pamantayan.

Ang pangunahing elemento ng kaugnayan ng index ay ang na-index na halaga. Ang isang naka-index na halaga ay nauunawaan bilang ang halaga ng isang katangian ng isang istatistikal na populasyon, ang pagbabago nito ay ang object ng pag-aaral.

Gamit ang mga index, tatlong pangunahing gawain ang malulutas:

1) pagtatasa ng mga pagbabago sa isang kumplikadong kababalaghan;

2) pagtukoy sa impluwensya ng mga indibidwal na kadahilanan sa mga pagbabago sa isang kumplikadong kababalaghan;

3) paghahambing ng magnitude ng isang phenomenon sa magnitude ng nakaraang panahon, sa magnitude ng ibang teritoryo, pati na rin sa mga pamantayan, plano, at mga pagtataya.

Ang mga indeks ay inuri ayon sa 3 pamantayan:

2) ayon sa antas ng saklaw ng mga elemento ng populasyon;

3) ayon sa mga pamamaraan para sa pagkalkula ng mga pangkalahatang indeks.

Sa pamamagitan ng nilalaman na-index na dami, ang mga indeks ay nahahati sa mga indeks ng quantitative (volume) indicator at mga indeks ng qualitative indicators. Mga indeks ng mga tagapagpahiwatig ng dami - mga indeks ng pisikal na dami ng mga produktong pang-industriya, pisikal na dami ng mga benta, bilang ng bilang, atbp. Mga indeks ng mga tagapagpahiwatig ng husay - mga indeks ng mga presyo, gastos, produktibidad ng paggawa, average na sahod, atbp.

Ayon sa antas ng saklaw ng mga yunit ng populasyon, ang mga indeks ay nahahati sa dalawang klase: indibidwal at pangkalahatan. Upang makilala ang mga ito, ipinakilala namin ang mga sumusunod na kombensiyon na pinagtibay sa pagsasanay ng paggamit ng paraan ng index:

q- dami (volume) ng anumang produkto sa pisikal na termino ; r- presyo ng yunit; z- halaga ng yunit ng produksyon; t— oras na ginugol sa paggawa ng isang yunit ng produkto (labor intensity) ; w- produksyon ng mga produkto sa mga tuntunin ng halaga bawat yunit ng oras; v- produksyon output sa pisikal na mga tuntunin sa bawat yunit ng oras; T— kabuuang oras na ginugol o bilang ng mga empleyado.

Upang makilala kung aling panahon o bagay ang nabibilang sa mga na-index na halaga, kaugalian na maglagay ng mga subscript sa kanang ibaba ng kaukulang simbolo. Kaya, halimbawa, sa mga indeks ng dynamics, bilang panuntunan, ang subscript 1 ay ginagamit para sa mga panahon na inihahambing (kasalukuyan, pag-uulat) at para sa mga panahon kung saan ginawa ang paghahambing,

Indibidwal na mga indeks nagsisilbi upang makilala ang mga pagbabago sa mga indibidwal na elemento ng isang kumplikadong kababalaghan (halimbawa, isang pagbabago sa dami ng output ng isang uri ng produkto). Kinakatawan nila ang mga kamag-anak na halaga ng dinamika, katuparan ng mga obligasyon, paghahambing ng mga na-index na halaga.

Ang indibidwal na index ng pisikal na dami ng mga produkto ay tinutukoy

Mula sa isang analytical na pananaw, ang ibinigay na indibidwal na mga indeks ng dinamika ay katulad ng mga koepisyent ng paglago (mga rate) at nailalarawan ang pagbabago sa na-index na halaga sa kasalukuyang panahon kumpara sa batayang panahon, ibig sabihin, ipinapakita nila kung gaano karaming beses itong tumaas (bumaba) o kung anong porsyento ito ay paglago (pagbaba). Ang mga halaga ng index ay ipinahayag sa mga coefficient o porsyento.

Pangkalahatang (composite) index sumasalamin sa mga pagbabago sa lahat ng elemento ng isang komplikadong phenomenon.

Pinagsama-samang index ay ang pangunahing anyo ng isang index. Tinatawag itong aggregate dahil ang numerator at denominator nito ay isang set ng "aggregates"

Average na mga indeks, ang kanilang kahulugan.

Bilang karagdagan sa mga pinagsama-samang indeks, ang isa pang anyo ng mga ito ay ginagamit sa mga istatistika - mga average na timbang na indeks. Ang kanilang pagkalkula ay ginagamit kapag ang magagamit na impormasyon ay hindi pinapayagan ang pagkalkula ng pangkalahatang pinagsama-samang index. Kaya, kung walang data sa mga presyo, ngunit mayroong impormasyon sa gastos ng mga produkto sa kasalukuyang panahon at ang mga indibidwal na indeks ng presyo para sa bawat produkto ay kilala, kung gayon ang pangkalahatang indeks ng presyo ay hindi maaaring matukoy bilang isang pinagsama-samang isa, ngunit posible upang kalkulahin ito bilang average ng mga indibidwal. Sa parehong paraan, kung ang mga dami ng mga indibidwal na uri ng mga produkto na ginawa ay hindi alam, ngunit ang mga indibidwal na indeks at ang gastos ng produksyon ng batayang panahon ay kilala, kung gayon ang pangkalahatang indeks ng pisikal na dami ng produksyon ay maaaring matukoy bilang isang timbang na average halaga.

Average na index - Ito isang index na kinakalkula bilang average ng mga indibidwal na indeks. Ang pinagsama-samang index ay ang pangunahing anyo ng isang pangkalahatang index, kaya ang average na index ay dapat na magkapareho sa pinagsama-samang index. Kapag kinakalkula ang mga average na indeks, dalawang anyo ng mga average ang ginagamit: arithmetic at harmonic.

Ang arithmetic average index ay magkapareho sa pinagsama-samang index kung ang mga timbang ng mga indibidwal na indeks ay ang mga termino ng denominator ng pinagsama-samang index. Sa kasong ito lamang, ang halaga ng index na kinakalkula gamit ang arithmetic average formula ay magiging katumbas ng pinagsama-samang index.

Upang kalkulahin ang simpleng geometric mean, ginagamit ang formula:

Geometric na may timbang

Upang matukoy ang weighted geometric mean, ginagamit ang formula:

Ang average na diameter ng mga gulong, tubo, at ang average na gilid ng mga parisukat ay tinutukoy gamit ang mean square.

Ang mga halaga ng root-mean-square ay ginagamit upang kalkulahin ang ilang mga tagapagpahiwatig, halimbawa, ang koepisyent ng pagkakaiba-iba, na nagpapakilala sa ritmo ng produksyon. Narito ang karaniwang paglihis mula sa nakaplanong output ng produksyon para sa isang tiyak na panahon ay tinutukoy gamit ang sumusunod na formula:

Ang mga halagang ito ay tumpak na nagpapakilala sa pagbabago sa mga tagapagpahiwatig ng ekonomiya kumpara sa kanilang batayang halaga, na kinuha sa average na halaga nito.

Quadratic simple

Ang root mean square ay kinakalkula gamit ang formula:

Quadratic weighted

Ang weighted mean square ay katumbas ng:

22. Ang mga ganap na tagapagpahiwatig ng pagkakaiba-iba ay kinabibilangan ng:

saklaw ng pagkakaiba-iba

average na linear deviation

pagpapakalat

karaniwang paglihis

Saklaw ng variation (r)

Saklaw ng pagkakaiba-iba- ay ang pagkakaiba sa pagitan ng maximum at minimum na mga halaga ng katangian

Ipinapakita nito ang mga limitasyon kung saan nagbabago ang halaga ng isang katangian sa populasyon na pinag-aaralan.

Ang karanasan sa trabaho ng limang aplikante sa nakaraang trabaho ay: 2,3,4,7 at 9 na taon. Solusyon: saklaw ng variation = 9 - 2 = 7 taon.

Para sa isang pangkalahatang paglalarawan ng mga pagkakaiba sa mga halaga ng katangian, ang mga average na tagapagpahiwatig ng pagkakaiba-iba ay kinakalkula batay sa pagsasaalang-alang ng mga deviation mula sa arithmetic mean. Ang pagkakaiba ay kinuha bilang isang paglihis mula sa average.

Sa kasong ito, upang maiwasan ang kabuuan ng mga paglihis ng mga variant ng isang katangian mula sa average na nagiging zero (ang zero na ari-arian ng average), ang isa ay dapat na huwag pansinin ang mga palatandaan ng paglihis, iyon ay, kunin ang kabuuan modulo na ito , o parisukat ang mga halaga ng paglihis

Average na linear at square deviation

Average na linear deviation ay ang arithmetic average ng ganap na mga paglihis ng mga indibidwal na halaga ng isang katangian mula sa average.

Ang average na linear deviation ay simple:

Ang karanasan sa trabaho ng limang aplikante sa nakaraang trabaho ay: 2,3,4,7 at 9 na taon.

Sa ating halimbawa: taon;

Sagot: 2.4 na taon.

Average na linear deviation weighted nalalapat sa pinagsama-samang data:

Dahil sa kombensyon nito, ang average na linear deviation ay ginagamit sa pagsasanay na medyo bihira (sa partikular, upang makilala ang katuparan ng mga obligasyong kontraktwal tungkol sa pagkakapareho ng paghahatid; sa pagsusuri ng kalidad ng produkto, isinasaalang-alang ang mga teknolohikal na tampok ng produksyon).

Standard deviation

Ang pinakaperpektong katangian ng variation ay ang mean square deviation, na tinatawag na standard (o standard deviation). Standard deviation() ay katumbas ng square root ng average na square deviation ng mga indibidwal na halaga ng arithmetic average attribute:

Ang karaniwang paglihis ay simple:

Inilapat ang weighted standard deviation sa nakagrupong data:

Sa pagitan ng root mean square at mean linear deviations sa ilalim ng normal na kondisyon ng distribution, ang sumusunod na ratio ay nagaganap: ~ 1.25.

Ang karaniwang paglihis, bilang pangunahing ganap na sukatan ng pagkakaiba-iba, ay ginagamit sa pagtukoy ng mga ordinate na halaga ng isang normal na curve ng pamamahagi, sa mga kalkulasyon na may kaugnayan sa organisasyon ng sample na pagmamasid at pagtatatag ng katumpakan ng mga katangian ng sample, pati na rin sa pagtatasa ng mga limitasyon ng pagkakaiba-iba ng isang katangian sa isang homogenous na populasyon.

Ang mga halaga na nakuha mula sa karanasan ay hindi maiiwasang naglalaman ng mga pagkakamali dahil sa iba't ibang mga kadahilanan. Kabilang sa mga ito, ang isa ay dapat na makilala sa pagitan ng sistematiko at random na mga pagkakamali. Ang mga sistematikong error ay sanhi ng mga dahilan na kumikilos sa isang napaka-espesipikong paraan, at maaaring palaging alisin o isinasaalang-alang nang tumpak. Ang mga random na error ay sanhi ng napakalaking bilang ng mga indibidwal na dahilan na hindi tumpak na matutugunan at kumilos sa iba't ibang paraan sa bawat indibidwal na pagsukat. Ang mga error na ito ay hindi maaaring ganap na ibukod; maaari lamang silang isaalang-alang sa karaniwan, kung saan kinakailangang malaman ang mga batas na namamahala sa mga random na pagkakamali.

Ipapahiwatig namin ang sinusukat na dami ng A, at ang random na error sa pagsukat ng x. Dahil ang error na x ay maaaring tumagal sa anumang halaga, ito ay isang tuluy-tuloy na random variable, na ganap na nailalarawan sa pamamagitan ng batas ng pamamahagi nito.

Ang pinakasimpleng at pinakatumpak na sumasalamin sa katotohanan (sa karamihan ng mga kaso) ay ang tinatawag na batas sa pamamahagi ng normal na error:

Ang batas sa pamamahagi na ito ay maaaring makuha mula sa iba't ibang teoretikal na lugar, lalo na, mula sa pangangailangan na ang pinaka-malamang na halaga ng isang hindi kilalang dami kung saan ang isang serye ng mga halaga na may parehong antas ng katumpakan ay nakuha sa pamamagitan ng direktang pagsukat ay ang arithmetic mean ng ang mga halagang ito. Quantity 2 ang tawag pagpapakalat ng normal na batas na ito.

Ang ibig sabihin ng aritmetika

Pagpapasiya ng dispersion mula sa pang-eksperimentong data. Kung para sa anumang halaga A, n mga halaga a i ay nakuha sa pamamagitan ng direktang pagsukat na may parehong antas ng katumpakan at kung ang mga pagkakamali ng halaga A ay napapailalim sa normal na batas sa pamamahagi, kung gayon ang pinakamalamang na halaga ng A ay magiging ibig sabihin ng aritmetika:

a - ibig sabihin ng aritmetika,

a i - sinusukat na halaga sa i-th na hakbang.

Paglihis ng naobserbahang halaga (para sa bawat pagmamasid) a i ng halaga A mula sa ibig sabihin ng aritmetika: a i - a.

Upang matukoy ang pagkakaiba ng batas ng normal na pamamahagi ng error sa kasong ito, gamitin ang formula:

2 - pagpapakalat,
a - ibig sabihin ng aritmetika,
n - bilang ng mga sukat ng parameter,

Standard deviation

Standard deviation nagpapakita ng ganap na paglihis ng mga sinusukat na halaga mula sa ibig sabihin ng aritmetika. Alinsunod sa formula para sa sukat ng katumpakan ng isang linear na kumbinasyon ibig sabihin ng square error Ang arithmetic mean ay tinutukoy ng formula:

, Saan


a - ibig sabihin ng aritmetika,
n - bilang ng mga sukat ng parameter,
a i - sinusukat na halaga sa i-th na hakbang.

Koepisyent ng pagkakaiba-iba

Koepisyent ng pagkakaiba-iba nailalarawan ang kamag-anak na sukat ng paglihis ng mga sinusukat na halaga mula sa ibig sabihin ng aritmetika:

, Saan

V - koepisyent ng pagkakaiba-iba,
- karaniwang paglihis,
a - ibig sabihin ng aritmetika.

Mas mataas ang halaga koepisyent ng pagkakaiba-iba, mas malaki ang scatter at hindi gaanong pagkakapareho ng mga pinag-aralan na halaga. Kung koepisyent ng pagkakaiba-iba mas mababa sa 10%, kung gayon ang pagkakaiba-iba ng serye ng variation ay itinuturing na hindi gaanong mahalaga, mula 10% hanggang 20% ​​ay itinuturing na average, higit sa 20% at mas mababa sa 33% ay itinuturing na makabuluhan at kung koepisyent ng pagkakaiba-iba lumampas sa 33%, ito ay nagpapahiwatig ng heterogeneity ng impormasyon at ang pangangailangan na ibukod ang pinakamalaki at pinakamaliit na halaga.

Average na linear deviation

Isa sa mga indicator ng saklaw at intensity ng variation ay average na linear deviation(average na deviation module) mula sa arithmetic mean. Average na linear deviation kinakalkula ng formula:

, Saan

_
a - average na linear deviation,
a - ibig sabihin ng aritmetika,
n - bilang ng mga sukat ng parameter,
a i - sinusukat na halaga sa i-th na hakbang.

Upang suriin ang pagsunod ng mga pinag-aralan na halaga sa batas ng normal na pamamahagi, ginagamit ang kaugnayan tagapagpahiwatig ng kawalaan ng simetrya sa kanyang pagkakamali at ugali tagapagpahiwatig ng kurtosis sa kanyang pagkakamali.

Tagapagpahiwatig ng kawalaan ng simetrya

Tagapagpahiwatig ng kawalaan ng simetrya(A) at ang error nito (m a) ay kinakalkula gamit ang mga sumusunod na formula:

, Saan

A - tagapagpahiwatig ng kawalaan ng simetrya,
- karaniwang paglihis,
a - ibig sabihin ng aritmetika,
n - bilang ng mga sukat ng parameter,
a i - sinusukat na halaga sa i-th na hakbang.

Tagapagpahiwatig ng kurtosis

Tagapagpahiwatig ng kurtosis(E) at ang error nito (m e) ay kinakalkula gamit ang mga sumusunod na formula:

, Saan



 


Basahin:



Accounting para sa mga settlement na may badyet

Accounting para sa mga settlement na may badyet

Ang Account 68 sa accounting ay nagsisilbi upang mangolekta ng impormasyon tungkol sa mga ipinag-uutos na pagbabayad sa badyet, na ibinawas kapwa sa gastos ng negosyo at...

Cheesecake mula sa cottage cheese sa isang kawali - mga klasikong recipe para sa malambot na cheesecake Mga cheesecake mula sa 500 g ng cottage cheese

Cheesecake mula sa cottage cheese sa isang kawali - mga klasikong recipe para sa malambot na cheesecake Mga cheesecake mula sa 500 g ng cottage cheese

Mga sangkap: (4 na servings) 500 gr. cottage cheese 1/2 tasa ng harina 1 itlog 3 tbsp. l. asukal 50 gr. mga pasas (opsyonal) kurot ng asin baking soda...

Black pearl salad na may prun Black pearl salad na may prun

Salad

Magandang araw sa lahat ng nagsusumikap para sa pagkakaiba-iba sa kanilang pang-araw-araw na pagkain. Kung ikaw ay pagod na sa mga monotonous na pagkain at gusto mong masiyahan...

Lecho na may mga recipe ng tomato paste

Lecho na may mga recipe ng tomato paste

Napakasarap na lecho na may tomato paste, tulad ng Bulgarian lecho, na inihanda para sa taglamig. Ito ay kung paano namin pinoproseso (at kumakain!) 1 bag ng mga sili sa aming pamilya. At sino ang gusto kong...

feed-image RSS