Bahay - Kaya kong mag-ayos ng sarili ko
Ang karaniwang paglihis ay sinusukat sa. Pagkakaiba: pangkalahatan, sample, naitama

Sa istatistikal na pagsubok ng mga hypotheses, kapag sinusukat ang isang linear na relasyon sa pagitan ng mga random na variable.

Katamtaman karaniwang paglihis:

Standard Deviation(tantiya ng karaniwang paglihis ng random variable Floor, ang mga dingding sa paligid natin at ang kisame, x patungkol sa kanya inaasahan sa matematika batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba nito):

nasaan ang pagpapakalat; - Ang sahig, ang mga dingding sa paligid natin at ang kisame, i ika elemento ng pagpili; - laki ng sample; - arithmetic mean ng sample:

Dapat tandaan na ang parehong mga pagtatantya ay may kinikilingan. SA pangkalahatang kaso Imposibleng bumuo ng walang pinapanigan na pagtatantya. Gayunpaman, ang pagtatantya batay sa walang pinapanigan na pagtatantya ng pagkakaiba ay pare-pareho.

Tatlong sigma na panuntunan

Tatlong sigma na panuntunan() - halos lahat ng mga halaga ng isang normal na ibinahagi na random na variable ay nasa pagitan. Mas mahigpit - na may hindi bababa sa 99.7% kumpiyansa, ang halaga ng isang normal na ibinabahagi na random na variable ay nasa tinukoy na agwat (sa kondisyon na ang halaga ay totoo at hindi nakuha bilang resulta ng pagpoproseso ng sample).

Kung ang tunay na halaga ay hindi alam, kung gayon hindi natin dapat gamitin, kundi ang Sahig, ang mga dingding sa paligid natin at ang kisame, s. Kaya, ang panuntunan ng tatlong sigma ay binago sa panuntunan ng tatlong Palapag, mga pader sa paligid natin at sa kisame, s .

Interpretasyon ng standard deviation value

Ang isang malaking karaniwang halaga ng paglihis ay nagpapakita ng isang malaking pagkalat ng mga halaga sa ipinakita na hanay na may average na halaga ng hanay; ang isang maliit na halaga, nang naaayon, ay nagpapakita na ang mga halaga sa hanay ay nakapangkat sa paligid ng gitnang halaga.

Halimbawa, mayroon kaming tatlong hanay ng numero: (0, 0, 14, 14), (0, 6, 8, 14) at (6, 6, 8, 8). Ang lahat ng tatlong set ay may mga mean value na katumbas ng 7, at standard deviations, ayon sa pagkakabanggit, katumbas ng 7, 5 at 1. Ang huling set ay may maliit na standard deviation, dahil ang mga value sa set ay pinagsama-sama sa average na halaga; ang unang set ang may pinakamaraming malaking halaga standard deviation - ang mga halaga sa loob ng set ay lubhang nag-iiba mula sa average na halaga.

Sa pangkalahatang kahulugan, ang karaniwang paglihis ay maaaring ituring na isang sukatan ng kawalan ng katiyakan. Halimbawa, sa physics, ang standard deviation ay ginagamit upang matukoy ang error ng isang serye ng sunud-sunod na mga sukat ng ilang dami. Napakahalaga ng halagang ito para sa pagtukoy ng katumpakan ng hindi pangkaraniwang bagay na pinag-aaralan kung ihahambing sa halaga na hinulaang ng teorya: kung ang average na halaga ng mga sukat ay naiiba nang malaki sa mga halaga na hinulaan ng teorya (malaking standard deviation), pagkatapos ay ang mga nakuha na halaga o ang paraan para sa pagkuha ng mga ito ay dapat na muling suriin.

Praktikal na Aplikasyon

Sa pagsasagawa, pinapayagan ka ng standard deviation na matukoy kung magkano ang mga halaga sa isang set ay maaaring mag-iba mula sa average na halaga.

Klima

Ipagpalagay na mayroong dalawang lungsod na may parehong average na maximum na pang-araw-araw na temperatura, ngunit ang isa ay matatagpuan sa baybayin at ang isa ay nasa loob ng bansa. Ito ay kilala na ang mga lungsod na matatagpuan sa baybayin ay may maraming iba't ibang pinakamataas na temperatura sa araw na mas mababa kaysa sa mga lungsod na matatagpuan sa loob ng bansa. Samakatuwid, ang karaniwang paglihis ng maximum na pang-araw-araw na temperatura para sa isang coastal city ay magiging mas mababa kaysa sa pangalawang lungsod, sa kabila ng katotohanan na ang kanilang average na halaga ay pareho, na sa pagsasanay ay nangangahulugan na ang posibilidad na ang pinakamataas na temperatura ng hangin ng bawat isa. tiyak na araw bawat taon ay magiging mas matindi mula sa average na halaga, mas mataas para sa isang lungsod na matatagpuan sa loob ng kontinente.

Palakasan

Ipagpalagay natin na mayroong ilang mga koponan ng football na sinusuri ayon sa ilang hanay ng mga parameter, halimbawa, ang bilang ng mga layunin na nakapuntos at natanggap, mga pagkakataon sa pag-iskor, atbp. Malamang na ang pinakamahusay na koponan sa pangkat na ito ay magkakaroon ng pinakamahusay na mga halaga Sa pamamagitan ng higit pa mga parameter. Kung mas maliit ang standard deviation ng team para sa bawat isa sa mga ipinakitang parameter, mas mahuhulaan ang resulta ng team ay balanse. Sa kabilang banda, ang pangkat na may malaking halaga pinahihirapan ng standard deviation na hulaan ang resulta, na ipinaliwanag naman ng kawalan ng timbang, halimbawa, malakas na depensa ngunit mahinang pag-atake.

Ang paggamit ng karaniwang paglihis ng mga parameter ng koponan ay ginagawang posible, sa isang antas o iba pa, upang mahulaan ang resulta ng isang laban sa pagitan ng dalawang koponan, pagtatasa ng mga lakas at mga kahinaan mga utos, at samakatuwid ang mga piniling paraan ng pakikibaka.

Teknikal na pagsusuri

Tingnan din

Panitikan

* Borovikov, V. STATISTICS. Ang sining ng pagsusuri ng data sa isang computer: Para sa mga propesyonal / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 p. - ISBN 5-272-00078-1.

Sa artikulong ito ay pag-uusapan ko paano hanapin ang standard deviation. Ang materyal na ito ay lubhang mahalaga para sa isang ganap na pag-unawa sa matematika, kaya ang isang math tutor ay dapat maglaan ng isang hiwalay na aralin o kahit na ilang sa pag-aaral nito. Sa artikulong ito makikita mo ang isang link sa isang detalyado at nauunawaan na video tutorial na nagpapaliwanag kung ano ang standard deviation at kung paano ito mahahanap.

Standard deviation ginagawang posible na suriin ang pagkalat ng mga halaga na nakuha bilang isang resulta ng pagsukat ng isang tiyak na parameter. Ipinapahiwatig ng simbolo (Griyego na titik "sigma").

Ang formula para sa pagkalkula ay medyo simple. Upang mahanap ang standard deviation, kailangan mong kunin ang square root ng variance. Kaya ngayon kailangan mong itanong, "Ano ang pagkakaiba-iba?"

Ano ang pagkakaiba

Ang kahulugan ng pagkakaiba-iba ay ganito. Ang dispersion ay ang arithmetic mean ng squared deviations ng mga value mula sa mean.

Upang mahanap ang pagkakaiba, gawin ang mga sumusunod na kalkulasyon nang sunud-sunod:

  • Tukuyin ang average (simpleng arithmetic average ng isang serye ng mga halaga).
  • Pagkatapos ay ibawas ang average mula sa bawat halaga at parisukat ang nagresultang pagkakaiba (nakukuha mo parisukat na pagkakaiba).
  • Ang susunod na hakbang ay upang kalkulahin ang arithmetic mean ng mga resultang squared differences (Maaari mong malaman kung bakit eksaktong nasa ibaba ang mga parisukat).

Tingnan natin ang isang halimbawa. Sabihin nating ikaw at ang iyong mga kaibigan ay nagpasya na sukatin ang taas ng iyong mga aso (sa milimetro). Bilang resulta ng mga sukat, natanggap mo ang mga sumusunod na sukat ng taas (sa mga lanta): 600 mm, 470 mm, 170 mm, 430 mm at 300 mm.

Kalkulahin natin ang mean, variance at standard deviation.

Una, hanapin natin ang average na halaga. Tulad ng alam mo na, upang gawin ito kailangan mong magdagdag ng lahat ng mga sinusukat na halaga at hatiin sa bilang ng mga sukat. Pag-unlad ng pagkalkula:

Average na mm.

Kaya, ang average (arithmetic mean) ay 394 mm.

Ngayon kailangan nating matukoy paglihis ng taas ng bawat aso mula sa average:

Sa wakas, upang makalkula ang pagkakaiba-iba, parisukat namin ang bawat isa sa mga resultang pagkakaiba, at pagkatapos ay hanapin ang arithmetic mean ng mga resultang nakuha:

Dispersion mm 2 .

Kaya, ang dispersion ay 21704 mm 2.

Paano makahanap ng standard deviation

Kaya paano natin ngayon makalkula ang karaniwang paglihis, alam ang pagkakaiba? Bilang tandaan namin, kunin ang square root nito. Iyon ay, ang karaniwang paglihis ay katumbas ng:

Mm (bilugan sa pinakamalapit na buong numero sa mm).

Gamit ang paraang ito, nalaman namin na ang ilang aso (halimbawa, Rottweiler) ay napakalalaking aso. Ngunit mayroon ding napakaliit na aso (halimbawa, mga dachshunds, ngunit hindi mo dapat sabihin sa kanila iyon).

Ang pinaka-kagiliw-giliw na bagay ay ang karaniwang paglihis ay nagdadala dito kapaki-pakinabang na impormasyon. Ngayon ay maipapakita natin kung alin sa mga nakuhang resulta ng pagsukat ng taas ang nasa loob ng pagitan na makukuha natin kung i-plot natin ang karaniwang paglihis mula sa average (sa magkabilang panig nito).

Iyon ay, gamit ang standard deviation, nakakakuha tayo ng "standard" na paraan na nagbibigay-daan sa amin upang malaman kung alin sa mga halaga ang normal (statistics average), at kung saan ay extraordinarily malaki o, sa kabaligtaran, maliit.

Ano ang standard deviation

Pero... magiiba ng kaunti ang lahat kung susuriin natin sample datos. Sa aming halimbawa ay isinasaalang-alang namin pangkalahatang populasyon. Ibig sabihin, ang aming 5 aso ay ang tanging aso sa mundo na interesado sa amin.

Ngunit kung ang data ay isang sample (mga halaga na pinili mula sa isang malaking populasyon), kung gayon ang mga kalkulasyon ay kailangang gawin nang iba.

Kung mayroong mga halaga, kung gayon:

Ang lahat ng iba pang mga kalkulasyon ay isinasagawa nang katulad, kabilang ang pagpapasiya ng average.

Halimbawa, kung ang limang aso natin ay sample lang ng populasyon ng mga aso (lahat ng aso sa planeta), dapat nating hatiin sa 4, hindi 5, ibig sabihin:

Sample na pagkakaiba = mm 2.

Sa kasong ito, ang standard deviation para sa sample ay katumbas ng mm (bilugan sa pinakamalapit na buong numero).

Maaari naming sabihin na gumawa kami ng ilang "pagwawasto" sa kaso kung saan ang aming mga halaga ay isang maliit na sample lamang.

Tandaan. Bakit eksaktong squared differences?

Ngunit bakit eksaktong kinuha natin ang mga parisukat na pagkakaiba kapag kinakalkula ang pagkakaiba? Sabihin nating kapag nagsusukat ng ilang parameter, natanggap mo ang sumusunod na hanay ng mga halaga: 4; 4; -4; -4. Kung idagdag lang natin ang ganap na mga paglihis mula sa mean (mga pagkakaiba) nang magkasama... ang mga negatibong halaga ay kanselahin kasama ang mga positibo:

.

Ito ay lumalabas na ang pagpipiliang ito ay walang silbi. Kung gayon marahil ay sulit na subukan ang ganap na mga halaga ng mga paglihis (iyon ay, ang mga module ng mga halagang ito)?

Sa unang sulyap, ito ay lumiliko nang maayos (ang nagresultang halaga, sa pamamagitan ng paraan, ay tinatawag na mean absolute deviation), ngunit hindi sa lahat ng kaso. Subukan natin ang isa pang halimbawa. Hayaang magresulta ang pagsukat sa sumusunod na hanay ng mga halaga: 7; 1; -6; -2. Kung gayon ang average na ganap na paglihis ay:

Wow! Muli kaming nakakuha ng resulta ng 4, kahit na ang mga pagkakaiba ay may mas malaking pagkalat.

Ngayon tingnan natin kung ano ang mangyayari kung parisukat natin ang mga pagkakaiba (at pagkatapos ay kunin ang square root ng kanilang kabuuan).

Para sa unang halimbawa ito ay magiging:

.

Para sa pangalawang halimbawa ay magiging:

Ngayon ay isang ganap na naiibang bagay! Kung mas malaki ang pagkalat ng mga pagkakaiba, mas malaki ang standard deviation ay... na kung ano ang aming ninanais.

Sa katunayan, ang pamamaraang ito ay gumagamit ng parehong ideya tulad ng kapag kinakalkula ang distansya sa pagitan ng mga punto, inilapat lamang sa ibang paraan.

At mula sa isang mathematical point of view, ang paggamit ng mga parisukat at parisukat na ugat nagbibigay ng higit na benepisyo kaysa sa maaari nating makuha mula sa mga ganap na halaga ng mga deviations, na ginagawang naaangkop ang standard deviation sa iba pang mga problema sa matematika.

Sinabi sa iyo ni Sergey Valerievich kung paano hanapin ang karaniwang paglihis

Aralin Blg. 4

Paksa: “Mga istatistikal na naglalarawan. Mga tagapagpahiwatig ng pagkakaiba-iba ng katangian sa pinagsama-samang"

Ang pangunahing pamantayan para sa pagkakaiba-iba ng isang katangian sa isang istatistikal na populasyon ay: limitasyon, amplitude, standard deviation, coefficient of oscillation at coefficient of variation. Sa nakaraang aralin, tinalakay na ang mga average na halaga ay nagbibigay lamang ng isang pangkalahatang katangian ng katangian na pinag-aaralan sa pinagsama-samang at hindi isinasaalang-alang ang mga halaga ng mga indibidwal na variant nito: minimum at maximum na mga halaga, sa itaas ng average, sa ibaba karaniwan, atbp.

Halimbawa. Mga average na halaga ng dalawang magkaibang pagkakasunud-sunod ng numero: -100; -20; 100; 20 at 0.1; -0.2; 0.1 ay ganap na magkapareho at pantayTUNGKOL SA.Gayunpaman, ang mga scatter range ng relatibong mean sequence data na ito ay ibang-iba.

Ang pagpapasiya ng nakalistang pamantayan para sa pagkakaiba-iba ng isang katangian ay pangunahing isinasagawa na isinasaalang-alang ang halaga nito sa mga indibidwal na elemento ng istatistikal na populasyon.

Ang mga tagapagpahiwatig para sa pagsukat ng pagkakaiba-iba ng isang katangian ay ganap At kamag-anak. Ang mga ganap na tagapagpahiwatig ng variation ay kinabibilangan ng: hanay ng variation, limitasyon, standard deviation, dispersion. Ang coefficient ng variation at ang coefficient ng oscillation ay tumutukoy sa mga relatibong sukat ng variation.

Limitasyon (lim)– Ito ay isang criterion na tinutukoy ng matinding halaga ng isang variant sa isang variation series. Sa madaling salita, ang pamantayang ito ay nililimitahan ng pinakamababa at pinakamataas na halaga ng katangian:

Amplitude (Am) o saklaw ng pagkakaiba-iba - Ito ang pagkakaiba sa pagitan ng mga matinding opsyon. Ang pagkalkula ng pamantayang ito ay isinasagawa sa pamamagitan ng pagbabawas ng pinakamababang halaga nito mula sa pinakamataas na halaga ng katangian, na nagpapahintulot sa amin na tantiyahin ang antas ng scatter ng opsyon:

Ang kawalan ng limitasyon at amplitude bilang pamantayan ng pabagu-bago ay ganap silang umaasa sa mga matinding halaga ng katangian sa serye ng pagkakaiba-iba. Sa kasong ito, ang mga pagbabago sa mga halaga ng katangian sa loob ng isang serye ay hindi isinasaalang-alang.

Ang pinakakumpletong paglalarawan ng pagkakaiba-iba ng isang katangian sa isang istatistikal na populasyon ay ibinigay ng karaniwang paglihis(sigma), na isang pangkalahatang sukatan ng paglihis ng isang opsyon mula sa average na halaga nito. Ang karaniwang paglihis ay madalas na tinatawag karaniwang paglihis.

Ang standard deviation ay batay sa isang paghahambing ng bawat opsyon sa arithmetic mean ng isang naibigay na populasyon. Dahil sa pinagsama-samang mayroong mga pagpipilian na parehong mas mababa at higit pa kaysa dito, ang kabuuan ng mga paglihis na may sign na "" ay kakanselahin ng kabuuan ng mga deviations na may sign "", i.e. ang kabuuan ng lahat ng deviations ay zero. Upang maiwasan ang impluwensya ng mga palatandaan ng mga pagkakaiba, ang mga paglihis mula sa arithmetic mean squared ay kinuha, i.e. . Ang kabuuan ng mga squared deviations ay hindi katumbas ng zero. Upang makakuha ng isang koepisyent na may kakayahang sukatin ang pagkakaiba-iba, kunin ang average ng kabuuan ng mga parisukat - ang halagang ito ay tinatawag mga pagkakaiba-iba:

Sa esensya, ang pagpapakalat ay ang average na parisukat ng mga paglihis ng mga indibidwal na halaga ng isang katangian mula sa average na halaga nito. Pagpapakalat parisukat ng karaniwang paglihis.

Ang pagkakaiba ay isang dimensional na dami (pinangalanan). Kaya, kung ang mga variant ng isang serye ng numero ay ipinahayag sa metro, kung gayon ang pagkakaiba ay nagbibigay ng square meters; kung ang mga opsyon ay ipinahayag sa kilo, kung gayon ang pagkakaiba ay nagbibigay ng parisukat ng panukalang ito (kg 2), atbp.

Standard deviation– square root ng variance:

, at kapag kinakalkula ang dispersion at standard deviation sa denominator ng fraction, sa halip nadapat ilagay.

Ang pagkalkula ng karaniwang paglihis ay maaaring nahahati sa anim na yugto, na dapat isagawa sa isang tiyak na pagkakasunud-sunod:

Application ng standard deviation:

a) para sa paghusga sa pagkakaiba-iba ng mga serye ng variation at paghahambing na pagtatasa ng typicality (representativeness) ng mga arithmetic average. Ito ay kinakailangan sa differential diagnosis kapag tinutukoy ang katatagan ng mga sintomas.

b) upang muling buuin ang serye ng variation, i.e. pagpapanumbalik ng frequency response nito batay sa tatlong sigma panuntunan. Sa pagitan (М±3σ) 99.7% ng lahat ng variant ng serye ay matatagpuan sa pagitan (М±2σ) - 95.5% at nasa hanay (М±1σ) - 68.3% variant ng row(Larawan 1).

c) upang matukoy ang mga opsyon na "pop-up".

d) upang matukoy ang mga parameter ng pamantayan at patolohiya gamit ang mga pagtatantya ng sigma

e) upang kalkulahin ang koepisyent ng pagkakaiba-iba

f) upang kalkulahin ang average na error ng arithmetic mean.

Upang makilala ang anumang populasyon na mayroonnormal na uri ng pamamahagi , sapat na upang malaman ang dalawang parameter: ang arithmetic mean at ang standard deviation.

Figure 1. Three Sigma rule

Halimbawa.

Sa pediatrics, ang standard deviation ay ginagamit upang masuri ang pisikal na pag-unlad ng mga bata sa pamamagitan ng paghahambing ng data ng isang partikular na bata na may kaukulang standard indicator. Ang average na arithmetic ng pisikal na pag-unlad ng malusog na mga bata ay kinuha bilang pamantayan. Ang paghahambing ng mga tagapagpahiwatig na may mga pamantayan ay isinasagawa gamit ang mga espesyal na talahanayan kung saan ang mga pamantayan ay ibinibigay kasama ang kanilang kaukulang mga sukat ng sigma. Ito ay pinaniniwalaan na kung ang tagapagpahiwatig ng pisikal na pag-unlad ng bata ay nasa loob ng pamantayan (aritmetika mean) ±σ, kung gayon pisikal na pag-unlad ang bata (ayon sa tagapagpahiwatig na ito) ay tumutugma sa pamantayan. Kung ang tagapagpahiwatig ay nasa loob ng pamantayan ± 2σ, pagkatapos ay mayroong isang bahagyang paglihis mula sa pamantayan. Kung ang tagapagpahiwatig ay lumampas sa mga limitasyong ito, kung gayon ang pisikal na pag-unlad ng bata ay naiiba nang husto mula sa pamantayan (posible ang patolohiya).

Bilang karagdagan sa mga tagapagpahiwatig ng pagkakaiba-iba na ipinahayag sa mga ganap na halaga, ang istatistikal na pananaliksik ay gumagamit ng mga tagapagpahiwatig ng pagkakaiba-iba na ipinahayag sa mga kaugnay na halaga. Oscillation coefficient - ito ang ratio ng hanay ng variation sa average na halaga ng katangian. Koepisyent ng pagkakaiba-iba - Ito ang ratio ng standard deviation sa average na halaga ng katangian. Karaniwan, ang mga halagang ito ay ipinahayag bilang mga porsyento.

Mga formula para sa pagkalkula ng mga relatibong tagapagpahiwatig ng pagkakaiba-iba:

Mula sa mga formula sa itaas ay malinaw na mas malaki ang koepisyent V ay mas malapit sa zero, mas maliit ang pagkakaiba-iba sa mga halaga ng katangian. Ang higit pa V, mas maraming variable ang sign.

Sa pagsasanay sa istatistika, ang koepisyent ng pagkakaiba-iba ay kadalasang ginagamit. Ito ay ginagamit hindi lamang para sa paghahambing na pagtatasa ng pagkakaiba-iba, ngunit din upang makilala ang homogeneity ng populasyon. Ang populasyon ay itinuturing na homogenous kung ang koepisyent ng variation ay hindi lalampas sa 33% (para sa mga distribusyon na malapit sa normal). Sa aritmetika, ang ratio ng σ at ang arithmetic mean ay neutralisahin ang impluwensya ganap na halaga ang mga katangiang ito, at ang ratio ng porsyento ay gumagawa ng coefficient ng variation bilang isang walang sukat (walang pangalan) na dami.

Ang resultang halaga ng koepisyent ng pagkakaiba-iba ay tinatantya alinsunod sa mga tinatayang gradasyon ng antas ng pagkakaiba-iba ng katangian:

Mahina - hanggang 10%

Average - 10 - 20%

Malakas - higit sa 20%

Ang paggamit ng koepisyent ng pagkakaiba-iba ay ipinapayong sa mga kaso kung saan kinakailangan upang ihambing ang mga katangian na naiiba sa laki at sukat.

Ang pagkakaiba sa pagitan ng koepisyent ng pagkakaiba-iba at iba pang pamantayan ng scatter ay malinaw na ipinakita halimbawa.

Talahanayan 1

Komposisyon ng mga manggagawa sa negosyong pang-industriya

Batay sa mga istatistikal na katangian na ibinigay sa halimbawa, maaari tayong gumawa ng isang konklusyon tungkol sa kamag-anak na homogeneity ng komposisyon ng edad at antas ng edukasyon ng mga empleyado ng negosyo, dahil sa mababang propesyonal na katatagan ng surveyed contingent. Madaling makita na ang isang pagtatangka na hatulan ang mga panlipunang uso sa pamamagitan ng karaniwang paglihis ay hahantong sa isang maling konklusyon, at ang pagtatangkang ihambing ang mga katangian ng accounting na "karanasan sa trabaho" at "edad" sa tagapagpahiwatig ng accounting na "edukasyon" ay karaniwang magiging. hindi tama dahil sa heterogeneity ng mga katangiang ito.

Median at percentiles

Para sa ordinal (ranggo) na mga distribusyon, kung saan ang criterion para sa gitna ng serye ay ang median, ang standard deviation at dispersion ay hindi maaaring magsilbi bilang mga katangian ng dispersion ng variant.

Ang parehong ay totoo para sa bukas na serye ng variation. Ang pangyayaring ito ay dahil sa katotohanan na ang mga paglihis kung saan ang pagkakaiba at σ ay kinakalkula ay sinusukat mula sa arithmetic mean, na hindi kinakalkula sa bukas na serye ng variation at sa serye ng mga distribusyon ng mga katangiang husay. Samakatuwid, para sa isang naka-compress na paglalarawan ng mga distribusyon, isa pang parameter ng scatter ang ginagamit - dami(kasingkahulugan - "percentile"), na angkop para sa paglalarawan ng mga katangian ng husay at dami sa anumang anyo ng kanilang pamamahagi. Magagamit din ang parameter na ito upang i-convert ang mga quantitative na katangian sa mga qualitative. Sa kasong ito, ang mga naturang rating ay itinalaga depende sa kung anong pagkakasunud-sunod ng dami ng isang partikular na opsyon ay tumutugma.

Sa pagsasagawa ng biomedical na pananaliksik, ang mga sumusunod na dami ay kadalasang ginagamit:

– panggitna;

, – quartile (quartile), kung saan – lower quartile, tuktok na kuwarts.

Hinahati ng mga quantile ang lugar ng mga posibleng pagbabago sa isang serye ng variation sa ilang mga agwat. Ang Median (quantile) ay isang opsyon na nasa gitna ng isang variation series at hinahati ang seryeng ito sa kalahati sa dalawang pantay na bahagi ( 0,5 At 0,5 ). Hinahati ng isang quartile ang isang serye sa apat na bahagi: ang unang bahagi (lower quartile) ay isang opsyon na naghihiwalay sa mga opsyon na ang mga numerical na halaga ay hindi lalampas sa 25% ng maximum na posible sa seryeng ito, pinaghihiwalay ng quartile ang mga opsyon na may numerical na halaga hanggang 50% ng maximum na posible. Ang itaas na quartile () ay naghihiwalay ng mga opsyon hanggang sa 75% ng maximum na posibleng mga halaga.

Sa kaso ng asymmetric distribution variable na may kaugnayan sa arithmetic mean, ang median at quartiles ay ginagamit upang makilala ito. Sa kasong ito, ang sumusunod na anyo ng pagpapakita ng average na halaga ay ginagamit - Meh (;). Halimbawa, ang pinag-aralan na tampok - "ang panahon kung saan ang bata ay nagsimulang lumakad nang nakapag-iisa" - ay may walang simetrya na pamamahagi sa pangkat ng pag-aaral. Kasabay nito, ang mas mababang quartile () ay tumutugma sa simula ng paglalakad - 9.5 na buwan, ang median - 11 buwan, ang itaas na quartile () - 12 buwan. Alinsunod dito, ang katangian ng average na trend ng tinukoy na katangian ay ipapakita bilang 11 (9.5; 12) na buwan.

Pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pag-aaral

Ang istatistikal na kahalagahan ng data ay nauunawaan bilang ang antas kung saan ito tumutugma sa ipinakitang katotohanan, i.e. Ang data na makabuluhang istatistika ay ang mga hindi nakakasira at wastong sumasalamin sa layunin ng katotohanan.

Ang pagtatasa sa istatistikal na kahalagahan ng mga resulta ng pananaliksik ay nangangahulugan ng pagtukoy sa kung anong posibilidad na mailipat ang mga resultang nakuha mula sa sample na populasyon sa buong populasyon. Ang pagtatasa ng istatistikal na kabuluhan ay kinakailangan upang maunawaan kung gaano karami ng isang phenomenon ang maaaring gamitin upang hatulan ang phenomenon sa kabuuan at ang mga pattern nito.

Ang pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pananaliksik ay binubuo ng:

1. mga error sa pagiging kinatawan (mga error ng average at relative values) - m;

2. mga limitasyon ng kumpiyansa ng average o kamag-anak na mga halaga;

3. pagiging maaasahan ng pagkakaiba sa average o kamag-anak na mga halaga ayon sa pamantayan t.

Standard error ng arithmetic mean o pagkakamali sa pagiging kinatawan nailalarawan ang pagbabagu-bago ng average. Dapat tandaan na kung mas malaki ang laki ng sample, mas maliit ang pagkalat ng mga average na halaga. Ang karaniwang error ng mean ay kinakalkula gamit ang formula:

Sa modernong siyentipikong panitikan, ang arithmetic mean ay isinulat kasama ng error sa representasyon:

o kasama ng karaniwang paglihis:

Bilang halimbawa, isaalang-alang ang data sa 1,500 urban clinics sa bansa (pangkalahatang populasyon). Ang average na bilang ng mga pasyente na nagsilbi sa klinika ay 18,150 katao. Ang random na pagpili ng 10% ng mga site (150 klinika) ay nagbibigay ng average na bilang ng mga pasyente na katumbas ng 20,051 katao. Ang error sa sampling, malinaw naman dahil sa katotohanan na hindi lahat ng 1500 na klinika ay kasama sa sample, ay katumbas ng pagkakaiba sa pagitan ng mga average na ito - ang pangkalahatang average ( M gene) at sample mean ( M napili). Kung bubuo tayo ng isa pang sample na may parehong laki mula sa ating populasyon, magbibigay ito ng ibang halaga ng error. Ang lahat ng sample na ito ay nangangahulugan na may sapat na malalaking sample ay karaniwang ipinamamahagi sa paligid ng pangkalahatang mean na may sapat na malaki malaking bilang pag-uulit ng isang sample ng parehong bilang ng mga bagay mula sa isang populasyon. Standard error ng mean m- ito ang hindi maiiwasang pagkalat ng sample na paraan sa paligid ng pangkalahatang mean.

Sa kaso kapag ang mga resulta ng pananaliksik ay ipinakita sa mga kamag-anak na dami (halimbawa, mga porsyento) - kinakalkula karaniwang error ng fraction:

kung saan ang P ay ang indicator sa %, n ay ang bilang ng mga obserbasyon.

Ang resulta ay ipinapakita bilang (P ± m)%. Halimbawa, ang porsyento ng paggaling sa mga pasyente ay (95.2±2.5)%.

Sa kaganapan na ang bilang ng mga elemento ng populasyon, pagkatapos ay kapag kinakalkula ang mga karaniwang error ng mean at ang fraction sa denominator ng fraction, sa halip nadapat ilagay.

Para sa isang normal na distribusyon (normal ang distribusyon ng sample na paraan), alam natin kung anong bahagi ng populasyon ang nasa loob ng anumang pagitan sa paligid ng ibig sabihin. Sa partikular:

Sa pagsasagawa, ang problema ay ang mga katangian ng pangkalahatang populasyon ay hindi alam sa amin, at ang sample ay ginawa nang tumpak para sa layunin ng pagtantya sa kanila. Nangangahulugan ito na kung gumawa tayo ng mga sample ng parehong laki n mula sa pangkalahatang populasyon, pagkatapos ay sa 68.3% ng mga kaso ang pagitan ay maglalaman ng halaga M(sa 95.5% ng mga kaso ito ay nasa pagitan at sa 99.7% ng mga kaso - sa pagitan).

Dahil isang sample lamang ang aktwal na kinuha, ang pahayag na ito ay nabuo sa mga tuntunin ng posibilidad: na may posibilidad na 68.3%, ang average na halaga ng katangian sa populasyon ay nasa pagitan, na may posibilidad na 95.5% - sa pagitan, atbp.

Sa pagsasagawa, ang isang pagitan ay binuo sa paligid ng sample na halaga na, na may ibinigay na (sapat na mataas) na posibilidad, posibilidad ng kumpiyansa -"sasaklawin" ang tunay na halaga ng parameter na ito sa pangkalahatang populasyon. Ang agwat na ito ay tinatawag agwat ng kumpiyansa.

probabilidad ng kumpiyansaP ito ang antas ng kumpiyansa na ang agwat ng kumpiyansa ay talagang maglalaman ng tunay (hindi kilalang) halaga ng parameter sa populasyon.

Halimbawa, kung ang posibilidad ng kumpiyansa R ay 90%, nangangahulugan ito na 90 sample sa 100 ang magbibigay ng tamang pagtatantya ng parameter sa populasyon. Alinsunod dito, ang posibilidad ng error, i.e. maling pagtatantya ng pangkalahatang average para sa sample ay katumbas ng porsyento: . Para sa halimbawang ito nangangahulugan ito na 10 sample sa 100 ay magbibigay ng maling pagtatantya.

Malinaw, ang antas ng kumpiyansa (confidence probability) ay nakasalalay sa laki ng agwat: mas malawak ang pagitan, mas mataas ang kumpiyansa na mahuhulog dito ang isang hindi kilalang halaga para sa populasyon. Sa pagsasagawa, hindi bababa sa dalawang beses ang sampling error ay ginagamit upang bumuo ng isang confidence interval upang magbigay ng hindi bababa sa 95.5% kumpiyansa.

Ang pagtukoy sa mga limitasyon ng kumpiyansa ng mga average at kamag-anak na mga halaga ay nagbibigay-daan sa amin upang mahanap ang kanilang dalawang matinding halaga - ang pinakamababang posible at ang maximum na posible, kung saan ang pinag-aralan na tagapagpahiwatig ay maaaring mangyari sa buong populasyon. Batay dito, mga limitasyon ng kumpiyansa (o agwat ng kumpiyansa)- ito ang mga hangganan ng average o kamag-anak na mga halaga, na higit sa kung saan dahil sa mga random na pagbabagu-bago ay mayroong isang hindi gaanong posibilidad.

Ang agwat ng kumpiyansa ay maaaring muling isulat bilang: , kung saan t– pamantayan ng kumpiyansa.

Ang mga limitasyon ng kumpiyansa ng arithmetic mean sa populasyon ay tinutukoy ng formula:

M gene = M pumili + t m M

para sa relatibong halaga:

R gene = P pumili + t m R

saan M gene At R gene- mga halaga ng average at kamag-anak na mga halaga para sa pangkalahatang populasyon; M pumili At R pumili- mga halaga ng average at kamag-anak na mga halaga na nakuha mula sa sample na populasyon; m M At m P- mga error ng average at kamag-anak na mga halaga; t- criterion ng kumpiyansa (criterion ng katumpakan, na itinatag kapag nagpaplano ng pag-aaral at maaaring katumbas ng 2 o 3); t m- ito ay isang confidence interval o Δ - ang pinakamataas na error ng indicator na nakuha sa isang sample na pag-aaral.

Dapat tandaan na ang halaga ng criterion t sa isang tiyak na lawak na nauugnay sa posibilidad ng isang walang error na pagtataya (p), na ipinahayag sa %. Pinili ito ng mismong mananaliksik, ginagabayan ng pangangailangang makuha ang resulta na may kinakailangang antas ng katumpakan. Kaya, para sa posibilidad ng isang walang error na forecast na 95.5%, ang halaga ng criterion t ay 2, para sa 99.7% - 3.

Ang ibinigay na mga pagtatantya sa pagitan ng kumpiyansa ay tinatanggap lamang para sa mga istatistikal na populasyon na may higit sa 30 mga obserbasyon Sa mas maliit na laki ng populasyon (maliit na mga sample), ang mga espesyal na talahanayan ay ginagamit upang matukoy ang t criterion. Sa mga talahanayang ito, ang nais na halaga ay matatagpuan sa intersection ng linya na tumutugma sa laki ng populasyon (n-1), at isang column na tumutugma sa antas ng posibilidad ng isang walang error na pagtataya (95.5%; 99.7%) na pinili ng mananaliksik. Sa medikal na pananaliksik, kapag nagtatatag ng mga limitasyon ng kumpiyansa para sa anumang tagapagpahiwatig, ang posibilidad ng isang walang error na pagtataya ay 95.5% o higit pa. Nangangahulugan ito na ang halaga ng indicator na nakuha mula sa sample na populasyon ay dapat matagpuan sa pangkalahatang populasyon sa hindi bababa sa 95.5% ng mga kaso.

    Mga tanong sa paksa ng aralin:

    Kaugnayan ng mga tagapagpahiwatig ng pagkakaiba-iba ng katangian sa isang istatistikal na populasyon.

    Pangkalahatang katangian ng mga tagapagpahiwatig ng ganap na pagkakaiba-iba.

    Standard deviation, pagkalkula, aplikasyon.

    Mga kamag-anak na sukat ng pagkakaiba-iba.

    Median, quartile na marka.

    Pagtatasa ng istatistikal na kahalagahan ng mga resulta ng pag-aaral.

    Standard error ng arithmetic mean, formula ng pagkalkula, halimbawa ng paggamit.

    Pagkalkula ng proporsyon at ang karaniwang error nito.

    Ang konsepto ng posibilidad ng kumpiyansa, isang halimbawa ng paggamit.

10. Ang konsepto ng isang agwat ng kumpiyansa, ang aplikasyon nito.

    Subukan ang mga gawain sa paksa na may karaniwang mga sagot:

1. MGA GANAP NA INDICATOR NG VARIATION AY TUNGKOL SA

1) koepisyent ng pagkakaiba-iba

2) koepisyent ng oscillation

4) panggitna

2. MGA RELATIVE INDICATOR NG VARIATION RELATE

1) pagpapakalat

4) koepisyent ng pagkakaiba-iba

3. CRITERION NA TINUTUKOY NG MGA SOBRANG HALAGA NG ISANG OPTION SA ISANG VARIATION SERIES

2) amplitude

3) pagpapakalat

4) koepisyent ng pagkakaiba-iba

4. ANG PAGKAKAIBA NG MGA SOBRANG OPSYON AY

2) amplitude

3) karaniwang paglihis

4) koepisyent ng pagkakaiba-iba

5. ANG AVERAGE SQUARE NG MGA PAGLILIHIS NG INDIBIDWAL NA HALAGA NG ISANG KATANGIAN MULA SA AVERAGE NA HALAGA NITO AY

1) koepisyent ng oscillation

2) panggitna

3) pagpapakalat

6. ANG RATIO NG SCALE OF VARIATION SA AVERAGE VALUE NG ISANG CHARACTER AY

1) koepisyent ng pagkakaiba-iba

2) karaniwang paglihis

4) koepisyent ng oscillation

7. ANG RATIO NG AVERAGE SQUARE DEVIATION SA AVERAGE VALUE NG ISANG KATANGIAN AY

1) pagpapakalat

2) koepisyent ng pagkakaiba-iba

3) koepisyent ng oscillation

4) amplitude

8. ANG OPTION NA NASA GITNA NG VARIATION SERIES AT HINATI ITO SA DALAWANG PANTAY NA BAHAGI AY

1) panggitna

3) amplitude

9. SA MEDIKAL NA PANANALIKSIK, KAPAG NAGTATATAG NG MGA LIMITASYON NG PAGTIWALA PARA SA ANUMANG INDICATOR, ANG PROBABILIDAD NG WALANG ERROR NA PREDICTION AY TATANGGAP.

10. KUNG 90 SAMPLE SA 100 ANG NAGBIBIGAY NG TAMANG TANTA NG ISANG PARAMETER SA POPULASYON, IBIG SABIHIN NITO NA ANG PROBABILIDAD NG PAGTIWALA P PANTAY

11. KUNG 10 SAMPLE SA 100 ANG MAGBIBIGAY NG MALING PAGTAYA, ANG PROBABILIDAD NG ERROR AY PANTAY.

12. MGA LIMITASYON NG AVERAGE O KAUGNAY NA MGA HALAGA, HIGIT PA NA DAHIL SA RANDOM OSCILLATIONS AY MAY MALIIT NA PROBABILIDAD – ITO AY

1) agwat ng kumpiyansa

2) amplitude

4) koepisyent ng pagkakaiba-iba

13. ISANG MALIIT NA HALIMBAWA AY ITINURAD NA POPULASYON NA KUNG SAAN

1) ang n ay mas mababa sa o katumbas ng 100

2) ang n ay mas mababa sa o katumbas ng 30

3) ang n ay mas mababa sa o katumbas ng 40

4) n ay malapit sa 0

14. PARA SA PROBABILIDAD NG WALANG ERROR na PAGTATAYA 95% NA HALAGA NG CRITERION t AY

15. PARA SA PROBABILIDAD NG WALANG ERROR FORECAST 99% CRITERION VALUE t AY

16. PARA SA MGA DISTRIBUTION NA MALAPIT SA NORMAL, ANG POPULASYON AY ITINUTURING HOMOGENEOUS KUNG ANG COEFFICIENT OF VARIATION AY HINDI HIGIT SA

17. OPTION, SEPARATING OPTIONS, NUMERICAL VALUES NA HINDI HIGIT SA 25% NG MAXIMUM POSSIBLE SA ISANG BIGAY NA SERYE – ITO AY

2) mas mababang quartile

3) itaas na quartile

4) quartile

18. ANG DATOS NA HINDI NAKAKABITI AT TAMA NA NAGSASALIN ANG LAYUNIN NA REALIDAD AY TINATAWAG

1) imposible

2) pantay na posible

3) maaasahan

4) random

19. AYON SA PANUNTUNAN NG "THREE Sigma", NA MAY NORMAL NA PAGHAHATID NG KATANGIAN SA LOOB.
MATATAGPUAN

1) 68.3% na opsyon

Ang karaniwang paglihis ay isang klasikong tagapagpahiwatig ng pagkakaiba-iba mula sa mga istatistikang naglalarawan.

Standard Deviation, karaniwang paglihis, Standard deviation, sample standard deviation (eng. standard deviation, STD, STDev) ay isang napakakaraniwang indicator ng dispersion sa mga deskriptibong istatistika. Pero, kasi ang teknikal na pagsusuri ay katulad ng mga istatistika; ang tagapagpahiwatig na ito ay maaaring (at dapat) gamitin sa teknikal na pagsusuri upang makita ang antas ng pagpapakalat ng presyo ng nasuri na instrumento sa paglipas ng panahon. Tinutukoy ng simbolong Griyego na Sigma "σ".

Salamat kina Carl Gauss at Pearson sa pagpapahintulot sa amin na gumamit ng standard deviation.

Gamit standard deviation sa teknikal na pagsusuri, iikot natin ito "index ng pagpapakalat""V "tagapagpahiwatig ng pagkasumpungin", pinapanatili ang kahulugan, ngunit binabago ang mga termino.

Ano ang standard deviation

Ngunit bukod sa mga intermediate auxiliary kalkulasyon, ang standard deviation ay medyo katanggap-tanggap para sa independiyenteng pagkalkula at mga aplikasyon sa teknikal na pagsusuri. Bilang isang aktibong mambabasa ng aming magazine burdock nabanggit, " Hindi ko pa rin maintindihan kung bakit hindi kasama ang standard deviation sa set ng standard indicators ng domestic dealing centers«.

talaga, masusukat ng standard deviation ang pagkakaiba-iba ng isang instrumento sa isang klasiko at "dalisay" na paraan. Ngunit sa kasamaang palad, ang tagapagpahiwatig na ito ay hindi pangkaraniwan sa pagsusuri ng mga mahalagang papel.

Paglalapat ng standard deviation

Ang manu-manong pagkalkula ng standard deviation ay hindi masyadong interesante, ngunit kapaki-pakinabang para sa karanasan. Maaaring ipahayag ang standard deviation formula STD=√[(∑(x-x ) 2)/n] , na parang ugat ng kabuuan ng mga parisukat ng mga pagkakaiba sa pagitan ng mga elemento ng sample at ng mean, na hinati sa bilang ng mga elemento sa sample.

Kung ang bilang ng mga elemento sa sample ay lumampas sa 30, kung gayon ang denominator ng fraction sa ilalim ng ugat ay kukuha ng halaga n-1. Kung hindi n ay ginagamit.

Hakbang-hakbang karaniwang pagkalkula ng paglihis:

  1. kalkulahin ang arithmetic mean ng sample ng data
  2. ibawas ang average na ito mula sa bawat sample na elemento
  3. parisukat namin ang lahat ng mga resultang pagkakaiba
  4. buuin ang lahat ng resultang mga parisukat
  5. hatiin ang nagresultang halaga sa bilang ng mga elemento sa sample (o sa n-1, kung n>30)
  6. kalkulahin ang square root ng nagresultang quotient (tinatawag na pagpapakalat)

Tinukoy bilang isang pangkalahatang katangian ng laki ng pagkakaiba-iba ng isang katangian sa pinagsama-samang. Ito ay katumbas ng square root ng average na square deviation ng mga indibidwal na halaga ng katangian mula sa arithmetic mean, i.e. Ang ugat ng at maaaring matagpuan tulad nito:

1. Para sa pangunahing hilera:

2. Para sa serye ng variation:

Dinadala ito ng pagbabago sa standard deviation formula sa isang form na mas maginhawa para sa mga praktikal na kalkulasyon:

Standard deviation tinutukoy kung gaano karami sa average na partikular na mga opsyon ang lumihis mula sa kanilang average na halaga, at isa rin itong ganap na sukatan ng pagkakaiba-iba ng isang katangian at ipinahayag sa parehong mga yunit ng mga opsyon, at samakatuwid ay mahusay na binibigyang-kahulugan.

Mga halimbawa ng paghahanap ng standard deviation: ,

Para sa mga alternatibong katangian, ang average na formula parisukat na paglihis ganito ang hitsura:

kung saan ang p ay ang proporsyon ng mga yunit sa populasyon na may isang tiyak na katangian;

q ay ang proporsyon ng mga yunit na walang ganitong katangian.

Ang konsepto ng average na linear deviation

Average na linear deviation ay tinukoy bilang ang arithmetic mean ng mga ganap na halaga ng mga paglihis ng mga indibidwal na opsyon mula sa .

1. Para sa pangunahing hilera:

2. Para sa serye ng variation:

kung saan ang kabuuan n ay kabuuan ng mga frequency ng variation series.

Isang halimbawa ng paghahanap ng average na linear deviation:

Ang bentahe ng mean absolute deviation bilang sukatan ng dispersion sa hanay ng variation ay kitang-kita, dahil ang panukalang ito ay nakabatay sa pagsasaalang-alang sa lahat ng posibleng deviations. Ngunit ang tagapagpahiwatig na ito ay may mga makabuluhang disbentaha. Ang di-makatwirang pagtanggi sa mga algebraic na palatandaan ng mga paglihis ay maaaring humantong sa katotohanan na ang mga katangian ng matematika ng tagapagpahiwatig na ito ay malayo sa elementarya. Ginagawa nitong napakahirap gamitin ang mean absolute deviation kapag nilulutas ang mga problemang kinasasangkutan ng probabilistikong kalkulasyon.

Samakatuwid, ang average na linear deviation bilang isang sukatan ng pagkakaiba-iba ng isang katangian ay bihirang ginagamit sa istatistikal na kasanayan, lalo na kapag ang pagbubuod ng mga tagapagpahiwatig nang hindi isinasaalang-alang ang mga palatandaan ay may kahulugan sa ekonomiya. Sa tulong nito, halimbawa, nasuri ang turnover kalakalang panlabas, komposisyon ng mga manggagawa, ritmo ng produksyon, atbp.

Mean square

Inilapat ang ibig sabihin ng parisukat, halimbawa, upang kalkulahin ang average na laki ng mga gilid ng n square section, ang average na diameters ng mga putot, pipe, atbp. Ito ay nahahati sa dalawang uri.

Simple mean square. Kung, kapag pinapalitan ang mga indibidwal na halaga ng isang katangian ng average na halaga Kung kinakailangan na panatilihing pare-pareho ang kabuuan ng mga parisukat ng orihinal na mga halaga, kung gayon ang average ay magiging isang parisukat na average na halaga.

Ito ang square root ng quotient ng paghahati ng kabuuan ng mga parisukat ng mga indibidwal na halaga ng katangian sa kanilang numero:

Ang weighted mean square ay kinakalkula gamit ang formula:

kung saan ang f ay ang tanda ng timbang.

Average na kubiko

Nalalapat ang average na kubiko, halimbawa, kapag tinutukoy ang average na haba ng isang gilid at mga cube. Ito ay nahahati sa dalawang uri.
Average na cubic simple:

Kapag kinakalkula ang mga average na halaga at pagpapakalat sa serye ng pamamahagi ng agwat, ang mga tunay na halaga ng katangian ay pinapalitan ng mga sentral na halaga ng mga agwat, na naiiba sa average mga halaga ng aritmetika kasama sa pagitan. Ito ay humahantong sa isang sistematikong error kapag kinakalkula ang pagkakaiba. V.F. Tinukoy iyon ni Sheppard error sa pagkalkula ng variance, na dulot ng paggamit ng pinagsama-samang data, ay 1/12 ng parisukat ng halaga ng pagitan, parehong sa direksyon ng pagtaas at sa direksyon ng pagpapababa ng magnitude ng dispersion.

Sheppard Amendment dapat gamitin kung ang distribusyon ay malapit sa normal, nauugnay sa isang katangian na may tuluy-tuloy na katangian ng variation, at nakabatay sa malaking halaga ng paunang data (n > 500). Gayunpaman, batay sa katotohanan na sa ilang mga kaso ang parehong mga pagkakamali, na kumikilos sa iba't ibang direksyon, ay nagbabayad sa bawat isa, kung minsan ay posible na tumanggi na ipakilala ang mga pagwawasto.

Kung mas maliit ang pagkakaiba at karaniwang paglihis, mas homogenous ang populasyon at magiging mas tipikal ang average.
Sa pagsasagawa ng mga istatistika, madalas na kailangang ihambing ang mga pagkakaiba-iba ng iba't ibang katangian. Halimbawa, malaking interes na ihambing ang mga pagkakaiba-iba sa edad ng mga manggagawa at kanilang mga kwalipikasyon, haba ng serbisyo at laki. sahod, gastos at tubo, haba ng serbisyo at produktibidad ng paggawa, atbp. Para sa gayong mga paghahambing, ang mga tagapagpahiwatig ng ganap na pagkakaiba-iba ng mga katangian ay hindi angkop: imposibleng ihambing ang pagkakaiba-iba ng karanasan sa trabaho, na ipinahayag sa mga taon, na may pagkakaiba-iba ng sahod, na ipinahayag sa rubles.

Upang maisakatuparan ang gayong mga paghahambing, pati na rin ang mga paghahambing ng pagkakaiba-iba ng parehong katangian sa ilang mga populasyon na may iba't ibang mga average na arithmetic, ginagamit ang isang kamag-anak na tagapagpahiwatig ng pagkakaiba-iba - ang koepisyent ng pagkakaiba-iba.

Mga katamtamang istruktura

Upang makilala ang sentral na tendensya sa mga distribusyon ng istatistika, madalas na makatwiran na gamitin, kasama ang arithmetic mean, ang isang tiyak na halaga ng katangian X, na, dahil sa ilang mga tampok ng lokasyon nito sa serye ng pamamahagi, ay maaaring makilala ang antas nito.

Ito ay lalong mahalaga kapag sa isang serye ng pamamahagi ang mga matinding halaga ng isang katangian ay may hindi malinaw na mga hangganan. Dahil dito tumpak na kahulugan Ang ibig sabihin ng aritmetika ay kadalasang imposible o napakahirap. Sa ganitong mga kaso, ang average na antas ay maaaring matukoy sa pamamagitan ng pagkuha, halimbawa, ang halaga ng tampok na matatagpuan sa gitna ng serye ng dalas o kung saan nangyayari ang pinakamadalas sa kasalukuyang serye.

Ang ganitong mga halaga ay nakasalalay lamang sa likas na katangian ng mga frequency, ibig sabihin, sa istraktura ng pamamahagi. Ang mga ito ay tipikal sa lokasyon sa isang serye ng mga frequency, samakatuwid ang mga naturang halaga ay itinuturing na mga katangian ng sentro ng pamamahagi at samakatuwid ay natanggap ang kahulugan ng mga istrukturang average. Sanay na silang mag-aral panloob na istraktura at ang istraktura ng serye ng pamamahagi ng mga halaga ng katangian. Kabilang sa mga naturang tagapagpahiwatig ang:



 


Basahin:



Accounting para sa mga settlement na may badyet

Accounting para sa mga settlement na may badyet

Ang Account 68 sa accounting ay nagsisilbi upang mangolekta ng impormasyon tungkol sa mga ipinag-uutos na pagbabayad sa badyet, na ibinawas kapwa sa gastos ng negosyo at...

Mga cheesecake mula sa cottage cheese sa isang kawali - mga klasikong recipe para sa malambot na cheesecake Mga cheesecake mula sa 500 g ng cottage cheese

Mga cheesecake mula sa cottage cheese sa isang kawali - mga klasikong recipe para sa malambot na cheesecake Mga cheesecake mula sa 500 g ng cottage cheese

Mga sangkap: (4 na servings) 500 gr. cottage cheese 1/2 tasa ng harina 1 itlog 3 tbsp. l. asukal 50 gr. mga pasas (opsyonal) kurot ng asin baking soda...

Black pearl salad na may prun Black pearl salad na may prun

Salad

Magandang araw sa lahat ng nagsusumikap para sa pagkakaiba-iba sa kanilang pang-araw-araw na pagkain. Kung ikaw ay pagod na sa mga monotonous na pagkain at gusto mong masiyahan...

Lecho na may mga recipe ng tomato paste

Lecho na may mga recipe ng tomato paste

Napakasarap na lecho na may tomato paste, tulad ng Bulgarian lecho, na inihanda para sa taglamig. Ito ay kung paano namin pinoproseso (at kumakain!) 1 bag ng mga sili sa aming pamilya. At sino ang gusto kong...

feed-image RSS