bahay - Mga sahig
One-way na pagsusuri ng pagkakaiba. Multivariate analysis of variance Pagsusuri ng variance article

ANOVA batay sa mga gawa ng sikat na mathematician R.A. Fisher... Sa kabila ng medyo solidong "edad", ang pamamaraang ito ay nananatiling isa sa pangunahing sa biyolohikal at agrikultural na pananaliksik. Ang mga ideyang pinagbabatayan ng pagsusuri ng pagkakaiba-iba ay malawakang ginagamit sa maraming iba pang mga pamamaraan ng mathematical analysis ng eksperimental na data, gayundin sa pagpaplano ng biyolohikal at agrikultural na mga eksperimento.

Ang pagsusuri ng pagkakaiba ay nagbibigay-daan sa iyo na:

1) ihambing ang dalawa o higit pang sample na paraan;

2) sabay-sabay na pag-aralan ang pagkilos ng ilang independiyenteng mga kadahilanan, habang posible na matukoy ang parehong epekto ng bawat kadahilanan sa pagkakaiba-iba ng pinag-aralan na katangian, at ang kanilang pakikipag-ugnayan;

3) wastong magplano ng siyentipikong eksperimento.

Ang pagkakaiba-iba ng mga nabubuhay na organismo ay ipinakita sa anyo ng isang scatter o scatter ng mga halaga ng mga indibidwal na katangian sa loob ng mga limitasyon na tinutukoy ng antas ng biological evenness ng materyal at ang likas na katangian ng kaugnayan sa mga kondisyon sa kapaligiran. Ang mga palatandaan na nagbabago sa ilalim ng impluwensya ng ilang mga kadahilanan ay tinatawag epektibo.

Ang mga salik ay anumang mga impluwensya o kundisyon, ang pagkakaiba-iba nito ay maaaring makaapekto sa pagkakaiba-iba ng mabisang katangian. Ang istatistikal na impluwensya ng mga kadahilanan sa pagsusuri ng pagkakaiba-iba ay nauunawaan bilang ang pagmuni-muni sa pagkakaiba-iba ng epektibong tagapagpahiwatig ng pagkakaiba-iba ng mga pinag-aralan na mga kadahilanan, na inayos sa pag-aaral.

Ang ibig sabihin ng pagkakaiba-iba ay ang pagkakaroon ng hindi pantay na halaga ng bawat katangian sa iba't ibang indibidwal na pinagsama sa isang grupo. Ang pagkakaiba-iba ng isang pangkat ng mga indibidwal ayon sa katangiang pinag-aaralan ay maaaring magkaroon ng ibang antas, na kadalasang sinusukat ng mga tagapagpahiwatig ng pagkakaiba-iba (o pagkakaiba-iba): mga limitasyon, karaniwang paglihis, koepisyent ng pagkakaiba-iba. Sa pagsusuri ng pagkakaiba-iba, ang antas ng pagkakaiba-iba ng indibidwal at average na mga halaga ng isang katangian ay sinusukat at inihambing sa mga espesyal na paraan na bumubuo sa mga detalye ng pangkalahatang pamamaraang ito.

Ang organisasyon ng mga kadahilanan ay ang ilang mga halaga ay itinalaga sa bawat pinag-aralan na kadahilanan. Alinsunod sa mga halagang ito, ang bawat kadahilanan ay nahahati sa ilang mga gradasyon; para sa bawat gradasyon, ilang indibidwal ang pinipili ayon sa prinsipyo ng random sampling, kung saan ang halaga ng epektibong katangian ay kasunod na sinusukat.

Upang malaman ang antas at pagiging maaasahan ng impluwensya ng mga pinag-aralan na salik, kinakailangang sukatin at suriin ang bahaging iyon ng kabuuang pagkakaiba-iba na dulot ng mga salik na ito.

Ang mga salik na nakakaapekto sa antas ng pagkakaiba-iba ng mabisang katangian ay nahahati sa:

1) adjustable

2) random

Regulado (systematic) ang mga salik ay sanhi ng pagkilos ng salik na pinag-aralan sa eksperimento, na may ilang mga gradasyon sa eksperimento. Factor gradation- ito ang antas ng epekto nito sa epektibong tampok. Alinsunod sa gradation ng attribute, ilang variant ng eksperimento ang naka-highlight para sa paghahambing. Dahil ang mga salik na ito ay preconditioned, ang mga ito ay tinatawag na regulated sa pananaliksik, i.e. ibinigay, depende sa organisasyon ng eksperimento. Dahil dito, ang mga nababagay na kadahilanan ay mga kadahilanan na ang pagkilos ay pinag-aralan sa karanasan, sila ang tumutukoy sa mga pagkakaiba sa pagitan ng sample na paraan ng iba't ibang mga pagpipilian - intergroup (factorial) variance.

Random na mga kadahilanan ay tinutukoy ng natural na pagkakaiba-iba ng lahat ng mga palatandaan ng mga biological na bagay sa kalikasan. Ito ay mga salik na lampas sa kontrol ng karanasan. Mayroon silang random na epekto sa mabisang katangian, nagdudulot ng mga error sa eksperimentong at tinutukoy ang scatter (dispersion) ng katangian sa loob ng bawat variant. Ang pagkalat na ito ay tinatawag na pagkakaiba-iba ng intragroup (random)..

Kaya, ang kamag-anak na papel ng mga indibidwal na kadahilanan sa pangkalahatang pagkakaiba-iba ng epektibong katangian ay nailalarawan sa pamamagitan ng pagkakaiba-iba at maaaring pag-aralan gamit ang pagsusuri ng variance o scattering analysis

Ang ANOVA ay batay sa paghahambing ng mga pagkakaiba-iba sa pagitan ng pangkat at sa loob ng pangkat... Kung ang pagkakaiba-iba ng intergroup ay hindi lalampas sa pagkakaiba-iba ng intragroup, kung gayon ang mga pagkakaiba sa pagitan ng mga pangkat ay random. Kung ang pagkakaiba-iba ng intergroup ay makabuluhang mas mataas kaysa sa pagkakaiba-iba ng intragroup, kung gayon sa pagitan ng mga pinag-aralan na grupo (mga opsyon) ay may mga makabuluhang pagkakaiba sa istatistika dahil sa epekto ng salik na pinag-aralan sa eksperimento.

Kasunod nito na sa istatistikal na pag-aaral ng mabisang katangian gamit ang pagsusuri ng pagkakaiba, kinakailangan upang matukoy ang pagkakaiba-iba nito sa mga variant, pag-uulit, natitirang pagkakaiba-iba sa loob ng mga pangkat na ito at ang pangkalahatang pagkakaiba-iba ng epektibong katangian sa eksperimento. Alinsunod dito, tatlong uri ng mga pagpapakalat ay nakikilala:

1) Ang pangkalahatang pagkakaiba-iba ng mabisang katangian (S y 2);

2) Intergroup, o pribado, sa pagitan ng mga sample (S y 2);

3) Intragroup, nalalabi (S z 2).

Kaya naman, pagsusuri ng pagkakaiba-ibaIto ang paghahati ng kabuuang kabuuan ng mga parisukat ng mga paglihis at ang kabuuang bilang ng mga antas ng kalayaan sa mga bahagi o bahagi na tumutugma sa istruktura ng eksperimento, at ang pagtatasa ng kahalagahan ng pagkilos at pakikipag-ugnayan ng mga salik na pinag-aaralan. ayon sa F-criterion. Depende sa bilang ng sabay-sabay na pinag-aralan na mga salik, dalawa-, tatlo, apat na salik na pagsusuri ng pagkakaiba ay nakikilala.

Kapag nagpoproseso ng field one-factor statistical complex na binubuo ng ilang independiyenteng variant, ang kabuuang pagkakaiba-iba ng epektibong katangian, na sinusukat ng kabuuang kabuuan ng mga parisukat (C y), ay nahahati sa tatlong bahagi: ang pagkakaiba-iba sa pagitan ng mga variant (mga sample) - CV , ang pagkakaiba-iba ng mga pag-uulit (ang mga variant ay nauugnay sa isang karaniwang kinokontrol na kondisyon - ang pagkakaroon ng mga organisadong pag-uulit) - C p at pagkakaiba-iba sa loob ng mga opsyon C z. Sa pangkalahatang anyo, ang pagkakaiba-iba ng isang katangian ay kinakatawan ng sumusunod na expression:

C y = C V + C p + C z.

Ang kabuuang bilang ng mga antas ng kalayaan (N -1) ay nahahati din sa tatlong bahagi:

antas ng kalayaan para sa mga pagpipilian (l - 1);

antas ng kalayaan para sa mga pag-uulit (n - 1);

random na pagkakaiba-iba (n - 1) × (l - 1).

Ang mga kabuuan ng mga parisukat ng mga paglihis, ayon sa isang eksperimento sa larangan - isang statistical complex na may mga pagpipilian - l at mga pag-uulit - n, ay matatagpuan bilang mga sumusunod. Una, gamit ang paunang talahanayan, ang mga kabuuan para sa mga pag-uulit ay tinutukoy - Σ P, para sa mga variant - Σ V at ang kabuuang kabuuan ng lahat ng mga obserbasyon - Σ X.

Pagkatapos ay kinakalkula ang mga sumusunod na tagapagpahiwatig:

Ang kabuuang bilang ng mga obserbasyon N = l × n;

Salik ng pagwawasto (amendment) C cor = (Σ X 1) 2 / N;

Ang kabuuang kabuuan ng mga parisukat Cy = Σ X 1 2 - C cor;

Ang kabuuan ng mga parisukat para sa mga pag-uulit C p = Σ P 2 / (l –C cor);

Ang kabuuan ng mga parisukat para sa mga opsyon C V = Σ V 2 / (n - 1);

Ang kabuuan ng mga parisukat para sa error (natitira) C Z = C y - C p - C V.

Ang mga nagresultang kabuuan ng mga parisukat na C V at C Z ay nahahati sa mga antas ng kalayaan na naaayon sa kanila at dalawang ibig sabihin ng mga parisukat (variances) ay nakuha:

Mga variant S v 2 = C V / l - 1;

Mga Error S Z 2 = C Z / (n - 1) × (l - 1).

Pagtatasa ng kahalagahan ng mga pagkakaiba sa pagitan ng mga paraan. Ang nakuhang mean squares ay ginagamit sa pagsusuri ng variance upang masuri ang kahalagahan ng pagkilos ng mga salik na pinag-aaralan sa pamamagitan ng paghahambing ng variance ng mga opsyon (S v 2) sa pagkakaiba ng error (SZ 2) ayon sa Fisher's criterion (F = SY 2 / SZ 2). Ang yunit ng paghahambing ay ang mean square ng random na pagkakaiba, na tumutukoy sa random na error ng eksperimento.

Ang paggamit ng Fisher's test ay nagbibigay-daan sa isa na magtatag ng presensya o kawalan ng mga makabuluhang pagkakaiba sa pagitan ng sample na paraan, ngunit hindi nagpapahiwatig ng mga partikular na pagkakaiba sa pagitan ng mga paraan.

Ang nasubok na H o - hypothesis ay ang pagpapalagay na ang lahat ng sample na paraan ay mga pagtatantya ng isang pangkalahatang average at ang mga pagkakaiba sa pagitan ng mga ito ay hindi gaanong mahalaga. Kung F fact = S Y 2 / S Z 2 ≤ F theor, kung gayon ang null hypothesis ay hindi tinatanggihan. Walang makabuluhang pagkakaiba sa pagitan ng sample na paraan, at dito nagtatapos ang pagsubok. Ang null hypothesis ay tinanggihan para sa F fact = S Y 2 / S Z 2 ≥ F theor Ang halaga ng F-criterion para sa antas ng kahalagahan na pinagtibay sa pag-aaral ay matatagpuan sa kaukulang talahanayan, na isinasaalang-alang ang mga antas ng kalayaan para sa pagkakaiba-iba ng mga variant at random na pagkakaiba-iba. Kadalasan ay gumagamit sila ng 5% na antas ng kahalagahan, at may mas mahigpit na diskarte, 1% - at kahit 0.1%.

Para sa isang sample ng laki n, ang sample na pagkakaiba ay kinakalkula bilang ang kabuuan ng mga squared deviations mula sa sample mean, na hinati ng n-1(sample size minus one). Kaya, para sa isang nakapirming laki ng sample n, ang pagkakaiba ay isang function ng kabuuan ng mga parisukat (mga deviations), na tinutukoy, para sa kaiklian, SS (mula sa English Sum of Squares - Sum of squares). Dagdag pa, madalas nating inaalis ang salitang sample, alam na alam natin na ang sample na variance o variance estimate ay isinasaalang-alang. Ang pagsusuri ng pagkakaiba ay batay sa paghahati ng pagkakaiba sa mga bahagi o bahagi.:

Mga error sa SS at SS epekto. Pagkakaiba-iba sa loob ng pangkat ( SS) ay karaniwang tinatawag na natitirang bahagi o pagkakaiba mga pagkakamali. Nangangahulugan ito na kadalasan sa isang eksperimento ay hindi ito mahulaan o maipaliwanag. Sa kabila, Epekto ng SS(o ang bahagi ng pagkakaiba sa pagitan ng mga grupo) ay maaaring ipaliwanag sa pamamagitan ng pagkakaiba sa pagitan ng mga paraan sa mga pangkat. Sa madaling salita, kabilang sa isang tiyak na grupo nagpapaliwanag pagkakaiba-iba ng intergroup, dahil alam natin na ang mga pangkat na ito ay may iba't ibang mean values.

Pangunahing lohika ng pagsusuri ng pagkakaiba-iba. Summing up, maaari nating sabihin na ang layunin ng ANOVA ay upang subukan ang istatistikal na kahalagahan ng pagkakaiba sa pagitan ng mga paraan (para sa mga grupo o mga variable). Ang tseke na ito ay isinasagawa sa pamamagitan ng paghahati sa kabuuan ng mga parisukat sa mga bahagi, i.e. sa pamamagitan ng paghahati ng kabuuang pagkakaiba (variation) sa mga bahagi, ang isa ay dahil sa random na error (iyon ay, intragroup variability), at ang pangalawa ay nauugnay sa pagkakaiba sa mean na mga halaga. Ang huling bahagi ng pagkakaiba ay pagkatapos ay ginagamit upang pag-aralan ang istatistikal na kahalagahan ng pagkakaiba sa pagitan ng mga paraan. Kung ito ang pagkakaiba makahulugan, null hypothesis tinanggihan at isang alternatibong hypothesis tungkol sa pagkakaroon ng pagkakaiba sa pagitan ng mga paraan ay tinatanggap.

Dependent at independent variable. Ang mga variable na ang mga halaga ay natutukoy gamit ang mga sukat sa panahon ng eksperimento (halimbawa, ang iskor na nakuha sa panahon ng pagsubok) ay tinatawag na umaasa mga variable. Ang mga variable na maaaring kontrolin sa eksperimento (halimbawa, mga pamamaraan ng pagtuturo o iba pang pamantayan na nagpapahintulot sa iyo na hatiin ang mga obserbasyon sa mga pangkat o uriin) ay tinatawag mga kadahilanan o malaya mga variable.

Maraming mga kadahilanan. Ang mundo ay likas na kumplikado at multidimensional. Ang mga sitwasyon kapag ang isang tiyak na kababalaghan ay ganap na inilarawan ng isang variable ay napakabihirang. Halimbawa, kung sinusubukan nating matutunan kung paano magtanim ng malalaking kamatis, dapat isaalang-alang ang mga salik na nauugnay sa istraktura ng genetic ng halaman, uri ng lupa, liwanag, temperatura, atbp. Kaya, maraming mga salik na haharapin sa isang tipikal na eksperimento. Ang pangunahing dahilan kung bakit ang paggamit ng pagsusuri ng pagkakaiba ay mas mainam kaysa sa paulit-ulit na paghahambing ng dalawang sample sa magkaibang antas ng mga salik gamit ang serye. t- criterion ay ang pagsusuri ng pagkakaiba ay higit na malaki mabisa at, para sa maliliit na sample, ito ay mas nagbibigay-kaalaman.

Output. Ang pagsusuri ng pagkakaiba ay binuo at ipinakilala sa pagsasanay ng agrikultura at biyolohikal na pananaliksik ng Ingles na siyentipiko na si R.A. Fisher . Ang kakanyahan ng pagsusuri ng pagkakaiba-iba Binubuo ang agnas ng kabuuang pagkakaiba-iba ng tampok at ang kabuuang bilang ng mga antas ng kalayaan sa mga bahaging bahagi na naaayon sa istruktura ng field experiment, gayundin sa pagtatasa ng acting factor ayon sa criterion ni Fisher.

Nasaan ang Pangkalahatang pagkakaiba-iba ng katangian, dahil sa pagkilos ng tanong na pinag-aaralan, ang heterogeneity ng pagkamayabong ng lupa at mga random na pagkakamali sa eksperimento.

Pag-iiba-iba ng mga ani batay sa mga pag-uulit ng field experiment.

Mga pagkakaiba-iba sa mga ani ayon sa mga variant ng karanasan na nauugnay sa pagkilos ng tanong na pinag-aaralan.

Mga pagkakaiba-iba sa mga ani na nauugnay sa mga random na error sa karanasan.

Output Ang pagsusuri ng pagkakaiba-iba ay ginagawa ayon sa mga sumusunod na patakaran:

1. May mga makabuluhang pagkakaiba sa karanasan kung Factual ≥Ftheoretical. Walang makabuluhang pagkakaiba sa karanasan kung F ang aktuwal

2. NDS - Ang pinakamaliit na makabuluhang pagkakaiba, na ginagamit upang matukoy ang pagkakaiba sa pagitan ng mga opsyon. Kung ang pagkakaiba d ≥ NSR, kung gayon ang mga pagkakaiba sa pagitan ng mga opsyon ay makabuluhan. Kung d< НСР, то различия между вариантами не существенные.

Mga grupo mga pagpipilian.

1. Kung ang pagkakaiba d ay makabuluhan at nagpapahiwatig ng pagtaas ng ani, ang mga opsyon ay tumutukoy sa pangkat 1.

2. Kung ang pagkakaiba d– ay hindi makabuluhan, ang mga opsyon ay tumutukoy sa pangkat 2.

3. Kung ang pagkakaiba d ay makabuluhan, ngunit nagpapahiwatig ng pagbaba sa ani, ang mga opsyon ay tumutukoy sa pangkat 3.

Pagpili ng formula Ang ANOVA ay depende sa mga paraan ng paglalagay ng mga opsyon sa eksperimento:

1. Para sa mga organisadong reps:

2. Para sa hindi organisadong pag-uulit.

5.1. Ano ang ANOVA?

Ang pagsusuri ng pagkakaiba ay binuo noong 1920s ng English mathematician at geneticist na si Ronald Fisher. Ayon sa isang survey sa mga siyentipiko, kung saan nalaman kung sino ang pinaka-impluwensyahan ang biology ng ika-20 siglo, si Sir Fisher ang nanalo ng kampeonato (para sa kanyang mga serbisyo ay iginawad siya ng kabalyero - isa sa pinakamataas na pagkakaiba sa Great Britain); sa bagay na ito, si Fischer ay maihahambing kay Charles Darwin, na may pinakamalaking impluwensya sa biology noong ika-19 na siglo.

Ang pagsusuri ng pagkakaiba ay isa na ngayong hiwalay na sangay ng istatistika. Ito ay batay sa katotohanang natuklasan ni Fisher na ang sukatan ng pagkakaiba-iba ng pinag-aralan na dami ay maaaring mabulok sa mga bahagi na tumutugma sa mga salik na nakakaimpluwensya sa dami na ito at mga random na paglihis.

Upang maunawaan ang kakanyahan ng pagsusuri ng pagkakaiba-iba, gagawa kami ng parehong uri ng mga kalkulasyon nang dalawang beses: "manu-mano" (na may calculator) at gamit ang Statistics program. Upang gawing simple ang aming gawain, hindi kami gagana sa mga resulta ng isang aktwal na paglalarawan ng pagkakaiba-iba ng mga berdeng palaka, ngunit sa isang kathang-isip na halimbawa na nauugnay sa paghahambing ng mga babae at lalaki sa mga tao. Isaalang-alang ang pagkakaiba-iba ng taas ng 12 matanda: 7 babae at 5 lalaki.

Talahanayan 5.1.1. Isang halimbawa para sa one-way na ANOVA: data ng kasarian at taas para sa 12 tao

Magsagawa tayo ng one-way na pagsusuri ng pagkakaiba-iba: ihahambing natin kung ang mga lalaki at babae sa inilarawang pangkat ay naiiba sa mga tuntunin ng taas na makabuluhan sa istatistika o hindi.

5.2. Pagsusulit sa normalidad

Ang karagdagang pangangatwiran ay batay sa katotohanan na ang distribusyon sa itinuturing na sample ay normal o malapit sa normal. Kung ang distribusyon ay malayo sa normal, ang pagkakaiba (variance) ay hindi isang sapat na sukatan ng pagkakaiba-iba nito. Gayunpaman, ang pagsusuri ng pagkakaiba ay medyo matatag sa mga paglihis ng pamamahagi mula sa normalidad.

Ang data na ito ay maaaring masuri para sa normalidad sa dalawang magkaibang paraan. Una: Statistics / Basic Statistics / Tables / Descriptive statistics / Normality tab. Sa tab Normalidad maaari mong piliin ang mga pagsubok na ginamit para sa normalidad ng distribusyon. Kapag nag-click ka sa pindutan ng Mga talahanayan ng dalas, lilitaw ang isang talahanayan ng dalas, at ang mga pindutan ng Histograms - isang histogram. Ipapakita ng talahanayan at bar graph ang mga resulta ng iba't ibang pagsubok.

Ang pangalawang paraan ay nauugnay sa paggamit ng naaangkop na posible kapag gumagawa ng mga histogram. Sa dialog para sa pagbuo ng mga histogram (Grafs / Histograms ...), piliin ang tab na Advanced. Sa ibaba nito ay mayroong bloke ng Statistics. Markahan natin ang Shapiro-Wilk dito t est at Kolmogorov-Smirnov test, tulad ng ipinapakita sa figure.

kanin. 5.2.1. Mga pagsusulit sa istatistika para sa normalidad ng distribusyon sa dialog para sa pagbuo ng mga histogram

Tulad ng makikita mula sa histogram, ang pamamahagi ng paglago sa aming sample ay naiiba sa normal (sa gitna - "pagkabigo").


kanin. 5.2.2. Naka-plot ang histogram gamit ang mga parameter na ipinahiwatig sa nakaraang figure

Ang ikatlong linya sa pamagat ng graph ay nagpapahiwatig ng mga parameter ng normal na distribusyon kung saan ang naobserbahang distribusyon ay pinakamalapit. Ang pangkalahatang average ay 173, ang pangkalahatang standard deviation ay 10.4. Sa ibaba sa sidebar sa graph, ang mga resulta ng mga pagsubok para sa normalidad ay ipinapakita. Ang D ay ang Kolmogorov-Smirnov test, at ang SW-W ay ang Shapiro-Vilk test. Tulad ng makikita, para sa lahat ng mga pagsubok na ginamit, ang mga pagkakaiba sa pagitan ng distribusyon ng taas at normal na distribusyon ay naging hindi gaanong mahalaga sa istatistika ( p sa lahat ng kaso higit sa 0.05).

Kaya, pormal na pagsasalita, ang mga pagsubok para sa pagsusulatan ng isang pamamahagi sa isang normal na pamamahagi ay hindi "nagbawal" sa amin na gumamit ng parametric na paraan batay sa pagpapalagay ng isang normal na pamamahagi. Tulad ng nabanggit na, ang pagsusuri ng pagkakaiba ay medyo lumalaban sa mga paglihis mula sa normalidad, kaya gagamitin pa rin natin ito.

5.3. One-way ANOVA: manu-manong pagkalkula

Upang makilala ang pagkakaiba-iba ng taas ng mga tao sa ibinigay na halimbawa, kinakalkula namin ang kabuuan ng mga parisukat ng mga paglihis (sa Ingles ito ay tinukoy bilang SS , Sum of Squares o) mga indibidwal na halaga mula sa mean: ... Ang average para sa taas sa halimbawang ito ay 173 sentimetro. Batay sa mga ito,

SS = (186–173) 2 + (169–173) 2 + (166–173) 2 + (188–173) 2 + (172–173) 2 + (179–173) 2 + (165–173) 2 + (174–173) 2 + (163–173) 2 + (162–173) 2 + (162–173) 2 + (190–173) 2 ;

SS = 132 + 42 + 72 + 152 + 12 + 62 + 82 + 12 + 102 + 112 + 112 + 172;

SS = 169 + 16 + 49 + 225 + 1 + 36 + 64 + 1 + 100 + 121 + 121 + 289 = 1192.

Ang resultang halaga (1192) ay isang sukatan ng pagkakaiba-iba ng buong hanay ng data. Gayunpaman, binubuo sila ng dalawang grupo, para sa bawat isa kung saan ang sarili nitong average ay maaaring makilala. Sa data sa itaas, ang average na taas ng kababaihan ay 168 cm, at ng mga lalaki - 180 cm.

Kalkulahin natin ang kabuuan ng mga parisukat ng mga paglihis para sa mga kababaihan:

SS f = (169–168) 2 + (166–168) 2 + (172–168) 2 + (179–168) 2 + (163–168) 2 + (162–168) 2 ;

SS f = 12 + 22 + 42 + 112 + 32 + 52 + 62 = 1 + 4 + 16 + 121 + 9 + 25 + 36 = 212.

Kinakalkula din namin ang kabuuan ng mga parisukat ng mga paglihis para sa mga lalaki:

SS m = (186–180) 2 + (188–180) 2 + (174–180) 2 + (162–180) 2 + (190–180) 2 ;

SS m = 62 + 82 + 62 + 182 + 102 = 36 + 64 + 36 + 324 + 100 = 560.

Ano ang nakasalalay sa sinisiyasat na halaga alinsunod sa lohika ng pagsusuri ng pagkakaiba?

Dalawang kinakalkula na halaga, SS f at SS m , nailalarawan ang pagkakaiba-iba ng intragroup, na sa pagsusuri ng pagkakaiba-iba ay karaniwang tinatawag na "error". Ang pinagmulan ng pangalang ito ay nauugnay sa sumusunod na lohika.

Ano ang tumutukoy sa paglaki ng isang tao sa halimbawang ito? Una sa lahat, mula sa karaniwang taas ng mga tao sa pangkalahatan, anuman ang kanilang kasarian. Pangalawa - mula sa sahig. Kung ang mga tao ng isang kasarian (lalaki) ay mas matangkad kaysa sa isa (babae), ito ay maaaring katawanin sa anyo ng karagdagan sa "karaniwang tao" na average ng ilang sukat, ang epekto ng kasarian. Sa wakas, ang mga tao ng parehong kasarian ay nagkakaiba sa taas dahil sa mga indibidwal na pagkakaiba. Sa isang modelo na naglalarawan sa taas bilang ang kabuuan ng average ng tao at ang pagsasaayos ng kasarian, ang mga indibidwal na pagkakaiba ay hindi maipaliwanag at maaaring ituring na "error."

Kaya, alinsunod sa lohika ng pagsusuri ng pagkakaiba-iba, ang sinisiyasat na halaga ay tinutukoy bilang mga sumusunod: , saan x ij - ang i-th na halaga ng pinag-aralan na halaga sa j-th na halaga ng pinag-aralan na salik; - pangkalahatang average; F j - ang impluwensya ng j-th na halaga ng pinag-aralan na kadahilanan; - "error", ang kontribusyon ng sariling katangian ng bagay kung saan nabibilang ang damix ij .

Intergroup kabuuan ng mga parisukat

Kaya, SS pagkakamali = SS f + SS m = 212 + 560 = 772. Sa halagang ito, inilarawan namin ang pagkakaiba-iba ng intragroup (kapag natukoy ang mga grupo ayon sa kasarian). Ngunit mayroon ding pangalawang bahagi ng pagkakaiba-iba - intergroup, na tatawagin natinEpekto ng SS (dahil pinag-uusapan natin ang epekto ng paghahati ng hanay ng mga bagay na isinasaalang-alang sa mga babae at lalaki).

Ang average ng bawat pangkat ay iba sa pangkalahatang average. Ang pagkalkula ng kontribusyon ng pagkakaibang ito sa kabuuang sukat ng pagkakaiba-iba, dapat nating i-multiply ang pagkakaiba sa pagitan ng pangkat at ang kabuuang average sa bilang ng mga bagay sa bawat pangkat.

Epekto ng SS = = 7 × (168–173) 2 + 5 × (180–173) 2 = 7 × 52 + 5 × 72 = 7 × 25 + 5 × 49 = 175 + 245 = 420.

Dito ipinakita ang prinsipyo ng pagiging matatag ng kabuuan ng mga parisukat, na natuklasan ni Fischer: SS = SS effect + SS error , ibig sabihin. para sa halimbawang ito, 1192 = 440 + 722.

Mga gitnang parisukat

Ang paghahambing sa aming halimbawa ng intergroup at intragroup na mga kabuuan ng mga parisukat, makikita natin na ang una ay nauugnay sa pagkakaiba-iba ng dalawang grupo, at ang pangalawa - 12 na mga halaga sa 2 grupo. Ang bilang ng mga antas ng kalayaan ( df ) para sa ilang parameter ay maaaring tukuyin bilang pagkakaiba sa pagitan ng bilang ng mga bagay sa pangkat at ang bilang ng mga dependency (equation) na nag-uugnay sa mga halagang ito.

Sa ating halimbawa epekto ng df = 2–1 = 1, a df error = 12–2 = 10.

Maaari nating hatiin ang mga kabuuan ng mga parisukat sa bilang ng kanilang mga antas ng kalayaan, pagkuha ng mga mean na parisukat ( MS , Paraan ng mga parisukat). Kapag nagawa na natin ito, maitatag natin iyon MS - walang iba kundi ang pagkakaiba-iba ("variance", ang resulta ng paghahati ng kabuuan ng mga parisukat sa bilang ng mga antas ng kalayaan). Pagkatapos ng pagtuklas na ito, mauunawaan natin ang istraktura ng talahanayan ng ANOVA. Para sa aming halimbawa, magiging ganito ang hitsura.

Ang epekto

Error

Epekto ng MS at Mga error sa MS ay mga pagtatantya ng pagkakaiba-iba ng intergroup at intragroup, at, samakatuwid, maaari silang ihambing sa pamamagitan ng criterionF (Snedecor's criterion, pinangalanan sa Fisher), na idinisenyo upang ihambing ang mga pagkakaiba. Ang criterion na ito ay simpleng quotient ng paghahati ng mas malaking pagkakaiba sa mas maliit. Sa aming kaso, ito ay 420 / 77.2 = 5.440.

Pagpapasiya ng istatistikal na kahalagahan ng Fisher test gamit ang mga talahanayan

Kung tutukuyin natin nang manu-mano ang istatistikal na kahalagahan ng epekto, gamit ang mga talahanayan, kakailanganin nating ikumpara ang nakuhang halaga ng criterion F na may kritikal, na tumutugma sa isang tiyak na antas ng istatistikal na kahalagahan para sa mga ibinigay na antas ng kalayaan.


kanin. 5.3.1. Fragment ng talahanayan na may mga kritikal na halaga ng criterion F

Tulad ng makikita mo, para sa antas ng statistical significance p = 0.05, ang kritikal na halaga ng criterionF ay 4.96. Nangangahulugan ito na sa aming halimbawa, ang aksyon ng pinag-aralan na kasarian ay naitala na may antas ng istatistikal na kahalagahan na 0.05.

Ang resulta ay maaaring bigyang-kahulugan bilang mga sumusunod. Ang posibilidad ng null hypothesis, ayon sa kung saan ang average na taas ng mga babae at lalaki ay pareho, at ang naitala na pagkakaiba sa kanilang taas ay nauugnay sa randomness sa pagbuo ng mga sample, ay mas mababa sa 5%. Nangangahulugan ito na dapat tayong pumili ng alternatibong hypothesis na ang average na taas ng babae at lalaki ay magkaiba.

5.4. One-way na pagsusuri ng pagkakaiba-iba ( ANOVA) sa Statistica package

Sa mga kaso kung saan ang mga kalkulasyon ay hindi ginawa nang manu-mano, ngunit sa tulong ng naaangkop na mga programa (halimbawa, ang Statistica package), ang halaga p ay awtomatikong tinutukoy. Maaari mong tiyakin na ito ay bahagyang mas mataas kaysa sa kritikal na halaga.

Upang pag-aralan ang tinalakay na halimbawa gamit ang pinakasimpleng variant ng pagsusuri ng variance, kailangan mong patakbuhin ang Statistics / ANOVA procedure para sa file na may kaukulang data at piliin ang One-way ANOVA na opsyon sa Uri ng analysis window, at ang Quick specs dialog opsyon sa window ng Specification method...


kanin. 5.4.1. Pangkalahatang ANOVA / MANOVA Dialogue

Sa binuksan na window ng mabilis na dialog, sa field na Mga Variable, kailangan mong tukuyin ang mga column na naglalaman ng data, ang pagkakaiba-iba na aming pinag-aaralan (Listahan ng depende sa variable; sa aming kaso, ang column ng Paglago), pati na rin ang column na naglalaman ng mga halaga na naghahati sa pinag-aralan na halaga sa mga pangkat (Catigorical predictor ( factor); sa aming kaso, ang Sex column). Sa bersyong ito ng pagsusuri, sa kaibahan sa multivariate analysis, isang salik lamang ang maaaring isaalang-alang.


kanin. 5.4.2. One-Way ANOVA Dialogue

Sa window ng Factor codes, dapat mong tukuyin ang mga halaga ng salik na isinasaalang-alang na kailangang iproseso sa kurso ng pagsusuri na ito. Ang lahat ng magagamit na mga halaga ay maaaring matingnan gamit ang pindutan ng Zoom; kung, tulad ng sa aming halimbawa, kailangan mong isaalang-alang ang lahat ng mga halaga ng kadahilanan (at para sa kasarian sa aming halimbawa ay dalawa lamang sa kanila), maaari mong i-click ang pindutang Lahat. Kapag ang mga column na ipoproseso at ang mga factor code ay naitakda, maaari mong i-click ang OK na buton at pumunta sa mabilisang pagsusuri ng mga resulta: ANOVA Results 1, sa Quick tab.

kanin. 5.4.3. Ang Quick tab ng window ng mga resulta ng ANOVA

Binibigyang-daan ka ng All effects / Graph na button na makita kung paano naghahambing ang mga average ng dalawang grupo. Sa itaas ng graph, ang bilang ng mga antas ng kalayaan ay ipinahiwatig, pati na rin ang mga halaga ng F at p para sa kadahilanan na isinasaalang-alang.


kanin. 5.4.4. Graphical na pagpapakita ng mga resulta ng ANOVA

Binibigyang-daan ka ng All effects button na makakuha ng table ng ANOVA na katulad ng inilarawan sa itaas (na may ilang makabuluhang pagkakaiba).


kanin. 5.4.5. ANOVA table (ihambing sa isang katulad na talahanayan na nakuha sa pamamagitan ng kamay)

Ang ilalim na linya ng talahanayan ay nagpapakita ng kabuuan ng mga parisukat, ang bilang ng mga antas ng kalayaan, at ang ibig sabihin ng mga parisukat para sa error (intragroup variability). Isang linya sa itaas - katulad na mga tagapagpahiwatig para sa kadahilanan na pinag-aaralan (sa kasong ito, ang Sex sign), pati na rin ang criterion F (ang ratio ng mean squares ng effect sa mean squares ng error), at ang antas ng statistical significance nito. Ang katotohanan na ang epekto ng pinag-uusapang kadahilanan ay naging makabuluhan ayon sa istatistika ay ipinapakita ng pag-highlight sa pula.

Ang unang linya ay naglalaman ng data sa indicator na "Intercept". Ito ang hilera sa talahanayan ay nagpapakita ng isang misteryo sa mga user na bago sa Statistica sa ika-6 o mas bagong bersyon nito. Ang halaga ng Intercept ay malamang na nauugnay sa agnas ng kabuuan ng mga parisukat ng lahat ng mga halaga ng data (ibig sabihin, 1862 + 1692 ... = 360340). Ang halaga ng criterion F na ipinahiwatig para dito ay nakuha sa pamamagitan ng paghahati MS Intercept / MS Error = 353220 / 77.2 = 4575.389 at natural na nagbibigay ng napakababang halaga p ... Kapansin-pansin, sa Statistica-5 ang halagang ito ay hindi kinakalkula sa lahat, at ang mga manwal para sa paggamit ng mga susunod na bersyon ng pakete ay hindi nagkomento sa pagpapakilala nito sa anumang paraan. Marahil ang pinakamagandang bagay na maaaring gawin ng isang biologist na nagtatrabaho sa Statistica-6 at sa ibang pagkakataon ay huwag pansinin ang hanay ng Intercept sa talahanayan ng ANOVA.

5.5. ANOVA at Mga Pagsusulit ng Mag-aaral at Fisher: Alin ang Mas Mabuti?

Tulad ng maaaring napansin mo, ang data na inihambing namin gamit ang one-way na pagsusuri ng pagkakaiba-iba, maaari rin naming siyasatin gamit ang mga pagsusulit ng Mag-aaral at Fisher. Ihambing natin ang dalawang pamamaraang ito. Upang gawin ito, kalkulahin ang pagkakaiba sa taas sa pagitan ng mga lalaki at babae gamit ang mga pamantayang ito. Upang gawin ito, kailangan nating pumunta sa landas na Statistics / Basic Statistics / t-test, independent, ayon sa mga grupo. Naturally, Dependent variable ay ang Growth variable at ang Grouping variable ay Sex variable.


kanin. 5.5.1. Paghahambing ng data na naproseso gamit ang ANOVA ayon sa mga pagsusulit ng Mag-aaral at Fisher

Tulad ng nakikita mo, ang resulta ay pareho sa ANOVA. p = 0.041874 sa parehong mga kaso, tulad ng ipinapakita sa Fig. 5 at ipinapakita sa Fig. 5.5.2 (tingnan para sa iyong sarili!).


kanin. 5.5.2. Mga resulta ng pagsusuri (detalyadong paliwanag ng talahanayan ng mga resulta - sa talata sa pamantayan ng Mag-aaral)

Mahalagang bigyang-diin na bagama't ang F criterion mula sa mathematical point of view sa nasuri na pagsusuri ayon sa Student and Fisher criteria ay pareho sa ANOVA (at nagpapahayag ng variance ratio), ang kahulugan nito sa mga resulta ng pagsusuri na ipinakita sa Ang huling talahanayan ay ganap na naiiba. Kapag naghahambing ayon sa pamantayan ng Mag-aaral at Fisher, ang paghahambing ng mga mean na halaga ng mga sample ay isinasagawa ayon sa pamantayan ng Estudyante, at ang paghahambing ng kanilang pagkakaiba-iba ay isinasagawa ayon sa pamantayan ng Fisher. Sa mga resulta ng pagsusuri, hindi ang pagkakaiba mismo ang ipinapakita, ngunit ang square root nito - ang standard deviation.

Sa ANOVA, sa kabaligtaran, ang pagsubok ni Fisher ay ginagamit upang ihambing ang mga paraan ng iba't ibang mga sample (tulad ng aming tinalakay, ito ay ginagawa sa pamamagitan ng paghahati sa kabuuan ng mga parisukat sa mga bahagi at paghahambing ng ibig sabihin ng kabuuan ng mga parisukat na naaayon sa pagkakaiba-iba sa pagitan at sa loob ng grupo) .

Gayunpaman, ang pagkakaiba sa itaas ay may kinalaman sa pagtatanghal ng mga resulta ng isang istatistikal na pag-aaral kaysa sa kakanyahan nito. Tulad ng itinuro, halimbawa, ni Glantz (1999, p. 99), ang paghahambing ng mga grupo sa pamamagitan ng pagsusulit ng Mag-aaral ay maaaring ituring bilang isang espesyal na kaso ng pagsusuri ng pagkakaiba para sa dalawang sample.

Kaya, ang paghahambing ng mga sample ayon sa mga pagsusulit ng Mag-aaral at Fisher ay may isang mahalagang kalamangan sa pagsusuri ng pagkakaiba-iba: maaari itong maghambing ng mga sample sa mga tuntunin ng kanilang pagkakaiba-iba. Ngunit ang mga benepisyo ng pagsusuri ng pagkakaiba ay mas makabuluhan pa rin. Kabilang dito, halimbawa, ang kakayahang maghambing ng maramihang mga sample sa parehong oras.

Ang isinasaalang-alang na pamamaraan ng pagsusuri ng pagkakaiba ay naiba depende sa: a) sa likas na katangian ng tampok kung saan ang populasyon ay nahahati sa mga grupo (mga sample;); b) sa bilang ng mga tampok kung saan ang populasyon ay nahahati sa mga grupo (mga sample ); c) sa paraan ng sampling.

Mga katangiang halaga. na naghahati sa populasyon sa mga pangkat ay maaaring kumatawan sa pangkalahatang populasyon o isang populasyon na malapit dito. Sa kasong ito, ang scheme ng ANOVA ay tumutugma sa tinalakay sa itaas. Kung ang mga halaga ng isang tampok na bumubuo ng iba't ibang mga grupo ay kumakatawan sa isang sample mula sa pangkalahatang populasyon, kung gayon ang pagbabalangkas ng zero at mga alternatibong hypotheses ay nagbabago. Bilang null hypothesis, ipinapalagay na may mga pagkakaiba sa pagitan ng mga grupo, iyon ay, ang ibig sabihin ng grupo ay nagpapakita ng ilang pagkakaiba-iba. Bilang alternatibong hypothesis, iminumungkahi na walang oscillation. Malinaw, sa gayong pormulasyon ng mga hypotheses, walang dahilan upang i-concretize ang mga resulta ng paghahambing ng mga pagkakaiba.

Sa pagtaas ng bilang ng mga feature ng pagpapangkat, halimbawa, hanggang 2, una, ang bilang ng zero at, nang naaayon, ang mga alternatibong hypotheses ay tumataas. Sa kasong ito, ang unang null hypothesis ay nagsasalita ng kawalan ng mga pagkakaiba sa pagitan ng mga paraan para sa mga pangkat ng unang pagpapangkat ng katangian, ang pangalawang null hypothesis ay nagsasalita ng kawalan ng mga pagkakaiba sa mga paraan para sa mga grupo ng pangalawang pangkat na katangian, at sa wakas ang ikatlong null hypothesis ay nagpapahiwatig ng kawalan ng tinatawag na epekto ng interaksyon ng mga kadahilanan (mga tampok ng pagpapangkat).

Ang epekto ng pakikipag-ugnayan ay nauunawaan bilang isang pagbabago sa halaga ng isang epektibong katangian na hindi maipaliwanag ng kabuuang pagkilos ng dalawang salik. Upang subukan ang tatlong iniharap na mga pares ng mga hypotheses, kinakailangan upang kalkulahin ang tatlong aktwal na mga halaga ng pamantayan ng F-Fisher, na nagmumungkahi naman ng sumusunod na variant ng agnas ng kabuuang dami ng pagkakaiba-iba.

Ang mga dispersion na kinakailangan upang makuha ang F-criterion ay nakukuha sa isang kilalang paraan sa pamamagitan ng paghahati sa mga volume ng variation sa bilang ng mga degree ng kalayaan.

Tulad ng alam mo, ang mga sample ay maaaring umasa at malaya. Kung ang mga sample ay nakasalalay, pagkatapos ay sa kabuuang halaga ng pagkakaiba-iba, ang tinatawag na pagkakaiba-iba ng mga replika ay dapat na makilala.
... Kung hindi ito naka-highlight, kung gayon ang pagkakaiba-iba na ito ay maaaring makabuluhang taasan ang pagkakaiba-iba ng intragroup (
), na maaaring baluktutin ang mga resulta ng pagsusuri ng pagkakaiba.

Suriin ang mga tanong

17-1. Ano ang espesipikasyon ng mga resulta ng pagsusuri ng pagkakaiba?

17-2. Kailan ginagamit ang Q-Tukey criterion para sa concretization?

17-3.Ano ang mga pagkakaiba ng una, pangalawa at iba pa na utos?

17-4. Paano mahahanap ang aktwal na halaga ng pagsubok ng Tukey's Q?

17-5. Anong mga hypotheses ang iniharap tungkol sa bawat pagkakaiba?

17-6. Ano ang nakasalalay sa halaga ng tabular ng Tukey Q criterion?

17-7. Ano ang null hypothesis kung ang mga antas ng katangian ng pagpapangkat ay isang sample?

17-8 Paano nabubulok ang kabuuang dami ng variation kapag ang data ay pinagsama ayon sa dalawang pamantayan?

17-9. Sa anong kaso ay naka-highlight ang pagkakaiba-iba sa mga pag-uulit (
) ?

Buod

Ang itinuturing na mekanismo ng pagtukoy ng mga resulta ng pagsusuri ng pagkakaiba-iba ay nagbibigay-daan sa iyo upang bigyan ito ng kumpletong hitsura. Dapat bigyang pansin ang mga limitasyon kapag gumagamit ng Tukey's Q test. Binalangkas din ng materyal ang mga pangunahing prinsipyo ng pag-uuri ng mga modelo ng ANOVA. Dapat bigyang-diin na ang mga ito ay mga prinsipyo lamang. Ang isang detalyadong pag-aaral ng mga tampok ng bawat modelo ay nangangailangan ng isang hiwalay na mas malalim na pag-aaral.

Mga takdang-aralin sa pagsusulit para sa panayam

Anong mga istatistikal na katangian ang tungkol sa mga hypotheses sa pagsusuri ng pagkakaiba?

    May kaugnayan sa dalawang pagkakaiba-iba

    May kaugnayan sa isang average

    May kaugnayan sa ilang mga average

    May kaugnayan sa isang pagkakaiba-iba

Ano ang nilalaman ng alternatibong hypothesis sa pagsusuri ng pagkakaiba?

    Ang mga pinaghahambing na pagkakaiba ay hindi pantay sa bawat isa

    Ang lahat ng inihambing na average ay hindi pantay.

    Hindi Magkapantay ang Dalawang Pangkalahatang Average

    Ang pagkakaiba-iba ng intergroup ay mas malaki kaysa sa pagkakaiba-iba ng intragroup

Ano ang mga karaniwang ginagamit na antas ng kahalagahan sa pagsusuri ng pagkakaiba?

Kung ang variation sa loob ng grupo ay mas malaki kaysa sa variation sa pagitan ng grupo, dapat bang magpatuloy ang ANOVA o agad na sumang-ayon sa H0 o sa AN?

1. Dapat mo bang ipagpatuloy ang mga kinakailangang pagkakaiba?

2. Dapat sumang-ayon sa H0

3. Sumang-ayon sa ON

Kung ang pagkakaiba-iba sa loob ng pangkat ay natagpuan na katumbas ng pagkakaiba-iba sa pagitan ng pangkat, ano ang dapat na sundan ng pagsusuri ng pagkakaiba?

    Sumang-ayon sa null hypothesis ng pagkakapantay-pantay ng pangkalahatang paraan

    Sumang-ayon sa alternatibong hypothesis tungkol sa pagkakaroon ng hindi bababa sa isang pares ng paraan na hindi pantay sa isa't isa

Anong pagkakaiba ang dapat palaging nasa numerator kapag kinakalkula ang pagsubok sa F-Fisher?

    Intra-group lang

    Sa anumang kaso, intergroup

    Intergroup, kung ito ay mas intragroup

Ano ang dapat na aktwal na halaga ng pamantayan ng F-Fisher?

    Laging mas mababa sa 1

    Laging higit sa 1

    Katumbas ng o higit sa 1

Ano ang nakasalalay sa halaga ng tabular ng pamantayang F-Fisher?

1.Mula sa tinatanggap na antas ng kahalagahan

2. Mula sa bilang ng mga antas ng kalayaan ng kabuuang pagkakaiba-iba

3. Mula sa bilang ng mga antas ng kalayaan ng pagkakaiba-iba ng intergroup

4. Sa bilang ng mga antas ng kalayaan ng pagkakaiba-iba ng intragroup

5. Mula sa halaga ng aktwal na halaga ng pamantayang F-Fisher?

Ang pagtaas sa bilang ng mga obserbasyon sa bawat pangkat na may pantay na pagkakaiba ay nagpapataas ng posibilidad na tanggapin ang ……

1 null hypothesis

2.Alternatibong hypothesis

3. Hindi nakakaapekto sa pagtanggap ng parehong null at alternatibong hypotheses

Ano ang punto ng pagtukoy ng mga resulta ng pagsusuri ng pagkakaiba?

    Upang linawin kung ang mga kalkulasyon ng mga pagkakaiba ay naisagawa nang tama

    Itakda kung alin sa mga pangkalahatang average ang naging pantay sa isa't isa

    Linawin kung alin sa mga pangkalahatang average ang hindi pantay sa isa't isa

Totoo ba ang pahayag na: "Kapag tinukoy ang mga resulta ng pagsusuri ng pagkakaiba, ang lahat ng pangkalahatang average ay naging pantay sa bawat isa"

    Maaaring tama at mali

    Hindi totoo, ito ay maaaring dahil sa mga error sa mga kalkulasyon

Posible ba, kapag tinukoy ang pagsusuri ng pagkakaiba-iba, na makarating sa konklusyon na ang lahat ng pangkalahatang average ay hindi pantay sa bawat isa?

1. Ito ay posible

2. Posibleng sa mga pambihirang kaso

3. Imposible sa prinsipyo.

4. Posible lamang kung magkamali ka sa mga kalkulasyon

Kung ang null hypothesis ay tinanggap ng F-Fisher criterion, kailangan bang tukuyin ang pagsusuri ng variance?

1. Kinakailangan

2.Hindi kinakailangan

3.At the discretion of the ANOVA analyst

Sa anong kaso ginagamit ang pagsubok ni Tukey upang i-concretize ang mga resulta ng pagsusuri ng pagkakaiba-iba?

1. Kung ang bilang ng mga obserbasyon ng mga grupo (mga sample) ay pareho

2. Kung ang bilang ng mga obserbasyon ng mga pangkat (sample) ay iba

3.Kung may mga sample na may parehong pantay at hindi pantay na mga numero

katamaran

Ano ang NDS kapag tinukoy ang mga resulta ng pagsusuri ng pagkakaiba-iba batay sa pagsubok ng Tukey?

1.Product ang average na error sa pamamagitan ng aktwal na halaga ng criterion

2. Ang produkto ng average na error sa pamamagitan ng table value ng criterion

3. Ang ratio ng bawat pagkakaiba sa pagitan ng sample ay nangangahulugan na

average na error

4. Pagkakaiba sa pagitan ng sample na paraan

Kung ang sample ay nahahati sa mga pangkat ayon sa 2 katangian, gaano karaming mga mapagkukunan ang dapat na hindi bababa sa nahahati sa kabuuang pagkakaiba-iba ng katangian?

Kung ang mga obserbasyon ng mga sample (mga grupo) ay nakadepende, sa ilang source ang dapat hatiin ang kabuuang variation (grouping attribute one)?

Ano ang pinagmulan (sanhi) ng pagkakaiba-iba ng intergroup?

    Laro ng pagkakataon

    Pinagsanib na aksyon ng laro ng pagkakataon at kadahilanan

    (mga) salik na aksyon

    Alamin pagkatapos ng pagsusuri ng pagkakaiba

Ano ang pinagmulan (sanhi) ng pagkakaiba-iba ng intragroup?

1 laro ng pagkakataon

2.Pinagsanib na aksyon ng laro ng pagkakataon at kadahilanan

3. Ang pagkilos ng (mga) salik

4. Malalaman ito pagkatapos ng pagsusuri ng variance

Anong paraan ng pagbabago ng source data ang ginagamit kung ang mga katangiang halaga ay ipinahayag sa mga fraction?

    Logarithm

    Pagkuha ng ugat

    Pagbabagong-anyo ng Phi

Lecture 8 Kaugnayan

anotasyon

Ang pinakamahalagang paraan para sa pag-aaral ng relasyon sa pagitan ng mga palatandaan ay ang paraan ng ugnayan. Ang lecture na ito ay nagpapakita ng nilalaman ng pamamaraang ito, na lumalapit sa analytical expression ng koneksyon na ito. Ang partikular na atensyon ay binabayaran sa mga partikular na tagapagpahiwatig bilang mga tagapagpahiwatig ng higpit ng komunikasyon

Mga keyword

Kaugnayan. Pinakamababang parisukat na pamamaraan. Coefficient ng regression. Coefficients ng determinasyon at ugnayan.

Mga isyung tinutugunan

    Functional at correlation na relasyon

    Mga yugto ng pagbuo ng correlation equation ng komunikasyon. Pagbibigay-kahulugan sa Equation Coefficients

    Mga tagapagpahiwatig ng higpit

    Pagsusuri ng mga napiling tagapagpahiwatig ng komunikasyon

Modular unit 1 Ang kakanyahan ng ugnayan. Mga yugto ng pagbuo ng correlation equation ng komunikasyon, interpretasyon ng mga coefficient ng equation.

Ang layunin at layunin ng pag-aaral ng modular unit 1 binubuo sa pag-unawa sa mga katangian ng ugnayan. mastering ang algorithm para sa pagbuo ng equation ng komunikasyon, pag-unawa sa nilalaman ng mga coefficient ng equation.

      Ang kakanyahan ng ugnayan

Sa natural at panlipunang phenomena, mayroong dalawang uri ng koneksyon - isang functional na koneksyon at isang koneksyon sa ugnayan. Sa isang functional na koneksyon, ang bawat halaga ng argument ay tumutugma sa mahigpit na tinukoy (isa o higit pa) na mga halaga ng function. Ang isang halimbawa ng isang functional na relasyon ay ang relasyon sa pagitan ng circumference at radius, na ipinahayag ng equation
... Ang bawat halaga ng radius r tumutugma sa isang solong halaga para sa circumference L . Sa kaso ng ugnayan, ang bawat halaga ng katangian ng kadahilanan ay tumutugma sa ilang hindi lubos na tiyak na mga halaga ng epektibong katangian. Ang mga halimbawa ng ugnayan ay ang ugnayan sa pagitan ng bigat ng isang tao (effective trait) at ng kanyang taas (factorial trait), ang ugnayan sa pagitan ng dami ng inilapat na pataba at ng ani, sa pagitan ng presyo at ng halaga ng inaalok na produkto. Ang pinagmulan ng paglitaw ng isang ugnayan ay ang katotohanan na, bilang panuntunan, sa totoong buhay, ang halaga ng epektibong katangian ay nakasalalay sa maraming mga kadahilanan, kabilang ang mga may random na katangian ng kanilang pagbabago. Halimbawa, ang parehong timbang ng isang tao ay nakasalalay sa edad, kasarian., Diet, trabaho at marami pang ibang mga kadahilanan. Ngunit sa parehong oras, malinaw na ang paglago ay ang mapagpasyang kadahilanan sa pangkalahatan. Sa pagtingin sa mga pangyayaring ito, ang ugnayan ay dapat tukuyin bilang isang hindi kumpletong relasyon, na maaaring itatag at matantya lamang kung mayroong isang malaking bilang ng mga obserbasyon, sa karaniwan.

1.2 Mga yugto ng pagbuo ng correlation equation ng komunikasyon.

Tulad ng isang functional na relasyon, ang isang ugnayan ay ipinahayag ng isang equation ng relasyon. Upang mabuo ito, kailangan mong patuloy na dumaan sa mga sumusunod na hakbang (mga yugto).

Una, dapat maunawaan ng isang tao ang sanhi-at-epekto na mga relasyon, alamin ang subordination ng mga palatandaan, iyon ay, kung alin sa mga ito ang mga dahilan (factor sign), at kung alin ang mga kahihinatnan (ang epektibong mga palatandaan). Ang mga ugnayang sanhi sa pagitan ng mga tampok ay itinatag ng teorya ng paksa kung saan ginagamit ang paraan ng ugnayan. Halimbawa, ang agham ng "anatomy ng tao" ay nagpapahintulot sa iyo na sabihin kung ano ang pinagmulan ng ugnayan sa pagitan ng timbang at taas, kung alin sa mga palatandaang ito ang isang kadahilanan, na nagreresulta, ang agham ng "ekonomiya" ay nagpapakita ng lohika ng relasyon sa pagitan ng presyo at suplay, nagtatatag kung ano at sa anong yugto ang sanhi at ano ang epekto ... Kung walang ganoong paunang teoretikal na katwiran, ang interpretasyon ng mga resulta na nakuha sa hinaharap ay mahirap, at kung minsan ay maaaring humantong sa walang katotohanan na mga konklusyon.

Ang pagkakaroon ng pagtatatag ng pagkakaroon ng mga ugnayang sanhi-at-epekto, kung gayon ang mga ugnayang ito ay dapat na pormal, iyon ay, ipinahayag gamit ang isang equation ng komunikasyon, habang pinipili muna ang uri ng equation. Ang ilang mga pamamaraan ay maaaring irekomenda para sa pagpili ng uri ng equation. Maaari mong buksan ang teorya ng paksa kung saan ginagamit ang paraan ng ugnayan, halimbawa, ang agham ng "agrochemistry" ay maaaring nakatanggap na ng sagot sa tanong kung aling equation ang dapat gamitin upang ipahayag ang relasyon: ani - mga pataba. Kung walang ganoong sagot, pagkatapos ay upang pumili ng isang equation, dapat kang gumamit ng ilang empirical na data, na naaangkop sa pagproseso ng mga ito. Dapat sabihin kaagad na ang pagpili ng uri ng equation batay sa empirical data, dapat na malinaw na maunawaan na ang ganitong uri ng equation ay maaaring gamitin upang ilarawan ang kaugnayan ng data na ginamit. Ang pangunahing pamamaraan para sa pagproseso ng mga datos na ito ay ang pagbuo ng mga graph, kapag ang mga halaga ng katangian ng kadahilanan ay naka-plot sa abscissa axis, at ang mga posibleng halaga ng epektibong katangian ay naka-plot sa ordinate axis. Dahil, sa pamamagitan ng kahulugan, ang parehong halaga ng katangian ng kadahilanan ay tumutugma sa isang hanay ng mga hindi natukoy na mga halaga ng epektibong katangian, bilang isang resulta ng mga aksyon sa itaas, makakatanggap kami ng isang tiyak na hanay ng mga puntos, na tinatawag na patlang ng ugnayan. Ang pangkalahatang pagtingin sa patlang ng ugnayan ay nagbibigay-daan sa ilang mga kaso na gumawa ng isang pagpapalagay tungkol sa posibleng anyo ng equation. , habang ang pinakamahusay na equation ay ang isa na nagbibigay ng pinakamataas na koepisyent ng pagpapasiya, pagsasalita na tatalakayin sa ibaba. Bago magpatuloy sa mga kalkulasyon, kinakailangang suriin kung hanggang saan ang empirical data na ginamit sa pagbuo ng equation ay nakakatugon sa ilang mga kinakailangan. Ang mga kinakailangan ay nauugnay sa mga factorial na katangian at sa set ng data. Ang mga palatandaan ng kadahilanan, kung marami sa kanila, ay dapat na independyente sa bawat isa. Kung tungkol sa kabuuan, ito ay dapat, una, homogenous

(ang konsepto ng homogeneity ay isinasaalang-alang nang mas maaga), at pangalawa, medyo malaki. Ang bawat factorial na katangian ay dapat magkaroon ng hindi bababa sa 8-10 obserbasyon.

Pagkatapos pumili ng isang equation, ang susunod na hakbang ay upang kalkulahin ang mga coefficient ng equation. Ang mga equation coefficient ay kadalasang kinakalkula gamit ang least squares method. Mula sa punto ng view ng ugnayan, ang paggamit ng pinakamaliit na paraan ng mga parisukat ay binubuo sa pagkuha ng mga naturang coefficient ng equation upang
= min, iyon ay, ang kabuuan ng mga parisukat ng mga paglihis ng aktwal na mga halaga ng epektibong tagapagpahiwatig ( ) mula sa mga kinakalkula ayon sa equation ( ) ay ang pinakamababang halaga. Naisasakatuparan ang pangangailangang ito sa pamamagitan ng pagbuo at paglutas ng isang kilalang sistema ng tinatawag na normal na equation. Kung bilang equation ng ugnayan sa pagitan y at x ang equation ng tuwid na linya ay pinili
, kung saan ang sistema ng mga normal na equation, tulad ng alam mo, ay magiging ganito:

Paglutas ng sistemang ito na may paggalang sa a at b , nakukuha namin ang mga kinakailangang halaga ng mga coefficient. Ang kawastuhan ng pagkalkula ng mga coefficient ay sinusuri ng pagkakapantay-pantay

Ano ang ginagamit ng pagsusuri ng pagkakaiba-iba? Ang layunin ng pagsusuri ng variance ay pag-aralan ang pagkakaroon o kawalan ng makabuluhang epekto ng anumang qualitative o quantitative factor sa mga pagbabago sa sinisiyasat na mabisang katangian. Upang magawa ito, ang isang salik, na malamang na mayroon o walang makabuluhang impluwensya, ay nahahati sa mga klase ng gradasyon (sa madaling salita, mga grupo) at natutukoy kung ang impluwensya ng salik ay pareho sa pamamagitan ng pag-aaral ng kahalagahan sa pagitan ng mga paraan sa mga data set na tumutugma sa mga gradasyon ng salik. Mga halimbawa: ang pag-asa ng kita ng negosyo sa uri ng hilaw na materyales na ginamit ay sinisiyasat (pagkatapos ang mga klase ng gradasyon ay ang mga uri ng hilaw na materyales), ang pagdepende ng gastos sa produksyon ng yunit sa laki ng dibisyon ng negosyo (pagkatapos ang mga klase ng gradasyon ay ang mga katangian ng laki ng dibisyon: malaki, katamtaman, maliit).

Ang pinakamababang bilang ng mga klase sa pagmamarka (mga grupo) ay dalawa. Ang mga klase sa pagtatapos ay maaaring qualitative o quantitative.

Bakit tinatawag na analysis of variance ang analysis of variance? Sinusuri ng pagsusuri ng pagkakaiba ang ratio ng dalawang pagkakaiba. Ang pagkakaiba-iba, tulad ng alam natin, ay isang katangian ng pagpapakalat ng data sa paligid ng ibig sabihin. Ang una ay ang pagkakaiba-iba na ipinaliwanag sa pamamagitan ng impluwensya ng kadahilanan, na nagpapakilala sa pagpapakalat ng mga halaga sa pagitan ng mga gradasyon ng kadahilanan (mga grupo) sa paligid ng average ng lahat ng data. Ang pangalawa ay hindi maipaliwanag na pagkakaiba-iba, na nagpapakilala sa pagpapakalat ng data sa loob ng mga gradasyon (mga grupo) sa paligid ng mga paraan ng mga grupo mismo. Ang unang pagkakaiba ay maaaring tawaging intergroup at ang pangalawang intragroup na pagkakaiba. Ang ratio ng mga pagkakaiba-iba na ito ay tinatawag na aktwal na Fisher ratio at inihahambing sa kritikal na halaga ng Fisher ratio. Kung ang aktwal na ratio ng Fisher ay mas malaki kaysa sa kritikal, kung gayon ang mga gitnang grado ng gradasyon ay naiiba sa isa't isa at ang sinisiyasat na kadahilanan ay makabuluhang nakakaapekto sa pagbabago sa data. Kung mas kaunti, kung gayon ang mga average na grado ng gradasyon ay hindi naiiba sa bawat isa at ang kadahilanan ay walang makabuluhang epekto.

Paano nabuo, tinatanggap, at tinatanggihan ang mga hypotheses sa ANOVA? Sa pagsusuri ng pagkakaiba, ang tiyak na bigat ng kabuuang epekto ng isa o higit pang mga kadahilanan ay tinutukoy. Ang kahalagahan ng impluwensya ng kadahilanan ay natutukoy sa pamamagitan ng pagsubok sa mga hypotheses:

  • H0 : μ 1 = μ 2 = ... = μ a, saan a- bilang ng mga gradation class - lahat ng gradation class ay may isang mean value,
  • H1 : Hindi lahat μ i equal - hindi lahat ng gradation class ay may parehong mean value.

Kung ang impluwensya ng isang salik ay hindi makabuluhan, kung gayon ang pagkakaiba sa pagitan ng mga klase ng gradasyon ng salik na ito ay hindi rin gaanong mahalaga at sa kurso ng pagsusuri ng pagkakaiba ang null hypothesis H0 ay hindi tinatanggihan. Kung ang impluwensya ng kadahilanan ay makabuluhan, pagkatapos ay ang null hypothesis H0 tinanggihan: hindi lahat ng gradation class ay may parehong mean, ibig sabihin, sa mga posibleng pagkakaiba sa pagitan ng gradation class, isa o higit pa ang makabuluhan.

Ilan pang konsepto ng pagsusuri ng pagkakaiba. Ang isang statistical complex sa ANOVA ay isang talahanayan ng empirical data. Kung sa lahat ng mga klase ng gradations ang bilang ng mga variant ay pareho, kung gayon ang statistical complex ay tinatawag na homogenous (homogeneous), kung ang bilang ng mga variant ay naiiba - heterogenous (heterogeneous).

Depende sa bilang ng nasuri na mga kadahilanan, ang one-way, two-way at multivariate na pagsusuri ng pagkakaiba ay nakikilala.

One-way na pagsusuri ng pagkakaiba-iba: ang kakanyahan ng pamamaraan, mga formula, mga halimbawa

Ang kakanyahan ng pamamaraan, mga formula

batay sa katotohanan na ang kabuuan ng mga parisukat ng mga paglihis ng statistical complex ay maaaring nahahati sa mga bahagi:

SS = SS isang + SS e,

SS

SSa a kabuuan ng mga parisukat ng mga paglihis,

SSe- hindi maipaliwanag na kabuuan ng mga parisukat ng mga deviations o kabuuan ng mga parisukat ng mga deviations ng error.

Kung sa pamamagitan ng ni italaga ang bilang ng mga opsyon sa bawat baitang ng gradasyon (grupo) at a ay ang kabuuang bilang ng mga gradasyon ng salik (mga pangkat), pagkatapos ay ang kabuuang bilang ng mga obserbasyon at ang mga sumusunod na formula ay maaaring makuha:

kabuuang bilang ng mga parisukat ng mga paglihis: ,

iniuugnay sa salik a kabuuan ng mga parisukat ng mga paglihis: ,

hindi maipaliwanag na kabuuan ng mga parisukat ng mga deviations o kabuuan ng mga parisukat ng mga deviations ng error: ,

- ang kabuuang average ng mga obserbasyon,

(grupo).

Bukod sa,

kung saan ang pagkakaiba-iba ng gradasyon ng salik (pangkat).

Upang magsagawa ng one-way analysis ng variance para sa data ng isang statistical complex, kinakailangan upang mahanap ang aktwal na Fisher's ratio - ang ratio ng variance na ipinaliwanag ng impluwensya ng factor (intergroup), at ang unexplained variance (intragroup). ):

at ihambing ito sa kritikal na halaga ni Fisher.

Ang mga pagkakaiba ay kinakalkula tulad ng sumusunod:

Ipinaliwanag ng pagkakaiba-iba,

Hindi maipaliwanag na pagkakaiba-iba

va = a − 1 - ang bilang ng mga antas ng kalayaan ng ipinaliwanag na pagkakaiba-iba,

ve = na - ang bilang ng mga antas ng kalayaan ng hindi maipaliwanag na pagkakaiba-iba,

v = n

Ang kritikal na halaga ng Fisher ratio na may ilang mga halaga ng antas ng kahalagahan at antas ng kalayaan ay matatagpuan sa mga istatistikal na talahanayan o kinakalkula gamit ang MS Excel F function na OBR (ang figure sa ibaba, upang madagdagan ito, i-click ito sa kaliwa pindutan ng mouse).


Ang function ay nangangailangan ng sumusunod na data upang maipasok:

Probability - antas ng kahalagahan α ,

Ang Degrees_freedom1 ay ang bilang ng mga degree ng kalayaan ng ipinaliwanag na pagkakaiba-iba va,

Ang Degrees_freedom2 ay ang bilang ng mga degree ng kalayaan ng hindi maipaliwanag na pagkakaiba ve.

Kung ang aktwal na halaga ng Fisher ratio ay mas malaki kaysa sa kritikal (), ang null hypothesis ay tatanggihan na may antas ng kahalagahan. α ... Nangangahulugan ito na ang kadahilanan ay makabuluhang nakakaapekto sa pagbabago sa data at ang data ay nakasalalay sa kadahilanan na may posibilidad P = 1 − α .

Kung ang aktwal na halaga ng Fisher ratio ay mas mababa kaysa sa kritikal (), kung gayon ang null hypothesis ay hindi maaaring tanggihan na may antas ng kahalagahan. α ... Nangangahulugan ito na ang kadahilanan ay hindi gaanong nakakaapekto sa data na may posibilidad P = 1 − α .

One Way Analysis of Variance: Mga Halimbawa

Halimbawa 1. Kinakailangang malaman kung ang uri ng hilaw na materyales na ginamit ay nakakaapekto sa kita ng negosyo. Sa anim na klase ng gradation (mga grupo) ng factor (1st type, 2nd type, atbp.), Nakolekta ang data sa kita mula sa produksyon ng 1000 units ng mga produkto sa milyun-milyong rubles sa loob ng 4 na taon.

Uri ng hilaw na materyal2014 2015 2016 2017
1st7,21 7,55 7,29 7,6
ika-27,89 8,27 7,39 8,18
ika-37,25 7,01 7,37 7,53
ika-47,75 7,41 7,27 7,42
ika-57,7 8,28 8,55 8,6
ika-67,56 8,05 8,07 7,84
Ang karaniwan
Pagpapakalat
7,413 0,0367
7,933 0,1571
7,290 0,0480
7,463 0,0414
8,283 0,1706
7,880 0,0563

a= 6 at sa bawat klase (grupo) nako = 4 pagmamasid. Kabuuang bilang ng mga obserbasyon n = 24 .

Bilang ng mga antas ng kalayaan:

va = a − 1 = 6 − 1 = 5 ,

ve = na = 24 − 6 = 18 ,

v = n − 1 = 24 − 1 = 23 .

Kalkulahin natin ang mga pagkakaiba-iba:

.

.

Dahil ang aktwal na saloobin ni Fischer ay mas kritikal:

na may antas ng kahalagahan α = 0.05, napagpasyahan namin na ang kita ng negosyo, depende sa uri ng mga hilaw na materyales na ginamit sa produksyon, ay naiiba nang malaki.

O, na pareho, tinatanggihan namin ang pangunahing hypothesis tungkol sa pagkakapantay-pantay ng mga paraan sa lahat ng mga klase ng factor gradation (mga grupo).

Sa halimbawang isinaalang-alang lamang, ang bawat factor grade class ay may parehong bilang ng mga opsyon. Ngunit, tulad ng nabanggit sa pagpapakilala, ang bilang ng mga pagpipilian ay maaaring magkakaiba. At ito ay hindi nagpapalubha sa pamamaraan ng ANOVA. Ito ang susunod na halimbawa.

Halimbawa 2. Kinakailangang malaman kung may pag-asa sa gastos ng produksyon ng isang yunit ng produksyon sa laki ng dibisyon ng negosyo. Ang kadahilanan (laki ng yunit) ay nahahati sa tatlong grado (mga pangkat): maliit, katamtaman, malaki. Pangkalahatang data na nauugnay sa mga pangkat na ito sa gastos ng produksyon ng isang yunit ng parehong uri ng produkto para sa isang tiyak na panahon.

maliitkaraniwanmalaki
48 47 46
50 61 57
63 63 57
72 47 55
43 32
59 59
58
Ang karaniwan58,6 54,0 51,0
Pagpapakalat128,25 65,00 107,60

Bilang ng mga factor gradation na klase (mga pangkat) a= 3, bilang ng mga obserbasyon sa mga klase (mga grupo) n1 = 4 , n2 = 7 , n3 = 6 ... Kabuuang bilang ng mga obserbasyon n = 17 .

Bilang ng mga antas ng kalayaan:

va = a − 1 = 2 ,

ve = na = 17 − 3 = 14 ,

v = n − 1 = 16 .

Kalkulahin natin ang kabuuan ng mga parisukat ng mga paglihis:

Kalkulahin natin ang mga pagkakaiba-iba:

,

.

Kalkulahin natin ang aktwal na ratio ng Fisher:

.

Kritikal na Ratio ni Fischer:

Dahil ang aktwal na halaga ng Fisher ratio ay mas mababa kaysa sa kritikal:, napagpasyahan namin na ang laki ng yunit ng enterprise ay hindi gaanong nakakaapekto sa gastos ng produksyon.

O, na pareho, na may posibilidad na 95%, tinatanggap namin ang pangunahing hypothesis na ang average na gastos sa produksyon ng isang yunit ng parehong produkto sa maliit, katamtaman at malalaking dibisyon ng isang negosyo ay hindi gaanong naiiba.

One-way ANOVA sa MS Excel

Ang one-way analysis ng variance ay maaaring isagawa gamit ang MS Excel procedure One-way na ANOVA... Ginagamit namin ito upang pag-aralan ang data sa ugnayan sa pagitan ng uri ng hilaw na materyales na ginamit at kita ng negosyo mula sa halimbawa 1.

Serbisyo / Pagsusuri ng Data at pumili ng tool sa pagsusuri One-way na ANOVA.

Sa bintana Interval ng pag-input ipinapahiwatig namin ang lugar ng data (sa aming kaso ito ay $ A $ 2: $ E $ 7). Ipinapahiwatig namin kung paano pinagsama-sama ang kadahilanan - ayon sa mga haligi o ayon sa mga hilera (sa aming kaso, ayon sa mga hilera). Kung ang unang column ay naglalaman ng mga pangalan ng mga factor class, lagyan ng check ang kahon Mga label ng unang column... Sa bintana Alpha ipahiwatig ang antas ng kahalagahan α = 0,05 .

Ang pangalawang talahanayan - Pagsusuri ng Pagkakaiba - naglalaman ng data sa mga halaga para sa kadahilanan sa pagitan ng mga grupo at sa loob ng mga grupo at ang mga kabuuan. Ito ang kabuuan ng mga squared deviations (SS), ang bilang ng mga degree ng kalayaan (df), variance (MS). Ang huling tatlong column ay naglalaman ng aktwal na halaga ng Fisher ratio (F), ang p-level (P-value) at ang kritikal na halaga ng Fisher ratio (F crit).

MS F P-halaga F crit
0,58585 6,891119 0,000936 2,77285
0,085017

Dahil ang aktwal na halaga ng ratio ng Fischer (6.89) ay mas malaki kaysa sa kritikal na halaga (2.77), na may posibilidad na 95% tinatanggihan namin ang null hypothesis tungkol sa pagkakapantay-pantay ng average na produktibidad kapag gumagamit ng lahat ng uri ng hilaw na materyales, iyon ay, napagpasyahan namin na ang uri ng hilaw na materyales na ginamit ay nakakaapekto sa mga negosyo ng kita.

Dalawang-paraan na pagsusuri ng pagkakaiba-iba nang walang pag-uulit: ang kakanyahan ng pamamaraan, mga formula, halimbawa

Ang two-way analysis ng variance ay ginagamit upang suriin ang posibleng pag-asa ng epektibong katangian sa dalawang salik - A at B... Pagkatapos a- ang bilang ng mga gradasyon ng kadahilanan A at b- ang bilang ng mga gradasyon ng kadahilanan B... Sa statistical complex, ang kabuuan ng mga parisukat ng mga nalalabi ay nahahati sa tatlong bahagi:

SS = SS isang + SS b + SS e,

- ang kabuuang kabuuan ng mga parisukat ng mga paglihis,

- ipinaliwanag sa pamamagitan ng impluwensya ng isang salik A kabuuan ng mga parisukat ng mga paglihis,

- ipinaliwanag sa pamamagitan ng impluwensya ng isang salik B kabuuan ng mga parisukat ng mga paglihis,

- ang kabuuang average ng mga obserbasyon,

Average ng mga obserbasyon sa bawat gradation ng factor A ,

B .

A ,

Ang pagpapakalat ay ipinaliwanag sa pamamagitan ng impluwensya ng salik B ,

va = a − 1 A ,

vb = b − 1 - ang bilang ng mga antas ng kalayaan ng pagpapakalat na ipinaliwanag ng impluwensya ng salik B ,

ve = ( a − 1)(b − 1)

v = ab- 1 - ang kabuuang bilang ng mga antas ng kalayaan.

Kung ang mga salik ay independiyente sa isa't isa, pagkatapos ay dalawang null hypotheses at ang kaukulang alternatibong hypotheses ay iniharap upang matukoy ang kahalagahan ng mga salik:

para sa kadahilanan A :

H0 : μ 1A = μ 2A = ... = μ aA,

H1 : Hindi lahat μ iA ay pantay;

para sa kadahilanan B :

H0 : μ 1B = μ 2B = ... = μ aB,

H1 : Hindi lahat μ iB ay pantay-pantay.

A

Upang matukoy ang impluwensya ng isang salik B, dapat ihambing ang aktwal na saloobin ni Fischer sa kritikal na saloobin ni Fischer.

α P = 1 − α .

α P = 1 − α .

Dalawang-paraan na pagsusuri ng pagkakaiba-iba nang walang pag-uulit: isang halimbawa

Halimbawa 3. Ang impormasyon ay ibinibigay sa average na pagkonsumo ng gasolina bawat 100 kilometro sa litro, depende sa dami ng engine at uri ng gasolina.

Kinakailangang suriin kung ang pagkonsumo ng gasolina ay nakasalalay sa laki ng makina at uri ng gasolina.

Solusyon. Para sa kadahilanan A bilang ng mga klase sa pagmamarka a= 3, para sa kadahilanan B bilang ng mga klase sa pagmamarka b = 3 .

Kinakalkula namin ang kabuuan ng mga parisukat ng mga paglihis:

,

,

,

.

Mga kaukulang pagkakaiba:

,

,

.

A ... Dahil ang aktwal na ratio ng Fischer ay mas mababa kaysa sa kritikal, tinatanggap namin ang hypothesis na ang pag-aalis ng makina ay hindi nakakaapekto sa pagkonsumo ng gasolina na may 95% na posibilidad. Gayunpaman, kung pipiliin natin ang antas ng kahalagahan α = 0.1, pagkatapos ay ang aktwal na halaga ng Fisher ratio, at pagkatapos ay may posibilidad na 95% maaari nating ipagpalagay na ang pag-aalis ng makina ay nakakaapekto sa pagkonsumo ng gasolina.

Aktwal na Ratio ni Fischer para sa isang Salik B , ang kritikal na halaga ng Fisher ratio: ... Dahil ang aktwal na ratio ng Fischer ay mas malaki kaysa sa kritikal na halaga ng Fisher ratio, ipinapalagay namin na may 95% na posibilidad na ang uri ng gasolina ay nakakaapekto sa pagkonsumo nito.

Dalawang-daan na pagsusuri ng pagkakaiba-iba nang walang pag-uulit sa MS Excel

Maaaring isagawa ang two-way analysis ng variance nang walang pag-uulit gamit ang MS Excel procedure. Ginagamit namin ito upang pag-aralan ang data sa kaugnayan sa pagitan ng uri ng uri ng gasolina at pagkonsumo nito mula sa halimbawa 3.

Sa menu ng MS Excel, isagawa ang utos Serbisyo / Pagsusuri ng Data at pumili ng tool sa pagsusuri Dalawang-daan na pagsusuri ng pagkakaiba-iba nang walang pag-uulit.

Pinupunan namin ang data sa parehong paraan tulad ng sa kaso ng univariate analysis ng variance.


Bilang resulta ng pamamaraan, dalawang talahanayan ang ipinapakita. Ang unang talahanayan ay Mga Kabuuan. Naglalaman ito ng data sa lahat ng klase ng factor gradation: bilang ng mga obserbasyon, kabuuang halaga, mean na halaga at pagkakaiba.

Ang pangalawang talahanayan - Pagsusuri ng Variance - naglalaman ng data sa mga pinagmumulan ng variation: scatter between row, scatter between columns, error scattering, total scattering, sum of squared deviations (SS), number of degrees of freedom (df), variance (MS ). Ang huling tatlong column ay naglalaman ng aktwal na halaga ng Fisher ratio (F), ang p-level (P-value) at ang kritikal na halaga ng Fisher ratio (F crit).

MS F P-halaga F crit
3,13 5,275281 0,075572 6,94476
8,043333 13,55618 0,016529 6,944276
0,593333

Salik A(engine displacement) ay nakagrupo sa mga linya. Dahil ang aktwal na ratio ng Fischer na 5.28 ay mas mababa kaysa sa kritikal na 6.94, ipinapalagay namin na may 95% na posibilidad na ang pagkonsumo ng gasolina ay hindi nakasalalay sa laki ng makina.

Salik B(uri ng gasolina) ay nakapangkat sa mga column. Ang aktwal na ratio ng Fischer na 13.56 ay mas malaki kaysa sa kritikal na 6.94, samakatuwid, na may 95% na posibilidad, ipinapalagay namin na ang pagkonsumo ng gasolina ay nakasalalay sa uri nito.

Dalawang-paraan na pagsusuri ng pagkakaiba-iba sa mga pag-uulit: ang kakanyahan ng pamamaraan, mga formula, halimbawa

Ang two-way analysis ng pagkakaiba-iba sa mga pag-uulit ay ginagamit upang suriin hindi lamang ang posibleng pag-asa ng epektibong katangian sa dalawang salik - A at B, kundi pati na rin ang posibleng interaksyon ng mga salik A at B... Pagkatapos a- ang bilang ng mga gradasyon ng kadahilanan A at b- ang bilang ng mga gradasyon ng kadahilanan B, r- ang bilang ng mga pag-uulit. Sa statistical complex, ang kabuuan ng mga parisukat ng mga nalalabi ay nahahati sa apat na bahagi:

SS = SS isang + SS b + SS ab + SS e,

- ang kabuuang kabuuan ng mga parisukat ng mga paglihis,

- ipinaliwanag sa pamamagitan ng impluwensya ng isang salik A kabuuan ng mga parisukat ng mga paglihis,

- ipinaliwanag sa pamamagitan ng impluwensya ng isang salik B kabuuan ng mga parisukat ng mga paglihis,

- ipinaliwanag sa pamamagitan ng impluwensya ng interaksyon ng mga salik A at B kabuuan ng mga parisukat ng mga paglihis,

- hindi maipaliwanag na kabuuan ng mga parisukat ng mga deviations o kabuuan ng mga parisukat ng mga deviations ng error,

- ang kabuuang average ng mga obserbasyon,

- average ng mga obserbasyon sa bawat gradasyon ng salik A ,

- ang average na bilang ng mga obserbasyon sa bawat gradasyon ng salik B ,

Average na bilang ng mga obserbasyon sa bawat kumbinasyon ng factor gradations A at B ,

n = abr- ang kabuuang bilang ng mga obserbasyon.

Ang mga pagkakaiba ay kinakalkula tulad ng sumusunod:

Ang pagpapakalat ay ipinaliwanag sa pamamagitan ng impluwensya ng salik A ,

Ang pagpapakalat ay ipinaliwanag sa pamamagitan ng impluwensya ng salik B ,

- pagkakaiba na ipinaliwanag sa pamamagitan ng interaksyon ng mga salik A at B ,

- hindi maipaliwanag na pagkakaiba o pagkakaiba ng error,

va = a − 1 - ang bilang ng mga antas ng kalayaan ng pagpapakalat na ipinaliwanag ng impluwensya ng salik A ,

vb = b − 1 - ang bilang ng mga antas ng kalayaan ng pagpapakalat na ipinaliwanag ng impluwensya ng salik B ,

vab = ( a − 1)(b − 1) - ang bilang ng mga antas ng kalayaan ng pagkakaiba na ipinaliwanag ng pakikipag-ugnayan ng mga salik A at B ,

ve = ab(r − 1) - ang bilang ng mga antas ng kalayaan ng hindi maipaliwanag na pagkakaiba o pagkakaiba ng error,

v = abr- 1 - ang kabuuang bilang ng mga antas ng kalayaan.

Kung ang mga salik ay independiyente sa isa't isa, pagkatapos ay tatlong null hypotheses at kaukulang alternatibong hypotheses ang inihaharap upang matukoy ang kahalagahan ng mga salik:

para sa kadahilanan A :

H0 : μ 1A = μ 2A = ... = μ aA,

H1 : Hindi lahat μ iA ay pantay;

para sa kadahilanan B :

Upang matukoy ang impluwensya ng pakikipag-ugnayan ng mga kadahilanan A at B, dapat ihambing ang aktwal na saloobin ni Fischer sa kritikal na saloobin ni Fischer.

Kung ang aktwal na Fisher ratio ay mas malaki kaysa sa kritikal na Fisher ratio, kung gayon ang null hypothesis ay dapat tanggihan na may antas ng kahalagahan. α ... Nangangahulugan ito na ang kadahilanan ay makabuluhang nakakaapekto sa data: ang data ay nakasalalay sa kadahilanan na may posibilidad P = 1 − α .

Kung ang aktwal na ratio ng Fischer ay mas mababa sa kritikal na ratio ng Fisher, kung gayon ang null hypothesis ay dapat tanggapin na may antas ng kahalagahan. α ... Nangangahulugan ito na ang kadahilanan ay hindi gaanong nakakaapekto sa data na may posibilidad P = 1 − α .

Two-Way Repeat ANOVA: Isang Halimbawa

tungkol sa interaksyon ng mga salik A at B: Ang aktwal na saloobin ni Fischer ay hindi gaanong kritikal, samakatuwid, ang pakikipag-ugnayan sa pagitan ng kampanya sa advertising at isang partikular na tindahan ay hindi mahalaga.

Dalawang-daan na pagsusuri ng pagkakaiba-iba sa mga pag-uulit sa MS Excel

Ang two-way na pagsusuri ng pagkakaiba-iba sa mga pag-uulit ay maaaring isagawa gamit ang pamamaraan ng MS Excel. Ginagamit namin ito upang suriin ang data sa kaugnayan sa pagitan ng kita ng tindahan at pagpili ng isang partikular na tindahan at ang kampanya sa advertising mula sa Halimbawa 4.

Sa menu ng MS Excel, isagawa ang utos Serbisyo / Pagsusuri ng Data at pumili ng tool sa pagsusuri Dalawang-daan na pagsusuri ng pagkakaiba-iba sa mga pag-uulit.

Pinupuno namin ang data sa parehong paraan tulad ng sa kaso ng two-way na pagsusuri ng pagkakaiba-iba nang walang pag-uulit, kasama ang pagdaragdag na ang bilang ng mga pag-uulit ay dapat ipasok sa bilang ng mga hilera para sa window ng pagpili.

Bilang resulta ng pamamaraan, dalawang talahanayan ang ipinapakita. Ang unang talahanayan ay binubuo ng tatlong bahagi: ang unang dalawa ay tumutugma sa bawat isa sa dalawang kampanya sa advertising, ang pangatlo ay naglalaman ng data sa parehong mga kampanya sa advertising. Ang mga column ng talahanayan ay naglalaman ng impormasyon sa lahat ng mga klase ng gradasyon ng pangalawang salik - ang tindahan: ang bilang ng mga obserbasyon, ang kabuuang halaga, ang average na halaga at ang pagkakaiba.

Ang pangalawang talahanayan ay naglalaman ng data sa kabuuan ng mga squared deviations (SS), ang bilang ng mga degree ng kalayaan (df), variance (MS), ang aktwal na halaga ng Fisher ratio (F), p-level (P-value) at ang kritikal na halaga ng Fisher ratio (F crit) para sa iba't ibang pinagmumulan ng variation: dalawang salik na ibinibigay sa mga row (sample) at column, interaksyon ng mga salik, mga error (sa loob) at kabuuang indicator (kabuuan).

MS F P-halaga F crit
8,013339 0,500252 0,492897 4,747221
189,1904 11,81066 0,001462 3,88529
6,925272 0,432327 0,658717 3,88529
16,01861

Para sa kadahilanan B Ang aktwal na ratio ng Fischer ay mas malaki kaysa sa kritikal, samakatuwid, na may 95% na posibilidad, malaki ang pagkakaiba ng mga kita sa pagitan ng mga tindahan.

Para sa interaksyon ng mga salik A at B Ang aktwal na saloobin ni Fischer ay mas mababa kaysa sa kritikal, samakatuwid, na may 95% na posibilidad, ang pakikipag-ugnayan sa pagitan ng kampanya sa advertising at isang partikular na tindahan ay hindi makabuluhan.

Lahat ng kaugnay na paksa "Mathematics Statistics"

ANOVA(mula sa Latin na Dispersio - dispersion / sa English Analysis Of Variance - ANOVA) ay ginagamit upang pag-aralan ang impluwensya ng isa o higit pang qualitative variables (factors) sa isang dependent quantitative variable (tugon).

Ang pagsusuri ng pagkakaiba-iba ay batay sa pagpapalagay na ang ilang mga variable ay maaaring isaalang-alang bilang mga sanhi (mga kadahilanan, mga independiyenteng mga variable): at iba pa bilang mga kahihinatnan (dependent variable). Ang mga independiyenteng variable ay tinatawag na mga adjustable factor kung minsan dahil sa eksperimento ang mananaliksik ay may kakayahan na pag-iba-ibahin ang mga ito at pag-aralan ang resultang resulta.

Ang pangunahing layunin pagsusuri ng pagkakaiba-iba(ANOVA) ay isang pag-aaral ng kahalagahan ng mga pagkakaiba sa pagitan ng mga paraan sa pamamagitan ng paghahambing (pagsusuri) ng mga pagkakaiba. Sa pamamagitan ng paghahati sa kabuuang pagkakaiba sa maraming pinagmumulan, posibleng ihambing ang pagkakaiba na dulot ng pagkakaiba sa pagitan ng mga pangkat sa pagkakaiba na dulot ng pagkakaiba-iba sa loob ng pangkat. Kung totoo ang null hypothesis (tungkol sa pagkakapantay-pantay ng mga paraan sa ilang grupo ng mga obserbasyon na pinili mula sa pangkalahatang populasyon), ang pagtatantya ng pagkakaiba-iba na nauugnay sa pagkakaiba-iba sa loob ng pangkat ay dapat na malapit sa pagtatantya ng pagkakaiba-iba sa pagitan ng pangkat. Kung inihahambing mo lamang ang mga paraan sa dalawang sample, ang ANOVA ay magbibigay ng parehong resulta tulad ng karaniwang t-test para sa mga independiyenteng sample (kung naghahambing ka ng dalawang independiyenteng grupo ng mga bagay o obserbasyon) o t-test para sa mga umaasa na sample (kung ihahambing mo dalawang variable sa pareho at parehong hanay ng mga bagay o obserbasyon).

Ang kakanyahan ng pagsusuri ng pagkakaiba-iba ay upang hatiin ang kabuuang pagkakaiba-iba ng katangiang pinag-aaralan sa mga indibidwal na sangkap, dahil sa impluwensya ng mga tiyak na salik, at upang subukan ang mga hypotheses tungkol sa kahalagahan ng impluwensya ng mga salik na ito sa katangiang pinag-aaralan. Ang paghahambing ng mga bahagi ng pagkakaiba sa isa't isa gamit ang Fisher's F-test, posibleng matukoy kung anong proporsyon ng pangkalahatang pagkakaiba-iba ng mabisang katangian ay dahil sa pagkilos ng mga regulated na salik.

Ang panimulang materyal para sa pagsusuri ng pagkakaiba-iba ay ang data ng pag-aaral ng tatlo o higit pang mga sample: na maaaring pantay o hindi pantay sa bilang, parehong konektado at hindi magkakaugnay. Sa pamamagitan ng bilang ng mga nakitang kinokontrol na salik, ang pagsusuri ng pagkakaiba ay maaaring univariate(sa kasong ito, ang impluwensya ng isang kadahilanan sa mga resulta ng eksperimento ay pinag-aralan), dalawang salik(kapag pinag-aaralan ang impluwensya ng dalawang salik) at multifactorial(nagbibigay-daan sa iyong suriin hindi lamang ang impluwensya ng bawat isa sa mga salik nang hiwalay, kundi pati na rin ang kanilang pakikipag-ugnayan).

Ang ANOVA ay kabilang sa pangkat ng mga parametric na pamamaraan at samakatuwid ay dapat lamang gamitin kapag napatunayang normal ang distribusyon.

Ginagamit ang ANOVA kapag ang dependent variable ay sinusukat sa mga tuntunin ng ratios, intervals, o order, at ang mga nakakaimpluwensyang variable ay hindi numerical (naming scale).

Mga halimbawa ng mga gawain

Sa mga problema na nalutas sa pamamagitan ng pagsusuri ng pagkakaiba, mayroong isang tugon ng isang numerical na kalikasan, na apektado ng ilang mga variable ng isang nominal na kalikasan. Halimbawa, ilang uri ng mga rasyon sa pagpapataba ng hayop o dalawang paraan ng pag-iingat sa kanila, atbp.

Halimbawa 1: Maraming kiosk ng parmasya ang nagpapatakbo sa tatlong magkakaibang lokasyon sa loob ng linggo. Sa hinaharap, isa lang ang maiiwan natin. Kinakailangang matukoy kung mayroong makabuluhang pagkakaiba sa istatistika sa pagitan ng mga dami ng benta ng mga gamot sa mga kiosk. Kung gayon, pipiliin namin ang kiosk na may pinakamataas na average na pang-araw-araw na dami ng benta. Kung ang pagkakaiba sa dami ng mga benta ay lumabas na hindi gaanong mahalaga sa istatistika, kung gayon ang iba pang mga tagapagpahiwatig ay dapat na maging batayan para sa pagpili ng isang kiosk.

Halimbawa 2: Paghahambing ng mga kaibahan ng mga paraan ng pangkat. Ang pitong politikal na bias ay inayos mula sa sobrang liberal hanggang sa sobrang konserbatibo, at ang linear na contrast ay ginagamit upang subukan kung mayroong nonzero tendency sa pagtaas ng mean values ​​sa mga grupo - iyon ay, kung mayroong isang makabuluhang linear na pagtaas sa average na edad kapag isinasaalang-alang ang mga grupo iniutos sa direksyon mula liberal hanggang konserbatibo.

Halimbawa 3: Dalawang-daan na pagsusuri ng pagkakaiba. Bilang karagdagan sa laki ng tindahan, ang bilang ng mga benta ng produkto ay kadalasang naiimpluwensyahan ng lokasyon ng mga istante na may produkto. Ang halimbawang ito ay naglalaman ng lingguhang mga bilang ng benta para sa apat na layout ng istante at tatlong laki ng tindahan. Ang mga resulta ng pagsusuri ay nagpapakita na ang parehong mga kadahilanan - ang lokasyon ng mga istante na may produkto at ang laki ng tindahan - ay nakakaapekto sa bilang ng mga benta, ngunit ang kanilang pakikipag-ugnayan ay hindi makabuluhan.

Halimbawa 4: One Dimensional ANOVA: Randomized na buong block na disenyo na may dalawang treatment. Ang epekto ng lahat ng posibleng kumbinasyon ng tatlong taba at tatlong ripper sa tinapay ay sinisiyasat. Apat na sample ng harina mula sa apat na iba't ibang pinagmumulan ang nagsilbing mga salik na humaharang. Kailangang matukoy ang kahalagahan ng pakikipag-ugnayan sa pagluwag ng taba. Pagkatapos nito, tukuyin ang iba't ibang mga posibilidad ng pagpili ng mga kaibahan, na ginagawang posible upang malaman kung aling mga kumbinasyon ng mga antas ng kadahilanan ang naiiba.

Halimbawa 5: Hierarchical (nested) na modelo ng plano na may magkahalong epekto. Pinag-aaralan ang epekto ng apat na random na napiling ulo na naka-install sa isang makina sa pagpapapangit ng mga ginawang glass cathode holder. (Ang mga ulo ay itinayo sa makina, kaya ang parehong ulo ay hindi maaaring gamitin sa iba't ibang mga makina). Ang epekto ng ulo ay itinuturing bilang isang random na kadahilanan. Ipinapakita ng mga istatistika ng ANOVA na walang makabuluhang pagkakaiba sa pagitan ng mga makina, ngunit may mga indikasyon na maaaring magkaiba ang mga ulo. Ang pagkakaiba sa pagitan ng lahat ng mga makina ay hindi makabuluhan, ngunit para sa dalawa sa kanila ang pagkakaiba sa pagitan ng mga uri ng ulo ay makabuluhan.

Halimbawa 6: Isang-dimensional na pagsusuri ng paulit-ulit na mga sukat gamit ang split plots plan. Isinagawa ang eksperimentong ito upang matukoy ang epekto ng rating ng pagkabalisa ng isang indibidwal sa pagpasa sa pagsusulit sa apat na magkakasunod na pagtatangka. Inayos ang data para matingnan ito bilang isang pangkat ng mga subset ng buong dataset ("buong plot"). Ang epekto ng pagkabalisa ay hindi gaanong mahalaga, habang ang epekto ng pagsubok ay makabuluhan.

Listahan ng mga pamamaraan

  • Mga Modelo ng Factorial Experiment. Mga halimbawa: mga salik na nakakaimpluwensya sa tagumpay ng paglutas ng mga problema sa matematika; mga kadahilanan na nakakaimpluwensya sa dami ng mga benta.

Binubuo ang data ng ilang serye ng mga obserbasyon (pagproseso), na itinuturing na mga pagsasakatuparan ng mga independiyenteng sample. Sinasabi ng paunang hypothesis na walang pagkakaiba sa mga paggamot, i.e. ipinapalagay na ang lahat ng mga obserbasyon ay maaaring ituring bilang isang sample mula sa pangkalahatang populasyon:

  • One-factor parametric model: Pamamaraan ni Scheffe.
  • One-factor nonparametric model [Lagutin MB, 237]: Kruskal-Wallis criterion [Hollender M., Wolf DA, 131], Jonkhier's criterion [Lagutin MB, 245].
  • Pangkalahatang kaso ng isang modelo na may pare-parehong mga kadahilanan, ang teorama ni Cochran [Afifi A., Eisen S., 234].

Ang data ay mga duplicate na obserbasyon:

  • Dalawang-factor na nonparametric na modelo: Friedman's criterion [Lapach, 203], Page's criterion [Lagutin MB, 263]. Mga halimbawa: paghahambing ng pagiging epektibo ng mga pamamaraan ng produksyon, mga pamamaraan ng agrikultura.
  • Dalawang-factor na non-parametric na modelo para sa hindi kumpletong data

Kasaysayan

Saan nagmula ang pangalan pagsusuri ng pagkakaiba-iba? Maaaring mukhang kakaiba na ang pamamaraan para sa paghahambing ng mga paraan ay tinatawag na pagsusuri ng pagkakaiba. Sa katunayan, ito ay dahil sa ang katunayan na kapag sinusuri ang istatistikal na kahalagahan ng pagkakaiba sa pagitan ng mga paraan ng dalawa (o higit pa) na mga grupo, aktwal naming inihahambing ang (pagsusuri) ng mga pagkakaiba-iba ng sample. Ang pangunahing konsepto ng pagsusuri ng pagkakaiba ay iminungkahi Fisher noong 1920. Marahil ang mas natural na termino ay kabuuan ng pagsusuri ng mga parisukat o pagsusuri ng variation, ngunit tradisyonal na ginagamit ang terminong ANOVA. Sa una, ang ANOVA ay binuo upang iproseso ang data na nakuha mula sa mga espesyal na idinisenyong eksperimento, at itinuring na ang tanging paraan na nagsisiyasat nang tama sa mga ugnayang sanhi. Ang pamamaraan ay ginamit upang suriin ang mga eksperimento sa produksyon ng pananim. Nang maglaon, ang pangkalahatang pang-agham na kahalagahan ng pagsusuri ng pagkakaiba-iba para sa mga eksperimento sa sikolohiya, pedagogy, gamot, atbp.

Panitikan

  1. Sheffe G. Pagsusuri ng pagkakaiba-iba. - M., 1980.
  2. Ahrens H. Leuter Yu. Multivariate analysis ng variance.
  3. A. I. Kobzar Applied Mathematics Statistics. - M .: Fizmatlit, 2006.
  4. Lapach S.N., Chubenko A.V., Babich P.N. Mga istatistika sa agham at negosyo. - Kiev: Morion, 2002.
  5. Lagutin M. B. Mga istatistika ng visual na matematika. Sa dalawang volume. - M .: P-center, 2003.
  6. Afifi A., Eisen S. Statistical Analysis: Isang Computer-Based Approach.
  7. Hollender M., Wolfe D.A. Nonparametric na pamamaraan ng mga istatistika.

Mga link

  • Pagsusuri ng pagkakaiba - StatSoft electronic textbook.


 


Basahin:



Bumili ng Sophora tincture, Sophora tincture application

Bumili ng Sophora tincture, Sophora tincture application

Sa artikulong tinatalakay namin ang tincture ng Japanese Sophora. Sasabihin namin sa iyo kung paano kapaki-pakinabang ang gamot, anong mga kontraindikasyon para sa paggamit at posibleng mga panganib sa kalusugan ...

Bakit walang gatas pagkatapos ng panganganak?

Bakit walang gatas pagkatapos ng panganganak?

Ang gatas ng ina ay ang pinakamahalagang pagkain para sa isang bagong silang na sanggol. Sa pagpapasuso lamang makukuha ng isang sanggol ang lahat ...

Ano ang dapat gawin upang maiwasan ang pagbubuntis?

Ano ang dapat gawin upang maiwasan ang pagbubuntis?

Ang pag-ibig sa isang kapareha na mayroon kang mga damdamin para sa ay isa sa mga pinaka-kahanga-hanga at napakasayang damdamin. Ang mga banal na damdamin ay nangingibabaw ...

Posible bang mabuntis mula sa male lubricant, may sperm ba ito?

Posible bang mabuntis mula sa male lubricant, may sperm ba ito?

Mayroong maraming mga paraan ng pagpipigil sa pagbubuntis, ngunit sa ilang kadahilanan ay mas gusto ng karamihan sa mga kabataan ang pinaka hindi mapagkakatiwalaan - nagambalang pakikipagtalik. Mag-asawa...

feed-image Rss