Kodu - Põrandad
Ühepoolne dispersiooni analüüs. Mitmemõõtmeline dispersioonianalüüs Variandianalüüsi artikkel

ANOVA kuulsa matemaatiku tööde põhjal R. A. Fisher... Vaatamata üsna kindlale "vanusele" on see meetod endiselt üks peamisi bioloogilistes ja põllumajandusuuringutes. Dispersioonanalüüsi aluseks olevaid ideid kasutatakse laialdaselt paljudes teistes katseandmete matemaatilise analüüsi meetodites, samuti bioloogiliste ja põllumajanduslike katsete kavandamisel.

Dispersiooni analüüs võimaldab teil:

1) võrrelda kahte või enamat valimi keskmist;

2) uurida samaaegselt mitme sõltumatu teguri toimet, samas on võimalik määrata nii iga teguri mõju uuritava tunnuse varieeruvusele kui ka nende koosmõju;

3) planeerida teaduslikku katset õigesti.

Elusorganismide varieeruvus avaldub üksikute tunnuste väärtuste hajumise või hajumise kujul piirides, mille määravad materjali bioloogilise ühtluse aste ja keskkonnatingimustega seotuse olemus. Märke, mis muutuvad teatud põhjuste mõjul, nimetatakse tõhus.

Tegurid on igasugused mõjud või tingimused, mille mitmekesisus võib kuidagi mõjutada efektiivse tunnuse mitmekesisust. Faktorite statistilist mõju dispersioonianalüüsis mõistetakse kui uuritud tegurite mitmekesisuse efektiivse näitaja peegeldust mitmekesisuses.

Mitmekesisuse all peame silmas iga tunnuse ebavõrdsete väärtuste olemasolu erinevates rühmades ühendatud isendites. Üksikisikute rühma mitmekesisus vastavalt uuritavale tunnusele võib olla erineval määral, mida tavaliselt mõõdetakse mitmekesisuse (või varieeruvuse) näitajatega: piirid, standardhälve, variatsioonikordaja. Dispersiooni analüüsimisel mõõdetakse tunnuse individuaalsete ja keskmiste väärtuste mitmekesisust ning võrreldakse seda erimeetoditel, mis moodustavad selle üldmeetodi eripära.

Tegurite korraldus seisneb selles, et igale uuritud tegurile omistatakse mitu väärtust. Vastavalt nendele väärtustele jagatakse iga tegur mitmeks gradatsiooniks; iga gradatsiooni jaoks valitakse juhusliku valimi põhimõtte kohaselt mitu isendit, mille puhul hiljem mõõdetakse efektiivse tunnuse väärtust.

Uuritud tegurite mõju astme ja usaldusväärsuse väljaselgitamiseks on vaja mõõta ja hinnata seda osa kogu mitmekesisusest, mis on nendest teguritest tingitud.

Efektiivse tunnuse varieeruvust mõjutavad tegurid jagunevad:

1) reguleeritav

2) juhuslik

Reguleeritud (süstemaatiline) tegurid on põhjustatud katses uuritud teguri toimest, millel on katses mitu gradatsiooni. Faktori gradatsioon- see on selle mõju aste tõhusale funktsioonile. Vastavalt atribuudi gradatsioonile tõstetakse võrdluseks esile mitu katse varianti. Kuna need tegurid on eeltingimused, nimetatakse neid teadustöös reguleerituks, s.t. antud, olenevalt katse korraldusest. Järelikult on reguleeritavad tegurid tegurid, mille toimimist on kogemuste põhjal uuritud, just need määravad erinevused erinevate valikuvõimaluste valimite vahel - rühmadevaheline (faktoriaalne) dispersioon.

Juhuslikud tegurid määratakse kõigi bioloogiliste objektide märkide loodusliku varieeruvusega looduses. Need on kogemustest sõltumatud tegurid. Neil on juhuslik mõju efektiivsele tunnusele, need põhjustavad katsevigu ja määravad tunnuse hajumise (hajumise) iga variandi piires. Seda levikut nimetatakse grupisisene (juhuslik) dispersioon.

Seega iseloomustab üksikute tegurite suhtelist rolli efektiivse tunnuse üldises varieeruvuses dispersioon ja seda saab uurida, kasutades dispersioonanalüüs või hajumisanalüüs

ANOVA põhineb rühmadevaheliste ja rühmasiseste dispersioonide võrdlus... Kui rühmadevaheline dispersioon ei ületa grupisisest dispersiooni, on erinevused rühmade vahel juhuslikud. Kui rühmadevaheline dispersioon on oluliselt suurem kui rühmasisene dispersioon, siis uuritud rühmade (valikuvõimaluste) vahel on statistiliselt olulisi erinevusi, mis tulenevad katses uuritud teguri mõjust.

Sellest järeldub, et efektiivse tunnuse statistilises uuringus, kasutades dispersioonanalüüsi, on vaja kindlaks teha selle variatsioonid variantides, kordused, jääkvariatsioon nende rühmade sees ja efektiivse tunnuse üldine varieeruvus katses. Selle kohaselt eristatakse kolme tüüpi dispersioone:

1) Efektiivse tunnuse üldine dispersioon (S y 2);

2) rühmadevaheline või privaatne proovide vahel (S y 2);

3) Rühmasisene, jääk (S z 2).

Seega dispersiooni analüüssee on kõrvalekallete ruutude ja vabadusastmete koguarvu kogusumma jagamine katse ülesehitusele vastavateks osadeks või komponentideks ning tegevuse olulisuse ja uuritavate tegurite koosmõju hindamine F-kriteeriumi järgi. Sõltuvalt samaaegselt uuritud tegurite arvust eristatakse kahe-, kolme-, neljafaktorilist dispersioonanalüüsi.

Väli ühefaktoriliste statistikakomplekside töötlemisel, mis koosnevad mitmest sõltumatust valikust, jaguneb efektiivse tunnuse kogu varieeruvus, mõõdetuna ruutude kogusumma (C y) abil, kolmeks komponendiks: valikute (näidised) vaheline variatsioon - CV , korduste variatsioon (valikud on üksteisega seotud ühise kontrollitava tingimusega - organiseeritud korduste olemasolu) - C p ja variatsioonid valikutes C z. Üldiselt väljendab tunnuse varieeruvust järgmine väljend:

C y = C V + C p + C z.

Vabadusastmete koguarv (N -1) on samuti jagatud kolmeks osaks:

valikuvabadused (l - 1);

korduste vabadusastmed (n- 1);

juhuslik variatsioon (n - 1) × (l - 1).

Kõrvalekallete ruutude summad vastavalt välikatsele - statistiline kompleks koos valikutega - l ja kordustega - n, leitakse järgmiselt. Esiteks määratakse esialgse tabeli abil korduste summad - Σ P, variantide puhul - Σ V ja kõigi vaatluste kogusumma - Σ X.

Seejärel arvutatakse järgmised näitajad:

Vaatluste koguarv N = l × n;

Parandustegur (muudatus) C cor = (Σ X 1) 2 / N;

Ruutude kogusumma Cy = Σ X 1 2 - C cor;

Korduste ruutude summa C p = Σ P 2 / (l –C cor);

Valikute C ruutude summa V V = Σ V 2 / (n - 1);

Vea ruutude summa (jääk) C Z = C y - C p - C V.

Saadud ruutude C V ja C Z summad jagatakse neile vastavate vabadusastmetega ja saadakse kaks keskmist ruutu (dispersiooni):

Variandid S v 2 = C V / l - 1;

Vead S Z 2 = C Z / (n - 1) × (l - 1).

Vahendite erinevuste olulisuse hindamine. Saadud keskmisi ruute kasutatakse dispersioonianalüüsis, et hinnata uuritavate tegurite mõju olulisust, võrreldes võimaluste dispersiooni (S v 2) vea dispersiooniga (SZ 2) vastavalt Fisheri kriteeriumile (F = SY 2 / SZ 2). Võrdlusühik on juhusliku dispersiooni keskmine ruut, mis määrab katse juhusliku vea.

Fisheri testi kasutamine võimaldab kindlaks teha oluliste erinevuste olemasolu või puudumise valimi keskmiste vahel, kuid ei näita konkreetseid erinevusi keskmiste vahel.

Testitud H o -hüpotees on eeldus, et kõik valimi keskmised on ühe üldise keskmise hinnangud ja erinevused nende vahel on ebaolulised. Kui F fakt = S Y 2 / S Z 2 ≤ F teoreetik, siis nullhüpoteesi tagasi ei lükata. Valimi keskmiste vahel pole olulisi erinevusi ja see on katse lõpp. Nullhüpotees lükatakse tagasi F fakt = S Y 2 / S Z 2 ≥ F theor Uuringus vastu võetud olulisuse taseme F-kriteeriumi väärtus on leitud vastavas tabelis, võttes arvesse variantide dispersiooni ja juhusliku dispersiooni vabadusastmeid. Tavaliselt kasutavad nad 5% olulisuse taset ja rangema lähenemisviisi korral 1% - ja isegi 0,1%.

N suurusega valimi puhul arvutatakse valimi dispersioon valimi keskmiste ruuthälvete summana, jagatuna n-1(valimi suurus miinus üks). Seega on valimi fikseeritud suuruse n puhul dispersioon funktsiooniks ruutude (kõrvalekallete) summa, mida tähistatakse lühiduse tõttu, SS (ingliskeelsest ruutude summast - ruutude summa). Lisaks jätame sageli sõna valimi välja, teades hästi, et kaalutakse valimi dispersiooni või dispersiooni hinnangut. Dispersiooni analüüs põhineb dispersiooni jagamisel osadeks või komponentideks.:

SS vead ja SS mõju. Rühmasisene varieeruvus ( SS) nimetatakse tavaliselt jääkkomponendiks või dispersiooniks vigu. See tähendab, et tavaliselt ei saa seda eksperimendi korral ette ennustada ega seletada. Teisel pool, SS -efekt(või rühmadevahelise dispersiooni komponenti) saab seletada rühmade keskmiste erinevusega. Teisisõnu, kuulumine teatud gruppi selgitab rühmadevaheline varieeruvus, sest me teame, et neil rühmadel on erinevad keskmised väärtused.

Dispersiooni analüüsi põhiloogika. Kokkuvõtteks võib öelda, et ANOVA eesmärk on testida keskmiste erinevuse statistilist olulisust (rühmade või muutujate puhul). See kontroll viiakse läbi, jagades ruutude summa komponentideks, s.t. jagades kogu dispersiooni (variatsiooni) osadeks, millest üks on tingitud juhuslikust veast (st rühmasisesest varieeruvusest) ja teine ​​on seotud keskmiste väärtuste erinevusega. Seejärel kasutatakse dispersiooni viimast komponenti, et analüüsida keskmiste erinevuse statistilist olulisust. Kui see on erinevus tähendusrikkalt, nullhüpotees tagasi lükatud ja aktsepteeritakse alternatiivset hüpoteesi vahendite erinevuse olemasolu kohta.

Sõltuvad ja sõltumatud muutujad. Muutujaid, mille väärtused määratakse katse käigus tehtud mõõtmiste abil (näiteks testimisel saadud skoor), nimetatakse sõltuvuses muutujad. Muutujaid, mida saab katses kontrollida (näiteks õpetamismeetodid või muud kriteeriumid, mis võimaldavad vaatlusi rühmadesse jagada või klassifitseerida) nimetatakse tegurid või sõltumatu muutujad.

Palju tegureid. Maailm on oma olemuselt keeruline ja mitmemõõtmeline. Olukordi, kus teatud nähtust kirjeldab täielikult üks muutuja, on äärmiselt harva. Näiteks kui proovime õppida suurte tomatite kasvatamist, tuleks arvestada taimede geneetilise struktuuri, mullatüübi, valguse, temperatuuri jms teguritega. Seega on tüüpilise katse puhul palju tegureid, millega tegeleda. Peamine põhjus, miks dispersioonanalüüsi kasutamine on eelistatav kahe proovi korduvale võrdlemisele erinevatel tegurite tasanditel, kasutades seeriaid t- kriteeriumiks on see, et dispersioonianalüüsi on oluliselt rohkem tõhus ja väikeste proovide puhul on see informatiivsem.

Väljund. Inglise teadlane R.A. Fisher töötas välja dispersioonanalüüsi ja tutvustas seda põllumajandus- ja bioloogiliste uuringute praktikas . Dispersioonianalüüsi olemus seisneb tunnuse kogu varieeruvuse ja vabadusastmete koguarvu lagundamises välikatse struktuurile vastavateks osadeks, samuti toimiva teguri hindamisel Fisheri kriteeriumi järgi.

Kus on tunnuse üldine varieeruvus, mis tuleneb uuritava küsimuse toimimisest, mullaviljakuse heterogeensusest ja katse juhuslikest vigadest.

Erinevad saagised, mis põhinevad välikatse kordustel.

Saagikuse variatsioonid uuritava küsimuse tegevusega seotud kogemuste variantide kaupa.

Kogemuste juhuslike vigadega seotud saagikuse variatsioonid.

Väljund dispersioonanalüüs tehakse vastavalt järgmistele reeglitele:

1. Kogemustes on olulisi erinevusi, kui Faktiline ≥ Teoreetiline. Kui F on tegelik, pole kogemustes olulisi erinevusi

2. NDS - väikseim oluline erinevus, mida kasutatakse valikute erinevuse määramiseks. Kui erinevus d ≥ NSR, on valikute erinevused olulised. Kui d< НСР, то различия между вариантами не существенные.

Rühmad võimalusi.

1. Kui erinevus d on märkimisväärne ja näitab saagikuse tõusu, siis kuuluvad valikud rühma 1.

2. Kui erinevus d– ei ole märkimisväärne, viitavad valikud rühmale 2.

3. Kui erinevus d on märkimisväärne, kuid näitab saagikuse vähenemist, siis viitavad valikud rühmale 3.

Valemi valimine ANOVA sõltub eksperimendi valikuvõimalustest:

1. Korraldatud korduste puhul:

2. Korraldamata korduste jaoks.

5.1. Mis on ANOVA?

Dispersioonanalüüsi töötas välja 1920. aastatel inglise matemaatik ja geneetik Ronald Fisher. Teadlaste seas läbi viidud küsitluse kohaselt, kus selgitati välja, kes 20. sajandi bioloogiat kõige enam mõjutas, võitis meistritiitli Sir Fisher (teenete eest pälvis ta rüütelkonna - üks Suurbritannia kõrgemaid tunnustusi); selles osas on Fischer võrreldav Charles Darwiniga, kellel oli 19. sajandil suurim mõju bioloogiale.

Dispersioonianalüüs on nüüd eraldi statistikaharu. See põhineb Fisheri avastatud tõsiasjal, et uuritud koguse varieeruvuse mõõtme saab lagundada osadeks, mis vastavad seda kogust mõjutavatele teguritele ja juhuslikele hälvetele.

Variatsioonianalüüsi olemuse mõistmiseks teeme sama tüüpi arvutusi kaks korda: „käsitsi” (kalkulaatoriga) ja kasutades programmi Statistica. Oma ülesande lihtsustamiseks ei tööta me roheliste konnade mitmekesisuse tegeliku kirjelduse tulemustega, vaid väljamõeldud näitega, mis on seotud naiste ja meeste võrdlemisega inimestel. Mõelge 12 täiskasvanu pikkuse mitmekesisusele: 7 naist ja 5 meest.

Tabel 5.1.1. Näide ühesuunalise ANOVA kohta: soo ja pikkuse andmed 12 inimese kohta

Teeme ühesuunalise dispersioonanalüüsi: võrdleme, kas kirjeldatud rühma mehed ja naised erinevad statistiliselt olulise pikkuse poolest või mitte.

5.2. Normaalsuse test

Edasine arutluskäik põhineb asjaolul, et jaotus vaadeldavas valimis on normaalne või normaalilähedane. Kui jaotus on normaalsusest kaugel, ei ole dispersioon (dispersioon) selle varieeruvuse adekvaatne näitaja. ANOVA on aga suhteliselt tugev, et levitada kõrvalekaldeid normaalsusest.

Nende andmete normaalsust saab kontrollida kahel erineval viisil. Esiteks: Statistika / Põhistatistika / Tabelid / Kirjeldav statistika / Vahekaart Normaalsus. Vahekaardil Normaalsus saate valida jaotuse normaalsuse jaoks kasutatavad testid. Kui klõpsate nuppu Sagedustabelid, ilmub sagedustabel ja nupud Histogrammid - histogramm. Tabel ja tulpdiagramm näitavad erinevate testide tulemusi.

Teine meetod on seotud sobiva võimaliku kasutamisega histogrammide koostamisel. Valige histogrammide (graafikud / histogrammid ...) loomise dialoogiboksis vahekaart Täpsemalt. Selle allosas on statistikaplokk. Märgime sellele Shapiro-Wilki t est ja Kolmogorov-Smirnovi test, nagu on näidatud joonisel.

Riis. 5.2.1. Jaotuse normaalsuse statistilised testid histogrammide koostamise dialoogis

Nagu histogrammist näha, erineb meie valimi kasvu jaotus tavapärasest (keskel - „ebaõnnestumine”).


Riis. 5.2.2. Histogramm joonistati eelmisel joonisel näidatud parameetritega

Graafiku pealkirja kolmas rida näitab normaaljaotuse parameetreid, millele vaadeldav jaotus oli kõige lähemal. Üldine keskmine on 173, üldine standardhälve 10,4. Graafiku külgribal on allpool normaalsuse testide tulemused. D on Kolmogorovi-Smirnovi test ja SW-W on Shapiro-Vilki test. Nagu näha, osutusid kõikide kasutatud testide puhul kõrgusejaotuse ja normaaljaotuse erinevused statistiliselt ebaolulisteks ( lk kõigil juhtudel üle 0,05).

Niisiis, ametlikult öeldes ei keelanud jaotuse normaaljaotusele vastavuse test meil "kasutada" parameetrilist meetodit, mis põhineb normaaljaotuse eeldusel. Nagu juba mainitud, on dispersioonanalüüs normaalsest kõrvalekallete suhtes suhteliselt vastupidav, seega kasutame seda endiselt.

5.3. Ühesuunaline ANOVA: käsitsi arvutamine

Inimeste pikkuse varieeruvuse iseloomustamiseks antud näites arvutame kõrvalekallete ruutude summa (inglise keeles tähistatakse seda kui SS , Ruutude summa või) üksikud väärtused keskmisest: ... Selle näite keskmine kõrgus on 173 sentimeetrit. Selle põhjal

SS = (186–173) 2 + (169–173) 2 + (166–173) 2 + (188–173) 2 + (172–173) 2 + (179–173) 2 + (165–173) 2 + (174–173) 2 + (163–173) 2 + (162–173) 2 + (162–173) 2 + (190–173) 2 ;

SS = 132 + 42 + 72 + 152 + 12 + 62 + 82 + 12 + 102 + 112 + 112 + 172;

SS = 169 + 16 + 49 + 225 + 1 + 36 + 64 + 1 + 100 + 121 + 121 + 289 = 1192.

Saadud väärtus (1192) on kogu andmekogumi varieeruvuse näitaja. Need koosnevad aga kahest rühmast, millest igaühe puhul saab eristada oma keskmist. Antud andmetel on naiste keskmine kõrgus 168 cm ja meeste - 180 cm.

Arvutame naiste kõrvalekallete ruutude summa:

SS f = (169–168) 2 + (166–168) 2 + (172–168) 2 + (179–168) 2 + (163–168) 2 + (162–168) 2 ;

SS f = 12 + 22 + 42 + 112 + 32 + 52 + 62 = 1 + 4 + 16 + 121 + 9 + 25 + 36 = 212.

Arvutame ka meeste kõrvalekallete ruutude summa:

SS m = (186–180) 2 + (188–180) 2 + (174–180) 2 + (162–180) 2 + (190–180) 2 ;

SS m = 62 + 82 + 62 + 182 + 102 = 36 + 64 + 36 + 324 + 100 = 560.

Millest sõltub uuritav väärtus vastavalt dispersiooniloogika analüüsile?

Kaks arvutatud väärtust, SS f ja SS m , iseloomustavad grupisisest dispersiooni, mida dispersioonanalüüsis nimetatakse tavaliselt "veaks". Selle nime päritolu on seotud järgmise loogikaga.

Mis määrab selles näites inimese kasvu? Esiteks inimeste keskmisest kasvust üldiselt, olenemata nende soost. Teiseks - põrandast. Kui ühest soost (meessoost) inimesed on teisest (naissoost) pikemad, võib seda kujutada teatud suurusega "tavainimese" keskmisele lisamise kujul, soo mõju. Lõpuks erinevad samasoolised inimesed individuaalsete erinevuste tõttu pikkuse poolest. Mudelis, mis kirjeldab pikkust inimese keskmise ja soolise kohandamise summana, on individuaalsed erinevused seletamatud ja neid võib pidada veaks.

Niisiis, vastavalt dispersioonanalüüsi loogikale, määratakse uuritav väärtus järgmiselt: , kus x ij -uuritud väärtuse i-ndat väärtust uuritava teguri j-nda väärtuse juures; - üldine keskmine; F j - uuritava teguri j-nda väärtuse mõju; - "viga" - selle objekti individuaalsuse panus, kuhu kogus kuulubx ij .

Rühmadevaheline ruutude summa

Niisiis, SS vigu = SS f + SS m = 212 + 560 = 772. Selle väärtusega kirjeldasime rühmasisest muutlikkust (kui rühmad tuvastati soo järgi). Kuid varieeruvusel on ka teine ​​osa - rühmadevaheline, mida me nimetameSS -efekt (kuna me räägime vaadeldavate objektide komplekti naiste ja meeste jagamise mõjust).

Iga rühma keskmine erineb üldisest keskmisest. Arvutades selle erinevuse panust varieeruvuse kogumõõdikusse, peame korrutama rühma ja kogu keskmise erinevuse iga rühma objektide arvuga.

SS -efekt = = 7 × (168–173) 2 + 5 × (180–173) 2 = 7 × 52 + 5 × 72 = 7 × 25 + 5 × 49 = 175 + 245 = 420.

Siin avaldus Fischeri avastatud ruutude summa püsivuse põhimõte: SS = SS -efekt + SS -viga , st. selle näite puhul 1192 = 440 + 722.

Keskmised ruudud

Võrreldes meie näites rühmadevahelisi ja grupisiseseid ruutude summasid, näeme, et esimene on seotud kahe rühma variatsiooniga ja teine ​​- 12 väärtust kahes rühmas. Vabadusastmete arv ( df ) mõne parameetri puhul saab määratleda kui erinevust rühmas olevate objektide arvu ja neid väärtusi ühendavate sõltuvuste (võrrandite) vahel.

Meie näites df efekt = 2–1 = 1, a df vead = 12–2 = 10.

Võime ruutude summad jagada nende vabadusastmete arvuga, saades keskmised ruudud ( PRL , Ruutude vahendid). Kui oleme seda teinud, saame selle kindlaks teha PRL - ei midagi muud kui dispersioon ("dispersioon", ruutude summa jagamise vabadusastmete arvuga tulemus). Pärast seda avastust saame aru ANOVA tabeli struktuurist. Meie näite puhul näeb see välja selline.

mõju

Viga

MS efekt ja MS vead on rühmadevaheliste ja rühmasiseste dispersioonide hinnangud ning seetõttu saab neid vastavalt kriteeriumile võrreldaF (Snedecori kriteerium, nimega Fisher), mille eesmärk on võrrelda dispersioone. See kriteerium on lihtsalt jagatis, mis jagab suurema dispersiooni väiksemaga. Meie puhul on see 420 / 77,2 = 5,440.

Fisheri testi statistilise olulisuse määramine tabelite abil

Kui me peaksime tabeli abil efekti statistilise olulisuse käsitsi kindlaks määrama, peaksime võrdlema kriteeriumi saadud väärtust F kriitiline, mis vastab teatud vabadusastmete statistilisele olulisuse tasemele.


Riis. 5.3.1. Tabeli fragment koos kriteeriumi kriitiliste väärtustega F

Nagu näete, on statistilise olulisuse taseme p = 0,05 puhul kriteeriumi kriitiline väärtusF on 4.96. See tähendab, et meie näites registreeriti uuritud soo tegevus statistilise olulisuse tasemega 0,05.

Tulemust saab tõlgendada järgmiselt. Nullhüpoteesi tõenäosus, mille kohaselt naiste ja meeste keskmine pikkus on sama ning nende pikkuse registreeritud erinevus on seotud juhuslikkusega proovide moodustamisel, on väiksem kui 5%. See tähendab, et peame valima alternatiivse hüpoteesi, et naiste ja meeste keskmine pikkus on erinev.

5.4. Ühesuunaline dispersioonianalüüs ( ANOVA) Statistica paketis

Juhul kui arvutusi ei tehta käsitsi, vaid sobivate programmide (näiteks Statistica pakett) abil, tuleb väärtus lk määratakse automaatselt. Võite veenduda, et see on kriitilisest väärtusest veidi kõrgem.

Arutatud näite analüüsimiseks, kasutades lihtsamat dispersioonianalüüsi varianti, peate vastavate andmetega faili jaoks käivitama statistika / ANOVA protseduuri ja valima akna Analüüsi tüüp suvandi Ühe suuna ANOVA ning dialoogi Kiirvalikud suvand aknas Täpsustusmeetod ...


Riis. 5.4.1. Üldine ANOVA / MANOVA dialoog

Avanenud kiirdialoogiakna väljal Muutujad peate määrama need veerud, mis sisaldavad andmeid, mille varieeruvust me uurime (sõltuvate muutujate loend; meie puhul veerg Kasv), samuti väärtusi sisaldav veerg mis jagavad uuritud väärtuse rühmadesse (Catigorical predicor (factor); meie puhul veerg Sex). Selles analüüsi versioonis võib erinevalt mitmemõõtmelisest analüüsist arvestada ainult ühe teguriga.


Riis. 5.4.2. Ühesuunaline ANOVA dialoog

Aknas Faktorikoodid peaksite määrama vaadeldava teguri väärtused, mida tuleb selle analüüsi käigus töödelda. Kõiki saadaolevaid väärtusi saab vaadata nupu Zoom abil; kui, nagu meie näites, peate arvestama teguri kõigi väärtustega (ja meie näite puhul on soo puhul neid ainult kaks), võite klõpsata nupul Kõik. Kui töödeldavad veerud ja tegurikoodid on seatud, võite klõpsata nuppu OK ja minna tulemuste kiiranalüüsile: ANOVA tulemused 1 vahekaardile Kiir.

Riis. 5.4.3. ANOVA tulemuste akna vahekaart Kiir

Nupp Kõik efektid / graafikud võimaldab teil näha, kuidas kahe rühma keskmised võrdlevad. Graafiku kohal on näidatud vabadusastmete arv, samuti vaadeldava teguri väärtused F ja p.


Riis. 5.4.4. ANOVA tulemuste graafiline kuvamine

Nupp Kõik efektid võimaldab teil saada ülalkirjeldatuga sarnase dispersioonitabeli (mõningate oluliste erinevustega).


Riis. 5.4.5. ANOVA tabel (võrrelge käsitsi saadud sarnase tabeliga)

Tabeli alumine rida näitab ruutude summat, vabadusastmete arvu ja vea keskmisi ruute (rühmasisene varieeruvus). Üks rida ülalpool - uuritava teguri (antud juhul sugu märk) sarnased näitajad, samuti kriteerium F (mõju keskmiste ruutude ja vea keskmiste ruutude suhe) ja selle statistilise olulisuse tase. Seda, et kõnealuse teguri mõju osutus statistiliselt oluliseks, näitab punasega esiletõstmine.

Esimene rida sisaldab indikaatori „Lõikamine” andmeid. See tabeli rida kujutab endast saladust statistika uutele kasutajatele selle kuuendas või uuemas versioonis. Lõikamise väärtus on tõenäoliselt seotud kõigi andmeväärtuste ruutude summa lagunemisega (st 1862 + 1692 ... = 360340). Selle jaoks näidatud kriteeriumi F väärtus saadakse jagamise teel MS pealtkuulamine / MS viga = 353220 / 77,2 = 4575,389 ja annab loomulikult väga madala väärtuse lk ... Huvitav on see, et Statistica-5-s seda väärtust üldse ei arvutatud ja pakendi hilisemate versioonide kasutamise juhendid ei kommenteeri selle kasutuselevõttu mingil viisil. Tõenäoliselt parim asi, mida Statistica-6 ja uuematega töötav bioloog saab teha, on lihtsalt ignoreerida tabeli ANOVA rida Intercept.

5.5. ANOVA ning õpilaste ja Fisheri testid: kumb on parem?

Nagu olete ehk märganud, võiksime andmeid, mida võrdlesime ühesuunalise dispersioonanalüüsi abil, uurida ka õpilaste ja Fisheri testide abil. Võrrelgem neid kahte meetodit. Selleks arvutage nende kriteeriumide alusel meeste ja naiste kõrguste vahe. Selleks peame liikuma mööda teed Statistika / Põhistatistika / t-test, sõltumatult, rühmade kaupa. Sõltuvad muutujad on loomulikult kasvumuutuja ja rühmitamismuutuja on sugu.


Riis. 5.5.1. ANOVA-töödeldud andmete võrdlus vastavalt õpilaste ja Fisheri testidele

Nagu näete, on tulemus sama, mis ANOVA puhul. lk = 0,041874 mõlemal juhul, nagu on näidatud joonisel fig. 5 ja näidatud joonisel fig. 5.5.2 (vaadake ise!).


Riis. 5.5.2. Analüüsi tulemused (tulemustabeli üksikasjalik selgitus - lõigus õpilase kriteeriumi kohta)

Oluline on rõhutada, et kuigi F -kriteerium matemaatilisest vaatenurgast on analüüsitud analüüsis vastavalt õpilase ja Fisheri kriteeriumidele sama, mis ANOVA -s (ja väljendab dispersioonisuhet), on selle tähendus dokumendis esitatud analüüsitulemustes finaallaud on täiesti erinev. Kui võrrelda õpilase ja Fisheri kriteeriumide järgi, siis viiakse proovide keskmiste väärtuste võrdlus läbi vastavalt õpilase kriteeriumile ja nende varieeruvuse võrdlus toimub Fisheri kriteeriumi järgi. Analüüsi tulemustes ei kuvata mitte dispersiooni ennast, vaid selle ruutjuurt - standardhälvet.

Seevastu ANOVA-s kasutatakse Fisheri testi erinevate proovide keskmiste võrdlemiseks (nagu me arutasime, jagatakse see ruutude summa osadeks ja võrreldakse ruutude keskmist ja rühmasisest varieeruvust) .

Ülaltoodud erinevus puudutab aga pigem statistilise uuringu tulemuste esitamist kui selle olemust. Nagu märkis näiteks Glantz (1999, lk. 99), võib rühmade võrdlemist Studenti testi järgi pidada kahe proovi dispersioonanalüüsi erijuhuks.

Niisiis, proovide võrdlemisel vastavalt õpilase ja Fisheri testidele on dispersioonanalüüsi ees üks oluline eelis: see võib võrrelda proove nende varieeruvuse poolest. Kuid dispersioonanalüüsi eelised on endiselt olulisemad. Nende hulka kuulub näiteks võimalus võrrelda mitut proovi korraga.

Kaalutud dispersioonianalüüsi skeem eristatakse sõltuvalt: a) tunnuse olemusest, mille alusel populatsioon rühmadesse (valimid;) jaotatakse; b) tunnuste arvu järgi, mille alusel populatsioon rühmadesse jaotatakse (valimid) ); c) proovivõtumeetodi kohta.

Iseloomulikud väärtused. mis jaotab elanikkonna rühmadesse, võib esindada üldist või selle lähedast elanikkonda. Sel juhul vastab ANOVA skeem ülalkirjeldatule. Kui eri rühmi moodustava tunnuse väärtused esindavad valimit üldpopulatsioonist, siis null- ja alternatiivsete hüpoteeside sõnastus muutub. Nullhüpoteesina pakutakse välja, et rühmade vahel on erinevusi, see tähendab, et rühma keskmised näitavad mõningast erinevust. Alternatiivse hüpoteesina pakutakse välja, et võnkumist ei toimu. Ilmselgelt pole sellise hüpoteeside sõnastuse korral põhjust dispersioonide võrdlemise tulemusi täpsustada.

Rühmitamisfunktsioonide arvu suurenemisega, näiteks kuni 2, suureneb esiteks nullide arv ja vastavalt ka alternatiivsed hüpoteesid. Sellisel juhul räägib esimene nullhüpotees esimese rühmitustunnuse rühmade keskmiste erinevuste puudumisest, teine ​​nullhüpotees teise rühmitustunnuse rühmade keskmiste erinevuste puudumisest ja lõpuks kolmas nullhüpotees näitab tegurite (rühmitamise tunnuste) nn interaktsiooniefekti puudumist.

Interaktsiooniefekti all mõistetakse sellist muutust efektiivse atribuudi väärtuses, mida ei saa seletada kahe teguri kogumõjuga. Kolme püstitatud hüpoteesipaari testimiseks on vaja arvutada kolm F-Fisheri kriteeriumi tegelikku väärtust, mis omakorda pakub välja järgmise variatsiooni kogumahu lagunemise variandi

F-kriteeriumi saamiseks vajalikud dispersioonid saadakse teadaoleval viisil, jagades variatsioonimahud vabadusastmete arvuga.

Nagu teate, võivad proovid olla sõltuvad ja sõltumatud. Kui proovid on sõltuvad, tuleks variatsiooni kogusummas eristada nn variatsiooni korduste kaupa.
... Kui seda ei tõsteta esile, võib see variatsioon oluliselt suurendada grupisisest variatsiooni (
), mis võib moonutada dispersioonanalüüsi tulemusi.

Vaadake küsimused üle

17-1 Mis on dispersioonanalüüsi tulemuste täpsustus?

17-2. Millal kasutatakse konkretiseerimiseks Q-Tukey kriteeriumi?

17-3. Millised on esimese, teise ja nii edasi tellimuste erinevused?

17-4. Kuidas leida Tukey Q testi tegelikku väärtust?

17-5 Milliseid hüpoteese esitatakse iga erinevuse kohta?

17-6. Millest sõltub Tukey Q kriteeriumi tabeliväärtus?

17-7. Mis on nullhüpotees, kui rühmitamise atribuudi tasemed on valim?

17-8 Kuidas jaotatakse variatsioonide kogusumma, kui andmed on grupeeritud kahe kriteeriumi järgi?

17-9. Sel juhul tõstetakse esile korduste variatsioone (
) ?

Kokkuvõte

Kaalutud mehhanism dispersioonanalüüsi tulemuste täpsustamiseks võimaldab teil anda sellele täieliku ilme. Tukey Q testi kasutamisel tuleb tähelepanu pöörata piirangutele. Materjal kirjeldas ka ANOVA mudelite klassifitseerimise aluspõhimõtteid. Tuleb rõhutada, et need on vaid põhimõtted. Iga mudeli omaduste üksikasjalik uurimine nõuab eraldi sügavamat uurimist.

Testiülesanded loengu jaoks

Milliste statistiliste tunnuste kohta on dispersioonanalüüsis hüpoteesid?

    Suhteliselt kahe variatsiooniga

    Suhteliselt ühe keskmisega

    Võrreldes mõne keskmisega

    Ühe variandi suhtes

Mis on alternatiivse hüpoteesi sisu dispersioonanalüüsis?

    Võrreldavad variatsioonid ei ole üksteisega võrdsed

    Kõik võrreldud keskmised pole võrdsed.

    Vähemalt kaks üldist keskmist pole võrdsed

    Rühmadevaheline dispersioon on suurem kui rühmasisene

Millised on dispersioonanalüüsis kõige sagedamini kasutatavad olulisuse tasemed?

Kui rühmasisene variatsioon on suurem kui rühmadevaheline variatsioon, kas ANOVA peaks jätkama või kohe nõustuma H0 või AN-ga?

1. Kas peaksite jätkama nõutavate variatsioonidega?

2. Tuleb nõustuda H0 -ga

3. Nõustuge ON -ga

Kui leiti, et grupisisene dispersioon on võrdne rühmadevahelise dispersiooniga, siis millele peaks järgnema dispersioonanalüüs?

    Nõus üldiste vahendite võrdsuse nullhüpoteesiga

    Nõustuge alternatiivse hüpoteesiga vähemalt üksteisest ebavõrdse vahendite paari olemasolu kohta

Milline dispersioon peaks lugejas alati olema F-Fisheri testi arvutamisel?

    Ainult rühmasiseselt

    Igal juhul rühmadevaheline

    Rühmadevaheline, kui see on rohkem rühmasisest

Milline peaks olema F-Fisheri kriteeriumi tegelik väärtus?

    Alati alla 1

    Alati suurem kui 1

    Võrdne või suurem kui 1

Millest sõltub F-Fisheri kriteeriumi tabeliväärtus?

1. Alates aktsepteeritud olulisuse tasemest

2. Kogu variatsiooni vabadusastmete arvust

3. Rühmadevaheliste variatsioonide vabadusastmete arvust

4. Rühmasisese varieeruvuse vabadusastmete arvu kohta

5. F-Fisheri kriteeriumi tegeliku väärtuse väärtusest?

Vaatluste arvu suurenemine igas rühmas võrdsete erinevustega suurendab tõenäosust nõustuda ……

1 nullhüpotees

2. Alternatiivne hüpotees

3. Ei mõjuta nii null- kui ka alternatiivsete hüpoteeside aktsepteerimist

Mis mõte on dispersioonanalüüsi tulemusi täpsustada?

    Selgitamaks, kas dispersioonide arvutused on õigesti tehtud

    Tehke kindlaks, millised üldistest keskmistest osutusid üksteisega võrdseks

    Selgitage, millised üldised keskmised ei ole üksteisega võrdsed

Kas väide vastab tõele: "dispersioonanalüüsi tulemuste täpsustamisel osutusid kõik üldised keskmised üksteisega võrdseks"

    Võib olla õige ja vale

    Ei vasta tõele, see võib olla tingitud arvutuste vigadest

Kas dispersioonanalüüsi täpsustades on võimalik jõuda järeldusele, et kõik üldised keskmised pole üksteisega võrdsed?

1. See on võimalik

2. Võimalik, et erandjuhtudel

3. See on põhimõtteliselt võimatu.

4. Võimalik ainult siis, kui teete arvutustes vigu

Kui nullhüpotees võeti vastu F-Fisheri kriteeriumi järgi, kas on vaja täpsustada dispersioonanalüüsi?

1. Vajalik

2. Pole nõutav

3. ANOVA analüütiku äranägemisel

Millisel juhul kasutatakse dispersioonanalüüsi tulemuste täpsustamiseks Tukey testi?

1. Kui vaatluste arv rühmade (proovide) kaupa on sama

2. Kui vaatluste arv rühmade (proovide) kaupa on erinev

3. Kui on nii võrdse kui ka ebavõrdse arvuga proove

laiskus

Mis on NDS, kui täpsustatakse dispersioonanalüüsi tulemusi Tukey testi põhjal?

1. Tooge keskmine viga kriteeriumi tegeliku väärtuse järgi

2. Keskmise vea korrutis kriteeriumi tabeli väärtuse järgi

3. Iga erinevuse suhe proovi keskmiste vahel

keskmine viga

4. Valimi keskmiste erinevus

Kui valim on jagatud kahe tunnuse järgi rühmadesse, siis kui palju allikaid tuleks jagada vähemalt tunnuse koguvariatsiooniks?

Kui valimite (rühmade) vaatlused sõltuvad, siis mitmesse allikasse tuleks kogu variatsioon jagada (rühmitamise atribuut üks)?

Mis on rühmadevahelise varieerumise allikas (põhjus)?

    Õnnemäng

    Õnnemängu ja teguri kombineeritud tegevus

    Teguri (te) tegevus

    Uurige seda pärast dispersioonanalüüsi

Mis on grupisisese varieerumise allikas (põhjus)?

1 õnnemäng

2. Õnnemängu ja teguri kombineeritud tegevus

3. Teguri (te) toime

4. See selgub pärast dispersioonanalüüsi

Millist lähteandmete teisendamise meetodit kasutatakse, kui iseloomulikud väärtused on väljendatud murdosades?

    Logaritm

    Juure väljavõtmine

    Phi transformatsioon

Loeng 8 Korrelatsioon

annotatsioon

Kõige olulisem meetod märkide vahelise seose uurimiseks on korrelatsioonimeetod. See loeng paljastab selle meetodi sisu, lähenemisviise selle seose analüütilisele väljendamisele. Erilist tähelepanu pööratakse sellistele spetsiifilistele näitajatele nagu suhtlustiheduse näitajad

Märksõnad

Korrelatsioon. Vähim ruudu meetod. Regressioonikoefitsient. Määramise ja korrelatsiooni koefitsiendid.

Lahendatud probleemid

    Funktsionaalne ja korrelatsiooniline seos

    Suhtluse korrelatsioonivõrrandi loomise etapid. Võrrandikoefitsientide tõlgendamine

    Tiheduse näitajad

    Valitud kommunikatsiooninäitajate hindamine

Moodulühik 1 Korrelatsiooni olemus. Suhtluse korrelatsioonivõrrandi koostamise etapid, võrrandi koefitsientide tõlgendamine.

Moodulüksuse õppimise eesmärk ja eesmärgid 1 seisneb korrelatsiooni tunnuste mõistmises. kommunikatsioonivõrrandi konstrueerimise algoritmi valdamine, võrrandi koefitsientide sisu mõistmine.

      Korrelatsiooni olemus

Looduslikes ja sotsiaalsetes nähtustes on kahte tüüpi seoseid - funktsionaalne ühendus ja korrelatsioonühendus. Funktsionaalses seoses vastab iga argumendi väärtus rangelt määratletud (ühele või mitmele) funktsiooni väärtusele. Funktsionaalse seose näiteks on ümbermõõdu ja raadiuse suhe, mida väljendab võrrand
... Igale raadiuse väärtusele r vastab ühele ümbermõõdu väärtusele L . Korrelatsiooni korral vastab faktorite atribuudi igale väärtusele mitu efektiivse atribuudi mitte päris kindlat väärtust. Korrelatsioonide näideteks on seos inimese kaalu (tegelik tunnus) ja pikkuse (faktoorne omadus) vahel, seos kasutatud väetise koguse ja saagikuse vahel, hinna ja pakutava toote koguse vahel. Korrelatsiooni tekkimise allikaks on asjaolu, et reeglina sõltub tegelikus elus efektiivse atribuudi väärtus paljudest teguritest, sealhulgas nendest, mille muutumine on juhuslik. Näiteks sõltub inimese sama kaal vanusest, soost., Toitumisest, ametist ja paljudest muudest teguritest. Kuid samas on ilmne, et kasv on üldiselt määrav tegur. Neid asjaolusid silmas pidades tuleks korrelatsiooni määratleda mittetäieliku seosena, mida saab kindlaks teha ja hinnata ainult keskmiselt suure hulga vaatluste korral.

1.2 Suhtluse korrelatsioonivõrrandi koostamise etapid.

Nagu funktsionaalset suhet, väljendab korrelatsiooni suhtevõrrand. Selle ehitamiseks peate järjepidevalt läbima järgmised sammud (etapid).

Esiteks tuleks mõista põhjus-tagajärg seoseid, välja selgitada märkide alluvus, see tähendab, millised neist on põhjused (tegurimärgid) ja millised tagajärjed (tõhusad märgid). Põhjuslikud seosed tunnuste vahel määratakse kindlaks subjekti teooriaga, kus kasutatakse korrelatsioonimeetodit. Näiteks "inimese anatoomia" teadus võimaldab teil öelda, mis on kaalu ja pikkuse vahelise seose allikas, milline neist märkidest on tegur, mille tulemuseks on "majandusteaduse" teadus, mis näitab nende suhete loogikat. hind ja pakkumine, määrab kindlaks, mis ja mis etapis on põhjus ja mis on tagajärg ... Ilma sellise esialgse teoreetilise põhjenduseta on tulevikus saadud tulemuste tõlgendamine keeruline ja võib mõnikord viia absurdsete järeldusteni.

Olles kindlaks teinud põhjusliku seose olemasolu, tuleks need seosed vormistada, st väljendada suhtlusvõrrandi abil, valides kõigepealt võrrandi tüübi. Võrrandi tüübi valimiseks võib soovitada mitmeid tehnikaid. Võite pöörduda selle aine teooria poole, kus kasutatakse korrelatsioonimeetodit, näiteks võib "agrokeemia" teadus olla juba saanud vastuse küsimusele, millist võrrandit tuleks seose väljendamiseks kasutada: saagikus - väetised. Kui sellist vastust pole, peaksite võrrandi valimiseks kasutama mõningaid empiirilisi andmeid, neid nõuetekohaselt töödeldes. Kohe tuleb öelda, et olles valinud empiiriliste andmete põhjal võrranditüübi, tuleb selgelt mõista, et seda tüüpi võrrandit saab kasutada kasutatud andmete seose kirjeldamiseks. Nende andmete töötlemise põhitehnika on graafikute koostamine, kui teguri atribuudi väärtused on joonistatud abstsissiteljele ja efektiivse atribuudi võimalikud väärtused ordinaatteljele. Kuna definitsiooni järgi vastab teguri atribuudi sama väärtus efektiivse atribuudi määratlemata väärtuste kogumile, saame ülaltoodud toimingute tulemusena teatud punktide kogumi, mida nimetatakse korrelatsiooniväljaks. Korrelatsioonivälja üldine vaade võimaldab mitmel juhul teha eelduse võrrandi võimaliku vormi kohta. Kaasaegse arvutitehnoloogia arenguga on võrrandi valimise üks peamisi meetodeid erinevat tüüpi võrrandite loetlemine , kuigi parim võrrand on see, mis tagab kõrgeima määramiskoefitsiendi, kõne, mida arutatakse allpool. Enne arvutustega jätkamist on vaja kontrollida, mil määral võrrandi koostamisel kasutatud empiirilised andmed vastavad teatud nõuetele. Nõuded on seotud faktorite omaduste ja andmekogumiga. Faktorimärgid, kui neid on mitu, peaksid olema üksteisest sõltumatud. Mis puutub tervikusse, siis esiteks peab see olema homogeenne

(homogeensuse mõistet käsitleti varem) ja teiseks üsna suur. Iga teguri tunnus peaks hõlmama vähemalt 8-10 vaatlust.

Pärast võrrandi valimist on järgmine samm võrrandi koefitsientide arvutamine. Võrrandikoefitsiente arvutatakse kõige sagedamini väikseimate ruutude meetodil. Korrelatsiooni seisukohast seisneb väikseimate ruutude meetodi kasutamine võrrandi selliste koefitsientide saamises, et
= min, see tähendab, et efektiivse näitaja tegelike väärtuste kõrvalekallete ruutude summa ( ) arvutatud arvutustest vastavalt võrrandile ( ) oli minimaalne väärtus. See nõue realiseerub, ehitades ja lahendades tuntud nn normaalvõrrandite süsteemi. Kui vahelise korrelatsiooni võrrandina y ja x valitakse sirge võrrand
, kus tavaliste võrrandite süsteem, nagu teate, on järgmine:

Selle süsteemi lahendamine seoses a ja b , saame koefitsientide vajalikud väärtused. Koefitsientide arvutamise õigsust kontrollib võrdsus

Milleks kasutatakse dispersioonanalüüsi? Dispersioonanalüüsi eesmärk on uurida mis tahes kvalitatiivse või kvantitatiivse teguri olulise mõju olemasolu või puudumist uuritava efektiivse tunnuse muutustele. Selleks jagatakse tegur, mis eeldatavasti omab või ei oma olulist mõju, gradatsiooniklassidesse (teisisõnu rühmadesse) ja määratakse kindlaks, kas teguri mõju on sama, uurides olulisust vastavate andmekogumite keskmiste vahel tegurite gradatsioonidele. Näited: uuritakse ettevõtte kasumi sõltuvust kasutatud tooraine tüübist (siis gradatsiooniklassid on tooraine liigid), tootmisüksuse tootmiskulude sõltuvust ettevõtte osakonna suurusest (siis gradatsiooniklassid on jaotuse suuruse tunnused: suur, keskmine, väike).

Hindamisklasside (rühmade) minimaalne arv on kaks. Lõpetamisklassid võivad olla kvalitatiivsed või kvantitatiivsed.

Miks nimetatakse dispersioonanalüüsi dispersioonanalüüsiks? Dispersioonianalüüs uurib kahe dispersiooni suhet. Nagu me teame, on dispersioon iseloomulik andmete hajumisele keskmise ümber. Esimene neist on teguri mõjuga seletatav dispersioon, mis iseloomustab väärtuste hajumist teguri (rühmade) gradatsioonide vahel kõigi andmete keskmise ümber. Teine on seletamatu dispersioon, mis iseloomustab andmete hajumist gradatsioonides (rühmades) rühmade endi keskmiste ümber. Esimest dispersiooni võib nimetada rühmadevaheliseks ja teist rühmasiseseks. Nende erinevuste suhet nimetatakse tegelikuks Fisheri suhtarvuks ja seda võrreldakse Fisheri suhte kriitilise väärtusega. Kui tegelik Fisheri suhe on kriitilisest suurem, siis keskmise astme astmed erinevad üksteisest ja uuritav tegur mõjutab oluliselt andmete muutumist. Kui vähem, siis ei erine keskmised astmelised hinded üksteisest ja tegur ei oma olulist mõju.

Kuidas sõnastatakse, aktsepteeritakse ja lükatakse hüpoteesid ANOVA -s tagasi? Dispersioonanalüüsis määratakse kindlaks ühe või mitme teguri kogumõju erikaal. Teguri mõju olulisus määratakse hüpoteeside testimisega:

  • H0 : μ 1 = μ 2 = ... = μ a, kus a- gradatsiooniklasside arv - kõigil gradatsiooniklassidel on üks keskmine väärtus,
  • H1 : Mitte kõik μ i võrdne - mitte kõigil gradatsiooniklassidel pole sama keskmist väärtust.

Kui teguri mõju ei ole märkimisväärne, on ka selle teguri gradatsiooniklasside erinevus ebaoluline ja dispersioonanalüüsi käigus nullhüpotees H0 ei lükata tagasi. Kui teguri mõju on märkimisväärne, siis nullhüpotees H0 tagasi lükatud: mitte kõigil gradatsiooniklassidel pole sama keskmist, see tähendab gradatsiooniklasside võimalike erinevuste hulgas üks või mitu olulist.

Veel mõned dispersioonanalüüsi mõisted. ANOVA statistikakompleks on empiiriliste andmete tabel. Kui kõikides gradatsiooniklassides on sama arv valikuid, siis nimetatakse statistilist kompleksi homogeenseks (homogeenseks), kui valikute arv on erinev - heterogeenne (heterogeenne).

Sõltuvalt hinnatud tegurite arvust eristatakse ühesuunalist, kahesuunalist ja mitmemõõtmelist dispersioonanalüüsi.

Ühesuunaline dispersioonianalüüs: meetodi olemus, valemid, näited

Meetodi olemus, valemid

põhineb asjaolul, et statistilise kompleksi kõrvalekallete ruutude summa saab jagada komponentideks:

SS = SS a + SS e,

SS

SSa a kõrvalekallete ruutude summa,

SSe- seletamatu kõrvalekallete ruutude summa või veahälvete ruutude summa.

Kui läbi ni määrake valikute arv igas astmes (rühm) ja a on teguri (rühmade) gradatsioonide koguarv, siis on vaatluste koguarv ja saadakse järgmised valemid:

kõrvalekallete ruutude koguarv: ,

tegurile omistatud a kõrvalekallete ruutude summa: ,

kõrvalekallete ruutude seletamatu summa või veahälvete ruutude summa: ,

- vaatluste kogu keskmine,

(Grupp).

Pealegi,

kus on teguri (grupi) gradatsiooni dispersioon.

Statistilise kompleksi andmete ühesuunalise dispersioonanalüüsi tegemiseks on vaja leida tegelik Fisheri suhe - teguri (rühmadevaheline) mõjuga seletatav dispersiooni suhe ja seletamatu dispersioon (rühmasisene ):

ja võrrelge seda Fisheri kriitilise väärtusega.

Variatsioonid arvutatakse järgmiselt:

Variatsioon selgitas,

Seletamatu variatsioon

va = a − 1 - selgitatud dispersiooni vabadusastmete arv,

ve = na - seletamatute erinevuste vabadusastmete arv,

v = n

Fisheri suhte kriitilise väärtuse koos teatud olulisuse taseme ja vabadusastmete väärtustega saab leida statistilistest tabelitest või arvutada MS Excel F funktsiooni OBR abil (allolev joonis, selle suurendamiseks klõpsake seda vasakul hiire nupp).


Funktsioon nõuab järgmiste andmete sisestamist:

Tõenäosus - olulisuse tase α ,

Vabadusastmed1 on selgitatud dispersiooni vabadusastmete arv va,

Vabadusastmed2 on seletamatu dispersiooni vabadusastmete arv ve.

Kui Fisheri suhte tegelik väärtus on suurem kui kriitiline (), lükatakse nullhüpotees olulisuse tasemega tagasi α ... See tähendab, et tegur mõjutab oluliselt andmete muutumist ja andmed sõltuvad tegurist tõenäosusega P = 1 − α .

Kui Fisheri suhte tegelik väärtus on väiksem kui kriitiline (), siis ei saa nullhüpoteesi olulisuse tasemega tagasi lükata α ... See tähendab, et tegur ei mõjuta andmeid tõenäosusega oluliselt P = 1 − α .

Ühesuunaline dispersioonianalüüs: näited

Näide 1. Tuleb välja selgitada, kas kasutatud tooraine liik mõjutab ettevõtte kasumit. Teguri kuues gradatsiooniklassis (rühmad) (1. tüüp, 2. tüüp jne) kogutakse andmeid 1000 ühiku tootmise kasumi kohta miljonites rublades 4 aasta jooksul.

Tooraine tüüp2014 2015 2016 2017
1.7,21 7,55 7,29 7,6
27,89 8,27 7,39 8,18
3.7,25 7,01 7,37 7,53
47,75 7,41 7,27 7,42
57,7 8,28 8,55 8,6
67,56 8,05 8,07 7,84
Keskmine
Dispersioon
7,413 0,0367
7,933 0,1571
7,290 0,0480
7,463 0,0414
8,283 0,1706
7,880 0,0563

a= 6 ja igas klassis (rühmas) ni = 4 vaatlus. Vaatluste koguarv n = 24 .

Vabadusastmete arv:

va = a − 1 = 6 − 1 = 5 ,

ve = na = 24 − 6 = 18 ,

v = n − 1 = 24 − 1 = 23 .

Arvutame variatsioonid:

.

.

Kuna Fischeri tegelik suhtumine on kriitilisem:

olulisuse tasemega α = 0,05, järeldame, et ettevõtte kasum erineb oluliselt tootmises kasutatava tooraine tüübist.

Või, mis on sama, lükkame tagasi peamise hüpoteesi vahendite võrdsuse kohta kõikides tegurite gradatsiooni klassides (rühmad).

Äsja vaadeldud näites oli igal teguriklassi klassil sama palju võimalusi. Kuid nagu sissejuhatuses mainitud, võib valikute arv olla erinev. Ja see ei raskenda kuidagi ANOVA protseduuri. See on järgmine näide.

Näide 2. Tuleb välja selgitada, kas tootmisüksuse tootmiskulud sõltuvad ettevõtte jagunemise suurusest. Tegur (ühiku suurus) on jagatud kolme klassi (gruppi): väike, keskmine, suur. Nendele rühmadele vastavad üldistatud andmed sama tüüpi toote ühiku tootmiskulude kohta teatud aja jooksul.

väikekeskminesuur
48 47 46
50 61 57
63 63 57
72 47 55
43 32
59 59
58
Keskmine58,6 54,0 51,0
Dispersioon128,25 65,00 107,60

Tegurite gradatsiooniklasside arv (rühmad) a= 3, vaatluste arv klassides (rühmades) n1 = 4 , n2 = 7 , n3 = 6 ... Vaatluste koguarv n = 17 .

Vabadusastmete arv:

va = a − 1 = 2 ,

ve = na = 17 − 3 = 14 ,

v = n − 1 = 16 .

Arvutame kõrvalekallete ruutude summa:

Arvutame variatsioonid:

,

.

Arvutame tegeliku Fisheri suhte:

.

Fischeri kriitiline suhe:

Kuna Fisheri suhte tegelik väärtus on väiksem kui kriitiline:, järeldame, et ettevõtte osakonna suurus ei mõjuta oluliselt tootmiskulusid.

Või, mis on sama, tõenäosusega 95%, aktsepteerime peamist hüpoteesi, et sama toote ühiku keskmine tootmiskulu ettevõtte väikestes, keskmistes ja suurtes osakondades ei erine oluliselt.

Ühesuunaline ANOVA MS Excelis

Ühesuunalist dispersiooni analüüsi saab teha MS Exceli protseduuri abil Ühesuunaline ANOVA... Kasutame seda näite 1 andmete analüüsimiseks kasutatud tooraine liigi ja ettevõtte kasumi vahelise seose kohta.

Teenuse / andmete analüüs ja valige analüüsivahend Ühesuunaline ANOVA.

Aknas Sisestusintervall me näitame andmeala (meie puhul on see $ A $ 2: $ E $ 7). Näitame, kuidas tegur on rühmitatud - veergude või ridade (meie puhul ridade) järgi. Kui esimene veerg sisaldab teguriklasside nimesid, märkige ruut Esimese veeru sildid... Aknas Alfa näidata olulisuse taset α = 0,05 .

Teine tabel - dispersioonianalüüs - sisaldab andmeid tegurite väärtuste kohta rühmade vahel ja rühmasiseselt ning kogusummasid. Need on ruuthälvete (SS), vabadusastmete arvu (df), dispersiooni (MS) summa. Viimased kolm veergu sisaldavad Fisheri suhte tegelikku väärtust (F), p-taset (P-väärtus) ja Fisheri suhte kriitilist väärtust (F crit).

PRL F P-väärtus F krit
0,58585 6,891119 0,000936 2,77285
0,085017

Kuna Fisheri suhte tegelik väärtus (6,89) on suurem kui kriitiline väärtus (2,77), lükkame 95% tõenäosusega tagasi nullhüpoteesi keskmise tootlikkuse võrdsuse kohta igat liiki tooraine kasutamisel, st järeldame, et kasutatud tooraine liik mõjutab kasumiettevõtteid.

Kahepoolne dispersioonianalüüs ilma kordusteta: meetodi olemus, valemid, näide

Kahepoolse dispersioonanalüüsi abil kontrollitakse tõhusa tunnuse võimalikku sõltuvust kahest tegurist - A ja B... Siis a- teguri gradatsioonide arv A ja b- teguri gradatsioonide arv B... Statistilises kompleksis jagatakse jääkide ruutude summa kolmeks komponendiks:

SS = SS a + SS b + SS e,

- kõrvalekallete ruutude kogusumma,

- seletatakse teguri mõjuga A kõrvalekallete ruutude summa,

- seletatakse teguri mõjuga B kõrvalekallete ruutude summa,

- vaatluste kogu keskmine,

Vaatluste keskmine teguri igas gradatsioonis A ,

B .

A ,

Dispersiooni selgitab teguri mõju B ,

va = a − 1 A ,

vb = b − 1 - hajumise vabadusastmete arv, mis on seletatav teguri mõjuga B ,

ve = ( a − 1)(b − 1)

v = ab- 1 - vabadusastmete koguarv.

Kui tegurid ei sõltu üksteisest, esitatakse tegurite olulisuse kindlakstegemiseks kaks nullhüpoteesi ja vastavad alternatiivsed hüpoteesid:

teguri jaoks A :

H0 : μ 1A = μ 2A = ... = μ aA,

H1 : Mitte kõik μ iA on võrdsed;

teguri jaoks B :

H0 : μ 1B = μ 2B = ... = μ aB,

H1 : Mitte kõik μ iB on võrdsed.

A

Teguri mõju kindlaksmääramiseks B, tuleb Fischeri tegelikku suhtumist võrrelda Fischeri kriitilise hoiakuga.

α P = 1 − α .

α P = 1 − α .

Kahepoolne dispersioonianalüüs ilma kordusteta: näide

Näide 3. Teavet antakse keskmise kütusekulu kohta 100 kilomeetri kohta liitrites, sõltuvalt mootori mahust ja kütuse tüübist.

Tuleb kontrollida, kas kütusekulu sõltub mootori suurusest ja kütuse tüübist.

Lahendus. Teguri jaoks A klasside arv a= 3, teguri jaoks B klasside arv b = 3 .

Arvutame kõrvalekallete ruutude summa:

,

,

,

.

Vastavad variatsioonid:

,

,

.

A ... Kuna tegelik Fischeri suhe on kriitilisest väiksem, aktsepteerime hüpoteesi, et mootori töömaht ei mõjuta 95% tõenäosusega kütusekulu. Kui aga valida olulisuse tase α = 0,1, siis Fisheri suhte tegelik väärtus ja seejärel 95% tõenäosusega võime eeldada, et mootori töömaht mõjutab kütusekulu.

Fischeri tegelik suhe teguriks B , Fisheri suhte kriitiline väärtus: ... Kuna tegelik Fischeri suhe on suurem kui Fisheri suhte kriitiline väärtus, eeldame 95% tõenäosusega, et kütusetüüp mõjutab selle tarbimist.

Kahepoolne dispersioonianalüüs ilma kordusteta MS Excelis

Kahepoolse dispersiooni analüüsi ilma kordusteta saab teha MS Exceli protseduuri abil. Kasutame seda, et analüüsida näite 3 andmeid kütuseliigi ja selle tarbimise vahelise seose kohta.

Menüüs MS Excel täitke käsk Teenuse / andmete analüüs ja valige analüüsivahend Kahepoolne dispersioonianalüüs ilma kordusteta.

Täidame andmed samamoodi nagu ühepoolse dispersioonanalüüsi puhul.


Protseduuri tulemusena kuvatakse kaks tabelit. Esimene tabel on kogusummad. See sisaldab andmeid kõigi tegurite gradatsiooni klasside kohta: vaatluste arv, koguväärtus, keskmine väärtus ja dispersioon.

Teine tabel - dispersioonianalüüs - sisaldab andmeid variatsiooniallikate kohta: hajumine ridade vahel, hajumine veergude vahel, vigade hajumine, kogu hajumine, ruutude hälvete summa (SS), vabadusastmete arv (df), dispersioon (MS ). Viimased kolm veergu sisaldavad Fisheri suhte tegelikku väärtust (F), p-taset (P-väärtus) ja Fisheri suhte kriitilist väärtust (F crit).

PRL F P-väärtus F krit
3,13 5,275281 0,075572 6,94476
8,043333 13,55618 0,016529 6,944276
0,593333

Faktor A(mootori töömaht) on rühmitatud ridadesse. Kuna tegelik Fischeri suhe 5,28 on väiksem kui kriitiline 6,94, eeldame 95% tõenäosusega, et kütusekulu ei sõltu mootori mahust.

Faktor B(kütusetüüp) on rühmitatud veergudesse. Tegelik Fischeri suhe 13,56 on suurem kui kriitiline 6,94, seetõttu eeldame 95% tõenäosusega, et kütusekulu sõltub selle tüübist.

Kahepoolne dispersioonianalüüs kordustega: meetodi olemus, valemid, näide

Kasutatakse kahesuunalist dispersiooni analüüsi kordustega, et kontrollida mitte ainult efektiivse tunnuse võimalikku sõltuvust kahest tegurist - A ja B, aga ka tegurite võimalikku koostoimet A ja B... Siis a- teguri gradatsioonide arv A ja b- teguri gradatsioonide arv B, r- korduste arv. Statistilises kompleksis jagatakse jääkide ruutude summa neljaks komponendiks:

SS = SS a + SS b + SS ab + SS e,

- kõrvalekallete ruutude kogusumma,

- seletatakse teguri mõjuga A kõrvalekallete ruutude summa,

- seletatakse teguri mõjuga B kõrvalekallete ruutude summa,

- seletatakse tegurite koosmõju mõjuga A ja B kõrvalekallete ruutude summa,

- seletamatu kõrvalekallete ruutude summa või veahälvete ruutude summa,

- vaatluste kogu keskmine,

- vaatluste keskmine teguri igal astmel A ,

- vaatluste keskmine arv teguri igal astmel B ,

Keskmine vaatluste arv igas tegurite gradatsiooni kombinatsioonis A ja B ,

n = abr- vaatluste koguarv.

Variatsioonid arvutatakse järgmiselt:

Dispersiooni selgitab teguri mõju A ,

Dispersiooni selgitab teguri mõju B ,

- dispersioon, mis on seletatav tegurite koosmõjuga A ja B ,

- vea seletamatu dispersioon või dispersioon,

va = a − 1 - hajumise vabadusastmete arv, mis on seletatav teguri mõjuga A ,

vb = b − 1 - hajumise vabadusastmete arv, mis on seletatav teguri mõjuga B ,

vab = ( a − 1)(b − 1) - dispersioonivabadusastmete arv, mis on seletatav tegurite koosmõjuga A ja B ,

ve = ab(r − 1) - vea seletamatu dispersiooni või dispersiooni vabadusastmete arv,

v = abr- 1 - vabadusastmete koguarv.

Kui tegurid on üksteisest sõltumatud, esitatakse tegurite olulisuse määramiseks kolm nullhüpoteesi ja vastavad alternatiivsed hüpoteesid:

teguri jaoks A :

H0 : μ 1A = μ 2A = ... = μ aA,

H1 : Mitte kõik μ iA on võrdsed;

teguri jaoks B :

Tegurite koosmõju mõju määramiseks A ja B, tuleb Fischeri tegelikku suhtumist võrrelda Fischeri kriitilise hoiakuga.

Kui tegelik Fisheri suhe on suurem kui kriitiline Fisheri suhe, tuleks nullhüpotees olulisuse tasemega tagasi lükata α ... See tähendab, et tegur mõjutab andmeid oluliselt: andmed sõltuvad tegurist tõenäosusega P = 1 − α .

Kui tegelik Fischeri suhe on väiksem kui kriitiline Fisheri suhe, tuleks nullhüpotees aktsepteerida olulisuse tasemega α ... See tähendab, et tegur ei mõjuta andmeid tõenäosusega oluliselt P = 1 − α .

Kahepoolne kordus ANOVA: näide

tegurite koosmõju kohta A ja B: Fischeri tegelik suhtumine on vähem kui kriitiline, seetõttu pole reklaamikampaania ja konkreetse poe vaheline suhtlus hädavajalik.

Kahepoolne dispersiooni analüüs kordustega MS Excelis

Kahepoolse dispersiooni analüüsi koos kordustega saab teha MS Exceli protseduuri abil. Kasutame seda, et analüüsida näite 4 andmeid kaupluste tulude ja konkreetse poe ning reklaamikampaania valiku vahelise seose kohta.

Menüüs MS Excel täitke käsk Teenuse / andmete analüüs ja valige analüüsivahend Kahepoolne dispersioonianalüüs kordustega.

Täidame andmed samamoodi nagu kahekordse dispersioonianalüüsi korral ilma kordusteta, lisades, et korduste arv tuleb sisestada valikuakna ridade arvule.

Protseduuri tulemusena kuvatakse kaks tabelit. Esimene tabel koosneb kolmest osast: kaks esimest vastavad mõlemale reklaamikampaaniale, kolmas sisaldab mõlema reklaamikampaania andmeid. Tabeli veerud sisaldavad teavet teise teguri - poe - kõigi gradatsiooniklasside kohta: vaatluste arv, koguväärtus, keskmine väärtus ja dispersioon.

Teine tabel sisaldab andmeid ruutude hälvete (SS), vabadusastmete arvu (df), dispersiooni (MS), Fisheri suhte tegeliku väärtuse (F), p-taseme (P-väärtus) ja Fisheri suhte kriitiline väärtus (F crit) erinevate variatsiooniallikate puhul: kaks tegurit, mis on esitatud ridades (valim) ja veergudes, tegurite koostoime, vead (sees) ja üldnäitajad (kokku).

PRL F P-väärtus F krit
8,013339 0,500252 0,492897 4,747221
189,1904 11,81066 0,001462 3,88529
6,925272 0,432327 0,658717 3,88529
16,01861

Teguri jaoks B Fischeri tegelik suhe on kriitilisest suurem, seetõttu on 95% tõenäosusega tulud kauplustes märkimisväärselt erinevad.

Tegurite koosmõju jaoks A ja B Fischeri tegelik suhtumine on kriitilisest väiksem, mistõttu 95% tõenäosusega ei ole reklaamikampaania ja konkreetse poe suhtlus märkimisväärne.

Kõik seotud teemad "Matemaatiline statistika"

ANOVA(ladina keelest Dispersio - dispersion / inglise keeles Analysis Of Variance - ANOVA) kasutatakse ühe või mitme kvalitatiivse muutuja (teguri) mõju uurimiseks ühele sõltuvale kvantitatiivsele muutujale (vastus).

Dispersiooni analüüs põhineb eeldusel, et mõnda muutujat võib pidada põhjuseks (tegurid, sõltumatud muutujad): ja teisi tagajärgedeks (sõltuvad muutujad). Sõltumatuid muutujaid nimetatakse mõnikord reguleeritavateks teguriteks just seetõttu, et katses on uurijal võimalus neid varieerida ja saadud tulemust analüüsida.

Peamine eesmärk dispersiooni analüüs(ANOVA) on uuring keskmiste erinevuste olulisuse kohta, kui võrrelda (analüüsida) dispersioone. Jagades kogu dispersiooni mitmeks allikaks, on võimalik võrrelda rühmadevahelise erinevuse põhjustatud dispersiooni grupisisese varieeruvuse põhjustatud dispersiooniga. Kui nullhüpotees vastab tõele (keskväärtuste võrdsuse kohta mitmetes üldpopulatsioonist valitud vaatlusrühmades), peaks grupisisese varieeruvusega seotud dispersiooni hinnang olema lähedane rühmadevahelise dispersiooni hinnangule. Kui võrdlete lihtsalt kahe proovi keskmisi, annab ANOVA sama tulemuse kui tavaline sõltumatute proovide t-test (kui võrdlete kahte sõltumatut objektide või vaatluste rühma) või sõltuvate proovide t-test (kui võrrelda kaks muutujat samal ja samal objektide või vaatluste kogumil).

Dispersioonianalüüsi olemus on konkreetsete tegurite mõjul jaotada uuritava tunnuse kogu dispersioon üksikuteks komponentideks ja katsetada hüpoteese nende tegurite mõju olulisuse kohta uuritaval tunnusel. Võrreldes dispersiooni komponente üksteisega Fisheri F-testi abil, on võimalik kindlaks teha, milline osa efektiivse tunnuse üldisest varieeruvusest tuleneb reguleeritud tegurite toimest.

Dispersioonanalüüsi lähtematerjaliks on kolme või enama valimi uurimise andmed: mis võivad olla kas võrdsed või ebavõrdsed, nii ühendatud kui ka ebajärjekindlad. Avastatud kontrollitud tegurite arvu järgi saab dispersioonianalüüsi teha ühemõõtmeline(sel juhul uuritakse ühe teguri mõju katse tulemustele), kahefaktoriline(uurides kahe teguri mõju) ja multifaktoriaalne(võimaldab hinnata mitte ainult iga teguri mõju eraldi, vaid ka nende koostoimet).

ANOVA kuulub parameetriliste meetodite rühma ja seetõttu tuleks seda kasutada ainult siis, kui on tõestatud, et jaotus on normaalne.

ANOVA-d kasutatakse juhul, kui sõltuvat muutujat mõõdetakse suhete, intervallide või järjekorra alusel ning mõjutavad muutujad on olemuselt mittearvulised (nimetusskaala).

Näited ülesannetest

Probleemides, mida lahendatakse dispersioonanalüüsiga, on arvuline vastus, mida mõjutavad mitmed nominaalse iseloomuga muutujad. Näiteks mitut tüüpi veiste toitmine või kaks nende pidamise viisi jne.

Näide 1: Nädala jooksul tegutses kolmes erinevas kohas mitu apteegikioskit. Tulevikus saame jätta ainult ühe. Tuleb kindlaks teha, kas kioskites olevate ravimite müügimahtude vahel on statistiliselt oluline erinevus. Kui jah, siis valime kioski, mille keskmine igapäevane müügimaht on suurim. Kui müügimahu erinevus osutub statistiliselt ebaoluliseks, siis peaksid kioski valimisel olema aluseks muud näitajad.

Näide 2: Rühma vahendite kontrastide võrdlus. Seitse poliitilist eelarvamust on järjestatud äärmiselt liberaalsest kuni väga konservatiivseni ning lineaarset kontrasti kasutatakse selleks, et testida, kas on nullist erinev suundumus kõrgemate grupi keskmiste väärtuste poole- st kas gruppide vaatamisel on keskmine vanus märkimisväärselt lineaarselt kasvanud käsk liberaalilt konservatiivsele.

Näide 3: Kahepoolne dispersiooni analüüs. Lisaks poe suurusele mõjutab toote müügi arvu sageli ka riiulite asukoht tootega. See näide sisaldab nädala müüginumbreid nelja riiulipaigutuse ja kolme poesuuruse kohta. Analüüsi tulemused näitavad, et mõlemad tegurid - tootega riiulite asukoht ja poe suurus - mõjutavad müügi arvu, kuid nende koosmõju pole märkimisväärne.

Näide 4:Ühemõõtmeline ANOVA: randomiseeritud täisploki disain kahe töötlusega. Uuritakse kõigi kolme rasva ja kolme rippuri võimalike kombinatsioonide mõju leivale. Blokeerivateks teguriteks olid neli jahuproovi neljast erinevast allikast. Pärast seda määrake kontrastide valimise erinevad võimalused, mis võimaldavad välja selgitada, millised teguritasemete kombinatsioonid erinevad.

Näide 5: Hierarhiline (pesastatud) plaanimudel, millel on segatud efektid. Uuritakse nelja juhuslikult valitud masinasse paigaldatud pea mõju toodetud klaaskatoodihoidjate deformatsioonile. (Pead on masinasse sisse ehitatud, seega ei saa sama pead erinevatel masinatel kasutada). Peamõju käsitletakse juhusliku tegurina. ANOVA statistika näitab, et masinate vahel pole olulisi erinevusi, kuid on märke, et pead võivad erineda. Erinevus kõigi masinate vahel ei ole märkimisväärne, kuid kahel neist on peatüüpide erinevus märkimisväärne.

Näide 6: Korduvate mõõtmiste ühemõõtmeline analüüs jagatud kruntide plaani abil. See katse viidi läbi, et teha kindlaks individuaalse ärevusreitingu mõju neljal järjestikusel katsel sooritatud eksamile. Andmed on korraldatud nii, et neid saab vaadata kogu andmestiku alamhulkade rühmana („kogu graafik”). Ärevuse mõju oli ebaoluline, samas kui proovimise mõju oli märkimisväärne.

Meetodite loetelu

  • Faktoriaalsed katsemudelid. Näited: matemaatiliste ülesannete lahendamise edukust mõjutavad tegurid; müügimahtu mõjutavad tegurid.

Andmed koosnevad mitmest vaatluste seeriast (töötlemine), mida loetakse sõltumatute proovide realiseerimiseks. Esialgne hüpotees ütleb, et ravides pole vahet, s.t. eeldatakse, et kõiki tähelepanekuid võib pidada üheks valimiks üldpopulatsioonist:

  • Ühefaktoriline parameetriline mudel: Scheffe meetod.
  • Ühefaktoriline mitteparameetriline mudel [Lagutin MB, 237]: Kruskal-Wallise kriteerium [Hollender M., Wolf DA, 131], Jonkhieri kriteerium [Lagutin MB, 245].
  • Pidevate teguritega mudeli üldjuhtum, Cochrani teoreem [Afifi A., Eisen S., 234].

Andmed on duplikaatvaatlused:

  • Kahefaktoriline mitteparameetriline mudel: Friedmani kriteerium [Lapach, 203], Page'i kriteerium [Lagutin MB, 263]. Näited: tootmismeetodite, põllumajandustehnikate tõhususe võrdlus.
  • Kahefaktoriline mitteparameetriline mudel mittetäielike andmete jaoks

Ajalugu

Kust see nimi pärineb? dispersiooni analüüs? Võib tunduda kummaline, et vahendite võrdlemise protseduuri nimetatakse dispersioonianalüüsiks. Tegelikult on see tingitud asjaolust, et uurides kahe (või enama) rühma keskmise erinevuse statistilist olulisust, võrdleme (analüüsime) tegelikult valimi dispersioone. Pakutakse välja dispersioonanalüüsi põhimõiste Fisher 1920. aastal. Võib -olla oleks loomulikum termin ruutude summa või variatsioonide analüüs, kuid traditsiooniliselt kasutatakse terminit ANOVA. Esialgu töötati ANOVA välja spetsiaalselt kavandatud katsetest saadud andmete töötlemiseks ja seda peeti ainsaks meetodiks, mis põhjuslikke seoseid õigesti uurib. Meetodit kasutati taimekasvatuse katsete hindamiseks. Hiljem dispersioonanalüüsi üldine teaduslik tähendus psühholoogia, pedagoogika, meditsiini jm katsete jaoks.

Kirjandus

  1. Sheffe G. Dispersiooni analüüs. - M., 1980.
  2. Ahrens H. Leuter Yu. Mitmemõõtmeline dispersioonanalüüs.
  3. A. I. Kobzar Rakenduslik matemaatiline statistika. - M.: Fizmatlit, 2006.
  4. Lapach S.N., Chubenko A.V., Babich P.N. Statistika teaduses ja äris. - Kiiev: Morion, 2002.
  5. Lagutin M. B. Visuaalne matemaatiline statistika. Kahes köites. - M.: P-keskus, 2003.
  6. Afifi A., Eisen S. Statistiline analüüs: arvutipõhine lähenemisviis.
  7. Hollender M., Wolfe D.A. Mitteparameetrilised statistikameetodid.

Lingid

  • Dispersiooni analüüs - StatSoft elektrooniline õpik.


 


Loe:



Neljaosaline ikoon, Jumalaema ikoonid Pehmendavad kurjad südamed (Czestochowa), Rahustavad mu kurbusi, toimetavad kannatusi muredest, taastavad kaotatu

Neljaosaline ikoon, Jumalaema ikoonid Pehmendavad kurjad südamed (Czestochowa), Rahustavad mu kurbusi, toimetavad kannatusi muredest, taastavad kaotatu

Sellele ikoonile on lisatud dokument - riikliku uurimisinstituudi eksam ajaloo- ja kultuuriobjektide uurimiseks ja hindamiseks ...

Värvi valimine pole lihtne ülesanne Must on alati asjakohane

Värvi valimine pole lihtne ülesanne Must on alati asjakohane

iPhone 6 pole kaugeltki uudsus, kuid nõudlus selle järele isegi ei arva langevat, pigem püsib see nutitelefonide tipus veel mitu aastat, muutudes järk -järgult odavamaks ...

Beebi luksub iga päev

Beebi luksub iga päev

Kui laps luksub, kõlab see armas ja armas, kuid olete selle pärast mures. Kui emme kõndis asendis, oli tema laps juba luksumine. Kõik ...

Kuidas valida ikooni inimese nime ja sünniaja järgi Ikoonid meestele nimega sergey

Kuidas valida ikooni inimese nime ja sünniaja järgi Ikoonid meestele nimega sergey

Sergejevi tähtsamad taevased patroonid on Kolmainsuse -Sergius Lavra asutaja, Radoneži Sergius - üks armastatumaid ja ...

feed-pilt Rss