Dom - Podovi
Jednosmjerna analiza varijance. Multivarijantna analiza varijance Analiza varijance članak

Analiza varijance na temelju djela poznatog matematičara R.A. Fisher. Unatoč prilično poodmakloj dobi, ova metoda još uvijek ostaje jedna od glavnih u biološkim i poljoprivrednim istraživanjima. Ideje na kojima se temelji analiza varijance naširoko se koriste u mnogim drugim metodama matematičke analize eksperimentalnih podataka, kao iu planiranju bioloških i poljoprivrednih eksperimenata.

Analiza varijance vam omogućuje da:

1) usporedite dvije ili više srednjih vrijednosti uzorka;

2) istodobno proučavati učinak nekoliko neovisnih čimbenika, pri čemu je moguće utvrditi kako učinak svakog čimbenika na varijabilnost svojstva koje se proučava, tako i njihovu interakciju;

3) ispravno planirati znanstveni eksperiment.

Varijabilnost živih organizama očituje se u obliku raspršivanja ili raspršivanja vrijednosti pojedinih karakteristika unutar granica koje su određene stupnjem biološke ujednačenosti materijala i prirodom odnosa s uvjetima okoline. Nazivaju se znakovi koji se mijenjaju pod utjecajem određenih razloga djelotvoran.

Čimbenici su bilo koji utjecaji ili uvjeti čija raznolikost može na ovaj ili onaj način utjecati na raznolikost rezultirajuće karakteristike. Statistički utjecaj faktora u analizi varijance shvaća se kao odraz u raznolikosti rezultirajućeg atributa raznolikosti faktora koji se proučavaju, a koji je organiziran u studiji.

Pod raznolikošću podrazumijevamo prisutnost nejednakih vrijednosti svake karakteristike kod različitih pojedinaca spojenih u skupinu. Raznolikost skupine jedinki prema proučavanom svojstvu može imati različite stupnjeve, što se obično mjeri pokazateljima raznolikosti (ili varijabilnosti): granicama, standardnom devijacijom, koeficijentom varijacije. U analizi varijance mjeri se stupanj različitosti pojedinačnih i prosječnih vrijednosti nekog obilježja i uspoređuje na posebne načine koji čine specifičnosti ove opće metode.

Organizacija faktora sastoji se u tome da se svakom faktoru koji se proučava daje nekoliko značenja. U skladu s tim vrijednostima, svaki faktor je podijeljen u nekoliko stupnjeva; Za svaku gradaciju odabire se nekoliko jedinki prema principu slučajnog uzorka, a vrijednost dobivenog svojstva se naknadno mjeri.

Da bi se utvrdio stupanj i pouzdanost utjecaja čimbenika koji se proučavaju, potrebno je izmjeriti i ocijeniti onaj dio ukupne raznolikosti koji je uzrokovan tim čimbenicima.

Čimbenici koji utječu na stupanj varijacije rezultirajuće karakteristike dijele se na:

1) podesiv

2) slučajan

Podesivo (sustavno) faktori su uzrokovani djelovanjem faktora proučavanog u eksperimentu, koji ima nekoliko stupnjeva u iskustvu. Gradacija faktora– to je stupanj njegovog utjecaja na rezultirajuću karakteristiku. Sukladno stupnjevanju obilježja, za usporedbu se izdvaja nekoliko varijanti iskustva. Budući da su ti čimbenici preduvjetovani, nazivaju se istraživački podesivi, tj. dano, ovisno o organizaciji iskustva. Prema tome, prilagodljivi faktori su faktori čiji se učinak proučava eksperimentalno; oni su ti koji određuju razlike između prosjeka uzoraka različitih opcija— međugrupna (faktorska) varijanca.

Slučajni faktori određeni su prirodnom varijacijom svih karakteristika bioloških objekata u prirodi. To su eksperimentalno nekontrolirani čimbenici. Oni imaju slučajni učinak na efektivno svojstvo, uzrokuju eksperimentalne pogreške i određuju širenje (raspršenost) svojstva unutar svake varijante. Ovaj namaz se zove unutarskupinska (slučajna) varijanca.

Stoga je relativna uloga pojedinih čimbenika u ukupnoj varijabilnosti rezultirajućeg svojstva karakterizirana disperzijom i može se proučavati pomoću analiza varijance ili analiza raspršenja

Analiza varijance temelji se na usporedba međugrupnih i unutargrupnih varijanci. Ako međugrupna varijanca ne premašuje unutargrupnu varijancu, tada su razlike između skupina slučajne. Ako je međugrupna disperzija značajno veća od unutargrupne disperzije, tada postoje statistički značajne razlike između ispitivanih skupina (varijanti) zbog djelovanja čimbenika proučavanog u pokusu.

Iz ovoga proizlazi da pri statističkom proučavanju efektivne karakteristike analizom varijance treba utvrditi njezinu varijaciju po varijantama, ponavljanjima, rezidualnu varijaciju unutar tih skupina i opću varijaciju efektivne karakteristike u eksperimentu. U skladu s tim razlikuju se tri vrste disperzija:

1) Ukupna varijanca rezultirajuće karakteristike (S y 2);

2) Međuskupinski, ili privatni, između uzoraka (S y 2);

3) Unutargrupni, rezidualni (S z 2).

Stoga, analiza varijanceto je podjela ukupnog zbroja kvadrata odstupanja i ukupnog broja stupnjeva slobode na dijelove ili komponente koje odgovaraju strukturi eksperimenta, te procjena značajnosti djelovanja i međudjelovanja proučavanih čimbenika pomoću F-kriterija . Ovisno o broju čimbenika koji se istovremeno proučavaju, razlikuju se dvofaktorska, trofaktorska i četverofaktorska analiza varijance.

Pri obradi terenskih jednofaktorskih statističkih kompleksa koji se sastoje od nekoliko neovisnih opcija, ukupna varijabilnost rezultirajuće karakteristike, mjerena ukupnim zbrojem kvadrata (C y), dijeli se na tri komponente: varijacija između opcija (uzoraka) - C V, varijacija ponavljanja (opcije su međusobno povezane zajedničkim kontroliranim uvjetom - prisutnost organiziranih ponavljanja) - C p i varijacije unutar opcija C z. U općem obliku, varijabilnost svojstva predstavljena je sljedećim izrazom:

S y = S V + S p + S z.

Ukupan broj stupnjeva slobode (N -1) također se dijeli na tri dijela:

stupnjevi slobode za opcije (l – 1);

stupnjevi slobode za ponavljanja (n - 1);

slučajna varijacija (n – 1) × (l – 1).

Zbrojevi kvadrata odstupanja, prema podacima terenskog eksperimenta - statistički kompleks s opcijama - l i ponavljanja - n, nalaze se kako slijedi. Prvo pomoću izvorne tablice odredite zbrojeve za ponavljanja - Σ P, varijante - Σ V i ukupni zbroj svih opažanja - Σ X.

Zatim se izračunavaju sljedeći pokazatelji:

Ukupan broj opažanja N = l × n;

Faktor korekcije (korekcija) C cor = (Σ X 1) 2 / N;

Ukupni zbroj kvadrata Cy = Σ X 1 2 – C jezgra;

Zbroj kvadrata za ponavljanja C p = Σ P 2 / (l –C jezgra);

Zbroj kvadrata za opcije C V = Σ V 2 / (n – 1);

Zbroj kvadrata za grešku (ostatak) C Z = C y - C p - C V .

Rezultirajući zbrojevi kvadrata C V i C Z dijele se s njihovim odgovarajućim stupnjevima slobode i dobivaju se dva srednja kvadrata (varijance):

Opcije S v 2 = C V / l – 1;

Pogreške S Z 2 = C Z / (n – 1)×(l – 1).

Procjena značajnosti razlika između sredstava. Dobiveni srednji kvadrati koriste se u analizi varijance za procjenu značajnosti učinka proučavanih čimbenika usporedbom varijance opcija (S v 2) s varijancom pogreške (S Z 2) prema Fisherovom kriteriju (F = S Y 2 / S Z 2). Jedinica za usporedbu je prosječni kvadrat slučajne varijance, koji određuje slučajnu pogrešku eksperimenta.

Korištenje Fisherova testa omogućuje nam određivanje prisutnosti ili odsutnosti značajnih razlika između srednjih vrijednosti uzorka, ali ne ukazuje na specifične razlike između srednjih vrijednosti.

Hipoteza koja se testira je pretpostavka da su sve srednje vrijednosti uzorka procjene jedne opće srednje vrijednosti i da su razlike među njima beznačajne. Ako F činjenica = S Y 2 / S Z 2 ≤ F teorija, tada se nulta hipoteza ne odbacuje. Nema značajnih razlika između srednjih vrijednosti uzorka i tu se test završava. Nulta hipoteza se odbacuje kada F činjenica = S Y 2 / S Z 2 ≥ F teorijski Vrijednost F-testa za razinu značajnosti usvojenu u studiji nalazi se u odgovarajućoj tablici, uzimajući u obzir stupnjeve slobode za varijancu opcija i slučajnu varijancu. Obično se koristi razina značajnosti od 5%, a sa strožim pristupom 1% ili čak 0,1%.

Za uzorak veličine n, varijanca uzorka izračunava se kao zbroj kvadrata odstupanja od srednje vrijednosti uzorka podijeljen s n-1(veličina uzorka minus jedan). Dakle, za fiksnu veličinu uzorka n, varijanca je funkcija zbroja kvadrata (odstupanja), označena, za sažetost, SS (od engleskog zbroja kvadrata - zbroj kvadrata). U nastavku često izostavljamo riječ uzorak, dobro znajući da razmatramo varijancu uzorka ili procjenu varijance. Osnova analize varijance je podjela varijance na dijelove ili komponente:

SS pogreške i SS posljedica. Varijabilnost unutar grupe ( SS) obično se naziva rezidualna komponenta ili varijanca pogreške. To znači da se obično ne može predvidjeti ili objasniti kada se eksperiment izvodi. Na drugoj strani, SS učinak(ili komponenta varijance između skupina) može se objasniti razlikama između srednjih vrijednosti skupina. Drugim riječima, pripadnost određenoj skupini objašnjava međugrupna varijabilnost, jer znamo da te skupine imaju različita sredstva.

Osnovna logika analize varijance. Ukratko, svrha ANOVA-e je testirati statističku značajnost razlika između srednjih vrijednosti (za skupine ili varijable). Ova provjera se provodi dijeljenjem zbroja kvadrata na komponente, tj. dijeljenjem ukupne varijance (varijacije) na dijelove, od kojih je jedan posljedica slučajne pogreške (odnosno unutargrupne varijabilnosti), a drugi je povezan s razlikama u srednjim vrijednostima. Posljednja komponenta varijance zatim se koristi za analizu statističke značajnosti razlike između srednjih vrijednosti. Ako je ovo razlika značajan, Nulta hipoteza odbijena a prihvaća se alternativna hipoteza da postoji razlika između sredstava.

Zavisne i nezavisne varijable. Pozivaju se varijable čije su vrijednosti određene mjerenjima tijekom eksperimenta (na primjer, rezultat testa). ovisan varijable. Varijable koje se mogu kontrolirati u eksperimentu (kao što su nastavne metode ili drugi kriteriji koji omogućuju da se opažanja podijele u skupine ili klasificiraju) nazivaju se čimbenici ili nezavisna varijable.

Mnogo faktora. Svijet je po prirodi složen i višedimenzionalan. Situacije kada je određena pojava u potpunosti opisana jednom varijablom izuzetno su rijetke. Na primjer, ako pokušavamo naučiti kako uzgajati velike rajčice, trebali bismo uzeti u obzir čimbenike koji se odnose na genetsku strukturu biljke, vrstu tla, svjetlost, temperaturu itd. Stoga, kada se provodi tipičan eksperiment, treba se suočiti s velikim brojem čimbenika. Glavni razlog zašto je korištenje ANOVA-e poželjnije od ponovljenih usporedbi dva uzorka na različitim razinama faktora korištenjem serija t- Kriterij je da je analiza varijance znatno veća djelotvoran a za male uzorke informativniji.

Zaključak. Analizu varijance razvio je i uveo u praksu poljoprivrednih i bioloških istraživanja engleski znanstvenik R. A. Fisher. . Suština analize varijance sastoji se u rastavljanju ukupne varijabilnosti svojstva i ukupnog broja stupnjeva slobode na sastavne dijelove koji odgovaraju strukturi poljskog pokusa, kao iu procjeni operativnog faktora korištenjem Fisherova kriterija.

Gdje je opća varijabilnost svojstva zbog utjecaja problematike koja se proučava, heterogenosti plodnosti tla i slučajnih pogrešaka u pokusu.

Varijacije prinosa kroz ponavljanja poljskih pokusa.

Varijacije prinosa prema eksperimentalnim varijantama, povezane s učinkom pitanja koje se proučava.

Varijacije u prinosima povezane sa slučajnim pogreškama u eksperimentu.

Zaključak analiza varijance se radi prema sljedećim pravilima:

1. Postoje značajne razlike u iskustvu ako je Činjenično ≥Fteoretski. Nema značajnih razlika u iskustvu ako je činjenica

2. LSD – Najmanja značajna razlika, koristi se za određivanje razlike između opcija. Ako je razlika d≥ NSR, tada su razlike između opcija značajne. Ako d< НСР, то различия между вариантами не существенные.

grupe opcije.

1. Ako je razlika d značajna i ukazuje na povećanje prinosa, tada opcije pripadaju skupini 1.

2. Ako razlika d nije značajna, tada opcije pripadaju skupini 2.

3. Ako je razlika d značajna, ali ukazuje na smanjenje prinosa, tada opcije pripadaju skupini 3.

Odabir formule analiza varijance ovisi o metodama postavljanja opcija u eksperimentu:

1. Za organizirana ponavljanja:

2. Za neorganizirana ponavljanja.

5.1. Što je analiza varijance?

Disperzijsku analizu razvio je 20-ih godina 20. stoljeća engleski matematičar i genetičar Ronald Fisher. Prema anketi među znanstvenicima, koja je pokazala tko je imao najveći utjecaj na biologiju 20. stoljeća, prvenstvo je dobio Sir Fisher (za svoje zasluge dobio je titulu viteza - jedno od najvećih priznanja u Velikoj Britaniji) ; u tom smislu, Fischer je usporediv s Charlesom Darwinom, najvećim utjecajem na biologiju 19. stoljeća.

Analiza varijance sada je posebna grana statistike. Temelji se na činjenici koju je otkrio Fisher da se mjera varijabilnosti proučavane veličine može rastaviti na dijelove koji odgovaraju čimbenicima koji utječu na tu količinu i slučajnim odstupanjima.

Da bismo razumjeli bit analize varijance, izvršit ćemo istu vrstu izračuna dva puta: “ručno” (kalkulatorom) i pomoću programa Statistica. Kako bismo pojednostavili naš zadatak, nećemo raditi s rezultatima stvarnog opisa raznolikosti zelenih žaba, već s fiktivnim primjerom koji se tiče usporedbe ženki i mužjaka kod ljudi. Uzmite u obzir različitost visina 12 odraslih osoba: 7 žena i 5 muškaraca.

Tablica 5.1.1. Primjer za jednosmjernu ANOVA: podaci o spolu i visini 12 osoba

Provedimo jednosmjernu analizu varijance: usporedimo razlikuju li se muškarci i žene u karakteriziranoj skupini statistički značajno ili ne po visini.

5.2. Testirajte normalnu distribuciju

Daljnje razmišljanje temelji se na činjenici da je distribucija u uzorku koji se razmatra normalna ili bliska normalnoj. Ako je distribucija daleko od normalne, disperzija (varijanca) nije odgovarajuća mjera njezine varijabilnosti. Međutim, analiza varijance relativno je otporna na odstupanja distribucije od normalnosti.

Test normalnosti ovih podataka može se provesti na dva različita načina. Prvo: Statistika / Osnovna statistika / Tablice / Opisna statistika / Kartica Normalnost. U kartici Normalnost Možete odabrati koje ćete testove normalnosti koristiti. Kada kliknete na gumb Tablice učestalosti pojavit će se tablica učestalosti, a gumb Histogrami prikazat će histogram. Tablica i histogram će pokazati rezultate različitih testova.

Druga metoda povezana je s korištenjem odgovarajućih sposobnosti pri izradi histograma. U dijalogu za izradu histograma (Grafovi / Histogrami...) odaberite karticu Napredno. Na dnu se nalazi blok Statistika. Označimo Shapiro-Wilka na njemu t est i Kolmogorov-Smirnov test, kao što je prikazano na slici.

Riža. 5.2.1. Statistički testovi za normalnost distribucije u dijaloškom okviru za crtanje histograma

Kao što se može vidjeti iz histograma, distribucija rasta u našem uzorku razlikuje se od normalne (postoji "kvar" u sredini).


Riža. 5.2.2. Histogram izgrađen s parametrima navedenim na prethodnoj slici

Treća linija u naslovu grafikona označava parametre normalne distribucije kojima se promatrana distribucija pokazala najbližom. Ukupna sredina je 173, a ukupna standardna devijacija je 10,4. Umetak ispod na grafikonu prikazuje rezultate testova normalnosti. D je Kolmogorov-Smirnov test, a SW-W je Shapiro-Wilkov test. Kao što se može vidjeti, za sve korištene testove razlike između visinske distribucije i normalne distribucije pokazale su se statistički beznačajne ( str u svim slučajevima veći od 0,05).

Dakle, formalno gledano, testovi za normalnost distribucije nisu nam “zabranili” korištenje parametarske metode temeljene na pretpostavci normalne distribucije. Kao što je već spomenuto, analiza varijance je relativno otporna na odstupanja od normalnosti, pa ćemo je i dalje koristiti.

5.3. Jednosmjerna analiza varijance: ručni izračuni

Kako bismo okarakterizirali varijabilnost visina ljudi u danom primjeru, izračunajmo zbroj kvadratnih odstupanja (na engleskom označeno kao SS , Zbroj kvadrata ili ) pojedinačne vrijednosti iz prosjeka: . Prosječna vrijednost visine u gornjem primjeru je 173 centimetra. Na temelju ovoga,

SS = (186–173) 2 + (169–173) 2 + (166–173) 2 + (188–173) 2 + (172–173) 2 + (179–173) 2 + (165–173) 2 + (174–173) 2 + (163–173) 2 + (162–173) 2 + (162–173) 2 + (190–173) 2 ;

SS = 132 + 42 + 72 + 152 + 12 + 62 + 82 + 12 + 102 + 112 + 112 + 172;

SS = 169 + 16 + 49 + 225 + 1 + 36 + 64 + 1 + 100 + 121 + 121 + 289 = 1192.

Dobivena vrijednost (1192) je mjera varijabilnosti cijelog skupa podataka. Međutim, oni se sastoje od dvije skupine, od kojih svaka može imati svoj prosjek. U navedenim podacima prosječna visina žena je 168 cm, a muškaraca 180 cm.

Izračunajmo zbroj kvadrata odstupanja za žene:

SS f = (169–168) 2 + (166–168) 2 + (172–168) 2 + (179–168) 2 + (163–168) 2 + (162–168) 2 ;

SS f = 12 + 22 + 42 + 112 + 32 + 52 + 62 = 1 + 4 + 16 + 121 + 9 + 25 + 36 = 212.

Također izračunavamo zbroj kvadratnih odstupanja za muškarce:

SS m = (186–180) 2 + (188–180) 2 + (174–180) 2 + (162–180) 2 + (190–180) 2 ;

SS m = 62 + 82 + 62 + 182 + 102 = 36 + 64 + 36 + 324 + 100 = 560.

O čemu ovisi proučavana vrijednost u skladu s logikom analize varijance?

Dvije izračunate vrijednosti, SS f I SS m , karakteriziraju unutargrupnu varijaciju, koja se u analizi varijance obično naziva "greška". Podrijetlo ovog imena povezano je sa sljedećom logikom.

Što određuje visinu osobe u ovom primjeru? Prije svega o prosječnoj visini ljudi općenito, bez obzira na njihov spol. Drugo - s poda. Ako su ljudi jednog spola (muški) viši od drugog (ženskog), to se može predstaviti kao dodatak "univerzalnom" prosjeku neke vrijednosti, učinak spola. Konačno, osobe istog spola razlikuju se po visini zbog individualnih razlika. U modelu koji visinu opisuje kao zbroj ljudskog prosjeka i prilagodbe za spol, individualne razlike su neobjašnjive i mogu se smatrati "pogreškom".

Dakle, u skladu s logikom analize varijance, vrijednost koja se proučava određuje se na sljedeći način: , Gdje x ij - i-ta vrijednost proučavane veličine pri j-toj vrijednosti proučavanog faktora; - opća havarija; F j - utjecaj j-te vrijednosti faktora koji se proučava; - “greška”, doprinos individualnosti objekta na koji se vrijednost odnosix ij .

Međugrupni zbroj kvadrata

Tako, SS pogreške = SS f + SS m = 212 + 560 = 772. Ovom vrijednošću opisali smo unutargrupnu varijabilnost (pri razlikovanju grupa po spolu). Ali postoji i drugi dio varijabilnosti - međugrupna varijabilnost, koju ćemo nazvatiSS učinak (budući da govorimo o učinku podjele ukupnosti predmeta koji se razmatraju na žene i muškarce).

Srednja vrijednost svake skupine razlikuje se od ukupne srednje vrijednosti. Kada izračunavamo doprinos ove razlike ukupnoj mjeri varijabilnosti, moramo pomnožiti razliku između grupe i ukupnog prosjeka s brojem objekata u svakoj grupi.

SS učinak = = 7×(168–173) 2 + 5×(180–173) 2 = 7×52 + 5×72 = 7×25 + 5×49 = 175 + 245 = 420.

Ovdje se očitovao princip konstantnosti zbroja kvadrata koji je otkrio Fischer: SS = učinak SS + greška SS , tj. za ovaj primjer, 1192 = 440 + 722.

Prosječni kvadrati

Uspoređujući međugrupne i unutargrupne zbrojeve kvadrata u našem primjeru, možemo vidjeti da je prvi povezan s varijacijom dviju skupina, a drugi s 12 vrijednosti u 2 skupine. Broj stupnjeva slobode ( df ) za neki parametar može se definirati kao razlika između broja objekata u skupini i broja ovisnosti (jednadžbi) koje povezuju te veličine.

U našem primjeru df učinak = 2–1 = 1, A df greške = 12–2 = 10.

Zbrojeve kvadrata možemo podijeliti s njihovim brojem stupnjeva slobode, dajući nam srednje kvadrate ( MS , Sredstva kvadrata). Nakon što smo to učinili, možemo to utvrditi MS - ništa više od varijacija ("odstupanja", rezultat dijeljenja zbroja kvadrata s brojem stupnjeva slobode). Nakon ovog otkrića možemo razumjeti strukturu ANOVA tablice. Za naš primjer to će izgledati ovako.

Posljedica

Greška

MS učinak I MS pogreške su procjene međugrupne i unutargrupne varijance, te se stoga mogu uspoređivati ​​prema kriterijuF (Snedecorov kriterij, nazvan po Fischeru), osmišljen za usporedbu varijacija. Ovaj kriterij je jednostavno kvocijent dijeljenja veće varijacije s manjom. U našem slučaju to je 420 / 77,2 = 5,440.

Određivanje statističke značajnosti Fisherova testa pomoću tablica

Ako bismo ručno, pomoću tablica, odredili statističku značajnost učinka, morali bismo usporediti dobivenu vrijednost kriterija F s kritičnom vrijednošću koja odgovara određenoj razini statističke značajnosti za dane stupnjeve slobode.


Riža. 5.3.1. Fragment tablice s kritičnim vrijednostima kriterija F

Kao što vidite, za razinu statističke značajnosti p=0,05 kritična vrijednost kriterija jeF je 4,96. To znači da je u našem primjeru učinak proučavanog spola zabilježen na razini statističke značajnosti od 0,05.

Dobiveni rezultat može se tumačiti na sljedeći način. Vjerojatnost nulte hipoteze, prema kojoj je prosječna visina žena i muškaraca ista, a zabilježena razlika u njihovoj visini posljedica je slučajnosti u odabiru uzoraka, manja je od 5%. To znači da moramo odabrati alternativnu hipotezu, a to je da je prosječna visina žena i muškaraca različita.

5.4. Jednosmjerna analiza varijance ( ANOVA) u paketu Statistica

U slučajevima kada se izračuni ne rade ručno, već pomoću odgovarajućih programa (na primjer, paket Statistica), vrijednost str određuje automatski. Možete provjeriti je li nešto viša od kritične vrijednosti.

Kako biste analizirali primjer o kojem se raspravlja koristeći najjednostavniju verziju analize varijance, trebate pokrenuti proceduru Statistika / ANOVA za datoteku s odgovarajućim podacima i odabrati opciju Jednosmjerna ANOVA u prozoru Vrsta analize i dijalogu Brze specifikacije opciju u prozoru Metoda specifikacije.


Riža. 5.4.1. Opća dijaloška ANOVA/MANOVA (Analiza varijance)

U brzom dijaloškom okviru koji se otvori, u polju Varijable potrebno je navesti one stupce koji sadrže podatke čiju varijabilnost proučavamo (Popis zavisnih varijabli; u našem slučaju stupac Rast), kao i stupac koji sadrži vrijednosti​ ​koji dijele vrijednost koja se proučava u skupine (kategorički prediktor (faktor); u našem slučaju, stupac Spol). U ovoj verziji analize, za razliku od multivarijatne analize, može se uzeti u obzir samo jedan faktor.


Riža. 5.4.2. Dijaloška jednosmjerna ANOVA (jednosmjerna analiza varijance)

U prozoru Šifre faktora trebate označiti one vrijednosti dotičnog faktora koje je potrebno obraditi tijekom ove analize. Sve dostupne vrijednosti mogu se vidjeti pomoću gumba Zoom; ako, kao u našem primjeru, trebate uzeti u obzir sve vrijednosti faktora (a za spol u našem primjeru postoje samo dvije), možete kliknuti gumb Sve. Kada su navedeni obrađeni stupci i kodovi faktora, možete kliknuti OK i otići na prozor za brzu analizu rezultata: ANOVA Rezultati 1, na karticu Brzo.

Riža. 5.4.3. Brza kartica u prozoru ANOVA rezultata

Gumb Svi efekti/Grafikoni omogućuje vam da vidite usporedbu srednjih vrijednosti dviju grupa. Iznad grafikona je naznačen broj stupnjeva slobode, kao i vrijednosti F i p za dotični faktor.


Riža. 5.4.4. Grafički prikaz ANOVA rezultata

Gumb Svi učinci omogućuje vam da dobijete analizu tablice varijance sličnu onoj gore opisanoj (s nekim značajnim razlikama).


Riža. 5.4.5. Tablica s rezultatima analize varijance (usporediti sa sličnom tablicom dobivenom “ručno”)

Donji redak tablice prikazuje zbroj kvadrata, broj stupnjeva slobode i srednje kvadrate pogreške (varijabilnost unutar grupe). Na retku iznad su slični pokazatelji za faktor koji se proučava (u ovom slučaju znak Spol), kao i kriterij F (omjer srednjih kvadrata učinka i srednjih kvadrata pogreške), te razinu njegove statističke značajnosti. Da se učinak promatranog čimbenika pokazao statistički značajnim pokazuje crvena boja.

I prvi red prikazuje podatke o indikatoru "Presretanje". Ovaj Redak tablice predstavlja misterij za korisnike koji se pridružuju Statistici u njenoj 6. ili novijoj verziji. Vrijednost intercepta vjerojatno je povezana s dekompozicijom zbroja kvadrata svih vrijednosti podataka (tj. 1862 + 1692 ... = 360340). Vrijednost F kriterija navedena za njega dobivena je dijeljenjem MS presretanje/MS pogreška = 353220 / 77,2 = 4575,389 i prirodno daje vrlo nisku vrijednost str . Zanimljivo je da u Statistici-5 ta vrijednost uopće nije izračunata, a priručnici za korištenje kasnijih verzija paketa ni na koji način ne komentiraju njegovo uvođenje. Vjerojatno najbolja stvar koju biolog koji koristi Statisticu-6 i kasnije može učiniti je jednostavno ignorirati red Intercept u tablici ANOVA.

5.5. ANOVA i Studentov i Fisherov t-test: koji je bolji?

Kao što ste možda primijetili, podatke koje smo usporedili korištenjem jednosmjerne analize varijance, mogli bismo ispitati i korištenjem Studentovog i Fisherovog testa. Usporedimo ove dvije metode. Da bismo to učinili, izračunajmo razliku u visini između muškaraca i žena pomoću ovih kriterija. Da bismo to učinili, morat ćemo slijediti stazu Statistika / Osnovna statistika / t-test, neovisno, po grupama. Naravno, ovisne varijable su varijabla rasta, a varijabla grupiranja je varijabla spola.


Riža. 5.5.1. Usporedba podataka obrađenih ANOVA-om pomoću Studentovog i Fisherovog testa

Kao što vidite, rezultat je isti kao pri ANOVA-i. str = 0,041874 u oba slučaja, kao što je prikazano na sl. 5.4.5, a prikazano na sl. 5.5.2 (uvjerite se sami!).


Riža. 5.5.2. Rezultati analize (detaljno objašnjenje tablice rezultata - u paragrafu posvećenom testu učenika)

Važno je naglasiti da iako je F kriterij s matematičkog gledišta u analizi koja se razmatra prema Studentovom i Fisherovom testu isti kao u ANOVA (i izražava omjer varijance), njegovo značenje u rezultatima analize prikazanim u finalni stol je potpuno drugačiji. Kod usporedbe Studentovim i Fisherovim testom, usporedba sredina uzoraka provodi se Studentovim testom, a usporedba njihove varijabilnosti Fisherovim testom. Rezultati analize ne prikazuju samu varijancu, već njen kvadratni korijen - standardnu ​​devijaciju.

U ANOVA-i, s druge strane, Fisherov test koristi se za usporedbu srednjih vrijednosti različitih uzoraka (kao što smo spomenuli, to se radi dijeljenjem zbroja kvadrata na dijelove i usporedbom srednjeg zbroja kvadrata koji odgovara između i unutar grupe varijabilnost).

Međutim, navedena se razlika više odnosi na prikaz rezultata statističkog istraživanja nego na njegovu bit. Kao što Glantz (1999., str. 99) ističe, na primjer, usporedba grupa pomoću Studentovog t testa može se smatrati posebnim slučajem analize varijance za dva uzorka.

Dakle, usporedba uzoraka pomoću Studentovog i Fisherovog testa ima jednu važnu prednost u odnosu na analizu varijance: omogućuje vam usporedbu uzoraka u smislu njihove varijabilnosti. Ali prednosti analize varijance još su značajnije. To uključuje, primjerice, mogućnost istodobne usporedbe nekoliko uzoraka.

Razmatranu shemu analize varijance razlikujemo ovisno o: a) prirodi obilježja po kojem je populacija podijeljena u skupine (uzorke); b) broju obilježja po kojima je populacija podijeljena na skupine (uzorke); c) o načinu uzimanja uzoraka.

Vrijednosti obilježja. koji populaciju dijeli na skupine može predstavljati opću populaciju ili njoj veličinom blisku populaciju. U ovom slučaju, shema za provođenje analize varijance odgovara onoj koja je gore razmotrena. Ako vrijednosti obilježja koje formira različite skupine predstavljaju uzorak iz opće populacije, tada se formulacija nulte i alternativne hipoteze mijenja. Nulta hipoteza je da postoje razlike između skupina, odnosno da srednje vrijednosti skupine pokazuju neke varijacije. Alternativna hipoteza je da nema fluktuacije. Očito, s ovakvom formulacijom hipoteza, nema razloga specificirati rezultate usporedbe varijanci.

Kada se broj karakteristika grupiranja poveća, na primjer, na 2, prvo se povećava broj nultih i, sukladno tome, alternativnih hipoteza. U ovom slučaju, prva nulta hipoteza govori o nepostojanju razlika između sredina skupina prvog obilježja grupiranja, druga nulta hipoteza govori o nepostojanju razlika u sredinama skupina drugog obilježja grupiranja, i na kraju treća nulta hipoteza govori o nepostojanju tzv.učinka međudjelovanja čimbenika (značajke grupiranja).

Učinak interakcije shvaća se kao takva promjena vrijednosti rezultirajuće karakteristike koja se ne može objasniti ukupnim učinkom dvaju čimbenika. Za testiranje tri postavljena para hipoteza, potrebno je izračunati tri stvarne vrijednosti Fisherovog F testa, koji zauzvrat pretpostavlja sljedeću verziju dekompozicije ukupnog volumena varijacije

Varijance potrebne za dobivanje F-kriterija dobivaju se na poznati način dijeljenjem volumena varijacije s brojem stupnjeva slobode.

Kao što znate, uzorci mogu biti ovisni i neovisni. Ako su uzorci ovisni, tada u ukupnom volumenu varijacije treba razlikovati tzv. varijaciju ponavljanjem
. Ako nije izolirana, tada ova varijacija može značajno povećati varijaciju unutar grupe (
), što može iskriviti rezultate analize varijance.

Pregled pitanja

17-1.Koja je specifikacija rezultata analize varijance?

17-2. U kojem se slučaju za specifikaciju koristi Tukeyev Q test?

17-3. Koje su razlike između prvog, drugog i tako dalje reda?

17-4. Kako pronaći stvarnu vrijednost Tukeyeva Q testa?

17-5. Koje su hipoteze postavljene u vezi svake razlike?

17-6 (prikaz, ostalo). O čemu ovisi tablična vrijednost Tukeyeva Q testa?

17-7 (prikaz, ostalo). Što bi bila nulta hipoteza ako razine obilježja grupiranja predstavljaju uzorak?

17-8 Kako se izračunava ukupni volumen varijacije pri grupiranju podataka prema dvije karakteristike?

17-9 (prikaz, ostalo). U kojem slučaju se identificira varijacija ponavljanjem (
) ?

Sažetak

Razmatrani mehanizam za konkretiziranje rezultata analize varijance omogućuje nam da mu damo gotov oblik. Imajte na umu ograničenja kada koristite Tukeyev Q test. U materijalu su također prikazani osnovni principi klasifikacije modela analize varijance. Mora se naglasiti da su to samo principi. Detaljna studija značajki svakog modela zahtijeva zasebnu, dubinsku studiju.

Testni zadaci za predavanje

Koje su statističke karakteristike pretpostavljene u ANOVA?

    Što se tiče dvije varijante

    U odnosu na jedan prosjek

    U odnosu na nekoliko prosjeka

    U odnosu na jednu varijancu

Što je sadržaj alternativne hipoteze u analizi varijance?

    Uspoređivane varijance nisu međusobno jednake

    Svi uspoređeni prosjeci nisu međusobno jednaki

    Najmanje dvije opće sredine nisu međusobno jednake

    Varijanca između grupa veća je od varijance unutar grupe

Koje se razine značajnosti najčešće koriste u analizi varijance?

Ako je varijacija unutar grupe veća od varijacije između grupa, trebamo li nastaviti analizu varijance ili odmah prihvatiti H0 ili NA?

1. Trebamo li nastaviti s određivanjem potrebnih odstupanja?

2. Trebali bismo se složiti s H0

3. Trebali biste se složiti s NA

Ako se ispostavi da je varijanca unutar grupe jednaka varijanci između grupa, što treba poduzeti osoba koja provodi analizu varijance?

    Složite se s nultom hipotezom da su opće srednje vrijednosti jednake

    Složite se s alternativnom hipotezom da postoji barem par sredina koje su međusobno nejednake

Koja bi varijanca uvijek trebala biti u brojniku kada se izračunava Fisherov F test?

    Samo unutar grupe

    U svakom slučaju međugrupna

    Međugrupna ako je veća od unutargrupne

Kolika bi trebala biti stvarna vrijednost Fisherova F testa?

    Uvijek manje od 1

    Uvijek više od 1

    Jednako ili veće od 1

O čemu ovisi tablična vrijednost Fisherova F testa?

1. Od prihvaćene razine značajnosti

2. O broju stupnjeva slobode ukupne varijacije

3. O broju stupnjeva slobode međugrupne varijacije

4. O broju stupnjeva slobode unutargrupne varijacije

5. Iz stvarne vrijednosti Fisherovog F testa?

Povećanje broja opažanja u svakoj skupini s jednakim varijancama povećava vjerojatnost prihvaćanja......

1.Nulta hipoteza

2. Alternativna hipoteza

3. Ne utječe na prihvaćanje nulte i alternativne hipoteze

Koja je svrha specificiranja rezultata analize varijance?

    Provjerite jesu li izračuni varijance ispravno izvedeni

    Odredite koji se od općih prosjeka pokazao međusobno jednakim

    Odredite koji od općih prosjeka nisu međusobno jednaki

Je li istinita tvrdnja: "Prilikom specificiranja rezultata analize varijance pokazalo se da su svi opći prosjeci međusobno jednaki?"

    Može biti istina ili laž

    Ovo nije točno, to može biti zbog pogrešaka u izračunima

Može li se pri određivanju analize varijance doći do zaključka da sve opće srednje vrijednosti nisu međusobno jednake?

1. Sasvim moguće

2. Moguće u iznimnim slučajevima

3. Načelno nemoguće.

4. Moguće samo ako su napravljene pogreške u izračunima

Ako je nulta hipoteza prihvaćena prema Fisherovom F testu, je li potrebna analiza varijance?

1.Obavezno

2. Nije potrebno

3. Prema odluci osobe koja provodi analizu varijance

U kojem se slučaju koristi Tukeyev test za specificiranje rezultata analize varijance?

1. Ako je broj opažanja u skupinama (uzorcima) isti

2. Ako je broj opažanja u skupinama (uzorcima) različit

3. Ako postoje uzorci s jednakim i nejednakim brojevima,

lijenost

Što predstavlja NSR kada se specificiraju rezultati analize varijance temeljene na Tukeyjevom kriteriju?

1. Umnožak prosječne pogreške i stvarne vrijednosti kriterija

2. Umnožak prosječne pogreške s tabličnom vrijednošću kriterija

3. Omjer svake razlike između srednjih vrijednosti uzorka i

prosječna greška

4. Razlika između srednjih vrijednosti uzorka

Ako je populacija uzorka podijeljena u skupine prema 2 karakteristike, na koliko bi izvora barem trebala biti podijeljena ukupna varijacija karakteristike?

Ako su promatranja iz uzoraka (skupina) ovisna, na koliko izvora treba podijeliti ukupnu varijaciju (jedna karakteristika grupiranja)?

Koji je izvor (uzrok) međugrupnih varijacija?

    Igra na sreću

    Kombinirani učinak igre na sreću i faktora

    Učinak čimbenika

    Saznat će se nakon ANOVE

Koji je izvor (uzrok) varijacija unutar grupe?

1.Igra na sreću

2. Kombinirano djelovanje igre na sreću i faktora

3. Djelovanje faktora(a)

4. Postat će jasno nakon provedbe analize varijance

Koja se metoda pretvorbe izvornih podataka koristi ako su karakteristične vrijednosti izražene u udjelima?

    Logaritam

    Vađenje korijena

    Phi transformacija

Predavanje 8 Korelacija

anotacija

Najvažnija metoda za proučavanje odnosa među karakteristikama je metoda korelacije. Ovo predavanje otkriva sadržaj ove metode, pristupe analitičkom izražavanju te veze. Posebna se pažnja posvećuje takvim specifičnim pokazateljima kao što su pokazatelji bliskosti komunikacije

Ključne riječi

Poveznica. Metoda najmanjeg kvadrata. Koeficijent regresije. Koeficijenti determinacije i korelacije.

Pokrivena pitanja

    Funkcionalna i korelacijska povezanost

    Faze konstruiranja korelacijske komunikacijske jednadžbe. Interpretacija koeficijenata jednadžbe

    Indikatori bliskosti veze

    Procjena odabranih pokazatelja povezanosti

Modularna cjelina 1 Bit korelacije. Faze konstruiranja korelacijske komunikacijske jednadžbe, interpretacija koeficijenata jednadžbe.

Svrha i ciljevi izučavanja modularne cjeline 1 sastoje se u razumijevanju obilježja korelacijskog odnosa. ovladavanje algoritmom za konstruiranje komunikacijske jednadžbe, razumijevanje sadržaja koeficijenata jednadžbe.

      Suština korelacije

U prirodnim i društvenim pojavama postoje dvije vrste veza - funkcionalne veze i korelacijske veze. S funkcionalnom vezom, svaka vrijednost argumenta odgovara strogo definiranim (jednom ili više) vrijednostima funkcije. Primjer funkcionalnog odnosa je odnos između opsega i polumjera, koji se izražava jednadžbom
. Svaka vrijednost radijusa r odgovara jednoj vrijednosti opsega L . U korelacijskom odnosu, svaka vrijednost faktorske karakteristike odgovara nekoliko nepotpuno definiranih vrijednosti rezultantne karakteristike. Primjeri korelacijskog odnosa uključuju odnos između težine osobe (rezultativno svojstvo) i njegove visine (faktorsko svojstvo), odnos između količine primijenjenog gnojiva i produktivnosti te između cijene i količine ponuđene robe. Izvor nastanka korelacije je činjenica da, u pravilu, u stvarnom životu vrijednost efektivnog atributa ovisi o mnogim čimbenicima, uključujući one koji se nasumično mijenjaju. Na primjer, ista težina osobe ovisi o dobi, spolu, prehrani, zanimanju i mnogim drugim čimbenicima. No, istodobno je očito da je rast općenito odlučujući čimbenik. S obzirom na ove okolnosti, korelacijsku vezu treba definirati kao nepotpunu vezu koja se može utvrditi i ocijeniti samo ako postoji velik broj promatranja, u prosjeku.

1.2 Faze konstruiranja korelacijske komunikacijske jednadžbe.

Kao i funkcionalna veza, korelacijska veza se izražava jednadžbom veze. Da biste ga izgradili, morate proći kroz sljedeće korake (faze) jedan za drugim.

Najprije treba razumjeti uzročno-posljedične veze, utvrditi podređenost znakova, odnosno koji su od njih uzroci (faktorski znakovi), a koji posljedica (rezultativni znakovi). Uzročno-posljedične veze među karakteristikama utvrđuju se teorijom predmeta pri čemu se koristi metoda korelacije. Na primjer, znanost o "ljudskoj anatomiji" dopušta nam da kažemo što je izvor odnosa između težine i visine, koji je od ovih znakova faktor, koji je rezultat, znanost o "ekonomiji" otkriva logiku odnos između cijene i ponude, utvrđuje što je i u kojoj fazi uzrok, a što posljedica . Bez takvog preliminarnog teorijskog opravdanja interpretacija daljnjih rezultata je otežana, a ponekad može dovesti do apsurdnih zaključaka.

Nakon utvrđivanja prisutnosti uzročno-posljedičnih veza, te odnose treba formalizirati, odnosno izraziti komunikacijskom jednadžbom, a najprije odabrati vrstu jednadžbe. Za odabir vrste jednadžbe mogu se preporučiti brojne tehnike. Možete se okrenuti teoriji predmeta gdje se koristi metoda korelacije, recimo da je znanost "agrokemije" možda već dobila odgovor na pitanje kojom jednadžbom treba izraziti odnos: prinos - gnojiva. Ako nema takvog odgovora, tada biste za odabir jednadžbe trebali koristiti neke empirijske podatke i obraditi ih u skladu s tim. Treba odmah reći da se odabirom vrste jednadžbe na temelju empirijskih podataka mora jasno razumjeti da se ova vrsta jednadžbe može koristiti za opisivanje odnosa korištenih podataka. Glavna metoda obrade ovih podataka je konstruiranje grafikona, gdje su vrijednosti faktorske karakteristike iscrtane na apscisnoj osi, a moguće vrijednosti rezultantne karakteristike iscrtane su na ordinatnoj osi. Budući da, po definiciji, ista vrijednost faktorskog atributa odgovara mnogim neizvjesnim vrijednostima rezultirajućeg atributa, kao rezultat gore navedenih radnji dobit ćemo određeni skup točaka koji se naziva korelacijsko polje. Opći izgled korelacijskog polja omogućuje u nizu slučajeva pretpostavku o mogućem obliku jednadžbe. Uz suvremeni razvoj računalne tehnologije, jedna od glavnih metoda za odabir jednadžbi je nabrajanje različitih vrsta jednadžbi. a najbolji se bira onaj koji daje najveći koeficijent determinacije, govor o kojem će biti riječi u nastavku. Prije nego što prijeđemo na izračune, potrebno je provjeriti koliko empirijski podaci korišteni za konstruiranje jednadžbe zadovoljavaju određene zahtjeve. Zahtjevi se odnose na karakteristike faktora i na ukupnost podataka. Faktorske karakteristike, ako ih ima više, moraju biti neovisne jedna o drugoj. Što se tiče ukupnosti, ona najprije mora biti homogena

(o konceptu homogenosti raspravljalo se ranije), i drugo, prilično je velik. Svaka faktorska karakteristika mora imati najmanje 8-10 opažanja.

Nakon odabira jednadžbe, sljedeći korak je izračunavanje koeficijenata jednadžbe. Izračun koeficijenata jednadžbe najčešće se provodi metodom najmanjih kvadrata. Sa stajališta korelacije, korištenje metode najmanjih kvadrata sastoji se od dobivanja koeficijenata jednadžbe tako da
=min, odnosno tako da je zbroj kvadrata odstupanja stvarnih vrijednosti rezultirajuće karakteristike ( ) od onih izračunatih jednadžbom ( ) bila je minimalna vrijednost. Taj se zahtjev ostvaruje konstruiranjem i rješavanjem dobro poznatog sustava tzv. normalnih jednadžbi. Ako, kao jednadžba za korelaciju između g I x odabrana je jednadžba pravca
, gdje će sustav normalnih jednadžbi, kao što je poznato, biti ovakav:

Rješavanje ovog sustava za a I b , dobivamo potrebne vrijednosti koeficijenata. Ispravnost izračuna koeficijenata provjerava se jednakošću

Za što se koristi analiza varijance? Svrha analize varijance je proučavanje prisutnosti ili odsutnosti značajnog utjecaja bilo kojeg kvalitativnog ili kvantitativnog čimbenika na promjene u rezultirajućoj karakteristici koja se proučava. Da bi se to postiglo, čimbenik za koji se vjeruje da ima ili nema značajan učinak dijeli se u gradacijske klase (drugim riječima, skupine) i utvrđuje se je li utjecaj čimbenika isti ispitivanjem značajnosti između srednjih vrijednosti u skupovima podataka koji odgovaraju gradacijama faktora. Primjeri: proučava se ovisnost dobiti poduzeća o vrsti korištenih sirovina (tada su gradacijski razredi vrste sirovina), ovisnost troška proizvodnje po jedinici proizvodnje o veličini odjela poduzeća (tada gradacijski razredi su karakteristike veličine odjela: veliki, srednji, mali).

Minimalan broj gradacijskih razreda (grupa) je dva. Maturalna nastava može biti kvalitativna i kvantitativna.

Zašto se analiza varijance naziva analizom varijance? Analiza varijance ispituje odnos između dvije varijance. Disperzija je, kao što znamo, karakteristika disperzije podataka oko prosječne vrijednosti. Prva je disperzija objašnjena utjecajem faktora, koja karakterizira disperziju vrijednosti između gradacija faktora (skupina) oko prosjeka svih podataka. Druga je neobjašnjiva varijanca, koja karakterizira disperziju podataka unutar stupnjeva (grupa) oko prosječnih vrijednosti samih grupa. Prva se varijanca može nazvati između grupa, a druga - unutar grupa. Omjer ovih varijanci naziva se stvarni Fisherov omjer i uspoređuje se s kritičnom vrijednošću Fisherovog omjera. Ako je stvarni Fisherov omjer veći od kritičnog, tada se prosjeci gradacijskih razreda međusobno razlikuju i faktor koji se proučava značajno utječe na promjenu podataka. Ako je manji, tada se prosječni gradacijski razredi međusobno ne razlikuju i faktor nema značajan utjecaj.

Kako se hipoteze formuliraju, prihvaćaju i odbacuju u ANOVA-i? U analizi varijance utvrđuje se specifična težina ukupnog utjecaja jednog ili više čimbenika. Značajnost utjecaja faktora utvrđuje se testiranjem hipoteza:

  • H0 : μ 1 = μ 2 = ... = μ a, Gdje a- broj gradacijskih razreda - svi gradacijski razredi imaju istu prosječnu vrijednost,
  • H1 : Ne sve μ ja jednako - nemaju svi gradacijski razredi istu prosječnu vrijednost.

Ako utjecaj faktora nije značajan, tada je razlika između gradacijskih klasa tog faktora također beznačajna i tijekom analize varijance nulta hipoteza H0 se ne odbija. Ako je utjecaj čimbenika značajan, onda je nulta hipoteza H0 odbijeno: nemaju svi gradacijski razredi istu srednju vrijednost, odnosno među mogućim razlikama između gradacijskih razreda jedna ili više njih su značajne.

Još neki pojmovi analize varijance. Statistički kompleks u analizi varijance je tablica empirijskih podataka. Ako sve klase stupnjevanja imaju isti broj opcija, tada se statistički kompleks naziva homogenim (homogenim), ako je broj opcija različit - heterogenim (heterogenim).

Ovisno o broju čimbenika koji se procjenjuju, razlikuju se jednofaktorska, dvofaktorska i višefaktorska analiza varijance.

Jednofaktorska analiza varijance: suština metode, formule, primjeri

Suština metode, formula

temelji se na činjenici da se zbroj kvadrata odstupanja statističkog kompleksa može podijeliti na komponente:

SS = SS a+ SS e,

SS

SSa a zbroj kvadrata odstupanja,

SSe- neobjašnjen zbroj kvadratnih odstupanja ili zbroj kvadratnih odstupanja pogreške.

Ako kroz nja naznačiti broj opcija u svakom gradacijskom razredu (skupini) i a je ukupni broj stupnjevanja faktora (grupa), zatim je ukupni broj opažanja i mogu se dobiti sljedeće formule:

ukupan broj kvadrata odstupanja: ,

objasniti utjecajem faktora a zbroj kvadrata odstupanja: ,

neobjašnjivi zbroj kvadratnih odstupanja ili zbroj kvadratnih odstupanja: ,

- opći prosjek opažanja,

(skupina).

Osim,

gdje je varijanca gradacije faktora (grupe).

Da biste proveli jednosmjernu analizu varijance podataka iz statističkog kompleksa, morate pronaći stvarni Fisherov omjer - omjer varijance objašnjene utjecajem faktora (međugrupna) i neobjašnjene varijance (unutargrupna):

i usporedite je s Fisherovom kritičnom vrijednošću.

Odstupanja se izračunavaju na sljedeći način:

Objašnjenje varijance,

Neobjašnjena varijanca

va = a − 1 - broj stupnjeva slobode objašnjene varijance,

ve = na - broj stupnjeva slobode neobjašnjene varijance,

v = n

Kritična vrijednost Fisherovog omjera s određenim vrijednostima razine značajnosti i stupnjeva slobode može se pronaći u statističkim tablicama ili izračunati pomoću MS Excel funkcije F.OBR (slika ispod, za povećanje kliknite na nju tipkom lijevom tipkom miša).


Funkcija zahtijeva unos sljedećih podataka:

Vjerojatnost - razina značajnosti α ,

Stupnjevi_slobode1 - broj stupnjeva slobode objašnjene varijance va,

Stupnjevi_slobode2 - broj stupnjeva slobode neobjašnjene varijance ve.

Ako je stvarna vrijednost Fisherovog omjera veća od kritične vrijednosti (), tada se nulta hipoteza odbacuje na razini značajnosti. α . To znači da čimbenik značajno utječe na promjenu podataka i podaci su ovisni o faktoru s vjerojatnošću P = 1 − α .

Ako je stvarna vrijednost Fisherovog omjera manja od kritične vrijednosti (), tada se nulta hipoteza ne može odbaciti na razini značajnosti. α . To znači da čimbenik ne utječe značajno na podatke s vjerojatnošću P = 1 − α .

Jednosmjerna ANOVA: Primjeri

Primjer 1. Potrebno je utvrditi utječe li vrsta korištenih sirovina na dobit poduzeća. U šest gradacijskih klasa (skupina) faktora (1. vrsta, 2. vrsta itd.) prikupljaju se podaci o dobiti od proizvodnje 1000 jedinica proizvoda u milijunima rubalja tijekom 4 godine.

Vrsta sirovine2014 2015 2016 2017
17,21 7,55 7,29 7,6
27,89 8,27 7,39 8,18
37,25 7,01 7,37 7,53
47,75 7,41 7,27 7,42
57,7 8,28 8,55 8,6
67,56 8,05 8,07 7,84
Prosjek
Disperzija
7,413 0,0367
7,933 0,1571
7,290 0,0480
7,463 0,0414
8,283 0,1706
7,880 0,0563

a= 6 i u svakom razredu (skupini) ni=4 zapažanja. Ukupan broj opažanja n = 24 .

Broj stupnjeva slobode:

va = a − 1 = 6 − 1 = 5 ,

ve = na = 24 − 6 = 18 ,

v = n − 1 = 24 − 1 = 23 .

Izračunajmo varijance:

.

.

Budući da je stvarni Fischerov omjer veći od kritičnog:

s razinom značaja α = 0,05 zaključujemo da se dobit poduzeća, ovisno o vrsti sirovina koje se koriste u proizvodnji, značajno razlikuje.

Ili, što je isto, odbacujemo glavnu hipotezu o jednakosti prosjeka u svim gradacijskim razredima (skupinama) faktora.

U upravo razmatranom primjeru, svaka klasa gradacije faktora imala je isti broj opcija. No, kao što je spomenuto u uvodnom dijelu, broj opcija može varirati. A to ni na koji način ne komplicira postupak analize varijance. Ovo je sljedeći primjer.

Primjer 2. Potrebno je utvrditi postoji li ovisnost troška proizvodnje po jedinici proizvodnje o veličini odjela poduzeća. Faktor (veličina jedinice) podijeljen je u tri gradacijske klase (skupine): mali, srednji, veliki. Podaci koji odgovaraju ovim skupinama o troškovima proizvodnje jedinice iste vrste proizvoda za određeno razdoblje su sažeti.

maliprosjekvelik
48 47 46
50 61 57
63 63 57
72 47 55
43 32
59 59
58
Prosjek58,6 54,0 51,0
Disperzija128,25 65,00 107,60

Broj klasa gradacije faktora (grupa) a= 3, broj promatranja u razredima (grupama) n1 = 4 , n2 = 7 , n3 = 6 . Ukupan broj opažanja n = 17 .

Broj stupnjeva slobode:

va = a − 1 = 2 ,

ve = na = 17 − 3 = 14 ,

v = n − 1 = 16 .

Izračunajmo zbroj kvadrata odstupanja:

Izračunajmo varijance:

,

.

Izračunajmo stvarni Fisherov omjer:

.

Kritična vrijednost Fisherovog omjera:

Budući da je stvarna vrijednost Fisherovog omjera manja od kritične: , zaključujemo da veličina odjela poduzeća nema značajan utjecaj na trošak proizvodnje.

Ili, što je isto, s vjerojatnošću od 95% prihvaćamo glavnu hipotezu da se prosječni trošak proizvodnje jedinice istog proizvoda u malim, srednjim i velikim odjelima poduzeća značajno ne razlikuje.

Jednosmjerna ANOVA u MS Excelu

Jednosmjernu analizu varijance moguće je provesti pomoću MS Excel procedure Jednosmjerna ANOVA. Koristimo ga za analizu podataka o odnosu između vrste korištenih sirovina i dobiti poduzeća iz primjera 1.

Analiza usluga/podataka i odaberite alat za analizu Jednosmjerna ANOVA.

U prozoru Interval unosa navedite područje podataka (u našem slučaju to je $A$2:$E$7). Označavamo kako je faktor grupiran - po stupcima ili po redovima (u našem slučaju po redovima). Ako prvi stupac sadrži nazive klasa faktora, označite okvir Oznake u prvom stupcu. U prozoru Alfa ukazuju na razinu značaja α = 0,05 .

Druga tablica - Analiza varijance - sadrži podatke o vrijednostima za faktor između grupa i unutar grupa i ukupne iznose. Ovo je zbroj kvadrata odstupanja (SS), broja stupnjeva slobode (df), disperzije (MS). Posljednja tri stupca sadrže stvarnu vrijednost Fisherova omjera (F), p-razinu (P-vrijednost) i kritičnu vrijednost Fisherova omjera (F crit).

MS F P-vrijednost F krit
0,58585 6,891119 0,000936 2,77285
0,085017

Budući da je stvarna vrijednost Fisherovog koeficijenta (6,89) veća od kritične (2,77), s vjerojatnošću od 95% odbacujemo nultu hipotezu o jednakosti prosječne produktivnosti pri korištenju svih vrsta sirovina, tj. zaključiti da vrsta korištenih sirovina utječe na profit poduzeća.

Dvofaktorska analiza varijance bez ponavljanja: suština metode, formule, primjer

Dvofaktorska analiza varijance koristi se za provjeru moguće ovisnosti rezultirajuće karakteristike o dva faktora - A I B. Zatim a- broj stupnjevanja faktora A I b- broj stupnjevanja faktora B. U statističkom kompleksu zbroj kvadrata reziduala podijeljen je na tri komponente:

SS = SS a+ SS b+ SS e,

- ukupni zbroj kvadrata odstupanja,

- objašnjeno utjecajem faktora A zbroj kvadrata odstupanja,

- objašnjeno utjecajem faktora B zbroj kvadrata odstupanja,

- opći prosjek opažanja,

Prosjek opažanja u svakoj gradaciji faktora A ,

B .

A ,

Varijanca objašnjena utjecajem faktora B ,

va = a − 1 A ,

vb = b − 1 - broj stupnjeva slobode disperzije koji se objašnjava utjecajem faktora B ,

ve = ( a − 1)(b − 1)

v = ab− 1 - ukupan broj stupnjeva slobode.

Ako čimbenici ne ovise jedan o drugome, tada se za određivanje značaja čimbenika postavljaju dvije nulte hipoteze i odgovarajuće alternativne hipoteze:

za faktor A :

H0 : μ 1A = μ 2A = ... = μ aA,

H1 : Ne sve μ iA jednak;

za faktor B :

H0 : μ 1B = μ 2B = ... = μ aB,

H1 : Ne sve μ iB su jednaki.

A

Za utvrđivanje utjecaja faktora B, trebate usporediti stvarni Fischerov stav s kritičnim Fischerovim stavom.

α P = 1 − α .

α P = 1 − α .

Dvosmjerna ANOVA bez ponavljanja: primjer

Primjer 3. Dane su informacije o prosječnoj potrošnji goriva na 100 kilometara u litrama ovisno o veličini motora i vrsti goriva.

Potrebno je provjeriti ovisi li potrošnja goriva o veličini motora i vrsti goriva.

Riješenje. Za faktor A broj gradacijskih razreda a= 3, za faktor B broj gradacijskih razreda b = 3 .

Izračunavamo zbroj kvadrata odstupanja:

,

,

,

.

Odgovarajuće varijance:

,

,

.

A . Budući da je stvarni Fisherov omjer manji od kritičnog, s vjerojatnošću od 95% prihvaćamo hipotezu da volumen motora ne utječe na potrošnju goriva. Međutim, ako odaberemo razinu značajnosti α = 0,1, zatim stvarna vrijednost Fisherovog omjera i tada s vjerojatnošću od 95% možemo prihvatiti da volumen motora utječe na potrošnju goriva.

Stvarni Fisherov omjer za faktor B , kritična vrijednost Fisherovog omjera: . Budući da je stvarni Fisherov omjer veći od kritične vrijednosti Fisherova omjera, s 95% vjerojatnosti prihvaćamo da vrsta goriva utječe na njegovu potrošnju.

Dvosmjerna ANOVA bez ponavljanja u MS Excelu

Dvofaktorsku analizu varijance bez ponavljanja moguće je provesti postupkom MS Excel. Njime analiziramo podatke o odnosu vrste goriva i njegove potrošnje iz primjera 3.

U izborniku MS Excel izvršite naredbu Analiza usluga/podataka i odaberite alat za analizu Dvosmjerna ANOVA bez ponavljanja.

Podatke popunjavamo na isti način kao i kod jednosmjerne analize varijance.


Kao rezultat postupka prikazuju se dvije tablice. Prva tablica je Totals. Sadrži podatke o svim klasama gradacije faktora: broj opažanja, ukupnu vrijednost, srednju vrijednost i varijancu.

Druga tablica – Analiza varijance – sadrži podatke o izvorima varijacije: disperzija između redaka, disperzija između stupaca, disperzija pogreške, ukupna disperzija, zbroj kvadrata odstupanja (SS), stupnjevi slobode (df), disperzija (MS). Posljednja tri stupca sadrže stvarnu vrijednost Fisherova omjera (F), p-razinu (P-vrijednost) i kritičnu vrijednost Fisherova omjera (F crit).

MS F P-vrijednost F krit
3,13 5,275281 0,075572 6,94476
8,043333 13,55618 0,016529 6,944276
0,593333

Faktor A(zapremina motora) grupiran je u linije. Budući da je stvarni Fisherov omjer od 5,28 manji od kritičnog od 6,94, prihvaćamo s 95% vjerojatnosti da potrošnja goriva ne ovisi o veličini motora.

Faktor B(vrsta goriva) grupiran je u stupce. Stvarni Fisherov omjer od 13,56 veći je od kritičnog omjera od 6,94, tako da s 95% vjerojatnosti prihvaćamo da potrošnja goriva ovisi o njegovoj vrsti.

Dvofaktorska analiza varijance s ponavljanjima: bit metode, formule, primjer

Dvofaktorska analiza varijance s ponavljanjima koristi se za provjeru ne samo moguće ovisnosti rezultirajuće karakteristike o dva čimbenika - A I B, ali i moguće međudjelovanje čimbenika A I B. Zatim a- broj stupnjevanja faktora A I b- broj stupnjevanja faktora B, r- broj ponavljanja. U statističkom kompleksu zbroj kvadrata reziduala podijeljen je na četiri komponente:

SS = SS a+ SS b+ SS ab + SS e,

- ukupni zbroj kvadrata odstupanja,

- objašnjeno utjecajem faktora A zbroj kvadrata odstupanja,

- objašnjeno utjecajem faktora B zbroj kvadrata odstupanja,

- objašnjava se utjecajem međudjelovanja faktora A I B zbroj kvadrata odstupanja,

- neobjašnjen zbroj kvadratnih odstupanja ili zbroj kvadratnih odstupanja od pogreške,

- opći prosjek opažanja,

- prosjek opažanja u svakoj gradaciji faktora A ,

- prosječan broj opažanja u svakoj gradaciji faktora B ,

Prosječan broj opažanja u svakoj kombinaciji stupnjevanja faktora A I B ,

n = abr- ukupan broj opažanja.

Odstupanja se izračunavaju na sljedeći način:

Varijanca objašnjena utjecajem faktora A ,

Varijanca objašnjena utjecajem faktora B ,

- varijanca objašnjena međudjelovanjem faktora A I B ,

- neobjašnjiva varijanca ili varijanca pogreške,

va = a − 1 - broj stupnjeva slobode disperzije koji se objašnjava utjecajem faktora A ,

vb = b − 1 - broj stupnjeva slobode disperzije koji se objašnjava utjecajem faktora B ,

vab = ( a − 1)(b − 1) - broj stupnjeva slobode varijance objašnjen međudjelovanjem faktora A I B ,

ve = ab(r − 1) - broj stupnjeva slobode neobjašnjive varijance ili varijance pogreške,

v = abr− 1 - ukupan broj stupnjeva slobode.

Ako čimbenici ne ovise jedan o drugome, tada se za određivanje značaja čimbenika postavljaju tri nulte hipoteze i odgovarajuće alternativne hipoteze:

za faktor A :

H0 : μ 1A = μ 2A = ... = μ aA,

H1 : Ne sve μ iA jednak;

za faktor B :

Utvrditi utjecaj međudjelovanja faktora A I B, trebate usporediti stvarni Fischerov stav s kritičnim Fischerovim stavom.

Ako je stvarni Fisherov omjer veći od kritičnog Fisherovog omjera, tada nultu hipotezu treba odbaciti na razini značajnosti α . To znači da faktor značajno utječe na podatke: podaci ovise o faktoru s vjerojatnošću P = 1 − α .

Ako je stvarni Fisherov omjer manji od kritičnog Fisherovog omjera, tada se nulta hipoteza treba prihvatiti na razini značajnosti α . To znači da čimbenik ne utječe značajno na podatke s vjerojatnošću P = 1 − α .

Dvosmjerna ANOVA s ponavljanjima: primjer

o međudjelovanju faktora A I B: Fisherov stvarni omjer manji je od kritičnog, stoga interakcija reklamne kampanje i određene trgovine nije značajna.

Dvosmjerna analiza varijance s ponavljanjima u MS Excelu

Dvosmjerna analiza varijance s replikatima može se provesti pomoću MS Excel procedure. Njime analiziramo podatke o odnosu prihoda trgovine i odabira konkretne trgovine i reklamne kampanje iz primjera 4.

U izborniku MS Excel izvršite naredbu Analiza usluga/podataka i odaberite alat za analizu Dvosmjerna ANOVA s ponavljanjima.

Podatke popunjavamo na isti način kao i kod dvofaktorske analize varijance bez ponavljanja, s tim da u broj redaka za prozor uzorka treba unijeti broj ponavljanja.

Kao rezultat postupka prikazuju se dvije tablice. Prva tablica sastoji se od tri dijela: prva dva odgovaraju svakoj od dvije reklamne kampanje, a treća sadrži podatke o obje reklamne kampanje. Stupci tablice sadrže informacije o svim gradacijskim klasama drugog faktora - store: broj opažanja, ukupna vrijednost, srednja vrijednost i disperzija.

Druga tablica sadrži podatke o zbroju kvadrata odstupanja (SS), broju stupnjeva slobode (df), disperziji (MS), stvarnoj vrijednosti Fisherovog omjera (F), p-razini (P-value) i kritična vrijednost Fisherovog omjera (F crit) za različite izvore varijacije: dva faktora, koji su dati u recima (uzorak) i stupcima, interakcija faktora, pogreška (unutar) i ukupni pokazatelji (ukupno).

MS F P-vrijednost F krit
8,013339 0,500252 0,492897 4,747221
189,1904 11,81066 0,001462 3,88529
6,925272 0,432327 0,658717 3,88529
16,01861

Za faktor B Stvarni Fisherov omjer veći je od kritičnog omjera, stoga postoji 95% vjerojatnosti da se prihodi značajno razlikuju između trgovina.

Za interakciju faktora A I B Fisherov stvarni omjer je manji od kritičnog, stoga, s vjerojatnošću od 95%, interakcija reklamne kampanje i određene trgovine nije značajna.

Sve na temu "Matematička statistika"

Analiza varijance(od latinskog Dispersio - disperzija / na engleskom Analysis Of Variance - ANOVA) koristi se za proučavanje utjecaja jedne ili više kvalitativnih varijabli (faktora) na jednu zavisnu kvantitativnu varijablu (odgovor).

Temelj analize varijance je pretpostavka da se neke varijable mogu smatrati uzrocima (čimbenici, nezavisne varijable): , a druge posljedicama (ovisne varijable). Nezavisne varijable ponekad se nazivaju prilagodljivim faktorima upravo zato što u eksperimentu istraživač ima priliku varirati ih i analizirati dobiveni rezultat.

Glavni cilj analiza varijance(ANOVA) je proučavanje značajnosti razlika između srednjih vrijednosti korištenjem usporedbe (analize) varijanci. Dijeljenje ukupne varijance na više izvora omogućuje usporedbu varijance zbog razlika između grupa s varijancom zbog varijance unutar grupe. Ako je nulta hipoteza (da su srednje vrijednosti jednake u nekoliko skupina opažanja odabranih iz populacije) točna, procjena varijance povezana s varijabilnošću unutar grupe trebala bi biti blizu procjene varijance između grupa. Ako jednostavno uspoređujete srednje vrijednosti u dva uzorka, ANOVA će dati isti rezultat kao obični t-test neovisnih uzoraka (ako se uspoređuju dvije neovisne skupine subjekata ili opažanja) ili t-test zavisnih uzoraka (ako se uspoređuju dvije varijable na istom i isti skup objekata ili opažanja).

Bit analize varijance je podijeliti ukupnu varijancu svojstva koje se proučava na pojedinačne komponente određene utjecajem pojedinih čimbenika, te provjeriti hipoteze o značaju utjecaja tih čimbenika na svojstvo koje se proučava. Međusobnom usporedbom komponenti varijance korištenjem Fisherova F testa moguće je odrediti koji je udio ukupne varijabilnosti rezultirajućeg atributa posljedica djelovanja kontroliranih čimbenika.

Izvorni materijal za analizu varijance su podaci iz studije tri ili više uzoraka: , koji mogu biti jednakog ili nejednakog broja, povezani i nekoherentni. Prema broju identificiranih reguliranih čimbenika može se analiza varijance jednofaktorski(u ovom slučaju proučava se utjecaj jednog čimbenika na rezultate pokusa), dvofaktorski(kada se proučava utjecaj dva faktora) i multifaktorski(omogućuje procjenu ne samo utjecaja svakog čimbenika zasebno, već i njihove interakcije).

Analiza varijance spada u skupinu parametarskih metoda i stoga se treba koristiti samo kada se dokaže da je distribucija normalna.

Analiza varijance koristi se ako se zavisna varijabla mjeri na skali omjera, intervala ili reda, a utjecajne varijable su nenumeričke prirode (ljestvica naziva).

Uzorak problema

U zadacima koji se rješavaju analizom varijance javlja se odgovor numeričke prirode na koji utječe nekoliko varijabli nominalne prirode. Na primjer, nekoliko vrsta obroka za tov stoke ili dva načina držanja i sl.

Primjer 1: Nekoliko je ljekarničkih kioska radilo na tri različite lokacije tijekom cijelog tjedna. U budućnosti možemo ostaviti samo jedno. Potrebno je utvrditi postoji li statistički značajna razlika između obujma prodaje lijekova na kioscima. Ako da, odabrat ćemo kiosk s najvećim prosječnim dnevnim opsegom prodaje. Ako se razlika u obujmu prodaje pokaže statistički beznačajnom, tada bi osnova za odabir kioska trebali biti drugi pokazatelji.

Primjer 2: Usporedba kontrasta srednjih skupina. Sedam političkih opredjeljenja poredano je od ekstremno liberalnih do ekstremno konzervativnih, a koristi se linearni kontrast kako bi se testiralo postoji li tendencija povećanja srednjih vrijednosti grupe različita od nule – to jest, postoji li značajno linearno povećanje prosječne dobi kada se razmatraju poredane grupe u smjeru od liberala prema konzervativcima.

Primjer 3: Dvofaktorska analiza varijance. Na broj prodaja proizvoda, osim veličine trgovine, često utječe i položaj polica s proizvodom. Ovaj primjer sadrži tjedne podatke o prodaji za četiri rasporeda polica i tri veličine trgovine. Rezultati analize pokazuju da oba čimbenika - položaj polica s robom i veličina trgovine - utječu na broj prodaja, ali njihova interakcija nije značajna.

Primjer 4: Univarijatna ANOVA: Randomizirani puni blok dizajn s dva tretmana. Istražuje se učinak svih mogućih kombinacija triju masti i triju dizalaca tijesta na pečenje kruha. Treba odrediti četiri uzorka brašna uzeta iz četiri različita izvora. Nakon toga identificirajte različite mogućnosti za odabir kontrasta koji vam omogućuju da saznate koje se kombinacije razina faktora razlikuju.

Primjer 5: Hijerarhijski (clustered) model dizajna s mješovitim učincima. Proučava se učinak četiri nasumično odabrane glave postavljene na stroj na deformaciju proizvedenih staklenih katodnih držača. (Glave su ugrađene u stroj, tako da se ista glava ne može koristiti na različitim strojevima.) Učinak glave se tretira kao slučajni faktor. ANOVA statistika pokazuje da nema značajnih razlika između strojeva, ali postoje naznake da se glave mogu razlikovati. Razlika između svih strojeva nije značajna, ali za dva od njih razlika između tipova glava je značajna.

Primjer 6: Univarijatna analiza ponovljenih mjerenja korištenjem split-plot dizajna. Ovaj eksperiment je proveden kako bi se odredio učinak pojedinačnih ocjena anksioznosti na uspješnost ispita tijekom četiri uzastopna pokušaja. Podaci su organizirani tako da se mogu promatrati kao grupe podskupova cijelog skupa podataka ("cijeli dijagram"). Učinak anksioznosti bio je beznačajan, ali je učinak pokušaja bio značajan.

Popis metoda

  • Faktorski eksperimentalni modeli. Primjeri: čimbenici koji utječu na uspješnost rješavanja matematičkih zadataka; čimbenici koji utječu na količinu prodaje.

Podaci se sastoje od nekoliko serija opažanja (procesa), koji se smatraju realizacijama uzoraka neovisnih jedan o drugom. Početna hipoteza kaže da nema razlike u tretmanima, tj. pretpostavlja se da se sva promatranja mogu smatrati jednim uzorkom iz ukupne populacije:

  • Jednofaktorski parametarski model: Scheffeova metoda.
  • Jednofaktorski neparametarski model [Lagutin M.B., 237]: Kruskal-Wallisov test [Hollender M., Wolf D.A., 131], Jonckheereov kriterij [Lagutin M.B., 245].
  • Opći slučaj modela s konstantnim faktorima, Cochranov teorem [Afifi A., Eisen S., 234].

Podaci predstavljaju dvostruka opažanja:

  • Dvofaktorski neparametarski model: Friedmanov kriterij [Lapach, 203], Pageov kriterij [Lagutin M.B., 263]. Primjeri: usporedba učinkovitosti proizvodnih metoda, poljoprivredne prakse.
  • Dvofaktorski neparametarski model za nepotpune podatke

Priča

Odakle ime analiza varijance? Može se činiti čudnim da se postupak za usporedbu srednjih vrijednosti naziva analizom varijance. U stvarnosti je to zato što kada ispitujemo statističku značajnost razlike između srednjih vrijednosti dviju (ili više) grupa, mi zapravo uspoređujemo (analiziramo) varijance uzorka. Predlaže se temeljni koncept analize varijance Fischer 1920. godine. Možda bi prirodniji termin bio analiza zbroja kvadrata ili analiza varijacije, no zbog tradicije koristi se termin analiza varijance. U početku je analiza varijance razvijena za obradu podataka dobivenih tijekom posebno dizajniranih eksperimenata, te se smatrala jedinom metodom koja ispravno ispituje uzročne veze. Metoda je korištena za ocjenu pokusa u biljnoj proizvodnji. Naknadno je postalo jasno opće znanstveno značenje analize varijance za eksperimente u psihologiji, pedagogiji, medicini itd.

Književnost

  1. Sheffe G. Analiza varijance. - M., 1980.
  2. Ahrens H. Leuter Yu. Multivarijantna analiza varijance.
  3. Kobzar A. I. Primijenjena matematička statistika. - M.: Fizmatlit, 2006.
  4. Lapach S. N., Chubenko A. V., Babich P. N. Statistika u znanosti i poslovanju. - Kijev: Morion, 2002.
  5. Lagutin M. B. Vizualna matematička statistika. U dva sveska. - M.: P-centar, 2003.
  6. Afifi A., Eisen S. Statistička analiza: računalni pristup.
  7. Hollender M., Wolf D.A. Neparametarske metode statistike.

Linkovi

  • Analiza varijance - Elektronički udžbenik StatSoft.


 


Čitati:



Pogačice od svježeg sira u tavi - klasični recepti za pahuljaste pogačice sa sirom Pogačice od 500 g svježeg sira

Pogačice od svježeg sira u tavi - klasični recepti za pahuljaste pogačice sa sirom Pogačice od 500 g svježeg sira

Sastojci: (4 porcije) 500 gr. svježeg sira 1/2 šalice brašna 1 jaje 3 žlice. l. šećera 50 gr. grožđice (po želji) prstohvat soli sode bikarbone...

Crni biser salata sa suhim šljivama Crni biser sa suhim šljivama

Salata

Dobar dan svima koji teže raznovrsnosti u svakodnevnoj prehrani. Ako ste umorni od monotonih jela i želite ugoditi...

Lecho s tijestom od rajčice recepti

Lecho s tijestom od rajčice recepti

Vrlo ukusan lecho s tijestom od rajčice, poput bugarskog lechoa, pripremljen za zimu. Ovako se u našoj obitelji obradi (i pojede!) 1 vrećica paprike. A koga bih ja...

Aforizmi i citati o samoubojstvu

Aforizmi i citati o samoubojstvu

Evo citata, aforizama i duhovitih izreka o samoubojstvu. Ovo je prilično zanimljiv i neobičan izbor pravih “bisera...

feed-image RSS