rumah - Lantai
Analisis varians sehala. Analisis pelbagai variasi bagi varians Analisis artikel varians

ANOVA berdasarkan karya ahli matematik terkenal R.A. Fisher... Walaupun "umur" yang agak kukuh, kaedah ini masih kekal sebagai salah satu yang utama dalam penyelidikan biologi dan pertanian. Idea yang mendasari analisis varians digunakan secara meluas dalam banyak kaedah analisis matematik data eksperimen lain, serta dalam perancangan eksperimen biologi dan pertanian.

Analisis varians membolehkan anda:

1) bandingkan dua atau lebih sampel min;

2) secara serentak mengkaji tindakan beberapa faktor bebas, sementara adalah mungkin untuk menentukan kedua-dua kesan setiap faktor dalam kebolehubahan sifat yang dikaji, dan interaksi mereka;

3) merancang eksperimen saintifik dengan betul.

Kebolehubahan organisma hidup dimanifestasikan dalam bentuk taburan atau taburan nilai sifat individu dalam had yang ditentukan oleh tahap kesamarataan biologi bahan dan sifat hubungan dengan keadaan persekitaran. Tanda-tanda yang berubah di bawah pengaruh sebab-sebab tertentu dipanggil berkesan.

Faktor ialah sebarang pengaruh atau keadaan, yang kepelbagaiannya boleh mempengaruhi kepelbagaian atribut berkesan. Pengaruh statistik faktor dalam analisis varians difahami sebagai refleksi dalam kepelbagaian penunjuk berkesan kepelbagaian faktor yang dikaji, yang dianjurkan dalam kajian.

Dengan kepelbagaian yang kami maksudkan ialah kehadiran nilai yang tidak sama bagi setiap sifat dalam individu yang berbeza digabungkan menjadi satu kumpulan. Kepelbagaian sekumpulan individu mengikut sifat yang dikaji boleh mempunyai darjah yang berbeza, yang biasanya diukur dengan penunjuk kepelbagaian (atau kebolehubahan): had, sisihan piawai, pekali variasi. Dalam analisis varians, tahap kepelbagaian nilai individu dan purata sifat diukur dan dibandingkan dengan cara khas yang membentuk spesifik kaedah umum ini.

Organisasi faktor ialah beberapa nilai diberikan kepada setiap faktor yang dikaji. Selaras dengan nilai ini, setiap faktor dibahagikan kepada beberapa penggredan; bagi setiap penggredan, beberapa individu dipilih mengikut prinsip persampelan rawak, di mana nilai sifat berkesan kemudiannya diukur.

Untuk mengetahui tahap dan kebolehpercayaan pengaruh faktor yang dikaji, adalah perlu untuk mengukur dan menilai bahagian daripada jumlah kepelbagaian yang disebabkan oleh faktor-faktor ini.

Faktor yang mempengaruhi tahap variasi sifat berkesan terbahagi kepada:

1) boleh laras

2) rawak

Terkawal (sistematik) faktor adalah disebabkan oleh tindakan faktor yang dikaji dalam eksperimen, yang mempunyai beberapa penggredan dalam eksperimen. Penggredan faktor- ini ialah tahap impaknya terhadap ciri berkesan. Selaras dengan penggredan atribut, beberapa varian percubaan diserlahkan untuk perbandingan. Oleh kerana faktor ini diprasyaratkan, ia dipanggil dikawal dalam penyelidikan, i.e. diberikan, bergantung kepada organisasi eksperimen. Akibatnya, faktor boleh laras ialah faktor yang tindakannya dikaji dalam pengalaman, ialah yang menentukan perbezaan antara cara sampel pilihan yang berbeza - varians antara kumpulan (faktorial).

Faktor rawak ditentukan oleh variasi semula jadi semua tanda objek biologi dalam alam semula jadi. Ini adalah faktor di luar kawalan pengalaman. Mereka mempunyai kesan rawak pada sifat berkesan, menyebabkan ralat eksperimen dan menentukan serakan (serakan) sifat dalam setiap varian. Penyebaran ini dipanggil varians intrakumpulan (rawak)..

Oleh itu, peranan relatif faktor individu dalam kebolehubahan keseluruhan sifat berkesan dicirikan oleh varians dan boleh dikaji menggunakan analisis varians atau analisis serakan

ANOVA adalah berdasarkan perbandingan varians antara kumpulan dan dalam kumpulan... Jika varians antara kumpulan tidak melebihi varians intrakumpulan, maka perbezaan antara kumpulan adalah rawak. Jika varians antara kumpulan jauh lebih tinggi daripada varians intrakumpulan, maka antara kumpulan yang dikaji (pilihan) terdapat perbezaan yang signifikan secara statistik disebabkan oleh tindakan faktor yang dikaji dalam eksperimen.

Berikutan daripada ini bahawa dalam kajian statistik sifat berkesan menggunakan analisis varians, adalah perlu untuk menentukan variasinya dalam varian, ulangan, variasi baki dalam kumpulan ini dan variasi umum sifat berkesan dalam eksperimen. Selaras dengan ini, tiga jenis penyebaran dibezakan:

1) Varians am bagi sifat berkesan (S y 2);

2) Antara kumpulan, atau persendirian, antara sampel (S y 2);

3) Dalam kumpulan, baki (S z 2).

Oleh itu, analisis variansIni ialah pembahagian jumlah jumlah kuasa dua sisihan dan jumlah bilangan darjah kebebasan kepada bahagian atau komponen yang sepadan dengan struktur eksperimen, dan penilaian kepentingan tindakan dan interaksi faktor yang dikaji. oleh kriteria F. Bergantung kepada bilangan faktor yang dikaji secara serentak, analisis varians dua, tiga, empat faktor dibezakan.

Apabila memproses kompleks statistik satu faktor medan yang terdiri daripada beberapa pilihan bebas, jumlah kebolehubahan sifat berkesan, diukur dengan jumlah jumlah kuasa dua (C y), dibahagikan kepada tiga komponen: variasi antara pilihan (sampel) - CV , variasi ulangan (pilihan berkaitan antara satu sama lain oleh keadaan terkawal biasa - kehadiran ulangan teratur) - C p dan variasi dalam pilihan C z. Dalam bentuk umum, kebolehubahan sesuatu sifat diwakili oleh ungkapan berikut:

C y = C V + C p + C z.

Jumlah darjah kebebasan (N -1) juga dibahagikan kepada tiga bahagian:

darjah kebebasan untuk pilihan (l - 1);

darjah kebebasan untuk pengulangan (n - 1);

variasi rawak (n - 1) × (l - 1).

Jumlah kuasa dua sisihan, mengikut eksperimen lapangan - kompleks statistik dengan pilihan - l dan ulangan - n, didapati seperti berikut. Pertama, menggunakan jadual asal, jumlah ulangan ditentukan - Σ P, untuk varian - Σ V dan jumlah keseluruhan semua cerapan - Σ X.

Kemudian penunjuk berikut dikira:

Jumlah bilangan cerapan N = l × n;

Faktor pembetulan (pindaan) C cor = (Σ X 1) 2 / N;

Jumlah jumlah kuasa dua Cy = Σ X 1 2 - C cor;

Jumlah kuasa dua untuk ulangan C p = Σ P 2 / (l –C cor);

Jumlah kuasa dua untuk pilihan C V = Σ V 2 / (n - 1);

Jumlah kuasa dua untuk ralat (baki) C Z = C y - C p - C V.

Jumlah kuasa dua C V dan C Z yang terhasil dibahagikan dengan darjah kebebasan yang sepadan dengannya dan dua kuasa dua min (varians) diperoleh:

Varian S v 2 = C V / l - 1;

Ralat S Z 2 = C Z / (n - 1) × (l - 1).

Penilaian kepentingan perbezaan antara cara. Kuasa dua min yang diperoleh digunakan dalam analisis varians untuk menilai kepentingan tindakan faktor yang dikaji dengan membandingkan varians pilihan (S v 2) dengan varians ralat (SZ 2) mengikut kriteria Fisher (F = SY 2 / SZ 2). Unit perbandingan ialah purata kuasa dua bagi varians rawak, yang menentukan ralat rawak eksperimen.

Penggunaan kriteria Fisher membolehkan anda menentukan kehadiran atau ketiadaan perbezaan ketara antara cara sampel, tetapi tidak menunjukkan perbezaan khusus antara cara.

Hipotesis H o - yang diuji ialah andaian bahawa semua min sampel adalah anggaran satu purata am dan perbezaan di antara mereka adalah tidak ketara. Jika F fakta = S Y 2 / S Z 2 ≤ F theor, maka hipotesis nol tidak ditolak. Tiada perbezaan yang ketara antara min sampel, dan di sinilah ujian berakhir. Hipotesis nol ditolak untuk F fact = S Y 2 / S Z 2 ≥ F theor Nilai kriteria F untuk tahap keertian yang diterima pakai dalam kajian didapati dalam jadual yang sepadan, dengan mengambil kira darjah kebebasan untuk varians varian dan varians rawak. Biasanya mereka menggunakan tahap keertian 5%, dan dengan pendekatan yang lebih ketat, 1% - dan juga 0.1%.

Untuk sampel bersaiz n, varians sampel dikira sebagai jumlah sisihan kuasa dua daripada min sampel, dibahagikan dengan n-1(saiz sampel tolak satu). Oleh itu, untuk saiz sampel tetap n, varians ialah fungsi jumlah kuasa dua (penyimpangan), dilambangkan, untuk keringkasan, SS (daripada Jumlah Kuasa Dua Bahasa Inggeris - Jumlah kuasa dua). Selanjutnya, kita sering meninggalkan perkataan sampel, dengan mengetahui sepenuhnya bahawa varians sampel atau anggaran varians sedang dipertimbangkan. Analisis varians adalah berdasarkan membahagikan varians kepada bahagian atau komponen .:

Ralat SS dan SS kesan. kebolehubahan dalam kumpulan ( SS) biasanya dipanggil komponen baki atau varians kesilapan. Ini bermakna biasanya dalam eksperimen ia tidak boleh diramal atau dijelaskan. Di sebelah sana, Kesan SS(atau komponen varians antara kumpulan) boleh dijelaskan dengan perbezaan antara min dalam kumpulan. Dengan kata lain, tergolong dalam kumpulan tertentu menerangkan kebolehubahan antara kumpulan, kerana kita tahu bahawa kumpulan ini mempunyai nilai min yang berbeza.

Logik asas analisis varians. Kesimpulannya, kita boleh mengatakan bahawa tujuan ANOVA adalah untuk menguji kepentingan statistik perbezaan antara min (untuk kumpulan atau pembolehubah). Pemeriksaan ini dijalankan dengan membahagikan jumlah kuasa dua kepada komponen, i.e. dengan membahagikan jumlah varians (variasi) kepada bahagian, satu daripadanya disebabkan oleh ralat rawak (iaitu, kebolehubahan intrakumpulan), dan yang kedua dikaitkan dengan perbezaan nilai min. Komponen terakhir varians kemudiannya digunakan untuk menganalisis kepentingan statistik perbezaan antara min. Jika ini perbezaannya secara bermakna, hipotesis nol ditolak dan hipotesis alternatif tentang kewujudan perbezaan antara cara diterima.

Pembolehubah bersandar dan bebas. Pembolehubah yang nilainya ditentukan oleh pengukuran semasa percubaan (contohnya, skor yang diperoleh semasa ujian) dipanggil bergantung pembolehubah. Pembolehubah yang boleh dikawal dalam eksperimen (contohnya, kaedah pengajaran atau kriteria lain yang membolehkan anda membahagikan pemerhatian kepada kumpulan atau mengelas) dipanggil faktor atau bebas pembolehubah.

Banyak faktor. Dunia sememangnya kompleks dan pelbagai dimensi. Situasi di mana fenomena diterangkan sepenuhnya oleh satu pembolehubah adalah sangat jarang berlaku. Sebagai contoh, jika kita cuba mempelajari cara menanam tomato besar, faktor yang berkaitan dengan solek genetik tumbuhan, jenis tanah, cahaya, suhu, dan lain-lain harus dipertimbangkan. Oleh itu, terdapat banyak faktor yang perlu ditangani dalam eksperimen biasa. Sebab utama mengapa penggunaan analisis varians adalah lebih baik daripada perbandingan berulang dua sampel pada tahap faktor yang berbeza menggunakan siri. t- kriterianya ialah analisis varians adalah lebih ketara cekap dan, untuk sampel kecil, ia lebih bermaklumat.

Pengeluaran. Analisis varians dibangunkan dan diperkenalkan ke dalam amalan penyelidikan pertanian dan biologi oleh saintis Inggeris R. A. Fisher . Intipati analisis varians terdiri daripada penguraian jumlah kebolehubahan ciri dan jumlah bilangan darjah kebebasan kepada bahagian komponen yang sepadan dengan struktur eksperimen medan, serta dalam penilaian faktor bertindak mengikut kriteria Fisher.

Di manakah kebolehubahan am sifat, disebabkan oleh tindakan soalan yang dikaji, heterogeniti kesuburan tanah dan ralat rawak dalam eksperimen.

Mengubah hasil berdasarkan ulangan pengalaman lapangan.

Mempelbagaikan hasil mengikut variasi pengalaman yang berkaitan dengan tindakan soalan yang dikaji.

Variasi dalam hasil yang dikaitkan dengan ralat rawak dalam pengalaman.

Pengeluaran analisis varians dilakukan mengikut peraturan berikut:

1. Terdapat perbezaan yang ketara dalam pengalaman jika Faktual ≥Fteoretikal. Tiada perbezaan yang ketara dalam pengalaman jika F adalah sebenar

2. NDS - Perbezaan ketara terkecil, digunakan untuk menentukan perbezaan antara pilihan. Jika perbezaan d ≥ NSR, maka perbezaan antara pilihan adalah ketara. Jika d< НСР, то различия между вариантами не существенные.

Kumpulan pilihan.

1. Jika perbezaan d adalah ketara, dan menunjukkan peningkatan dalam hasil, maka pilihan merujuk kepada kumpulan 1.

2. Jika perbezaan d– tidak ketara, maka pilihan merujuk kepada kumpulan 2.

3. Jika perbezaan d adalah ketara, tetapi menunjukkan penurunan dalam hasil, maka pilihan merujuk kepada kumpulan 3.

Memilih formula ANOVA bergantung pada kaedah meletakkan pilihan dalam eksperimen:

1. Untuk wakil yang teratur:

2. Untuk wakil yang tidak teratur.

5.1. Apakah ANOVA?

Analisis varians dibangunkan pada tahun 1920-an oleh ahli matematik dan genetik Inggeris Ronald Fisher. Menurut tinjauan di kalangan saintis, di mana didapati siapa yang paling mempengaruhi biologi abad ke-20, Sir Fisher yang memenangi kejuaraan (atas jasanya dia dianugerahkan gelaran kesatria - salah satu kepujian tertinggi di Great Britain); dalam hal ini, Fischer adalah setanding dengan Charles Darwin, yang mempunyai pengaruh terbesar terhadap biologi pada abad ke-19.

Analisis varians kini merupakan cabang statistik yang berasingan. Ia berdasarkan fakta yang ditemui oleh Fisher bahawa ukuran kebolehubahan kuantiti yang dikaji boleh diuraikan kepada bahagian yang sepadan dengan faktor yang mempengaruhi kuantiti ini dan sisihan rawak.

Untuk memahami intipati analisis varians, kami akan melakukan jenis pengiraan yang sama dua kali: "secara manual" (dengan kalkulator) dan menggunakan program Statistica. Untuk memudahkan tugas kami, kami tidak akan bekerja dengan hasil penerangan sebenar tentang kepelbagaian katak hijau, tetapi dengan contoh fiksyen yang berkaitan dengan perbandingan wanita dan lelaki dalam manusia. Pertimbangkan kepelbagaian ketinggian 12 orang dewasa: 7 wanita dan 5 lelaki.

Jadual 5.1.1. Contoh untuk ANOVA sehala: data jantina dan ketinggian untuk 12 orang

Mari kita jalankan analisis varians sehala: kita akan membandingkan sama ada lelaki dan wanita dalam kumpulan yang diterangkan berbeza dari segi ketinggian secara statistik atau tidak.

5.2. Ujian normaliti

Penaakulan lanjut adalah berdasarkan fakta bahawa taburan dalam sampel yang dipertimbangkan adalah normal atau hampir normal. Jika taburan jauh daripada normal, varians (variance) bukanlah ukuran yang mencukupi bagi kebolehubahannya. Walau bagaimanapun, ANOVA agak teguh kepada sisihan taburan daripada normaliti.

Ujian normaliti data ini boleh dilakukan dengan dua cara yang berbeza. Pertama: Statistik / Statistik Asas / Jadual / Statistik deskriptif / Tab Normaliti. Dalam tab Normaliti anda boleh memilih ujian yang digunakan untuk kenormalan taburan. Apabila anda mengklik pada butang Jadual kekerapan, jadual kekerapan akan muncul, dan butang Histogram - histogram. Jadual dan graf bar akan menunjukkan keputusan pelbagai ujian.

Kaedah kedua adalah berkaitan dengan penggunaan kemungkinan yang sesuai semasa membina histogram. Dalam dialog untuk membina histogram (Graf / Histogram ...), pilih tab Lanjutan. Di bahagian bawahnya terdapat blok Statistik. Mari tandakan Shapiro-Wilk padanya t est dan ujian Kolmogorov-Smirnov, seperti yang ditunjukkan dalam rajah.

nasi. 5.2.1. Ujian statistik untuk kenormalan taburan dalam dialog untuk membina histogram

Seperti yang dapat dilihat dari histogram, taburan pertumbuhan dalam sampel kami berbeza daripada yang biasa (di tengah - "kegagalan").


nasi. 5.2.2. Histogram diplot dengan parameter yang ditunjukkan dalam rajah sebelumnya

Baris ketiga dalam tajuk graf menunjukkan parameter taburan normal yang paling hampir dengan taburan yang diperhatikan. Purata am ialah 173, sisihan piawai am ialah 10.4. Di bawah bar sisi pada graf, keputusan ujian untuk kenormalan ditunjukkan. D ialah ujian Kolmogorov-Smirnov, dan SW-W ialah ujian Shapiro-Vilk. Seperti yang dapat dilihat, bagi semua ujian yang digunakan, perbezaan antara taburan ketinggian dan taburan normal ternyata tidak ketara secara statistik ( hlm dalam semua kes lebih daripada 0.05).

Jadi, secara rasminya, ujian untuk pematuhan taburan kepada taburan normal tidak "melarang" kami menggunakan kaedah parametrik berdasarkan andaian taburan normal. Seperti yang telah disebutkan, analisis varians agak tahan terhadap penyimpangan daripada normal, jadi kami masih akan menggunakannya.

5.3. ANOVA sehala: pengiraan manual

Untuk mencirikan kebolehubahan ketinggian orang dalam contoh yang diberikan, kami mengira jumlah kuasa dua sisihan (dalam bahasa Inggeris ia dilambangkan sebagai SS , Jumlah Kuasa Dua atau) nilai individu daripada min: ... Purata untuk ketinggian dalam contoh ini ialah 173 sentimeter. Berdasarkan ini,

SS = (186–173) 2 + (169–173) 2 + (166–173) 2 + (188–173) 2 + (172–173) 2 + (179–173) 2 + (165–173) 2 + (174–173) 2 + (163–173) 2 + (162–173) 2 + (162–173) 2 + (190–173) 2 ;

SS = 132 + 42 + 72 + 152 + 12 + 62 + 82 + 12 + 102 + 112 + 112 + 172;

SS = 169 + 16 + 49 + 225 + 1 + 36 + 64 + 1 + 100 + 121 + 121 + 289 = 1192.

Nilai yang terhasil (1192) ialah ukuran kebolehubahan keseluruhan set data. Walau bagaimanapun, mereka terdiri daripada dua kumpulan, untuk setiap satu puratanya sendiri boleh dibezakan. Dalam data di atas, ketinggian purata wanita ialah 168 cm, dan lelaki - 180 cm.

Mari kita hitung jumlah kuasa dua sisihan untuk wanita:

SS f = (169–168) 2 + (166–168) 2 + (172–168) 2 + (179–168) 2 + (163–168) 2 + (162–168) 2 ;

SS f = 12 + 22 + 42 + 112 + 32 + 52 + 62 = 1 + 4 + 16 + 121 + 9 + 25 + 36 = 212.

Kami juga mengira jumlah kuasa dua sisihan untuk lelaki:

SS m = (186–180) 2 + (188–180) 2 + (174–180) 2 + (162–180) 2 + (190–180) 2 ;

SS m = 62 + 82 + 62 + 182 + 102 = 36 + 64 + 36 + 324 + 100 = 560.

Apakah yang bergantung kepada nilai yang disiasat mengikut analisis logik varians?

Dua nilai yang dikira, SS f dan SS m , mencirikan varians dalam kumpulan, yang dalam analisis varians biasanya dipanggil "ralat". Asal nama ini dikaitkan dengan logik berikut.

Apakah yang menentukan pertumbuhan seseorang dalam contoh ini? Pertama sekali, pada purata ketinggian orang secara umum, tanpa mengira jantina mereka. Kedua - dari lantai. Jika orang dari satu jantina (lelaki) lebih tinggi daripada yang lain (perempuan), ini boleh diwakili dalam bentuk tambahan kepada purata "manusia biasa" beberapa saiz, kesan jantina. Akhirnya, orang yang sama jantina berbeza ketinggian kerana perbezaan individu. Dalam model yang menerangkan ketinggian sebagai jumlah purata manusia dan pelarasan jantina, perbezaan individu tidak dapat dijelaskan dan boleh dianggap sebagai "ralat".

Jadi, selaras dengan logik analisis varians, nilai yang diselidiki ditentukan seperti berikut: , di mana x ij - nilai ke-i nilai yang dikaji pada nilai ke-j faktor yang dikaji; - purata am; F j - pengaruh nilai ke-j faktor yang dikaji; - "ralat", sumbangan keperibadian objek yang kuantitinya dimilikix ij .

Jumlah kuasa dua antara kumpulan

Jadi, SS kesilapan = SS f + SS m = 212 + 560 = 772. Dengan nilai ini, kami menerangkan kebolehubahan intrakumpulan (apabila kumpulan dikenal pasti mengikut jantina). Tetapi terdapat juga bahagian kedua kebolehubahan - antara kumpulan, yang akan kita panggilKesan SS (kerana kita bercakap tentang kesan membahagikan set objek yang sedang dipertimbangkan kepada wanita dan lelaki).

Purata setiap kumpulan adalah berbeza daripada purata keseluruhan. Mengira sumbangan perbezaan ini kepada jumlah ukuran kebolehubahan, kita mesti mendarabkan perbezaan antara kumpulan dan jumlah purata dengan bilangan objek dalam setiap kumpulan.

Kesan SS = = 7 × (168–173) 2 + 5 × (180–173) 2 = 7 × 52 + 5 × 72 = 7 × 25 + 5 × 49 = 175 + 245 = 420.

Di sini prinsip ketekalan jumlah kuasa dua, yang ditemui oleh Fischer, ditunjukkan: SS = kesan SS + ralat SS , iaitu untuk contoh ini, 1192 = 440 + 722.

Petak tengah

Membandingkan dalam contoh kami jumlah kuasa dua antara kumpulan dan intrakumpulan, kita dapat melihat bahawa yang pertama dikaitkan dengan variasi dua kumpulan, dan yang kedua - 12 nilai dalam 2 kumpulan. Bilangan darjah kebebasan ( df ) untuk beberapa parameter boleh ditakrifkan sebagai perbezaan antara bilangan objek dalam kumpulan dan bilangan kebergantungan (persamaan) yang menghubungkan nilai-nilai ini.

Dalam contoh kita kesan df = 2–1 = 1, a ralat df = 12–2 = 10.

Kita boleh membahagikan jumlah kuasa dua dengan bilangan darjah kebebasannya, mendapatkan kuasa dua min ( CIK , Cara Kuasa Dua). Setelah melakukan ini, kita boleh menetapkannya CIK - tidak lain adalah varians ("variance", hasil daripada membahagikan jumlah kuasa dua dengan bilangan darjah kebebasan). Selepas penemuan ini, kita boleh memahami struktur jadual ANOVA. Untuk contoh kami, ia akan kelihatan seperti ini.

kesannya

ralat

Kesan MS dan Ralat MS adalah anggaran varians antara kumpulan dan intrakumpulan, dan, oleh itu, ia boleh dibandingkan mengikut kriteriaF (Kriteria Snedecor, dinamakan sempena Fisher), direka untuk membandingkan varians. Kriteria ini hanyalah hasil bagi membahagikan varians yang lebih besar dengan yang lebih kecil. Dalam kes kami, ini ialah 420 / 77.2 = 5.440.

Penentuan kepentingan statistik ujian Fisher menggunakan jadual

Jika kita menentukan kepentingan statistik kesan secara manual, menggunakan jadual, kita perlu membandingkan nilai kriteria yang diperolehi. F dengan kritikal, sepadan dengan tahap kepentingan statistik tertentu untuk darjah kebebasan tertentu.


nasi. 5.3.1. Serpihan jadual dengan nilai kritikal kriteria F

Seperti yang anda lihat, untuk tahap kepentingan statistik p = 0.05, nilai kritikal kriteriaF ialah 4.96. Ini bermakna dalam contoh kami, tindakan jantina yang dikaji direkodkan dengan tahap keertian statistik 0.05.

Hasilnya boleh ditafsirkan seperti berikut. Kebarangkalian hipotesis nol, mengikut mana ketinggian purata wanita dan lelaki adalah sama, dan perbezaan yang direkodkan dalam ketinggian mereka dikaitkan dengan rawak dalam pembentukan sampel, adalah kurang daripada 5%. Ini bermakna kita mesti memilih hipotesis alternatif bahawa purata ketinggian wanita dan lelaki adalah berbeza.

5.4. Analisis varians sehala ( ANOVA) dalam pakej Statistica

Dalam kes di mana pengiraan tidak dibuat secara manual, tetapi dengan bantuan program yang sesuai (contohnya, pakej Statistica), nilai hlm ditentukan secara automatik. Anda boleh memastikan bahawa ia lebih tinggi sedikit daripada nilai kritikal.

Untuk menganalisis contoh yang dibincangkan menggunakan varian paling mudah analisis varians, anda perlu menjalankan prosedur Statistik / ANOVA untuk fail dengan data yang sepadan dan pilih pilihan ANOVA Sehala dalam tetingkap Jenis analisis dan dialog Spesifikasi cepat pilihan dalam tetingkap Kaedah Spesifikasi ...


nasi. 5.4.1. Dialog ANOVA / MANOVA Am

Dalam tetingkap dialog pantas yang dibuka, dalam medan Pembolehubah, anda perlu menentukan lajur yang mengandungi data, kebolehubahan yang kami sedang kaji (Senarai pembolehubah bergantung; dalam kes kami, lajur Pertumbuhan), serta lajur yang mengandungi nilai yang membahagikan nilai yang dikaji ke dalam kumpulan (Peramal kategorikal ( faktor); dalam kes kami, lajur Seks). Dalam versi analisis ini, berbeza dengan analisis multivariate, hanya satu faktor boleh dipertimbangkan.


nasi. 5.4.2. Dialog ANOVA Sehala

Dalam tetingkap Kod Faktor, anda harus menentukan nilai faktor yang dipersoalkan yang perlu diproses semasa analisis ini. Semua nilai yang tersedia boleh dilihat menggunakan butang Zum; jika, seperti dalam contoh kami, anda perlu mempertimbangkan semua nilai faktor (dan untuk jantina dalam contoh kami hanya terdapat dua daripadanya), anda boleh mengklik butang Semua. Apabila lajur yang akan diproses dan kod faktor ditetapkan, anda boleh mengklik butang OK dan pergi ke analisis pantas keputusan: Keputusan ANOVA 1, ke tab Pantas.

nasi. 5.4.3. Tab Pantas tetingkap keputusan ANOVA

Butang Semua kesan / Graf membolehkan anda melihat perbandingan purata kedua-dua kumpulan. Di atas graf, bilangan darjah kebebasan ditunjukkan, serta nilai F dan p untuk faktor yang dipertimbangkan.


nasi. 5.4.4. Memplot Keputusan ANOVA

Butang Semua kesan membolehkan anda mendapatkan jadual ANOVA yang serupa dengan yang diterangkan di atas (dengan beberapa perbezaan yang ketara).


nasi. 5.4.5. Jadual ANOVA (bandingkan dengan jadual yang dijana secara manual)

Garis bawah jadual menunjukkan jumlah kuasa dua, bilangan darjah kebebasan, dan kuasa dua min untuk ralat (kebolehubahan dalam kumpulan). Satu baris di atas - penunjuk yang serupa untuk faktor yang dikaji (dalam kes ini, tanda Jantina), serta kriteria F (nisbah bagi kuasa dua min kesan kepada kuasa dua ralat), dan tahap kepentingan statistiknya. Fakta bahawa kesan faktor yang dipersoalkan ternyata signifikan secara statistik ditunjukkan oleh sorotan berwarna merah.

Baris pertama mengandungi data pada penunjuk "Memintas". ini baris dalam jadual membentangkan misteri kepada pengguna baharu Statistica dalam versi ke-6 atau yang lebih baru. Nilai Intercept mungkin berkaitan dengan penguraian jumlah kuasa dua semua nilai data (iaitu 1862 + 1692 ... = 360340). Nilai kriteria F yang ditunjukkan untuknya diperoleh dengan membahagi MS Intercept / Ralat MS = 353220 / 77.2 = 4575.389 dan secara semula jadi memberikan nilai yang sangat rendah hlm ... Menariknya, dalam Statistica-5 nilai ini tidak dikira sama sekali, dan manual untuk menggunakan versi pakej yang lebih baru tidak mengulas mengenai pengenalannya dalam apa jua cara. Mungkin perkara terbaik yang boleh dilakukan oleh ahli biologi yang bekerja dengan Statistica-6 dan kemudiannya ialah mengabaikan sahaja baris Intercept dalam jadual ANOVA.

5.5. ANOVA dan Ujian Pelajar dan Fisher: Mana Yang Lebih Baik?

Seperti yang anda perhatikan, data yang kami bandingkan menggunakan analisis varians sehala, kami juga boleh menyiasat menggunakan ujian Pelajar dan Fisher. Mari bandingkan kedua-dua kaedah ini. Untuk melakukan ini, kira perbezaan ketinggian antara lelaki dan wanita menggunakan kriteria ini. Untuk melakukan ini, kita perlu mengikut laluan Statistik / Statistik Asas / ujian-t, bebas, mengikut kumpulan. Sememangnya, pembolehubah Bersandar ialah pembolehubah Pertumbuhan dan pembolehubah Kumpulan ialah pembolehubah Jantina.


nasi. 5.5.1. Perbandingan data yang diproses menggunakan ANOVA mengikut ujian Pelajar dan Fisher

Seperti yang anda lihat, hasilnya adalah sama seperti ANOVA. hlm = 0.041874 dalam kedua-dua kes, seperti yang ditunjukkan dalam Rajah. 5 dan ditunjukkan dalam Rajah. 5.5.2 (lihat sendiri!).


nasi. 5.5.2. Keputusan analisis (untuk penjelasan terperinci tentang jadual keputusan - dalam perenggan mengenai kriteria Pelajar)

Adalah penting untuk ditekankan bahawa walaupun kriteria F dari sudut pandangan matematik dalam analisis yang dipertimbangkan mengikut ujian Pelajar dan Fisher adalah sama seperti dalam ANOVA (dan menyatakan nisbah varians), maknanya dalam keputusan analisis yang dibentangkan dalam jadual akhir adalah berbeza sama sekali. Apabila membandingkan mengikut kriteria Pelajar dan Fisher, perbandingan nilai min sampel dijalankan mengikut kriteria Pelajar, dan perbandingan kebolehubahan mereka dijalankan mengikut kriteria Fisher. Dalam keputusan analisis, bukan varians itu sendiri dipaparkan, tetapi punca kuasa duanya - sisihan piawai.

Dalam ANOVA, sebaliknya, ujian Fisher digunakan untuk membandingkan cara sampel yang berbeza (seperti yang kita bincangkan, ini dilakukan dengan membahagikan jumlah kuasa dua kepada bahagian dan membandingkan jumlah purata kuasa dua sepadan dengan kebolehubahan antara dan dalam kumpulan) .

Walau bagaimanapun, perbezaan di atas melibatkan pembentangan hasil kajian statistik dan bukannya intipatinya. Seperti yang dinyatakan, sebagai contoh, Glantz (1999, ms. 99), perbandingan kumpulan mengikut ujian Pelajar boleh dianggap sebagai kes khas analisis varians untuk dua sampel.

Jadi, membandingkan sampel mengikut ujian Pelajar dan Fisher mempunyai satu kelebihan penting berbanding analisis varians: ia boleh membandingkan sampel dari segi kebolehubahannya. Tetapi kelebihan analisis varians masih lebih ketara. Ini termasuk, sebagai contoh, keupayaan untuk membandingkan berbilang sampel pada masa yang sama.

Skim analisis varians yang dipertimbangkan dibezakan bergantung pada: a) pada sifat ciri yang mana populasi dibahagikan kepada kumpulan (sampel;); b) pada bilangan ciri yang mana populasi dibahagikan kepada kumpulan (sampel ); c) mengenai kaedah persampelan.

Nilai ciri. yang membahagikan populasi kepada kumpulan boleh mewakili populasi umum atau populasi yang hampir dengannya. Dalam kes ini, skema ANOVA sepadan dengan yang dibincangkan di atas. Jika nilai ciri yang membentuk kumpulan berbeza mewakili sampel daripada populasi umum, maka rumusan hipotesis nol dan alternatif berubah. Sebagai hipotesis nol, dicadangkan terdapat perbezaan antara kumpulan, iaitu kumpulan bermakna menunjukkan beberapa variasi. Sebagai hipotesis alternatif, adalah dicadangkan bahawa tiada ayunan. Jelas sekali, dengan rumusan hipotesis sedemikian, tidak ada sebab untuk mengukuhkan keputusan membandingkan varians.

Dengan peningkatan bilangan tanda kumpulan, contohnya, sehingga 2, pertama, bilangan sifar dan, dengan itu, hipotesis alternatif meningkat. Dalam kes ini, hipotesis nol pertama bercakap tentang ketiadaan perbezaan antara min untuk kumpulan ciri pengelompokan pertama, hipotesis nol kedua bercakap tentang ketiadaan perbezaan dalam cara untuk kumpulan ciri pengelompokan kedua, dan akhirnya. hipotesis nol ketiga bercakap tentang ketiadaan apa yang dipanggil kesan interaksi faktor (ciri kumpulan).

Kesan interaksi difahami sebagai perubahan dalam nilai atribut berkesan, yang tidak dapat dijelaskan oleh jumlah tindakan dua faktor. Untuk menguji tiga pasangan hipotesis yang dikemukakan, adalah perlu untuk mengira tiga nilai sebenar bagi kriteria F-Fisher, yang seterusnya mencadangkan variasi penguraian berikut bagi jumlah volum variasi

Penyerakan yang diperlukan untuk mendapatkan kriteria F diperoleh dengan cara yang diketahui dengan membahagikan isipadu variasi dengan bilangan darjah kebebasan.

Seperti yang anda ketahui, sampel boleh bergantung dan bebas. Jika sampel bergantung, maka dalam jumlah variasi, apa yang dipanggil variasi mengikut replika harus dibezakan.
... Jika ia tidak diserlahkan, maka variasi ini boleh meningkatkan variasi intrakumpulan dengan ketara (
), yang boleh memesongkan keputusan analisis varians.

Ulangkaji soalan

17-1. Apakah spesifikasi keputusan analisis varians?

17-2. Bilakah kriteria Q-Tukey digunakan untuk konkritisasi?

17-3. Apakah perbezaan pesanan pertama, kedua dan seterusnya?

17-4. Bagaimana untuk mencari nilai sebenar ujian Q Tukey?

17-5. Apakah hipotesis yang dikemukakan tentang setiap perbezaan?

17-6. Apakah yang menentukan nilai jadual bagi kriteria Q-Tukey?

17-7. Apakah hipotesis nol jika tahap atribut kumpulan adalah sampel?

17-8 Bagaimanakah jumlah variasi terurai apabila data dikumpulkan mengikut dua kriteria?

17-9. Dalam hal ini variasi dalam ulangan diserlahkan (
) ?

Ringkasan

Mekanisme yang dipertimbangkan untuk menentukan keputusan analisis varians membolehkan anda memberikan rupa yang lengkap. Perhatian harus diberikan kepada batasan apabila menggunakan ujian Q Tukey. Bahan ini juga menggariskan prinsip asas klasifikasi model ANOVA. Perlu ditekankan bahawa ini hanyalah prinsip. Kajian terperinci tentang ciri setiap model memerlukan kajian lebih mendalam yang berasingan.

Tugasan ujian untuk kuliah

Apakah ciri statistik yang menjadi hipotesis dalam analisis varians?

    Relatif kepada dua varians

    Berbanding dengan satu purata

    Berbanding dengan beberapa purata

    Relatif kepada satu varians

Apakah kandungan hipotesis alternatif dalam analisis varians?

    Varians yang dibandingkan tidak sama.

    Semua purata yang dibandingkan adalah tidak sama.

    Sekurang-kurangnya Dua Purata Am Tidak Sama

    Varians antara kumpulan adalah lebih besar daripada varians dalam kumpulan

Apakah tahap keertian yang paling biasa digunakan dalam analisis varians?

Jika variasi dalam kumpulan lebih besar daripada variasi antara kumpulan, patutkah ANOVA diteruskan atau serta-merta bersetuju dengan H0 atau dengan AN?

1. Sekiranya anda meneruskan varians yang diperlukan?

2. Seseorang harus bersetuju dengan H0

3. Setuju dengan ON

Jika varians dalam kumpulan didapati sama dengan varians antara kumpulan, apakah yang perlu diikuti oleh analisis varians?

    Setuju dengan hipotesis nol kesamaan cara am

    Setuju dengan hipotesis alternatif tentang kehadiran sekurang-kurangnya sepasang cara yang tidak sama antara satu sama lain

Apakah varians yang perlu sentiasa ada dalam pengangka semasa mengira ujian F-Fisher?

    Dalam kumpulan sahaja

    Bagaimanapun, antara kumpulan

    Antara kumpulan, jika lebih intrakumpulan

Apakah nilai sebenar kriteria F-Fisher?

    Sentiasa kurang daripada 1

    Sentiasa lebih besar daripada 1

    Sama dengan atau lebih daripada 1

Apakah nilai jadual bagi kriteria F-Fisher bergantung pada?

1. Dari tahap kepentingan yang diterima

2. Daripada bilangan darjah kebebasan jumlah variasi

3. Daripada bilangan darjah kebebasan variasi antara kumpulan

4. Mengenai bilangan darjah kebebasan variasi dalam kumpulan

5. Daripada nilai nilai sebenar kriteria F-Fisher?

Peningkatan bilangan pemerhatian dalam setiap kumpulan dengan varians yang sama meningkatkan kemungkinan menerima ……

1 hipotesis nol

2. Hipotesis alternatif

3. Tidak menjejaskan penerimaan kedua-dua hipotesis nol dan alternatif

Apakah gunanya menentukan keputusan analisis varians?

    Jelaskan sama ada pengiraan varians telah dijalankan dengan betul

    Tetapkan purata am yang mana yang ternyata sama antara satu sama lain

    Jelaskan mana antara purata am yang tidak sama antara satu sama lain

Adakah pernyataan itu benar: "Apabila menyatakan keputusan analisis varians, semua purata am ternyata sama antara satu sama lain"

    Boleh jadi betul dan salah

    Tidak benar, ini mungkin disebabkan oleh kesilapan dalam pengiraan

Adakah mungkin, apabila menyatakan analisis varians, untuk membuat kesimpulan bahawa semua purata am tidak sama antara satu sama lain?

1. Boleh

2. Mungkin dalam kes luar biasa

3. Ia adalah mustahil pada dasarnya.

4. Hanya mungkin jika anda membuat kesilapan dalam pengiraan

Jika hipotesis nol diterima mengikut kriteria F-Fisher, adakah perlu untuk menentukan analisis varians?

1. Diperlukan

2.Tidak diperlukan

3. Mengikut budi bicara penganalisis ANOVA

Dalam kes apakah ujian Tukey digunakan untuk mengkokritkan keputusan analisis varians?

1. Jika bilangan pemerhatian mengikut kumpulan (sampel) adalah sama

2. Jika bilangan pemerhatian mengikut kumpulan (sampel) berbeza

3. Jika terdapat sampel dengan kedua-dua nombor yang sama dan tidak sama

kemalasan

Apakah NDS apabila menyatakan keputusan analisis varians berdasarkan ujian Tukey?

1. Hasilkan ralat purata mengikut nilai sebenar kriteria

2. Hasil darab ralat purata dengan nilai jadual kriteria

3. Nisbah setiap perbezaan antara sampel bermakna kepada

ralat purata

4. Perbezaan antara cara sampel

Jika sampel dibahagikan kepada kumpulan mengikut 2 ciri, berapa banyak sumber yang perlu sekurang-kurangnya dibahagikan kepada jumlah variasi ciri tersebut?

Jika pemerhatian oleh sampel (kumpulan) adalah bergantung, kepada berapa banyak sumber yang harus dibahagikan kepada jumlah variasi (kumpulan atribut satu)?

Apakah punca (punca) variasi antara kumpulan?

    Permainan peluang

    Aksi gabungan permainan peluang dan faktor

    Tindakan faktor

    Ketahui selepas analisis varians

Apakah punca (punca) variasi intrakumpulan?

1 permainan peluang

2. Tindakan gabungan permainan peluang dan faktor

3. Tindakan faktor (s)

4. Ia akan diketahui selepas analisis varians

Apakah kaedah mengubah data sumber yang digunakan jika nilai ciri dinyatakan dalam pecahan?

    Logaritma

    Mengeluarkan akar

    Transformasi Phi

Kuliah 8 Korelasi

anotasi

Kaedah yang paling penting untuk mengkaji hubungan antara sifat ialah kaedah korelasi. Kuliah ini mendedahkan kandungan kaedah ini, pendekatan kepada ungkapan analitik sambungan ini. Perhatian khusus diberikan kepada penunjuk khusus seperti penunjuk kesesakan komunikasi

Kata kunci

Korelasi. Kaedah kuasa dua terkecil. Pekali regresi. Pekali penentuan dan korelasi.

Isu ditangani

    Hubungan fungsional dan korelasi

    Peringkat membina persamaan korelasi komunikasi. Mentafsir Pekali Persamaan

    Penunjuk kekejangan

    Penilaian penunjuk komunikasi terpilih

Unit modular 1 Intipati korelasi. Peringkat membina persamaan korelasi komunikasi, tafsiran pekali persamaan.

Tujuan dan objektif mempelajari unit modular 1 terdiri daripada memahami ciri-ciri korelasi. menguasai algoritma untuk membina persamaan komunikasi, memahami kandungan pekali persamaan.

      Intipati korelasi

Dalam fenomena semula jadi dan sosial, terdapat dua jenis sambungan - sambungan berfungsi dan sambungan korelasi. Dalam sambungan berfungsi, setiap nilai hujah sepadan dengan nilai yang ditakrifkan dengan ketat (satu atau lebih) bagi fungsi tersebut. Contoh hubungan berfungsi ialah hubungan antara lilitan dan jejari, yang dinyatakan oleh persamaan
... Setiap nilai jejari r sepadan dengan nilai tunggal untuk lilitan L . Dengan sambungan korelasi, setiap nilai atribut faktor sepadan dengan beberapa nilai atribut berkesan yang tidak pasti. Contoh korelasi ialah hubungan antara berat seseorang (sifat berkesan) dan ketinggiannya (sifat faktor), hubungan antara jumlah baja yang digunakan dan hasil, antara harga dan jumlah produk yang ditawarkan. Sumber kemunculan korelasi adalah hakikat bahawa, sebagai peraturan, dalam kehidupan sebenar, nilai atribut berkesan bergantung pada banyak faktor, termasuk yang mempunyai sifat rawak perubahannya. Sebagai contoh, berat yang sama seseorang bergantung pada umur, jantina., Diet, pekerjaan dan banyak faktor lain. Tetapi pada masa yang sama, jelas bahawa pertumbuhan adalah faktor penentu secara umum. Memandangkan keadaan ini, korelasi harus ditakrifkan sebagai hubungan yang tidak lengkap, yang boleh diwujudkan dan dianggarkan hanya jika terdapat sejumlah besar pemerhatian, secara purata.

1.2 Peringkat membina persamaan korelasi komunikasi.

Seperti hubungan berfungsi, korelasi dinyatakan oleh persamaan hubungan. Untuk membinanya, anda mesti konsisten melalui langkah-langkah (peringkat-peringkat) berikut.

Pertama, anda harus memahami hubungan sebab-akibat, mengetahui subordinasi tanda-tanda, iaitu, yang mana antara mereka adalah sebab (tanda-tanda faktor), dan yang mana akibat (tanda-tanda berkesan). Hubungan sebab akibat antara ciri ditubuhkan oleh teori subjek di mana kaedah korelasi digunakan. Sebagai contoh, sains "anatomi manusia" membolehkan anda untuk mengatakan apakah sumber hubungan antara berat dan ketinggian, yang mana antara tanda-tanda ini adalah faktor, yang mengakibatkan, sains "ekonomi" mendedahkan logik hubungan antara harga dan penawaran, menetapkan apa dan pada peringkat apakah punca dan apakah kesannya ... Tanpa justifikasi teori awal sedemikian, tafsiran keputusan yang diperoleh pada masa hadapan adalah sukar, dan kadangkala boleh membawa kepada kesimpulan yang tidak masuk akal.

Setelah mewujudkan kehadiran hubungan sebab-akibat, maka hubungan ini harus diformalkan, iaitu, dinyatakan menggunakan persamaan komunikasi, sambil memilih jenis persamaan terlebih dahulu. Beberapa teknik boleh disyorkan untuk memilih jenis persamaan. Anda boleh beralih kepada teori subjek di mana kaedah korelasi digunakan, sebagai contoh, sains "agrokimia" mungkin telah menerima jawapan kepada persoalan persamaan mana yang harus menyatakan hubungan: hasil - baja. Jika tiada jawapan sedemikian, maka untuk memilih persamaan, anda harus menggunakan beberapa data empirikal, setelah memprosesnya dengan betul. Harus dikatakan dengan segera bahawa setelah memilih jenis persamaan berdasarkan data empirikal, seseorang mesti memahami dengan jelas bahawa persamaan jenis ini boleh digunakan untuk menggambarkan hubungan data yang digunakan. Teknik utama untuk memproses data ini ialah pembinaan graf, apabila nilai atribut faktor diplot pada paksi abscissa, dan kemungkinan nilai atribut berkesan diplot pada paksi ordinat. Oleh kerana, mengikut takrifan, nilai yang sama bagi atribut faktor sepadan dengan satu set nilai yang tidak ditentukan bagi atribut berkesan, sebagai hasil daripada tindakan di atas, kami akan menerima satu set mata tertentu, yang dipanggil medan korelasi. Pandangan umum medan korelasi membolehkan dalam beberapa kes untuk membuat andaian tentang kemungkinan bentuk persamaan.. Dengan perkembangan moden teknologi komputer, salah satu kaedah utama untuk memilih persamaan adalah dengan menghitung pelbagai jenis persamaan. , manakala persamaan terbaik ialah persamaan yang memberikan pekali penentuan tertinggi, pertuturan yang akan dibincangkan di bawah. Sebelum meneruskan pengiraan, adalah perlu untuk menyemak sejauh mana data empirikal yang digunakan untuk membina persamaan memenuhi keperluan tertentu. Keperluan berkaitan dengan ciri faktorial dan set data. Tanda-tanda faktor, jika terdapat beberapa daripadanya, hendaklah bebas antara satu sama lain. Bagi agregat, ia mesti, pertama, homogen

(konsep homogeniti dianggap lebih awal), dan kedua, agak besar. Setiap sifat faktorial harus menyumbang sekurang-kurangnya 8-10 pemerhatian.

Selepas memilih persamaan, langkah seterusnya ialah mengira pekali persamaan. Pekali persamaan paling kerap dikira menggunakan kaedah kuasa dua terkecil. Dari sudut pandangan korelasi, penggunaan kaedah kuasa dua terkecil terdiri daripada mendapatkan pekali persamaan sedemikian supaya
= min, iaitu jumlah kuasa dua sisihan nilai sebenar penunjuk berkesan ( ) daripada yang dikira mengikut persamaan ( ) ialah nilai minimum. Keperluan ini direalisasikan dengan membina dan menyelesaikan sistem yang terkenal yang dipanggil persamaan normal. Jika sebagai persamaan korelasi antara y dan x persamaan garis lurus dipilih
, di mana sistem persamaan normal, seperti yang anda ketahui, adalah seperti berikut:

Menyelesaikan sistem ini berkenaan dengan a dan b , kami memperoleh nilai pekali yang diperlukan. Ketepatan pengiraan pekali disemak oleh kesamaan

Untuk apa analisis varians digunakan? Tujuan analisis varians adalah untuk mengkaji kehadiran atau ketiadaan kesan ketara mana-mana faktor kualitatif atau kuantitatif terhadap perubahan dalam sifat berkesan yang disiasat. Untuk ini, faktor, mungkin mempunyai atau tidak mempunyai pengaruh yang signifikan, dibahagikan kepada kelas penggredan (dengan kata lain, kumpulan) dan ditentukan sama ada pengaruh faktor itu adalah sama dengan mengkaji kepentingan antara min dalam set data yang sepadan. kepada penggredan faktor. Contoh: pergantungan keuntungan perusahaan pada jenis bahan mentah yang digunakan disiasat (kemudian kelas penggredan adalah jenis bahan mentah), pergantungan kos pengeluaran unit pengeluaran pada saiz bahagian perusahaan (kemudian kelas penggredan adalah ciri-ciri saiz bahagian: besar, sederhana, kecil).

Bilangan minimum kelas penggredan (kumpulan) ialah dua. Kelas pengijazahan boleh berbentuk kualitatif atau kuantitatif.

Mengapa analisis varians dipanggil analisis varians? Analisis varians mengkaji nisbah dua varians. Varians, seperti yang kita ketahui, adalah ciri penyebaran data di sekitar min. Yang pertama ialah varians yang dijelaskan oleh pengaruh faktor, yang mencirikan penyebaran nilai antara penggredan faktor (kumpulan) di sekitar purata semua data. Yang kedua ialah varians yang tidak dapat dijelaskan, yang mencirikan penyebaran data dalam penggredan (kumpulan) di sekitar cara kumpulan itu sendiri. Varians pertama boleh dipanggil antara kumpulan dan varians intrakumpulan kedua. Nisbah varians ini dipanggil nisbah Fisher sebenar dan dibandingkan dengan nilai kritikal nisbah Fisher. Jika nisbah Fisher sebenar adalah lebih besar daripada yang kritikal, maka gred pertengahan penggredan berbeza antara satu sama lain dan faktor yang dikaji secara signifikan mempengaruhi perubahan dalam data. Jika kurang, maka gred purata penggredan tidak berbeza antara satu sama lain dan faktor tersebut tidak memberi kesan yang ketara.

Bagaimanakah hipotesis dirumus, diterima dan ditolak dalam ANOVA? Dalam analisis varians, berat khusus jumlah impak satu atau lebih faktor ditentukan. Kepentingan pengaruh faktor ditentukan dengan menguji hipotesis:

  • H0 : μ 1 = μ 2 = ... = μ a, di mana a- bilangan kelas penggredan - semua kelas penggredan mempunyai satu nilai min,
  • H1 : Tidak semua μ i sama - tidak semua kelas penggredan mempunyai nilai min yang sama.

Jika pengaruh faktor tidak signifikan, maka perbezaan antara kelas penggredan faktor ini juga tidak signifikan, dan dalam perjalanan analisis varians hipotesis nol H0 tidak ditolak. Jika pengaruh faktor adalah signifikan, maka hipotesis nol H0 ditolak: tidak semua kelas penggredan mempunyai min yang sama, iaitu, antara kemungkinan perbezaan antara kelas penggredan, satu atau lebih adalah ketara.

Beberapa lagi konsep analisis varians. Kompleks statistik dalam ANOVA ialah jadual data empirikal. Jika semua kelas penggredan mempunyai bilangan pilihan yang sama, maka kompleks statistik dipanggil homogen (homogen), jika bilangan pilihan berbeza - heterogen (heterogen).

Bergantung kepada bilangan faktor yang dinilai, analisis varians sehala, dua hala dan pelbagai variasi dibezakan.

Analisis varians sehala: intipati kaedah, formula, contoh

Intipati kaedah, formula

berdasarkan fakta bahawa jumlah kuasa dua sisihan kompleks statistik boleh dibahagikan kepada komponen:

SS = SS a + SS e,

SS

SSa a jumlah kuasa dua sisihan,

SSe- jumlah kuasa dua sisihan yang tidak dapat dijelaskan atau jumlah kuasa dua sisihan ralat.

Jika melalui ni menetapkan bilangan pilihan dalam setiap gred penggredan (kumpulan) dan a ialah jumlah bilangan penggredan faktor (kumpulan), maka ialah jumlah bilangan cerapan dan formula berikut boleh diperolehi:

jumlah bilangan kuasa dua sisihan: ,

dikaitkan dengan faktor a jumlah kuasa dua sisihan: ,

jumlah kuasa dua sisihan yang tidak dapat dijelaskan atau jumlah kuasa dua sisihan ralat: ,

- jumlah purata pemerhatian,

(kumpulan).

selain itu,

di manakah varians penggredan faktor (kumpulan).

Untuk menjalankan analisis varians sehala untuk data kompleks statistik, adalah perlu untuk mencari nisbah Fisher sebenar - nisbah varians yang dijelaskan oleh pengaruh faktor (antara kumpulan), dan varians yang tidak dapat dijelaskan (intragroup). ):

dan bandingkan dengan nilai kritikal Fischer.

Varians dikira seperti berikut:

Varians menjelaskan,

Varians yang tidak dapat dijelaskan

va = a − 1 - bilangan darjah kebebasan varians yang dijelaskan,

ve = na - bilangan darjah kebebasan varians yang tidak dapat dijelaskan,

v = n

Nilai kritikal nisbah Fisher dengan nilai tahap keertian dan darjah kebebasan tertentu boleh didapati dalam jadual statistik atau dikira menggunakan fungsi MS Excel F. OBR (angka di bawah, untuk meningkatkannya, klik padanya dengan butang kiri tetikus).


Fungsi ini memerlukan data berikut untuk dimasukkan:

Kebarangkalian - tahap kepentingan α ,

Degrees_freedom1 ialah bilangan darjah kebebasan varians yang dijelaskan va,

Degrees_freedom2 ialah bilangan darjah kebebasan varians yang tidak dapat dijelaskan ve.

Jika nilai sebenar nisbah Fisher lebih besar daripada nilai kritikal (), maka hipotesis nol ditolak dengan tahap keertian. α ... Ini bermakna faktor tersebut mempengaruhi perubahan data dengan ketara dan data bergantung kepada faktor yang mempunyai kebarangkalian P = 1 − α .

Jika nilai sebenar nisbah Fisher adalah kurang daripada nilai kritikal (), maka hipotesis nol tidak boleh ditolak dengan tahap keertian. α ... Ini bermakna faktor tersebut tidak mempengaruhi data dengan kebarangkalian yang ketara P = 1 − α .

Analisis Varian Sehala: Contoh

Contoh 1. Ia diperlukan untuk mengetahui sama ada jenis bahan mentah yang digunakan mempengaruhi keuntungan perusahaan. Dalam enam kelas penggredan (kumpulan) faktor (jenis pertama, jenis ke-2, dll.), Data mengenai keuntungan daripada pengeluaran 1000 unit produk dalam berjuta-juta rubel selama 4 tahun dikumpulkan.

Jenis bahan mentah2014 2015 2016 2017
pertama7,21 7,55 7,29 7,6
ke-27,89 8,27 7,39 8,18
ke-37,25 7,01 7,37 7,53
ke-47,75 7,41 7,27 7,42
ke-57,7 8,28 8,55 8,6
ke-67,56 8,05 8,07 7,84
Purata
Penyerakan
7,413 0,0367
7,933 0,1571
7,290 0,0480
7,463 0,0414
8,283 0,1706
7,880 0,0563

a= 6 dan dalam setiap kelas (kumpulan) ni = 4 pemerhatian. Jumlah bilangan pemerhatian n = 24 .

Bilangan darjah kebebasan:

va = a − 1 = 6 − 1 = 5 ,

ve = na = 24 − 6 = 18 ,

v = n − 1 = 24 − 1 = 23 .

Mari kita hitung varians:

.

.

Oleh kerana sikap sebenar Fischer lebih kritikal:

dengan tahap kepentingan α = 0.05, kami menyimpulkan bahawa keuntungan perusahaan, bergantung pada jenis bahan mentah yang digunakan dalam pengeluaran, berbeza dengan ketara.

Atau, yang sama, kami menolak hipotesis utama tentang kesamaan min dalam semua kelas penggredan faktor (kumpulan).

Dalam contoh yang baru dibincangkan, setiap kelas gred faktor mempunyai bilangan pilihan yang sama. Tetapi, seperti yang dinyatakan dalam pengenalan, bilangan pilihan boleh berbeza. Dan ini sama sekali tidak merumitkan prosedur ANOVA. Ini adalah contoh seterusnya.

Contoh 2. Ia diperlukan untuk mengetahui sama ada terdapat pergantungan kos pengeluaran unit pengeluaran pada saiz bahagian perusahaan. Faktor (saiz unit) dibahagikan kepada tiga gred (kumpulan): kecil, sederhana, besar. Data umum yang sepadan dengan kumpulan ini mengenai harga kos unit jenis produk yang sama untuk tempoh tertentu.

kecilpuratabesar
48 47 46
50 61 57
63 63 57
72 47 55
43 32
59 59
58
Purata58,6 54,0 51,0
Penyerakan128,25 65,00 107,60

Bilangan kelas penggredan faktor (kumpulan) a= 3, bilangan pemerhatian dalam kelas (kumpulan) n1 = 4 , n2 = 7 , n3 = 6 ... Jumlah bilangan pemerhatian n = 17 .

Bilangan darjah kebebasan:

va = a − 1 = 2 ,

ve = na = 17 − 3 = 14 ,

v = n − 1 = 16 .

Mari kita hitung jumlah kuasa dua sisihan:

Mari kita hitung varians:

,

.

Mari kita hitung nisbah Fisher sebenar:

.

Nisbah Kritikal Fischer:

Oleh kerana nilai sebenar nisbah Fisher adalah kurang daripada kritikal:, kami membuat kesimpulan bahawa saiz bahagian perusahaan tidak menjejaskan kos pengeluaran dengan ketara.

Atau, yang sama, dengan kebarangkalian 95%, kami menerima hipotesis utama bahawa kos pengeluaran purata bagi unit produk yang sama dalam bahagian kecil, sederhana dan besar perusahaan tidak berbeza dengan ketara.

ANOVA sehala dalam MS Excel

Analisis varians sehala boleh dilakukan menggunakan prosedur MS Excel Analisis varians sehala... Kami menggunakannya untuk menganalisis data tentang hubungan antara jenis bahan mentah yang digunakan dan keuntungan perusahaan daripada contoh 1.

Perkhidmatan / Analisis Data dan pilih alat analisis Analisis varians sehala.

Dalam tingkap Selang input kami menunjukkan kawasan data (dalam kes kami ialah $ A $ 2: $ E $ 7). Kami menunjukkan cara faktor dikumpulkan - mengikut lajur atau mengikut baris (dalam kes kami, mengikut baris). Jika lajur pertama mengandungi nama kelas faktor, tandai kotak Label lajur pertama... Dalam tingkap Alfa menunjukkan tahap keertian α = 0,05 .

Jadual kedua - Analisis Varians - mengandungi data tentang nilai untuk faktor antara kumpulan dan dalam kumpulan dan jumlahnya. Ini ialah jumlah sisihan kuasa dua (SS), bilangan darjah kebebasan (df), varians (MS). Tiga lajur terakhir mengandungi nilai sebenar nisbah Fisher (F), tahap p (nilai P) dan nilai kritikal nisbah Fisher (Krit F).

CIK F P-nilai F kritik
0,58585 6,891119 0,000936 2,77285
0,085017

Oleh kerana nilai sebenar nisbah Fischer (6.89) adalah lebih besar daripada nilai kritikal (2.77), dengan kebarangkalian 95% kami menolak hipotesis nol tentang kesamaan produktiviti purata apabila menggunakan semua jenis bahan mentah, iaitu, kami membuat kesimpulan bahawa jenis bahan mentah yang digunakan memberi kesan kepada perusahaan untung.

Analisis dua hala varians tanpa pengulangan: intipati kaedah, formula, contoh

Analisis dua hala bagi varians digunakan untuk memeriksa kemungkinan pergantungan sifat berkesan pada dua faktor - A dan B... Kemudian a- bilangan penggredan faktor A dan b- bilangan penggredan faktor B... Dalam kompleks statistik, jumlah kuasa dua baki dibahagikan kepada tiga komponen:

SS = SS a + SS b + SS e,

- jumlah jumlah kuasa dua sisihan,

- dijelaskan oleh pengaruh faktor A jumlah kuasa dua sisihan,

- dijelaskan oleh pengaruh faktor B jumlah kuasa dua sisihan,

- jumlah purata pemerhatian,

Purata pemerhatian dalam setiap penggredan faktor A ,

B .

A ,

Serakan dijelaskan oleh pengaruh faktor B ,

va = a − 1 A ,

vb = b − 1 - bilangan darjah kebebasan serakan yang dijelaskan oleh pengaruh faktor B ,

ve = ( a − 1)(b − 1)

v = ab- 1 - jumlah bilangan darjah kebebasan.

Jika faktor tidak bergantung antara satu sama lain, maka dua hipotesis nol dan hipotesis alternatif yang sepadan dikemukakan untuk menentukan kepentingan faktor:

untuk faktor A :

H0 : μ 1A = μ 2A = ... = μ aA,

H1 : Tidak semua μ iA adalah sama;

untuk faktor B :

H0 : μ 1B = μ 2B = ... = μ aB,

H1 : Tidak semua μ iB adalah sama.

A

Untuk menentukan pengaruh sesuatu faktor B, sikap sebenar Fischer mesti dibandingkan dengan sikap kritis Fischer.

α P = 1 − α .

α P = 1 − α .

Analisis varians dua hala tanpa ulangan: contoh

Contoh 3. Maklumat diberikan tentang purata penggunaan bahan api setiap 100 kilometer dalam liter, bergantung pada saiz enjin dan jenis bahan api.

Ia dikehendaki menyemak sama ada penggunaan bahan api bergantung kepada saiz enjin dan jenis bahan api.

Penyelesaian. Untuk faktor A bilangan kelas penggredan a= 3, untuk faktor B bilangan kelas penggredan b = 3 .

Kami mengira jumlah kuasa dua sisihan:

,

,

,

.

Varian yang sepadan:

,

,

.

A ... Oleh kerana nisbah Fischer sebenar adalah kurang daripada yang kritikal, kami menerima hipotesis bahawa anjakan enjin tidak menjejaskan penggunaan bahan api dengan kebarangkalian 95%. Walau bagaimanapun, jika kita memilih tahap keertian α = 0.1, maka nilai sebenar nisbah Fisher dan kemudian dengan kebarangkalian 95% kita boleh mengandaikan bahawa anjakan enjin mempengaruhi penggunaan bahan api.

Nisbah Sebenar Fischer untuk Faktor B , nilai kritikal nisbah Fisher: ... Oleh kerana nisbah Fischer sebenar adalah lebih besar daripada nilai kritikal nisbah Fisher, kami mengandaikan dengan kebarangkalian 95% bahawa jenis bahan api mempengaruhi penggunaannya.

Analisis dua hala bagi varians tanpa ulangan dalam MS Excel

Analisis varians dua hala tanpa ulangan boleh dilakukan menggunakan prosedur MS Excel. Kami akan menggunakannya untuk menganalisis data tentang hubungan antara jenis jenis bahan api dan penggunaannya daripada contoh 3.

Dalam menu MS Excel, laksanakan arahan Perkhidmatan / Analisis Data dan pilih alat analisis Analisis varians dua hala tanpa ulangan.

Kami mengisi data dengan cara yang sama seperti dalam kes analisis varians univariat.


Hasil daripada prosedur, dua jadual dipaparkan. Jadual pertama ialah Jumlah. Ia mengandungi data tentang semua kelas penggredan faktor: bilangan cerapan, jumlah nilai, nilai min dan varians.

Jadual kedua, ANOVA, mengandungi data tentang sumber variasi: serakan antara baris, serakan antara lajur, serakan ralat, jumlah serakan, jumlah kuasa dua sisihan (SS), bilangan darjah kebebasan (df), varians (MS) . Tiga lajur terakhir mengandungi nilai sebenar nisbah Fisher (F), tahap p (nilai P) dan nilai kritikal nisbah Fisher (Krit F).

CIK F P-nilai F kritik
3,13 5,275281 0,075572 6,94476
8,043333 13,55618 0,016529 6,944276
0,593333

Faktor A(anjakan enjin) dikumpulkan dalam garisan. Oleh kerana nisbah Fischer sebenar 5.28 adalah kurang daripada kritikal 6.94, kami mengandaikan dengan kebarangkalian 95% bahawa penggunaan bahan api tidak bergantung pada saiz enjin.

Faktor B(jenis bahan api) dikumpulkan dalam lajur. Nisbah Fischer sebenar 13.56 adalah lebih besar daripada kritikal 6.94, oleh itu, dengan kebarangkalian 95%, kami menganggap bahawa penggunaan bahan api bergantung pada jenisnya.

Analisis dua hala varians dengan pengulangan: intipati kaedah, formula, contoh

Analisis dua hala bagi varians dengan ulangan digunakan untuk memeriksa bukan sahaja kemungkinan pergantungan sifat berkesan pada dua faktor - A dan B, tetapi juga kemungkinan interaksi faktor A dan B... Kemudian a- bilangan penggredan faktor A dan b- bilangan penggredan faktor B, r- bilangan ulangan. Dalam kompleks statistik, jumlah kuasa dua baki dibahagikan kepada empat komponen:

SS = SS a + SS b + SS ab + SS e,

- jumlah jumlah kuasa dua sisihan,

- dijelaskan oleh pengaruh faktor A jumlah kuasa dua sisihan,

- dijelaskan oleh pengaruh faktor B jumlah kuasa dua sisihan,

- dijelaskan oleh pengaruh interaksi faktor A dan B jumlah kuasa dua sisihan,

- jumlah kuasa dua sisihan yang tidak dapat dijelaskan atau jumlah kuasa dua sisihan ralat,

- jumlah purata pemerhatian,

- purata pemerhatian dalam setiap penggredan faktor A ,

- purata bilangan cerapan dalam setiap penggredan faktor B ,

Purata bilangan cerapan dalam setiap gabungan penggredan faktor A dan B ,

n = abr- jumlah bilangan pemerhatian.

Varians dikira seperti berikut:

Serakan dijelaskan oleh pengaruh faktor A ,

Serakan dijelaskan oleh pengaruh faktor B ,

- varians dijelaskan oleh interaksi faktor A dan B ,

- varians atau varians ralat yang tidak dapat dijelaskan,

va = a − 1 - bilangan darjah kebebasan serakan yang dijelaskan oleh pengaruh faktor A ,

vb = b − 1 - bilangan darjah kebebasan serakan yang dijelaskan oleh pengaruh faktor B ,

vab = ( a − 1)(b − 1) - bilangan darjah kebebasan varians yang dijelaskan oleh interaksi faktor A dan B ,

ve = ab(r − 1) - bilangan darjah kebebasan varians yang tidak dapat dijelaskan atau varians ralat,

v = abr- 1 - jumlah bilangan darjah kebebasan.

Jika faktor adalah bebas antara satu sama lain, maka tiga hipotesis nol dan hipotesis alternatif yang sepadan dikemukakan untuk menentukan kepentingan faktor:

untuk faktor A :

H0 : μ 1A = μ 2A = ... = μ aA,

H1 : Tidak semua μ iA adalah sama;

untuk faktor B :

Untuk menentukan pengaruh interaksi faktor A dan B, sikap sebenar Fischer mesti dibandingkan dengan sikap kritis Fischer.

Jika nisbah Fisher sebenar adalah lebih besar daripada nisbah Fisher kritikal, maka hipotesis nol harus ditolak dengan tahap keertian. α ... Ini bermakna faktor mempengaruhi data dengan ketara: data bergantung pada faktor yang mempunyai kebarangkalian P = 1 − α .

Jika nisbah Fischer sebenar kurang daripada nisbah Fisher kritikal, maka hipotesis nol harus diterima dengan tahap keertian. α ... Ini bermakna faktor tersebut tidak mempengaruhi data dengan kebarangkalian yang ketara P = 1 − α .

ANOVA Ulangan Dua Hala: Satu Contoh

tentang interaksi faktor A dan B: Sikap sebenar Fischer adalah kurang kritikal, oleh itu, interaksi antara kempen pengiklanan dan kedai tertentu adalah tidak penting.

Analisis dua hala bagi varians dengan ulangan dalam MS Excel

Analisis varians dua hala dengan ulangan boleh dilakukan menggunakan prosedur MS Excel. Kami menggunakannya untuk menganalisis data tentang hubungan antara pendapatan kedai dan pilihan kedai tertentu dan kempen pengiklanan daripada Contoh 4.

Dalam menu MS Excel, laksanakan arahan Perkhidmatan / Analisis Data dan pilih alat analisis Analisis dua hala bagi varians dengan ulangan.

Kami mengisi data dengan cara yang sama seperti dalam kes analisis varians dua hala tanpa ulangan, dengan tambahan bahawa bilangan ulangan mesti dimasukkan dalam bilangan baris untuk tetingkap pemilihan.

Hasil daripada prosedur, dua jadual dipaparkan. Jadual pertama terdiri daripada tiga bahagian: dua yang pertama sepadan dengan setiap satu daripada dua kempen pengiklanan, yang ketiga mengandungi data pada kedua-dua kempen pengiklanan. Lajur jadual mengandungi maklumat tentang semua gred penggredan faktor kedua - stor: bilangan cerapan, jumlah nilai, nilai purata dan varians.

Jadual kedua mengandungi data jumlah kuasa dua sisihan (SS), bilangan darjah kebebasan (df), varians (MS), nilai sebenar nisbah Fisher (F), p-level (P-value) dan nilai kritikal nisbah Fisher (Krit F) untuk sumber variasi yang berbeza: dua faktor yang diberikan dalam baris (sampel) dan lajur, interaksi faktor, ralat (dalam) dan jumlah penunjuk (jumlah).

CIK F P-nilai F kritik
8,013339 0,500252 0,492897 4,747221
189,1904 11,81066 0,001462 3,88529
6,925272 0,432327 0,658717 3,88529
16,01861

Untuk faktor B Nisbah sebenar Fischer adalah lebih besar daripada yang kritikal, oleh itu, dengan kebarangkalian 95%, hasil berbeza dengan ketara antara kedai.

Untuk interaksi faktor A dan B Sikap sebenar Fischer adalah kurang kritikal, oleh itu, dengan kebarangkalian 95%, interaksi antara kempen pengiklanan dan kedai tertentu adalah tidak ketara.

Semua topik berkaitan "Statistik Matematik"

ANOVA(dari bahasa Latin Dispersio - dispersion / dalam Bahasa Inggeris Analysis Of Variance - ANOVA) digunakan untuk mengkaji pengaruh satu atau lebih pembolehubah kualitatif (faktor) ke atas satu pembolehubah kuantitatif bersandar (tindak balas).

Analisis varians adalah berdasarkan andaian bahawa beberapa pembolehubah boleh dianggap sebagai punca (faktor, pembolehubah bebas):, dan lain-lain sebagai akibat (pembolehubah bersandar). Pembolehubah bebas kadangkala dipanggil faktor boleh laras dengan tepat kerana dalam eksperimen penyelidik mempunyai keupayaan untuk mengubahnya dan menganalisis keputusan yang terhasil.

Tujuan utama analisis varians(ANOVA) ialah kajian tentang kepentingan perbezaan antara min dengan membandingkan (menganalisis) varians. Dengan membahagikan jumlah varians kepada pelbagai sumber, adalah mungkin untuk membandingkan varians yang disebabkan oleh perbezaan antara kumpulan dengan varians yang disebabkan oleh kebolehubahan dalam kumpulan. Jika hipotesis nol adalah benar (tentang kesamaan min dalam beberapa kumpulan pemerhatian yang dipilih daripada populasi umum), anggaran varians yang dikaitkan dengan kebolehubahan dalam kumpulan hendaklah hampir dengan anggaran varians antara kumpulan. Jika anda hanya membandingkan min dalam dua sampel, ANOVA akan memberikan keputusan yang sama seperti ujian-t biasa untuk sampel bebas (jika anda membandingkan dua kumpulan bebas objek atau pemerhatian) atau ujian-t untuk sampel bergantung (jika anda membandingkan dua pembolehubah pada set objek atau pemerhatian yang sama dan sama).

Intipati analisis varians adalah untuk memecahkan jumlah varians bagi sifat yang dikaji kepada komponen yang berasingan, disebabkan oleh pengaruh faktor-faktor tertentu, dan untuk menguji hipotesis tentang kepentingan pengaruh faktor-faktor ini ke atas sifat yang dikaji. Dengan membandingkan komponen varians antara satu sama lain menggunakan kriteria F Fisher, adalah mungkin untuk menentukan bahagian kebolehubahan keseluruhan sifat berkesan disebabkan oleh tindakan faktor terkawal.

Bahan permulaan untuk analisis varians ialah data penyelidikan tiga atau lebih sampel: yang boleh sama ada sama atau tidak sama dalam bilangan, kedua-duanya bersambung dan tidak koheren. Dengan bilangan faktor terkawal yang dikesan, analisis varians boleh univariate(dalam kes ini, pengaruh satu faktor ke atas keputusan eksperimen dikaji), dua faktor(apabila mengkaji pengaruh dua faktor) dan pelbagai faktor(membolehkan anda menilai bukan sahaja pengaruh setiap faktor secara berasingan, tetapi juga interaksi mereka).

ANOVA tergolong dalam kumpulan kaedah parametrik dan oleh itu hanya boleh digunakan apabila telah terbukti bahawa taburan adalah normal.

ANOVA digunakan apabila pembolehubah bersandar diukur dari segi nisbah, selang atau susunan, dan pembolehubah yang mempengaruhi adalah bersifat bukan berangka (skala penamaan).

Contoh tugasan

Dalam masalah yang diselesaikan dengan analisis varians, terdapat tindak balas yang bersifat numerik, yang dipengaruhi oleh beberapa pembolehubah yang bersifat nominal. Contohnya, beberapa jenis catuan untuk memberi makan ternakan atau dua cara memeliharanya, dsb.

Contoh 1: Beberapa kiosk farmasi beroperasi di tiga lokasi berbeza sepanjang minggu. Pada masa hadapan, kita hanya boleh meninggalkan satu. Adalah perlu untuk menentukan sama ada terdapat perbezaan yang ketara secara statistik antara volum jualan ubat di kiosk. Jika ya, kami akan memilih kiosk dengan purata jualan harian tertinggi. Jika perbezaan dalam jumlah jualan ternyata tidak ketara secara statistik, maka penunjuk lain harus menjadi asas untuk memilih kiosk.

Contoh 2: Perbandingan kontras cara kumpulan. Tujuh kecondongan politik disenaraikan daripada sangat liberal kepada sangat konservatif, dan kontras linear digunakan untuk menguji sama ada terdapat aliran bukan sifar ke arah nilai min kumpulan yang lebih tinggi - iaitu, sama ada terdapat peningkatan linear yang ketara dalam umur min apabila melihat kumpulan diperintahkan ke arah dari liberal kepada konservatif.

Contoh 3: Analisis varians dua hala. Selain saiz kedai, bilangan jualan produk selalunya dipengaruhi oleh lokasi rak dengan produk. Contoh ini mengandungi angka jualan mingguan untuk empat susun atur rak dan tiga saiz kedai. Hasil analisis menunjukkan bahawa kedua-dua faktor - lokasi rak dengan produk dan saiz kedai - mempengaruhi bilangan jualan, tetapi interaksinya tidak ketara.

Contoh 4: ANOVA Satu Dimensi: Reka bentuk blok penuh rawak dengan dua rawatan. Kesan semua kemungkinan gabungan tiga lemak dan tiga pelonggar pada roti disiasat. Empat sampel tepung yang diambil daripada empat sumber berbeza bertindak sebagai faktor penghalang. Kepentingan interaksi pelonggar lemak perlu ditentukan. Selepas itu, tentukan pelbagai kemungkinan untuk memilih kontras, yang memungkinkan untuk mengetahui gabungan tahap faktor yang berbeza.

Contoh 5: Model pelan hierarki (bersarang) dengan kesan campuran. Kesan empat kepala yang dipilih secara rawak dipasang dalam mesin ke atas ubah bentuk pemegang katod kaca yang dihasilkan dikaji. (Kepala dibina ke dalam mesin supaya kepala yang sama tidak boleh digunakan pada mesin yang berbeza). Kesan kepala dianggap sebagai faktor rawak. Statistik ANOVA menunjukkan bahawa tiada perbezaan yang ketara antara mesin, tetapi terdapat tanda-tanda bahawa kepala mungkin berbeza. Perbezaan antara semua mesin tidak ketara, tetapi bagi dua daripadanya perbezaan antara jenis kepala adalah ketara.

Contoh 6: Analisis satu dimensi bagi pengukuran berulang menggunakan pelan plot berpecah. Eksperimen ini dijalankan untuk menentukan kesan penilaian kebimbangan individu terhadap kelulusan peperiksaan pada empat percubaan berturut-turut. Data disusun supaya ia boleh dilihat sebagai kumpulan subset keseluruhan set data ("keseluruhan plot"). Kesan kebimbangan adalah tidak ketara, manakala kesan mencuba adalah ketara.

Senarai kaedah

  • Model Eksperimen Faktorial. Contoh: faktor yang mempengaruhi kejayaan menyelesaikan masalah matematik; faktor yang mempengaruhi jumlah jualan.

Data terdiri daripada beberapa siri pemerhatian (pemprosesan), yang dianggap sebagai realisasi sampel bebas. Hipotesis awal mengatakan bahawa tiada perbezaan dalam rawatan, i.e. diandaikan bahawa semua pemerhatian boleh dianggap sebagai satu sampel daripada populasi umum:

  • Model parametrik satu faktor: Kaedah Scheffe.
  • Model bukan parametrik satu faktor [Lagutin MB, 237]: Kriteria Kruskal-Wallis [Hollender M., Wolf DA, 131], kriteria Jonkhier [Lagutin MB, 245].
  • Kes umum model dengan faktor malar, teorem Cochran [Afifi A., Eisen S., 234].

Data adalah pemerhatian pendua:

  • Model bukan parametrik dua faktor: Kriteria Friedman [Lapach, 203], kriteria Halaman [Lagutin MB, 263]. Contoh: perbandingan keberkesanan kaedah pengeluaran, teknik pertanian.
  • Model bukan parametrik dua faktor untuk data tidak lengkap

Sejarah

Dari mana datangnya nama itu analisis varians? Ia mungkin kelihatan aneh bahawa prosedur untuk membandingkan cara dipanggil analisis varians. Sebenarnya, ini disebabkan oleh fakta bahawa apabila mengkaji kepentingan statistik perbezaan antara min dua (atau lebih) kumpulan, kita sebenarnya membandingkan (menganalisis) varians sampel. Konsep asas analisis varians dicadangkan Fisher pada tahun 1920. Mungkin istilah yang lebih semula jadi ialah analisis jumlah kuasa dua atau analisis variasi, tetapi secara tradisinya istilah ANOVA digunakan. Pada mulanya, ANOVA telah dibangunkan untuk memproses data yang diperoleh daripada eksperimen yang direka khas, dan dianggap satu-satunya kaedah yang menyiasat hubungan sebab akibat dengan betul. Kaedah ini digunakan untuk menilai eksperimen dalam pengeluaran tanaman. Kemudian, kepentingan saintifik umum analisis varians untuk eksperimen dalam psikologi, pedagogi, perubatan, dll.

kesusasteraan

  1. Scheffe G. Analisis varians. - M., 1980.
  2. Ahrens H. Leuter Yu. Analisis pelbagai variasi bagi varians.
  3. A. I. Kobzar Statistik Matematik Gunaan. - M .: Fizmatlit, 2006.
  4. Lapach S.N., Chubenko A.V., Babich P.N. Statistik dalam sains dan perniagaan. - Kiev: Morion, 2002.
  5. Lagutin M. B. Statistik matematik visual. Dalam dua jilid. - M .: P-center, 2003.
  6. Afifi A., Eisen S. Analisis Statistik: Pendekatan Berasaskan Komputer.
  7. Hollender M., Wolfe D.A. Kaedah statistik bukan parametrik.

Pautan

  • Analisis varians - buku teks elektronik StatSoft.


 


Baca:



Ulasan Nikon D5500

Ulasan Nikon D5500

Hey! Ini adalah bahagian akhir semakan kamera DSLR Nikon D5500 baharu, yang kami jalankan dalam format "Seminggu dengan pakar". Hari ini pada...

Skirt Tarian Ballroom DIY Skirt Tarian Ballroom

Skirt Tarian Ballroom DIY Skirt Tarian Ballroom

Apabila seorang gadis mula menari, penting bagi ibu bapa untuk memilih skirt tarian. Model yang sama tidak boleh digunakan pada...

Bagaimana untuk memilih telefon pintar dengan kamera terbaik Penilaian telefon pintar dengan ujian buta kamera terbaik

Bagaimana untuk memilih telefon pintar dengan kamera terbaik Penilaian telefon pintar dengan ujian buta kamera terbaik

Studio DxOMark menjalankan analisis terperinci tentang kualiti imej yang diambil pada telefon pintar yang berbeza. Ada yang menuduhnya berat sebelah, tetapi pada ...

Apa yang dilakukan oleh Nazi di kem tahanan Stutthof

Apa yang dilakukan oleh Nazi di kem tahanan Stutthof

Tidak ada orang di dunia hari ini yang tidak tahu apa itu kem tahanan. Semasa Perang Dunia Kedua, institusi ini, diwujudkan untuk ...

suapan-imej Rss