ev - katlar
Tek yönlü varyans analizi. Çok değişkenli varyans analizi Varyans makalesi analizi

ANOVAünlü matematikçinin eserlerine dayanarak RA Fisher... Oldukça sağlam "çağa" rağmen, bu yöntem hala biyolojik ve tarımsal araştırmalarda ana yöntemlerden biri olmaya devam ediyor. Varyans analizinin altında yatan fikirler, biyolojik ve tarımsal deneylerin planlanmasında olduğu kadar, deneysel verilerin matematiksel analizinin diğer birçok yönteminde yaygın olarak kullanılmaktadır.

Varyans analizi şunları yapmanızı sağlar:

1) iki veya daha fazla numune aracını karşılaştırın;

2) aynı anda birkaç bağımsız faktörün etkisini incelemek, her bir faktörün incelenen özelliğin değişkenliği üzerindeki etkisini ve bunların etkileşimini belirlemek mümkündür;

3) bilimsel bir deneyi doğru planlar.

Canlı organizmaların değişkenliği, malzemenin biyolojik düzgünlüğü derecesi ve çevresel koşullarla olan ilişkinin doğası ile belirlenen sınırlar dahilinde bireysel özelliklerin değerlerinin bir dağılımı veya dağılımı şeklinde kendini gösterir. Belirli sebeplerin etkisiyle değişen işaretlere denir. etkili.

Faktörler, çeşitliliği bir şekilde etkin özelliğin çeşitliliğini etkileyebilen herhangi bir etki veya koşuldur. Varyans analizinde faktörlerin istatistiksel etkisi, çalışmada düzenlenen incelenen faktörlerin çeşitliliğinin etkili göstergesinin çeşitliliğine yansıması olarak anlaşılmaktadır.

Çeşitlilik ile, bir grupta birleştirilmiş farklı bireylerde her bir özelliğin eşit olmayan değerlerinin varlığını kastediyoruz. İncelenen özelliğe göre bir grup bireyin çeşitliliği, genellikle çeşitlilik (veya değişkenlik) göstergeleri ile ölçülen farklı bir dereceye sahip olabilir: sınırlar, standart sapma, varyasyon katsayısı. Varyans analizinde, bir özelliğin bireysel ve ortalama değerlerinin çeşitlilik derecesi ölçülür ve bu genel yöntemin özelliklerini oluşturan özel yollarla karşılaştırılır.

Faktörlerin organizasyonu, çalışılan her faktöre birkaç değer atanmasıdır. Bu değerlere göre her bir faktör birkaç dereceye ayrılır; Her bir derecelendirme için, birkaç birey, etkin özelliğin değerinin daha sonra ölçüldüğü rastgele örnekleme ilkesine göre seçilir.

İncelenen faktörlerin etkisinin derecesini ve güvenilirliğini bulmak için, toplam çeşitliliğin bu faktörlerin neden olduğu kısmını ölçmek ve değerlendirmek gerekir.

Etkili özelliğin varyasyon derecesini etkileyen faktörler şu şekilde ayrılır:

1) ayarlanabilir

2) rastgele

Düzenlenmiş (sistematik) faktörler, deneyde birkaç dereceleme olan deneyde çalışılan faktörün etkisinden kaynaklanır. faktör derecelendirmesi- bu, etkili özellik üzerindeki etkisinin derecesidir. Özelliğin derecelendirilmesine göre, karşılaştırma için deneyin çeşitli varyantları vurgulanır. Bu faktörler ön koşullu olduğundan, araştırmalarda düzenlenmiş olarak adlandırılırlar, yani. deneyin organizasyonuna bağlı olarak verilir. Sonuç olarak, ayarlanabilir faktörler, eylemleri deneyimde incelenen faktörlerdir, farklı seçeneklerin örnek ortalamaları arasındaki farkları belirleyen onlardır - gruplar arası (faktöriyel) varyans.

rastgele faktörler doğadaki biyolojik nesnelerin tüm işaretlerinin doğal varyasyonu tarafından belirlenir. Bunlar, deneyimin kontrolü dışındaki faktörlerdir. Etkili özellik üzerinde rastgele bir etkiye sahiptirler, deneysel hatalara neden olurlar ve özelliğin her bir varyant içindeki dağılımını (dağılımını) belirlerler. Bu yayılma denir grup içi (rastgele) varyans.

Bu nedenle, etkili özelliğin genel değişkenliğinde bireysel faktörlerin nispi rolü, varyans ile karakterize edilir ve kullanılarak incelenebilir. varyans analizi veya saçılma analizi

ANOVA'nın temel aldığı grup içi ve grup içi varyansların karşılaştırılması... Gruplar arası varyans, grup içi varyansı aşmıyorsa, gruplar arasındaki farklar rastgeledir. Gruplar arası varyans grup içi varyanstan önemli ölçüde yüksekse, o zaman çalışılan gruplar (seçenekler) arasında deneyde çalışılan faktörün etkisinden dolayı istatistiksel olarak anlamlı farklılıklar vardır.

Bundan, varyans analizi kullanılarak etkili özelliğin istatistiksel çalışmasında, varyantlardaki varyasyon, tekrarlar, bu gruplar içindeki kalıntı varyasyon ve deneydeki etkili özelliğin genel varyasyonunun belirlenmesi gerekir. Buna göre, üç tip dispersiyon ayırt edilir.:

1) Etkili özelliğin genel varyansı (S y 2);

2) Gruplar arası veya örnekler arasında özel (S y 2);

3) Grup içi, artık (S z 2).

Buradan, varyans analiziBu, sapmaların karelerinin toplam toplamının ve toplam serbestlik derecesi sayısının deneyin yapısına karşılık gelen parçalara veya bileşenlere bölünmesi ve incelenen faktörlerin eyleminin ve etkileşiminin öneminin değerlendirilmesidir. F kriterine göre. Eşzamanlı olarak çalışılan faktörlerin sayısına bağlı olarak, iki, üç, dört faktörlü varyans analizi ayırt edilir.

Alan işlenirken, birkaç bağımsız seçenekten oluşan tek faktörlü istatistiksel kompleksler, toplam kareler toplamı (C y) ile ölçülen etkili özelliğin toplam değişkenliği üç bileşene bölünür: seçenekler (örnekler) arasındaki varyasyon - CV , tekrarların varyasyonu (seçenekler ortak kontrollü bir koşulla birbirleriyle ilişkilidir - organize tekrarların varlığı) - C p ve C z seçeneklerindeki varyasyon. Genel formda, bir özelliğin değişkenliği aşağıdaki ifade ile temsil edilir:

Cy = CV + Cp + Cz.

Toplam serbestlik derecesi sayısı (N -1) ayrıca üç bölüme ayrılmıştır:

seçenekler için serbestlik dereceleri (l - 1);

tekrarlar için serbestlik derecesi (n - 1);

rastgele varyasyon (n - 1) × (l - 1).

Bir saha deneyine göre sapmaların karelerinin toplamı - l ve tekrarlar - n seçenekleriyle istatistiksel bir kompleks aşağıdaki gibi bulunur. İlk olarak, orijinal tablo kullanılarak, tekrarların toplamları belirlenir - Σ P, varyantlar için - Σ V ve tüm gözlemlerin toplam toplamı - Σ X.

Ardından aşağıdaki göstergeler hesaplanır:

Toplam gözlem sayısı N = l × n;

Düzeltme faktörü (değişiklik) C cor = (Σ X 1) 2 / N;

Toplam kareler toplamı Cy = Σ X 1 2 - C cor;

Tekrarlar için kareler toplamı C p = Σ P 2 / (l –C cor);

C V = Σ V 2 / (n - 1);

Hatanın karelerinin toplamı (kalan) C Z = C y - C p - C V.

C V ve C Z karelerinin elde edilen toplamları, bunlara karşılık gelen serbestlik derecelerine bölünür ve iki ortalama kare (varyans) elde edilir:

Varyantlar S v 2 = C V / l - 1;

Hatalar S Z 2 = C Z / (n - 1) × (l - 1).

Araçlar arasındaki farklılıkların öneminin değerlendirilmesi. Elde edilen ortalama kareler, seçeneklerin varyansını (S v 2) Fisher kriterine göre hatanın varyansı (SZ 2) ile karşılaştırarak incelenen faktörlerin etkisinin önemini değerlendirmek için varyans analizinde kullanılır (F = SY2 / SZ 2). Karşılaştırma birimi, deneyin rastgele hatasını belirleyen rastgele varyansın ortalama karesidir.

Fisher kriterinin kullanılması, örnek ortalamalar arasında önemli farklılıkların varlığını veya yokluğunu belirlemenize izin verir, ancak ortalamalar arasındaki belirli farklılıkları göstermez.

Test edilen H o - hipotezi, tüm örnek ortalamaların bir genel ortalamanın tahminleri olduğu ve aralarındaki farkların önemsiz olduğu varsayımıdır. Eğer F gerçeği = S Y 2 / S Z 2 ≤ F teoremi, o zaman boş hipotez reddedilmez. Numune ortalamaları arasında önemli bir fark yoktur ve testin bittiği yer burasıdır. Boş hipotez için reddedilir F gerçeği = S Y 2 / S Z 2 ≥ F teoremiÇalışmada benimsenen anlamlılık düzeyi için F kriterinin değeri, değişkenlerin varyansı ve rastgele varyansın serbestlik dereceleri dikkate alınarak ilgili tabloda bulunur. Genellikle %5 anlamlılık düzeyi kullanırlar ve daha titiz bir yaklaşımla %1 - ve hatta %0,1'dir.

n büyüklüğünde bir örnek için, örnek varyansı, örnek ortalamasından sapmaların karelerinin toplamının şuna bölünmesiyle hesaplanır: n-1(örnek boyutu eksi bir). Bu nedenle, sabit bir numune boyutu n için, varyans, kısalık için gösterilen kareler (sapmalar) toplamının bir fonksiyonudur, SS (İngilizce Karelerin Toplamından - Karelerin Toplamından). Ayrıca, örnek varyansı veya varyans tahmininin dikkate alındığını çok iyi bilerek, genellikle örnek kelimesini atlarız. Varyans analizi, varyansın parçalara veya bileşenlere bölünmesine dayanır:

SS hataları ve SS Efekt. Grup içi değişkenlik ( SS) genellikle artık bileşen veya varyans olarak adlandırılır hatalar. Bu, genellikle bir deneyde tahmin edilemeyeceği veya açıklanamayacağı anlamına gelir. Diğer tarafta, SS etkisi(veya gruplar arasındaki varyans bileşeni), gruplardaki ortalamalar arasındaki farkla açıklanabilir. Başka bir deyişle, belirli bir gruba ait olmak açıklar gruplar arası değişkenlik, çünkü bu grupların farklı ortalama değerleri olduğunu biliyoruz.

Varyans analizinin temel mantığı.Özetle, ANOVA'nın amacının ortalamalar (gruplar veya değişkenler için) arasındaki farkın istatistiksel anlamlılığını test etmek olduğunu söyleyebiliriz. Bu kontrol, kareler toplamının bileşenlere bölünmesiyle gerçekleştirilir, yani. toplam varyansı (varyansı), biri rastgele hatadan (yani grup içi değişkenlikten) kaynaklanan ve ikincisi ortalama değerlerdeki farkla ilişkili olan parçalara bölerek. Varyansın son bileşeni daha sonra ortalamalar arasındaki farkın istatistiksel önemini analiz etmek için kullanılır. Fark bu ise anlamlı bir şekilde, sıfır hipotezi reddedilmiş ve araçlar arasında bir farkın varlığına ilişkin alternatif bir hipotez kabul edilir.

Bağımlı ve bağımsız değişkenler. Değerleri deney sırasında yapılan ölçümlerle belirlenen (örneğin test sırasında alınan puan) değişkenlere denir. bağımlı değişkenler. Deneyde kontrol edilebilen değişkenlere (örneğin, gözlemleri gruplara ayırmanıza veya sınıflandırmanıza izin veren öğretim yöntemleri veya diğer kriterler) denir. faktörler veya bağımsız değişkenler.

Birçok faktör. Dünya doğası gereği karmaşık ve çok boyutludur. Bir olgunun tamamen tek bir değişken tarafından tanımlandığı durumlar oldukça nadirdir. Örneğin büyük domates yetiştirmeyi öğrenmeye çalışıyorsak bitkinin genetik yapısı, toprak tipi, ışık, sıcaklık vb. faktörler göz önünde bulundurulmalıdır. Bu nedenle, tipik bir deneyde ele alınması gereken birçok faktör vardır. Varyans analizinin kullanılmasının, farklı faktör seviyelerindeki iki örneğin seriler kullanılarak tekrar tekrar karşılaştırılması yerine tercih edilmesinin ana nedeni T- kriter, varyans analizinin önemli ölçüde daha fazla olmasıdır. verimli ve küçük örnekler için daha bilgilendiricidir.

Çıktı. Varyans analizi İngiliz bilim adamı R. A. Fisher tarafından geliştirilmiş ve tarımsal ve biyolojik araştırma uygulamalarına dahil edilmiştir. . Varyans analizinin özü özelliğin toplam değişkenliğinin ve toplam serbestlik derecesi sayısının alan deneyinin yapısına karşılık gelen bileşen parçalarına ayrıştırılmasından ve ayrıca Fisher kriterine göre hareket eden faktörün değerlendirilmesinden oluşur.

Araştırılan sorunun eylemi, toprak verimliliğinin heterojenliği ve deneydeki rastgele hatalar nedeniyle özelliğin genel değişkenliği nerede.

Saha deneyimi tekrarlarına dayalı olarak değişen verimler.

Araştırılan sorunun eylemiyle ilişkili deneyim çeşitlerine göre verimlerin değişmesi.

Deneyimdeki rastgele hatalarla ilişkili verim varyasyonları.

Çıktı varyans analizi aşağıdaki kurallara göre yapılır:

1. Gerçek ≥ Teorik ise deneyimde önemli farklılıklar vardır. F gerçek ise, deneyimde önemli bir fark yoktur.

2. NDS - Seçenekler arasındaki farkı belirlemek için kullanılan en küçük anlamlı fark. Fark d ≥ NSR ise, seçenekler arasındaki farklar önemlidir. eğer d< НСР, то различия между вариантами не существенные.

Gruplar seçenekler.

1. Fark d önemliyse ve verimde bir artışa işaret ediyorsa, seçenekler grup 1'e atıfta bulunur.

2. Eğer d– farkı anlamlı değilse, o zaman seçenekler grup 2'ye atıfta bulunur.

3. Fark d önemliyse, ancak verimde bir düşüşe işaret ediyorsa, seçenekler grup 3'e atıfta bulunur.

Bir formül seçme ANOVA, deneyde seçenekleri yerleştirme yöntemlerine bağlıdır:

1. Organize tekrarlar için:

2. Düzensiz tekrarlar için.

5.1. ANOVA nedir?

Varyans analizi 1920'lerde İngiliz matematikçi ve genetikçi Ronald Fisher tarafından geliştirildi. 20. yüzyılın biyolojisini en çok kimin etkilediğinin tespit edildiği bilim adamları arasında yapılan bir araştırmaya göre, şampiyonluğu kazanan Sir Fisher'dı (hizmetleri için şövalyelik ile ödüllendirildi - Büyük Britanya'daki en yüksek ayrımlardan biri); Bu bakımdan Fischer, 19. yüzyılda biyoloji üzerinde en büyük etkiye sahip olan Charles Darwin ile karşılaştırılabilir.

Varyans analizi artık ayrı bir istatistik dalıdır. İncelenen miktarın değişkenlik ölçüsünün, bu miktarı etkileyen faktörlere ve rastgele sapmalara karşılık gelen parçalara ayrılabileceği Fisher tarafından keşfedilen gerçeğe dayanmaktadır.

Varyans analizinin özünü anlamak için aynı tür hesaplamaları iki kez yapacağız: “manuel” (bir hesap makinesi ile) ve Statistica programını kullanarak. Görevimizi basitleştirmek için, yeşil kurbağaların çeşitliliğinin gerçek bir tanımının sonuçlarıyla değil, insanlarda kadın ve erkeklerin karşılaştırılmasına ilişkin kurgusal bir örnekle çalışacağız. 12 yetişkinin boy çeşitliliğini düşünün: 7 kadın ve 5 erkek.

Tablo 5.1.1. Tek yönlü ANOVA için bir örnek: 12 kişi için cinsiyet ve boy verileri

Tek yönlü bir varyans analizi yapalım: Tanımlanan gruptaki erkek ve kadınların boy bakımından istatistiksel olarak anlamlı olup olmadığını karşılaştıracağız.

5.2. normallik testi

Daha fazla akıl yürütme, dikkate alınan örnekteki dağılımın normal veya normale yakın olduğu gerçeğine dayanmaktadır. Dağılım normalden uzaksa, varyans (varyans), değişkenliğinin yeterli bir ölçüsü değildir. Bununla birlikte, ANOVA, normallikten dağılım sapmalarına karşı nispeten sağlamdır.

Bu verilerin normallik testi iki farklı şekilde yapılabilmektedir. İlk: İstatistikler / Temel İstatistikler / Tablolar / Tanımlayıcı istatistikler / Normallik sekmesi. sekmesinde normallik dağılımın normalliği için kullanılan testleri seçebilirsiniz. Frekans tabloları düğmesine tıkladığınızda, bir frekans tablosu ve Histogram düğmeleri - bir histogram görünecektir. Tablo ve çubuk grafik, çeşitli testlerin sonuçlarını gösterecektir.

İkinci yöntem, histogramlar oluşturulurken uygun olanın kullanılmasıyla ilgilidir. Histogram oluşturma iletişim kutusunda (Grafs / Histograms ...), Gelişmiş sekmesini seçin. Alt kısmında bir İstatistik bloğu var. Üzerine Shapiro-Wilk'i işaretleyelim. T est ve Kolmogorov-Smirnov testi, şekilde gösterildiği gibi.

Pirinç. 5.2.1. Histogramları oluşturmaya yönelik iletişim kutusunda dağılımın normalliği için istatistiksel testler

Histogramdan da anlaşılacağı gibi, örneğimizdeki büyüme dağılımı normal olandan farklıdır (ortada - “başarısızlık”).


Pirinç. 5.2.2. Önceki şekilde belirtilen parametrelerle çizilen histogram

Grafiğin başlığındaki üçüncü satır, gözlemlenen dağılımın en yakın olduğu normal dağılımın parametrelerini gösterir. Genel ortalama 173, genel standart sapma 10.4'tür. Aşağıdaki grafikteki kenar çubuğunda, normallik testlerinin sonuçları gösterilmektedir. D, Kolmogorov-Smirnov testidir ve SW-W, Shapiro-Vilk testidir. Görüldüğü gibi kullanılan tüm testler için boy dağılımı ile normal dağılım arasındaki farklar istatistiksel olarak önemsiz çıkmıştır ( P her durumda 0.05'ten fazla).

Dolayısıyla, resmi olarak konuşursak, bir dağılımın normal dağılıma uygunluğu testleri, normal dağılım varsayımına dayalı bir parametrik yöntemi kullanmamızı "yasaklamadı". Daha önce de belirtildiği gibi, varyans analizi normallikten sapmalara nispeten dirençlidir, bu yüzden onu kullanmaya devam edeceğiz.

5.3. Tek yönlü ANOVA: manuel hesaplamalar

Verilen örnekte insanların boyunun değişkenliğini karakterize etmek için, sapmaların karelerinin toplamını hesaplıyoruz (İngilizce'de şu şekilde gösterilir: SS , Kareler Toplamı veya) ortalamadan bireysel değerler: ... Bu örnekte ortalama yükseklik 173 santimetredir. Buna dayanarak,

SS = (186–173) 2 + (169–173) 2 + (166–173) 2 + (188–173) 2 + (172–173) 2 + (179–173) 2 + (165–173) 2 + (174–173) 2 + (163–173) 2 + (162–173) 2 + (162–173) 2 + (190–173) 2 ;

SS = 132 + 42 + 72 + 152 + 12 + 62 + 82 + 12 + 102 + 112 + 112 + 172;

SS = 169 + 16 + 49 + 225 + 1 + 36 + 64 + 1 + 100 + 121 + 121 + 289 = 1192.

Ortaya çıkan değer (1192), tüm veri setinin değişkenliğinin bir ölçüsüdür. Ancak, her biri için kendi ortalamasının ayırt edilebildiği iki gruptan oluşurlar. Yukarıdaki verilerde, kadınların ortalama boyu 168 cm, erkeklerin boyu - 180 cm'dir.

Kadınlar için sapmaların karelerinin toplamını hesaplayalım:

SS f = (169–168) 2 + (166–168) 2 + (172–168) 2 + (179–168) 2 + (163–168) 2 + (162–168) 2 ;

SS f = 12 + 22 + 42 + 112 + 32 + 52 + 62 = 1 + 4 + 16 + 121 + 9 + 25 + 36 = 212.

Erkekler için sapmaların karelerinin toplamını da hesaplıyoruz:

SS m = (186–180) 2 + (188–180) 2 + (174–180) 2 + (162–180) 2 + (190–180) 2 ;

SS m = 62 + 82 + 62 + 182 + 102 = 36 + 64 + 36 + 324 + 100 = 560.

Varyans mantığının analizine göre incelenen değer neye bağlıdır?

Hesaplanan iki değer, SS f ve SS m , varyans analizinde genellikle "hata" olarak adlandırılan grup içi varyansı karakterize eder. Bu ismin kökeni aşağıdaki mantıkla ilişkilidir.

Bu örnekte bir kişinin büyümesini ne belirler? Her şeyden önce, cinsiyetleri ne olursa olsun, genel olarak insanların ortalama boyları. İkincisi - yerden. Bir cinsiyetten (erkek) insanlar diğerinden (kadın) daha uzunsa, bu, cinsiyetin etkisi olan "ortak insan" ortalamasına ek olarak temsil edilebilir. Son olarak, aynı cinsiyetten insanların boyları bireysel farklılıklardan dolayı farklılık gösterir. Boyu insan ortalamasının ve cinsiyet ayarlamasının toplamı olarak tanımlayan bir modelde, bireysel farklılıklar açıklanamaz ve “hata” olarak kabul edilebilir.

Böylece varyans analizi mantığına göre araştırılan değer şu şekilde belirlenir: , nerede x ij - çalışılan faktörün j-th değerinde incelenen değerin i-inci değeri; - genel ortalama; F j - incelenen faktörün j-th değerinin etkisi; - "hata", miktarın ait olduğu nesnenin bireyselliğinin katkısıx ij .

Gruplar arası kareler toplamı

Yani, SS hatalar = SS f + SS m = 212 + 560 = 772. Bu değerle grup içi değişkenliği tanımladık (gruplar cinsiyete göre tanımlandığında). Ancak değişkenliğin ikinci bir kısmı da var - gruplararası, diyeceğimizSS etkisi (çünkü ele alınan nesne kümesini kadın ve erkek olarak bölmenin etkisinden bahsediyoruz).

Her grubun ortalaması, genel ortalamadan farklıdır. Bu farkın toplam değişkenlik ölçüsüne katkısını hesaplarken, grup ile toplam ortalama arasındaki farkı her gruptaki nesne sayısıyla çarpmalıyız.

SS etkisi = = 7 × (168–173) 2 + 5 × (180–173) 2 = 7 × 52 + 5 × 72 = 7 × 25 + 5 × 49 = 175 + 245 = 420.

Burada Fischer tarafından keşfedilen kareler toplamının sabitliği ilkesi ortaya çıktı: SS = SS etkisi + SS hatası , yani bu örnek için 1192 = 440 + 722.

orta kareler

Örneğimizde gruplar arası ve grup içi kareler toplamlarını karşılaştırarak, ilkinin iki grubun varyasyonu ile ilişkili olduğunu ve ikinci - 12 değerlerinin 2 grupta olduğunu görebiliriz. Serbestlik derecesi sayısı ( df ) bazı parametreler için gruptaki nesnelerin sayısı ile bu değerleri birbirine bağlayan bağımlılıkların (denklemlerin) sayısı arasındaki fark olarak tanımlanabilir.

Örneğimizde df etkisi = 2–1 = 1, a df hataları = 12–2 = 10.

Karelerin toplamını serbestlik derecelerine bölerek ortalama kareleri elde edebiliriz ( HANIM , Kareler Ortalamaları). Bunu yaptıktan sonra şunu belirleyebiliriz. HANIM - varyanstan başka bir şey değil ("varyans", kareler toplamının serbestlik derecesi sayısına bölünmesinin sonucu). Bu keşiften sonra ANOVA tablosunun yapısını anlayabiliriz. Örneğimiz için, böyle görünecek.

etki

Hata

MS etkisi ve MS hataları gruplar arası ve grup içi varyans tahminleridir ve bu nedenle kritere göre karşılaştırılabilirler.F (Fisher'ın adını taşıyan Snedecor kriteri), varyansları karşılaştırmak için tasarlanmıştır. Bu kriter, basitçe, daha büyük varyansı daha küçük olana bölmenin bölümüdür. Bizim durumumuzda bu 420 / 77.2 = 5.440'tır.

Tablolar kullanılarak Fisher testinin istatistiksel öneminin belirlenmesi

Tabloları kullanarak etkinin istatistiksel önemini manuel olarak belirleyecek olsaydık, kriterin elde edilen değerini karşılaştırmamız gerekirdi. F verilen serbestlik dereceleri için belirli bir istatistiksel anlamlılık düzeyine karşılık gelen kritik ile.


Pirinç. 5.3.1. Kriterin kritik değerlerine sahip tablonun parçası F

Gördüğünüz gibi istatistiksel anlamlılık düzeyi için p = 0.05, kriterin kritik değeriF 4,96'dır. Bu, örneğimizde çalışılan cinsiyetin eyleminin 0,05 istatistiksel anlamlılık düzeyiyle kaydedildiği anlamına gelir.

Sonuç aşağıdaki gibi yorumlanabilir. Kadınların ve erkeklerin ortalama boylarının aynı olduğu ve boylarındaki kaydedilen farkın örneklerin oluşumundaki rastgelelikle ilişkili olduğu sıfır hipotezinin olasılığı %5'ten azdır. Bu, kadınların ve erkeklerin ortalama boyunun farklı olduğuna dair alternatif bir hipotez seçmemiz gerektiği anlamına gelir.

5.4. Tek yönlü varyans analizi ( ANOVA) Statistica paketinde

Hesaplamaların manuel olarak değil, uygun programlar yardımıyla (örneğin, Statistica paketi) yapıldığı durumlarda, değer P otomatik olarak belirlenir. Kritik değerden biraz daha yüksek olduğundan emin olabilirsiniz.

Tartışılan örneği, varyans analizinin en basit varyantını kullanarak analiz etmek için, ilgili verilerle dosya için İstatistik / ANOVA prosedürünü çalıştırmanız ve Analiz tipi penceresinde Tek yönlü ANOVA seçeneğini ve Hızlı özellikler'i seçmeniz gerekir. Belirtim yöntemi penceresindeki iletişim seçeneği ...


Pirinç. 5.4.1. Genel ANOVA / MANOVA Diyaloğu

Açılan hızlı iletişim penceresinde, Değişkenler alanında, değişkenliğini incelediğimiz verileri içeren sütunları (Bağımlı değişken listesi; bizim durumumuzda Büyüme sütunu) ve bunları içeren sütunu belirtmeniz gerekir. çalışılan değeri gruplara ayıran değerler (Kategorik öngörücü ( faktör); bizim durumumuzda Cinsiyet sütunu). Analizin bu versiyonunda, çok değişkenli analizin aksine sadece bir faktör dikkate alınabilir.


Pirinç. 5.4.2. Tek Yönlü ANOVA Diyaloğu

Faktör kodları penceresinde, söz konusu faktörün bu analiz sırasında işlenmesi gereken değerlerini belirtmelisiniz. Mevcut tüm değerler Yakınlaştır düğmesi kullanılarak görüntülenebilir; Örneğimizde olduğu gibi, faktörün tüm değerlerini dikkate almanız gerekiyorsa (ve örneğimizde cinsiyet için bunlardan sadece ikisi var), Tümü düğmesini tıklayabilirsiniz. İşlenecek sütunlar ve faktör kodları ayarlandığında, Tamam düğmesine tıklayabilir ve sonuçların hızlı analizine gidebilirsiniz: ANOVA Sonuçları 1, Hızlı sekmesine.

Pirinç. 5.4.3. ANOVA sonuçları penceresinin Hızlı sekmesi

Tüm efektler / Grafikler düğmesi, iki grubun ortalamalarının nasıl karşılaştırıldığını görmenizi sağlar. Grafiğin üzerinde, söz konusu faktör için serbestlik derecesi sayısı ve F ve p değerleri belirtilmiştir.


Pirinç. 5.4.4. ANOVA Sonuçlarının Çizilmesi

Tüm efektler düğmesi, yukarıda açıklanana benzer bir ANOVA tablosu elde etmenizi sağlar (bazı önemli farklılıklarla).


Pirinç. 5.4.5. ANOVA tablosu (manuel olarak oluşturulmuş bir tabloyla karşılaştırın)

Tablonun alt satırı, karelerin toplamını, serbestlik derecesi sayısını ve hatanın ortalama karelerini (grup içi değişkenlik) gösterir. Yukarıdaki bir satır - incelenen faktör için benzer göstergeler (bu durumda, Cinsiyet işareti) ve kriter F (etkinin ortalama karelerinin hatanın ortalama karelerine oranı) ve istatistiksel anlamlılık düzeyi. Söz konusu faktörün etkisinin istatistiksel olarak anlamlı çıkması kırmızı ile vurgulanarak gösterilmiştir.

İlk satır, “Kesme” göstergesine ilişkin verileri içerir. Bu tablodaki satır, Statistica'nın 6. veya sonraki sürümünde yeni olan kullanıcılara bir gizem sunuyor. Intercept değeri muhtemelen tüm veri değerlerinin karelerinin toplamının ayrıştırılmasıyla ilgilidir (yani 1862 + 1692 ... = 360340). Bunun için belirtilen F kriterinin değeri, bölünerek elde edilir. MS Engelleme / MS Hatası = 353220 / 77.2 = 4575.389 ve doğal olarak çok düşük bir değer verir P ... İlginç bir şekilde, Statistica-5'te bu değer hiç hesaplanmadı ve paketin sonraki sürümlerini kullanma kılavuzları, giriş hakkında hiçbir şekilde yorum yapmıyor. Muhtemelen Statistica-6 ve sonrasında çalışan bir biyologun yapabileceği en iyi şey, ANOVA tablosundaki Intercept satırını görmezden gelmektir.

5.5. ANOVA ve Öğrenci ve Fisher Testleri: Hangisi Daha İyi?

Fark etmiş olabileceğiniz gibi, tek yönlü varyans analizini kullanarak karşılaştırdığımız verileri Student ve Fisher testlerini kullanarak da araştırabiliriz. Bu iki yöntemi karşılaştıralım. Bunu yapmak için, bu kriterleri kullanarak erkekler ve kadınlar arasındaki boy farkını hesaplayın. Bunu yapmak için, İstatistikler / Temel İstatistikler / t-testi, bağımsız, gruplara göre gitmemiz gerekecek. Doğal olarak, Bağımlı değişkenler Büyüme değişkenidir ve Gruplandırma değişkeni Cinsiyet değişkenidir.


Pirinç. 5.5.1. ANOVA kullanılarak işlenen verilerin Student ve Fisher testlerine göre karşılaştırılması

Gördüğünüz gibi, sonuç ANOVA ile aynıdır. P = 0.041874, Şekil 2'de gösterildiği gibi her iki durumda da. 5 ve Şek. 5.5.2 (kendiniz görün!).


Pirinç. 5.5.2. Analiz sonuçları (sonuç tablosunun ayrıntılı bir açıklaması için - Öğrenci kriteriyle ilgili paragrafta)

Öğrenci ve Fisher testlerine göre ele alınan analizde matematiksel açıdan F kriterinin ANOVA ile aynı olmasına (ve varyans oranını ifade etmesine) rağmen, burada sunulan analiz sonuçlarındaki anlamının vurgulanması önemlidir. Final tablosu tamamen farklı. Student's ve Fisher's kriterlerine göre karşılaştırma yapılırken örneklerin ortalama değerlerinin karşılaştırılması Student's kriterine göre, değişkenliklerinin karşılaştırılması ise Fisher's kriterine göre yapılır. Analiz sonuçlarında, varyansın kendisi değil, karekökü - standart sapma gösterilir.

ANOVA'da ise, tersine, farklı örneklerin ortalamalarını karşılaştırmak için Fisher testi kullanılır (tartıştığımız gibi, bu, kareler toplamını parçalara bölerek ve grup içi ve grup içi değişkenliğe karşılık gelen ortalama kareler toplamını karşılaştırarak yapılır) .

Bununla birlikte, yukarıdaki fark, özünden ziyade istatistiksel bir çalışmanın sonuçlarının sunumu ile ilgilidir. Örneğin, Glantz'ın (1999, s. 99) belirttiği gibi, Student testiyle grupların karşılaştırılması, iki örnek için varyans analizinin özel bir durumu olarak düşünülebilir.

Dolayısıyla, örnekleri Student ve Fisher's testlerine göre karşılaştırmanın, varyans analizine göre önemli bir avantajı vardır: Örnekleri değişkenlikleri açısından karşılaştırabilir. Ancak varyans analizinin avantajları hala daha önemlidir. Bunlar, örneğin, aynı anda birden fazla numuneyi karşılaştırma yeteneğini içerir.

Dikkate alınan varyans analizi şeması, aşağıdakilere bağlı olarak farklılaştırılır: a) popülasyonun gruplara ayrıldığı özelliğin doğasına (örnekler; b) popülasyonun gruplara ayrıldığı özelliklerin sayısına (örnekler) ); c) örnekleme yöntemi hakkında.

Karakteristik değerler. Popülasyonu gruplara ayıran, genel popülasyonu veya ona yakın bir popülasyonu temsil edebilir. Bu durumda, ANOVA şeması yukarıda tartışılana karşılık gelir. Farklı grupları oluşturan bir özelliğin değerleri genel popülasyondan bir örneği temsil ediyorsa, boş ve alternatif hipotezlerin formülasyonu değişir. Boş bir hipotez olarak, gruplar arasında farklılıklar olduğu, yani grup ortalamalarının bir miktar varyasyon gösterdiği ileri sürülür. Alternatif bir hipotez olarak, salınımın olmadığı ileri sürülmektedir. Açıkçası, böyle bir hipotez formülasyonu ile, varyansları karşılaştırmanın sonuçlarını somutlaştırmak için hiçbir neden yoktur.

Gruplama işaretlerinin sayısındaki artışla, örneğin 2'ye kadar, ilk önce sıfır sayısı ve buna bağlı olarak alternatif hipotezler artar. Bu durumda, ilk boş hipotez, birinci gruplama karakteristiğinin grupları için ortalamalar arasında farkların yokluğundan bahseder, ikinci boş hipotez, ikinci gruplama karakteristiğinin grupları için ortalamalarda farklılıkların bulunmadığından bahseder ve son olarak üçüncü boş hipotez, faktörlerin etkileşiminin (gruplama özellikleri) sözde etkisinin yokluğundan bahseder.

Etkileşim etkisi, iki faktörün toplam eylemiyle açıklanamayan, etkin özelliğin değerindeki böyle bir değişiklik olarak anlaşılır. Öne sürülen üç hipotez çiftini test etmek için, F-Fisher kriterinin üç gerçek değerini hesaplamak gerekir, bu da toplam varyasyon hacminin aşağıdaki ayrıştırma varyantını önerir.

F-kriterini elde etmek için gereken dağılımlar, varyasyon hacimlerinin serbestlik derecesi sayısına bölünmesiyle bilinen bir şekilde elde edilir.

Bildiğiniz gibi, örnekler bağımlı ve bağımsız olabilir. Numuneler bağımlıysa, toplam varyasyon miktarında, kopyalara göre varyasyon ayırt edilmelidir.
... Vurgulanmazsa, bu varyasyon grup içi varyasyonu önemli ölçüde artırabilir (
), varyans analizinin sonuçlarını bozabilir.

Soruları gözden geçir

17-1 Varyans analizi sonuçlarının özelliği nedir?

17-2. Q-Tukey kriteri somutlaştırma için ne zaman kullanılır?

17-3.Birinci, ikinci ve benzeri sıraların farkları nelerdir?

17-4. Tukey Q testinin gerçek değeri nasıl bulunur?

17-5. Her bir farklılık hakkında hangi hipotezler öne sürülmektedir?

17-6. Tukey Q kriterinin tablo değeri neye bağlıdır?

17-7. Gruplama özniteliğinin seviyeleri bir örnekse, sıfır hipotezi nedir?

17-8. Veriler iki kritere göre gruplandırıldığında toplam varyasyon miktarı nasıl ayrıştırılır?

17-9. Bu durumda, tekrarlardaki varyasyon vurgulanır (
) ?

Özet

Varyans analizinin sonuçlarını belirlemenin dikkate alınan mekanizması, ona tam bir görünüm vermenizi sağlar. Tukey's Q testi kullanılırken sınırlamalara dikkat edilmelidir. Materyal ayrıca ANOVA modellerinin sınıflandırılmasının temel ilkelerini de özetledi. Bunların sadece ilkeler olduğu vurgulanmalıdır. Her modelin özelliklerinin ayrıntılı bir incelemesi, ayrı bir daha derin çalışma gerektirir.

Ders için test ödevleri

Varyans analizinde hipotezler hangi istatistiksel özelliklerle ilgilidir?

    İki varyansa göre

    Bir ortalamaya göre

    Birkaç ortalamaya göre

    Bir varyansa göre

Varyans analizinde alternatif hipotezin içeriği nedir?

    Karşılaştırılan varyanslar eşit değildir.

    Karşılaştırılan tüm ortalamalar eşit değildir.

    En Az İki Genel Ortalama Eşit Değildir

    Gruplar arası varyans, grup içi varyanstan daha büyüktür

Varyans analizinde en sık kullanılan anlamlılık seviyeleri nelerdir?

Grup içi varyasyon, gruplar arası varyasyondan daha büyükse, ANOVA devam etmeli mi yoksa H0 veya AN ile hemen uyuşmalı mı?

1. Gerekli varyanslarla devam etmeli misiniz?

2. H0 ile hemfikir olunmalıdır

3. ON ile anlaşın

Grup içi varyansın gruplar arası varyansa eşit olduğu bulunursa, varyans analizi ne izlemelidir?

    Genel araçların eşitliğinin sıfır hipotezine katılıyorum

    Birbirine eşit olmayan en az bir çift aracın varlığına ilişkin alternatif hipoteze katılıyorum.

F-Fisher testi hesaplanırken payda her zaman hangi varyans olmalıdır?

    Yalnızca grup içi

    Her neyse, gruplar arası

    Gruplar arası, daha fazla grup içi ise

F-Fisher kriterinin gerçek değeri ne olmalıdır?

    Her zaman 1'den az

    Her zaman 1'den büyük

    1'e eşit veya daha büyük

F-Fisher kriterinin tablo değeri neye bağlıdır?

1.Kabul edilen önem düzeyinden

2. Toplam varyasyonun serbestlik derecesi sayısından

3. Gruplar arası varyasyonun serbestlik derecesi sayısından

4. Grup içi varyasyon serbestlik derecesi sayısı hakkında

5. F-Fisher kriterinin gerçek değerinin değerinden mi?

Her grupta eşit varyanslara sahip gözlem sayısındaki artış, …… kabul olasılığını artırır.

1 boş hipotez

2.Alternatif hipotez

3. Hem boş hem de alternatif hipotezlerin kabulünü etkilemez

Varyans analizinin sonuçlarını belirtmenin amacı nedir?

    Varyans hesaplamalarının doğru yapılıp yapılmadığını netleştirin

    Genel ortalamalardan hangisinin birbirine eşit olduğunu belirleyin

    Genel ortalamalardan hangisinin birbirine eşit olmadığını netleştirin

"Varyans analizi sonuçları belirlenirken, tüm genel ortalamaların birbirine eşit olduğu ortaya çıktı" ifadesi doğru mu?

    Doğru ve yanlış olabilir

    Doğru değil, bu hesaplamalardaki hatalardan kaynaklanıyor olabilir

Varyans analizini belirlerken tüm genel ortalamaların birbirine eşit olmadığı sonucuna varmak mümkün müdür?

1. mümkün

2. Muhtemelen istisnai durumlarda

3. Prensipte imkansızdır.

4. Yalnızca hesaplamalarda hata yaparsanız mümkündür

F-Fisher kriterine göre sıfır hipotezi kabul edildiyse, varyans analizini belirtmek gerekli midir?

1.Gerekli

2. Gerekli değil

3. ANOVA analistinin takdirine bağlı olarak

Hangi durumda varyans analizi sonuçlarını somutlaştırmak için Tukey testi kullanılır?

1. Gruplara (örneklere) göre gözlem sayısı aynıysa

2. Gruplara (örneklere) göre gözlem sayısı farklıysa

3. Hem eşit hem de eşit olmayan örnekler varsa

tembellik

Tukey testine dayalı varyans analizinin sonuçlarını belirlerken NDS nedir?

1. Ortalama hatayı kriterin gerçek değerine göre üretin

2. Kriterin tablo değeri ile ortalama hatanın çarpımı

3. Örnek araçlar arasındaki her bir farkın oranı

ortalama hata

4. Örnek ortalamalar arasındaki fark

Örneklem 2 özelliğe göre gruplara ayrılırsa, özelliğin toplam varyasyonuna en az kaç kaynak ayrılmalıdır?

Örnekler (gruplar) tarafından yapılan gözlemler bağımlıysa, toplam varyasyon kaç kaynağa bölünmelidir (gruplandırma özelliği bir)?

Gruplar arası varyasyonun kaynağı (nedeni) nedir?

    Şans oyunu

    Şans ve faktör oyununun birleşik eylemi

    Faktör (ler) eylemi

    Varyans analizinden sonra öğrenin

Grup içi varyasyonun kaynağı (nedeni) nedir?

1 şans oyunu

2. Şans ve faktör oyununun birleşik eylemi

3. Faktör(ler)in eylemi

4. Varyans analizinden sonra bulunacaktır.

Karakteristik değerler kesirlerle ifade edilirse, kaynak verileri dönüştürmek için hangi yöntem kullanılır?

    logaritma

    Kökün çıkarılması

    fi dönüşümü

Ders 8 Korelasyon

Dipnot

Özellikler arasındaki ilişkiyi incelemek için en önemli yöntem korelasyon yöntemidir. Bu ders, bu yöntemin içeriğini, bu bağlantının analitik ifadesine yaklaşımları ortaya koymaktadır. İletişimin sıkılığının göstergeleri gibi belirli göstergelere özellikle dikkat edilir.

anahtar kelimeler

Korelasyon. En küçük kareler yöntemi. Regresyon katsayısı. Belirleme ve korelasyon katsayıları.

Ele alınan sorunlar

    Fonksiyonel ve korelasyon ilişkisi

    İletişimin korelasyon denklemini oluşturma aşamaları. Denklem Katsayılarının Yorumlanması

    Sızdırmazlık göstergeleri

    Seçilen iletişim göstergelerinin değerlendirilmesi

Modüler birim 1 Korelasyonun özü. İletişimin korelasyon denklemini oluşturma aşamaları, denklemin katsayılarının yorumlanması.

Modüler bir üniteyi incelemenin amacı ve hedefleri 1 korelasyonun özelliklerini anlamaktan ibarettir. iletişim denklemini oluşturmak için algoritmaya hakim olmak, denklemin katsayılarının içeriğini anlamak.

      Korelasyonun özü

Doğal ve sosyal olaylarda iki tür bağlantı vardır - işlevsel bağlantı ve korelasyon bağlantısı. İşlevsel bir bağlantıda, bağımsız değişkenin her değeri, işlevin kesin olarak tanımlanmış (bir veya daha fazla) değerine karşılık gelir. Fonksiyonel bir ilişki örneği, denklemle ifade edilen çevre ve yarıçap arasındaki ilişkidir.
... Yarıçapın her değeri rçevre için tek bir değere karşılık gelir L . Bir korelasyon bağlantısıyla, faktör özelliğinin her değeri, etkili özelliğin pek kesin olmayan birkaç değerine karşılık gelir. Korelasyon örnekleri, bir kişinin ağırlığı (etkili özellik) ile boyu (faktör özelliği) arasındaki ilişki, uygulanan gübre miktarı ile verim arasındaki ilişki, fiyat ve teklif edilen ürünün miktarı arasındaki ilişkidir. Bir korelasyonun ortaya çıkmasının kaynağı, kural olarak, gerçek hayatta etkili özelliğin değerinin, değişimlerinin rastgele doğasına sahip olanlar da dahil olmak üzere birçok faktöre bağlı olduğu gerçeğidir. Örneğin, bir kişinin aynı kilosu yaşa, cinsiyete, Diyete, mesleğe ve diğer birçok faktöre bağlıdır. Ancak aynı zamanda, büyümenin genel olarak belirleyici faktör olduğu açıktır. Bu koşullar göz önüne alındığında, korelasyon, yalnızca ortalama olarak çok sayıda gözlem varsa kurulabilen ve tahmin edilebilen tamamlanmamış bir ilişki olarak tanımlanmalıdır.

1.2 İletişimin korelasyon denklemini oluşturma aşamaları.

İşlevsel bir ilişki gibi, bir korelasyon da bir ilişki denklemi ile ifade edilir. İnşa etmek için, aşağıdaki adımlardan (aşamalardan) sürekli olarak geçmelisiniz.

İlk olarak, kişi neden-sonuç ilişkilerini anlamalı, işaretlerin ikincilliğini, yani hangilerinin sebep (faktör işaretleri) ve hangilerinin sonuç (etkili işaretler) olduğunu bulmalıdır. Öznitelikler arasındaki nedensel ilişkiler, korelasyon yönteminin kullanıldığı öznenin teorisi ile kurulur. Örneğin, "insan anatomisi" bilimi, kilo ve boy arasındaki ilişkinin kaynağının ne olduğunu, bu işaretlerden hangisinin bir faktör olduğunu söylemenizi sağlar, bunun sonucunda "ekonomi" bilimi arasındaki ilişkinin mantığını ortaya çıkarır. fiyat ve arz, neyin ve hangi aşamada neden ve sonucun ne olduğunu belirler ... Böyle bir ön teorik gerekçe olmadan, gelecekte elde edilen sonuçların yorumlanması zordur ve bazen saçma sonuçlara yol açabilir.

Sebep-sonuç ilişkilerinin varlığını belirledikten sonra, önce denklem türünü seçerken bu ilişkiler resmileştirilmeli, yani bir iletişim denklemi kullanılarak ifade edilmelidir. Denklem türünü seçmek için bir dizi teknik önerilebilir. Korelasyon yönteminin kullanıldığı konunun teorisine dönebilirsiniz, örneğin "agrokimya" bilimi, ilişkiyi ifade etmek için hangi denklemin kullanılması gerektiği sorusuna zaten bir cevap almış olabilir: verim - gübreler. Böyle bir cevap yoksa, bir denklem seçmek için, bunları uygun şekilde işleyerek bazı ampirik verileri kullanmalısınız. Deneysel verilere dayalı denklem türünü seçtikten sonra, bu tür denklemin kullanılan verilerin ilişkisini tanımlamak için kullanılabileceğini açıkça anlamanız gerekir. Bu verileri işlemek için ana teknik, faktör özniteliğinin değerleri apsis ekseninde çizildiğinde ve etkili özniteliğin olası değerleri ordinat ekseninde çizildiğinde grafiklerin oluşturulmasıdır. Tanım olarak, faktör özniteliğinin aynı değeri, etkili özniteliğin bir dizi tanımsız değerine karşılık geldiğinden, yukarıdaki eylemlerin bir sonucu olarak, korelasyon alanı olarak adlandırılan belirli bir puan kümesi alacağız. Korelasyon alanının genel görünümü, bazı durumlarda denklemin olası biçimi hakkında bir varsayımda bulunmaya izin verir. Bilgisayar teknolojisinin modern gelişimi ile, bir denklem seçmenin ana yöntemlerinden biri, çeşitli denklem türlerini numaralandırmaktır. , en iyi denklem, en yüksek kararlılık katsayısını sağlayan, aşağıda tartışılacak olan konuşmadır. Hesaplamalara geçmeden önce, denklemi oluşturmak için kullanılan deneysel verilerin belirli gereksinimleri ne ölçüde karşıladığını kontrol etmek gerekir. Gereksinimler, faktöriyel özellikler ve veri seti ile ilgilidir. Faktör işaretleri, eğer birkaç tane varsa, birbirinden bağımsız olmalıdır. Bütünlüğe gelince, öncelikle homojen olmalıdır.

(homojenlik kavramı daha önce düşünülmüştü) ve ikincisi oldukça büyük. Her faktöriyel özellik en az 8-10 gözlemi hesaba katmalıdır.

Bir denklem seçtikten sonraki adım, denklemin katsayılarını hesaplamaktır. Denklem katsayıları çoğunlukla en küçük kareler yöntemi kullanılarak hesaplanır. Korelasyon açısından, en küçük kareler yönteminin kullanımı, denklemin bu katsayılarını elde etmekten ibarettir.
= min, yani etkin göstergenin gerçek değerlerinden sapmaların karelerinin toplamı ( ) denklemine göre hesaplananlardan ( ) minimum değerdi. Bu gereklilik, normal denklemler olarak adlandırılan iyi bilinen bir sistem oluşturularak ve çözülerek gerçekleştirilir. arasındaki korelasyon denklemi olarak ise y ve x doğrunun denklemi seçilir
, bildiğiniz gibi normal denklemler sistemi aşağıdaki gibi olacaktır:

Bu sistemin çözümü ile ilgili a ve B , katsayıların gerekli değerlerini elde ederiz. Katsayıların hesaplanmasının doğruluğu eşitlik ile kontrol edilir.

Varyans analizi ne için kullanılır? Varyans analizinin amacı, araştırılan etkili özellikteki değişiklikler üzerinde herhangi bir nitel veya nicel faktörün önemli bir etkisinin olup olmadığını incelemektir. Bunun için, önemli bir etkiye sahip olan veya olmayan bir faktör, derecelendirme sınıflarına (diğer bir deyişle gruplara) ayrılır ve ilgili veri setlerindeki ortalamalar arasındaki önem incelenerek faktörün etkisinin aynı olup olmadığı belirlenir. faktör derecelerine göre. Örnekler: işletmenin kârının kullanılan hammadde türüne bağımlılığı araştırılır (o zaman sınıflandırma sınıfları hammadde türleridir), bir üretim biriminin üretim maliyetinin işletme bölümünün büyüklüğüne bağımlılığı (daha sonra derecelendirme sınıfları, bölümün büyüklüğünün özellikleridir: büyük, orta, küçük).

Minimum derecelendirme sınıfı (grup) sayısı ikidir. Mezuniyet sınıfları nitel veya nicel olabilir.

Varyans analizine neden varyans analizi denir? Varyans analizi, iki varyansın oranını inceler. Varyans, bildiğimiz gibi, verilerin ortalama etrafındaki dağılımının bir özelliğidir. Birincisi, faktörlerin (grupların) derecelendirmeleri arasındaki değerlerin tüm verilerin ortalaması etrafındaki dağılımını karakterize eden faktörün etkisiyle açıklanan varyanstır. İkincisi, verilerin grupların kendi ortalamaları etrafında derecelendirmeler (gruplar) içindeki dağılımını karakterize eden açıklanamayan varyanstır. Birinci varyans, gruplar arası ve ikinci grup içi varyans olarak adlandırılabilir. Bu varyansların oranına gerçek Fisher oranı denir ve Fisher oranının kritik değeri ile karşılaştırılır. Gerçek Fisher oranı kritik olandan büyükse, orta dereceli dereceler birbirinden farklıdır ve incelenen faktör verilerdeki değişimi önemli ölçüde etkiler. Daha az ise, ortalama derecelendirme notları birbirinden farklı değildir ve faktörün önemli bir etkisi yoktur.

ANOVA'da hipotezler nasıl formüle edilir, kabul edilir ve reddedilir? Varyans analizinde, bir veya daha fazla faktörün toplam etkisinin özgül ağırlığı belirlenir. Faktörün etkisinin önemi, hipotezlerin test edilmesiyle belirlenir:

  • H0 : μ 1 = μ 2 = ... = μ a, nerede a- derecelendirme sınıflarının sayısı - tüm derecelendirme sınıflarının bir ortalama değeri vardır,
  • H1 : Hepsi değil μ ben eşittir - tüm derecelendirme sınıfları aynı ortalama değere sahip değildir.

Bir faktörün etkisi önemli değilse, o zaman bu faktörün derecelendirme sınıfları arasındaki fark da önemsizdir ve varyans analizi sırasında sıfır hipotezi H0 reddedilmez. Faktörün etkisi önemliyse, o zaman boş hipotez H0 reddedildi: tüm derecelendirme sınıfları aynı ortalamaya sahip değildir, yani derecelendirme sınıfları arasındaki olası farklılıklar arasında bir veya daha fazlası önemlidir.

Varyans analiziyle ilgili birkaç kavram daha. ANOVA'daki istatistiksel bir kompleks, ampirik bir veri tablosudur. Tüm derecelendirme sınıfları aynı sayıda seçeneğe sahipse, seçeneklerin sayısı farklıysa - heterojen (heterojen) istatistiksel komplekse homojen (homojen) denir.

Değerlendirilen faktörlerin sayısına bağlı olarak, tek yönlü, iki yönlü ve çok değişkenli varyans analizi ayırt edilir.

Tek yönlü varyans analizi: yöntemin özü, formüller, örnekler

Yöntemin özü, formüller

istatistiksel kompleksin sapmalarının karelerinin toplamının bileşenlere bölünebileceği gerçeğine dayanarak:

SS = SS bir + SS e,

SS

SSa a sapmaların kareleri toplamı,

SSe- açıklanamayan sapma karelerinin toplamı veya hata sapmalarının karelerinin toplamı.

eğer aracılığıyla nben her dereceleme derecesindeki (grup) seçeneklerin sayısını belirleyin ve a faktörün (grupların) toplam derecelendirme sayısıdır, o zaman toplam gözlem sayısıdır ve aşağıdaki formüller elde edilebilir:

toplam sapma karesi sayısı: ,

faktöre atfedilen a sapma karelerinin toplamı: ,

açıklanamayan sapma karelerinin toplamı veya hata sapmalarının karelerinin toplamı: ,

- gözlemlerin toplam ortalaması,

(grup).

Dışında,

faktörün (grubun) derecelendirmesinin varyansı nerede.

İstatistiksel bir kompleksin verileri için tek yönlü bir varyans analizi yapmak için, gerçek Fisher oranını - faktörün (gruplar arası) ve açıklanamayan varyansın (grup içi) etkisiyle açıklanan varyans oranını bulmak gerekir. ):

ve Fischer'in kritik değeri ile karşılaştırın.

Varyanslar aşağıdaki gibi hesaplanır:

Varyans açıkladı,

açıklanamayan varyans

vbir = a − 1 - açıklanan varyansın serbestlik derecesi sayısı,

ve = na - açıklanamayan varyansın serbestlik derecesi sayısı,

v = n

Önemlilik düzeyi ve serbestlik derecelerinin belirli değerleri ile Fisher oranının kritik değeri, istatistiksel tablolarda bulunabilir veya MS Excel işlevi F. OBR kullanılarak hesaplanabilir (aşağıdaki şekil, artırmak için üzerine tıklayın. sol fare tuşu).


İşlev, aşağıdaki verilerin girilmesini gerektirir:

Olasılık - önem düzeyi α ,

Derece_özgürlük1, açıklanan varyansın serbestlik derecesi sayısıdır va,

Derece_özgürlük2, açıklanamayan varyansın serbestlik derecesi sayısıdır ve.

Fisher oranının gerçek değeri kritik olandan () büyükse, boş hipotez anlamlılık düzeyi ile reddedilir. α ... Bu, faktörün verilerdeki değişimi önemli ölçüde etkilediği ve verilerin bir olasılıkla faktöre bağlı olduğu anlamına gelir. P = 1 − α .

Fisher oranının gerçek değeri kritik olandan () küçükse, boş hipotez anlamlılık düzeyi ile reddedilemez. α ... Bu, faktörün bir olasılıkla verileri önemli ölçüde etkilemediği anlamına gelir. P = 1 − α .

Tek Yönlü Varyans Analizi: Örnekler

Örnek 1. Kullanılan hammadde türünün işletmenin kârını etkileyip etkilemediğinin bulunması gerekir. Faktörün altı dereceli sınıf (grup) (1. tip, 2. tip, vb.), 4 yıl boyunca milyonlarca ruble cinsinden 1000 birim ürün üretiminden elde edilen kârla ilgili veriler toplanır.

Hammadde türü2014 2015 2016 2017
1 inci7,21 7,55 7,29 7,6
2.7,89 8,27 7,39 8,18
3 üncü7,25 7,01 7,37 7,53
4.7,75 7,41 7,27 7,42
5.7,7 8,28 8,55 8,6
6.7,56 8,05 8,07 7,84
Ortalama
Dağılım
7,413 0,0367
7,933 0,1571
7,290 0,0480
7,463 0,0414
8,283 0,1706
7,880 0,0563

a= 6 ve her sınıfta (grup) nben = 4 gözlem. Toplam gözlem sayısı n = 24 .

Serbestlik derecesi sayısı:

vbir = a − 1 = 6 − 1 = 5 ,

ve = na = 24 − 6 = 18 ,

v = n − 1 = 24 − 1 = 23 .

Varyansları hesaplayalım:

.

.

Fischer'ın gerçek tutumu daha kritik olduğundan:

anlamlılık düzeyi ile α = 0.05, üretimde kullanılan hammadde türüne bağlı olarak işletmenin kârının önemli ölçüde farklı olduğu sonucuna varıyoruz.

Veya, aynı olan, tüm faktör derecelendirme sınıflarında (gruplar) araçların eşitliği hakkındaki ana hipotezi reddediyoruz.

Az önce tartışılan örnekte, her faktör not sınıfı aynı sayıda seçeneğe sahipti. Ancak, girişte belirtildiği gibi, seçeneklerin sayısı farklı olabilir. Ve bu hiçbir şekilde ANOVA prosedürünü karmaşıklaştırmaz. Bu bir sonraki örnek.

Örnek 2. Bir üretim biriminin üretim maliyetinin, işletmenin bölümünün büyüklüğüne bağlı olup olmadığını bulmak gerekir. Faktör (birimin boyutu) üç dereceye (gruplara) ayrılır: küçük, orta, büyük. Belirli bir süre için aynı tür ürünün bir biriminin maliyet fiyatına ilişkin bu gruplara karşılık gelen genelleştirilmiş veriler.

küçükortalamabüyük
48 47 46
50 61 57
63 63 57
72 47 55
43 32
59 59
58
Ortalama58,6 54,0 51,0
Dağılım128,25 65,00 107,60

Faktör derecelendirme sınıflarının sayısı (gruplar) a= 3, sınıflardaki (gruplardaki) gözlem sayısı n1 = 4 , n2 = 7 , n3 = 6 ... Toplam gözlem sayısı n = 17 .

Serbestlik derecesi sayısı:

vbir = a − 1 = 2 ,

ve = na = 17 − 3 = 14 ,

v = n − 1 = 16 .

Sapmaların karelerinin toplamını hesaplayalım:

Varyansları hesaplayalım:

,

.

Gerçek Fisher oranını hesaplayalım:

.

Fischer'in Kritik Oranı:

Fisher oranının gerçek değeri kritik değerden daha az olduğu için, işletmenin bölümünün boyutunun üretim maliyetini önemli ölçüde etkilemediği sonucuna varıyoruz.

Ya da aynı olan %95 olasılıkla, bir işletmenin küçük, orta ve büyük bölümlerinde aynı üründen bir birimin ortalama üretim maliyetinin önemli ölçüde farklılık göstermediği ana hipotezini kabul ediyoruz.

MS Excel'de tek yönlü ANOVA

MS Excel prosedürü kullanılarak tek yönlü varyans analizi yapılabilir Tek yönlü varyans analizi... Bunu, kullanılan hammadde türü ile işletmenin karı arasındaki ilişkiye ilişkin verileri örnek 1'den analiz etmek için kullanıyoruz.

Hizmet / Veri Analizi ve bir analiz aracı seçin Tek yönlü varyans analizi.

Pencerede Giriş aralığı veri alanını belirtiyoruz (bizim durumumuzda $ A $ 2: $ E $ 7). Faktörün nasıl gruplandırıldığını belirtiriz - sütunlara veya satırlara göre (bizim durumumuzda satırlara göre). İlk sütun faktör sınıflarının adlarını içeriyorsa kutuyu işaretleyin. İlk sütun etiketleri... Pencerede Alfa anlamlılık düzeyini belirtmek α = 0,05 .

İkinci tablo - Varyans Analizi - gruplar arasındaki ve gruplar içindeki faktör değerlerine ve toplamlara ilişkin verileri içerir. Bunlar sapmaların karelerinin toplamı (SS), serbestlik derecesi sayısı (df), varyans (MS). Son üç sütun, Fisher oranının (F), p-düzeyinin (P-değeri) gerçek değerini ve Fisher oranının (F kritik) kritik değerini içerir.

HANIM F P-değeri F kritik
0,58585 6,891119 0,000936 2,77285
0,085017

Fisher oranının (6.89) gerçek değeri kritik olandan (2.77) daha büyük olduğundan, %95 olasılıkla tüm hammaddeleri kullanırken ortalama üretkenliğin eşitliği hakkındaki sıfır hipotezini reddediyoruz, yani, kullanılan hammadde türünün kârlı işletmeleri etkilediği sonucuna varıyoruz.

Tekrarlar olmadan iki yönlü varyans analizi: yöntemin özü, formüller, örnek

Etkili bir özelliğin iki faktöre olası bağımlılığını kontrol etmek için iki yönlü varyans analizi kullanılır - A ve B... Sonra a- faktör derecelerinin sayısı A ve B- faktör derecelerinin sayısı B... İstatistiksel komplekste, artıkların karelerinin toplamı üç bileşene ayrılır:

SS = SS bir + SS b + SS e,

- sapmaların karelerinin toplamı,

- bir faktörün etkisiyle açıklanır A sapmaların kareleri toplamı,

- bir faktörün etkisiyle açıklanır B sapmaların kareleri toplamı,

- gözlemlerin toplam ortalaması,

Faktörün her derecesindeki gözlemlerin ortalaması A ,

B .

A ,

Faktörün etkisiyle açıklanan dağılım B ,

vbir = a − 1 A ,

vb = B − 1 - faktörün etkisiyle açıklanan yayılma serbestliği derecesi sayısı B ,

ve = ( a − 1)(B − 1)

v = ab- 1 - toplam serbestlik derecesi sayısı.

Faktörler birbirine bağlı değilse, faktörlerin önemini belirlemek için iki boş hipotez ve bunlara karşılık gelen alternatif hipotezler ileri sürülür:

faktör için A :

H0 : μ 1A = μ 2A = ... = μ bir,

H1 : Hepsi değil μ iA eşittir;

faktör için B :

H0 : μ 1B = μ 2B = ... = μ aB,

H1 : Hepsi değil μ iB eşittir.

A

Bir faktörün etkisini belirlemek için B Fischer'in gerçek tutumu, Fischer'in eleştirel tutumu ile karşılaştırılmalıdır.

α P = 1 − α .

α P = 1 − α .

Tekrarlar olmadan iki yönlü varyans analizi: bir örnek

Örnek 3. Motor boyutuna ve yakıt tipine bağlı olarak, 100 kilometrede ortalama yakıt tüketimi litre olarak verilmektedir.

Yakıt tüketiminin motor boyutuna ve yakıt tipine bağlı olup olmadığının kontrol edilmesi gerekir.

Çözüm. faktör için A notlandırma sınıflarının sayısı a= 3, faktör için B notlandırma sınıflarının sayısı B = 3 .

Sapmaların karelerinin toplamını hesaplıyoruz:

,

,

,

.

Karşılık gelen varyanslar:

,

,

.

A ... Gerçek Fischer oranı kritik olandan daha az olduğu için, motor hacminin yakıt tüketimini etkilemediği hipotezini %95 olasılıkla kabul ediyoruz. Ancak anlamlılık düzeyini seçersek α = 0.1, ardından Fisher oranının gerçek değeri ve ardından %95 olasılıkla motor hacminin yakıt tüketimini etkilediğini varsayabiliriz.

Bir Faktör için Fischer'in Gerçek Oranı B , Fisher oranının kritik değeri: ... Gerçek Fischer oranı, Fisher oranının kritik değerinden büyük olduğundan, yakıt türünün tüketimini etkilediğini %95 olasılıkla varsayıyoruz.

MS Excel'de tekrarlar olmadan iki yönlü varyans analizi

MS Excel prosedürü kullanılarak tekrarlar olmadan iki yönlü varyans analizi yapılabilir. Bunu, örnek 3'teki yakıt türü ile tüketimi arasındaki ilişkiye ilişkin verileri analiz etmek için kullanacağız.

MS Excel menüsünde, komutu yürütün Hizmet / Veri Analizi ve bir analiz aracı seçin Tekrarlar olmadan iki yönlü varyans analizi.

Verileri, tek değişkenli varyans analizi durumunda olduğu gibi dolduruyoruz.


Prosedürün bir sonucu olarak, iki tablo görüntülenir. İlk tablo Toplamlar'dır. Tüm faktör derecelendirme sınıflarına ilişkin verileri içerir: gözlem sayısı, toplam değer, ortalama değer ve varyans.

İkinci tablo - Varyans Analizi - varyasyon kaynakları hakkında veriler içerir: satırlar arasındaki dağılım, sütunlar arasındaki dağılım, hata dağılımı, toplam saçılım, kare sapmaların toplamı (SS), serbestlik derecesi sayısı (df), varyans (MS ). Son üç sütun, Fisher oranının (F), p-düzeyinin (P-değeri) gerçek değerini ve Fisher oranının (F kritik) kritik değerini içerir.

HANIM F P-değeri F kritik
3,13 5,275281 0,075572 6,94476
8,043333 13,55618 0,016529 6,944276
0,593333

faktör A(motor hacmi) satırlar halinde gruplandırılmıştır. 5.28 olan gerçek Fischer oranı kritik 6.94'ten daha az olduğundan, yakıt tüketiminin motor boyutuna bağlı olmadığını %95 olasılıkla varsayıyoruz.

faktör B(yakıt türü) sütunlarda gruplandırılmıştır. 13.56 olan gerçek Fischer oranı kritik 6.94'ten daha büyüktür, bu nedenle %95 olasılıkla yakıt tüketiminin türüne bağlı olduğunu varsayıyoruz.

Tekrarlarla iki yönlü varyans analizi: yöntemin özü, formüller, örnek

Sadece etkili özelliğin iki faktöre olası bağımlılığını kontrol etmek için değil, tekrarlarla iki yönlü varyans analizi kullanılır - A ve B değil, aynı zamanda faktörlerin olası etkileşimi A ve B... Sonra a- faktör derecelerinin sayısı A ve B- faktör derecelerinin sayısı B, r- tekrar sayısı. İstatistiksel komplekste, artıkların karelerinin toplamı dört bileşene ayrılır:

SS = SS bir + SS b + SS ab + SS e,

- sapmaların karelerinin toplamı,

- bir faktörün etkisiyle açıklanır A sapmaların kareleri toplamı,

- bir faktörün etkisiyle açıklanır B sapmaların kareleri toplamı,

- faktörlerin etkileşiminin etkisiyle açıklanır A ve B sapmaların kareleri toplamı,

- açıklanamayan sapma karelerinin toplamı veya hata sapmalarının karelerinin toplamı,

- gözlemlerin toplam ortalaması,

- faktörün her derecesindeki gözlemlerin ortalaması A ,

- faktörün her derecesindeki ortalama gözlem sayısı B ,

Faktör derecelendirmelerinin her bir kombinasyonundaki ortalama gözlem sayısı A ve B ,

n = kısa- toplam gözlem sayısı.

Varyanslar aşağıdaki gibi hesaplanır:

Faktörün etkisiyle açıklanan dağılım A ,

Faktörün etkisiyle açıklanan dağılım B ,

- faktörlerin etkileşimi ile açıklanan varyans A ve B ,

- hatanın açıklanamayan varyansı veya varyansı,

vbir = a − 1 - faktörün etkisiyle açıklanan yayılma serbestliği derecesi sayısı A ,

vb = B − 1 - faktörün etkisiyle açıklanan yayılma serbestliği derecesi sayısı B ,

vab = ( a − 1)(B − 1) - faktörlerin etkileşimi ile açıklanan varyansın serbestlik derecesi sayısı A ve B ,

ve = ab(r − 1) - hatanın açıklanamayan varyansının veya varyansının serbestlik derecesi sayısı,

v = kısa- 1 - toplam serbestlik derecesi sayısı.

Faktörler birbirinden bağımsız ise, faktörlerin önemini belirlemek için üç boş hipotez ve bunlara karşılık gelen alternatif hipotezler ileri sürülür:

faktör için A :

H0 : μ 1A = μ 2A = ... = μ bir,

H1 : Hepsi değil μ iA eşittir;

faktör için B :

Faktörlerin etkileşiminin etkisini belirlemek için A ve B Fischer'in gerçek tutumu, Fischer'in eleştirel tutumu ile karşılaştırılmalıdır.

Gerçek Fisher oranı kritik Fisher oranından büyükse, boş hipotez anlamlılık düzeyi ile reddedilmelidir. α ... Bu, faktörün verileri önemli ölçüde etkilediği anlamına gelir: veriler, olasılıklı faktöre bağlıdır. P = 1 − α .

Gerçek Fischer oranı, kritik Fisher oranından küçükse, anlamlılık düzeyinde sıfır hipotezi kabul edilmelidir. α ... Bu, faktörün bir olasılıkla verileri önemli ölçüde etkilemediği anlamına gelir. P = 1 − α .

İki Yönlü Tekrar ANOVA: Bir Örnek

faktörlerin etkileşimi hakkında A ve B: Fischer'in gerçek tutumu kritik olmaktan daha azdır, bu nedenle reklam kampanyası ile belirli bir mağaza arasındaki etkileşim gerekli değildir.

MS Excel'de tekrarlarla iki yönlü varyans analizi

MS Excel prosedürü kullanılarak tekrarlarla iki yönlü varyans analizi yapılabilir. Mağaza geliri ile belirli bir mağazanın seçimi ve Örnek 4'teki bir reklam kampanyası arasındaki ilişkiye ilişkin verileri analiz etmek için kullanıyoruz.

MS Excel menüsünde, komutu yürütün Hizmet / Veri Analizi ve bir analiz aracı seçin Tekrarlarla iki yönlü varyans analizi.

Verileri tekrarsız iki yönlü varyans analizi durumunda olduğu gibi doldururuz, ayrıca seçim penceresi için satır sayısına tekrar sayısının girilmesi gerekir.

Prosedürün bir sonucu olarak, iki tablo görüntülenir. İlk tablo üç bölümden oluşur: ilk ikisi iki reklam kampanyasının her birine karşılık gelir, üçüncüsü her iki reklam kampanyasına ilişkin verileri içerir. Tablonun sütunları, ikinci faktörün tüm derecelendirme notları hakkında bilgi içerir - mağaza: gözlem sayısı, toplam değer, ortalama değer ve varyans.

İkinci tablo, sapmaların karelerinin toplamı (SS), serbestlik derecesi sayısı (df), varyans (MS), Fisher oranının gerçek değeri (F), p seviyesi (P değeri) ve farklı varyasyon kaynakları için Fisher oranının (F kritik) kritik değeri: satırlarda (örnek) ve sütunlarda verilen iki faktör, faktörlerin etkileşimi, hatalar (iç) ve toplam göstergeler (toplam).

HANIM F P-değeri F kritik
8,013339 0,500252 0,492897 4,747221
189,1904 11,81066 0,001462 3,88529
6,925272 0,432327 0,658717 3,88529
16,01861

faktör için B Fischer'in gerçek oranı kritik olandan daha büyüktür, bu nedenle, %95 olasılıkla gelirler mağazalar arasında önemli ölçüde farklılık gösterir.

Faktörlerin etkileşimi için A ve B Fischer'in fiili tutumu kritik olmaktan daha azdır, bu nedenle, %95 olasılıkla, reklam kampanyası ile belirli bir mağaza arasındaki etkileşim önemli değildir.

Tüm ilgili konular "Matematiksel İstatistik"

ANOVA(Latince Dispersio - dağılım / İngilizce Varyans Analizi - ANOVA'dan) bir veya daha fazla nitel değişkenin (faktörün) bir bağımlı nicel değişken (yanıt) üzerindeki etkisini incelemek için kullanılır.

Varyans analizi, bazı değişkenlerin nedenler (faktörler, bağımsız değişkenler): ve diğerlerinin sonuç (bağımlı değişkenler) olarak kabul edilebileceği varsayımına dayanır. Bağımsız değişkenlere bazen kesin olarak ayarlanabilir faktörler denir çünkü deneyde araştırmacı bunları değiştirme ve elde edilen sonucu analiz etme yeteneğine sahiptir.

Asıl amaç varyans analizi(ANOVA), varyansları karşılaştırarak (analiz ederek) ortalamalar arasındaki farklılıkların öneminin incelenmesidir. Toplam varyansı birden çok kaynağa bölerek, gruplar arasındaki farkın neden olduğu varyansı, grup içi değişkenliğin neden olduğu varyansla karşılaştırmak mümkündür. Boş hipotez doğruysa (genel popülasyondan seçilen birkaç gözlem grubunda ortalamaların eşitliği hakkında), grup içi değişkenlikle ilişkili varyansın tahmini, gruplar arası varyansın tahminine yakın olmalıdır. Yalnızca iki örnekteki ortalamaları karşılaştırıyorsanız, ANOVA bağımsız örnekler için olağan t testiyle (iki bağımsız nesne veya gözlem grubunu karşılaştırıyorsanız) veya bağımlı örnekler için t testiyle (karşılaştırıyorsanız) aynı sonucu verecektir. bir ve aynı nesne veya gözlem kümesindeki iki değişken).

Varyans analizinin özü, belirli faktörlerin etkisi nedeniyle incelenen özelliğin toplam varyansını ayrı bileşenlere ayırmaktan ve bu faktörlerin incelenen özellik üzerindeki etkisinin önemine ilişkin hipotezleri test etmekten oluşur. Fisher's F-kriterini kullanarak varyansın bileşenlerini birbirleriyle karşılaştırarak, etkili özelliğin genel değişkenliğinin ne kadarının düzenlenmiş faktörlerin etkisinden kaynaklandığını belirlemek mümkündür.

Varyans analizi için başlangıç ​​materyali, sayıca eşit veya eşit olmayan, hem bağlantılı hem de tutarsız olabilen üç veya daha fazla örneğin araştırma verileridir. Tespit edilen kontrollü faktörlerin sayısı ile varyans analizi yapılabilir. tek değişkenli(bu durumda, bir faktörün deneyin sonuçları üzerindeki etkisi incelenir), iki faktörlü(iki faktörün etkisini incelerken) ve çok faktörlü(sadece faktörlerin her birinin etkisini değil, aynı zamanda etkileşimlerini de değerlendirmenizi sağlar).

ANOVA, parametrik yöntemler grubuna aittir ve bu nedenle yalnızca dağılımın normal olduğu kanıtlandığında kullanılmalıdır.

Varyans analizi, bağımlı değişken oranlar, aralıklar veya sıra açısından ölçüldüğünde ve etkileyen değişkenler sayısal olmayan bir yapıya sahip olduğunda (adlandırma ölçeği) kullanılır.

Görev örnekleri

Varyans analizi ile çözülen problemlerde, nominal nitelikteki çeşitli değişkenlerden etkilenen sayısal nitelikte bir yanıt vardır. Örneğin, çiftlik hayvanlarını beslemek için çeşitli rasyon türleri veya onları tutmanın iki yolu vb.

Örnek 1: Hafta boyunca üç farklı yerde birkaç eczane büfesi faaliyet gösterdi. Gelecekte, sadece bir tane bırakabiliriz. İlaçların kiosklardaki satış hacimleri arasında istatistiksel olarak anlamlı bir fark olup olmadığının belirlenmesi gerekmektedir. Eğer öyleyse, günlük ortalama satışları en yüksek olan kiosku seçeceğiz. Satış hacmindeki farkın istatistiksel olarak önemsiz olduğu ortaya çıkarsa, bir kiosk seçmek için diğer göstergeler temel olmalıdır.

Örnek 2: Grup ortalamalarının karşıtlıklarının karşılaştırılması. Yedi siyasi önyargı, aşırı liberalden son derece muhafazakar olana kadar sıralanır ve daha yüksek grup ortalama değerlerine sıfırdan farklı bir eğilim olup olmadığını test etmek için doğrusal kontrast kullanılır - yani gruplara bakıldığında ortalama yaşta önemli bir doğrusal artış olup olmadığı liberalden muhafazakâra doğru sıralanmıştır.

Örnek 3:İki yönlü varyans analizi. Mağazanın büyüklüğüne ek olarak, ürün satışlarının sayısı genellikle ürünle birlikte rafların konumundan etkilenir. Bu örnek, dört raf düzeni ve üç mağaza boyutu için haftalık satış rakamlarını içerir. Analiz sonuçları, her iki faktörün de - rafların ürünle konumu ve mağazanın büyüklüğü - satış sayısını etkilediğini, ancak bunların etkileşiminin önemli olmadığını göstermektedir.

Örnek 4: Tek Boyutlu ANOVA: İki işlemle rastgele tam blok tasarımı. Üç yağ ve üç gevşeticinin olası tüm kombinasyonlarının ekmek üzerindeki etkisi araştırılmıştır. Dört farklı kaynaktan alınan dört un numunesi bloke edici faktör olarak görev yaptı.Yağ gevşetici etkileşiminin önemi belirlenmelidir. Bundan sonra, hangi faktör seviyeleri kombinasyonlarının farklı olduğunu bulmayı mümkün kılan çeşitli kontrast seçme olasılıklarını belirleyin.

Örnek 5: Karışık etkilere sahip hiyerarşik (iç içe) plan modeli. Bir makineye yerleştirilen rastgele seçilmiş dört kafanın üretilen cam katot tutucuların deformasyonu üzerindeki etkisi incelenmiştir. (Aynı kafa farklı makinelerde kullanılamayacak şekilde kafalar makinenin içine yerleştirilmiştir). Kafa etkisi rastgele bir faktör olarak kabul edilir. ANOVA istatistikleri, makineler arasında önemli bir fark olmadığını gösteriyor, ancak kafaların farklı olabileceğine dair göstergeler var. Tüm makineler arasındaki fark önemli değil, ancak ikisi için kafa tipleri arasındaki fark önemli.

Örnek 6: Bölünmüş parsel planı kullanılarak tekrarlanan ölçümlerin tek boyutlu analizi. Bu deney, bir bireyin kaygı derecesinin art arda dört denemede sınavı geçme üzerindeki etkisini belirlemek için yapılmıştır. Veriler, tüm veri kümesinin bir alt kümesi olarak görüntülenebilecek şekilde düzenlenir ("tüm çizim"). Kaygının etkisi önemsiz, denemenin etkisi ise anlamlıydı.

Yöntemlerin listesi

  • Faktöriyel Deney Modelleri. Örnekler: matematik problemlerini çözme başarısını etkileyen faktörler; Satış hacmini etkileyen faktörler.

Veriler, bağımsız örneklerin gerçekleştirilmesi olarak kabul edilen birkaç gözlem dizisinden (işleme) oluşur. İlk hipotez, tedavilerde hiçbir fark olmadığını söylüyor, yani. tüm gözlemlerin genel popülasyondan bir örnek olarak kabul edilebileceği varsayılmaktadır:

  • Tek faktörlü parametrik model: Scheffe yöntemi.
  • Tek faktörlü parametrik olmayan model [Lagutin MB, 237]: Kruskal-Wallis kriteri [Hollender M., Wolf DA, 131], Jonkhier kriteri [Lagutin MB, 245].
  • Sabit çarpanlı bir modelin genel durumu, Cochran teoremi [Afifi A., Eisen S., 234].

Veriler yinelenen gözlemlerdir:

  • İki faktörlü parametrik olmayan model: Friedman'ın kriteri [Lapach, 203], Page'in kriteri [Lagutin MB, 263]. Örnekler: üretim yöntemlerinin etkinliğinin karşılaştırılması, tarım teknikleri.
  • Eksik veriler için iki faktörlü parametrik olmayan model

Tarih

isim nereden geliyor varyans analizi? Ortalamaları karşılaştırma prosedürünün varyans analizi olarak adlandırılması garip görünebilir. Aslında bunun nedeni, iki (veya daha fazla) grubun ortalamaları arasındaki farkın istatistiksel önemini incelerken, aslında örnek varyanslarını karşılaştırdığımız (analiz ettiğimiz) gerçeğidir. Varyans analizinin temel konsepti önerilmiştir balıkçı 1920'de. Belki daha doğal terim, kareler analizi veya varyasyon analizi toplamı olabilir, ancak geleneksel olarak ANOVA terimi kullanılır. Başlangıçta, ANOVA özel olarak tasarlanmış deneylerden elde edilen verileri işlemek için geliştirildi ve nedensel ilişkileri doğru bir şekilde araştıran tek yöntem olarak kabul edildi. Yöntem, mahsul üretimindeki deneyleri değerlendirmek için kullanıldı. Daha sonra, psikoloji, pedagoji, tıp vb. deneyler için varyans analizinin genel bilimsel önemi.

Edebiyat

  1. Scheffe G. Varyans analizi. - M., 1980.
  2. Ahrens H. Leuter Yu.Çok değişkenli varyans analizi.
  3. A.I. Kobzar Uygulamalı Matematiksel İstatistik. - M.: Fizmatlit, 2006.
  4. Lapach S.N., Chubenko A.V., Babich P.N. Bilim ve iş dünyasında istatistik. - Kiev: Morion, 2002.
  5. Lagutin M.B. Görsel matematiksel istatistikler. İki ciltte. - M.: P-merkezi, 2003.
  6. Afifi A., Eisen S.İstatistiksel Analiz: Bilgisayar Tabanlı Bir Yaklaşım.
  7. Hollender M., Wolfe D.A. Parametrik olmayan istatistik yöntemleri.

Bağlantılar

  • Varyans analizi - StatSoft elektronik ders kitabı.


 


Okumak:



Rusya'nın yıldızı, Eski Kilise Slav sembolünün kutsal anlamını korudu

Rusya'nın yıldızı, Eski Kilise Slav sembolünün kutsal anlamını korudu

Slav tılsımı Rusya'nın Yıldızı veya Svarog Meydanı, yalnızca Svarog'un değil, aynı zamanda ...

Runa Hyera - ana anlam ve yorum

Runa Hyera - ana anlam ve yorum

Hyera rününün doğrudan veya ters bir konumu olmadığı için anlamı ve uygulaması açıktır. Bu gerçek bir zenginlik runesi ve ...

Elizabeth adı ne anlama geliyor, karakter ve kader

Elizabeth adı ne anlama geliyor, karakter ve kader

Elizabeth adında bir kızın hayatı nasıl şekillenecek? isim, karakter ve kaderin anlamı, bu makalemizin konusu. Lisa'nın kaderi hakkında konuşmadan önce, ...

Madam Hasse'nin rüya yorumu: rüyaların sayılarla yorumlanması

Madam Hasse'nin rüya yorumu: rüyaların sayılarla yorumlanması

Hasse'nin rüya kitabı, çok ünlü medyum Bayan Hasse tarafından birkaç eski ve modern temele dayanarak derlendi ...

besleme görüntüsü TL