بيت - طوابق
تحليل التباين في اتجاه واحد. تحليل متعدد المتغيرات من التباين تحليل المادة التباين

تحليل التباينبناء على عمل عالم الرياضيات الشهير ر.أ.فيشر. على الرغم من عمرها المتقدم إلى حد ما، لا تزال هذه الطريقة واحدة من الطرق الرئيسية في البحوث البيولوجية والزراعية. تُستخدم الأفكار التي يقوم عليها تحليل التباين على نطاق واسع في العديد من الطرق الأخرى للتحليل الرياضي للبيانات التجريبية، وكذلك في تخطيط التجارب البيولوجية والزراعية.

يتيح لك تحليل التباين ما يلي:

1) مقارنة اثنين أو أكثر من وسائل العينة؛

2) دراسة تأثير عدة عوامل مستقلة في وقت واحد، ومن الممكن تحديد تأثير كل عامل في تباين السمة قيد الدراسة، وتفاعلها؛

3) التخطيط لتجربة علمية بشكل صحيح.

يتجلى تباين الكائنات الحية في شكل تشتت أو تشتت قيم الخصائص الفردية ضمن الحدود التي تحددها درجة التوحيد البيولوجي للمادة وطبيعة العلاقات مع الظروف البيئية. تسمى العلامات التي تتغير تحت تأثير أسباب معينة فعال.

والعوامل هي أية مؤثرات أو ظروف قد يؤثر تنوعها بطريقة أو بأخرى على تنوع الخاصية الناتجة. يُفهم التأثير الإحصائي للعوامل في تحليل التباين على أنه الانعكاس في تنوع السمة الناتجة لتنوع العوامل قيد الدراسة، والتي يتم تنظيمها في الدراسة.

ونعني بالتنوع وجود قيم غير متساوية لكل صفة لدى الأفراد المختلفين المندمجين في المجموعة. يمكن أن يكون لتنوع مجموعة من الأفراد حسب السمة المدروسة درجات مختلفة، والتي تقاس عادة بمؤشرات التنوع (أو التباين): الحدود، الانحراف المعياري، معامل التباين. في تحليل التباين يتم قياس ومقارنة درجة تنوع القيم الفردية والمتوسطة للخاصية بطرق خاصة تشكل خصوصيات هذه الطريقة العامة.

تنظيم العوامل هو أن كل عامل تتم دراسته يعطى عدة معانٍ. ووفقاً لهذه القيم، يتم تقسيم كل عامل إلى عدة تدرجات؛ ولكل تدرج، يتم اختيار عدة أفراد وفقا لمبدأ أخذ العينات العشوائية، ويتم بعد ذلك قياس قيمة السمة الناتجة.

ولمعرفة درجة وموثوقية تأثير العوامل التي تتم دراستها، من الضروري قياس وتقييم ذلك الجزء من التنوع الكلي الذي تسببه هذه العوامل.

تنقسم العوامل المؤثرة على درجة تباين الخاصية الناتجة إلى:

1) قابل للتعديل

2) عشوائية

قابل للتعديل (منهجي)العوامل ناتجة عن فعل عامل مدروس في التجربة، والذي له عدة تدرجات في الخبرة. تدرج العامل- هذه هي درجة تأثيرها على الخاصية الناتجة. وفقا لتدرجات الخاصية، يتم تمييز العديد من خيارات الخبرة للمقارنة. وبما أن هذه العوامل مشروطة مسبقاً، فإنها تسمى بحثاً قابلاً للتعديل، أي. معين، اعتمادا على تنظيم الخبرة. وبالتالي، فإن العوامل القابلة للتعديل هي العوامل التي يتم دراسة تأثيرها تجريبيا، وهي التي تحدد الاختلافات بين متوسطات العينة للخيارات المختلفة. التباين بين المجموعات (المضروب).

عوامل عشوائيةيتم تحديدها من خلال الاختلاف الطبيعي لجميع خصائص الكائنات البيولوجية في الطبيعة. هذه عوامل لا يمكن السيطرة عليها تجريبيا. لها تأثير عشوائي على السمة الفعالة وتسبب أخطاء تجريبية وتحدد انتشار (تشتت) السمة داخل كل متغير. ويسمى هذا الانتشار التباين داخل المجموعة (عشوائي)..

وبالتالي فإن الدور النسبي للعوامل الفردية في التباين العام للصفة الناتجة يتميز بالتشتت ويمكن دراسته باستخدام تحليل التباين أو تحليل التشتت

يعتمد تحليل التباين على مقارنة التباين بين المجموعة وداخل المجموعة. إذا كان التباين بين المجموعات لا يتجاوز التباين داخل المجموعة، فإن الاختلافات بين المجموعات تكون عشوائية. إذا كان التشتت بين المجموعات أعلى بكثير من التشتت داخل المجموعة، فإن هناك فروق ذات دلالة إحصائية بين المجموعات المدروسة (المتغيرات) بسبب عمل العامل المدروس في التجربة.

ويترتب على ذلك أنه عند الدراسة الإحصائية لخاصية فعالة باستخدام تحليل التباين، ينبغي تحديد تباينها عبر المتغيرات والتكرارات والتباين المتبقي داخل هذه المجموعات والتباين العام للخاصية الفعالة في التجربة. ووفقا لهذا، يتم تمييز ثلاثة أنواع من التشتت:

1) التباين الكلي للخاصية الناتجة (S y 2)؛

2) مجموعة مشتركة، أو خاصة، بين العينات (S y 2)؛

3) المجموعة الداخلية المتبقية (S z 2).

لذلك، تحليل التباينهذا هو تقسيم المجموع الإجمالي للانحرافات التربيعية والعدد الإجمالي لدرجات الحرية إلى أجزاء أو مكونات تتوافق مع بنية التجربة، وتقييم أهمية عمل وتفاعل العوامل المدروسة باستخدام معيار F . اعتمادًا على عدد العوامل التي تمت دراستها في وقت واحد، يتم التمييز بين تحليل التباين ثنائي وثلاثي وأربعة عوامل.

عند معالجة المجمعات الإحصائية الميدانية ذات العامل الواحد والتي تتكون من عدة خيارات مستقلة، يتم تقسيم التباين العام للخاصية الناتجة، المقاسة بمجموع المربعات الإجمالية (C y)، إلى ثلاثة مكونات: التباين بين الخيارات (العينات) - C V، التباين من التكرارات (ترتبط الخيارات مع بعضها البعض بشرط مشترك متحكم فيه - وجود تكرارات منظمة) - C p والتنوع داخل الخيارات C z. بشكل عام، يتم تمثيل تباين السمة بالتعبير التالي:

С y = С V + С ع + С ض.

وينقسم العدد الإجمالي لدرجات الحرية (N-1) أيضًا إلى ثلاثة أجزاء:

درجات الحرية للخيارات (ل - 1)؛

درجات الحرية للتكرار (ن - 1)؛

الاختلاف العشوائي (ن - 1) × (ل - 1).

تم العثور على مجاميع الانحرافات المربعة، وفقًا لبيانات التجربة الميدانية - مجمع إحصائي مع الخيارات - l والتكرار - n، على النحو التالي. أولاً، باستخدام الجدول الأصلي، حدد مجموع التكرارات - Σ P، والمتغيرات - Σ V والمجموع الإجمالي لجميع الملاحظات - Σ X.

ثم يتم حساب المؤشرات التالية:

العدد الإجمالي للملاحظات N = l × n؛

عامل التصحيح (التصحيح) C cor = (Σ X 1) 2 / N؛

مجموع المربعات Cy = Σ X 1 2 - C الأساسية؛

مجموع مربعات التكرارات C p = Σ P 2 / (l –C core);

مجموع مربعات الخيارات C V = Σ V 2 / (n – 1);

مجموع مربعات الخطأ (الباقي) C Z = C y - C p - C V .

يتم تقسيم مجموع المربعات الناتجة C V و C Z على درجات الحرية المقابلة لها ويتم الحصول على مربعين متوسطين (تباينات):

الخيارات S v 2 = C V / l - 1؛

الأخطاء S Z 2 = C Z / (n – 1)×(l – 1).

تقييم أهمية الاختلافات بين الوسائل.تُستخدم مربعات الوسط الناتجة في تحليل التباين لتقييم أهمية تأثير العوامل المدروسة من خلال مقارنة تباين الخيارات (S v 2) مع تباين الخطأ (S Z 2) وفق معيار فيشر (F = S Y 2/ ق ض 2). وحدة المقارنة هي مربع متوسط ​​التباين العشوائي، وهو الذي يحدد الخطأ العشوائي للتجربة.

يتيح لنا استخدام اختبار فيشر تحديد وجود أو عدم وجود فروق ذات دلالة إحصائية بين متوسطات العينة، لكنه لا يشير إلى فروق محددة بين المتوسطات.

الفرضية التي يتم اختبارها هي افتراض أن جميع وسائل العينة هي تقديرات لمتوسط ​​عام واحد وأن الاختلافات بينها غير هامة. لو حقيقة F = نظرية S Y 2 / S Z 2 ≥ F، فإن الفرضية الصفرية غير مرفوضة. لا توجد فروق ذات دلالة إحصائية بين متوسطات العينة، وهنا ينتهي الاختبار. يتم رفض الفرضية الصفرية عندما حقيقة F = S Y 2 / S Z 2 ≥ F نظريًاوتوجد قيمة اختبار F لمستوى الدلالة المعتمد في الدراسة في الجدول المقابل، مع مراعاة درجات الحرية لتباين الخيارات والتباين العشوائي. عادة، يتم استخدام مستوى أهمية 5%، ومع نهج أكثر صرامة، 1% أو حتى 0.1%.

بالنسبة لعينة بحجم n، يتم حساب تباين العينة كمجموع الانحرافات التربيعية عن متوسط ​​العينة مقسومًا على ن-1(حجم العينة ناقص واحد). وهكذا، بالنسبة لحجم العينة الثابت n، يكون التباين دالة لمجموع المربعات (الانحرافات)، ويشار إليها، للإيجاز، SS (من الإنجليزية مجموع المربعات - مجموع المربعات). في ما يلي، غالبًا ما نحذف كلمة عينة، مع العلم جيدًا أننا نفكر في تباين العينة أو تقدير التباين. أساس تحليل التباين هو تقسيم التباين إلى أجزاء أو مكونات:

أخطاء SS و سستأثير.التباين داخل المجموعة ( سس) عادة ما يسمى المكون المتبقي أو التباين أخطاء.وهذا يعني أنه عادة لا يمكن التنبؤ به أو تفسيره عند إجراء التجربة. على الجانب الآخر، تأثير سس(أو مكون التباين بين المجموعة) يمكن تفسيره بالاختلافات بين وسائل المجموعة. بمعنى آخر الانتماء إلى جماعة معينة يشرحالتباين بين المجموعات، لأن ونحن نعلم أن هذه المجموعات لديها وسائل مختلفة.

المنطق الأساسي لتحليل التباين.لتلخيص ذلك، فإن الغرض من تحليل التباين (ANOVA) هو اختبار الأهمية الإحصائية للاختلافات بين الوسائل (للمجموعات أو المتغيرات). ويتم هذا الفحص عن طريق تقسيم مجموع المربعات إلى مكونات، أي. وذلك بتقسيم التباين الكلي (التباين) إلى أجزاء، أحدها يرجع إلى الخطأ العشوائي (أي التباين داخل المجموعة)، والثاني يرتبط بالاختلافات في القيم المتوسطة. ثم يتم استخدام مكون التباين الأخير لتحليل الأهمية الإحصائية للفرق بين الوسائل. إذا كان هذا هو الفرق بارِز، فرضية العدم مرفوضويتم قبول الفرضية البديلة القائلة بوجود فرق بين الوسيلتين.

المتغيرات التابعة والمستقلة.تسمى المتغيرات التي يتم تحديد قيمها عن طريق القياسات أثناء التجربة (على سبيل المثال، درجة الاختبار). متكلالمتغيرات. تسمى المتغيرات التي يمكن التحكم فيها في التجربة (مثل طرق التدريس أو المعايير الأخرى التي تسمح بتقسيم الملاحظات إلى مجموعات أو تصنيفها) عواملأو مستقلالمتغيرات.

عوامل كثيرة.إن العالم معقد ومتعدد الأبعاد بطبيعته. المواقف التي يتم فيها وصف ظاهرة معينة بالكامل بواسطة متغير واحد نادرة للغاية. على سبيل المثال، إذا كنا نحاول تعلم كيفية زراعة طماطم كبيرة، فيجب أن نأخذ في الاعتبار العوامل المتعلقة بالتركيب الوراثي للنبات، ونوع التربة، والضوء، ودرجة الحرارة، وما إلى ذلك. وبالتالي، عند إجراء تجربة نموذجية، يتعين على المرء التعامل مع عدد كبير من العوامل. السبب الرئيسي وراء تفضيل استخدام ANOVA هو إجراء مقارنات متكررة لعينتين عند مستويات عوامل مختلفة باستخدام السلسلة ر-المعيار هو أن تحليل التباين أكبر بكثير فعالوبالنسبة للعينات الصغيرة، فهي أكثر إفادة.

خاتمة.تم تطوير تحليل التباين وإدخاله في ممارسة البحوث الزراعية والبيولوجية من قبل العالم الإنجليزي ر. أ. فيشر . جوهر تحليل التباين يتكون من تحليل التباين الكلي للسمات والعدد الإجمالي لدرجات الحرية إلى أجزاء مكونة تتوافق مع هيكل التجربة الميدانية، وكذلك في تقييم عامل التشغيل باستخدام معيار فيشر.

أين التباين العام للصفة نتيجة لتأثير الموضوع محل الدراسة وعدم تجانس خصوبة التربة والأخطاء العشوائية في التجربة.

تباين الغلة عبر تكرار التجارب الميدانية.

تباين المحصول تبعاً للمتغيرات التجريبية المرتبطة بتأثير السؤال محل الدراسة.

التباين في الغلة المرتبطة بالأخطاء العشوائية في التجربة.

خاتمةفي تحليل التباين يتم وفقا للقواعد التالية:

1. توجد فروق ذات دلالة إحصائية في الخبرة إذا كانت واقعية أو نظرية. لا توجد فروق ذات دلالة إحصائية في الخبرة إذا كانت واقعية

2. LSD – الفرق الأقل أهمية، يستخدم لتحديد الفرق بين الخيارات. إذا كان الفرق d≥ NSR، فإن الاختلافات بين الخيارات تكون كبيرة. إذا د< НСР, то различия между вариантами не существенные.

مجموعاتخيارات.

1. إذا كان الفرق د كبيرا ويشير إلى زيادة في العائد، فإن الخيارات تنتمي إلى المجموعة 1.

2. إذا كان الفرق د ليس كبيرا، فإن الخيارات تنتمي إلى المجموعة 2.

3. إذا كان الفرق d كبيرًا، ولكنه يشير إلى انخفاض في العائد، فإن الخيارات تنتمي إلى المجموعة 3.

اختيار الصيغةيعتمد تحليل التباين على طرق وضع الخيارات في التجربة:

1. للممثلين المنظمين:

2. للتكرار غير المنظم.

5.1. ما هو تحليل التباين؟

تم تطوير تحليل التشتت في العشرينات من القرن العشرين على يد عالم الرياضيات وعالم الوراثة الإنجليزي رونالد فيشر. وفقا لمسح بين العلماء، الذي اكتشف من كان له أكبر تأثير على علم الأحياء في القرن العشرين، كان السير فيشر هو الذي حصل على البطولة (لخدماته حصل على وسام الفارس - أحد أعلى الأوسمة في بريطانيا العظمى). ; وفي هذا الصدد، يمكن مقارنة فيشر بتشارلز داروين، صاحب التأثير الأعظم على علم الأحياء في القرن التاسع عشر.

أصبح تحليل التباين الآن فرعًا منفصلاً من الإحصاء. ويعتمد على ما اكتشفه فيشر من أن مقياس تباين الكمية المدروسة يمكن تحلله إلى أجزاء تتوافق مع العوامل المؤثرة في هذه الكمية والانحرافات العشوائية.

لفهم جوهر تحليل التباين، سنقوم بإجراء نفس النوع من الحسابات مرتين: "يدويًا" (باستخدام الآلة الحاسبة) وباستخدام برنامج Statistica. ولتبسيط مهمتنا، لن نعمل مع نتائج الوصف الفعلي لتنوع الضفادع الخضراء، ولكن مع مثال وهمي يتعلق بمقارنة الإناث والذكور في البشر.ضع في اعتبارك تنوع ارتفاعات 12 شخصًا بالغًا: 7 نساء و5 رجال.

الجدول 5.1.1. مثال على تحليل التباين أحادي الاتجاه: بيانات عن الجنس والطول لـ 12 شخصًا

دعونا نجري تحليل التباين أحادي الاتجاه: قارن ما إذا كان الرجال والنساء في المجموعة المميزة يختلفون في الطول بشكل ملحوظ إحصائيًا أم لا.

5.2. اختبار التوزيع الطبيعي

ويستند المزيد من الاستدلال إلى حقيقة أن التوزيع في العينة قيد النظر طبيعي أو قريب من الطبيعي. إذا كان التوزيع بعيدًا عن الطبيعي، فإن التشتت (التباين) ليس مقياسًا مناسبًا لتقلبه. ومع ذلك، فإن تحليل التباين مقاوم نسبيًا لانحرافات التوزيع عن الحالة الطبيعية.

يمكن إجراء اختبار الحالة الطبيعية لهذه البيانات بطريقتين مختلفتين. أولاً: الإحصائيات / الإحصائيات الأساسية / الجداول / الإحصائيات الوصفية / علامة التبويب العادية. في علامة التبويبالحياة الطبيعية يمكنك اختيار الاختبارات الطبيعية التي تريد استخدامها. عند النقر على زر الجداول التكرارية، سيظهر جدول تكراري، وسيعرض زر الرسوم البيانية رسمًا بيانيًا. سيظهر الجدول والرسم البياني نتائج الاختبارات المختلفة.

ترتبط الطريقة الثانية باستخدام الإمكانات المناسبة عند إنشاء الرسوم البيانية. في مربع الحوار الخاص بإنشاء الرسوم البيانية (الرسوم البيانية / الرسوم البيانية...)، حدد علامة التبويب خيارات متقدمة. يوجد في الأسفل كتلة إحصائيات. دعونا نضع علامة على شابيرو ويلك عليهار اختبار est وKolmogorov-Smirnov، كما هو موضح في الشكل.

أرز. 5.2.1. الاختبارات الإحصائية لحالة التوزيع الطبيعية في مربع حوار رسم الرسم البياني

وكما يتبين من الرسم البياني، فإن توزيع النمو في عينتنا يختلف عن الطبيعي (هناك "فشل" في المنتصف).


أرز. 5.2.2. رسم بياني تم إنشاؤه باستخدام المعلمات المحددة في الشكل السابق

يشير السطر الثالث في عنوان الرسم البياني إلى معلمات التوزيع الطبيعي التي تبين أن التوزيع الملحوظ هو الأقرب إليها. المتوسط ​​العام هو 173 والانحراف المعياري الكلي هو 10.4. يوضح الشكل الداخلي أدناه في الرسم البياني نتائج اختبارات الحالة الطبيعية. D هو اختبار Kolmogorov-Smirnov، وSW-W هو اختبار Shapiro-Wilk. كما يتبين، بالنسبة لجميع الاختبارات المستخدمة، تبين أن الاختلافات في توزيع الارتفاع عن التوزيع الطبيعي غير ذات دلالة إحصائية ( ص في جميع الحالات أكبر من 0.05).

لذا، من الناحية الرسمية، فإن اختبارات التوزيع الطبيعي لا "تمنعنا" من استخدام الطريقة البارامترية القائمة على افتراض التوزيع الطبيعي. كما ذكرنا سابقًا، فإن تحليل التباين مقاوم نسبيًا للانحرافات عن الحالة الطبيعية، لذلك سنستمر في استخدامه.

5.3. تحليل التباين أحادي الاتجاه: الحسابات اليدوية

لتوصيف التباين في أطوال الأشخاص في المثال الموضح، دعونا نحسب مجموع الانحرافات المربعة (يشار إليها باللغة الإنجليزية بـ سس أو مجموع المربعات أو ) القيم الفردية من المتوسط: . متوسط ​​قيمة الارتفاع في المثال أعلاه هو 173 سم. بناء على هذا،

سس = (186–173) 2 + (169–173) 2 + (166–173) 2 + (188–173) 2 + (172–173) 2 + (179–173) 2 + (165–173) 2 + (174–173) 2 + (163–173) 2 + (162–173) 2 + (162–173) 2 + (190–173) 2 ;

سس = 132 + 42 + 72 + 152 + 12 + 62 + 82 + 12 + 102 + 112 + 112 + 172;

سس = 169 + 16 + 49 + 225 + 1 + 36 + 64 + 1 + 100 + 121 + 121 + 289 = 1192.

القيمة الناتجة (1192) هي مقياس لتباين مجموعة البيانات بأكملها. ومع ذلك، فهي تتكون من مجموعتين، يمكن أن يكون لكل منهما متوسطها الخاص. في البيانات الواردة، يبلغ متوسط ​​طول النساء 168 سم، والرجال 180 سم.

دعونا نحسب مجموع الانحرافات التربيعية للنساء:

سس و = (169–168) 2 + (166–168) 2 + (172–168) 2 + (179–168) 2 + (163–168) 2 + (162–168) 2 ;

سس و = 12 + 22 + 42 + 112 + 32 + 52 + 62 = 1 + 4 + 16 + 121 + 9 + 25 + 36 = 212.

نحسب أيضًا مجموع الانحرافات التربيعية للرجال:

سس م = (186–180) 2 + (188–180) 2 + (174–180) 2 + (162–180) 2 + (190–180) 2 ;

سس م = 62 + 82 + 62 + 182 + 102 = 36 + 64 + 36 + 324 + 100 = 560.

على ماذا تعتمد القيمة قيد الدراسة وفق منطق تحليل التباين؟

قيمتان محسوبتان، سس و و سس م ، يميز التباين داخل المجموعة، والذي يُسمى عادةً في تحليل التباين "خطأ". أصل هذا الاسم مرتبط بالمنطق التالي.

ما الذي يحدد طول الشخص في هذا المثال؟ بادئ ذي بدء، على متوسط ​​طول الأشخاص بشكل عام، بغض النظر عن جنسهم. ثانيا - من الأرض. إذا كان الأشخاص من أحد الجنسين (الذكور) أطول من الآخر (الأنثى)، فيمكن تمثيل ذلك كإضافة إلى المتوسط ​​"العالمي" لبعض القيمة، وهو تأثير الجنس. وأخيرًا، يختلف الأشخاص من نفس الجنس في الطول بسبب الاختلافات الفردية. في النموذج الذي يصف الطول كمجموع المتوسط ​​البشري والتكيف مع الجنس، تكون الفروق الفردية غير مفسرة ويمكن اعتبارها "خطأ".

لذا، ووفقاً لمنطق تحليل التباين، يتم تحديد القيمة محل الدراسة على النحو التالي: ، أين س ي - القيمة i للكمية المدروسة عند القيمة j للعامل المدروس؛ - المتوسط ​​العام؛ ف ي - تأثير القيمة j للعامل قيد الدراسة؛ - "الخطأ"، مساهمة فردية الكائن الذي تشير إليه القيمةس ي .

مجموع المربعات بين المجموعات

لذا، سس أخطاء = سس و + سس م = 212 + 560 = 772. بهذه القيمة وصفنا التباين داخل المجموعة (عند التمييز بين المجموعات حسب الجنس). ولكن هناك الجزء الثاني من التباين - التباين بين المجموعات، والذي سنسميهتأثير سس (بما أننا نتحدث عن تأثير تقسيم مجمل الأشياء قيد النظر إلى نساء ورجال).

ويختلف متوسط ​​كل مجموعة عن المتوسط ​​العام. عند حساب مساهمة هذا الاختلاف في المقياس العام للتباين، يجب علينا ضرب الفرق بين المجموعة والمتوسط ​​الإجمالي بعدد العناصر في كل مجموعة.

تأثير سس = = 7×(168–173) 2 + 5×(180–173) 2 = 7×52 + 5×72 = 7×25 + 5×49 = 175 + 245 = 420.

هنا تجلى مبدأ ثبات مجموع المربعات الذي اكتشفه فيشر: SS = التأثير SS + الخطأ SS ، أي. على سبيل المثال، 1192 = 440 + 722.

متوسط ​​المربعات

بمقارنة مجموع المربعات بين المجموعات وداخل المجموعة في مثالنا، يمكننا أن نرى أن الأول مرتبط باختلاف مجموعتين، والثاني مرتبط بـ 12 قيمة في مجموعتين. عدد درجات الحرية ( df ) لبعض المعلمات يمكن تعريفها على أنها الفرق بين عدد الكائنات في المجموعة وعدد التبعيات (المعادلات) التي تربط هذه الكميات.

في مثالنا تأثير مدافع = 2–1 = 1، أ أخطاء df = 12–2 = 10.

يمكننا قسمة مجموع المربعات على عدد درجات حريتها، مما يعطينا متوسط ​​المربعات ( آنسة ، وسائل المربعات). بعد القيام بذلك، يمكننا إثبات ذلك آنسة - لا شيء أكثر من الاختلافات ("التباينات"، نتيجة قسمة مجموع المربعات على عدد درجات الحرية). بعد هذا الاكتشاف، يمكننا أن نفهم بنية جدول ANOVA. في مثالنا، سيبدو هكذا.

تأثير

خطأ

تأثير مرض التصلب العصبي المتعدد و أخطاء MS هي تقديرات للتباين بين المجموعات وداخل المجموعة، وبالتالي يمكن مقارنتها وفقًا للمعيارF (معيار سنديكور، الذي سمي على اسم فيشر)، المصمم لمقارنة الاختلافات. هذا المعيار هو ببساطة حاصل قسمة التباين الأكبر على التباين الأصغر. في حالتنا هو 420 / 77.2 = 5.440.

تحديد الدلالة الإحصائية لاختبار فيشر باستخدام الجداول

إذا أردنا تحديد الأهمية الإحصائية للتأثير يدويًا باستخدام الجداول، فسنحتاج إلى مقارنة قيمة المعيار الناتج F بقيمة حرجة تتوافق مع مستوى معين من الأهمية الإحصائية لدرجات معينة من الحرية.


أرز. 5.3.1. جزء من جدول يحتوي على قيم معيارية حرجة F

كما ترون، بالنسبة لمستوى الأهمية الإحصائية p=0.05 فإن القيمة الحرجة للمعيار هيF هو 4.96. وهذا يعني أنه في مثالنا تم تسجيل تأثير الجنس عند مستوى دلالة إحصائية قدره 0.05.

يمكن تفسير النتيجة التي تم الحصول عليها على النحو التالي. إن احتمال الفرضية الصفرية، التي بموجبها يكون متوسط ​​طول النساء والرجال متساويين، وأن الفرق المسجل في أطوالهم يرجع إلى العشوائية في اختيار العينات، هو أقل من 5%. وهذا يعني أنه يجب علينا اختيار الفرضية البديلة، وهي أن متوسط ​​طول النساء والرجال مختلف.

5.4. تحليل التباين في اتجاه واحد ( ANOVA) في حزمة Statistica

في الحالات التي لا يتم فيها إجراء الحسابات يدويًا، ولكن باستخدام البرامج المناسبة (على سبيل المثال، حزمة Statistica)، تكون القيمة ص يتم تحديدها تلقائيًا. يمكنك التحقق من أنها أعلى قليلاً من القيمة الحرجة.

لتحليل المثال قيد المناقشة باستخدام أبسط إصدار من تحليل التباين، تحتاج إلى تشغيل إجراء الإحصائيات / ANOVA للملف الذي يحتوي على البيانات المقابلة وتحديد خيار One-way ANOVA في نافذة نوع التحليل ومربع حوار المواصفات السريعة الخيار في نافذة طريقة المواصفات.


أرز. 5.4.1. الحوار العام ANOVA/MANOVA (تحليل التباين)

في نافذة الحوار السريع التي تفتح، في حقل المتغيرات، تحتاج إلى تحديد تلك الأعمدة التي تحتوي على البيانات التي ندرس تباينها (قائمة المتغيرات التابعة؛ في حالتنا، عمود النمو)، بالإضافة إلى عمود يحتوي على قيم التي تقسم القيمة محل الدراسة إلى مجموعات (المتنبئ الفئوي (العامل)، في حالتنا، عمود الجنس). في هذا الإصدار من التحليل، على عكس التحليل متعدد المتغيرات، يمكن أخذ عامل واحد فقط في الاعتبار.


أرز. 5.4.2. الحوار أحادي الاتجاه ANOVA (تحليل التباين أحادي الاتجاه)

في نافذة رموز العوامل، يجب عليك الإشارة إلى قيم العامل المعني التي يجب معالجتها أثناء هذا التحليل. يمكن الاطلاع على جميع القيم المتاحة باستخدام زر التكبير. إذا كنت بحاجة، كما في مثالنا، إلى مراعاة جميع قيم العامل (وبالنسبة للجنس في مثالنا هناك قيمتان فقط)، فيمكنك النقر فوق الزر "الكل". عندما يتم تحديد الأعمدة وأكواد العوامل المراد معالجتها، يمكنك النقر فوق موافق والانتقال إلى نافذة تحليل النتائج السريعة: نتائج ANOVA 1، إلى علامة التبويب السريعة.

أرز. 5.4.3. علامة التبويب السريعة لنافذة نتائج ANOVA

يتيح لك زر جميع التأثيرات/الرسوم البيانية رؤية كيفية مقارنة متوسطات مجموعتين. يُشار فوق الرسم البياني إلى عدد درجات الحرية، بالإضافة إلى قيم F وp للعامل المعني.


أرز. 5.4.4. عرض رسومي لنتائج ANOVA

يتيح لك زر جميع التأثيرات الحصول على تحليل لجدول التباين مشابه للجدول الموصوف أعلاه (مع بعض الاختلافات المهمة).


أرز. 5.4.5. جدول نتائج تحليل التباين (قارن مع جدول مماثل تم الحصول عليه "يدويًا")

يوضح الصف السفلي من الجدول مجموع المربعات وعدد درجات الحرية ومتوسط ​​مربعات الخطأ (التباين داخل المجموعة). على السطر أعلاه مؤشرات متشابهة للعامل قيد الدراسة (في هذه الحالة علامة الجنس)، وكذلك المعيار F (نسبة متوسطات مربعات التأثير إلى متوسطات مربعات الخطأ)، ومستوى دلالتها الإحصائية. حقيقة أن تأثير العامل قيد النظر تبين أنه ذو دلالة إحصائية يظهر باللون الأحمر.

ويعرض السطر الأول بيانات على مؤشر "الاعتراض". هذا يقدم صف الجدول لغزًا للمستخدمين الذين ينضمون إلى Statistica في الإصدار السادس أو الأحدث. من المحتمل أن تكون قيمة الاعتراض مرتبطة بتحليل مجموع مربعات جميع قيم البيانات (أي 1862 + 1692 ... = 360340). تم الحصول على قيمة المعيار F المشار إليها عن طريق القسمة اعتراض MS/خطأ MS = 353220 / 77.2 = 4575.389 وبطبيعة الحال يعطي قيمة منخفضة جدًا ص . ومن المثير للاهتمام أنه في Statistica-5 لم يتم حساب هذه القيمة على الإطلاق، ولا تعلق أدلة استخدام الإصدارات الأحدث من الحزمة على تقديمها بأي شكل من الأشكال. ربما يكون أفضل شيء يمكن أن يفعله عالم الأحياء الذي يستخدم Statistica-6 والإصدارات الأحدث هو ببساطة تجاهل صف الاعتراض في جدول ANOVA.

5.5. ANOVA واختبارات الطالب وفيشر: أيهما أفضل؟

كما لاحظت، فإن البيانات التي قمنا بمقارنتها باستخدام تحليل التباين أحادي الاتجاه، يمكننا أيضًا فحصها باستخدام اختبارات الطالب وفيشر. دعونا نقارن هاتين الطريقتين. للقيام بذلك، دعونا نحسب الفرق في الطول بين الرجال والنساء باستخدام هذه المعايير. للقيام بذلك، سيتعين علينا اتباع المسار الإحصائيات / الإحصائيات الأساسية / اختبار t، بشكل مستقل، حسب المجموعات. وبطبيعة الحال، فإن المتغيرات التابعة هي متغير النمو، ومتغير التجميع هو متغير الجنس.


أرز. 5.5.1. مقارنة البيانات التي تمت معالجتها باستخدام ANOVA باستخدام اختبارات الطالب وفيشر

كما ترون، والنتيجة هي نفس استخدام ANOVA. ص = 0.041874 في كلتا الحالتين، كما هو مبين في الشكل. 5.4.5، كما هو موضح في الشكل. 5.5.2 (انظر بنفسك!).


أرز. 5.5.2. نتائج التحليل (شرح تفصيلي لجدول النتائج - في الفقرة المخصصة لاختبار الطالب)

من المهم التأكيد على أنه على الرغم من أن معيار F من الناحية الرياضية في التحليل قيد النظر وفقًا لاختبارات الطالب وفيشر هو نفسه كما في تحليل التباين (ويعبر عن نسبة التباين)، إلا أن معناه في نتائج التحليل المقدمة في الجدول النهائي مختلف تماما. عند المقارنة باختبارات الطالب وفيشر، يتم إجراء مقارنة متوسطات العينة عن طريق اختبار الطالب، ويتم إجراء مقارنة تباينها عن طريق اختبار فيشر. لا تظهر نتائج التحليل التباين نفسه، بل جذره التربيعي - الانحراف المعياري.

من ناحية أخرى، يُستخدم اختبار فيشر في تحليل التباين (ANOVA) لمقارنة متوسطات العينات المختلفة (كما ناقشنا، يتم ذلك عن طريق تقسيم مجموع المربعات إلى أجزاء ومقارنة متوسط ​​مجموع المربعات المقابلة لـ بين وداخل المجموعة التقلب).

إلا أن الاختلاف أعلاه يتعلق بعرض نتائج الدراسة الإحصائية وليس بجوهرها. وكما يشير غلانتز (1999، ص 99)، على سبيل المثال، فإن المقارنة بين المجموعات باستخدام اختبار الطالب يمكن اعتبارها حالة خاصة لتحليل التباين لعينتين.

لذا، فإن مقارنة العينات باستخدام اختبارات الطالب وفيشر لها ميزة مهمة واحدة مقارنة بتحليل التباين: فهي تسمح لك بمقارنة العينات من حيث تباينها. لكن مزايا تحليل التباين لا تزال أكثر أهمية. وتشمل هذه، على سبيل المثال، القدرة على مقارنة عدة عينات في وقت واحد.

يتم التمييز بين مخطط تحليل التباين بناءً على: أ) طبيعة الخاصية التي يتم من خلالها تقسيم السكان إلى مجموعات (عينات)؛ ب) عدد الخصائص التي يتم من خلالها تقسيم السكان إلى مجموعات (عينات)؛ ج) على طريقة أخذ العينات.

قيم الميزة. الذي يقسم السكان إلى مجموعات يمكن أن يمثل عموم السكان أو السكان القريبين منه في الحجم. في هذه الحالة، يتوافق مخطط إجراء تحليل التباين مع المخطط الذي تمت مناقشته أعلاه. إذا كانت قيم الخاصية التي تشكل مجموعات مختلفة تمثل عينة من عموم السكان، فإن صياغة الفرضيات الصفرية والبديلة تتغير. الفرضية الصفرية هي أن هناك اختلافات بين المجموعات، أي أن متوسطات المجموعة تظهر بعض الاختلاف. الفرضية البديلة هي أنه لا يوجد تقلب. ومن الواضح أنه مع مثل هذه الصياغة للفرضيات، لا يوجد سبب لتحديد نتائج مقارنة التباينات.

عندما يزيد عدد خصائص التجميع، على سبيل المثال، إلى 2، أولاً، يزداد عدد الفرضيات الخالية، وبالتالي يزيد عدد الفرضيات البديلة. وفي هذه الحالة تتحدث الفرضية الصفرية الأولى عن عدم وجود فروق بين متوسطات مجموعات صفة التجمع الأولى، وتتحدث الفرضية الصفرية الثانية عن عدم وجود فروق في متوسطات مجموعات صفة التجميع الثانية، وأخيرا تتحدث الفرضية الصفرية الثالثة عن غياب ما يسمى بتأثير تفاعل العوامل (خصائص التجميع).

يُفهم تأثير التفاعل على أنه تغيير في قيمة الخاصية الناتجة التي لا يمكن تفسيرها بالتأثير الكلي لعاملين. ولاختبار أزواج الفرضيات الثلاثة المطروحة، لا بد من حساب ثلاث قيم فعلية لاختبار فيشر إف، والذي بدوره يفترض النسخة التالية من تحلل الحجم الكلي للتباين

يتم الحصول على التباينات المطلوبة للحصول على المعيار F بطريقة معروفة عن طريق قسمة أحجام التباين على عدد درجات الحرية.

كما تعلمون، يمكن أن تكون العينات مستقلة ومستقلة. إذا كانت العينات تابعة، فيجب تمييز ما يسمى بالتباين بالتكرار في الحجم الإجمالي للتباين
. إذا لم يتم عزله، فيمكن لهذا الاختلاف أن يزيد بشكل كبير من التباين داخل المجموعة (
)، والتي يمكن أن تشوه نتائج تحليل التباين.

راجع الأسئلة

17-1.ما هي مواصفات نتائج تحليل التباين؟

17-2. في أي حالة يتم استخدام اختبار Tukey's Q للمواصفات؟

17-3.ما الفرق بين الأوامر الأولى والثانية وهكذا؟

17-4. كيف يمكنك العثور على القيمة الفعلية لاختبار Tukey's Q؟

17-5.ما الفرضيات المطروحة بشأن كل اختلاف؟

17-6. على ماذا تعتمد القيمة الجدولية لاختبار Tukey's Q؟

17-7. ما هي الفرضية الصفرية إذا كانت مستويات خاصية التجميع تمثل العينة؟

17-8. كيف يتم حساب الحجم الإجمالي للتباين عند تجميع البيانات حسب خاصيتين؟

17-9. في أي حالة يتم تحديد الاختلاف عن طريق التكرار (
) ?

ملخص

تتيح لنا الآلية المدروسة لتحقيق نتائج تحليل التباين إعطائها شكلاً نهائيًا. لاحظ القيود عند استخدام اختبار Tukey's Q. كما أوضحت المادة المبادئ الأساسية لتصنيف نماذج تحليل التباين. ويجب التأكيد على أن هذه مجرد مبادئ. تتطلب الدراسة التفصيلية لميزات كل نموذج دراسة منفصلة ومتعمقة.

واجبات الاختبار للمحاضرة

ما هي الخصائص الإحصائية المفترضة في ANOVA؟

    بخصوص اختلافين

    نسبة إلى متوسط ​​واحد

    نسبة إلى عدة متوسطات

    نسبة إلى تباين واحد

ما محتوى الفرضية البديلة في تحليل التباين؟

    الفروق المقارنة ليست متساوية مع بعضها البعض

    جميع المتوسطات المقارنة ليست متساوية مع بعضها البعض

    هناك وسيلتان عامتان على الأقل غير متساويتين

    التباين بين المجموعة أكبر من التباين داخل المجموعة

ما هي مستويات الأهمية الأكثر استخداما في تحليل التباين؟

إذا كان التباين داخل المجموعة أكبر من التباين بين المجموعات، فهل يجب أن نستمر في تحليل التباين أو نقبل على الفور H0 أو NA؟

1. هل نستمر في تحديد الفروق المطلوبة؟

2. يجب أن نتفق مع H0

3. يجب أن تتفق مع زمالة المدمنين المجهولين

إذا تبين أن التباين داخل المجموعة يساوي التباين بين المجموعة، فما هي الإجراءات التي يجب على الشخص الذي يقوم بتحليل التباين اتخاذها؟

    أتفق مع الفرضية الصفرية القائلة بأن المتوسطات العامة متساوية

    اتفق مع الفرضية البديلة القائلة بأن هناك على الأقل زوجًا من الوسائل غير المتكافئة

ما التباين الذي يجب أن يكون موجودًا دائمًا في البسط عند حساب اختبار Fisher's F؟

    داخل المجموعة فقط

    في أي حال، بين المجموعات

    Intergroup إذا كان أكبر من intragroup

ما هي القيمة الفعلية لاختبار فيشر F؟

    دائما أقل من 1

    دائما أكثر من 1

    يساوي أو أكبر من 1

على ماذا تعتمد القيمة الجدولية لاختبار فيشر F؟

1. من مستوى الأهمية المقبول

2. على عدد درجات الحرية للتباين الكلي

3. على عدد درجات حرية الاختلاف بين المجموعات

4. على عدد درجات حرية الاختلاف داخل المجموعة

5. من القيمة الفعلية لاختبار فيشر F؟

إن زيادة عدد الملاحظات في كل مجموعة ذات التباين المتساوي يزيد من احتمال قبول......

1. الفرضية الصفرية

2. الفرضية البديلة

3. لا يؤثر على قبول الفرضيتين الصفرية والبديلة

ما الفائدة من تحديد نتائج تحليل التباين؟

    التحقق مما إذا كانت حسابات التباين قد تم تنفيذها بشكل صحيح

    تحديد أي من المتوسطات العامة تبين أنها مساوية لبعضها البعض

    تحديد أي من المتوسطات العامة لا تساوي بعضها البعض

هل العبارة صحيحة: "عند تحديد نتائج تحليل التباين تبين أن جميع المتوسطات العامة متساوية مع بعضها البعض؟"

    يمكن أن تكون صحيحة أو خاطئة

    هذا غير صحيح، ربما يكون ذلك بسبب أخطاء في الحسابات

هل من الممكن عند تحديد تحليل التباين التوصل إلى نتيجة مفادها أن جميع الوسائل العامة ليست متساوية مع بعضها البعض؟

1. ممكن تماما

2. ممكن في حالات استثنائية

3. مستحيل من حيث المبدأ.

4. ممكن فقط في حالة حدوث أخطاء في الحسابات

إذا تم قبول الفرضية الصفرية وفقًا لاختبار فيشر F، فهل تحليل التباين مطلوب؟

1. مطلوب

2. غير مطلوب

3. حسب تقدير الشخص الذي يقوم بتحليل التباين

في أي حالة يتم استخدام اختبار توكي لتحديد نتائج تحليل التباين؟

1. إذا كان عدد المشاهدات في المجموعات (العينات) هو نفسه

2. إذا كان عدد الملاحظات في المجموعات (العينات) مختلفاً

3. إذا كانت هناك عينات بأعداد متساوية وغير متساوية،

الكسل

ماذا يمثل NSR عند تحديد نتائج تحليل التباين بناءً على معيار توكي؟

1. حاصل ضرب متوسط ​​الخطأ والقيمة الفعلية للمعيار

2. حاصل ضرب متوسط ​​الخطأ بالقيمة الجدولية للمعيار

3. نسبة كل فرق بين وسائل العينة إلى

متوسط ​​الخطأ

4. الفرق بين وسائل العينة

إذا تم تقسيم مجتمع العينة إلى مجموعات وفقًا لخاصيتين، فما هو عدد المصادر التي يجب على الأقل تقسيم التباين الكلي للخاصية إليها؟

إذا كانت الملاحظات من العينات (المجموعات) معتمدة، فما عدد المصادر التي يجب تقسيم التباين الإجمالي إليها (خاصية تجميع واحدة)؟

ما هو مصدر (سبب) الاختلاف بين المجموعات؟

    لعبة من فرصة

    التأثير المشترك للعبة الصدفة والعامل

    تأثير العامل (العوامل)

    سيتم اكتشافه بعد ANOVA

ما هو مصدر (سبب) الاختلاف داخل المجموعة؟

1. لعبة الحظ

2. العمل المشترك للعبة الصدفة والعامل

3. عمل العامل (العوامل)

4. سيتضح الأمر بعد إجراء تحليل التباين

ما هي طريقة تحويل البيانات المصدر المستخدمة إذا تم التعبير عن القيم المميزة في المشاركات؟

    اللوغاريتم

    استخراج الجذر

    تحويل فاي

المحاضرة 8 الارتباط

حاشية. ملاحظة

الطريقة الأكثر أهمية لدراسة العلاقة بين الخصائص هي طريقة الارتباط. تكشف هذه المحاضرة عن محتوى هذه الطريقة، وطرق التعبير التحليلي عن هذا الارتباط. يتم إيلاء اهتمام خاص لمؤشرات محددة مثل مؤشرات مدى قرب الاتصال

الكلمات الدالة

علاقة. طريقة المربع الأصغر. معامل الانحدار. معاملات التحديد والارتباط.

القضايا المغطاة

    الاتصال الوظيفي والارتباطي

    مراحل بناء معادلة التواصل الارتباطي. تفسير معاملات المعادلة

    مؤشرات قرب الاتصال

    تقييم مؤشرات الاتصال المختارة

الوحدة النمطية 1 جوهر الارتباط. مراحل بناء معادلة التواصل الارتباطي، تفسير معاملات المعادلة.

الغرض والأهداف من دراسة الوحدة النمطية 1تتمثل في فهم ميزات علاقة الارتباط. إتقان خوارزمية بناء معادلة الاتصال، وفهم محتوى معاملات المعادلة.

      جوهر الارتباط

في الظواهر الطبيعية والاجتماعية، هناك نوعان من الروابط - الروابط الوظيفية وروابط الارتباط. مع الاتصال الوظيفي، تتوافق كل قيمة وسيطة مع قيم دالة محددة بدقة (واحدة أو عدة). مثال على العلاقة الوظيفية هي العلاقة بين المحيط ونصف القطر، والتي يتم التعبير عنها بالمعادلة
. كل قيمة نصف قطرها صيتوافق مع قيمة واحدة للمحيط ل . في علاقة الارتباط، تتوافق كل قيمة لخاصية العامل مع عدة قيم غير محددة تمامًا للخاصية الناتجة. تتضمن أمثلة علاقة الارتباط العلاقة بين وزن الشخص (السمة الناتجة) وطوله (السمة العاملية)، والعلاقة بين كمية الأسمدة المستخدمة والإنتاجية، وبين سعر وكمية السلع المعروضة. مصدر ظهور الارتباط هو حقيقة أنه، كقاعدة عامة، في الحياة الواقعية، تعتمد قيمة السمة الفعالة على العديد من العوامل، بما في ذلك تلك التي تتغير بشكل عشوائي. على سبيل المثال، يعتمد نفس وزن الشخص على العمر والجنس والتغذية والمهنة والعديد من العوامل الأخرى. ولكن في الوقت نفسه، من الواضح أن النمو بشكل عام هو العامل الحاسم. وفي ضوء هذه الظروف، ينبغي تعريف ارتباط الارتباط على أنه رابط غير مكتمل لا يمكن إنشاؤه وتقييمه إلا إذا كان هناك عدد كبير من الملاحظات في المتوسط.

1.2 مراحل بناء معادلة التواصل الارتباطي.

مثل الاتصال الوظيفي، يتم التعبير عن اتصال الارتباط بواسطة معادلة اتصال. لإنشائه، عليك اتباع الخطوات (المراحل) التالية بالتتابع.

أولاً، يجب عليك فهم علاقات السبب والنتيجة، ومعرفة تبعية العلامات، أي منها أسباب (علامات عاملية)، وما هي النتيجة (علامات ناتجة). يتم إنشاء علاقات السبب والنتيجة بين الخصائص من خلال نظرية الموضوع حيث يتم استخدام طريقة الارتباط. فمثلا علم "تشريح الإنسان" يتيح لنا أن نقول ما هو مصدر العلاقة بين الوزن والطول، أي من هذه العلامات يعد عاملا، وهو النتيجة، فإن علم "الاقتصاد" يكشف منطق العلاقة بين السعر والعرض تحدد ماذا وفي أي مرحلة يكون السبب وما هي النتيجة. وبدون مثل هذا التبرير النظري الأولي، يكون تفسير النتائج الإضافية أمرًا صعبًا، وقد يؤدي في بعض الأحيان إلى استنتاجات سخيفة.

بعد إثبات وجود علاقات السبب والنتيجة، يجب بعد ذلك إضفاء الطابع الرسمي على هذه العلاقات، أي التعبير عنها باستخدام معادلة الاتصال، ويجب تحديد نوع المعادلة أولاً. لتحديد نوع المعادلة، يمكن التوصية بعدد من التقنيات. يمكنك اللجوء إلى نظرية الموضوع حيث يتم استخدام طريقة الارتباط، لنفترض أن علم "الكيمياء الزراعية" ربما يكون قد تلقى بالفعل إجابة على سؤال ما هي المعادلة التي يجب استخدامها للتعبير عن العلاقة: العائد - الأسمدة. إذا لم يكن هناك مثل هذه الإجابة، لاختيار معادلة يجب عليك استخدام بعض البيانات التجريبية ومعالجتها وفقا لذلك. يجب أن يقال على الفور أنه بعد اختيار نوع المعادلة بناءً على البيانات التجريبية، يجب على المرء أن يفهم بوضوح أن هذا النوع من المعادلات يمكن استخدامه لوصف العلاقة بين البيانات المستخدمة. الطريقة الرئيسية لمعالجة هذه البيانات هي إنشاء الرسوم البيانية، حيث يتم رسم قيم خاصية العامل على محور الإحداثي، ويتم رسم القيم المحتملة للخاصية الناتجة على المحور الإحداثي. نظرًا لأن نفس قيمة سمة العامل، بحكم التعريف، تتوافق مع العديد من القيم غير المؤكدة للسمة الناتجة، فنتيجة للإجراءات المذكورة أعلاه، سنحصل على مجموعة معينة من النقاط والتي تسمى حقل الارتباط. يسمح المظهر العام لمجال الارتباط في عدد من الحالات بوضع افتراض حول الشكل المحتمل للمعادلة، ومع التطور الحديث لتكنولوجيا الكمبيوتر، فإن إحدى الطرق الرئيسية لاختيار المعادلة هي تعداد أنواع مختلفة من المعادلات، ويتم اختيار الأفضل باعتباره الذي يوفر أعلى معامل تحديد، وهو ما سيتم مناقشته أدناه. قبل الانتقال إلى الحسابات، من الضروري التحقق من مدى استيفاء البيانات التجريبية المستخدمة لبناء المعادلة لمتطلبات معينة. تتعلق المتطلبات بخصائص العامل وإجمالي البيانات. يجب أن تكون خصائص العامل، إذا كان هناك العديد منها، مستقلة عن بعضها البعض. وأما الكل فيجب أولا أن يكون متجانسا

(تمت مناقشة مفهوم التجانس سابقًا)، وثانيًا، إنه كبير جدًا. يجب أن تحتوي كل خاصية عاملية على 8-10 ملاحظات على الأقل.

بعد اختيار المعادلة، الخطوة التالية هي حساب معاملات المعادلة. غالبًا ما يتم حساب معاملات المعادلة باستخدام طريقة المربعات الصغرى. من وجهة نظر الارتباط، فإن استخدام طريقة المربعات الصغرى يتكون من الحصول على معاملات المعادلة بحيث
=min، أي أن مجموع الانحرافات التربيعية للقيم الفعلية للخاصية الناتجة ( ) من تلك المحسوبة بالمعادلة ( ) كانت القيمة الدنيا. يتم تحقيق هذا المطلب من خلال بناء وحل نظام معروف لما يسمى بالمعادلات العادية. إذا، كمعادلة للارتباط بين ذو سيتم اختيار معادلة الخط
حيث أن نظام المعادلات العادية كما هو معروف سيكون على النحو التالي:

حل هذا النظام ل أو ب , نحصل على القيم اللازمة للمعاملات. يتم التحقق من صحة حساب المعاملات من خلال المساواة

ما هو تحليل التباين المستخدمة ل؟ الغرض من تحليل التباين هو دراسة وجود أو عدم وجود تأثير معنوي لأي عامل نوعي أو كمي على التغيرات في الخاصية الناتجة محل الدراسة. وللقيام بذلك، يتم تقسيم العامل الذي يُعتقد أن له تأثيرًا مهمًا أو ليس له تأثير كبير إلى فئات متدرجة (بمعنى آخر، مجموعات) ويتم تحديد ما إذا كان تأثير العامل هو نفسه من خلال فحص الأهمية بين المتوسطات في مجموعات البيانات المقابلة لتدرجات العامل. أمثلة: تتم دراسة اعتماد ربح المؤسسة على نوع المواد الخام المستخدمة (ثم فئات التدرج هي أنواع المواد الخام)، واعتماد تكلفة الإنتاج لكل وحدة إنتاج على حجم تقسيم المؤسسة (ثم فئات التدرج هي خصائص حجم القسم: كبير، متوسط، صغير).

الحد الأدنى لعدد فئات التدرج (المجموعات) هو اثنان. يمكن أن تكون فصول التخرج نوعية أو كمية.

لماذا يسمى تحليل التباين تحليل التباين؟ تحليل التباين يفحص العلاقة بين تباينين. التشتت، كما نعلم، هو خاصية تشتت البيانات حول القيمة المتوسطة. الأول هو التشتت المفسر بتأثير العامل، وهو ما يميز تشتت القيم بين تدرجات العامل (المجموعات) حول متوسط ​​جميع البيانات. والثاني هو التباين غير المفسر، والذي يتميز بتشتت البيانات ضمن التدرجات (المجموعات) حول متوسط ​​قيم المجموعات نفسها. يمكن تسمية التباين الأول بين المجموعات، والثاني - داخل المجموعات. وتسمى نسبة هذه الفروق بنسبة فيشر الفعلية وتتم مقارنتها بالقيمة الحرجة لنسبة فيشر. إذا كانت نسبة فيشر الفعلية أكبر من النسبة الحرجة فإن متوسطات فئات التدرج تختلف عن بعضها البعض ويؤثر العامل قيد الدراسة بشكل كبير على التغير في البيانات. وإذا كان أقل فإن متوسط ​​فئات التدرج لا تختلف عن بعضها البعض وليس للعامل تأثير كبير.

كيف يتم صياغة الفرضيات وقبولها ورفضها في ANOVA؟ في تحليل التباين، يتم تحديد الوزن النوعي للتأثير الكلي لعامل واحد أو أكثر. يتم تحديد أهمية تأثير العامل من خلال اختبار الفرضيات:

  • ح0 : μ 1 = μ 2 = ... = μ أ، أين أ- عدد فئات التدرج - جميع فئات التدرج لها نفس القيمة المتوسطة،
  • ح1 : ليس الكل μ أنامتساوي - ليست كل فئات التدرج لها نفس القيمة المتوسطة.

إذا لم يكن تأثير العامل مهمًا، فإن الفرق بين فئات التدرج لهذا العامل يكون أيضًا غير مهم وفي سياق تحليل التباين يتم فرض فرضية العدم ح0 لم يتم رفضه. إذا كان تأثير العامل معنويا، فإن الفرضية الصفرية ح0 مرفوض: ليست كل فئات التدرج لها نفس القيمة المتوسطة، أي أنه من بين الاختلافات المحتملة بين فئات التدرج، هناك واحدة أو أكثر مهمة.

المزيد من مفاهيم تحليل التباين. المجمع الإحصائي في تحليل التباين هو جدول البيانات التجريبية. إذا كانت جميع فئات التدرجات لها نفس عدد الخيارات، فإن المجمع الإحصائي يسمى متجانس (متجانس)، إذا كان عدد الخيارات مختلفا - غير متجانس (غير متجانس).

اعتمادًا على عدد العوامل التي يتم تقييمها، يتم التمييز بين تحليل التباين بعامل واحد وعاملين ومتعدد العوامل.

تحليل التباين ذو العامل الواحد: جوهر الطريقة، الصيغ، الأمثلة

جوهر الطريقة والصيغة

يعتمد على حقيقة أن مجموع الانحرافات التربيعية للمجمع الإحصائي يمكن تقسيمه إلى مكونات:

سس = سسأ+ سسه,

سس

سسأ أمجموع الانحرافات التربيعية،

سسه- مجموع غير مفسر للانحرافات المربعة أو مجموع انحرافات الخطأ المربعة.

إذا من خلال نأناالإشارة إلى عدد الخيارات في كل فئة تدرج (مجموعة) و أهو إجمالي عدد تدرجات العامل (المجموعات)، ثم هو إجمالي عدد الملاحظات ويمكن الحصول على الصيغ التالية:

العدد الإجمالي للانحرافات التربيعية: ,

وأوضح من خلال تأثير العامل أمجموع الانحرافات التربيعية: ,

مجموع غير مفسر للانحرافات المربعة أو مجموع انحرافات الخطأ المربعة: ,

- المتوسط ​​العام للملاحظات،

(مجموعة).

بجانب،

أين هو تباين تدرج العامل (المجموعة).

لإجراء تحليل أحادي الاتجاه لتباين البيانات من مجمع إحصائي، تحتاج إلى العثور على نسبة فيشر الفعلية - نسبة التباين الموضحة بتأثير العامل (بين المجموعات) والتباين غير المفسر (داخل المجموعة):

ومقارنتها بقيمة فيشر الحرجة.

يتم حساب الفروق على النحو التالي:

وأوضح التباين،

التباين غير المبررة

الخامسأ = أ − 1 - عدد درجات حرية التباين المفسر،

الخامسه = نأ - عدد درجات حرية التباين غير المفسر،

الخامس = ن

يمكن العثور على القيمة الحرجة لنسبة فيشر مع قيم معينة لمستوى الدلالة ودرجات الحرية في جداول إحصائية أو حسابها باستخدام دالة MS Excel F.OBR (الصورة أدناه لتكبيرها اضغط عليها بالزر زر الفأرة الايسر).


تتطلب الوظيفة منك إدخال البيانات التالية:

الاحتمالية - مستوى الأهمية α ,

Degrees_freedom1 - عدد درجات حرية التباين المفسر الخامسأ,

Degrees_freedom2 - عدد درجات حرية التباين غير المفسر الخامسه.

إذا كانت القيمة الفعلية لنسبة فيشر أكبر من القيمة الحرجة ()، فسيتم رفض الفرضية الصفرية عند مستوى الأهمية α . وهذا يعني أن العامل يؤثر بشكل كبير على التغير في البيانات وأن البيانات تعتمد على العامل ذو الاحتمال ص = 1 − α .

إذا كانت القيمة الفعلية لنسبة فيشر أقل من القيمة الحرجة ()، فلا يمكن رفض الفرضية الصفرية عند مستوى الأهمية α . وهذا يعني أن العامل لا يؤثر بشكل كبير على البيانات ذات الاحتمالية ص = 1 − α .

تحليل التباين أحادي الاتجاه: أمثلة

مثال 1.من الضروري معرفة ما إذا كان نوع المواد الخام المستخدمة يؤثر على ربحية المؤسسة. في ستة فئات تدرج (مجموعات) للعامل (النوع الأول، النوع الثاني، وما إلى ذلك) يتم جمع بيانات عن الأرباح من إنتاج 1000 وحدة من المنتج بملايين الروبل على مدى 4 سنوات.

نوع المادة الخام2014 2015 2016 2017
الأول7,21 7,55 7,29 7,6
الثاني7,89 8,27 7,39 8,18
الثالث7,25 7,01 7,37 7,53
الرابع7,75 7,41 7,27 7,42
الخامس7,7 8,28 8,55 8,6
السادس7,56 8,05 8,07 7,84
متوسط
تشتت
7,413 0,0367
7,933 0,1571
7,290 0,0480
7,463 0,0414
8,283 0,1706
7,880 0,0563

أ= 6 وفي كل صف (مجموعة) نط = 4الملاحظات. العدد الإجمالي للملاحظات ن = 24 .

عدد درجات الحرية:

الخامسأ = أ − 1 = 6 − 1 = 5 ,

الخامسه = نأ = 24 − 6 = 18 ,

الخامس = ن − 1 = 24 − 1 = 23 .

دعونا نحسب الفروق:

.

.

بما أن نسبة فيشر الفعلية أكبر من النسبة الحرجة:

مع مستوى الأهمية α = 0.05 نستنتج أن ربح المؤسسة يختلف بشكل كبير حسب نوع المواد الخام المستخدمة في الإنتاج.

أو، وهو نفس الشيء، نرفض الفرضية الرئيسية حول تساوي المتوسطات في جميع فئات (مجموعات) التدرج العاملي.

في المثال الذي تم تناوله للتو، كان لكل فئة تدرج عامل نفس عدد الخيارات. ولكن، كما ذكر في الجزء التمهيدي، قد يختلف عدد الخيارات. وهذا لا يؤدي بأي حال من الأحوال إلى تعقيد عملية تحليل التباين. هذا هو المثال التالي.

مثال 2.مطلوب معرفة ما إذا كان هناك اعتماد لتكلفة الإنتاج لكل وحدة إنتاج على حجم قسم المؤسسة. وينقسم العامل (حجم الوحدة) إلى ثلاث فئات تدرجية (مجموعات): صغيرة، متوسطة، كبيرة. يتم تلخيص البيانات المقابلة لهذه المجموعات حول تكلفة إنتاج وحدة من نفس نوع المنتج لفترة معينة.

صغيرمتوسطكبير
48 47 46
50 61 57
63 63 57
72 47 55
43 32
59 59
58
متوسط58,6 54,0 51,0
تشتت128,25 65,00 107,60

عدد فئات تدرج العوامل (المجموعات) أ= 3، عدد الملاحظات في الفصول (المجموعات) ن1 = 4 , ن2 = 7 , ن3 = 6 . العدد الإجمالي للملاحظات ن = 17 .

عدد درجات الحرية:

الخامسأ = أ − 1 = 2 ,

الخامسه = نأ = 17 − 3 = 14 ,

الخامس = ن − 1 = 16 .

دعونا نحسب مجموع الانحرافات التربيعية:

دعونا نحسب الفروق:

,

.

دعونا نحسب نسبة فيشر الفعلية:

.

القيمة الحرجة لنسبة فيشر:

وبما أن القيمة الفعلية لنسبة فيشر أقل من القيمة الحرجة: فإننا نستنتج أن حجم قسم المؤسسة ليس له تأثير كبير على تكلفة الإنتاج.

أو ما هو نفسه، مع احتمال 95٪ نقبل الفرضية الرئيسية القائلة بأن متوسط ​​تكلفة إنتاج وحدة من نفس المنتج في الأقسام الصغيرة والمتوسطة والكبيرة للمؤسسة لا يختلف بشكل كبير.

تحليل التباين أحادي الاتجاه في MS Excel

يمكن إجراء تحليل التباين أحادي الاتجاه باستخدام إجراء MS Excel اتجاه واحد أنوفا. نستخدمها لتحليل البيانات المتعلقة بالعلاقة بين نوع المواد الخام المستخدمة وربح المؤسسة من المثال 1.

تحليل الخدمة/البياناتوحدد أداة التحليل اتجاه واحد أنوفا.

فى الشباك الفاصل الزمني للإدخالقم بالإشارة إلى منطقة البيانات (في حالتنا هي $A$2:$E$7). نشير إلى كيفية تجميع العامل - حسب الأعمدة أو الصفوف (في حالتنا، حسب الصفوف). إذا كان العمود الأول يحتوي على أسماء فئات العوامل، فحدد المربع التسميات في العمود الأول. فى الشباك ألفاتشير إلى مستوى الأهمية α = 0,05 .

الجدول الثاني – تحليل التباين – يحتوي على بيانات عن قيم العامل بين المجموعات وداخل المجموعات والمجاميع. هذا هو مجموع الانحرافات التربيعية (SS)، وعدد درجات الحرية (df)، والتشتت (MS). تحتوي الأعمدة الثلاثة الأخيرة على القيمة الفعلية لنسبة فيشر (F)، والمستوى p (القيمة P) والقيمة الحرجة لنسبة فيشر (F Crit).

آنسة F القيمة P F الحرجة
0,58585 6,891119 0,000936 2,77285
0,085017

وبما أن القيمة الفعلية لنسبة فيشر (6.89) أكبر من القيمة الحرجة (2.77) وباحتمال 95% فإننا نرفض الفرضية الصفرية حول مساواة متوسط ​​الإنتاجية عند استخدام جميع أنواع المواد الخام، أي أننا نستنتج أن نوع المواد الخام المستخدمة يؤثر على ربحية المشروعات.

التحليل الثنائي للتباين بدون تكرار: جوهر الطريقة، الصيغ، المثال

يتم استخدام تحليل التباين الثنائي للتحقق من الاعتماد المحتمل للخاصية الناتجة على عاملين - أو ب. ثم أ- عدد تدرجات العوامل أو ب- عدد تدرجات العوامل ب. في المجمع الإحصائي، ينقسم مجموع البقايا المربعة إلى ثلاثة مكونات:

سس = سسأ+ سسب+ سسه,

- مجموع الانحرافات التربيعية،

- موضح بتأثير العامل أمجموع الانحرافات التربيعية،

- موضح بتأثير العامل بمجموع الانحرافات التربيعية،

- المتوسط ​​العام للملاحظات،

متوسط ​​الملاحظات في كل عامل التدرج أ ,

ب .

أ ,

وأوضح التباين من خلال تأثير العامل ب ,

الخامسأ = أ − 1 أ ,

الخامسب = ب − 1 - عدد درجات حرية التشتت الموضحة بتأثير العامل ب ,

الخامسه = ( أ − 1)(ب − 1)

الخامس = أب− 1 - العدد الإجمالي لدرجات الحرية.

إذا كانت العوامل لا تعتمد على بعضها البعض، لتحديد أهمية العوامل، يتم طرح فرضيتين صفريتين وفرضيات بديلة مقابلة:

للعامل أ :

ح0 : μ 1أ = μ 2أ = ... = μ أأ,

ح1 : ليس الكل μ I لمتساوي؛

للعامل ب :

ح0 : μ 1 ب = μ 2ب =... = μ أ ب,

ح1 : ليس الكل μ آي بيمتساوون.

أ

لتحديد تأثير العامل ب، فأنت بحاجة إلى مقارنة موقف فيشر الفعلي مع موقف فيشر النقدي.

α ص = 1 − α .

α ص = 1 − α .

تحليل التباين ثنائي الاتجاه بدون تكرار: مثال

مثال 3.يتم تقديم المعلومات حول متوسط ​​استهلاك الوقود لكل 100 كيلومتر باللتر حسب حجم المحرك ونوع الوقود.

من الضروري التحقق مما إذا كان استهلاك الوقود يعتمد على حجم المحرك ونوع الوقود.

حل. للعامل أعدد فئات التدرج أ= 3 للعامل بعدد فئات التدرج ب = 3 .

نحسب مجموع الانحرافات التربيعية:

,

,

,

.

الفروق المقابلة:

,

,

.

أ . وبما أن نسبة فيشر الفعلية أقل من النسبة الحرجة وباحتمال 95% فإننا نقبل فرضية أن حجم المحرك لا يؤثر على استهلاك الوقود. ومع ذلك، إذا اخترنا مستوى الأهمية α = 0.1 ثم القيمة الفعلية لنسبة فيشر ومن ثم باحتمال 95% يمكننا أن نقبل أن حجم المحرك يؤثر على استهلاك الوقود.

نسبة فيشر الفعلية للعامل ب القيمة الحرجة لنسبة فيشر: . وبما أن نسبة فيشر الفعلية أكبر من القيمة الحرجة لنسبة فيشر، فإننا نقبل باحتمال 95% أن نوع الوقود يؤثر على استهلاكه.

تحليل التباين ثنائي الاتجاه بدون تكرار في MS Excel

يمكن إجراء تحليل التباين الثنائي دون تكرار باستخدام إجراء MS Excel. نستخدمها لتحليل البيانات المتعلقة بالعلاقة بين نوع الوقود واستهلاكه من المثال 3.

في قائمة MS Excel، قم بتنفيذ الأمر تحليل الخدمة/البياناتوحدد أداة التحليل تحليل التباين ثنائي الاتجاه بدون تكرار.

نقوم بملء البيانات بنفس الطريقة كما في حالة تحليل التباين أحادي الاتجاه.


ونتيجة لهذا الإجراء، يتم عرض جدولين. الجدول الأول هو الإجماليات. أنه يحتوي على بيانات عن جميع فئات تدرج العوامل: عدد الملاحظات، القيمة الإجمالية، القيمة المتوسطة والتباين.

الجدول الثاني - تحليل التباين - يحتوي على بيانات عن مصادر التباين: التشتت بين الصفوف، التشتت بين الأعمدة، تشتت الأخطاء، التشتت الكلي، مجموع مربعات الانحرافات (SS)، درجات الحرية (df)، التشتت (MS). تحتوي الأعمدة الثلاثة الأخيرة على القيمة الفعلية لنسبة فيشر (F)، والمستوى p (القيمة P) والقيمة الحرجة لنسبة فيشر (F Crit).

آنسة F القيمة P F الحرجة
3,13 5,275281 0,075572 6,94476
8,043333 13,55618 0,016529 6,944276
0,593333

عامل أ(إزاحة المحرك) يتم تجميعها في الخطوط. وبما أن نسبة فيشر الفعلية البالغة 5.28 أقل من النسبة الحرجة البالغة 6.94، فإننا نقبل باحتمال 95% أن استهلاك الوقود لا يعتمد على حجم المحرك.

عامل ب(نوع الوقود) مجمعة في أعمدة. نسبة فيشر الفعلية 13.56 أكبر من النسبة الحرجة 6.94، لذلك نقبل باحتمال 95% أن استهلاك الوقود يعتمد على نوعه.

التحليل الثنائي للتباين مع التكرار: جوهر الطريقة، الصيغ، المثال

يتم استخدام التحليل الثنائي للتباين مع التكرار للتحقق ليس فقط من الاعتماد المحتمل للخاصية الناتجة على عاملين - أو ب، ولكن أيضًا التفاعل المحتمل للعوامل أو ب. ثم أ- عدد تدرجات العوامل أو ب- عدد تدرجات العوامل ب, ص- عدد التكرارات. في المجمع الإحصائي، ينقسم مجموع البقايا المربعة إلى أربعة مكونات:

سس = سسأ+ سسب+ سسأب + سسه,

- مجموع الانحرافات التربيعية،

- موضح بتأثير العامل أمجموع الانحرافات التربيعية،

- موضح بتأثير العامل بمجموع الانحرافات التربيعية،

- موضح بتأثير تفاعل العوامل أو بمجموع الانحرافات التربيعية،

- مجموع غير مفسر للانحرافات المربعة أو مجموع انحرافات الخطأ المربعة،

- المتوسط ​​العام للملاحظات،

- متوسط ​​الملاحظات في كل عامل التدرج أ ,

- متوسط ​​عدد الملاحظات في كل عامل التدرج ب ,

متوسط ​​عدد الملاحظات في كل مجموعة من تدرجات العوامل أو ب ,

ن = أبريل- العدد الإجمالي للملاحظات.

يتم حساب الفروق على النحو التالي:

وأوضح التباين من خلال تأثير العامل أ ,

وأوضح التباين من خلال تأثير العامل ب ,

- التباين المفسر بتفاعل العوامل أو ب ,

- التباين غير المفسر أو التباين الخطأ،

الخامسأ = أ − 1 - عدد درجات حرية التشتت الموضحة بتأثير العامل أ ,

الخامسب = ب − 1 - عدد درجات حرية التشتت الموضحة بتأثير العامل ب ,

الخامسأب = ( أ − 1)(ب − 1) - عدد درجات حرية التباين الموضحة بتفاعل العوامل أو ب ,

الخامسه = أب(ص − 1) - عدد درجات حرية التباين غير المفسر أو تباين الخطأ،

الخامس = أبريل− 1 - العدد الإجمالي لدرجات الحرية.

إذا كانت العوامل لا تعتمد على بعضها البعض، لتحديد أهمية العوامل، يتم طرح ثلاث فرضيات صفرية وفرضيات بديلة مقابلة:

للعامل أ :

ح0 : μ 1أ = μ 2أ = ... = μ أأ,

ح1 : ليس الكل μ I لمتساوي؛

للعامل ب :

لتحديد تأثير تفاعل العوامل أو ب، فأنت بحاجة إلى مقارنة موقف فيشر الفعلي مع موقف فيشر النقدي.

إذا كانت نسبة فيشر الفعلية أكبر من نسبة فيشر الحرجة، فيجب رفض فرضية العدم عند مستوى الأهمية α . وهذا يعني أن العامل يؤثر بشكل كبير على البيانات: تعتمد البيانات على العامل ذو الاحتمالية ص = 1 − α .

إذا كانت نسبة فيشر الفعلية أقل من نسبة فيشر الحرجة، فيجب قبول فرضية العدم عند مستوى الأهمية α . وهذا يعني أن العامل لا يؤثر بشكل كبير على البيانات ذات الاحتمالية ص = 1 − α .

تحليل التباين ثنائي الاتجاه مع التكرار: مثال

حول تفاعل العوامل أو ب: نسبة فيشر الفعلية أقل من حرجة، وبالتالي فإن تفاعل الحملة الإعلانية ومتجر معين ليس كبيرًا.

ANOVA ثنائي الاتجاه مع التكرار في MS Excel

يمكن إجراء تحليل ثنائي الاتجاه للتباين مع التكرارات باستخدام إجراء MS Excel. نستخدمها لتحليل البيانات الخاصة بالعلاقة بين دخل المتجر واختيار متجر معين والحملة الإعلانية من المثال 4.

في قائمة MS Excel، قم بتنفيذ الأمر تحليل الخدمة/البياناتوحدد أداة التحليل تحليل التباين ثنائي الاتجاه مع التكرار.

نقوم بملء البيانات بنفس الطريقة كما في حالة تحليل التباين ثنائي العوامل بدون تكرار، مع إضافة أنه في عدد الصفوف لنافذة العينة تحتاج إلى إدخال عدد التكرارات.

ونتيجة لهذا الإجراء، يتم عرض جدولين. يتكون الجدول الأول من ثلاثة أجزاء: الجزء الأول يتوافق مع كل من الحملتين الإعلانيتين، والثالث يحتوي على بيانات حول كلا الحملتين الإعلانيتين. تحتوي أعمدة الجدول على معلومات حول جميع فئات التدرج للعامل الثاني - المتجر: عدد الملاحظات والقيمة الإجمالية والقيمة المتوسطة والتشتت.

يحتوي الجدول الثاني على بيانات عن مجموع الانحرافات التربيعية (SS)، وعدد درجات الحرية (df)، والتشتت (MS)، والقيمة الفعلية لنسبة فيشر (F)، والمستوى p (القيمة P) و القيمة الحرجة لنسبة فيشر (F Crit) لمختلف مصادر التباين: العاملان الواردان في الصفوف (العينة) والأعمدة، تفاعل العوامل، الخطأ (داخل) والمؤشرات الإجمالية (الإجمالي).

آنسة F القيمة P F الحرجة
8,013339 0,500252 0,492897 4,747221
189,1904 11,81066 0,001462 3,88529
6,925272 0,432327 0,658717 3,88529
16,01861

للعامل بإن نسبة فيشر الفعلية أكبر من النسبة الحرجة، وبالتالي هناك احتمال بنسبة 95% أن تختلف الإيرادات بشكل كبير بين المتاجر.

لتفاعل العوامل أو بنسبة فيشر الفعلية أقل من حرجة، وبالتالي، مع احتمال 95٪، فإن تفاعل الحملة الإعلانية ومتجر معين ليس كبيرا.

كل شيء عن موضوع "الإحصاء الرياضي"

تحليل التباين(من اللاتينية Dispersio - dispersion / بالإنجليزية Analysis Of Variance - ANOVA) يستخدم لدراسة تأثير واحد أو أكثر من المتغيرات النوعية (العوامل) على متغير كمي تابع (الاستجابة).

أساس تحليل التباين هو الافتراض بأن بعض المتغيرات يمكن اعتبارها أسباباً (عوامل، متغيرات مستقلة)، وأخرى كعواقب (متغيرات تابعة). تسمى المتغيرات المستقلة أحيانًا بالعوامل القابلة للتعديل على وجه التحديد لأنه في التجربة يكون لدى الباحث الفرصة لتنويعها وتحليل النتيجة الناتجة.

الهدف الاساسي تحليل التباين(ANOVA) هي دراسة أهمية الفروق بين الوسائل باستخدام مقارنة (تحليل) التباينات. يسمح تقسيم التباين الإجمالي إلى مصادر متعددة بمقارنة التباين الناتج عن الاختلافات بين المجموعة مع التباين الناتج عن التباين داخل المجموعة. إذا كانت الفرضية الصفرية (أن المتوسطات متساوية في عدة مجموعات من الملاحظات المختارة من المجتمع) صحيحة، فيجب أن يكون تقدير التباين المرتبط بالتباين داخل المجموعة قريبًا من تقدير التباين بين المجموعة. إذا كنت تقارن ببساطة المتوسطات في عينتين، فإن تحليل التباين (ANOVA) سيعطي نفس النتيجة مثل اختبار t للعينات المستقلة العادية (في حالة مقارنة مجموعتين مستقلتين من الموضوعات أو الملاحظات) أو اختبار t للعينات التابعة (في حالة مقارنة متغيرين على نفس ونفس مجموعة الأشياء أو الملاحظات).

إن جوهر تحليل التباين هو تقسيم التباين الكلي للصفة محل الدراسة إلى مكونات فردية يحددها تأثير عوامل محددة، واختبار الفرضيات حول أهمية تأثير هذه العوامل على السمة محل الدراسة. من خلال مقارنة مكونات التباين مع بعضها البعض باستخدام اختبار فيشر F، من الممكن تحديد نسبة التباين الإجمالي للسمة الناتجة بسبب عمل العوامل الخاضعة للرقابة.

المادة المصدر لتحليل التباين هي بيانات من دراسة ثلاث عينات أو أكثر: والتي يمكن أن تكون متساوية أو غير متساوية في العدد، سواء كانت متصلة أو غير متماسكة. وفقا لعدد العوامل المنظمة التي تم تحديدها، يمكن تحليل التباين عامل واحد(في هذه الحالة تتم دراسة تأثير عامل واحد على نتائج التجربة)، عاملين(عند دراسة تأثير عاملين) و متعددة العوامل(يسمح لك بتقييم ليس فقط تأثير كل عامل على حدة، ولكن أيضًا تفاعلهم).

ينتمي تحليل التباين إلى مجموعة الطرق البارامترية ولذلك يجب استخدامه فقط عندما يثبت أن التوزيع طبيعي.

يستخدم تحليل التباين إذا تم قياس المتغير التابع على مقياس نسبة أو فاصل أو ترتيب، وكانت المتغيرات المؤثرة ذات طبيعة غير رقمية (مقياس الاسم).

أمثلة على المشاكل

في المسائل التي يتم حلها عن طريق تحليل التباين هناك استجابة ذات طبيعة عددية تتأثر بعدة متغيرات ذات طبيعة اسمية. على سبيل المثال عدة أنواع من حصص تسمين الماشية أو طريقتين لحفظها، الخ.

مثال 1:كان هناك العديد من أكشاك الصيدليات العاملة في ثلاثة مواقع مختلفة طوال الأسبوع. في المستقبل يمكننا ترك واحد فقط. ومن الضروري تحديد ما إذا كان هناك فرق ذو دلالة إحصائية بين أحجام مبيعات الأدوية في الأكشاك. إذا كانت الإجابة بنعم، فسنختار الكشك الذي يتمتع بأعلى متوسط ​​حجم مبيعات يومية. إذا تبين أن الفرق في حجم المبيعات غير مهم إحصائيا، فيجب أن يكون أساس اختيار الكشك مؤشرات أخرى.

مثال 2:مقارنة مجموعة يعني التناقضات. تم ترتيب الانتماءات السياسية السبعة من الليبرالية للغاية إلى المحافظة للغاية، ويتم استخدام التباين الخطي لاختبار ما إذا كان هناك ميل غير صفري لوسائل المجموعة للزيادة - أي ما إذا كانت هناك زيادة خطية كبيرة في متوسط ​​العمر عند النظر في المجموعات المرتبة في الاتجاه من الليبرالية إلى المحافظة.

مثال 3:التحليل الثنائي للتباين. غالبًا ما يتأثر عدد مبيعات المنتج، بالإضافة إلى حجم المتجر، بموقع الرفوف مع المنتج. يحتوي هذا المثال على أرقام المبيعات الأسبوعية لأربعة تخطيطات للأرفف وثلاثة أحجام للمتجر. تظهر نتائج التحليل أن كلا العاملين - موقع الرفوف مع البضائع وحجم المتجر - يؤثران على عدد المبيعات، ولكن تفاعلهما ليس كبيرا.

مثال 4:تحليل التباين أحادي المتغير: تصميم القطاعات العشوائية الكاملة بمعاملتين. تم دراسة تأثير جميع التوليفات الممكنة من ثلاثة دهون وثلاثة عوامل تخمير العجين على خبز الخبز. كانت أربع عينات من الدقيق مأخوذة من أربعة مصادر مختلفة بمثابة عوامل كتلة ويجب تحديد أهمية التفاعل بين الدهون والكسارة. بعد ذلك، حدد الاحتمالات المختلفة لاختيار التباينات التي تسمح لك بمعرفة مجموعات مستويات العوامل المختلفة.

مثال 5:نموذج تصميم هرمي (مجمع) ذو تأثيرات مختلطة. تمت دراسة تأثير أربعة رؤوس تم اختيارها عشوائياً ومثبتة على آلة على تشوه حاملات الكاثود الزجاجية المنتجة. (الرؤوس مدمجة في الجهاز، لذلك لا يمكن استخدام نفس الرأس على أجهزة مختلفة.) يتم التعامل مع تأثير الرأس كعامل عشوائي. وتشير إحصائيات تحليل التباين (ANOVA) إلى عدم وجود فروق ذات دلالة إحصائية بين الآلات، ولكن هناك دلائل تشير إلى أن الرؤوس قد تختلف. الفرق بين جميع الآلات ليس كبيرًا، ولكن بالنسبة لاثنين منها يكون الفرق بين أنواع الرؤوس كبيرًا.

مثال 6:تحليل التدابير المتكررة وحيد المتغير باستخدام تصميم قطعة أرض مقسمة. أجريت هذه التجربة لتحديد تأثير تقييمات القلق الفردية على أداء الامتحان خلال أربع محاولات متتالية. يتم تنظيم البيانات بحيث يمكن عرضها كمجموعات من مجموعات فرعية من مجموعة البيانات بأكملها ("المؤامرة الكاملة"). وكان تأثير القلق ضئيلا، ولكن تأثير المحاولة كان كبيرا.

قائمة الأساليب

  • نماذج التجارب العاملية. أمثلة: العوامل المؤثرة في نجاح حل المسائل الرياضية؛ العوامل المؤثرة على حجم المبيعات.

تتكون البيانات من عدة سلاسل من الملاحظات (العمليات)، والتي تعتبر تحقيقات لعينات مستقلة عن بعضها البعض. تنص الفرضية الأولية على عدم وجود اختلاف في المعالجات، أي. من المفترض أن جميع الملاحظات يمكن اعتبارها عينة واحدة من إجمالي السكان:

  • النموذج البارامتري ذو العامل الواحد: طريقة شيفيه.
  • النموذج غير المعلمي ذو العامل الواحد [Lagutin M.B., 237]: اختبار Kruskal-Wallis [Hollender M., Wolf D.A., 131]، معيار Jonckheere [Lagutin M.B., 245].
  • الحالة العامة لنموذج ذو عوامل ثابتة، نظرية كوكران [عفيفي أ.، آيزن س.، 234].

تمثل البيانات ملاحظات مكررة:

  • النموذج اللابارامترى ذو العاملين: معيار فريدمان [Lapach, 203]، معيار الصفحة [Lagutin M.B., 263]. أمثلة: مقارنة فعالية أساليب الإنتاج والممارسات الزراعية.
  • نموذج غير معلمي ذو عاملين للبيانات غير المكتملة

قصة

من أين أتت التسمية تحليل التباين؟ قد يبدو غريبًا أن يسمى إجراء مقارنة الوسائل تحليل التباين. في الواقع، هذا لأننا عندما نفحص الأهمية الإحصائية للفرق بين متوسطي مجموعتين (أو أكثر)، فإننا في الواقع نقارن (نحلل) تباينات العينة. ويقترح المفهوم الأساسي لتحليل التباين فيشرفي عام 1920. ربما يكون المصطلح الأكثر طبيعية هو تحليل مجموع المربعات أو تحليل التباين، ولكن بسبب التقاليد، يتم استخدام مصطلح تحليل التباين. في البداية، تم تطوير تحليل التباين لمعالجة البيانات التي تم الحصول عليها خلال تجارب مصممة خصيصًا، وكان يعتبر الطريقة الوحيدة التي تدرس العلاقات السببية بشكل صحيح. تم استخدام الطريقة لتقييم التجارب في إنتاج المحاصيل. بعد ذلك، أصبحت الأهمية العلمية العامة لتحليل التباين للتجارب في علم النفس والتربية والطب وما إلى ذلك واضحة.

الأدب

  1. شيفي جي.تحليل التباين. - م، 1980.
  2. أرينز ه. ليوتر يو.تحليل متعدد المتغيرات من التباين.
  3. كوبزار أ.الإحصاء الرياضي التطبيقي. - م: فيزماتليت، 2006.
  4. لاباتش إس. إن.، تشوبينكو إيه. في.، بابيتش بي. إن.الإحصاء في العلوم والأعمال. - كييف: موريون، 2002.
  5. لاجوتين م.ب.الإحصائيات الرياضية المرئية. في مجلدين. - م: مركز ع، 2003.
  6. عفيفي أ، آيزن س.التحليل الإحصائي: نهج الكمبيوتر.
  7. هولندر م.، وولف د.أ.الطرق اللابارامترية للإحصاء.

روابط

  • تحليل التباين - الكتاب المدرسي الإلكتروني StatSoft.


 


يقرأ:



كعك الجبن من الجبن في مقلاة - وصفات كلاسيكية لكعك الجبن الرقيق كعك الجبن من 500 جرام من الجبن

كعك الجبن من الجبن في مقلاة - وصفات كلاسيكية لكعك الجبن الرقيق كعك الجبن من 500 جرام من الجبن

المقادير: (4 حصص) 500 جرام. جبنة قريش 1/2 كوب دقيق 1 بيضة 3 ملاعق كبيرة. ل. سكر 50 غرام. زبيب (اختياري) رشة ملح بيكنج صودا...

سلطة اللؤلؤة السوداء مع البرقوق سلطة اللؤلؤة السوداء مع البرقوق

سلطة

يوم جيد لجميع أولئك الذين يسعون جاهدين للتنوع في نظامهم الغذائي اليومي. إذا كنت تعبت من الأطباق الرتيبة وتريد إرضائك...

وصفات ليتشو مع معجون الطماطم

وصفات ليتشو مع معجون الطماطم

ليتشو لذيذ جدًا مع معجون الطماطم، مثل الليكو البلغاري المحضر لفصل الشتاء. هذه هي الطريقة التي نعالج بها (ونأكل!) كيسًا واحدًا من الفلفل في عائلتنا. ومن أكون...؟

الأمثال ونقلت عن الانتحار

الأمثال ونقلت عن الانتحار

فيما يلي اقتباسات وأمثال وأقوال بارعة عن الانتحار. هذه مجموعة مثيرة للاهتمام وغير عادية من "اللؤلؤ" الحقيقي...

صورة تغذية آر إس إس