خانه - من خودم می توانم تعمیرات را انجام دهم
انحراف معیار در اندازه گیری می شود. واریانس: کلی، نمونه، تصحیح شده

در آزمون آماری فرضیه ها، هنگام اندازه گیری رابطه خطی بین متغیرهای تصادفی.

میانگین انحراف معیار:

انحراف معیار(برآورد انحراف معیار متغیر تصادفی Floor، دیوارهای اطراف ما و سقف، ایکسدر مورد او انتظارات ریاضیبر اساس یک برآورد بی طرفانه از واریانس آن):

پراکندگی کجاست - کف، دیوارهای اطراف ما و سقف، منعنصر انتخاب؛ - اندازهی نمونه؛ - میانگین حسابی نمونه:

لازم به ذکر است که هر دو برآورد مغرضانه هستند. که در مورد کلیایجاد یک تخمین بی طرفانه غیرممکن است. با این حال، برآورد بر اساس برآورد واریانس بی طرفانه سازگار است.

قانون سه سیگما

قانون سه سیگما() - تقریباً تمام مقادیر یک متغیر تصادفی توزیع شده معمولی در بازه قرار دارند. دقیق تر - با اطمینان کمتر از 99.7٪، مقدار یک متغیر تصادفی توزیع شده معمولی در بازه زمانی مشخص قرار دارد (به شرطی که مقدار درست باشد و در نتیجه پردازش نمونه به دست نیاید).

اگر مقدار واقعی ناشناخته است، پس نباید از کف، دیوارهای اطراف و سقف استفاده کنیم. س. بنابراین، قانون سه سیگما به قانون سه طبقه، دیوارهای اطراف ما و سقف تبدیل می شود. س .

تفسیر مقدار انحراف استاندارد

مقدار زیادی از انحراف استاندارد، گسترش زیادی از مقادیر را در مجموعه ارائه شده با مقدار متوسط ​​مجموعه نشان می دهد. بر این اساس، یک مقدار کوچک نشان می دهد که مقادیر موجود در مجموعه حول مقدار وسط گروه بندی می شوند.

به عنوان مثال، ما سه مجموعه اعداد داریم: (0، 0، 14، 14)، (0، 6، 8، 14) و (6، 6، 8، 8). هر سه مجموعه دارای مقادیر میانگین برابر با 7 و انحرافات استاندارد به ترتیب برابر با 7، 5 و 1 هستند. ست اول بیشترین تعداد را دارد پراهمیتانحراف استاندارد - مقادیر درون مجموعه از مقدار متوسط ​​بسیار متفاوت است.

در یک مفهوم کلی، انحراف معیار را می توان معیاری برای عدم قطعیت در نظر گرفت. به عنوان مثال، در فیزیک، از انحراف معیار برای تعیین خطای یک سری اندازه گیری های متوالی مقداری استفاده می شود. این مقدار برای تعیین معقول بودن پدیده مورد مطالعه در مقایسه با مقدار پیش‌بینی‌شده توسط تئوری بسیار مهم است: اگر مقدار میانگین اندازه‌گیری‌ها با مقادیر پیش‌بینی‌شده توسط تئوری تفاوت زیادی داشته باشد (انحراف معیار بزرگ)، سپس مقادیر به دست آمده یا روش به دست آوردن آنها باید دوباره بررسی شود.

استفاده عملی

در عمل، انحراف استاندارد به شما امکان می دهد تعیین کنید که مقادیر در یک مجموعه چقدر ممکن است با مقدار متوسط ​​متفاوت باشد.

اقلیم

فرض کنید دو شهر با میانگین حداکثر دمای روزانه یکسان هستند، اما یکی در ساحل و دیگری در داخل کشور قرار دارد. مشخص است که شهرهایی که در ساحل قرار دارند، دارای حداکثر دمای متفاوتی در طول روز هستند که کمتر از شهرهای واقع در داخل کشور است. بنابراین، انحراف معیار حداکثر دمای روزانه برای یک شهر ساحلی کمتر از شهر دوم خواهد بود، علیرغم اینکه مقدار میانگین آنها یکسان است، که در عمل به این معنی است که احتمال حداکثر دمای هوای هر شهر وجود دارد. روز خاصدر هر سال به شدت متفاوت از مقدار متوسط ​​خواهد بود، برای شهری واقع در داخل قاره بیشتر است.

ورزش

فرض کنید چند تیم فوتبال وجود دارند که با توجه به مجموعه ای از پارامترها مورد ارزیابی قرار می گیرند، مثلا تعداد گل های زده و خورده، موقعیت های گلزنی و غیره. به احتمال زیاد بهترین تیم این گروه خواهد داشت. بهترین ارزش هاتوسط بیشترمولفه های. هر چه انحراف استاندارد تیم برای هر یک از پارامترهای ارائه شده کمتر باشد، نتیجه تیم ها قابل پیش بینی تر است. از سوی دیگر، تیم با ارزش عالیانحراف معیار، پیش بینی نتیجه را دشوار می کند، که به نوبه خود با عدم تعادل توضیح داده می شود، به عنوان مثال، دفاع قوی اما حمله ضعیف.

استفاده از انحراف معیار پارامترهای تیم، پیش بینی نتیجه مسابقه بین دو تیم، ارزیابی نقاط قوت و طرف های ضعیفدستورات، و در نتیجه روش های مبارزه انتخاب شده است.

تحلیل تکنیکال

همچنین ببینید

ادبیات

* بوروویکوف، وی.آمار. هنر تجزیه و تحلیل داده ها در رایانه: برای حرفه ای ها / V. Borovikov. - سنت پترزبورگ. : پیتر، 2003. - 688 ص. - شابک 5-272-00078-1.

در این مقاله در مورد آن صحبت خواهم کرد چگونه انحراف معیار را پیدا کنیم. این مطالب برای درک کامل ریاضیات بسیار مهم است، بنابراین یک معلم ریاضی باید یک درس جداگانه یا حتی چندین درس را به مطالعه آن اختصاص دهد. در این مقاله پیوندی به یک آموزش ویدیویی دقیق و قابل درک خواهید یافت که توضیح می دهد انحراف معیار چیست و چگونه آن را پیدا کنید.

انحراف معیارارزیابی گسترش مقادیر به دست آمده در نتیجه اندازه گیری یک پارامتر خاص را امکان پذیر می کند. با علامت (حرف یونانی "سیگما") نشان داده شده است.

فرمول محاسبه بسیار ساده است. برای پیدا کردن انحراف معیار، باید جذر واریانس را بگیرید. بنابراین اکنون باید بپرسید "واریانس چیست؟"

واریانس چیست

تعریف واریانس به این صورت است. پراکندگی میانگین حسابی مجذور انحراف مقادیر از میانگین است.

برای یافتن واریانس، محاسبات زیر را به ترتیب انجام دهید:

  • میانگین را تعیین کنید (میانگین حسابی ساده یک سری مقادیر).
  • سپس میانگین را از هر مقدار کم کنید و اختلاف حاصل را مربع کنید (به دست می آورید اختلاف مربع).
  • مرحله بعدی محاسبه میانگین حسابی اختلاف مجذورهای حاصل است (در زیر می توانید دقیقاً دلیل مربعات را دریابید).

بیایید به یک مثال نگاه کنیم. فرض کنید شما و دوستانتان تصمیم دارید قد سگ های خود را (به میلی متر) اندازه گیری کنید. در نتیجه اندازه‌گیری‌ها، اندازه‌گیری‌های ارتفاع زیر را دریافت کردید (در جثه‌ها): 600 میلی‌متر، 470 میلی‌متر، 170 میلی‌متر، 430 میلی‌متر و 300 میلی‌متر.

بیایید میانگین، واریانس و انحراف معیار را محاسبه کنیم.

ابتدا بیایید مقدار متوسط ​​را پیدا کنیم. همانطور که می دانید، برای انجام این کار باید تمام مقادیر اندازه گیری شده را جمع آوری کنید و بر تعداد اندازه گیری ها تقسیم کنید. پیشرفت محاسبات:

میانگین میلی متر

بنابراین، میانگین (میانگین حسابی) 394 میلی متر است.

حالا باید تعیین کنیم انحراف قد هر سگ از میانگین:

سرانجام، برای محاسبه واریانس، هر یک از تفاوت های حاصل را مربع می کنیم و سپس میانگین حسابی نتایج به دست آمده را می یابیم:

پراکندگی میلی متر 2.

بنابراین، پراکندگی 21704 میلی متر مربع است.

نحوه پیدا کردن انحراف معیار

پس چگونه می توانیم با دانستن واریانس، انحراف معیار را محاسبه کنیم؟ همانطور که به یاد داریم، جذر آن را بگیرید. یعنی انحراف معیار برابر است با:

mm (به نزدیکترین عدد صحیح برحسب میلی متر گرد شده است).

با استفاده از این روش متوجه شدیم که برخی از سگ ها (مثلاً روتوایلرها) سگ های بسیار بزرگی هستند. اما سگ‌های بسیار کوچکی نیز وجود دارند (مثلاً سگ‌های داش، اما این را نباید به آنها بگویید).

جالب ترین چیز این است که انحراف معیار با خود همراه است اطلاعات مفید. حال می‌توانیم نشان دهیم که اگر انحراف معیار از میانگین (به دو طرف آن) را رسم کنیم، کدام یک از نتایج اندازه‌گیری ارتفاع به دست آمده در بازه‌ای است که به دست می‌آوریم.

یعنی با استفاده از انحراف استاندارد، یک روش "استاندارد" به دست می آوریم که به ما امکان می دهد بفهمیم کدام یک از مقادیر نرمال است (از نظر آماری متوسط) و کدام فوق العاده بزرگ یا برعکس کوچک است.

انحراف معیار چیست؟

اما... اگر تحلیل کنیم همه چیز کمی متفاوت خواهد بود نمونهداده ها. در مثال ما در نظر گرفتیم جمعیت عمومی.یعنی 5 سگ ما تنها سگهای دنیا بودند که به ما علاقه داشتند.

اما اگر داده ها یک نمونه باشند (مقادیر انتخاب شده از یک جمعیت بزرگ)، محاسبات باید متفاوت انجام شود.

اگر مقادیری وجود دارد، پس:

تمام محاسبات دیگر به طور مشابه انجام می شود، از جمله تعیین میانگین.

به عنوان مثال، اگر پنج سگ ما فقط نمونه ای از جمعیت سگ ها (همه سگ های روی کره زمین) باشند، باید بر آنها تقسیم کنیم 4، نه 5،برای مثال:

واریانس نمونه = میلی متر 2.

در این حالت انحراف استاندارد برای نمونه برابر است با میلی متر (به نزدیکترین عدد کامل گرد شده است).

می توانیم بگوییم که در موردی که مقادیر ما فقط یک نمونه کوچک است، مقداری "اصلاح" انجام داده ایم.

توجه داشته باشید. چرا دقیقاً مجذور تفاوت ها؟

اما چرا هنگام محاسبه واریانس دقیقاً اختلافات مجذور را در نظر می گیریم؟ فرض کنید هنگام اندازه گیری برخی از پارامترها، مجموعه مقادیر زیر را دریافت کرده اید: 4; 4 -4 -4. اگر به سادگی انحرافات مطلق از میانگین (تفاوت ها) را با هم جمع کنیم ... مقادیر منفی با مقادیر مثبت خنثی می شوند:

.

معلوم می شود که این گزینه بی فایده است. سپس شاید ارزش امتحان مقادیر مطلق انحرافات (یعنی ماژول های این مقادیر) را داشته باشد؟

در نگاه اول، خوب معلوم می شود (به هر حال، مقدار حاصل، میانگین انحراف مطلق نامیده می شود)، اما نه در همه موارد. بیایید مثال دیگری را امتحان کنیم. اجازه دهید اندازه گیری به مجموعه مقادیر زیر منجر شود: 7; 1 -6 -2. سپس میانگین انحراف مطلق برابر است با:

وای! مجدداً نتیجه 4 را به دست آوردیم، اگرچه تفاوت ها گسترش بسیار بیشتری دارند.

حالا بیایید ببینیم اگر اختلافات را مربع کنیم (و سپس جذر مجموع آنها را بگیریم چه اتفاقی می افتد).

برای مثال اول این خواهد بود:

.

برای مثال دوم این خواهد بود:

حالا موضوع کاملاً متفاوت است! هر چه گسترش تفاوت ها بیشتر باشد، انحراف معیار بیشتر است... این همان چیزی است که ما به دنبال آن بودیم.

در واقع، این روش از همان ایده ای استفاده می کند که هنگام محاسبه فاصله بین نقاط، فقط به روشی متفاوت اعمال می شود.

و از نظر ریاضی استفاده از مربع و ریشه های مربعسود بیشتری نسبت به مقادیر مطلق انحرافات به دست می آورد و انحراف استاندارد را برای سایر مسائل ریاضی قابل اجرا می کند.

سرگئی والریویچ به شما گفت که چگونه انحراف معیار را پیدا کنید

درس شماره 4

موضوع: آمار توصیفی. شاخص های تنوع صفات در مجموع"

معیارهای اصلی تنوع یک مشخصه در جامعه آماری عبارتند از: حد، دامنه، انحراف معیار، ضریب نوسان و ضریب تغییرات. در درس قبلی بحث شد که مقادیر متوسط ​​فقط یک مشخصه تعمیم یافته از مشخصه مورد مطالعه را در مجموع ارائه می دهد و مقادیر انواع مختلف آن را در نظر نمی گیرد: مقادیر حداقل و حداکثر، بالاتر از میانگین، زیر. متوسط ​​و غیره

مثال. مقادیر متوسط ​​دو دنباله اعداد مختلف: -100. -20؛ 100; 20 و 0.1; -0.2; 0.1 کاملاً یکسان و برابر هستنددر باره.با این حال، محدوده پراکندگی این داده های توالی میانگین نسبی بسیار متفاوت است.

تعیین معیارهای ذکر شده برای تنوع یک ویژگی در درجه اول با در نظر گرفتن ارزش آن در عناصر فردی جامعه آماری انجام می شود.

شاخص هایی برای اندازه گیری تنوع یک صفت هستند مطلقو نسبت فامیلی. شاخص های مطلق تغییرات عبارتند از: محدوده تغییرات، حد، انحراف معیار، پراکندگی. ضریب تغییرات و ضریب نوسان به معیارهای نسبی تغییرات اشاره دارد.

حد (Lim) -این معیاری است که با مقادیر شدید یک نوع در یک سری تغییرات تعیین می شود. به عبارت دیگر، این معیار محدود به مقادیر حداقل و حداکثر ویژگی است:

دامنه (Am)یا محدوده تنوع -این تفاوت بین گزینه های افراطی است. محاسبه این معیار با کم کردن حداقل مقدار آن از حداکثر مقدار مشخصه انجام می شود که به ما امکان می دهد درجه پراکندگی گزینه را تخمین بزنیم:

نقطه ضعف حد و دامنه به عنوان معیار تغییرپذیری این است که کاملاً به مقادیر شدید مشخصه در سری تغییرات بستگی دارند. در این مورد، نوسانات مقادیر ویژگی در یک سری در نظر گرفته نمی شود.

کاملترین توصیف از تنوع یک صفت در یک جامعه آماری توسط انحراف معیار(سیگما)، که معیار کلی انحراف یک گزینه از مقدار میانگین آن است. انحراف معیار اغلب نامیده می شود انحراف معیار.

انحراف معیار بر اساس مقایسه هر گزینه با میانگین حسابی یک جامعه معین است. از آنجایی که در مجموع همیشه گزینه های کمتر و بیشتر از آن وجود خواهد داشت، مجموع انحرافات با علامت "" با مجموع انحرافات با علامت "" لغو می شود، یعنی. مجموع همه انحرافات صفر است. برای جلوگیری از تأثیر علائم تفاوت ها، انحراف از میانگین حسابی مجذور گرفته می شود، یعنی. . مجموع مجذور انحرافات برابر با صفر نیست. برای به دست آوردن ضریب قابل اندازه گیری تغییرپذیری، میانگین مجموع مربع ها را بگیرید - این مقدار نامیده می شود. واریانس ها:

در اصل، پراکندگی میانگین مربع انحراف مقادیر فردی یک مشخصه از مقدار متوسط ​​آن است. پراکندگی مربع انحراف معیار

واریانس یک کمیت بعدی است (نامگذاری شده). بنابراین، اگر انواع یک سری اعداد بر حسب متر بیان شود، واریانس متر مربع را به دست می دهد. اگر گزینه ها بر حسب کیلوگرم بیان شوند، واریانس مربع این اندازه (کیلوگرم 2) و غیره را نشان می دهد.

انحراف معیار– جذر واریانس:

، سپس هنگام محاسبه پراکندگی و انحراف معیار در مخرج کسر، به جایباید قرار گیرد.

محاسبه انحراف استاندارد را می توان به شش مرحله تقسیم کرد که باید در یک دنباله خاص انجام شود:

کاربرد انحراف معیار:

الف) برای قضاوت در مورد تغییرپذیری سری تغییرات و ارزیابی مقایسه ای تیپیکیت (نمایندگی) میانگین های حسابی. این در تشخیص افتراقی هنگام تعیین ثبات علائم ضروری است.

ب) برای بازسازی سری تغییرات، یعنی. بازیابی پاسخ فرکانسی آن بر اساس قوانین سه سیگما. در فاصله زمانی (М±3σ) 99.7٪ از تمام انواع سری در فاصله (М±2σ) - 95.5 درصد و در محدوده (М±1σ) - گزینه ردیف 68.3٪(عکس. 1).

ج) برای شناسایی گزینه های "پاپ آپ".

د) تعیین پارامترهای هنجار و آسیب شناسی با استفاده از تخمین سیگما

ه) برای محاسبه ضریب تغییرات

و) برای محاسبه میانگین خطای میانگین حسابی.

برای توصیف هر جمعیتی که داردنوع توزیع نرمال کافی است دو پارامتر را بدانیم: میانگین حسابی و انحراف معیار.

شکل 1. قانون سه سیگما

مثال.

در اطفال، انحراف معیار برای ارزیابی رشد فیزیکی کودکان با مقایسه داده های یک کودک خاص با شاخص های استاندارد مربوطه استفاده می شود. میانگین حسابی رشد جسمانی کودکان سالم به عنوان استاندارد در نظر گرفته شده است. مقایسه شاخص ها با استانداردها با استفاده از جداول خاصی انجام می شود که در آن استانداردها به همراه مقیاس سیگما مربوطه آنها آورده شده است. اعتقاد بر این است که اگر شاخص رشد فیزیکی کودک در حد استاندارد (میانگین حسابی) ± σ باشد، آنگاه رشد فیزیکیکودک (طبق این شاخص) با هنجار مطابقت دارد. اگر شاخص در حد استاندارد ± 2σ باشد، انحراف جزئی از هنجار وجود دارد. اگر شاخص فراتر از این محدودیت ها باشد، رشد فیزیکی کودک به شدت با هنجار متفاوت است (آسیب شناسی ممکن است).

علاوه بر شاخص های تغییرات بیان شده در مقادیر مطلق، تحقیقات آماری از شاخص های تغییرات بیان شده در مقادیر نسبی استفاده می کند. ضریب نوسان -این نسبت دامنه تغییرات به مقدار متوسط ​​صفت است. ضریب تغییرات -این نسبت انحراف استاندارد به مقدار متوسط ​​مشخصه است. به طور معمول، این مقادیر به صورت درصد بیان می شوند.

فرمول های محاسبه شاخص های تغییرات نسبی:

از فرمول های بالا مشخص می شود که هر چه ضریب بیشتر باشد V نزدیکتر به صفر باشد، تغییرات مقادیر مشخصه کمتر است. بیشتر V، علامت متغیرتر است.

در عمل آماری، اغلب از ضریب تغییرات استفاده می شود. این نه تنها برای ارزیابی مقایسه ای تنوع، بلکه برای مشخص کردن همگنی جمعیت استفاده می شود. اگر ضریب تغییرات از 33 درصد (برای توزیع های نزدیک به نرمال) تجاوز نکند، جمعیت همگن در نظر گرفته می شود. از نظر حسابی، نسبت σ و میانگین حسابی تأثیر را خنثی می کند قدر مطلقاین ویژگی ها و نسبت درصد، ضریب تغییرات را به یک کمیت بی بعد (بی نام) تبدیل می کند.

مقدار حاصل از ضریب تغییرات مطابق با درجه بندی های تقریبی درجه تنوع صفت تخمین زده می شود:

ضعیف - تا 10٪

میانگین - 10 - 20٪

قوی - بیش از 20٪

استفاده از ضریب تغییرات در مواردی که نیاز به مقایسه خصوصیاتی که از نظر اندازه و ابعاد متفاوت هستند توصیه می شود.

تفاوت بین ضریب تغییرات و سایر معیارهای پراکندگی به وضوح نشان داده شده است مثال.

میز 1

ترکیب کارگران شرکت های صنعتی

بر اساس ویژگی های آماری ارائه شده در مثال، می توانیم در مورد همگنی نسبی ترکیب سنی و سطح تحصیلات کارکنان شرکت، با توجه به ثبات حرفه ای کم گروه مورد بررسی، نتیجه گیری کنیم. به راحتی می توان دریافت که تلاش برای قضاوت در مورد این روندهای اجتماعی با انحراف معیار منجر به نتیجه گیری اشتباه می شود و تلاش برای مقایسه ویژگی های حسابداری "سابقه کار" و "سن" با شاخص حسابداری "تحصیلات" به طور کلی خواهد بود. به دلیل ناهمگونی این ویژگی ها نادرست است.

میانه و صدک

برای توزیع‌های ترتیبی (رتبه‌ای)، که معیار وسط سری، میانه است، انحراف معیار و پراکندگی نمی‌تواند به عنوان ویژگی پراکندگی نوع باشد.

همین امر در مورد سری های باز هم صادق است. این شرایط به این دلیل است که انحراف هایی که از آن واریانس و σ محاسبه می شود از میانگین حسابی اندازه گیری می شود که در سری های تغییرات باز و در سری توزیع های ویژگی های کیفی محاسبه نمی شود. بنابراین، برای توصیف فشرده توزیع ها، پارامتر پراکندگی دیگری استفاده می شود - چندک(مترادف - "درصد")، مناسب برای توصیف ویژگی های کیفی و کمی در هر شکل توزیع آنها. از این پارامتر می توان برای تبدیل ویژگی های کمی به کیفی نیز استفاده کرد. در این مورد، چنین رتبه‌بندی‌هایی بسته به اینکه یک گزینه خاص به کدام ترتیب کمیت مربوط می‌شود، اختصاص می‌یابد.

در عمل تحقیقات زیست پزشکی، از چندک های زیر بیشتر استفاده می شود:

- میانه؛

, – چارک (چهارم)، که در آن – چارک پایین، چارک بالا

کوانتیل ها ناحیه تغییرات احتمالی در یک سری تغییرات را به فواصل معینی تقسیم می کنند. میانه (چک) گزینه ای است که در وسط یک سری تغییرات قرار دارد و این سری را به دو قسمت مساوی تقسیم می کند. 0,5 و 0,5 ). یک چارک یک سری را به چهار قسمت تقسیم می کند: قسمت اول (چرک پایین) گزینه ای است که گزینه هایی را از هم جدا می کند که مقادیر عددی آن از 25٪ حداکثر ممکن تجاوز نمی کند. این سریال، چارک گزینه هایی را با مقدار عددی تا 50٪ حداکثر ممکن جدا می کند. چارک بالایی () گزینه ها را تا 75 درصد از حداکثر مقادیر ممکن جدا می کند.

در صورت توزیع نامتقارن متغیر نسبت به میانگین حسابی، میانه و چارک برای توصیف آن استفاده می شود.در این حالت از شکل زیر برای نمایش مقدار متوسط ​​استفاده می شود - مه (;). مثلا، ویژگی مورد مطالعه - "دوره ای که کودک شروع به راه رفتن مستقل کرد" - دارای توزیع نامتقارن در گروه مورد مطالعه است. در همان زمان، چارک پایین () مربوط به شروع راه رفتن - 9.5 ماه، میانه - 11 ماه، چارک بالا () - 12 ماه است. بر این اساس، مشخصه میانگین روند مشخصه مشخص شده به صورت 11 (9.5؛ 12) ماه ارائه خواهد شد.

ارزیابی اهمیت آماری نتایج تحقیق

اهمیت آماری داده ها به عنوان میزان مطابقت آنها با واقعیت نمایش داده شده درک می شود. داده های آماری معنی دار آن هایی هستند که واقعیت عینی را تحریف نمی کنند و به درستی منعکس می کنند.

ارزیابی اهمیت آماری نتایج تحقیق به معنای تعیین اینکه با چه احتمالی می توان نتایج به دست آمده از جامعه نمونه را به کل جامعه منتقل کرد. ارزیابی اهمیت آماری برای درک میزان استفاده از یک پدیده برای قضاوت درباره پدیده به عنوان یک کل و الگوهای آن ضروری است.

ارزیابی اهمیت آماری نتایج تحقیق عبارت است از:

1. خطاهای بازنمایی (خطاهای مقادیر متوسط ​​و نسبی) - متر;

2. حد اطمینان مقادیر متوسط ​​یا نسبی.

3. قابلیت اطمینان تفاوت در مقادیر متوسط ​​یا نسبی بر اساس معیار تی.

خطای استاندارد میانگین حسابییا خطای نمایندگینوسانات میانگین را مشخص می کند. لازم به ذکر است که هر چه حجم نمونه بزرگتر باشد، گسترش مقادیر متوسط ​​کمتر است. خطای استاندارد میانگین با استفاده از فرمول محاسبه می شود:

در ادبیات علمی مدرن، میانگین حسابی همراه با خطای بازنمایی نوشته می‌شود:

یا همراه با انحراف معیار:

به عنوان مثال، داده های مربوط به 1500 کلینیک شهری در کشور (جمعیت عمومی) را در نظر بگیرید. میانگین تعداد بیماران ارائه شده در این کلینیک 18150 نفر است. انتخاب تصادفی 10 درصد سایت ها (150 کلینیک) میانگین تعداد بیماران برابر 20051 نفر را به دست می دهد. خطای نمونه گیری، بدیهی است که به دلیل این واقعیت است که همه 1500 کلینیک در نمونه قرار نگرفته اند، برابر است با تفاوت بین این میانگین ها - میانگین کلی ( مژن) و میانگین نمونه ( مانتخاب شد). اگر نمونه دیگری با همان اندازه از جامعه خود تشکیل دهیم، مقدار خطای متفاوتی به دست می دهد. همه این میانگین های نمونه با نمونه های به اندازه کافی بزرگ به طور معمول در اطراف میانگین کلی با اندازه کافی بزرگ توزیع می شوند تعداد زیادیتکرار نمونه ای از همان تعداد اشیاء از یک جمعیت. خطای استاندارد میانگین متر- این گسترش اجتناب ناپذیر میانگین نمونه در اطراف میانگین کلی است.

در مواردی که نتایج تحقیق در مقادیر نسبی (مثلاً درصد) ارائه می شود - محاسبه می شود خطای استاندارد کسر:

که در آن P شاخص بر حسب درصد است، n تعداد مشاهدات است.

نتیجه به صورت نمایش داده می شود (P ± m)٪. مثلا،درصد بهبودی در بین بیماران (5/2±2/95) درصد بود.

در صورتی که تعداد عناصر جمعیت، سپس هنگام محاسبه خطاهای استاندارد میانگین و کسر در مخرج کسر، به جایباید قرار گیرد.

برای توزیع نرمال (توزیع میانگین نمونه نرمال است)، می دانیم که چه بخشی از جامعه در هر بازه ای حول میانگین قرار می گیرد. به خصوص:

در عمل، مشکل این است که ویژگی های جمعیت عمومی برای ما ناشناخته است و نمونه دقیقاً به منظور برآورد آنها ساخته شده است. به این معنی که اگر نمونه هایی با اندازه یکسان بسازیم nاز جمعیت عمومی، سپس در 68.3٪ موارد این فاصله حاوی مقدار خواهد بود م(در 95.5٪ موارد در بازه و در 99.7٪ موارد - در بازه زمانی خواهد بود).

از آنجایی که در واقع فقط یک نمونه گرفته شده است، این عبارت بر اساس احتمال فرموله می شود: با احتمال 68.3٪، میانگین مقدار ویژگی در جامعه در فاصله زمانی قرار دارد، با احتمال 95.5٪. - در فاصله زمانی و غیره

در عمل، فاصله ای حول مقدار نمونه ساخته می شود به طوری که با احتمال معین (به اندازه کافی بالا)، احتمال اطمینان -مقدار واقعی این پارامتر را در جمعیت عمومی پوشش می دهد. این فاصله نامیده می شود فاصله اطمینان.

احتمال اطمینانپ این درجه اطمینان است که فاصله اطمینان در واقع حاوی مقدار واقعی (ناشناخته) پارامتر در جامعه است.

به عنوان مثال، اگر احتمال اطمینان آر 90 درصد است، این بدان معناست که 90 نمونه از 100 نمونه، تخمین صحیح پارامتر را در جامعه ارائه می دهد. بر این اساس، احتمال خطا، یعنی. تخمین نادرست میانگین عمومی نمونه بر حسب درصد برابر است: . برای این مثالاین بدان معنی است که 10 نمونه از 100 نمونه تخمین نادرستی ارائه می دهند.

بدیهی است که درجه اطمینان (احتمال اطمینان) به اندازه فاصله بستگی دارد: هرچه این بازه بزرگتر باشد، اطمینان بیشتر می شود که یک مقدار ناشناخته برای جمعیت در آن قرار می گیرد. در عمل، حداقل دوبرابر خطای نمونه گیری برای ایجاد فاصله اطمینان برای ایجاد حداقل اطمینان 95.5 درصد استفاده می شود.

تعیین حدود اطمینان میانگین ها و مقادیر نسبی به ما امکان می دهد دو مقدار شدید آنها را پیدا کنیم - حداقل ممکن و حداکثر ممکن که در آن شاخص مورد مطالعه می تواند در کل جمعیت رخ دهد. بر این اساس، محدودیت های اطمینان (یا فاصله اطمینان)- اینها مرزهای مقادیر متوسط ​​یا نسبی هستند که فراتر از آنها به دلیل نوسانات تصادفی احتمال ناچیز وجود دارد.

فاصله اطمینان را می توان به صورت زیر بازنویسی کرد: , Where تی- معیار اطمینان

حدود اطمینان میانگین حسابی در جامعه با فرمول تعیین می شود:

م ژن = م انتخاب کنید + تی متر م

برای ارزش نسبی:

آر ژن = پ انتخاب کنید + تی متر آر

جایی که م ژنو آر ژن- مقادیر میانگین و نسبی برای جمعیت عمومی؛ م انتخاب کنیدو آر انتخاب کنید- مقادیر مقادیر متوسط ​​و نسبی به دست آمده از جامعه نمونه؛ متر مو متر پ- خطاهای مقادیر متوسط ​​و نسبی؛ تی- معیار اطمینان (معیار دقت که هنگام برنامه ریزی مطالعه تعیین می شود و می تواند برابر با 2 یا 3 باشد). تی متر- این یک فاصله اطمینان یا Δ - حداکثر خطای شاخص به دست آمده در یک مطالعه نمونه است.

لازم به ذکر است که ارزش معیار تیتا حد معینی مربوط به احتمال یک پیش‌بینی بدون خطا (p) است که در درصد بیان می‌شود. توسط خود محقق انتخاب می شود و با توجه به نیاز به دستیابی به نتیجه با درجه دقت مورد نیاز هدایت می شود. بنابراین، برای احتمال یک پیش‌بینی بدون خطا 95.5 درصد، مقدار معیار است. تی 2 است، برای 99.7٪ - 3.

تخمین فاصله اطمینان داده شده تنها برای جمعیت های آماری با بیش از 30 مشاهدات قابل قبول است. در این جداول مقدار مورد نظر در محل تقاطع خط مربوط به اندازه جمعیت قرار دارد (n-1)و ستونی مربوط به سطح احتمال یک پیش‌بینی بدون خطا (95.5%؛ 99.7%) انتخاب شده توسط محقق. در تحقیقات پزشکی، هنگام ایجاد محدودیت های اطمینان برای هر شاخص، احتمال یک پیش بینی بدون خطا 95.5٪ یا بیشتر است. این بدان معناست که مقدار شاخص به دست آمده از جامعه نمونه باید حداقل در 95.5 درصد موارد در جامعه عمومی یافت شود.

    سوالات در مورد موضوع درس:

    ارتباط شاخص های تنوع صفات در یک جامعه آماری.

    ویژگی های کلی شاخص های تغییرات مطلق.

    انحراف استاندارد، محاسبه، کاربرد.

    معیارهای نسبی تنوع

    میانه، امتیاز چارک.

    ارزیابی اهمیت آماری نتایج مطالعه.

    خطای استاندارد میانگین حسابی، فرمول محاسبه، مثال استفاده.

    محاسبه نسبت و خطای استاندارد آن.

    مفهوم احتمال اطمینان، نمونه ای از استفاده.

10. مفهوم فاصله اطمینان، کاربرد آن.

    تست تکالیف موضوع با پاسخ های استاندارد:

1. شاخص های مطلق تغییرات مراجعه کنید

1) ضریب تغییرات

2) ضریب نوسان

4) میانه

2. شاخص های نسبی تغییرات مربوط

1) پراکندگی

4) ضریب تغییرات

3. معیاری که با مقادیر شدید یک گزینه در یک سری تغییرات تعیین می شود

2) دامنه

3) پراکندگی

4) ضریب تغییرات

4. تفاوت گزینه های EXTREME است

2) دامنه

3) انحراف معیار

4) ضریب تغییرات

5. میانگین مجذور انحراف ارزشهای فردی یک مشخصه از مقادیر متوسط ​​آن است.

1) ضریب نوسان

2) میانه

3) پراکندگی

6. نسبت مقیاس تغییرات به مقدار متوسط ​​یک کاراکتر است

1) ضریب تغییرات

2) انحراف معیار

4) ضریب نوسان

7. نسبت میانگین انحراف مربع به مقدار متوسط ​​یک مشخصه است

1) پراکندگی

2) ضریب تغییرات

3) ضریب نوسان

4) دامنه

8. گزینه ای که در وسط سری تغییرات قرار دارد و آن را به دو قسمت مساوی تقسیم می کند

1) میانه

3) دامنه

9. در تحقیقات پزشکی، هنگام ایجاد محدودیت های اطمینان برای هر شاخص، احتمال یک پیش بینی بدون خطا پذیرفته می شود.

10. اگر 90 نمونه از 100 نمونه، تخمین صحیح یک پارامتر را در جمعیت بدهد، به این معنی است که احتمال اطمینان پبرابر

11. اگر 10 نمونه از 100 نمونه، تخمین نادرستی بدهد، احتمال خطا برابر است.

12. محدودیت‌های مقادیر متوسط ​​یا نسبی، فراتر از آن‌ها که به دلیل نوسانات تصادفی احتمال حل‌ناپذیری دارد - این

1) فاصله اطمینان

2) دامنه

4) ضریب تغییرات

13. یک نمونه کوچک در نظر گرفته می شود که جمعیتی در آن

1) n کمتر یا مساوی 100 است

2) n کمتر یا مساوی 30 است

3) n کمتر یا مساوی 40 است

4) n نزدیک به 0 است

14. برای احتمال یک پیش بینی بدون خطا 95% ارزش معیار تیاست

15. برای احتمال یک پیش بینی بدون خطا 99% ارزش معیار تیاست

16. برای توزیع‌های نزدیک به نرمال، اگر ضریب تغییرات از آن تجاوز نکند، جمعیت همگن در نظر گرفته می‌شود.

17. گزینه، گزینه های جداکننده، مقادیر عددی که از 25٪ حداکثر ممکن در یک سری داده تجاوز نمی کند - این است

2) چارک پایین

3) چارک بالایی

4) چارک

18. داده هایی که واقعیت عینی را تحریف نمی کنند و به درستی منعکس می کنند، نامیده می شود.

1) غیر ممکن

2) به همان اندازه ممکن است

3) قابل اعتماد

4) تصادفی

19. با توجه به قانون "سه سیگما"، با توزیع عادی یک ویژگی در داخل
واقع خواهد شد

1) گزینه 68.3٪

انحراف معیار یک شاخص کلاسیک از تغییرپذیری از آمار توصیفی است.

انحراف معیار, انحراف معیارانحراف استاندارد، انحراف استاندارد نمونه (eng. standard deviation, STD, STDev) یک شاخص بسیار رایج پراکندگی در آمار توصیفی است. اما، چون تجزیه و تحلیل تکنیکال شبیه به آمار است. با نماد یونانی Sigma "σ" مشخص می شود.

با تشکر از کارل گاوس و پیرسون که به ما اجازه استفاده از انحراف معیار را دادند.

استفاده كردن انحراف معیار در تحلیل تکنیکال، ما این را می چرخانیم "شاخص پراکندگی""V "شاخص نوسانات"، حفظ معنی، اما تغییر اصطلاحات.

انحراف معیار چیست؟

اما علاوه بر محاسبات کمکی میانی، انحراف استاندارد برای محاسبه مستقل کاملاً قابل قبول استو کاربردها در تحلیل تکنیکال همانطور که یک خواننده فعال مجله ما اشاره کرد، " من هنوز متوجه نشدم که چرا انحراف معیار در مجموعه شاخص های استاندارد مراکز معاملات داخلی گنجانده نشده است.«.

واقعا، انحراف معیار می تواند تغییرپذیری یک ابزار را به روشی کلاسیک و "خالص" اندازه گیری کند. اما متاسفانه این شاخص در تحلیل اوراق بهادار چندان رایج نیست.

اعمال انحراف معیار

محاسبه دستی انحراف معیار چندان جالب نیست، اما برای تجربه مفید است. انحراف معیار را می توان بیان کردفرمول STD=√[(∑(x-x) 2)/n]، که مانند ریشه مجموع اختلافات مجذور بین عناصر نمونه و میانگین، تقسیم بر تعداد عناصر نمونه به نظر می رسد.

اگر تعداد عناصر نمونه از 30 بیشتر شود، مخرج کسر زیر ریشه مقدار n-1 را می گیرد. در غیر این صورت n استفاده می شود.

گام به گام محاسبه انحراف استاندارد:

  1. میانگین حسابی نمونه داده را محاسبه کنید
  2. این میانگین را از هر عنصر نمونه کم کنید
  3. تمام تفاوت های حاصل را مربع می کنیم
  4. تمام مربع های حاصل را جمع کنید
  5. مقدار حاصل را بر تعداد عناصر موجود در نمونه تقسیم کنید (یا بر n-1، اگر n>30 باشد)
  6. جذر ضریب حاصل را محاسبه کنید (نامیده می شود پراکندگی)

به عنوان یک مشخصه تعمیم دهنده اندازه تنوع یک صفت در کل تعریف می شود. برابر است با جذر میانگین انحراف مربع مقادیر فردی ویژگی از میانگین حسابی، یعنی. ریشه و را می توان به این صورت یافت:

1. برای ردیف اصلی:

2. برای سری تغییرات:

تبدیل فرمول انحراف استاندارد آن را به شکلی راحت‌تر برای محاسبات عملی می‌آورد:

انحراف معیارتعیین می کند که به طور متوسط ​​​​گزینه های خاص چقدر از مقدار میانگین خود انحراف دارند و همچنین معیار مطلق تغییرپذیری یک مشخصه است و در واحدهای مشابه گزینه ها بیان می شود و بنابراین به خوبی تفسیر می شود.

نمونه هایی برای یافتن انحراف معیار: ,

برای ویژگی های جایگزین، فرمول میانگین انحراف مربعبه نظر می رسد که:

که در آن p نسبت واحدهایی در جمعیت است که ویژگی خاصی دارند.

q نسبت واحدهایی است که این ویژگی را ندارند.

مفهوم انحراف خطی متوسط

میانگین انحراف خطیبه عنوان میانگین حسابی مقادیر مطلق انحراف گزینه های فردی از .

1. برای ردیف اصلی:

2. برای سری تغییرات:

که در آن مجموع n است مجموع فرکانس های سری تغییرات.

مثالی برای یافتن میانگین انحراف خطی:

مزیت میانگین انحراف مطلق به عنوان معیاری از پراکندگی در دامنه تغییرات آشکار است، زیرا این اندازه گیری بر اساس در نظر گرفتن تمام انحرافات ممکن است. اما این شاخص دارای اشکالات قابل توجهی است. رد خودسرانه علائم جبری انحراف می تواند به این واقعیت منجر شود که ویژگی های ریاضی این شاخص از ابتدایی دور است. این امر استفاده از میانگین انحراف مطلق را هنگام حل مسائل مربوط به محاسبات احتمالی بسیار دشوار می کند.

بنابراین، میانگین انحراف خطی به عنوان معیاری برای تغییر یک مشخصه به ندرت در عمل آماری استفاده می شود، یعنی زمانی که جمع بندی شاخص ها بدون در نظر گرفتن علائم، منطقی اقتصادی است. با کمک آن، به عنوان مثال، گردش مالی تجزیه و تحلیل می شود تجارت خارجی، ترکیب کارگران، ریتم تولید و غیره.

مربع متوسط

میانگین مربع اعمال شدبه عنوان مثال برای محاسبه اندازه متوسط ​​اضلاع n مقطع مربع، قطر متوسط ​​تنه، لوله و ... به دو نوع تقسیم می شود.

مربع متوسط ​​ساده اگر، هنگام جایگزینی مقادیر فردی یک مشخصه با مقدار متوسطاگر لازم باشد مجموع مجذورهای مقادیر اصلی ثابت بماند، میانگین یک مقدار میانگین درجه دوم خواهد بود.

این جذر ضریب تقسیم مجموع مربعات مقادیر مشخصه های فردی بر تعداد آنها است:

میانگین وزنی مربع با استفاده از فرمول محاسبه می شود:

که در آن f علامت وزن است.

مکعب متوسط

میانگین مکعب اعمال می شودبه عنوان مثال، هنگام تعیین طول متوسط ​​یک ضلع و مکعب ها. به دو نوع تقسیم می شود.
متوسط ​​مکعب ساده:

هنگام محاسبه مقادیر متوسط ​​و پراکندگی در سری های توزیع بازه ای، مقادیر واقعی ویژگی با مقادیر مرکزی فواصل جایگزین می شود که با میانگین متفاوت است. مقادیر حسابیدر فاصله گنجانده شده است. این منجر به یک خطای سیستماتیک هنگام محاسبه واریانس می شود. V.F. شپرد این را تعیین کرد خطا در محاسبه واریانس، ناشی از استفاده از داده های گروه بندی شده، 1/12 مجذور مقدار بازه، هم در جهت افزایش و هم در جهت کاهش بزرگی پراکندگی است.

اصلاحیه شپرداگر توزیع نزدیک به نرمال باشد، به یک مشخصه با ماهیت تغییرات پیوسته مربوط باشد و بر اساس مقدار قابل توجهی از داده های اولیه باشد (n>500) باید استفاده شود. اما با توجه به اینکه در برخی موارد هر دو خطا که در جهت های مختلف عمل می کنند، یکدیگر را جبران می کنند، گاهی می توان از اصلاحات خودداری کرد.

هرچه واریانس و انحراف معیار کمتر باشد، جامعه همگن تر و میانگین معمول تر خواهد بود.
در عمل آمار، اغلب نیاز به مقایسه تغییرات ویژگی های مختلف وجود دارد. به عنوان مثال، مقایسه تغییرات در سن کارگران و صلاحیت، طول خدمت و اندازه آنها بسیار جالب است. دستمزد، هزینه و سود، طول خدمت و بهره وری نیروی کار و غیره. برای چنین مقایسه‌هایی، شاخص‌های تغییر مطلق ویژگی‌ها نامناسب هستند: مقایسه متغیر تجربه کاری، بیان شده در سال، با تغییر دستمزد، بیان شده در روبل، غیرممکن است.

برای انجام چنین مقایسه‌هایی و همچنین مقایسه تغییرپذیری یک مشخصه در چندین جمعیت با میانگین‌های حسابی مختلف، از یک شاخص نسبی تنوع - ضریب تغییرات استفاده می‌شود.

میانگین های ساختاری

برای مشخص کردن گرایش مرکزی در توزیع‌های آماری، اغلب منطقی است که همراه با میانگین حسابی، از مقدار مشخصی از مشخصه X استفاده کنیم، که به دلیل ویژگی‌های خاصی از موقعیت آن در سری توزیع، می‌تواند سطح آن را مشخص کند.

این امر به ویژه زمانی مهم است که در یک سری توزیع، مقادیر شدید یک مشخصه دارای مرزهای نامشخص باشند. با توجه به این تعریف دقیقمیانگین حسابی معمولاً غیرممکن یا بسیار دشوار است. در چنین مواردی، سطح متوسط ​​را می توان با در نظر گرفتن مقدار مشخصه ای که در وسط سری فرکانس قرار دارد یا اغلب در سری فعلی رخ می دهد، تعیین کرد.

چنین مقادیری فقط به ماهیت فرکانس ها، یعنی به ساختار توزیع بستگی دارد. آنها در مکان در یک سری فرکانس معمولی هستند، بنابراین چنین مقادیری به عنوان ویژگی های مرکز توزیع در نظر گرفته می شوند و بنابراین تعریف میانگین های ساختاری را دریافت می کنند. از آنها برای مطالعه استفاده می شود ساختار داخلیو ساختار سری توزیع مقادیر ویژگی. چنین شاخص هایی شامل.



 


خواندن:



کیک پنیر از پنیر در یک ماهیتابه - دستور العمل های کلاسیک برای کیک پنیر کرکی کیک پنیر از 500 گرم پنیر دلمه

کیک پنیر از پنیر در یک ماهیتابه - دستور العمل های کلاسیک برای کیک پنیر کرکی کیک پنیر از 500 گرم پنیر دلمه

مواد لازم: (4 وعده) 500 گرم. پنیر دلمه 1/2 پیمانه آرد 1 تخم مرغ 3 قاشق غذاخوری. ل شکر 50 گرم کشمش (اختیاری) کمی نمک جوش شیرین...

سالاد مروارید سیاه با آلو سالاد مروارید سیاه با آلو

سالاد

روز بخیر برای همه کسانی که برای تنوع در رژیم غذایی روزانه خود تلاش می کنند. اگر از غذاهای یکنواخت خسته شده اید و می خواهید لذت ببرید...

دستور العمل لچو با رب گوجه فرنگی

دستور العمل لچو با رب گوجه فرنگی

لچوی بسیار خوشمزه با رب گوجه فرنگی مانند لچوی بلغاری که برای زمستان تهیه می شود. اینگونه است که ما 1 کیسه فلفل را در خانواده خود پردازش می کنیم (و می خوریم!). و من چه کسی ...

کلمات قصار و نقل قول در مورد خودکشی

کلمات قصار و نقل قول در مورد خودکشی

در اینجا نقل قول ها، کلمات قصار و سخنان شوخ در مورد خودکشی وجود دارد. این یک انتخاب نسبتاً جالب و خارق العاده از "مرواریدهای واقعی ...

فید-تصویر RSS