خانه - تاریخچه تعمیرات
تعیین میانگین انحراف مربع. انحراف معیار

درس شماره 4

موضوع: «آمار توصیفی. شاخص های تنوع صفت در مجموع "

معیارهای اصلی تنوع یک صفت در جامعه آماری عبارتند از: حد، دامنه، میانگین. انحراف معیار، ضریب نوسان و ضریب تغییرات. در درس قبلی بحث شد که مقادیر متوسط ​​فقط یک ویژگی تعمیم‌دهنده صفت مورد مطالعه را در مجموع می‌دهد و مقادیر انواع مختلف آن را در نظر نمی‌گیرد: مقادیر حداقل و حداکثر، بالاتر از میانگین، زیر میانگین و غیره

مثال. مقادیر متوسط ​​دو دنباله اعداد مختلف: -100. -بیست؛ 100; 20 و 0.1; -0.2; 0.1 کاملاً یکسان و برابر هستندO.با این حال، محدوده پراکندگی این توالی از میانگین نسبی بسیار متفاوت است.

تعریف معیارهای فهرست شده برای تنوع یک ویژگی در درجه اول با در نظر گرفتن ارزش آن برای عناصر فردی جامعه آماری انجام می شود.

شاخص هایی برای اندازه گیری تنوع یک صفت هستند مطلقو نسبت فامیلی... شاخص های مطلق تغییرات عبارتند از: محدوده تغییرات، حد، انحراف معیار، واریانس. ضریب تغییرات و ضریب نوسان به معیارهای نسبی تغییرات اشاره دارد.

حد (حداکثر) -این معیاری است که با مقادیر شدید متغیر در سری تغییرات تعیین می شود. به عبارت دیگر، این معیار به حداقل و حداکثر مقادیر ویژگی محدود می شود:

دامنه (Am)یا محدوده تنوع -این تفاوت بین گزینه های افراطی است. محاسبه این معیار با کم کردن حداقل مقدار آن از حداکثر مقدار مشخصه انجام می شود که به ما امکان می دهد درجه تغییر گزینه را ارزیابی کنیم:

نقطه ضعف حد و دامنه به عنوان معیار تغییرپذیری این است که کاملاً به مقادیر شدید صفت در سری تغییرات بستگی دارند. در این مورد، نوسانات مقادیر یک مشخصه در یک سری در نظر گرفته نمی شود.

کاملترین مشخصه تنوع یک صفت در یک جامعه آماری توسط انحراف معیار(سیگما) که معیار کلی انحراف یک نوع از میانگین آن است. انحراف معیار اغلب به عنوان نامیده می شود انحراف معیار.

انحراف معیار بر اساس مقایسه هر گزینه با میانگین حسابی جامعه داده شده است. از آنجایی که در مجموع همیشه گزینه های کمتر و بیشتر از آن وجود خواهد داشت، مجموع انحرافاتی که دارای علامت "" هستند، با مجموع انحرافاتی که دارای علامت "" هستند، بازپرداخت می شود. مجموع همه انحرافات صفر است. برای جلوگیری از تأثیر علائم تفاوت ها، انحرافات از مجذور میانگین حسابی، یعنی. ... مجموع مجذورات انحرافات صفر نیست. برای بدست آوردن ضریبی که می تواند تغییرپذیری را اندازه گیری کند، میانگین مجموع مربع ها را بگیرید - این مقدار نامیده می شود واریانس:

از نظر معنا، واریانس میانگین مربعات انحراف مقادیر فردی یک ویژگی از میانگین آن است. پراکندگی مربع انحراف معیار

واریانس یک بعد (نامگذاری شده) است. بنابراین، اگر انواع سری اعداد بر حسب متر بیان شوند، واریانس به متر مربع می دهد. اگر گزینه ها بر حسب کیلوگرم بیان شوند، واریانس مربع این اندازه (کیلوگرم 2) و غیره را نشان می دهد.

انحراف معیار- جذر واریانس:

، سپس هنگام محاسبه واریانس و انحراف معیار در مخرج کسر به جایقرار دادن ضروری است.

محاسبه انحراف استاندارد را می توان به شش مرحله تقسیم کرد که باید در یک دنباله خاص انجام شود:

کاربرد انحراف معیار:

الف) برای قضاوت در مورد متغیر بودن سری تغییرات و ارزیابی مقایسه ای از معمول بودن (نمایندگی) مقادیر میانگین حسابی. این در تشخیص افتراقی هنگام تعیین پایداری علائم ضروری است.

ب) برای بازسازی سری تغییرات، یعنی. بازیابی پاسخ فرکانسی آن بر اساس قوانین سه سیگما. در فاصله (M ± 3σ) 99.7٪ از تمام انواع سری، در فاصله زمانی (M ± 2σ) - 95.5٪ و در بازه (M ± 1σ) - 68.3٪ نوع ردیف(عکس. 1).

ج) برای شناسایی گزینه "پاپ آپ".

د) برای تعیین پارامترهای هنجار و آسیب شناسی با استفاده از تخمین سیگما

ه) برای محاسبه ضریب تغییرات

و) برای محاسبه میانگین خطای میانگین حسابی.

برای توصیف هر جمعیت عمومی که داردنوع توزیع نرمال کافی است دو پارامتر را بدانیم: میانگین حسابی و انحراف معیار.

شکل 1. قانون سه سیگما

مثال.

در اطفال، انحراف معیار برای ارزیابی رشد فیزیکی کودکان با مقایسه داده های یک کودک خاص با شاخص های استاندارد مربوطه استفاده می شود. میانگین حسابی شاخص های رشد فیزیکی کودکان سالم به عنوان استاندارد در نظر گرفته می شود. مقایسه شاخص ها با استانداردها طبق جداول خاصی انجام می شود که در آن استانداردها همراه با مقیاس سیگما مربوطه آنها آورده شده است. در نظر گرفته می شود که اگر شاخص رشد جسمانی کودک در حد استاندارد (میانگین حسابی) ± σ باشد، پس رشد فیزیکیکودک (طبق این شاخص) با هنجار مطابقت دارد. اگر نشانگر در استاندارد ± 2σ باشد، انحراف جزئی از هنجار وجود دارد. اگر شاخص فراتر از این مرزها باشد، رشد فیزیکی کودک به شدت با هنجار متفاوت است (آسیب شناسی ممکن است).

علاوه بر شاخص های تغییرات، بیان شده در مقادیر مطلق، مطالعه آماری از شاخص های تغییرات، بیان شده در مقادیر نسبی استفاده می کند. ضریب نوسان -نسبت دامنه تغییرات به مقدار متوسط ​​صفت است. ضریب تغییرات -نسبت انحراف معیار به میانگینامضا کردن. به طور معمول، این مقادیر به صورت درصد بیان می شوند.

فرمول های محاسبه شاخص های نسبی تغییرات:

از فرمول های بالا می توان دریافت که هر چه ضریب بزرگتر باشد V نزدیک به صفر، تغییرات در مقادیر ویژگی کمتر است. بیشتر V، علامت تغییر پذیرتر است.

در عمل آماری، اغلب از ضریب تغییرات استفاده می شود. این نه تنها برای ارزیابی مقایسه ای تنوع، بلکه برای مشخص کردن همگنی جمعیت استفاده می شود. اگر ضریب تغییرات از 33 درصد (برای توزیع های نزدیک به نرمال) تجاوز نکند، جمعیت همگن در نظر گرفته می شود. از نظر حسابی، نسبت σ و میانگین حسابی تأثیر را از بین می برد قدر مطلقاز این ویژگی ها، و درصد باعث می شود ضریب تغییرات یک مقدار بی بعد (بی نام) باشد.

مقدار به دست آمده از ضریب تغییرات مطابق با درجه بندی های تقریبی درجه تنوع صفت تخمین زده می شود:

ضعیف - تا 10٪

میانگین - 10 - 20٪

قوی - بیش از 20٪

استفاده از ضریب تغییرات در مواردی که نیاز به مقایسه ویژگی های متفاوت در اندازه و ابعاد باشد، توصیه می شود.

تفاوت بین ضریب تغییرات و سایر معیارهای پراکندگی به وضوح نشان می دهد مثال.

میز 1

ترکیب کارگران در یک شرکت صنعتی

بر اساس ویژگی های آماری ارائه شده در مثال، می توان نتیجه گرفت که ترکیب سنی و سطح تحصیلات کارکنان شرکت نسبتاً همگن با ثبات حرفه ای پایین گروه مورد بررسی است. به راحتی می توان دریافت که تلاش برای قضاوت درباره این گرایشات اجتماعی با انحراف معیار منجر به نتیجه گیری اشتباه می شود و تلاش برای مقایسه اعتبارنامه "سابقه کاری" و "سن" با ویژگی حسابداری "تحصیلات" به طور کلی نادرست است. به دلیل ناهمگونی این ویژگی ها.

میانه و صدک

برای توزیع‌های ترتیبی (رتبه‌ای)، که معیار وسط سری، میانه است، انحراف معیار و واریانس نمی‌تواند به عنوان ویژگی‌های نوع پراکندگی باشد.

همین امر در مورد سری های باز هم صادق است. این شرایط به این دلیل است که انحراف هایی که واریانس و σ محاسبه می شود از میانگین حسابی محاسبه می شود که در سری های متغیر باز و در سری توزیع های ویژگی های کیفی محاسبه نمی شود. بنابراین، برای توصیف مختصر توزیع ها، یکی دیگر از پارامترهای پراکندگی استفاده می شود - چندک(مترادف - "nercentile")، مناسب برای توصیف ویژگی های کیفی و کمی در هر شکل توزیع آنها. این پارامتر همچنین می تواند برای تبدیل ویژگی های کمی به ویژگی های کیفی استفاده شود. در این مورد، چنین تخمین‌هایی بسته به اینکه کدام مرتبه چندک با یک گزینه خاص مطابقت دارد، اختصاص داده می‌شوند.

در عمل تحقیقات زیست پزشکی، از چندک های زیر بیشتر استفاده می شود:

آیا میانه است؛

, - ربع ها (چهارک ها) ، چارک پایین کجاست چارک بالایی

چندک ها مساحت تغییرات احتمالی یک نوع را در یک سری تغییرات به فواصل معینی تقسیم می کنند. میانه (چک) متغیری است که در وسط سری تغییرات قرار دارد و این سری را به دو قسمت مساوی تقسیم می کند. 0,5 و 0,5 ). چارک مجموعه را به چهار قسمت تقسیم می کند: قسمت اول (چرک پایین) گزینه هایی است که گزینه ها را از هم جدا می کند که مقادیر عددی آنها از 25٪ حداکثر ممکن در آن تجاوز نمی کند. این سریال، چارک گزینه ها را با مقدار عددی تا 50% حداکثر ممکن جدا می کند. چارک بالایی () گزینه ها را تا 75 درصد از حداکثر مقادیر ممکن جدا می کند.

در مورد توزیع نامتقارن یک متغیر نسبت به میانگین حسابی، میانه و چارک برای توصیف آن استفاده می شود.در این حالت از شکل زیر برای نمایش مقدار متوسط ​​استفاده می شود - من (;). مثلا، علامت مورد مطالعه - "دوره ای که کودک شروع به راه رفتن مستقل کرد" - در گروه مطالعه دارای توزیع نامتقارن است. در همان زمان، چارک پایین () مربوط به شروع راه رفتن - 9.5 ماه، میانه - 11 ماه، و چارک بالایی () - 12 ماه است. بر این اساس، مشخصه روند میانگین علامت نشان داده شده به صورت 11 (9.5؛ 12) ماه ارائه می شود.

ارزیابی اهمیت آماری نتایج تحقیق

اهمیت آماری داده ها به عنوان میزان مطابقت آنها با واقعیت نمایش داده شده درک می شود. داده های آماری معنی دار آن هایی هستند که واقعیت عینی را تحریف نمی کنند و به درستی منعکس می کنند.

برای ارزیابی اهمیت آماری نتایج تحقیق به معنای تعیین اینکه با چه احتمالی می توان نتایج به دست آمده از جامعه نمونه را به کل جامعه عمومی منتقل کرد. ارزیابی اهمیت آماری برای درک اینکه چه مقدار از پدیده را می توان بر روی پدیده به عنوان یک کل و الگوهای آن قضاوت کرد، ضروری است.

ارزیابی اهمیت آماری نتایج تحقیق عبارت است از:

1. خطاهای بازنمایی (خطاهای مقادیر میانگین و نسبی) - متر;

2. حد اطمینان مقادیر متوسط ​​یا نسبی.

3. پایایی تفاوت بین مقادیر میانگین یا نسبی بر اساس معیار تی.

خطای استاندارد میانگین حسابییا خطای نمایندگینوسانات میانگین را مشخص می کند. لازم به ذکر است که هر چه حجم نمونه بزرگتر باشد، گسترش مقادیر میانگین کمتر است. خطای استاندارد میانگین با فرمول محاسبه می شود:

در ادبیات علمی مدرن، میانگین حسابی همراه با خطای بازنمایی نوشته می شود:

یا همراه با انحراف استاندارد:

به عنوان مثال، داده های 1500 پلی کلینیک شهری در کشور (جمعیت عمومی) را در نظر بگیرید. میانگین تعداد بیمارانی که در یک پلی کلینیک خدمات ارائه می دهند 18150 نفر است. انتخاب تصادفی 10 درصد از اشیا (150 پلی کلینیک) میانگین تعداد بیماران برابر با 20051 نفر را نشان می دهد. خطای نمونه گیری، بدیهی است که مربوط به این واقعیت است که همه 1500 پلی کلینیک در نمونه گنجانده نشده اند، برابر است با تفاوت بین این میانگین ها - میانگین کلی ( مژن) و میانگین نمونه ( مانتخاب کنید). اگر نمونه دیگری با همان اندازه از جمعیت عمومی خود تشکیل دهیم، مقدار متفاوتی خطا خواهد داد. همه این میانگین های نمونه برای نمونه های به اندازه کافی بزرگ به طور معمول در اطراف میانگین عمومی برای نمونه های به اندازه کافی بزرگ توزیع می شوند. تعداد زیادیتکرار نمونه برداری از همان تعداد اشیاء از جمعیت عمومی. خطای استاندارد میانگین مترپراکندگی اجتناب ناپذیر میانگین نمونه در اطراف میانگین عمومی است.

در صورتی که نتایج تحقیق در مقادیر نسبی (به عنوان مثال، درصد) ارائه شود - محاسبه می شود خطای استاندارد را به اشتراک بگذارید:

که در آن P شاخص بر حسب درصد است، n تعداد مشاهدات است.

نتیجه به صورت نمایش داده می شود (P ± m)٪. مثلا،درصد بهبودی در بین بیماران (5/2 ± 2/95) درصد بود.

در صورتی که تعداد عناصر در جمعیت، سپس هنگام محاسبه خطاهای استاندارد میانگین و کسر در مخرج کسر به جایقرار دادن ضروری است.

برای توزیع نرمال (توزیع میانگین نمونه نرمال است)، مشخص است که چه مقدار از جامعه در هر بازه ای حول میانگین قرار می گیرد. به خصوص:

در عمل، مشکل این است که ما ویژگی های جمعیت عمومی را نمی دانیم و نمونه دقیقاً به منظور ارزیابی آنها انجام می شود. این بدان معناست که اگر نمونه هایی با اندازه یکسان بسازیم nاز جمعیت عمومی، سپس در 68.3٪ موارد این فاصله حاوی مقدار خواهد بود م(در 95.5 درصد موارد در فاصله زمانی و در 99.7 درصد موارد در فاصله زمانی خواهد بود).

از آنجایی که در واقع فقط یک نمونه ساخته شده است، این عبارت بر حسب احتمال فرمول بندی می شود: با احتمال 68.3٪، میانگین مقدار یک ویژگی در جامعه عمومی در یک بازه محصور شده است، با احتمال 95.5٪. - در فاصله زمانی و غیره

در عمل، یک فاصله حول مقدار نمونه ساخته می شود که با احتمال معین (به اندازه کافی بالا) - سطح اطمینان -آیا مقدار واقعی این پارامتر در جمعیت عمومی را "پوشانده" می کند. این فاصله نامیده می شود فاصله اطمینان.

احتمال اطمینانپ این درجه اطمینان است که فاصله اطمینان در واقع حاوی مقدار واقعی (ناشناخته) پارامتر در جمعیت عمومی است.

به عنوان مثال، اگر سطح اطمینان آرمعادل 90% است، این بدان معناست که 90 نمونه از 100 نمونه تخمین صحیح پارامتر را در جمعیت عمومی ارائه می دهد. بر این اساس، احتمال خطا، یعنی. برآورد نادرست میانگین عمومی برای نمونه بر حسب درصد برابر است با:. برای این مثال، این بدان معناست که 10 نمونه از 100 نمونه، تخمین نادرستی ارائه می دهند.

بدیهی است که درجه اطمینان (سطح اطمینان) به اندازه فاصله بستگی دارد: هرچه این فاصله بیشتر باشد، اطمینان بیشتری وجود دارد که یک مقدار ناشناخته برای جمعیت عمومی در آن قرار می گیرد. در عمل، برای ایجاد فاصله اطمینان، حداقل دو برابر خطای نمونه گیری برای اطمینان از اطمینان حداقل 95.5٪ گرفته می شود.

تعیین حد اطمینان مقادیر متوسط ​​و نسبی به شما امکان می دهد دو مقدار شدید آنها را پیدا کنید - حداقل ممکن و حداکثر ممکن که در آن شاخص مورد مطالعه را می توان در کل جمعیت عمومی یافت. بر این اساس، محدودیت های اطمینان (یا فاصله اطمینان)- اینها مرزهای مقادیر متوسط ​​یا نسبی هستند که فراتر از آن به دلیل نوسانات تصادفی احتمال ناچیزی دارد.

فاصله اطمینان را می توان به صورت:، Where بازنویسی کرد تی- معیار اطمینان

حدود اطمینان میانگین حسابی در جامعه عمومی با فرمول تعیین می شود:

م ژن = م انتخاب کنید + تی متر م

برای مقدار نسبی:

آر ژن = پ انتخاب کنید + تی متر آر

جایی که م ژنو آر ژن- مقادیر میانگین و نسبی برای جمعیت عمومی؛ م انتخاب کنیدو آر انتخاب کنید- مقادیر میانگین و مقادیر نسبی به دست آمده در جامعه نمونه؛ متر مو متر پ- خطاهای مقادیر متوسط ​​و نسبی؛ تی- معیار اطمینان (معیار دقت که هنگام برنامه ریزی مطالعه تعیین می شود و می تواند برابر با 2 یا 3 باشد). تی مترفاصله اطمینان یا Δ خطای حاشیه ای شاخص به دست آمده در مطالعه نمونه است.

لازم به ذکر است که ارزش معیار تیتا حد معینی مربوط به احتمال یک پیش‌بینی بدون خطا (p) است که بر حسب درصد بیان می‌شود. توسط خود محقق انتخاب می شود و با توجه به نیاز به دستیابی به نتیجه با درجه دقت مورد نیاز هدایت می شود. بنابراین، برای احتمال یک پیش‌بینی بدون خطا 95.5 درصد، مقدار معیار تی 2 است، برای 99.7٪ - 3.

تخمین های داده شده از فاصله اطمینان فقط برای جمعیت های آماری با بیش از 30 مشاهده قابل قبول است و با اندازه جمعیت کوچکتر (نمونه های کوچک) از جداول ویژه برای تعیین معیار t استفاده می شود. در این جداول مقدار مورد نظر در محل تقاطع خط مربوط به اندازه جمعیت است (n-1)و ستونی مطابق با سطح احتمال یک پیش‌بینی اشتباه (95.5%؛ 99.7%) انتخاب شده توسط محقق. در تحقیقات پزشکی، هنگام تعیین حدود اطمینان برای هر شاخص، احتمال یک پیش‌بینی بدون خطا 95.5 درصد یا بیشتر پذیرفته می‌شود. این بدان معناست که مقدار شاخص به دست آمده بر روی جامعه نمونه را باید حداقل در 95.5 درصد موارد در جامعه عمومی یافت.

    سوالات در مورد موضوع درس:

    ارتباط شاخص های تنوع یک ویژگی در جامعه آماری.

    ویژگی های کلی شاخص های مطلق تغییرات.

    انحراف استاندارد، محاسبه، کاربرد.

    شاخص های نسبی تنوع

    برآورد میانه، چارک.

    ارزیابی اهمیت آماری نتایج تحقیق.

    خطای استاندارد میانگین حسابی، فرمول محاسبه، مثال استفاده.

    محاسبه نسبت و خطای استاندارد آن.

    مفهوم سطح اعتماد، مثال استفاده.

10. مفهوم فاصله اطمینان، کاربرد آن.

    تکالیف تستی در مورد موضوع با نمونه پاسخ:

1. شاخص های مطلق تغییرات مربوط به

1) ضریب تغییرات

2) ضریب نوسان

4) میانه

2. شاخص های نسبی تغییرات مربوط به

1) واریانس

4) ضریب تغییرات

3. معیاری که با مقادیر افراطی یک متغیر در یک دامنه تغییرات تعیین می شود

2) دامنه

3) واریانس

4) ضریب تغییرات

4. تفاوت گزینه های EXTREME است

2) دامنه

3) متوسط انحراف معیار

4) ضریب تغییرات

5. میانگین مجذور انحراف ارزش های فردی شخصیت از مقادیر متوسط ​​آن است.

1) ضریب نوسان

2) میانه

3) واریانس

6. ارتباط سرعت تغییر با مقدار متوسط ​​سیگنال

1) ضریب تغییرات

2) انحراف معیار

4) ضریب نوسان

7. نسبت میانگین انحراف مربع به میانگین مقدار مشخصه است

1) واریانس

2) ضریب تغییرات

3) ضریب نوسان

4) دامنه

8. گزینه ای که در وسط دامنه تغییرات قرار دارد و آن را به دو قسمت مساوی تقسیم می کند - این است

1) میانه

3) دامنه

9. در تحقیقات پزشکی، هنگام تعیین مرزهای محرمانه هر شاخص، احتمال یک پیش بینی بدون خطا پذیرفته می شود.

10. اگر 90 نمونه از 100 نمونه، تخمین صحیح پارامتر را در کل کلی ارائه دهد، این به این معنی است که یک اطمینان پبرابر

11. در صورتی که 10 نمونه از 100 نمونه، تخمین نادرستی بدهد، احتمال خطا برابر است.

12. مرزهای مقادیر متوسط ​​یا نسبی، خارج از آن که به دلیل ارتعاشات تصادفی دارای احتمال ناچیز است.

1) فاصله اطمینان

2) دامنه

4) ضریب تغییرات

13. نمونه کوچک آن مجموعه است که در آن است

1) n کمتر یا مساوی 100 است

2) n کمتر یا مساوی 30 است

3) n کمتر یا مساوی 40 است

4) n نزدیک به 0 است

14. برای 95% احتمال ارزش معیار پیش بینی بدون خطا تیباعث می شود

15. برای 99٪ احتمال یک معیار ارزش پیش بینی بدون خطا تیباعث می شود

16. برای توزیع های نزدیک به نرمال، مجموعه یکنواخت در نظر گرفته می شود، مگر اینکه ضریب تغییر از آن تجاوز نکند.

17. گزینه های جداسازی متغیر که مقادیر عددی آنها از 25% حداکثر ممکن در این محدوده تجاوز نمی کند.

2) چارک پایین

3) چارک بالایی

4) چارک

18. داده هایی که تفاوتی ندارند و به درستی واقعیت عینی را منعکس می کنند نامیده می شوند.

1) غیر ممکن

2) به همان اندازه ممکن است

3) قابل اعتماد

4) تصادفی

19. بر اساس قانون "سه سیگما"، با توزیع نرمال ویژگی در محدوده
واقع خواهد شد

1) گزینه 68.3٪

انحراف استاندارد یک شاخص کلاسیک از نوسانات از آمار توصیفی است.

انحراف معیار, انحراف معیار, RMSD, انحراف استاندارد نمونه (English standard deviation, STD, STDev) یک شاخص بسیار رایج پراکندگی در آمار توصیفی است. اما از آنجایی که تحلیل تکنیکال مشابه آمار است، این شاخص می تواند (و باید) در تحلیل تکنیکال برای تشخیص میزان پراکندگی قیمت ابزار تجزیه و تحلیل شده در طول زمان مورد استفاده قرار گیرد. با نماد یونانی Sigma "σ" مشخص شده است.

با تشکر از کارلام گاوس و پیرسون که به ما فرصت استفاده از انحراف معیار را دادند.

استفاده كردن انحراف معیار در تحلیل تکنیکال، این را می چرخانیم عامل پراکندگی" v "شاخص نوسانات"، حفظ معنی، اما تغییر اصطلاحات.

انحراف معیار چیست؟

اما علاوه بر محاسبات کمکی میانی، انحراف استاندارد برای محاسبه خود کاملاً قابل قبول استو کاربردها در تحلیل تکنیکال همانطور که یکی از خوانندگان مشتاق مجله بیدمشک ما اشاره کرد، " من هنوز نمی فهمم که چرا RMS در مجموعه شاخص های استاندارد مراکز معاملات داخلی گنجانده نشده است«.

واقعا، انحراف معیار می تواند نوسانات ابزار را به روشی کلاسیک و "خالص" اندازه گیری کند... متأسفانه این شاخص در تحلیل اوراق بهادار چندان رایج نیست.

اعمال انحراف معیار

محاسبه دستی انحراف معیار چندان جالب نیستاما برای تجربه مفید است انحراف معیار را می توان بیان کردبا فرمول STD = √ [(∑ (xx) 2) / n]، که شبیه ریشه مجموع مجذورات تفاوت بین آیتم های نمونه و میانگین تقسیم بر تعداد آیتم های نمونه است. .

اگر تعداد عناصر نمونه از 30 بیشتر شود، مخرج کسر زیر ریشه مقدار n-1 را می گیرد. در غیر این صورت از n استفاده می شود.

گام به گام محاسبه انحراف معیار:

  1. میانگین حسابی نمونه داده را محاسبه کنید
  2. این میانگین را از هر عنصر نمونه کم کنید
  3. تمام تفاوت های حاصل مربع هستند
  4. تمام مربع های حاصل را جمع کنید
  5. مجموع حاصل را بر تعداد عناصر موجود در نمونه تقسیم کنید (یا بر n-1، اگر n> 30 باشد)
  6. جذر ضریب حاصل را محاسبه کنید (نامیده می شود واریانس)

کامل ترین ویژگی تنوع، انحراف معیار است که به آن استاندارد (یا انحراف معیار) می گویند. انحراف معیار() برابر است با جذر مجذور میانگین انحراف مقادیر فردی ویژگی از میانگین حسابی:

انحراف استاندارد ساده است:

انحراف استاندارد وزنی برای داده های گروه بندی شده استفاده می شود:

بین میانگین مربع و انحراف خطی استاندارد در شرایط توزیع نرمال، رابطه زیر برقرار است: ~ 1.25.

انحراف استاندارد، که معیار مطلق اصلی تغییرات است، برای تعیین مقادیر ارادات منحنی توزیع نرمال، در محاسبات مربوط به سازماندهی مشاهده نمونه و تعیین دقت ویژگی های نمونه، و همچنین هنگام ارزیابی مرزهای تنوع یک ویژگی در یک جمعیت همگن

پراکندگی، انواع آن، انحراف معیار.

واریانس یک متغیر تصادفی- معیاری برای گسترش یک متغیر تصادفی معین، یعنی انحراف آن از انتظارات ریاضی. در آمار، نام یا اغلب استفاده می شود. ریشه دوماز واریانس، انحراف معیار، انحراف معیار یا انحراف معیار نامیده می شود.

واریانس کل (σ 2) تغییرات یک صفت را در کل تحت تأثیر همه عواملی که باعث این تنوع شده اند اندازه گیری می کند. در عین حال، به لطف روش گروه‌بندی، امکان جداسازی و اندازه‌گیری تغییرات ناشی از صفت گروه‌بندی و تغییرات ناشی از تأثیر عوامل حساب‌نشده وجود دارد.

واریانس بین گروهی (σ 2 میلی گرم) تنوع سیستماتیک را مشخص می کند، به عنوان مثال، تفاوت در ارزش صفت مورد مطالعه که تحت تأثیر یک صفت ایجاد می شود - عاملی که زیربنای گروه بندی است.

انحراف معیار(مترادف: انحراف استاندارد، انحراف استاندارد، انحراف مربع؛ اصطلاحات مشابه: انحراف استاندارد، گسترش استاندارد) - در نظریه احتمال و آمار، رایج ترین شاخص پراکندگی مقادیر یک متغیر تصادفی نسبت به انتظارات ریاضی آن است. با آرایه های محدود نمونه مقادیر، به جای انتظار ریاضی، از میانگین حسابی جمعیت نمونه ها استفاده می شود.

انحراف معیار در واحدهای اندازه گیری خود متغیر تصادفی اندازه گیری می شود و برای محاسبه خطای استاندارد میانگین حسابی، هنگام ساخت فواصل اطمینان، هنگام آزمون آماری فرضیه ها، هنگام اندازه گیری رابطه خطی بین استفاده می شود. متغیرهای تصادفی... به عنوان جذر واریانس متغیر تصادفی تعریف می شود.


انحراف معیار:

انحراف معیار(تخمین انحراف معیار یک متغیر تصادفی ایکسنسبت به انتظارات ریاضی آن بر اساس برآورد بی طرفانه از واریانس آن):

واریانس کجاست - منعنصر ام نمونه؛ - اندازهی نمونه؛ - میانگین حسابی نمونه:

لازم به ذکر است که هر دو برآورد مغرضانه هستند. V مورد کلیایجاد یک تخمین بی طرفانه غیرممکن است. با این حال، برآورد مبتنی بر برآورد واریانس بی طرفانه سازگار است.

ماهیت، محدوده و روش برای تعیین حالت و میانه.

علاوه بر میانگین‌های قانون قدرت در آمار برای ویژگی‌های نسبی بزرگی ویژگی‌های متغیر و ساختار داخلیسری های توزیع از میانگین های ساختاری استفاده می کنند که عمدتاً نشان داده می شوند مد و میانه.

روش- این رایج ترین نوع ردیف است. از مد استفاده می شود، به عنوان مثال، در تعیین سایز لباس، کفش، که بیشترین تقاضا را در بین مشتریان دارد. حالت برای سری گسسته حالتی است که بالاترین فرکانس را دارد. هنگام محاسبه حالت برای سری تغییرات بازه، لازم است ابتدا فاصله مودال (با حداکثر فرکانس) و سپس - مقدار مقدار معین ویژگی طبق فرمول تعیین شود:

- - ارزش مد

- - کران پایینی فاصله مدال

- - مقدار فاصله

- - فرکانس بازه مودال

- بسامد فاصله قبل از مدال است

- بسامد فاصله پس از مدال است

میانه -این مقدار صفتی است که زیر مجموعه رتبه بندی شده قرار می گیرد و این سری را به دو قسمت مساوی تقسیم می کند.

برای تعیین میانه در یک سری گسسته در حضور فرکانس ها، ابتدا نصف جمع فرکانس ها را محاسبه کنید و سپس تعیین کنید که چه مقدار از متغیر روی آن می افتد. (اگر سری مرتب شده دارای تعداد فرد ویژگی باشد، عدد میانه با فرمول محاسبه می شود:

M e = (n (تعداد ویژگی ها در مجموع) + 1) / 2،

در مورد تعداد زوج از ویژگی ها، میانه برابر با میانگین دو ویژگی در وسط ردیف خواهد بود).

هنگام محاسبه میانه هابرای یک سری تغییرات بازه ای، ابتدا بازه میانه ای را که میانه در آن قرار دارد و سپس مقدار میانه را با استفاده از فرمول تعیین کنید:

- - میانه مورد نیاز

- - کران پایین بازه ای که حاوی میانه است

- - مقدار فاصله

- - مجموع فرکانس ها یا تعداد اعضای سری

مجموع فرکانس های انباشته شده بازه های قبل از میانه

- - فراوانی بازه میانه

مثال... مد و میانه را پیدا کنید.

راه حل:
V این مثالفاصله مودال در گروه سنی 30-25 سال است، زیرا این فاصله بیشترین فراوانی (1054) را دارد.

بیایید بزرگی حالت را محاسبه کنیم:

به این معنی که سن معدل دانش آموزان 27 سال است.

ما میانه را محاسبه می کنیم... فاصله متوسط ​​​​در گروه سنی 25-30 سال است، زیرا در این فاصله یک نوع وجود دارد که جمعیت را به دو قسمت مساوی تقسیم می کند (Σf i / 2 = 3462/2 = 1731). بعد، داده های عددی لازم را در فرمول جایگزین می کنیم و مقدار میانه را بدست می آوریم:

این بدان معناست که نیمی از دانش آموزان زیر 27.4 سال و بقیه بالای 27.4 سال سن دارند.

علاوه بر حالت و میانه، می توان از شاخص هایی مانند چارک هایی که سری های رتبه بندی شده را به 4 قسمت مساوی تقسیم می کند، استفاده کرد. دهک ها- 10 قسمت و صدک - در 100 قسمت.

مفهوم مشاهده انتخابی و دامنه آن.

مشاهده انتخابیهنگامی که اعمال نظارت مستمر اعمال می شود از نظر فیزیکی غیر ممکنبه دلیل حجم زیاد داده یا از نظر اقتصادی غیر عملی... عدم امکان فیزیکی، به عنوان مثال، هنگام مطالعه جریان مسافر، قیمت بازار، بودجه خانواده رخ می دهد. عدم مصلحت اقتصادی هنگام ارزیابی کیفیت کالاهای مرتبط با تخریب آنها، به عنوان مثال، چشیدن، آزمایش آجر برای استحکام و غیره رخ می دهد.

واحدهای آماری انتخاب شده برای مشاهده، یک جامعه یا نمونه نمونه و کل آرایه آنها - جمعیت عمومی (HS) را تشکیل می دهند. در این مورد، تعداد واحدهای نمونه نشان می دهد nو در کل HS - ن... نگرش n / Nاندازه نسبی یا کسری از نمونه نامیده می شود.

کیفیت نتایج مشاهده نمونه به نماینده بودن نمونه بستگی دارد، یعنی به میزان نماینده بودن آن در HS. برای اطمینان از نماینده بودن نمونه باید رعایت شود انتخاب تصادفی واحدها، که فرض می کند گنجاندن یک واحد HS در نمونه نمی تواند تحت تأثیر هیچ عامل دیگری به جز مورد قرار گیرد.

وجود دارد 4 روش برای انتخاب تصادفیبه نمونه:

  1. در واقع تصادفیانتخاب یا "روش لوتو"، زمانی که به مقادیر آماری شماره سریال اختصاص داده می شود، روی موارد خاصی (به عنوان مثال، بشکه) ثبت می شود، که سپس در یک ظرف (مثلاً در یک کیسه) مخلوط می شوند و به طور تصادفی انتخاب می شوند. در عمل، این روش با استفاده از یک ژنراتور انجام می شود اعداد تصادفییا جداول ریاضی اعداد تصادفی.
  2. مکانیکیانتخاب، که بر اساس آن هر ( N / n) -ام ارزش جمعیت عمومی. به عنوان مثال، اگر شامل 100000 مقدار باشد و بخواهید 1000 را انتخاب کنید، هر 100000 / 1000 = 100 مقدار در نمونه گنجانده می شود. ضمناً اگر رتبه بندی نشوند، نفر اول به طور تصادفی از صد نفر اول انتخاب می شود و تعداد بقیه صد نفر بیشتر می شود. به عنوان مثال، اگر واحد # 19 اولین بود، پس واحد بعدی باید # 119، سپس # 219، سپس # 319 و غیره باشد. اگر واحدهای جمعیت عمومی رتبه بندی شوند، ابتدا # 50، سپس # 150، سپس # 250 و غیره انتخاب می شود.
  3. انتخاب مقادیر از یک مجموعه داده ناهمگن انجام می شود طبقه بندی شدهروش (طبقه بندی شده)، زمانی که جمعیت عمومی از قبل به گروه های همگن تقسیم می شود، که انتخاب تصادفی یا مکانیکی برای آنها اعمال می شود.
  4. روش خاص نمونه گیری است سریالانتخابی، که در آن مقادیر منفرد به طور تصادفی یا مکانیکی انتخاب نمی‌شوند، بلکه سری‌های آنها (توالی‌هایی از تعدادی عدد به تعدادی در یک ردیف) که در آن مشاهده مداوم انجام می‌شود.

کیفیت مشاهدات نمونه نیز بستگی دارد نوع نمونه: تکرار کردیا غیر قابل تکرار

در انتخاب مجددمقادیر آماری وارد شده به نمونه یا سری آنها پس از استفاده به جامعه عمومی بازگردانده می شود و شانس ورود به نمونه جدید را دارد. علاوه بر این، همه مقادیر جمعیت عمومی احتمال یکسانی برای قرار گرفتن در نمونه را دارند.

انتخاب بدون تکراربه این معنی که مقادیر آماری موجود در نمونه یا سری آنها پس از استفاده به جامعه عمومی بازگردانده نمی شود و بنابراین برای مقادیر باقیمانده دومی، احتمال سقوط به نمونه بعدی افزایش می یابد.

نمونه برداری مکرر نتایج دقیق تری می دهد، بنابراین بیشتر مورد استفاده قرار می گیرد. اما شرایطی وجود دارد که نمی توان آن را اعمال کرد (مطالعه جریان مسافر، تقاضای مصرف کننده و غیره) و سپس انتخاب مجدد انجام می شود.

خطای نمونه گیری حاشیه ای مشاهده، میانگین خطای نمونه گیری، ترتیب محاسبه آنها.

اجازه دهید روش های بالا برای تشکیل جامعه نمونه و خطاهایی که در این مورد ایجاد می شود را با جزئیات در نظر بگیریم. نمایندگی .
در واقع تصادفینمونه بر اساس انتخاب تصادفی واحدها از جمعیت عمومی بدون هیچ گونه عنصر سیستماتیک است. از نظر فنی، انتخاب تصادفی مناسب با قرعه کشی (مثلاً قرعه کشی) یا طبق جدول اعداد تصادفی انجام می شود.

در واقع انتخاب تصادفی "در شکل خالص خود" به ندرت در تمرین مشاهده انتخابی استفاده می شود، اما انتخاب اولیه در بین انواع دیگر انتخاب است، اصول اساسی مشاهده انتخابی را اجرا می کند. اجازه دهید چند سوال تئوری روش نمونه گیری و فرمول خطا را برای یک نمونه تصادفی ساده در نظر بگیریم.

خطای مشاهده نمونهتفاوت بین مقدار پارامتر در جمعیت عمومی و مقدار آن محاسبه شده از نتایج مشاهده نمونه است. برای یک مشخصه کمی متوسط، خطای نمونه گیری تعیین می شود

نشانگر خطای نمونه برداری حاشیه ای نامیده می شود.
میانگین نمونه یک متغیر تصادفی است که می تواند انتخاب شود معانی مختلفبسته به اینکه کدام واحد در نمونه گنجانده شده است. بنابراین، خطاهای نمونه گیری نیز مقادیر تصادفی هستند و می توانند مقادیر مختلفی به خود بگیرند. بنابراین، میانگین از اشتباهات احتمالی - میانگین خطای نمونه گیریکه بستگی به این دارد:

اندازه نمونه: هر چه عدد بزرگتر باشد، مقدار خطای متوسط ​​کمتر است.

درجه تغییر صفت مورد مطالعه: هر چه واریانس صفت کوچکتر و در نتیجه واریانس، میانگین خطای نمونه گیری کمتر باشد.

در انتخاب مجدد تصادفیمیانگین خطا محاسبه می شود:
.
در عمل، واریانس کلی دقیقاً مشخص نیست، اما در نظریه احتمالثابت کرد که
.
از آنجایی که مقدار n به اندازه کافی بزرگ نزدیک به 1 است، می توانیم چنین فرض کنیم. سپس میانگین خطای نمونه گیری را می توان محاسبه کرد:
.
اما در موارد نمونه کوچک (برای n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

در نمونه تصادفی غیر تکراریفرمول های داده شده با مقدار تصحیح می شوند. سپس میانگین خطای نمونه گیری غیر تکراری به صورت زیر است:
و .
زیرا همیشه کمتر است، پس ضریب () همیشه کمتر از 1 است. این بدان معنی است که میانگین خطا در انتخاب غیر تکراری همیشه کمتر از انتخاب تکراری است.
نمونه برداری مکانیکیزمانی استفاده می شود که جمعیت عمومی به نحوی ترتیب داده شده باشد (مثلاً فهرست الفبایی رأی دهندگان، شماره تلفن، شماره خانه ها، آپارتمان ها). انتخاب واحدها در یک بازه زمانی مشخص انجام می شود که برابر با متقابل درصد نمونه است. بنابراین، با یک نمونه 2٪، هر 50 واحد = 1 / 0.02، با 5٪ هر 1 / 0.05 = 20 واحد از جمعیت عمومی انتخاب می شود.

نقطه مرجع به روش های مختلف انتخاب می شود: به طور تصادفی، از وسط فاصله، با تغییر در نقطه مرجع. نکته اصلی در اینجا جلوگیری از خطای سیستماتیک است. به عنوان مثال، با یک نمونه 5 درصد، اگر واحد اول 13 باشد، سپس 33، 53، 73 و غیره بعدی.

از نظر دقت، انتخاب مکانیکی به خود نمونه‌برداری تصادفی نزدیک است. بنابراین برای تعیین میانگین خطای نمونه گیری مکانیکی از فرمول های انتخاب تصادفی مناسب استفاده می شود.

در انتخاب معمولی جمعیت مورد بررسی ابتدا به گروه های همگن از همان نوع تقسیم می شود. به عنوان مثال، هنگام بررسی بنگاه ها، اینها می توانند صنایع، زیربخش ها باشند؛ هنگام مطالعه جمعیت، اینها می توانند مناطق، گروه های اجتماعی یا سنی باشند. سپس از هر گروه یک انتخاب مستقل به صورت مکانیکی یا کاملا تصادفی انجام می شود.

نمونه گیری معمولی نتایج دقیق تری نسبت به روش های دیگر می دهد. نمونه‌سازی جمعیت عمومی تضمین می‌کند که هر گروه گونه‌شناختی در نمونه نشان داده می‌شود، که امکان حذف تأثیر واریانس بین گروهی بر میانگین خطای نمونه‌گیری را فراهم می‌کند. در نتیجه، هنگام یافتن خطای یک نمونه معمولی طبق قانون اضافه کردن واریانس ها () لازم است فقط میانگین واریانس های گروه در نظر گرفته شود. سپس میانگین خطای نمونه گیری:
در مورد انتخاب مجدد
,
بدون انتخاب مجدد
,
جایی که میانگین واریانس های درون گروهی در نمونه است.

انتخاب سریال (یا تو در تو). در مواردی اعمال می شود که قبل از شروع بررسی نمونه، جمعیت عمومی به سری یا گروه ها تقسیم شود. این مجموعه ها می تواند بسته بندی محصولات نهایی، گروه های دانشجویی، تیپ ها باشد. مجموعه های مورد نظر به صورت مکانیکی یا کاملا تصادفی انتخاب می شوند و در داخل مجموعه، بررسی مستمر واحدها انجام می شود. بنابراین، میانگین خطای نمونه گیری تنها به واریانس بین گروهی (بین سری) بستگی دارد که با فرمول محاسبه می شود:

جایی که r تعداد سری های انتخاب شده است.
- میانگین سری i.

میانگین خطای نمونه برداری سریال محاسبه می شود:

پس از انتخاب مجدد:
,
با انتخاب غیر تکراری:
,
که در آن R تعداد کل سری ها است.

ترکیب شدهانتخابترکیبی از روش های انتخاب در نظر گرفته شده است.

میانگین خطای نمونه گیری برای هر روش انتخابی عمدتاً به اندازه مطلق نمونه و تا حدی کمتر به درصد نمونه بستگی دارد. فرض کنید 225 مشاهده در مورد اول از یک جمعیت عمومی 4500 واحدی و در مورد دوم از 225000 واحد انجام شود. واریانس در هر دو حالت برابر با 25 است. سپس در حالت اول با 5% نمونه گیری خطای نمونه گیری به صورت زیر خواهد بود:

در حالت دوم با انتخاب 0.1% برابر خواهد بود با:


بدین ترتیب، با کاهش 50 برابری درصد نمونه، خطای نمونه گیری به طور غیر قابل توجهی افزایش یافت، زیرا حجم نمونه تغییر نکرد.
فرض کنید حجم نمونه به 625 مشاهده افزایش یافته است. در این حالت خطای نمونه گیری به صورت زیر است:

افزایش ضریب 2.8 نمونه با همان اندازه جامعه عمومی، اندازه خطای نمونه گیری را بیش از 1.6 برابر کاهش می دهد.

روش ها و روش های تشکیل نمونه.

در آمار از روش‌های مختلفی برای تشکیل مجموعه‌های نمونه استفاده می‌شود که با توجه به اهداف تحقیق و به ویژگی‌های موضوع مطالعه بستگی دارد.

شرط اصلی انجام یک نظرسنجی نمونه، جلوگیری از بروز خطاهای سیستماتیک ناشی از نقض اصل فرصت های برابر برای هر واحد از جمعیت عمومی برای درج در نمونه است. پیشگیری از خطاهای سیستماتیک در نتیجه استفاده از روش های علمی مبتنی بر تشکیل جامعه نمونه حاصل می شود.

راه های زیر برای انتخاب واحدها از جمعیت عمومی وجود دارد:

1) انتخاب فردی - واحدهای فردی در نمونه انتخاب می شوند.

2) انتخاب گروه - گروه ها یا سری هایی از واحدهای مورد مطالعه از نظر کیفی همگن در نمونه قرار می گیرند.

3) انتخاب ترکیبی ترکیبی از انتخاب فردی و گروهی است.
روش های انتخاب با قوانین تشکیل جامعه نمونه تعیین می شود.

نمونه می تواند باشد:

  • تصادفی مناسبشامل این واقعیت است که جامعه نمونه در نتیجه انتخاب تصادفی (غیر عمدی) واحدهای فردی از جامعه عمومی تشکیل می شود. در این حالت معمولاً تعداد واحدهای انتخاب شده برای جامعه نمونه بر اساس نسبت پذیرفته شده نمونه تعیین می شود. نسبت نمونه، نسبت تعداد واحدهای نمونه n به تعداد واحدها در جمعیت عمومی N است، یعنی.
  • مکانیکیشامل این واقعیت است که انتخاب واحدها در جامعه نمونه از جامعه عمومی انجام می شود که به فواصل مساوی (گروه ها) تقسیم می شود. علاوه بر این، اندازه فاصله در جمعیت عمومی برابر است با متقابل نسبت نمونه. بنابراین، با یک نمونه 2٪، هر 50 واحد (1: 0.02)، با یک نمونه 5٪، هر 20 واحد (1: 0.05) و غیره انتخاب می شود. بنابراین، مطابق با سهم پذیرفته شده انتخاب، جمعیت عمومی به طور مکانیکی به گروه هایی با اندازه مساوی تقسیم می شود. از هر گروه فقط یک واحد انتخاب می شود.
  • معمول -که در آن ابتدا جمعیت عمومی به گروه های معمولی همگن تقسیم می شود. سپس، از هر گروه معمولی، با نمونه‌گیری تصادفی یا مکانیکی مناسب، یک انتخاب فردی از واحدها در جامعه نمونه انجام می‌شود. یکی از ویژگی های مهم نمونه معمولی این است که نتایج دقیق تری در مقایسه با سایر روش های انتخاب واحد در نمونه می دهد.
  • سریال- که در آن جمعیت عمومی به گروه های هم اندازه تقسیم می شود - سری. سری برای نمونه انتخاب شده است. در داخل مجموعه، مشاهده مستمر واحدهای موجود در سری انجام می شود.
  • ترکیب شده- نمونه می تواند دو مرحله ای باشد. در این حالت ابتدا جمعیت عمومی به گروه هایی تقسیم می شوند. سپس گروه ها انتخاب می شوند و درون گروه دوم، واحدهای فردی انتخاب می شوند.

در آمار، روش های زیر برای انتخاب واحدها در یک جامعه نمونه متمایز می شود:

  • تک مرحلهنمونه گیری - هر واحد انتخاب شده بلافاصله با توجه به یک معیار معین (نمونه گیری تصادفی و سریال مناسب) بررسی می شود.
  • چند مرحله اینمونه گیری - انتخاب از جمعیت عمومی گروه های فردی انجام می شود و واحدهای فردی از گروه ها انتخاب می شوند (نمونه گیری معمولی با روش مکانیکی انتخاب واحدها در جامعه نمونه).

علاوه بر این، بین:

  • انتخاب مجدد- طبق طرح توپ برگشتی. علاوه بر این، هر واحد یا سری که وارد نمونه شده است به جمعیت عمومی باز می گردد و بنابراین شانس ورود مجدد به نمونه را دارد.
  • انتخاب بدون تکرار- طبق طرح یک توپ برگشت نشده. با همان حجم نمونه نتایج دقیق تری دارد.

تعیین حجم نمونه مورد نیاز (با استفاده از جدول دانشجو).

یکی از اصول علمی در تئوری نمونه گیری، اطمینان از تعداد کافی واحد نمونه گیری است. از لحاظ نظری، نیاز به رعایت این اصل در اثبات قضایای حدی نظریه احتمال ارائه شده است، که این امکان را فراهم می کند تا مشخص شود که چه حجمی از واحدها باید از جمعیت عمومی انتخاب شود تا کافی باشد و اطمینان حاصل شود که نمایندگی نمونه

کاهش خطای استاندارد نمونه، و در نتیجه، افزایش دقت برآورد همیشه با افزایش حجم نمونه همراه است، بنابراین، در حال حاضر در مرحله سازماندهی یک مشاهده نمونه، لازم است تصمیم گیری شود. این سوال که اندازه جامعه نمونه باید چقدر باشد تا از دقت مورد نیاز نتایج مشاهدات اطمینان حاصل شود. محاسبه اندازه نمونه مورد نیاز با استفاده از فرمول های مشتق شده از فرمول های خطاهای نمونه برداری حاشیه ای (A) که مربوط به نوع و روش خاصی از انتخاب است، ساخته می شود. بنابراین، برای یک اندازه نمونه تکراری تصادفی (n) داریم:

ماهیت این فرمول این است که با انتخاب تصادفی مکرر اندازه مورد نیاز، حجم نمونه با مجذور ضریب اطمینان نسبت مستقیم دارد. (t2)و واریانس ویژگی تغییرات (? 2) و با مجذور خطای نمونه برداری حاشیه ای (? 2) نسبت معکوس دارد. به طور خاص، با دو برابر شدن خطای حاشیه ای، حجم نمونه مورد نیاز را می توان با ضریب چهار کاهش داد. از سه پارامتر، دو پارامتر (t و؟) توسط محقق تنظیم می شود.

در این صورت محقق اقدام می کندبرای اهداف نمونه نظرسنجی باید این سوال را حل کند که در چه ترکیب کمی بهتر است این پارامترها برای اطمینان از گزینه بهینه گنجانده شود؟ در یک مورد، او ممکن است از قابلیت اطمینان نتایج به دست آمده (t) بیشتر از اندازه گیری دقت (؟) راضی باشد، در مورد دیگر - برعکس. حل مسئله مربوط به مقدار خطای نمونه گیری حاشیه ای دشوارتر است، زیرا محقق این شاخص را در مرحله طراحی مشاهده نمونه ندارد، بنابراین، در عمل مرسوم است که خطای نمونه برداری حاشیه ای را به عنوان یک تنظیم کنید. قانون، حداکثر تا 10٪ از سطح متوسط ​​مورد انتظار ویژگی. ایجاد یک میانگین فرضی را می توان به روش های مختلفی انجام داد: استفاده از داده های بررسی های قبلی مشابه، یا استفاده از داده های یک چارچوب نمونه گیری و ایجاد یک نمونه آزمایشی کوچک.

هنگام طراحی یک مشاهده نمونه، تعیین پارامتر سوم در فرمول (5.2) - واریانس جامعه نمونه - بسیار دشوار است. در این صورت لازم است از تمامی اطلاعاتی که در نظرسنجی های مشابه و آزمایشی قبلی در اختیار محقق است استفاده شود.

سوال تعریف کردناگر بررسی نمونه شامل مطالعه چندین ویژگی واحد نمونه باشد، حجم نمونه مورد نیاز پیچیده می شود. در این حالت، میانگین سطوح هر یک از ویژگی ها و تنوع آنها معمولاً متفاوت است، و بنابراین، تنها با در نظر گرفتن هدف و اهداف می توان در مورد اینکه کدام یک از واریانس ویژگی ها را ترجیح داد، تصمیم گرفت. نظر سنجی.

هنگام طراحی یک مشاهده نمونه، مقدار از پیش تعیین شده خطای نمونه گیری مجاز مطابق با وظایف یک مطالعه خاص و احتمال نتیجه گیری بر اساس نتایج مشاهده در نظر گرفته می شود.

به طور کلی، فرمول خطای حاشیه ای میانگین نمونه، تعیین موارد زیر را ممکن می سازد:

میزان انحرافات احتمالی شاخص های جامعه عمومی از شاخص های جامعه نمونه.

اندازه مورد نیاز نمونه، با ارائه دقت مورد نیاز، که در آن محدوده خطای احتمالی از مقدار مشخصی تجاوز نمی کند.

احتمال اینکه خطا در نمونه دارای حد مشخصی باشد.

توزیع t دانش آموزدر تئوری احتمال، یک خانواده یک پارامتری از توزیع های کاملاً پیوسته است.

مجموعه ای از دینامیک (فاصله، لحظه)، بسته شدن ردیف های دینامیک.

ردیف های دینامیک- اینها مقادیر شاخص های آماری هستند که به ترتیب زمانی مشخص ارائه می شوند.

هر سری زمانی شامل دو جزء است:

1) شاخص های دوره های زمانی (سال، سه ماهه، ماه، روز یا تاریخ).

2) شاخص هایی که شی مورد مطالعه را برای دوره های زمانی یا برای تاریخ های مربوطه مشخص می کند که سطوح سری نامیده می شود.

سطوح سری بیان شده استهر دو مقدار مطلق و متوسط ​​یا نسبی. بسته به ماهیت شاخص ها، سری های دینامیکی از مقادیر مطلق، نسبی و متوسط ​​ساخته می شوند. مجموعه ای از دینامیک از مقادیر نسبی و متوسط ​​بر اساس سری مشتق شده از مقادیر مطلق ساخته شده است. بین سری های بازه ای و لحظه ای دینامیک تمایز قائل شوید.

سری فاصله پویاحاوی مقادیر شاخص ها برای دوره های زمانی خاص است. در سری بازه‌ای، سطوح را می‌توان خلاصه کرد، حجم پدیده را در یک دوره طولانی‌تر به‌دست آورد یا به اصطلاح کل انباشته‌شده را به دست آورد.

سری گشتاور دینامیکیمقادیر شاخص ها را در یک نقطه خاص از زمان (تاریخ زمان) منعکس می کند. در سری لحظه‌ای، محقق تنها می‌تواند به تفاوت پدیده‌ها علاقه‌مند باشد که منعکس‌کننده تغییر سطح سری بین تاریخ‌های معین است، زیرا مجموع سطوح در اینجا محتوای واقعی ندارد. مجموع انباشته شده در اینجا محاسبه نمی شود.

مهم ترین شرط ساخت صحیح سری های زمانی، قابل مقایسه بودن سطوح سری های متعلق به دوره های مختلف است. سطوح باید در مقادیر همگن ارائه شوند و قسمت های مختلف پدیده باید به همان اندازه جامع باشند.

بهبرای جلوگیری از تحریف دینامیک واقعی، در مطالعه آماری محاسبات اولیه (بستن سری دینامیک) انجام می شود که مقدم بر تحلیل آماری سری های زمانی است. بسته شدن سری دینامیک به عنوان یکپارچه سازی دو یا چند سری در یک ردیف درک می شود که سطوح آنها بر اساس روش شناسی مختلف محاسبه می شود یا با مرزهای سرزمینی مطابقت ندارد و غیره. همگرایی سری دینامیک ممکن است به معنای آوردن سطوح مطلق سری دینامیک به یک پایه مشترک باشد که غیرقابل مقایسه بودن سطوح سری دینامیک را از بین می برد.

مفهوم مقایسه پذیری سری پویایی، ضرایب، رشد و نرخ رشد.

ردیف های دینامیک- مجموعه ای از شاخص های آماری که توسعه پدیده های طبیعی و اجتماعی را در زمان مشخص می کند. مجموعه های آماری منتشر شده توسط Goskomstat روسیه حاوی تعداد زیادی سری از دینامیک به صورت جدولی است. مجموعه ای از پویایی ها امکان آشکارسازی الگوهای توسعه پدیده های مورد مطالعه را فراهم می کند.

سری دینامیک شامل دو نوع شاخص است. شاخص های زمان(سال، ربع، ماه و غیره) یا نقاط زمانی (در ابتدای سال، در آغاز هر ماه و غیره). نشانگرهای سطح ردیف... شاخص های سطوح سری دینامیک را می توان در مقادیر مطلق (تولید یک محصول در تن یا روبل)، مقادیر نسبی (سهم جمعیت شهری بر حسب درصد) و مقادیر متوسط ​​(متوسط ​​دستمزدها بیان کرد. کارگران در صنعت بر حسب سالها و غیره). به شکل جدولی، یک ردیف پویا شامل دو ستون یا دو ردیف است.

ساخت صحیح سری دینامیک مستلزم تحقق تعدادی از الزامات است:

  1. همه شاخص های تعدادی از پویایی ها باید از نظر علمی پایه و قابل اعتماد باشند.
  2. شاخص های تعدادی از پویایی ها باید در زمان قابل مقایسه باشند، به عنوان مثال. باید برای دوره های زمانی یکسان یا برای همان تاریخ ها محاسبه شود.
  3. شاخص های تعدادی از پویایی ها باید در سراسر قلمرو قابل مقایسه باشند.
  4. شاخص های تعدادی از پویایی ها باید از نظر محتوا قابل مقایسه باشند، به عنوان مثال. به همین ترتیب بر اساس یک روش واحد محاسبه می شود.
  5. شاخص های تعدادی از پویایی ها باید در طیف وسیعی از مزارع در نظر گرفته شده قابل مقایسه باشند. همه شاخص های تعدادی از دینامیک باید در واحدهای اندازه گیری مشابه داده شوند.

شاخص های آماریمی تواند نتایج فرآیند مورد مطالعه را در یک دوره زمانی مشخص کند، یا وضعیت پدیده مورد مطالعه را در یک نقطه زمانی مشخص، یعنی. شاخص ها می توانند بازه ای (دوره ای) و فوری باشند. بر این اساس، سری اولیه دینامیک می تواند مقطعی یا لحظه ای باشد. سری لحظه ای دینامیک به نوبه خود می تواند با بازه های زمانی مساوی و نابرابر باشد.

سری اصلی دینامیک را می توان به یک سری مقادیر متوسط ​​و یک سری مقادیر نسبی (زنجیره ای و پایه) تبدیل کرد. به این سری از دینامیک سری های مشتق شده از دینامیک می گویند.

روش محاسبه میانگین سطح در سری دینامیک با توجه به نوع سری دینامیک متفاوت است. با استفاده از مثال، انواع سری از دینامیک و فرمول برای محاسبه سطح متوسط ​​را در نظر خواهیم گرفت.

دستاوردهای مطلق (Δy) نشان می دهد که سطح بعدی سری در مقایسه با قبلی (ستون 3. - افزایش مطلق زنجیره ای) یا در مقایسه با سطح اولیه (ستون 4. - افزایش مطلق پایه) چند واحد تغییر کرده است. فرمول های محاسبه را می توان به صورت زیر نوشت:

با کاهش مقادیر مطلق سری، به ترتیب "کاهش"، "کاهش" وجود خواهد داشت.

شاخص های رشد مطلق حاکی از آن است که به عنوان مثال در سال 1377 تولید محصول «الف» نسبت به سال 97، 4 ​​هزار تن و نسبت به سال 94، 34 هزار تن افزایش داشته است. برای بقیه سالها جدول را ببینید. 11.5 گرم 3 و 4.

نرخ رشدنشان می دهد که سطح سری نسبت به قبلی (ستون 5 - ضرایب رشد یا کاهش زنجیره) یا نسبت به سطح اولیه (ستون 6 - ضرایب رشد یا کاهش پایه) چند برابر تغییر کرده است. فرمول های محاسبه را می توان به صورت زیر نوشت:

نرخ رشدنشان می دهد که سطح بعدی سری در مقایسه با قبلی (ستون 7 - نرخ رشد زنجیره ای) یا در مقایسه با سطح اولیه (ستون 8 - نرخ های رشد پایه) چند درصد است. فرمول های محاسبه را می توان به صورت زیر نوشت:

به عنوان مثال، در سال 1997 حجم تولید محصول "الف" در مقایسه با سال 1996 به 105.5٪ رسیده است.

نرخ رشدنشان می دهد که سطح دوره گزارش چند درصد در مقایسه با قبلی (ستون 9 - نرخ رشد زنجیره ای) یا در مقایسه با سطح اولیه (ستون 10 - نرخ های رشد پایه) افزایش یافته است. فرمول های محاسبه را می توان به صورت زیر نوشت:

T pr = T p - 100٪ یا T pr = افزایش مطلق / سطح دوره قبل * 100٪

بنابراین، به عنوان مثال، در سال 1996، در مقایسه با سال 1995، محصول "A" 3.8٪ (103.8٪ - 100٪) یا (8: 210) در 100٪، و نسبت به سال 1994 - 9٪ (109٪ -) تولید شد. 100٪.

اگر سطوح مطلق در یک ردیف کاهش یابد، آنگاه نرخ کمتر از 100٪ خواهد بود و بر این اساس، نرخ کاهش (نرخ رشد با علامت منفی) وجود خواهد داشت.

ارزش مطلق 1% سود(ستون 11) نشان می دهد که در یک دوره معین چند واحد باید تولید شود تا سطح دوره قبل 1٪ افزایش یابد. در مثال ما، در سال 1995 لازم بود 2.0 هزار تن تولید شود، و در سال 1998 - 2.3 هزار تن، یعنی. بسیار بزرگتر.

دو راه برای تعیین مقدار قدر مطلق افزایش 1٪ وجود دارد:

سطح دوره قبل را بر 100 تقسیم کنید.

افزایش مطلق زنجیره را بر نرخ رشد زنجیره مربوطه تقسیم کنید.

مقدار مطلق سود 1% =

در دینامیک، به ویژه در یک دوره طولانی، تجزیه و تحلیل مشترک نرخ رشد با محتوای هر درصد افزایش یا کاهش مهم است.

توجه داشته باشید که روش در نظر گرفته شده برای تجزیه و تحلیل سری دینامیک هم برای سری دینامیک، که سطوح آن در مقادیر مطلق (t، هزار روبل، تعداد کارمندان و غیره) بیان می شود، و هم برای سری قابل استفاده است. دینامیک، سطوح آن با شاخص های نسبی (٪ ضایعات،٪ محتوای خاکستر زغال سنگ و غیره) یا مقادیر متوسط ​​(میانگین عملکرد بر حسب سنتر در هکتار، متوسط ​​دستمزد و غیره) بیان می شود.

همراه با شاخص های تحلیلی در نظر گرفته شده، محاسبه شده برای هر سال در مقایسه با سطح قبلی یا اولیه، هنگام تجزیه و تحلیل سری پویایی ها، لازم است میانگین شاخص های تحلیلی برای دوره محاسبه شود: میانگین سطح سری، میانگین سالانه. افزایش مطلق (کاهش) و میانگین نرخ رشد سالانه و نرخ رشد.

روش‌های محاسبه میانگین سطح یک سری از دینامیک در بالا مورد بحث قرار گرفت. در سری بازه‌ای دینامیک مورد نظر، سطح میانگین سری با استفاده از فرمول میانگین حسابی ساده محاسبه می‌شود:

میانگین تولید سالانه یک محصول برای سال 1994-1998 218.4 هزار تن بوده است.

میانگین رشد مطلق سالانه نیز با استفاده از فرمول میانگین حسابی ساده محاسبه می شود:

افزایش مطلق سالانه در طول سالها از 4 تا 12 هزار تن (به ستون 3 مراجعه کنید) و میانگین افزایش سالانه تولید برای دوره 1995 - 1998 تغییر کرده است. 8.5 هزار تن بوده است.

روش‌های محاسبه میانگین نرخ رشد و متوسط ​​نرخ رشد نیاز به بررسی دقیق‌تری دارد. اجازه دهید آنها را با استفاده از مثال شاخص های سالانه سطح سری نشان داده شده در جدول در نظر بگیریم.

سطح متوسط ​​تعدادی از دینامیک.

یک سری دینامیک (یا سری زمانی)مقادیر عددی یک آمار خاص در لحظه ها یا دوره های زمانی متوالی هستند (یعنی به ترتیب زمانی مرتب شده اند).

مقادیر عددی یک یا آن شاخص آماری که یک سری از دینامیک را تشکیل می دهد نامیده می شود سطوح ازو معمولا با حرف مشخص می شود y... اولین عضو سریال y 1به نام اولیه یا خط پایهو آخری y n - آخرین... لحظه‌ها یا دوره‌های زمانی که سطوح به آن‌ها اشاره می‌کنند از طریق نشان داده می‌شوند تی.

مجموعه ای از دینامیک، به عنوان یک قاعده، در قالب یک جدول یا نمودار ارائه می شود و مقیاس زمانی در امتداد محور آبسیسا رسم می شود. تی، و در ترتیب - مقیاس سطوح سری y.

میانگین شاخص های تعدادی از دینامیک

هر ردیف از دینامیک را می توان به عنوان نوعی جمع مشاهده کرد nشاخص های متغیر با زمان که می توان آنها را به عنوان میانگین خلاصه کرد. چنین شاخص های تعمیم یافته (متوسط) به ویژه هنگام مقایسه تغییرات در یک شاخص خاص در دوره های مختلف، در کشورهای مختلف و غیره ضروری است.

یک مشخصه تعمیم یافته تعدادی از دینامیک ها می تواند در درجه اول باشد سطح میانی ردیف... روش محاسبه سطح متوسط ​​بستگی به این دارد که سری لحظه ای باشد یا سری بازه ای (دوره ای).

چه زمانی فاصلهاز سری، سطح متوسط ​​آن با فرمول یک میانگین حسابی ساده از سطوح سری تعیین می شود، یعنی.

=
اگر وجود دارد لحظهردیف حاوی nسطوح ( y1، y2،…، yn) با فواصل مساوی بین تاریخ ها (نقاط زمانی)، آنگاه می توان چنین سری را به راحتی به یک سری میانگین تبدیل کرد. در این حالت، شاخص (سطح) ابتدای هر دوره به طور همزمان شاخص پایان دوره قبل است. سپس مقدار متوسط ​​شاخص برای هر دوره (فاصله بین تاریخ ها) را می توان به صورت نصف مجموع مقادیر محاسبه کرد. دردر ابتدا و انتهای دوره، یعنی. چگونه . تعداد چنین میانگین هایی خواهد بود. همانطور که قبلا ذکر شد، برای سری میانگین ها، سطح متوسط ​​از میانگین حسابی محاسبه می شود.

بنابراین می توانیم بنویسیم:
.
پس از تبدیل صورت، به دست می آید:
,

جایی که Y1و Yn- سطوح اول و آخر ردیف؛ یی- سطوح متوسط

این میانگین در آمار به عنوان شناخته شده است میانگین زمانیبرای سریال لحظه ای این نام را از کلمه "cronos" (زمان، لات) گرفته است، زیرا از شاخص هایی محاسبه می شود که در طول زمان تغییر می کنند.

در مورد نابرابراز فواصل بین تاریخ‌ها، میانگین زمانی برای سری لحظه‌ای را می‌توان به عنوان میانگین حسابی مقادیر میانگین سطوح برای هر جفت لحظه محاسبه کرد، وزن آن با فاصله (فاصله زمانی) بین تاریخ‌ها، یعنی.
.
در این موردفرض بر این است که در فواصل بین تاریخ ها سطوح مقادیر متفاوتی به خود گرفتند و ما یکی از دو شناخته شده هستیم ( ییو yi + 1) میانگین ها را تعیین می کنیم و سپس میانگین کلی کل دوره تحلیل شده را از آن محاسبه می کنیم.
اگر فرض شود که هر مقدار ییتا بعدی بدون تغییر باقی می ماند (من + 1)- لحظه ام، یعنی تاریخ دقیق تغییر سطوح مشخص است، سپس محاسبه را می توان با توجه به فرمول میانگین وزنی حسابی انجام داد:
,

زمانی است که در طی آن سطح بدون تغییر باقی مانده است.

علاوه بر سطح متوسط ​​در سری دینامیک، سایر شاخص های میانگین محاسبه می شود - میانگین تغییر در سطوح سری (با روش های پایه و زنجیره ای)، میانگین نرخ تغییر.

مبنا به معنای تغییر مطلق استضریب آخرین تغییر مطلق اساسی تقسیم بر تعداد تغییرات است. به این معنا که

زنجیره به معنای تغییر مطلق است سطوح یک سری ضریب تقسیم مجموع تغییرات مطلق زنجیره ای بر تعداد تغییرات است، یعنی

از علامت میانگین تغییرات مطلق نیز برای قضاوت در مورد ماهیت تغییر در پدیده به طور متوسط ​​استفاده می شود: رشد، کاهش یا ثبات.

از قاعده کنترل تغییرات مطلق اساسی و زنجیره ای چنین بر می آید که میانگین تغییرات اساسی و زنجیره ای باید برابر باشند.

همراه با میانگین تغییر مطلق، میانگین نسبی نیز با استفاده از روش های پایه و زنجیره ای محاسبه می شود.

مبنا به معنای تغییر نسبی استبا فرمول تعیین می شود:

زنجیره به معنای تغییر نسبی استبا فرمول تعیین می شود:

طبیعتاً میانگین تغییرات نسبی خط مبنا و زنجیره باید یکسان باشد و با مقایسه آنها با مقدار معیار 1، در مورد ماهیت تغییر پدیده به طور میانگین نتیجه‌گیری می‌شود: رشد، کاهش یا ثبات.
با کم کردن 1 از خط مبنا یا میانگین زنجیره تغییر نسبی، مربوط می شود میانگین نرخ تغییر، با نشانه ای که می توان ماهیت تغییر در پدیده مورد مطالعه را که توسط سری داده شده از دینامیک منعکس شده است قضاوت کرد.

نوسانات فصلی و شاخص های فصلی.

نوسانات فصلی نوسانات ثابت درون سالیانه است.

اصل اصلی مدیریت برای به دست آوردن حداکثر اثر، به حداکثر رساندن درآمد و به حداقل رساندن هزینه ها است. با مطالعه نوسانات فصلی، مسئله معادله حداکثر در هر سطح از سال حل می شود.

هنگام مطالعه نوسانات فصلی، دو کار مرتبط حل می شود:

1. آشکار ساختن ویژگی های توسعه پدیده در پویایی درون سالیانه;

2. اندازه گیری نوسانات فصلی با ساخت مدل موج فصلی.

برای اندازه‌گیری نوسانات فصلی، بوقلمون‌ها معمولاً فصلی هستند. به طور کلی، آنها با نسبت معادلات اولیه تعدادی از دینامیک به معادلات نظری تعیین می شوند که به عنوان مبنایی برای مقایسه عمل می کنند.

از آنجایی که انحرافات تصادفی روی نوسانات فصلی قرار می گیرند، شاخص های فصلی برای حذف آنها میانگین می شوند.

در این مورد، برای هر دوره از چرخه سالانه، شاخص های تعمیم یافته در قالب شاخص های متوسط ​​فصلی تعیین می شود:

میانگین شاخص‌های نوسانات فصلی عاری از تأثیر انحرافات تصادفی روند اصلی توسعه است.

بسته به ماهیت روند، فرمول میانگین شاخص فصلی می تواند به اشکال زیر باشد:

1.برای مجموعه ای از پویایی های درون سالانه با روند توسعه اصلی مشخص:

2. برای مجموعه ای از پویایی های درون سالی که در آنها روند افزایشی یا کاهشی وجود ندارد یا ناچیز است:

میانگین کلی کجاست

روشهای تحلیل روند اصلی

توسعه پدیده ها در زمان تحت تأثیر عواملی با ماهیت و قدرت تأثیر متفاوت است. برخی از آنها ماهیت تصادفی دارند، برخی دیگر تأثیر تقریباً ثابتی دارند و روند توسعه خاصی را در ردیف پویایی تشکیل می دهند.

یکی از وظایف مهم آمار، شناسایی پویایی روند در سری، رها از عملکرد عوامل تصادفی مختلف است. برای این منظور، سری دینامیک ها با روش های تثبیت فواصل، میانگین متحرک و تراز تحلیلی و ... پردازش می شوند.

روش درشت کردن فاصلهبر اساس بزرگ شدن دوره های زمانی که سطوح تعدادی از پویایی ها به آن تعلق دارند، یعنی. جایگزینی داده های مربوط به دوره های زمانی کوچک با داده های دوره های بزرگتر است. به ویژه زمانی که سطوح اولیه سریال برای دوره های زمانی کوتاه باشد موثر است. به عنوان مثال، ردیف های شاخص های مربوط به رویدادهای روزانه با ردیف های مربوط به هفتگی، ماهانه و غیره جایگزین می شوند. این به شما این امکان را می دهد که واضح تر نشان دهید "محور توسعه پدیده"... میانگین محاسبه شده در فواصل بزرگتر، شناسایی جهت و ماهیت (شتاب یا کاهش رشد) روند اصلی توسعه را ممکن می سازد.

روش میانگین متحرکمشابه قبلی است، اما در این مورد سطوح واقعی با سطوح متوسط ​​محاسبه شده برای پوشش فواصل بزرگ شده متوالی (لغزشی) جایگزین می شوند. مترسطوح سری

مثلااگر شما قبول کنید m = 3،سپس ابتدا میانگین سه سطح اول مجموعه محاسبه می شود، سپس از همان تعداد سطح، اما از دومی متوالی شروع می شود، سپس از سوم شروع می شود و غیره. بنابراین، میانگین، همانطور که بود، در امتداد تعدادی از پویایی ها "لغزش" می کند و با یک دوره حرکت می کند. محاسبه شده از متراصطلاح میانگین متحرک به وسط (مرکز) هر بازه اشاره دارد.

این روش فقط نوسانات تصادفی را حذف می کند. اگر سریال دارای موج فصلی باشد پس از هموارسازی به روش میانگین متحرک باقی می ماند.

تراز تحلیلی به منظور حذف نوسانات تصادفی و شناسایی یک روند، تراز سطوح سری با فرمول های تحلیلی (یا تراز تحلیلی) اعمال می شود. ماهیت آن عبارت است از جایگزینی سطوح تجربی (واقعی) با سطوح نظری، که با توجه به معادله خاصی که به عنوان یک مدل روند ریاضی اتخاذ شده است، محاسبه می شود، که در آن سطوح نظری به عنوان تابعی از زمان در نظر گرفته می شوند. در این حالت، هر سطح واقعی به عنوان مجموع دو مؤلفه در نظر گرفته می شود: مولفه سیستماتیک کجاست و با معادله معینی بیان می شود و متغیر تصادفی است که باعث نوسانات حول روند می شود.

وظیفه تراز تحلیلی به موارد زیر خلاصه می شود:

1. تعیین، بر اساس داده های واقعی، نوع تابع فرضی که می تواند به اندازه کافی روند توسعه شاخص مورد مطالعه را منعکس کند.

2. یافتن پارامترهای تابع (معادله) مشخص شده از داده های تجربی

3. محاسبه بر اساس معادله یافت شده سطوح نظری (تراز شده).

انتخاب یک تابع خاص، به عنوان یک قاعده، بر اساس یک نمایش گرافیکی از داده های تجربی انجام می شود.

معادلات رگرسیون به عنوان مدل استفاده می شود که پارامترهای آن با استفاده از روش حداقل مربعات محاسبه می شود

در زیر رایج ترین معادلات رگرسیون مورد استفاده برای تسطیح سری های زمانی آورده شده است که نشان می دهد کدام روند توسعه برای بازتاب مناسب تر است.

برای یافتن پارامترهای معادلات فوق، الگوریتم ها و برنامه های کامپیوتری خاصی وجود دارد. به طور خاص، برای یافتن پارامترهای معادله یک خط مستقیم، می توان از الگوریتم زیر استفاده کرد:

اگر دوره‌ها یا لحظه‌های زمانی به‌گونه‌ای شماره گذاری شوند که St = 0، الگوریتم‌های فوق به طور قابل توجهی ساده شده و به

سطوح تراز شده در نمودار روی یک خط مستقیم قرار می گیرند که در نزدیکترین فاصله از سطوح واقعی این سری زمانی عبور می کند. مجموع مربعات انحرافات بازتابی از تأثیر عوامل تصادفی است.

با کمک آن، میانگین خطای (استاندارد) معادله را محاسبه می کنیم:

در اینجا n تعداد مشاهدات و m تعداد پارامترهای معادله است (دو مورد از آنها را داریم - b 1 و b 0).

گرایش اصلی (روند) نشان می‌دهد که چگونه عوامل سیستماتیک بر سطوح تعدادی از پویایی‌ها تأثیر می‌گذارند، و نوسانات سطوح حول روند () به عنوان معیاری برای تأثیر عوامل باقیمانده عمل می‌کند.

برای ارزیابی کیفیت مدل سری زمانی استفاده شده نیز از آن استفاده می شود تست F فیشر... این نسبت دو واریانس است، یعنی نسبت واریانس ناشی از رگرسیون، یعنی. عامل مورد مطالعه، به واریانس ناشی از علل تصادفی، یعنی. پراکندگی باقیمانده:

در شکل بسط یافته، فرمول این معیار را می توان به صورت زیر نشان داد:

که در آن n تعداد مشاهدات است، یعنی. تعداد سطوح در یک ردیف،

m تعداد پارامترهای معادله است، y سطح واقعی سری است،

سطح ردیف تراز شده - سطح ردیف وسط.

یک مدل موفق تر از سایرین، ممکن است همیشه به اندازه کافی رضایت بخش نباشد. تنها در صورتی می توان آن را به عنوان چنین تشخیص داد که معیار F برای آن از مرز بحرانی شناخته شده عبور کند. این مرز با استفاده از جداول توزیع F ایجاد می شود.

ماهیت و طبقه بندی شاخص ها.

یک شاخص در آمار به عنوان یک شاخص نسبی درک می شود که تغییر در بزرگی یک پدیده را در زمان، مکان یا در مقایسه با هر استانداردی مشخص می کند.

عنصر اصلی نسبت شاخص مقدار نمایه شده است. مقدار نمایه شده به عنوان مقدار ویژگی جامعه آماری درک می شود که تغییر در آن موضوع مطالعه است.

سه کار اصلی با شاخص ها وجود دارد:

1) ارزیابی تغییرات در یک پدیده پیچیده؛

2) تعیین تأثیر عوامل فردی بر تغییر در یک پدیده پیچیده.

3) مقایسه بزرگی یک پدیده با بزرگی دوره گذشته، قدر برای قلمرو دیگر و همچنین با استانداردها، برنامه ها، پیش بینی ها.

شاخص ها بر اساس 3 معیار طبقه بندی می شوند:

2) با توجه به میزان پوشش عناصر جمعیت.

3) با توجه به روش های محاسبه شاخص های عمومی.

بر اساس محتوااز مقادیر شاخص شده، شاخص ها به شاخص های کمی (حجمی) و شاخص های شاخص های کیفی تقسیم می شوند. شاخص های شاخص های کمی - شاخص های حجم فیزیکی تولید صنعتی، حجم فیزیکی فروش، تعداد کار و ... شاخص های شاخص های کیفی - شاخص های قیمت ها، هزینه های تولید، بهره وری نیروی کار، متوسط ​​دستمزد و ....

با توجه به میزان پوشش واحدهای جامعه، شاخص ها به دو دسته فردی و عمومی تقسیم می شوند. برای توصیف آنها، قراردادهای زیر را که در عمل استفاده از روش شاخص اتخاذ شده اند، معرفی می کنیم:

q- مقدار (حجم) هر محصول در بیان طبیعی ; آر- قیمت واحد؛ z- هزینه واحد تولید؛ تی- زمان صرف شده برای تولید یک واحد تولید (شدت کار) ; w- تولید محصولات بر حسب ارزش در واحد زمان؛ v- تولید محصولات در نوع در واحد زمان. تی- کل زمان صرف شده یا تعداد کارکنان.

برای تشخیص اینکه مقادیر نمایه شده به کدام دوره یا شیء تعلق دارند، مرسوم است که زیرنویس ها را در پایین سمت راست بعد از نماد مربوطه قرار دهید. بنابراین، به عنوان مثال، در شاخص های دینامیک، به عنوان یک قاعده، برای دوره های مقایسه شده (جاری، گزارشگری)، زیرنویس 1 و برای دوره هایی که مقایسه با آنها انجام می شود، استفاده می شود.

شاخص های فردیبرای توصیف تغییرات در عناصر منفرد یک پدیده پیچیده (به عنوان مثال، تغییر در حجم خروجی یک نوع محصول). آنها مقادیر نسبی پویایی، انجام تعهدات، مقایسه مقادیر شاخص شده را نشان می دهند.

شاخص فردی حجم فیزیکی تولید تعیین می شود

از نقطه نظر تحلیلی، شاخص های پویایی فردی ذکر شده مشابه نرخ های رشد (نرخ) هستند و تغییر در مقدار شاخص در دوره جاری را نسبت به پایه مشخص می کنند، یعنی نشان می دهند که چند برابر افزایش (کاهش) شده است. ) یا چند درصد رشد (کاهش) است. مقادیر شاخص در ضرایب یا درصد بیان می شود.

نمایه عمومی (خلاصه).منعکس کننده تغییر در تمام عناصر یک پدیده پیچیده است.

شاخص کلشکل اصلی شاخص است. به این دلیل جمع نامیده می شود که صورت و مخرج آن مجموعه ای از "جمع" است.

شاخص های متوسط، تعریف آنها.

علاوه بر شاخص های کل، آمار از شکل دیگر خود استفاده می کند - شاخص های میانگین وزنی. زمانی به آنها متوسل می شوند که اطلاعات موجود اجازه نمی دهد شاخص کل محاسبه شود. بنابراین، اگر اطلاعاتی در مورد قیمت ها وجود نداشته باشد، اما اطلاعاتی در مورد بهای تمام شده محصولات در دوره جاری وجود داشته باشد و شاخص های قیمت جداگانه برای هر محصول مشخص باشد، نمی توان شاخص عمومی قیمت را به صورت مجموع تعیین کرد، اما می توان آن را به عنوان میانگین افراد محاسبه کنید. به همین ترتیب، اگر مقادیر تک تک محصولات تولید شده مشخص نباشد، اما شاخص های جداگانه و هزینه تولید برای دوره پایه مشخص باشد، می توان شاخص کلی حجم فیزیکی تولید را به عنوان میانگین موزون تعیین کرد. .

شاخص متوسط ​​-این هستشاخص به عنوان میانگین هر شاخص محاسبه می شود. شاخص کل شکل اصلی شاخص عمومی است، بنابراین میانگین شاخص باید با شاخص کل یکسان باشد. هنگام محاسبه میانگین ها، از دو شکل میانگین استفاده می شود: حسابی و هارمونیک.

اگر اوزان هر شاخص، عبارت مخرج شاخص کل باشد، شاخص میانگین حسابی با شاخص کل یکسان است. فقط در این حالت مقدار شاخص که بر اساس فرمول میانگین حسابی محاسبه می شود، برابر با شاخص کل خواهد بود.

برای محاسبه میانگین هندسی ساده از فرمول استفاده می شود:

وزن هندسی

برای تعیین میانگین وزنی هندسی، از فرمول استفاده می شود:

میانگین قطر چرخ ها، لوله ها، اضلاع متوسط ​​مربع ها با استفاده از میانگین مربع تعیین می شود.

مقادیر RMS برای محاسبه برخی از شاخص ها، به عنوان مثال، ضریب تغییرات، که ریتم تولید را مشخص می کند، استفاده می شود. در اینجا، انحراف استاندارد از خروجی برنامه ریزی شده برای یک دوره خاص با استفاده از فرمول زیر تعیین می شود:

این مقادیر به طور دقیق تغییر شاخص های اقتصادی را در مقایسه با ارزش پایه آنها که در مقدار متوسط ​​آن گرفته شده است، مشخص می کند.

درجه دوم ساده

ریشه میانگین مربع ساده با فرمول محاسبه می شود:

مربع وزن دار

میانگین وزنی مربع برابر است با:

22. شاخص های مطلق تغییرات عبارتند از:

محدوده تنوع

میانگین انحراف خطی

واریانس

انحراف معیار

تغییر چرخش (r)

تنوع سوایپتفاوت بین حداکثر و حداقل مقدار مشخصه است

حدودی را نشان می دهد که در آن مقدار صفت در جمعیت مورد مطالعه تغییر می کند.

سابقه کار پنج متقاضی در کار قبلی 2،3،4،7 و 9 سال می باشد. راه حل: محدوده تغییرات = 9 - 2 = 7 سال.

برای مشخصه تعمیم یافته تفاوت در مقادیر ویژگی، میانگین شاخص های تغییرات بر اساس در نظر گرفتن انحراف از میانگین حسابی محاسبه می شود. تفاوت به عنوان انحراف از میانگین در نظر گرفته می شود.

در عین حال، برای جلوگیری از مجموع انحراف گزینه های یک ویژگی از میانگین (صفر خاصیت میانگین)، لازم است یا علائم انحراف را در نظر نگیریم، یعنی این را در نظر بگیریم. مجموع مدول، یا مربع انحرافات به صفر.

میانگین انحراف خطی و استاندارد

میانگین انحراف خطی- این میانگین حسابی انحراف مطلق مقادیر فردی ویژگی از میانگین است.

میانگین انحراف خطی ساده است:

سابقه کار پنج متقاضی در کار قبلی 2،3،4،7 و 9 سال می باشد.

در مثال ما: سال.

پاسخ: 2.4 سال.

میانگین وزنی انحراف خطیبرای داده های گروه بندی شده اعمال می شود:

میانگین انحراف خطی، به دلیل قرارداد آن، در عمل نسبتاً به ندرت استفاده می شود (به ویژه برای توصیف اجرای تعهدات قراردادی برای یکنواختی تحویل؛ در تجزیه و تحلیل کیفیت محصول، با در نظر گرفتن ویژگی های تکنولوژیکی تولید).

انحراف معیار

کامل ترین ویژگی تنوع، انحراف معیار است که به آن استاندارد (یا انحراف معیار) می گویند. انحراف معیار() برابر است با جذر مجذور میانگین انحراف مقادیر فردی ویژگی از میانگین حسابی:

انحراف استاندارد ساده است:

انحراف استاندارد وزنی برای داده های گروه بندی شده استفاده می شود:

بین میانگین مربع و انحراف خطی استاندارد در شرایط توزیع نرمال، رابطه زیر برقرار است: ~ 1.25.

انحراف استاندارد، که معیار مطلق اصلی تغییرات است، برای تعیین مقادیر ارادات منحنی توزیع نرمال، در محاسبات مربوط به سازماندهی مشاهده نمونه و تعیین دقت ویژگی های نمونه، و همچنین هنگام ارزیابی مرزهای تنوع یک ویژگی در یک جمعیت همگن

مقادیر به دست آمده از تجربه ناگزیر به دلایل مختلف حاوی خطاهایی هستند. در میان آنها باید بین خطاهای سیستماتیک و تصادفی تمایز قائل شد. خطاهای سیستماتیک به دلایلی ایجاد می شوند که به روشی کاملاً مشخص عمل می کنند و همیشه می توان آنها را حذف کرد یا به دقت در نظر گرفت. خطاهای تصادفی به دلیل تعداد بسیار زیادی از علل جداگانه ایجاد می شوند که نمی توان آنها را به طور دقیق محاسبه کرد و در هر بعد جداگانه به روش های مختلف عمل کرد. این خطاها را نمی توان به طور کامل رد کرد. آنها را می توان فقط به طور متوسط ​​در نظر گرفت، که برای آن لازم است قوانین حاکم بر خطاهای تصادفی را بدانید.

مقدار اندازه گیری شده را با A و خطای تصادفی در اندازه گیری x را نشان می دهیم. از آنجایی که خطای x می تواند هر مقداری را بگیرد، یک متغیر تصادفی پیوسته است که کاملاً با قانون توزیع خودش مشخص می شود.

ساده ترین و دقیق ترین واقعیت منعکس کننده (در اکثریت قریب به اتفاق موارد) به اصطلاح است توزیع نرمال خطاها:

این قانون توزیع را می توان از مقدمات نظری مختلف به دست آورد، به ویژه از این شرط که محتمل ترین مقدار یک کمیت مجهول، که تعدادی از مقادیر با اندازه گیری مستقیم با همان درجه دقت به دست می آید، حساب است. میانگین این مقادیر کمیت 2 نامیده می شود واریانساز این قانون عادی

میانگین

تعیین واریانس از داده های تجربی. اگر برای هر کمیتی یک اندازه گیری مستقیم به دست آمده n مقدار a i را با همان درجه دقت داشته باشد و اگر خطاهای کمیت A تابع قانون توزیع نرمال باشد، محتمل ترین مقدار A خواهد بود. میانگین:

الف - میانگین حسابی

a i - مقدار اندازه گیری شده در مرحله i.

انحراف مقدار مشاهده شده (برای هر مشاهده) a i مقدار A از میانگین حسابی: a i - a.

برای تعیین واریانس توزیع نرمال خطاها در این مورد، از فرمول استفاده کنید:

2 - واریانس
الف - میانگین حسابی
n تعداد اندازه گیری های پارامتر است،

انحراف معیار

انحراف معیارانحراف مطلق مقادیر اندازه گیری شده را نشان می دهد میانگین حسابی... طبق فرمول اندازه گیری دقت یک ترکیب خطی ریشه میانگین مربعات خطامیانگین حسابی با فرمول تعیین می شود:

، جایی که


الف - میانگین حسابی
n تعداد اندازه گیری های پارامتر است،
a i - مقدار اندازه گیری شده در مرحله i.

ضریب تغییرات

ضریب تغییراتاندازه گیری نسبی انحراف مقادیر اندازه گیری شده را مشخص می کند میانگین حسابی:

، جایی که

V ضریب تغییرات است،
- انحراف معیار،
الف - میانگین حسابی.

هر چه ارزش بیشتر باشد ضریب تغییر، پراکندگی نسبتاً بیشتر و یکنواختی مقادیر مورد بررسی کمتر است. اگر ضریب تغییراتکمتر از 10 درصد، آنگاه متغیر بودن سری تغییرات ناچیز در نظر گرفته می شود، از 10 درصد تا 20 درصد به میانگین، بیش از 20 درصد و کمتر از 33 درصد به معنی دار و اگر ضریب تغییراتبیش از 33٪، این نشان دهنده ناهمگونی اطلاعات و نیاز به حذف بزرگترین و کوچکترین مقادیر است.

میانگین انحراف خطی

یکی از شاخص های دامنه و شدت تغییرات - میانگین انحراف خطی(میانگین مدول انحراف) از میانگین حسابی. میانگین انحراف خطیبا فرمول محاسبه می شود:

، جایی که

_
الف - میانگین انحراف خطی،
الف - میانگین حسابی
n تعداد اندازه گیری های پارامتر است،
a i - مقدار اندازه گیری شده در مرحله i.

برای بررسی مطابقت مقادیر بررسی شده با قانون توزیع نرمال، رابطه را اعمال کنید شاخص عدم تقارنبه اشتباه و نگرش او نرخ کشیدگیبه اشتباهش

شاخص عدم تقارن

شاخص عدم تقارن(A) و خطای آن (m a) با استفاده از فرمول های زیر محاسبه می شود:

، جایی که

الف - نشانگر عدم تقارن،
- انحراف معیار،
الف - میانگین حسابی
n تعداد اندازه گیری های پارامتر است،
a i - مقدار اندازه گیری شده در مرحله i.

نشانگر کورتوز

نشانگر کورتوز(E) و خطای آن (m e) با استفاده از فرمول های زیر محاسبه می شود:

، جایی که



 


خواندن:



روانشناسی عمومی stolyarenko a m

روانشناسی عمومی stolyarenko a m

جوهر روان و روان. علم یک پدیده اجتماعی است، بخشی جدایی ناپذیر از آگاهی اجتماعی، شکلی از شناخت انسان از طبیعت، ...

کار آزمون تمام روسی برای دوره ابتدایی

کار آزمون تمام روسی برای دوره ابتدایی

VLOOKUP. زبان روسی. 25 گزینه برای کارهای معمولی Volkova E.V. et al. M.: 2017 - 176 p. این راهنما کاملا مطابق با ...

فیزیولوژی انسان سن ورزش عمومی

فیزیولوژی انسان سن ورزش عمومی

صفحه فعلی: 1 (کتاب در مجموع 54 صفحه دارد) [گزیده ای موجود برای مطالعه: 36 صفحه] قلم: 100% + Alexey Solodkov, Elena ...

سخنرانی در مورد روش شناسی آموزش زبان و ادبیات روسی در توسعه روش شناختی مدرسه ابتدایی با موضوع

سخنرانی در مورد روش شناسی آموزش زبان و ادبیات روسی در توسعه روش شناختی مدرسه ابتدایی با موضوع

این راهنما شامل یک دوره سیستماتیک در آموزش گرامر، خواندن، ادبیات، املا و توسعه گفتار برای دانش آموزان جوان است. در آن یافت شد ...

فید-تصویر Rss