ev - Onarım geçmişi
Ortalama kare sapmanın belirlenmesi. Standart sapma

4 numaralı ders

Konu: “Tanımlayıcı istatistikler. Toplamda özelliğin çeşitliliğinin göstergeleri "

İstatistiksel bir popülasyonda bir özelliğin çeşitliliği için ana kriterler şunlardır: limit, genlik, ortalama standart sapma, salınım katsayısı ve varyasyon katsayısı. Bir önceki derste, ortalama değerlerin, toplamda incelenen özelliğin yalnızca genelleştirici bir özelliğini verdiği ve bireysel varyantlarının değerlerini dikkate almadığı tartışıldı: minimum ve maksimum değerler, ortalamanın üstünde, ortalamanın altında vb.

Örnek. İki farklı sayı dizisinin ortalama değerleri: -100; -yirmi; 100; 20 ve 0.1; -0.2; 0.1 kesinlikle aynı ve eşittirÖ.Bununla birlikte, nispi ortalamanın bu dizilerinin dağılım aralıkları çok farklıdır.

Bir özelliğin çeşitliliği için listelenen kriterlerin tanımı, öncelikle istatistiksel popülasyonun bireysel unsurları için değeri dikkate alınarak gerçekleştirilir.

Bir özelliğin varyasyonunu ölçmek için göstergeler şunlardır: mutlak ve akraba... Mutlak varyasyon göstergeleri şunları içerir: varyasyon aralığı, limit, standart sapma, varyans. Varyasyon katsayısı ve salınım katsayısı, göreli varyasyon ölçümlerini ifade eder.

Sınır (lim) - bu, varyasyon serisindeki varyantın uç değerleri ile belirlenen bir kriterdir. Yani bu kriter özelliğin minimum ve maksimum değerleri ile sınırlıdır:

Genlik (Am) veya varyasyon aralığı - aşırı seçenekler arasındaki fark budur. Bu kriterin hesaplanması, seçeneğin varyasyon derecesini değerlendirmemize izin veren, özniteliğin maksimum değerinden minimum değeri çıkarılarak gerçekleştirilir:

Bir değişkenlik kriteri olarak limit ve genliğin dezavantajı, tamamen varyasyon serisindeki özelliğin uç değerlerine bağlı olmalarıdır. Bu durumda, bir seri içindeki bir özelliğin değerlerindeki dalgalanmalar dikkate alınmaz.

İstatistiksel bir popülasyondaki bir özelliğin çeşitliliğinin en eksiksiz özelliği şu şekilde verilir: standart sapma(sigma), bir varyantın ortalamasından sapmasının genel bir ölçüsüdür. Standart sapma genellikle şu şekilde ifade edilir: standart sapma.

Standart sapma, her seçeneğin verilen popülasyonun aritmetik ortalaması ile karşılaştırılmasına dayanır. Toplamda her zaman hem daha az hem de daha fazla seçenekler olacağından, "" işaretli sapmaların toplamı "" işaretli sapmaların toplamı ile geri ödenecektir, yani. tüm sapmaların toplamı sıfırdır. Farklılıkların işaretlerinin etkisinden kaçınmak için, aritmetik ortalama kareden sapmalar alınır, yani. ... Sapmaların karelerinin toplamı sıfır değildir. Değişkenliği ölçebilecek bir katsayı elde etmek için kareler toplamının ortalamasını alın - bu değere denir varyans:

Anlam açısından, varyans, bir özelliğin bireysel değerlerinin ortalamasından sapmalarının ortalama karesidir. Dağılım standart sapmanın karesi.

Varyans bir boyuttur (adlandırılmıştır). Yani sayı serisinin varyantları metre cinsinden ifade edilirse varyans metrekareyi verir; seçenekler kilogram olarak ifade edilirse, varyans bu ölçünün karesini verir (kg 2), vb.

Standart sapma- varyansın karekökü:

, daha sonra kesrin paydasındaki varyansı ve standart sapmayı hesaplarken yerinekoymak gerekli.

Standart sapmanın hesaplanması, belirli bir sırayla gerçekleştirilmesi gereken altı aşamaya ayrılabilir:

Standart sapma uygulaması:

a) varyasyon serisinin değişkenliğini yargılamak ve aritmetik ortalama değerlerin tipikliğinin (temsil edilebilirliğinin) karşılaştırmalı bir değerlendirmesi. Bu, işaretlerin stabilitesini belirlerken ayırıcı tanıda gereklidir.

b) varyasyon serisini yeniden oluşturmak, yani. dayalı frekans yanıtının restorasyonu üç sigma kuralı. aralığında (M ± 3σ) Serinin tüm varyantlarının %99,7'si (M ± 2σ) -% 95,5 ve aralıkta (M ± 1σ) - %68,3 sıra varyantı(şekil 1).

c) "açılır pencere" seçeneğini belirlemek için

d) sigma tahminlerini kullanarak norm ve patoloji parametrelerini belirlemek

e) varyasyon katsayısını hesaplamak için

f) aritmetik ortalamanın ortalama hatasını hesaplamak.

Herhangi bir genel popülasyonu karakterize etmek içinnormal dağılım türü , iki parametreyi bilmek yeterlidir: aritmetik ortalama ve standart sapma.

Şekil 1. Üç Sigma Kuralı

Örnek.

Pediatride standart sapma, belirli bir çocuğun verilerini karşılık gelen standart göstergelerle karşılaştırarak çocukların fiziksel gelişimini değerlendirmek için kullanılır. Sağlıklı çocukların fiziksel gelişiminin aritmetik ortalama göstergeleri standart olarak alınır. Göstergelerin standartlarla karşılaştırılması, standartların karşılık gelen sigma ölçekleriyle birlikte verildiği özel tablolara göre yapılır. Çocuğun fiziksel gelişiminin göstergesi standart (aritmetik ortalama) ± σ içindeyse, o zaman kabul edilir. fiziksel Geliştirmeçocuk (bu göstergeye göre) norma karşılık gelir. Gösterge ± 2σ standardı içindeyse, normdan hafif bir sapma vardır. Gösterge bu sınırların ötesine geçerse, çocuğun fiziksel gelişimi normdan keskin bir şekilde farklıdır (patoloji mümkündür).

Mutlak değerlerle ifade edilen varyasyon göstergelerine ek olarak, istatistiksel çalışma, göreceli değerlerle ifade edilen varyasyon göstergelerini kullanır. Salınım katsayısı - varyasyon aralığının özelliğin ortalama değerine oranıdır. Varyasyon katsayısı - standart sapmanın oranıdır ortalama imza. Tipik olarak, bu değerler yüzde olarak ifade edilir.

Göreceli varyasyon indekslerini hesaplamak için formüller:

Yukarıdaki formüllerden katsayı ne kadar büyükse görülebilir. V sıfıra yakın, özelliğin değerlerindeki varyasyon o kadar az olur. Daha fazla V, daha değişken işaret.

İstatistiksel uygulamada, en sık olarak varyasyon katsayısı kullanılır. Sadece varyasyonun karşılaştırmalı değerlendirmesi için değil, aynı zamanda popülasyonun homojenliğini karakterize etmek için de kullanılır. Varyasyon katsayısı %33'ü geçmezse (normale yakın dağılımlar için) popülasyon homojen kabul edilir. Aritmetik olarak, σ ve aritmetik ortalamanın oranı etkiyi ortadan kaldırır mutlak değer ve yüzde, varyasyon katsayısını boyutsuz (isimsiz) bir değer yapar.

Varyasyon katsayısının elde edilen değeri, özelliğin çeşitlilik derecesinin yaklaşık derecelerine göre tahmin edilir:

Zayıf - %10'a kadar

Ortalama - %10 - %20

Güçlü - %20'den fazla

Boyut ve boyut olarak farklı olan özellikleri karşılaştırmanın gerekli olduğu durumlarda varyasyon katsayısının kullanılması tavsiye edilir.

Varyasyon katsayısı ile diğer dağılım kriterleri arasındaki fark açıkça göstermektedir. örnek.

tablo 1

Bir sanayi kuruluşundaki işçilerin bileşimi

Örnekte verilen istatistiksel özelliklere dayanarak, işletme çalışanlarının yaş kompozisyonu ve eğitim düzeyinin, ankete katılan birliğin düşük mesleki istikrarı ile nispeten homojen olduğu sonucuna varılabilir. Bu sosyal eğilimleri standart sapma ile yargılama girişiminin hatalı bir sonuca yol açacağını ve "iş deneyimi" ve "yaş" kimlik bilgilerini "eğitim" muhasebe niteliği ile karşılaştırma girişiminin genellikle yanlış olacağını görmek kolaydır. Bu özelliklerin heterojenliğinden kaynaklanmaktadır.

Medyan ve yüzdelikler

Serinin ortası için kriterin medyan olduğu sıralı (sıralı) dağılımlar için, standart sapma ve varyans, saçılma varyantının özellikleri olarak hizmet edemez.

Aynısı açık varyasyon serileri için de geçerlidir. Bu durum, varyans ve σ'nın hesaplandığı sapmaların, açık varyasyon serilerinde ve nitel özelliklerin dağılım serilerinde hesaplanmayan aritmetik ortalamadan sayılması gerçeğinden kaynaklanmaktadır. Bu nedenle, dağılımların kısa bir açıklaması için başka bir dağılım parametresi kullanılır - çeyreklik(eşanlamlı - "nercentile"), niteliksel ve niceliksel özellikleri dağılımlarının herhangi bir biçiminde tanımlamak için uygundur. Bu parametre, nicel özellikleri nitel olanlara çevirmek için de kullanılabilir. Bu durumda, bu tür tahminler, niceliğin hangi sırasının belirli bir seçeneğe karşılık geldiğine bağlı olarak atanır.

Biyomedikal araştırma pratiğinde, en sık olarak aşağıdaki nicelikler kullanılır:

medyan mı;

, - çeyrekler (çeyrekler), alt çeyrek nerede, Üst çeyrek.

Nicelikler, bir varyasyon serisindeki bir varyantın olası varyasyon alanını belirli aralıklara böler. Medyan (kuantil), varyasyon serisinin ortasında bulunan ve bu seriyi ikiye, iki eşit parçaya bölen bir varyanttır ( 0,5 ve 0,5 ). Çeyrek, satırı dört bölüme ayırır: ilk bölüm (alt çeyrek), sayısal değerleri olası maksimum değerin% 25'ini aşmayan seçenekleri ayıran seçeneklerdir. Bu diziler, çeyrek, seçenekleri mümkün olan maksimum değerin %50'sine kadar sayısal bir değerle ayırır. Üst çeyrek (), olası maksimum değerlerin %75'ine kadar olan seçenekleri ayırır.

Asimetrik dağılım durumunda aritmetik ortalamaya göre bir değişken, onu karakterize etmek için medyan ve çeyrekler kullanılır. Bu durumda, aşağıdaki ortalama değeri görüntüleme şekli kullanılır - Ben mi (;). Örneğin, çalışılan işaret - "çocuğun bağımsız olarak yürümeye başladığı dönem" - çalışma grubunda asimetrik bir dağılıma sahiptir. Aynı zamanda, alt çeyrek () yürümenin başlangıcına karşılık gelir - 9,5 ay, ortanca - 11 ay ve üst çeyrek () - 12 ay. Buna göre, belirtilen işaretin ortalama eğiliminin özelliği 11 (9.5; 12) ay olarak sunulacaktır.

Araştırma sonuçlarının istatistiksel öneminin değerlendirilmesi

Verilerin istatistiksel önemi, görüntülenen gerçekliğe karşılık gelme derecesi olarak anlaşılır, yani. istatistiksel olarak anlamlı veriler, nesnel gerçekliği çarpıtmayan ve doğru bir şekilde yansıtmayan verilerdir.

Araştırma sonuçlarının istatistiksel anlamlılığını değerlendirmek, örneklem popülasyonu üzerinde elde edilen sonuçların genel popülasyonun tamamına hangi olasılıkla aktarılmasının mümkün olduğunu belirlemek anlamına gelir. İstatistiksel önemi değerlendirmek, fenomenin ne kadarının bir bütün olarak fenomen ve onun kalıpları üzerinde yargılanabileceğini anlamak için gereklidir.

Araştırma sonuçlarının istatistiksel öneminin değerlendirilmesi aşağıdakilerden oluşur:

1. Temsiliyet hataları (ortalama ve bağıl değer hataları) - m;

2. ortalama veya göreceli değerlerin güven sınırları;

3.Kritere göre ortalama veya bağıl değerler arasındaki farkın güvenilirliği T.

Aritmetik ortalamanın standart hatası veya temsil hatası ortalamadaki dalgalanmaları karakterize eder. Örnek boyutu ne kadar büyük olursa, ortalama değerlerin yayılmasının o kadar küçük olduğuna dikkat edilmelidir. Ortalamanın standart hatası aşağıdaki formülle hesaplanır:

Modern bilimsel literatürde, aritmetik ortalama temsil hatası ile birlikte yazılır:

veya standart sapma ile birlikte:

Örnek olarak, ülkedeki 1.500 şehir polikliniğinin verilerini düşünün (genel nüfus). Bir poliklinikte hizmet verilen ortalama hasta sayısı 18150 kişidir. Nesnelerin %10'unun (150 poliklinik) rastgele seçilmesi, 20051 kişiye eşit ortalama hasta sayısı verir. Açıkça 1500 polikliniğin tamamının örnekleme dahil edilmemesiyle ilgili olan örnekleme hatası, bu ortalamalar arasındaki farka eşittir - genel ortalama ( m gen) ve örnek ortalama ( m Seçme). Genel popülasyonumuzdan aynı büyüklükte başka bir örnek oluşturursak, farklı miktarda hata verecektir. Yeterince büyük numuneler için tüm bu numune araçları, yeterince büyük numuneler için genel ortalama etrafında normal olarak dağıtılır. Büyük bir sayı genel popülasyondan aynı sayıda nesneyi örneklemenin tekrarları. Ortalamanın standart hatası mörnek ortalamanın genel ortalama etrafındaki kaçınılmaz dağılımıdır.

Araştırma sonuçlarının göreceli değerlerde (örneğin yüzdeler) sunulması durumunda - hesaplanır standart hatayı paylaş:

P, % cinsinden göstergedir, n ise gözlem sayısıdır.

Sonuç olarak görüntülenir (P ± m)%. Örneğin, hastalar arasında iyileşme yüzdesi (95.2 ± 2.5) idi.

Popülasyondaki eleman sayısının fazla olması durumunda, daha sonra ortalamanın standart hatalarını hesaplarken ve kesrin paydasındaki kesrin yerinekoymak gerekli.

Normal bir dağılım için (örnek ortalamalarının dağılımı normaldir), popülasyonun ne kadarının ortalama etrafındaki herhangi bir aralığa düştüğü bilinmektedir. Özellikle:

Uygulamada sorun, genel popülasyonun özelliklerini bilmememiz ve örneklemin tam olarak onları değerlendirmek amacıyla yapılmış olmasıdır. Bu, aynı boyutta numuneler yaparsak, n genel popülasyondan, daha sonra vakaların %68,3'ünde aralık değeri içerecektir m(vakaların %95,5'inde aralıkta ve vakaların %99,7'sinde aralıkta olacaktır).

Gerçekte yalnızca bir örnek yapıldığından, bu ifade olasılık cinsinden formüle edilmiştir: %68,3 olasılıkla, genel popülasyondaki bir özelliğin ortalama değeri, %95,5 olasılıkla bir aralık içine alınır. - aralıkta vb.

Pratikte, verilen (yeterince yüksek) bir olasılıkla, örnek değeri etrafında bir aralık oluşturulur - güven seviyesi - Genel popülasyonda bu parametrenin gerçek değerini "kapsar". Bu aralığa denir güven aralığı.

güven olasılığıP güven aralığının, genel popülasyondaki parametrenin gerçek (bilinmeyen) değerini gerçekten içereceğine dair güven derecesidir.

Örneğin, eğer güven düzeyi r%90'a eşittir, bu 100 örnekten 90'ının genel popülasyondaki parametrenin doğru tahminini vereceği anlamına gelir. Buna göre, hata olasılığı, yani. örnek için genel ortalamanın yanlış tahmini yüzde olarak şuna eşittir: Bu örnek için bu, 100 örnekten 10'unun yanlış bir tahmin vereceği anlamına gelir.

Açıkçası, güven derecesi (güven düzeyi) aralığın boyutuna bağlıdır: aralık ne kadar genişse, genel popülasyon için bilinmeyen bir değerin o aralığın içine düşeceği güveni de o kadar yüksek olur. Uygulamada, güven aralığını oluşturmak için, en az %95,5'lik bir güven sağlamak için örnekleme hatasının en az iki katı alınır.

Ortalama ve bağıl değerlerin güven sınırlarının belirlenmesi, iki uç değerini bulmanızı sağlar - mümkün olan minimum ve mümkün olan maksimum, çalışılan göstergenin tüm genel popülasyonda bulunabileceği. Buna dayanarak, güven sınırları (veya güven aralığı)- bunlar, rastgele dalgalanmalar nedeniyle ihmal edilebilir bir olasılığa sahip olan, ötesine geçen ortalama veya göreli değerlerin sınırlarıdır.

Güven aralığı şu şekilde yeniden yazılabilir:, nerede T- güven kriteri.

Genel popülasyondaki aritmetik ortalamanın güven sınırları şu formülle belirlenir:

m gen = M Seçme + tm m

göreceli değer için:

r gen = P Seçme + tm r

nerede m gen ve r gen- genel nüfus için ortalama ve göreceli değerler; m Seçme ve r Seçme- örnek popülasyonda elde edilen ortalama ve bağıl değerlerin değerleri; m m ve m P- ortalama ve bağıl değer hataları; T- Güven kriteri (bir çalışma planlanırken belirlenen ve 2 veya 3'e eşit olabilen doğruluk kriteri); tm güven aralığı veya Δ, örnek çalışmada elde edilen göstergenin marjinal hatasıdır.

Unutulmamalıdır ki kriter değeri T% olarak ifade edilen, hatasız bir tahmin olasılığı (p) ile ilgili bir dereceye kadar. Gerekli doğruluk derecesine sahip bir sonuç elde etme ihtiyacının rehberliğinde araştırmacının kendisi tarafından seçilir. Dolayısıyla, %95,5'lik hatasız bir tahmin olasılığı için, kriterin değeri T%99.7 için 2'dir - 3.

Verilen güven aralığı tahminleri, yalnızca 30'dan fazla gözlemi olan istatistiksel popülasyonlar için kabul edilebilir.Daha küçük bir popülasyon boyutuyla (küçük örnekler), t kriterini belirlemek için özel tablolar kullanılır. Bu tablolarda istenen değer, popülasyon büyüklüğüne karşılık gelen doğrunun kesiştiği noktadadır. (n-1) ve araştırmacı tarafından seçilen hatasız bir tahminin (%95,5; %99,7) olasılık düzeyine karşılık gelen bir sütun. Tıbbi araştırmalarda herhangi bir gösterge için güven sınırları belirlenirken hatasız bir tahminin olma olasılığı %95,5 ve üzeri olarak kabul edilir. Bu, örneklem popülasyonunda elde edilen gösterge değerinin, vakaların en az %95,5'inde genel popülasyonda bulunması gerektiği anlamına gelir.

    Dersin konusuyla ilgili sorular:

    İstatistiksel popülasyondaki bir özelliğin çeşitliliğinin göstergelerinin alaka düzeyi.

    Mutlak varyasyon göstergelerinin genel özellikleri.

    Standart sapma, hesaplama, uygulama.

    Göreceli varyasyon göstergeleri.

    Medyan, çeyrek tahmin.

    Araştırma sonuçlarının istatistiksel öneminin değerlendirilmesi.

    Aritmetik ortalamanın standart hatası, hesaplama formülü, kullanım örneği.

    Oranın hesaplanması ve standart hatası.

    Güven düzeyi kavramı, kullanım örneği.

10. Güven aralığı kavramı, uygulaması.

    Konuyla ilgili ödevleri örnek cevaplarla test edin:

1. İLGİLİ VARYASYONUN MUTLAK GÖSTERGELERİ

1) varyasyon katsayısı

2) salınım katsayısı

4) ortanca

2. İLGİLİ DEĞİŞİKLİK GÖSTERGELERİ

1) varyans

4) varyasyon katsayısı

3. AŞIRI DEĞERLERLE BELİRLENEN KRİTER VARYASYON ARALIĞINDA BİR VARYANT

2) genlik

3) varyans

4) varyasyon katsayısı

4. AŞIRI SEÇENEKLERİN FARKI

2) genlik

3) ortalama standart sapma

4) varyasyon katsayısı

5. KARAKTERİN TEK DEĞERLERİNİN ORTALAMA DEĞERLERİNDEN SAPMALARININ ORTALAMA KARESI

1) salınım katsayısı

2) ortanca

3) varyans

6. DEĞİŞİM HIZININ ORTALAMA SİNYAL DEĞERİ İLE İLİŞKİSİ:

1) varyasyon katsayısı

2) standart sapma

4) salınım katsayısı

7. ORTALAMA KARE SAPMA ÖZELLİĞİN ORTALAMA DEĞERİNE ORANI

1) varyans

2) varyasyon katsayısı

3) salınım katsayısı

4) genlik

8. DEĞİŞİKLİK ARALIĞININ ORTAINDA OLAN VE İKİ EŞİT PARÇAYA BÖLÜREN SEÇENEK - BU

1) ortanca

3) genlik

9. TIBBİ ARAŞTIRMALARDA HERHANGİ BİR GÖSTERGE İÇİN GİZLİ SINIRLAR OLUŞTURULURKEN HATASIZ BİR TAHMİN OLASILIĞI KABUL EDİLİR

10. GENEL TOPLAMDA 100 ÖRNEKTEN 90 ÖRNEĞİ PARAMETRE İÇİN DOĞRU TAHMİN VERİYORSA BU BİR GÜVEN ANLAMINA GELMEKTEDİR P EŞİT

11. 100 NUMUNEDEN 10 ÖRNEK YANLIŞ TAHMİN VERİLDİĞİ TAKTİRDE HATA OLASILIĞI EŞİTTİR

12. ORTALAMA VEYA GÖRSEL DEĞERLERİN SINIRLARI, DIŞINDA, RANDEVU TİTREŞİMLERİ NEDENİYLE ÖNEMLİ OLMAYAN BİR OLASILIĞI

1) güven aralığı

2) genlik

4) varyasyon katsayısı

13. KOLEKSİYONUN KÜÇÜK BİR ÖRNEK

1) n, 100'den küçük veya 100'e eşit

2) n, 30'dan küçük veya eşittir

3) n, 40'tan küçük veya 40'a eşittir

4) n 0'a yakın

14. HATASIZ ÖNGÖRME KRİTER DEĞERİ %95 OLASILIĞI İÇİN T YAPAR

15. HATASIZ BİR TAHMİN DEĞERİ KRİTERİNİN %99 OLASILIĞI İÇİN T YAPAR

16. NORMAL DAĞILIMLAR İÇİN DEĞİŞİKLİK KATSAYISI AŞMADIĞINDA TOPLAMA ÜNİFORMA DEĞERLENDİRİLİR

17. SAYISAL DEĞERLERİ BU ARALIKTA OLABİLECEK MAKSİMUM %25'İN AŞAMADIĞI VARYANT AYIRMA SEÇENEKLERİ

2) alt çeyrek

3) üst çeyrek

4) çeyrek

18. OBJEKTİF GERÇEĞİ ÇIKARMAYAN VE DOĞRU YANSIMAYAN VERİLERE DÖNÜŞ YAPILIR.

1) imkansız

2) eşit derecede mümkün

3) güvenilir

4) rastgele

19. "ÜÇ SIGMA" KURALINA GÖRE, ÖZELLİĞİN SINIRLARDAKİ NORMAL DAĞILIMI İLE
YERLEŞTİRİLECEK

1) %68,3 opsiyon

Standart sapma, tanımlayıcı istatistiklerden elde edilen oynaklığın klasik bir göstergesidir.

Standart sapma, standart sapma, RMSD, örnek standart sapma (İngilizce standart sapma, STD, STDev) - tanımlayıcı istatistiklerde çok yaygın bir dağılım göstergesi. Ama o zamandan beri teknik analiz istatistiklere benzer, bu gösterge, analiz edilen enstrümanın fiyatının zaman içindeki dağılım derecesini tespit etmek için teknik analizde kullanılabilir (ve kullanılmalıdır). Yunan sembolü Sigma "σ" ile gösterilir.

Bize standart sapmayı kullanma fırsatı verdikleri için Karlam Gauss ve Pearson'a teşekkürler.

kullanma teknik analizde standart sapma, bunu çeviriyoruz saçılma faktörü"v Volatilite göstergesi“, Anlamı korumak, ancak terimleri değiştirmek.

standart sapma nedir

Ancak ara yardımcı hesaplamalara ek olarak, standart sapma kendi kendine hesaplama için oldukça kabul edilebilir ve teknik analiz uygulamaları. Dulavratotu dergimizin hevesli bir okuyucusunun belirttiği gibi, “ Yurt içi işlem merkezlerinin standart göstergeleri grubuna RMS'nin neden dahil edilmediğini hala anlamıyorum«.

Yok canım, standart sapma, enstrümanın oynaklığını klasik ve "saf" bir şekilde ölçebilir... Ne yazık ki, bu gösterge menkul kıymetlerin analizinde çok yaygın değildir.

Standart sapmanın uygulanması

Standart sapmayı manuel olarak hesaplamak çok ilginç değil ama deneyim için yararlıdır. Standart sapma ifade edilebilir STD = √ [(∑ (xx) 2) / n] formülüyle, bu, örnekteki öğeler arasındaki farkların karelerinin toplamının kökü ve örnekteki öğe sayısına bölünen ortalama gibi .

Örnekteki eleman sayısı 30'u geçerse, kesrin kök altındaki paydası n-1 değerini alır. Aksi takdirde, n kullanılır.

Adım adım standart sapmanın hesaplanması:

  1. veri örneğinin aritmetik ortalamasını hesaplayın
  2. bu ortalamayı numunenin her bir elemanından çıkarın
  3. ortaya çıkan tüm farkların karesi alınır
  4. ortaya çıkan tüm kareleri toplayın
  5. elde edilen toplamı örnekteki eleman sayısına bölün (veya n> 30 ise n-1'e)
  6. elde edilen bölümün karekökünü hesaplayın ( denir varyans)

Varyasyonun en mükemmel özelliği, standart (veya standart sapma) olarak adlandırılan standart sapmadır. Standart sapma() özelliğin bireysel değerlerinin aritmetik ortalamadan sapmalarının ortalama karesinin kareköküne eşittir:

Standart sapma basittir:

Gruplandırılmış veriler için ağırlıklı standart sapma kullanılır:

Normal dağılım koşulları altında ortalama kare ve standart doğrusal sapmalar arasında aşağıdaki ilişki gerçekleşir: ~ 1.25.

Varyasyonun ana mutlak ölçüsü olan standart sapma, normal dağılım eğrisinin koordinatlarının değerlerini belirlemek için, numune gözlemini organize etme ve numune özelliklerinin doğruluğunu belirleme ile ilgili hesaplamalarda ve ayrıca değerlendirme yaparken kullanılır. homojen bir popülasyonda bir özelliğin varyasyon sınırları.

Dağılım, çeşitleri, standart sapma.

Rastgele bir değişkenin varyansı- belirli bir rastgele değişkenin yayılmasının bir ölçüsü, yani matematiksel beklentiden sapması. İstatistiklerde, atama veya sıklıkla kullanılır. Kare kök varyansın değeri standart sapma, standart sapma veya standart sapma olarak adlandırılır.

toplam varyans (2) bu varyasyona neden olan tüm faktörlerin etkisi altında bir özelliğin toplamdaki varyasyonunu ölçer. Aynı zamanda gruplama yöntemi sayesinde, gruplama özelliğinden kaynaklanan varyasyonu ve hesaba katılmayan faktörlerin etkisi altında ortaya çıkan varyasyonu izole etmek ve ölçmek mümkündür.

gruplar arası varyans (σ 2 mg) sistematik varyasyonu, yani bir özelliğin etkisi altında ortaya çıkan incelenen özelliğin değerindeki farklılıkları karakterize eder - gruplandırmanın altında yatan bir faktör.

Standart sapma(eş anlamlılar: standart sapma, standart sapma, kare sapma; benzer terimler: standart sapma, standart yayılma) - olasılık teorisi ve istatistikte, matematiksel beklentisine göre rastgele bir değişkenin değerlerinin dağılımının en yaygın göstergesi. Sınırlı değer örnekleri dizisiyle, matematiksel beklenti yerine, örnek popülasyonunun aritmetik ortalaması kullanılır.

Standart sapma, rastgele değişkenin kendisinin ölçüm birimlerinde ölçülür ve aritmetik ortalamanın standart hatasını hesaplamak için, güven aralıkları oluştururken, istatistiksel olarak hipotezleri test ederken, arasındaki doğrusal ilişkiyi ölçerken kullanılır. rastgele değişkenler... Rastgele değişkenin varyansının karekökü olarak tanımlanır.


Standart sapma:

Standart sapma(rastgele bir değişkenin standart sapmasının tahmini x varyansının tarafsız bir tahminine dayanan matematiksel beklentisine göre):

varyans nerede; - benörneğin inci elemanı; - örnek boyut; - örneğin aritmetik ortalaması:

Her iki tahminin de yanlı olduğu belirtilmelidir. V Genel dava tarafsız bir tahmin yapmak imkansızdır. Ancak, yansız varyansın tahminine dayanan tahmin tutarlıdır.

Mod ve medyanı belirlemenin özü, kapsamı ve prosedürü.

Değişen özniteliğin büyüklüğünün göreli özellikleri için istatistiklerdeki güç yasası ortalamalarına ek olarak ve iç yapı dağıtım serileri, esas olarak temsil edilen yapısal ortalamaları kullanır. moda ve ortanca.

Moda- bu, satırın en yaygın çeşididir. Moda, örneğin, müşteriler arasında en çok talep gören kıyafetlerin, ayakkabıların boyutunu belirlemede kullanılır. Ayrık seriler için mod, en yüksek frekansa sahip olandır. Aralık varyasyon serisi için modu hesaplarken, önce mod aralığını (maksimum frekansa göre) ve ardından - özelliğin modal değerinin değerini aşağıdaki formüle göre belirlemek gerekir:

- - moda değeri

- - mod aralığının alt sınırı

- - aralığın değeri

- - mod aralığının frekansı

- moddan önceki aralığın frekansıdır

- modu takip eden aralığın frekansıdır

ortanca - bu, sıralanmış serilerin altında yatan ve bu seriyi iki eşit parçaya bölen özelliğin değeridir.

Frekansların varlığında ayrık bir serideki medyanı belirlemek için, önce frekansların yarısını hesaplayın ve ardından varyantın hangi değerinin üzerine düştüğünü belirleyin. (Sıralanan seri tek sayıda özellik içeriyorsa, medyan sayı şu formülle hesaplanır:

M e = (n (toplamdaki özellik sayısı) + 1) / 2,

özniteliklerin çift sayıda olması durumunda, medyan, satırın ortasındaki iki özelliğin ortalamasına eşit olacaktır).

Hesaplarken medyanlar Bir aralık varyasyon serisi için, önce medyanın bulunduğu medyan aralığını ve ardından medyan değerini aşağıdaki formülü kullanarak belirleyin:

- - gerekli medyan

- - medyanı içeren aralığın alt sınırı

- - aralığın değeri

- - frekansların toplamı veya dizinin üye sayısı

Medyandan önceki aralıkların birikmiş frekanslarının toplamı

- - medyan aralığın sıklığı

Örnek... Moda ve medyanı bulun.

Çözüm:
V bu örnek mod aralığı 25-30 yaş aralığındadır, çünkü bu aralık en yüksek frekansa sahiptir (1054).

Modun büyüklüğünü hesaplayalım:

Bu, öğrencilerin modal yaşının 27 olduğu anlamına gelir.

medyanı hesaplıyoruz... Ortanca aralık 25-30 yaş grubundadır, çünkü bu aralık içinde nüfusu iki eşit parçaya bölen bir değişken vardır (Σf i / 2 = 3462/2 = 1731). Ardından, gerekli sayısal verileri formüle yerleştirir ve medyan değerini alırız:

Bu, öğrencilerin yarısının 27,4 yaşın altında, diğer yarısının 27,4 yaşın üzerinde olduğu anlamına gelmektedir.

Mod ve medyanın yanı sıra sıralanan seriyi 4 eşit parçaya bölen çeyrekler gibi göstergeler kullanılabilir, ondalık- 10 parça ve yüzdelik - 100 parça başına.

Seçici gözlem kavramı ve kapsamı.

seçici gözlem sürekli gözetim uygulaması yapıldığında geçerlidir fiziksel olarak imkansız büyük miktarda veri nedeniyle veya ekonomik olarak pratik olmayan... Fiziksel imkansızlık, örneğin yolcu akışlarını, piyasa fiyatlarını, aile bütçelerini incelerken ortaya çıkar. Ekonomik uygunsuzluk, örneğin tatma, tuğlaları dayanıklılık için test etme, vb. Gibi yıkımlarıyla ilişkili malların kalitesini değerlendirirken ortaya çıkar.

Gözlem için seçilen istatistiksel birimler, bir örnek popülasyonu veya örneği ve bunların tüm dizisini - genel popülasyonu (HS) oluşturur. Bu durumda, örnekteki birim sayısı, n ve tüm HS'de - n... Davranış yok / Nörneğin göreli boyutu veya kesri olarak adlandırılır.

Numune gözlem sonuçlarının kalitesi, numunenin temsil edilebilirliğine, yani HS'de ne kadar temsili olduğuna bağlıdır. Numunenin temsil edilebilirliğini sağlamak için gözlemlemek gerekir rastgele birim seçimi Bir HS biriminin numuneye dahil edilmesinin durum dışında herhangi bir faktörden etkilenmeyeceğini varsayar.

var Rastgele seçmenin 4 yoluörnek için:

  1. aslında rastgele seçim veya "loto yöntemi", istatistiksel miktarlara seri numaraları atandığında, belirli kalemlere (örneğin variller) kaydedilir, bunlar daha sonra bir kapta (örneğin bir torbada) karıştırılır ve rastgele seçilir. Pratikte bu yöntem bir jeneratör kullanılarak gerçekleştirilir. rastgele sayılar veya rastgele sayıların matematiksel tabloları.
  2. Mekanik seçim, her birine göre ( N / n) genel popülasyonun -th değeri. Örneğin, 100.000 değer içeriyorsa ve 1.000'i seçmek istiyorsanız, her 100.000 / 1000 = 100. değer örneğe dahil edilecektir. Ayrıca, sıralanmamışlarsa, ilk yüzde rastgele birincisi seçilir ve diğerlerinin sayısı yüz daha fazla olacaktır. Örneğin, ünite # 19 ilk olduğu ortaya çıktıysa, bir sonraki # 119, ardından # 219, ardından # 319 vb. olmalıdır. Genel popülasyonun birimleri sıralanırsa, önce # 50, ardından # 150, ardından # 250 vb. seçilir.
  3. Heterojen bir veri setinden değerlerin seçimi gerçekleştirilir tabakalı(tabakalı) yol, genel popülasyon önceden rastgele veya mekanik seçimin uygulandığı homojen gruplara ayrıldığında.
  4. Örneklemenin özel bir yolu seri Bireysel niceliklerin rastgele veya mekanik olarak seçildiği, ancak sürekli gözlemin gerçekleştirildiği serilerinin (bir sayıdan bazılarına sıralı diziler) seçildiği seçim.

Örnek gözlemlerin kalitesi ayrıca şunlara da bağlıdır: örnek tip: tekrarlanan veya tekrarlanamaz.

NS yeniden seçim Kullanımdan sonra örneğe veya serilerine giren istatistiksel miktarlar, yeni bir örneğe girme şansına sahip olarak genel popülasyona iade edilir. Ayrıca, genel popülasyonun tüm değerlerinin örneğe dahil edilme olasılığı aynıdır.

Tekrarsız seçim kullanımdan sonra örneğe veya serilerine dahil edilen istatistiksel değerlerin genel popülasyona geri dönmediği ve bu nedenle ikincisinin değerlerinin geri kalanı için bir sonraki örneğe düşme olasılığının arttığı anlamına gelir.

Tekrarlanan örnekleme daha doğru sonuçlar verir, bu nedenle daha sık kullanılır. Ancak uygulanamayacağı durumlar vardır (yolcu akışlarının incelenmesi, tüketici talebi vb.) ve ardından yeniden seçim yapılır.

Marjinal örnekleme hatası gözlem, ortalama örnekleme hatası, hesaplama sırası.

Yukarıdaki örnek popülasyonu oluşturma yöntemlerini ve bu durumda ortaya çıkan hataları ayrıntılı olarak ele alalım. temsil edilebilirlik .
aslında rastgeleörnek, herhangi bir sistematik unsur olmaksızın genel popülasyondan rastgele bir birim seçimine dayanmaktadır. Teknik olarak, uygun rastgele seçim, kura çekilerek (örneğin, piyango çekilişleri) veya bir rastgele sayılar tablosuna göre yapılır.

Aslında "saf haliyle" rastgele seçim, seçici gözlem uygulamasında nadiren kullanılır, ancak diğer seçim türleri arasında ilkidir, seçici gözlemin temel ilkelerini uygular. Basit bir rastgele örnek için örnekleme yöntemi teorisi ve hata formülü ile ilgili bazı soruları ele alalım.

Örnek gözlem hatası parametrenin genel popülasyondaki değeri ile örnek gözlem sonuçlarından hesaplanan değeri arasındaki farktır. Ortalama nicel bir özellik için örnekleme hatası belirlenir

Gösterge marjinal örnekleme hatası olarak adlandırılır.
Örnek ortalama, alabilen rastgele bir değişkendir. Farklı anlamlarörnekleme hangi birimlerin dahil edildiğine bağlı olarak. Bu nedenle örnekleme hataları da rastgele değerlerdir ve farklı değerler alabilir. Bu nedenle, ortalama olası hatalar - ortalama örnekleme hatası hangisine bağlıdır:

Örnek boyutu: sayı ne kadar büyükse, ortalama hatanın değeri o kadar düşük olur;

İncelenen özelliğin değişim derecesi: Özelliğin varyansı ne kadar küçükse ve sonuç olarak varyans ne kadar küçükse, ortalama örnekleme hatası o kadar küçüktür.

NS rastgele yeniden seçim ortalama hata hesaplanır:
.
Uygulamada, genel varyans tam olarak bilinmemekle birlikte, olasılık teorisi Kanıtlandı
.
Yeterince büyük n'nin değeri 1'e yakın olduğundan, bunu varsayabiliriz. Daha sonra ortalama örnekleme hatası hesaplanabilir:
.
Ancak küçük bir örneklem durumunda (n için<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

NS rastgele kopyalanmayan örnek verilen formüller değere göre düzeltilir. O zaman ortalama tekrarlamayan örnekleme hatası:
ve .
Çünkü her zaman daha azdır, o zaman çarpan () her zaman 1'den küçüktür. Bu, tekrarlı olmayan seçimdeki ortalama hatanın her zaman tekrarlı seçimdekinden daha az olduğu anlamına gelir.
mekanik örnekleme genel nüfus bir şekilde sıralandığında kullanılır (örneğin, alfabetik seçmen listeleri, telefon numaraları, ev numaraları, apartmanlar). Birimlerin seçimi, numunenin yüzdesinin karşılıklılığına eşit olan belirli bir aralıkta gerçekleştirilir. Böylece, %2'lik bir örnekle, her 50 birim = 1 / 0.02, genel popülasyonun her biri %5'i 1 / 0.05 = 20 birim olacak şekilde seçilir.

Referans noktası farklı şekillerde seçilir: referans noktasında bir değişiklikle aralığın ortasından rastgele. Burada önemli olan sistematik hatadan kaçınmaktır. Örneğin, %5'lik bir örnekle, ilk birim 13 ise sonraki 33, 53, 73 vb.

Doğruluk açısından, mekanik seçim rastgele örneklemeye yakındır. Bu nedenle, mekanik örneklemenin ortalama hatasını belirlemek için uygun rastgele seçim formülleri kullanılır.

NS tipik seçim Ankete katılan nüfus, ön olarak aynı türden homojen gruplara bölünür. Örneğin, işletmeleri incelerken bunlar endüstriler, alt sektörler olabilir; nüfus incelenirken bunlar bölgeler, sosyal veya yaş grupları olabilir. Ardından, her gruptan ya mekanik olarak ya da tamamen rastgele bir şekilde bağımsız bir seçim yapılır.

Tipik örnekleme, diğer yöntemlere göre daha doğru sonuçlar verir. Genel popülasyonun tiplendirilmesi, her tipolojik grubun örneklemde temsil edilmesini sağlar, bu da gruplar arası varyansın ortalama örnekleme hatası üzerindeki etkisini hariç tutmayı mümkün kılar. Sonuç olarak, varyans ekleme kuralına göre tipik bir örneğin hatasını bulurken (), yalnızca grup varyanslarının ortalamasını dikkate almak gerekir. Sonra ortalama örnekleme hatası:
yeniden seçimde
,
yeniden seçim olmadan
,
nerede örneklemdeki grup içi varyansların ortalamasıdır.

Seri (veya iç içe) seçim genel popülasyonun örneklem araştırmasının başlamasından önce serilere veya gruplara bölünmesi durumunda geçerlidir. Bu seriler bitmiş ürünlerin, öğrenci gruplarının, tugayların paketlenmesi olabilir. Anket için seriler mekanik olarak veya tamamen rastgele bir şekilde seçilir ve seri içinde sürekli bir birim anketi yapılır. Bu nedenle, ortalama örnekleme hatası yalnızca aşağıdaki formülle hesaplanan gruplar arası (seriler arası) varyansa bağlıdır:

burada r, seçilen serilerin sayısıdır;
- i-th serisinin ortalaması.

Ortalama seri örnekleme hatası hesaplanır:

yeniden seçim üzerine:
,
tekrarlanmayan bir seçimle:
,
burada R, toplam seri sayısıdır.

kombine seçim dikkate alınan seçim yöntemlerinin bir kombinasyonudur.

Herhangi bir seçim yöntemi için ortalama örnekleme hatası, esas olarak örneğin mutlak boyutuna ve daha az ölçüde örneğin yüzdesine bağlıdır. İlk durumda 4500 birimlik bir genel popülasyondan ve ikinci durumda 225000 birimden 225 gözlem yapıldığını varsayalım. Her iki durumda da varyanslar 25'e eşittir. Ardından, ilk durumda, %5 örnekleme ile örnekleme hatası şöyle olacaktır:

İkinci durumda, %0,1 seçim ile şuna eşit olacaktır:


Böylece, numunenin yüzdesinde 50 kat azalma ile, numunenin boyutu değişmediğinden örnekleme hatası önemsiz derecede arttı.
Örnek boyutunun 625 gözleme yükseltildiğini varsayalım. Bu durumda, örnekleme hatası:

Genel popülasyonla aynı büyüklükte örneklemde 2,8 faktörlük bir artış, örnekleme hatasının boyutunu 1,6 kattan fazla azaltır.

Numune oluşturma yöntemleri ve yolları.

İstatistikte, araştırmanın amaçlarına göre belirlenen ve çalışma nesnesinin özelliklerine bağlı olan çeşitli örnek kümeleri oluşturma yöntemleri kullanılır.

Örneklem araştırması yapmanın temel koşulu, örnekleme dahil edilecek genel popülasyonun her birimi için fırsat eşitliği ilkesinin ihlalinden kaynaklanan sistematik hataların oluşmasını önlemektir. Sistematik hataların önlenmesi, bilimsel temelli bir örneklem popülasyonu oluşturma yöntemlerinin kullanılması sonucunda elde edilir.

Genel popülasyondan birimleri seçmenin aşağıdaki yolları vardır:

1) bireysel seçim - numunede bireysel birimler seçilir;

2) grup seçimi - niteliksel olarak homojen gruplar veya incelenen birimlerin serileri örneğe girer;

3) Birleşik seçim, bireysel ve grup seçiminin birleşimidir.
Seçim yöntemleri, örnek popülasyonun oluşturulmasına ilişkin kurallar tarafından belirlenir.

Örnek olabilir:

  • uygun tesadüfiörnek popülasyonun, genel popülasyondan rastgele (kasıtsız) bireysel birimlerin seçiminin bir sonucu olarak oluşması gerçeğinden oluşur. Bu durumda, örneklem popülasyonu için seçilen birimlerin sayısı, genellikle, örneklemin kabul edilen oranı temelinde belirlenir. Numunenin oranı, numune n'deki birim sayısının genel N popülasyonundaki birim sayısına oranıdır, yani.
  • mekanikörneklem popülasyonundaki birimlerin seçiminin genel popülasyondan eşit aralıklara (gruplara) ayrılmış olarak yapılmasından ibarettir. Ayrıca, genel popülasyondaki aralığın büyüklüğü, örneklem oranının tersine eşittir. Bu nedenle, %2'lik bir örnekle, her 50. birimde bir (1: 0.02), %5'lik bir örnekle, her 20. birimde bir (1: 0.05), vb. seçilir. Böylece, kabul edilen seçim payına göre, genel nüfus, mekanik olarak eşit büyüklükteki gruplara bölünmüştür. Her gruptan sadece bir birim seçilir.
  • tipik - genel popülasyonun ilk önce homojen tipik gruplara ayrıldığı. Daha sonra, her bir tipik gruptan, uygun rastgele veya mekanik örnekleme yoluyla, örnek popülasyona ayrı bir birim seçimi yapılır. Tipik numunenin önemli bir özelliği, numunedeki diğer birimleri seçme yöntemlerine kıyasla daha doğru sonuçlar vermesidir;
  • seri- genel nüfusun aynı büyüklükteki gruplara ayrıldığı - seriler. Numune için seriler seçilir. Seri içerisinde, seriye dahil olan birimlerin sürekli gözlemi yapılır;
  • kombine- örnek iki aşamalı olabilir. Bu durumda, genel nüfus önce gruplara ayrılır. Daha sonra gruplar seçilir ve ikincisi içinde bireysel birimler seçilir.

İstatistikte, bir örnek popülasyondaki birimleri seçmenin aşağıdaki yöntemleri ayırt edilir::

  • tek aşamalıörnekleme - seçilen her birim, belirli bir kritere göre hemen incelenir (uygun rastgele ve seri örnekleme);
  • çok aşamalıörnekleme - seçim, bireysel grupların genel popülasyonundan yapılır ve bireysel birimler gruplardan seçilir (örnek popülasyonunda birimlerin seçilmesi için mekanik bir yöntemle tipik örnekleme).

Ek olarak, aşağıdakiler arasında bir ayrım yapılır:

  • yeniden seçim- iade edilen top şemasına göre. Ayrıca, örnekleme giren her birim veya seri, genel popülasyona geri döner ve dolayısıyla tekrar örnekleme girme şansına sahiptir;
  • tekrarsız seçim- iade edilmemiş bir topun şemasına göre. Aynı örneklem büyüklüğü ile daha doğru sonuçlara sahiptir.

Gerekli numune boyutunun belirlenmesi (Öğrenci tablosunu kullanarak).

Örnekleme teorisindeki bilimsel ilkelerden biri, yeterli sayıda örneklenmiş birim sağlamaktır. Teorik olarak, bu ilkeye uyma ihtiyacı, yeterli olması için genel popülasyondan hangi hacimde birimlerin seçilmesi gerektiğini belirlemeyi mümkün kılan olasılık teorisinin limit teoremlerinin kanıtlarında sunulmaktadır. örneğin temsil edilebilirliği.

Numunenin standart hatasında bir azalma ve sonuç olarak, tahminin doğruluğundaki bir artış, her zaman numune büyüklüğündeki bir artışla ilişkilidir, bu nedenle, zaten bir numune gözlemi düzenleme aşamasında, karar vermek gerekir. gözlem sonuçlarının gerekli doğruluğunu sağlamak için örnek popülasyonunun büyüklüğünün ne olması gerektiği sorusu. Gerekli örneklem büyüklüğünün hesaplanması, belirli bir tür ve seçim yöntemine karşılık gelen marjinal örnekleme hataları (A) için formüllerden türetilen formüller kullanılarak yapılır. Yani, rastgele tekrarlanan bir örneklem büyüklüğü (n) için:

Bu formülün özü, gerekli boyutun rastgele tekrarlanan seçimiyle, örnek boyutunun güven katsayısının karesiyle doğru orantılı olmasıdır. (t2) ve varyasyon özelliğinin varyansı (? 2) ve marjinal örnekleme hatasının karesiyle (? 2) ters orantılıdır. Özellikle, marjinal hatanın iki katına çıkarılmasıyla, gerekli örneklem boyutu dört kat azaltılabilir. Üç parametreden ikisi (t ve?) araştırmacı tarafından belirlenir.

Bu durumda araştırmacı, devam edenÖrnek anketin amaçları doğrultusunda şu soruyu çözmelidir: optimal seçeneği sağlamak için bu parametreleri hangi nicel kombinasyonda dahil etmek daha iyidir? Bir durumda, elde edilen sonuçların güvenilirliğinden (t) bir doğruluk ölçüsünden (?) daha memnun olabilir, Diğerinde - tam tersi. Araştırmacı, örneklem gözleminin tasarım aşamasında bu göstergeye sahip olmadığından, marjinal örnekleme hatasının değeri ile ilgili sorunu çözmek daha zordur, bu nedenle uygulamada, marjinal örnekleme hatasını bir örnek olarak ayarlamak gelenekseldir. kuralı, özelliğin beklenen ortalama seviyesinin %10'una kadar. Varsayılan bir ortalamanın oluşturulmasına farklı şekillerde yaklaşılabilir: benzer önceki anketlerden elde edilen verileri kullanmak veya bir örnekleme çerçevesinden gelen verileri kullanmak ve küçük bir deneme örneği yapmak.

Bir örnek gözlem tasarlarken, formül (5.2)'deki üçüncü parametreyi - örnek popülasyonun varyansını - oluşturmak en zorudur. Bu durumda, daha önceki benzer ve pilot araştırmalarda elde edilen, araştırmacının elindeki tüm bilgilerin kullanılması gerekir.

tanımlama sorusuÖrneklem araştırması, örnekleme birimlerinin çeşitli özelliklerinin çalışılmasını içeriyorsa, gerekli örneklem büyüklüğü karmaşıktır. Bu durumda, özelliklerin her birinin ortalama seviyeleri ve varyasyonları genellikle farklıdır ve bu nedenle, yalnızca özelliklerin amaç ve hedeflerini dikkate alarak, hangi özellik varyansının tercih edileceği sorusuna karar vermek mümkündür. anket.

Örnek bir gözlem tasarlarken, belirli bir çalışmanın görevlerine ve gözlem sonuçlarına dayalı sonuçların olasılığına göre izin verilen örnekleme hatasının önceden belirlenmiş bir değeri varsayılır.

Genel olarak, numune ortalamasının marjinal hatası formülü aşağıdakileri belirlemeyi mümkün kılar:

Genel popülasyonun göstergelerinin örnek popülasyonun göstergelerinden olası sapmalarının miktarı;

Olası hata sınırlarının belirli bir değeri aşmadığı, gerekli doğruluğu sağlayan numunenin gerekli boyutu;

Örnekteki hatanın belirli bir limite sahip olma olasılığı.

Öğrencinin t dağılımı olasılık teorisinde, kesinlikle sürekli dağılımların tek parametreli bir ailesidir.

Dinamikler dizisi (aralık, moment), dinamik sıralarının kapanması.

Dinamik satırlar- bunlar, belirli bir kronolojik sırada sunulan istatistiksel göstergelerin değerleridir.

Her zaman serisi iki bileşen içerir:

1) zaman periyotlarının göstergeleri (yıllar, çeyrekler, aylar, günler veya tarihler);

2) incelenen nesneyi zaman periyotları veya seri seviyeleri olarak adlandırılan ilgili tarihler için karakterize eden göstergeler.

Seri seviyeleri ifade edilir hem mutlak hem de ortalama veya göreli değerler. Göstergelerin doğasına bağlı olarak, dinamik mutlak, bağıl ve ortalama değerler serisi oluşturulur. Göreceli ve ortalama değerlerden dinamik diziler, türetilmiş mutlak değerler dizisi temelinde oluşturulur. Aralık ve moment serileri dinamikleri arasında ayrım yapın.

Dinamik aralık serisi belirli zaman dilimleri için göstergelerin değerlerini içerir. Aralık serilerinde, daha uzun bir süre boyunca olgunun hacmini veya sözde birikmiş toplamları elde ederek seviyeler toplanabilir.

Dinamik tork serisi zaman içinde belirli bir noktadaki (tarihteki) göstergelerin değerlerini yansıtır. Moment serilerinde araştırmacı sadece fenomenlerin farklılığı ile ilgilenebilir, burada seviyelerin toplamının gerçek bir içeriği olmadığı için, belirli tarihler arasındaki serilerin seviyesindeki değişimi yansıtan. Birikmiş toplamlar burada hesaplanmaz.

Zaman serilerinin doğru kurgulanması için en önemli koşul, farklı dönemlere ait serilerin seviyelerinin karşılaştırılabilir olmasıdır. Düzeyler homojen miktarlarda sunulmalı ve olgunun farklı bölümleri eşit derecede kapsamlı olmalıdır.

NS gerçek dinamiklerin bozulmasını önlemek için, istatistiksel çalışmada, zaman serilerinin istatistiksel analizinden önce gelen ön hesaplamalar (dinamik serisi kapatılarak) yapılır. Dinamik serisinin kapatılması, seviyeleri farklı metodolojiye göre hesaplanan veya bölgesel sınırlara karşılık gelmeyen iki veya daha fazla serinin bir satırda birleştirilmesi olarak anlaşılır. Dinamik dizilerinin yakınsaması, dinamikler dizisinin mutlak düzeylerinin ortak bir temele getirilmesi anlamına da gelebilir, bu da dinamik dizilerinin düzeylerinin karşılaştırılamazlığını ortadan kaldırır.

Dinamikler, katsayılar, büyüme ve büyüme oranları serisinin karşılaştırılabilirliği kavramı.

Dinamik satırlar- zamanla doğal ve sosyal olayların gelişimini karakterize eden bir dizi istatistiksel gösterge. Rusya'nın Goskomstat'ı tarafından yayınlanan istatistiksel derlemeler, tablo biçiminde çok sayıda dinamik dizi içerir. Dinamikler dizisi, incelenen fenomenlerin gelişim modellerini ortaya çıkarmayı mümkün kılar.

Dinamik serisi iki tür gösterge içerir. Zaman göstergeleri(yıllar, çeyrekler, aylar vb.) veya zaman içindeki noktalar (yılın başında, her ayın başında vb.). Satır düzeyi göstergeleri... Dinamikler dizisinin seviyelerinin göstergeleri, mutlak değerler (bir ürünün ton veya ruble cinsinden üretimi), göreceli değerler (şehir nüfusunun% olarak payı) ve ortalama değerler (ortalama ücretler) olarak ifade edilebilir. yıllara göre sektördeki işçiler, vb.). Tablo biçiminde, dinamik bir satır iki sütun veya iki satır içerir.

Dinamikler dizisinin doğru yapısı, bir dizi gereksinimin yerine getirilmesini gerektirir:

  1. bir dizi dinamiğin tüm göstergeleri bilimsel olarak temellendirilmeli, güvenilir olmalıdır;
  2. bir dizi dinamiğin göstergeleri zaman içinde karşılaştırılabilir olmalıdır, yani. aynı zaman dilimleri veya aynı tarihler için hesaplanmalıdır;
  3. bir dizi dinamiğin göstergeleri bölge genelinde karşılaştırılabilir olmalıdır;
  4. bir dizi dinamiğin göstergeleri içerik açısından karşılaştırılabilir olmalıdır, yani. aynı şekilde birleşik bir metodolojiye göre hesaplanır;
  5. bir dizi dinamiğin göstergeleri, dikkate alınan çiftlikler aralığında karşılaştırılabilir olmalıdır. Bir dizi dinamiğin tüm göstergeleri aynı ölçü birimlerinde verilmelidir.

istatistiksel göstergeler ya belirli bir süre boyunca incelenen sürecin sonuçlarını ya da incelenen olgunun belirli bir zaman noktasındaki durumunu karakterize edebilir, yani. göstergeler aralıklı (periyodik) ve anlık olabilir. Buna göre, ilk dinamik serisi, aralıklı veya anlık olabilir. Anlık dinamikler dizisi, sırayla, eşit ve eşit olmayan zaman aralıklarıyla olabilir.

Orijinal dinamik serisi, bir dizi ortalama değere ve bir dizi göreceli değere (zincir ve temel) dönüştürülebilir. Bu tür dinamik serilere türetilmiş dinamik serileri denir.

Dinamik serideki ortalama seviyeyi hesaplama metodolojisi, dinamik seri tipi nedeniyle farklıdır. Örnekleri kullanarak, ortalama seviyeyi hesaplamak için dinamik dizi türlerini ve formülleri ele alacağız.

Mutlak kazançlar (Δy) serinin bir sonraki düzeyinin bir öncekine göre (sütun 3. - mutlak zincir artışları) veya başlangıç ​​düzeyine (sütun 4. - temel mutlak artışlar) göre kaç birim değiştiğini gösterir. Hesaplama formülleri aşağıdaki gibi yazılabilir:

Serinin mutlak değerlerinde bir azalma ile sırasıyla "azalma", "azalma" olacaktır.

Mutlak büyüme endeksleri, örneğin, 1998'de "A" ürününün üretiminin 1997'ye göre 4 bin ton, 1994'e göre ise 34 bin ton arttığını; geri kalan yıllar için tabloya bakınız. 11,5 gr 3 ve 4.

Büyüme oranı serinin seviyesinin bir öncekine (sütun 5 - zincir büyüme veya düşüş katsayıları) veya başlangıç ​​seviyesine (sütun 6 - temel büyüme veya düşüş katsayıları) kıyasla kaç kez değiştiğini gösterir. Hesaplama formülleri aşağıdaki gibi yazılabilir:

büyüme oranlarıönceki seviyeyle (sütun 7 - zincir büyüme oranları) veya başlangıç ​​seviyesiyle (sütun 8 - temel büyüme oranları) karşılaştırıldığında dizinin bir sonraki seviyesinin yüzde kaç olduğunu gösterin. Hesaplama formülleri aşağıdaki gibi yazılabilir:

Örneğin, 1997'de "A" ürününün üretim hacmi 1996'ya kıyasla %105,5'ti (

Büyüme oranı raporlama dönemi seviyesinin bir öncekine (sütun 9 - zincir büyüme oranları) veya ilk seviyeye (sütun 10 - temel büyüme oranları) kıyasla yüzde kaç arttığını gösterin. Hesaplama formülleri aşağıdaki gibi yazılabilir:

T pr = T p - %100 veya T pr = önceki dönemin mutlak artışı / seviyesi * %100

Örneğin, 1996'da 1995'e kıyasla "A" ürünü %3.8 (%103.8 - %100) veya (8:210) x %100 ve 1994'e kıyasla - %9 (%109 - 100) üretildi. %).

Bir satırdaki mutlak seviyeler azalırsa, oran %100'den az olacak ve buna bağlı olarak bir düşüş oranı (eksi işaretli büyüme oranı) olacaktır.

%1 kazancın mutlak değeri(sütun 11), önceki dönemin seviyesinin %1 artması için belirli bir dönemde kaç adet üretilmesi gerektiğini gösterir. Örneğimizde, 1995'te 2.0 bin ton ve 1998'de - 2.3 bin ton, yani. Daha büyük.

%1'lik bir artışın mutlak değerinin büyüklüğünü belirlemenin iki yolu vardır:

Önceki dönemin seviyesini 100'e bölün;

Zincir mutlak artışlarını karşılık gelen zincir büyüme oranlarına bölün.

%1 kazancın mutlak değeri =

Dinamiklerde, özellikle uzun bir süre boyunca, her artış veya azalma yüzdesinin içeriği ile büyüme oranlarının ortak bir analizi önemlidir.

Dinamiğin dizisini analiz etmenin dikkate alınan yönteminin, hem seviyeleri mutlak değerlerle (t, bin ruble, çalışan sayısı vb.) seviyeleri göreceli göstergeler (hurda yüzdesi, kömürün % kül içeriği vb.) veya ortalama değerler (merkez / ha cinsinden ortalama verim, ortalama ücretler vb.) ile ifade edilen dinamiklerin.

Her yıl için önceki veya başlangıç ​​düzeyine göre hesaplanan, dikkate alınan analitik göstergelerle birlikte, dinamik serisini analiz ederken, dönem için ortalama analitik göstergeleri hesaplamak gerekir: serinin ortalama seviyesi, yıllık ortalama mutlak artış (azalış) ve ortalama yıllık büyüme oranı ve büyüme oranı.

Bir dizi dinamiğin ortalama düzeyini hesaplama yöntemleri yukarıda tartışılmıştır. İncelediğimiz dinamik aralık serisinde, serinin ortalama seviyesi basit aritmetik ortalama formülü kullanılarak hesaplanır:

1994-1998 için bir ürünün ortalama yıllık üretimi 218,4 bin ton olarak gerçekleşti.

Ortalama yıllık mutlak büyüme de basit aritmetik ortalama formülü kullanılarak hesaplanır:

Yıllık mutlak artışlar yıllar içinde 4 ila 12 bin ton arasında değişiyordu (bkz. sütun 3) ve 1995 - 1998 dönemi için üretimdeki ortalama yıllık artış. 8,5 bin ton olarak gerçekleşti.

Ortalama büyüme oranını ve ortalama büyüme oranını hesaplama yöntemleri daha ayrıntılı değerlendirme gerektirir. Tabloda gösterilen seri seviyesinin yıllık göstergeleri örneğini kullanarak bunları ele alalım.

Bir dizi dinamiğin ortalama seviyesi.

Bir dizi dinamik (veya zaman serisi) belirli bir istatistiğin ardışık anlarda veya zaman dilimlerinde (yani kronolojik sıraya göre düzenlenmiş) sayısal değerleridir.

Bir dizi dinamiği oluşturan bir veya başka bir istatistiksel göstergenin sayısal değerlerine denir. seviyeleri ve genellikle harfle gösterilir y... Serinin ilk üyesi 1 ilk olarak adlandırılan veya temel ve sonuncusu y n - son... Seviyelerin atıfta bulunduğu anlar veya zaman periyotları şu şekilde gösterilir: T.

Dinamik serisi, kural olarak, bir tablo veya grafik şeklinde sunulur ve zaman ölçeği, apsis ekseni boyunca çizilir. T, ve ordinatta - serinin seviyelerinin ölçeği y.

Bir dizi dinamiğin ortalama göstergeleri

Dinamiklerin her satırı bir tür toplama olarak görülebilir. n ortalamalar olarak özetlenebilecek zamana göre değişen göstergeler. Bu tür genelleştirilmiş (ortalama) göstergeler, farklı dönemlerde, farklı ülkelerde vb. belirli bir göstergedeki değişiklikleri karşılaştırırken özellikle gereklidir.

Bir dizi dinamiğin genelleştirilmiş bir özelliği, öncelikle sıranın orta seviyesi... Ortalama seviyeyi hesaplama yöntemi, bunun bir moment serisi mi yoksa bir aralık (periyot) serisi mi olduğuna bağlıdır.

Ne zaman Aralık Serinin ortalama seviyesi, serinin seviyelerinden basit bir aritmetik ortalama formülü ile belirlenir, yani.

=
Varsa an içeren satır n seviyeler ( y1, y2,…, yn) tarihler arasında eşit aralıklarla (zamandaki noktalar), o zaman böyle bir dizi kolayca bir dizi ortalamaya dönüştürülebilir. Bu durumda, her dönemin başındaki gösterge (seviye), aynı anda bir önceki dönemin sonundaki göstergedir. Daha sonra göstergenin her dönem için ortalama değeri (tarihler arasındaki aralık) değerlerin yarısı olarak hesaplanabilir. NS dönemin başında ve sonunda, yani. nasıl . Bu tür ortalamaların sayısı olacaktır. Daha önce belirtildiği gibi, ortalamalar serisi için ortalama seviye, aritmetik ortalamadan hesaplanır.

Bu nedenle şunları yazabiliriz:
.
Payı dönüştürdükten sonra şunu elde ederiz:
,

nerede Y1 ve Yn- sıranın ilk ve son seviyeleri; Yi- orta seviyeler.

Bu ortalama istatistiklerde şu şekilde bilinir: ortalama kronolojik Moment serisi için. Bu ismi "cronos" (zaman, enlem) kelimesinden almıştır, çünkü zamanla değişen göstergelerden hesaplanmıştır.

Eşitsizlik durumunda tarihler arasındaki aralıkların kronolojik ortalaması, her bir an çifti için seviyelerin ortalama değerlerinin aritmetik ortalaması olarak hesaplanabilir, tarihler arasındaki mesafe (zaman aralıkları) ile ağırlıklandırılır, yani.
.
Bu durumda Tarihler arasındaki aralıklarda seviyelerin farklı değerler aldığı varsayılır ve bilinen ikisinden biriyiz ( yi ve yi + 1) ortalamaları belirleriz ve bundan sonra analiz edilen dönemin tamamı için genel ortalamayı hesaplarız.
Her bir değerin olduğu varsayılırsa yi bir sonrakine kadar değişmeden kalır (ben + 1)- an, yani seviyelerdeki değişimin kesin tarihi biliniyorsa, hesaplama aritmetik ağırlıklı ortalama formülüne göre yapılabilir:
,

seviyenin değişmeden kaldığı süre nerede.

Dinamik serideki ortalama seviyeye ek olarak, diğer ortalama göstergeler hesaplanır - seri seviyelerindeki ortalama değişiklik (temel ve zincir yöntemlerle), ortalama değişim oranı.

Temel ortalama mutlak değişim son temel mutlak değişimin değişim sayısına bölümüdür. Yani

Zincir mutlak değişim anlamına gelir bir serinin seviyeleri, tüm zincir mutlak değişikliklerin toplamının değişiklik sayısına bölünmesinin bölümüdür, yani

Ortalama mutlak değişikliklerin işareti, fenomendeki ortalama değişikliğin doğasını yargılamak için de kullanılır: büyüme, düşüş veya istikrar.

Temel ve zincir mutlak değişikliklerin kontrol kuralından, temel ve zincir ortalama değişikliğin eşit olması gerektiği sonucu çıkar.

Ortalama mutlak değişimin yanı sıra, temel ve zincirleme yöntemler kullanılarak bağıl ortalama da hesaplanır.

Temel ortalama göreli değişiklik formülle belirlenir:

Zincir ortalama bağıl değişim formülle belirlenir:

Doğal olarak, temel ve zincir ortalama nispi değişiklikler aynı olmalıdır ve bunları kriter değeri 1 ile karşılaştırarak, fenomendeki ortalama değişikliğin doğası hakkında bir sonuca varılır: büyüme, düşüş veya istikrar.
Göreceli değişimin taban çizgisinden veya zincir ortalamasından 1 çıkarılarak, karşılık gelen ortalama değişim oranı, hangi dinamikler dizisi tarafından yansıtılan, incelenen fenomendeki değişimin doğasını yargılamak da mümkündür.

Mevsimsel dalgalanmalar ve mevsimsellik endeksleri.

Mevsimsel dalgalanmalar, sabit yıl içi dalgalanmalardır.

Maksimum etkiyi elde etmeyi yönetmenin temel prensibi, geliri maksimize etmek ve maliyetleri minimize etmektir. Mevsimsel dalgalanmaları inceleyerek, yılın her düzeyinde maksimum denklem sorunu çözülür.

Mevsimsel dalgalanmaları incelerken birbiriyle ilişkili iki görev çözülür:

1. Yıl içi dinamiklerde olgunun gelişiminin özelliklerini ortaya çıkarmak;

2. Mevsimsel dalga modelinin oluşturulması ile mevsimsel dalgalanmaların ölçülmesi;

Mevsimsel dalgalanmaları ölçmek için hindiler genellikle mevsimsellik ile hesaba katılır. Genel olarak, bir dizi dinamiğin ilk denklemlerinin, karşılaştırma için temel teşkil eden teorik denklemlere oranı ile belirlenirler.

Rastgele sapmalar mevsimsel dalgalanmaların üzerine bindirildiğinden, bunları ortadan kaldırmak için mevsimsellik endekslerinin ortalaması alınır.

Bu durumda, yıllık döngünün her dönemi için, genelleştirilmiş göstergeler ortalama mevsimsel endeksler şeklinde belirlenir:

Mevsimsel dalgalanmaların ortalama endeksleri, ana gelişme eğiliminin rastgele sapmalarının etkisinden bağımsızdır.

Trendin doğasına bağlı olarak, ortalama mevsimsellik endeksi formülü aşağıdaki şekillerde olabilir:

1.Belirgin bir ana gelişme eğilimi olan yıl içi dinamikler serisi için:

2. Artan veya azalan trendin olmadığı veya önemsiz olduğu yıl içi dinamikler serisi için:

Genel ortalama nerede;

Ana eğilimi analiz etme yöntemleri.

Olayların zaman içindeki gelişimi, farklı nitelikteki faktörlerden ve etki gücünden etkilenir. Bazıları doğada rastgeledir, diğerleri neredeyse sabit bir etkiye sahiptir ve dinamiklerin saflarında belirli bir gelişme eğilimi oluşturur.

İstatistiklerin önemli bir görevi, çeşitli rastgele faktörlerin etkisinden kurtulmuş serideki eğilimin dinamiklerini belirlemektir. Bu amaçla, dinamik seriler, konsolidasyon aralıkları, hareketli ortalama ve analitik hizalama vb. yöntemlerle işlenir.

Aralıklı kabalaştırma yöntemi bir dizi dinamiğin seviyelerinin ait olduğu zaman periyotlarının genişlemesine dayalıdır, yani. küçük zaman dilimlerine ilişkin verilerin daha büyük dönemlere ait verilerle değiştirilmesidir. Serinin başlangıç ​​seviyeleri kısa süreli olduğunda özellikle etkilidir. Örneğin, günlük olaylarla ilgili gösterge satırları, haftalık, aylık vb. ile ilgili satırlarla değiştirilir. Bu, daha net bir şekilde göstermenizi sağlayacaktır. "Olayın gelişim ekseni"... Genişletilmiş aralıklar üzerinden hesaplanan ortalama, ana gelişme eğiliminin yönünü ve yapısını (büyümenin hızlanması veya yavaşlaması) belirlemeyi mümkün kılar.

Hareketli ortalama yöntemiöncekine benzer, ancak bu durumda gerçek seviyelerin yerini, art arda hareket eden (kayan) genişletilmiş aralıklar için hesaplanan ortalama seviyeler alır. m seri seviyeleri.

Örneğin kabul edersen m = 3, daha sonra ilk önce serinin ilk üç seviyesinin ortalaması hesaplanır, daha sonra aynı sayıda seviyeden, ancak art arda ikinciden başlayarak, sonra üçüncüden başlayarak vb. Böylece, ortalama, olduğu gibi, bir dönem hareket ederek bir dizi dinamik boyunca "kayar". Hesaplanan m hareketli ortalama terimleri, her aralığın ortasına (merkezine) atıfta bulunur.

Bu yöntem yalnızca rastgele dalgalanmaları ortadan kaldırır. Serinin mevsimsel bir dalgası varsa, hareketli ortalama yöntemiyle yumuşatıldıktan sonra kalacaktır.

Analitik hizalama. Rastgele dalgalanmaları ortadan kaldırmak ve bir trend belirlemek için seri seviyelerinin analitik formüllerle hizalanması (veya analitik hizalama) uygulanır. Özü, teorik seviyelerin zamanın bir fonksiyonu olarak kabul edildiği matematiksel bir eğilim modeli olarak kabul edilen belirli bir denkleme göre hesaplanan ampirik (gerçek) seviyeleri teorik olanlarla değiştirmekten ibarettir: Bu durumda, her gerçek seviye iki bileşenin toplamı olarak kabul edilir: sistematik bileşen nerede ve belirli bir denklemle ifade edilir ve trend etrafında dalgalanmalara neden olan rastgele bir değişkendir.

Analitik hizalama görevi aşağıdaki gibidir:

1. Gerçek verilere dayalı olarak, incelenen göstergenin gelişme eğilimini en yeterli şekilde yansıtabilen varsayımsal işlev türünün belirlenmesi.

2. Ampirik verilerden belirtilen fonksiyonun (denklem) parametrelerini bulma

3. Bulunan teorik (uyumlu) seviyelerin denklemine göre hesaplama.

Belirli bir işlevin seçimi, kural olarak, ampirik verilerin grafiksel gösterimi temelinde gerçekleştirilir.

Model olarak, parametreleri en küçük kareler yöntemi kullanılarak hesaplanan regresyon denklemleri kullanılır.

Aşağıda, zaman serilerini tesviye etmek için en sık kullanılan regresyon denklemleri verilmiştir ve bu, hangi gelişme eğilimlerinin yansıtmak için en uygun olduğunu gösterir.

Yukarıdaki denklemlerin parametrelerini bulmak için özel algoritmalar ve bilgisayar programları bulunmaktadır. Özellikle, düz bir çizgi denkleminin parametrelerini bulmak için aşağıdaki algoritma kullanılabilir:

Zaman periyotları veya anları St = 0 olacak şekilde numaralandırılırsa, yukarıdaki algoritmalar önemli ölçüde basitleştirilecek ve

Grafikteki hizalanmış seviyeler, bu zaman serisinin gerçek seviyelerine en yakın mesafeden geçen bir düz çizgi üzerinde yer alacaktır. Sapmaların karelerinin toplamı, rastgele faktörlerin etkisinin bir yansımasıdır.

Yardımı ile denklemin ortalama (standart) hatasını hesaplıyoruz:

Burada n, gözlemlerin sayısıdır ve m, denklemdeki parametrelerin sayısıdır (bunlardan iki tanesine sahibiz - b 1 ve b 0).

Ana eğilim (trend), sistematik faktörlerin bir dizi dinamiğin seviyelerini nasıl etkilediğini gösterir ve trend () etrafındaki seviyelerin dalgalanmaları, artık faktörlerin etkisinin bir ölçüsü olarak hizmet eder.

Kullanılan zaman serisi modelinin kalitesini değerlendirmek için de kullanılır. Fisher'ın F testi... İki varyansın oranı, yani regresyonun neden olduğu varyansın oranı, yani. çalışılan faktör, rastgele nedenlerin neden olduğu varyansa, yani artık dağılım:

Genişletilmiş biçimde, bu kriterin formülü aşağıdaki gibi gösterilebilir:

n, gözlem sayısıdır, yani. üst üste seviye sayısı,

m denklemdeki parametre sayısıdır, y serinin gerçek seviyesidir,

Hizalanmış satır seviyesi - orta sıra seviyesi.

Diğerlerinden daha başarılı olan bir model her zaman yeterince tatmin edici olmayabilir. Sadece F kriteri bilinen kritik sınırı geçerse bu şekilde tanınabilir. Bu sınır, F dağılım tabloları kullanılarak belirlenir.

Endekslerin özü ve sınıflandırılması.

İstatistikte bir indeks, bir olgunun büyüklüğündeki değişikliği zaman, mekan veya herhangi bir standartla karşılaştırmalı olarak karakterize eden göreceli bir gösterge olarak anlaşılır.

İndeks oranının ana unsuru indekslenmiş değerdir. Endekslenmiş değer, çalışmanın nesnesi olan değişiklik olan istatistiksel popülasyonun niteliğinin değeri olarak anlaşılır.

Dizinlerle ilgili üç ana görev vardır:

1) karmaşık bir fenomendeki değişikliklerin değerlendirilmesi;

2) karmaşık bir fenomendeki değişim üzerindeki bireysel faktörlerin etkisinin belirlenmesi;

3) bazı fenomenlerin büyüklüğünün geçmiş dönemin büyüklüğü, başka bir bölgenin büyüklüğü ile standartlar, planlar, tahminlerle karşılaştırılması.

Endeksler 3 kritere göre sınıflandırılır:

2) nüfus unsurlarının kapsama derecesine göre;

3) genel endeksleri hesaplama yöntemlerine göre.

İçeriğe göre endekslenmiş değerlerin endeksleri, nicel (hacimsel) göstergelerin endekslerine ve nitel göstergelerin endekslerine bölünmüştür. Nicel gösterge endeksleri - endüstriyel üretimin fiziksel hacmi, satışların fiziksel hacmi, personel sayısı vb. Niteliksel gösterge endeksleri - fiyat endeksleri, maliyetler, emek verimliliği, ortalama ücretler vb.

Nüfus birimlerinin kapsama derecesine göre, endeksler iki sınıfa ayrılır: bireysel ve genel. Bunları karakterize etmek için, indeks yöntemini kullanma pratiğinde benimsenen aşağıdaki kuralları tanıtıyoruz:

Q- doğal ifadedeki herhangi bir ürünün miktarı (hacmi) ; r- birim fiyat; z- birim üretim maliyeti; T- bir üretim biriminin üretimi için harcanan zaman (emek yoğunluğu) ; w- zaman birimi başına değer cinsinden ürünlerin üretimi; v- birim zaman başına ayni ürün üretimi; T- harcanan toplam süre veya çalışan sayısı.

Endekslenen değerlerin hangi döneme veya nesneye ait olduğunu ayırt etmek için, karşılık gelen sembolden hemen sonra alt simgeler koymak gelenekseldir. Yani örneğin dinamik endekslerde, kural olarak, karşılaştırılan (cari, raporlama) dönemler için 1 alt indisi kullanılır ve karşılaştırmanın yapıldığı dönemler için,

Bireysel dizinler karmaşık bir olgunun bireysel unsurlarındaki değişiklikleri karakterize etmeye hizmet eder (örneğin, bir tür ürünün çıktı hacmindeki değişiklik). Dinamiklerin göreceli değerlerini, yükümlülüklerin yerine getirilmesini, endekslenmiş değerlerin karşılaştırılmasını temsil ederler.

Fiziksel üretim hacminin bireysel endeksi belirlenir

Analitik bir bakış açısıyla, belirtilen bireysel dinamik endeksler büyüme oranlarına (oranlara) benzerdir ve mevcut dönemde endekslenen değerdeki değişimi taban çizgisine kıyasla karakterize eder, yani kaç kez arttığını (azaldığını) gösterir. ) ya da yüzde kaç büyüyor (azalıyor). Endeks değerleri katsayı veya yüzde olarak ifade edilir.

Genel (özet) dizin karmaşık bir olgunun tüm unsurlarındaki değişimi yansıtır.

toplu indeks indeksin ana formudur. Payı ve paydası bir dizi "toplama" olduğu için toplama denir.

Ortalama endeksler, tanımları.

Toplam endekslere ek olarak, istatistikler diğer form ağırlıklı ortalama endekslerini kullanır. Mevcut bilgiler toplam toplam endeksin hesaplanmasına izin vermediğinde başvurulur. Dolayısıyla, fiyatlar hakkında veri yoksa, ancak cari dönemdeki ürünlerin maliyeti hakkında bilgi varsa ve her ürün için ayrı fiyat endeksleri biliniyorsa, genel fiyat endeksi bir toplam olarak belirlenemez, ancak mümkündür. bireysel olanların ortalaması olarak hesaplayın. Aynı şekilde, üretilen bireysel ürün türlerinin miktarları bilinmiyorsa, ancak temel dönem için bireysel endeksler ve ürünlerin maliyeti biliniyorsa, fiziksel üretim hacminin genel endeksi ağırlıklı ortalama olarak belirlenebilir. .

Ortalama indeks - bu endeks, bireysel endekslerin ortalaması olarak hesaplanır. Toplam endeks, genel endeksin ana biçimidir, bu nedenle ortalama endeks, toplam endeksle aynı olmalıdır. Ortalamalar hesaplanırken iki tür ortalama kullanılır: aritmetik ve harmonik.

Bireysel endekslerin ağırlıkları, toplam endeksin paydasının terimleri ise, aritmetik ortalama endeks, toplam endeksle aynıdır. Sadece bu durumda, aritmetik ortalamanın formülüne göre hesaplanan endeksin değeri, toplam endekse eşit olacaktır.

Basit geometrik ortalamayı hesaplamak için aşağıdaki formül kullanılır:

geometrik ağırlıklı

Geometrik ağırlıklı ortalamayı belirlemek için aşağıdaki formül uygulanır:

Tekerleklerin, boruların ortalama çapları, karelerin ortalama kenarları, ortalama kare kullanılarak belirlenir.

RMS değerleri, örneğin üretim ritmini karakterize eden varyasyon katsayısı gibi bazı göstergeleri hesaplamak için kullanılır. Burada, belirli bir süre için planlanan çıktıdan standart sapma aşağıdaki formül kullanılarak belirlenir:

Bu değerler, ekonomik göstergelerdeki değişimi, ortalama değerinde alınan temel değerlerine kıyasla doğru bir şekilde karakterize eder.

ikinci dereceden basit

Kök ortalama kare basit şu formülle hesaplanır:

ağırlıklı kare

Ağırlıklı ortalama kare:

22. Mutlak varyasyon göstergeleri şunları içerir:

varyasyon aralığı

ortalama doğrusal sapma

varyans

standart sapma

Salıncak varyasyonu (r)

Kaydırma varyasyonuözelliğin maksimum ve minimum değerleri arasındaki farktır

İncelenen popülasyonda özelliğin değerinin değiştiği sınırları gösterir.

Beş başvuranın önceki işteki iş tecrübesi: 2,3,4,7 ve 9 yıldır. Çözüm: varyasyon aralığı = 9 - 2 = 7 yıl.

Özniteliğin değerlerindeki farklılıkların genelleştirilmiş bir özelliği için, ortalama varyasyon göstergeleri, aritmetik ortalamadan sapmalar dikkate alınarak hesaplanır. Fark, ortalamadan sapma olarak alınır.

Aynı zamanda, öznitelik değişkenlerinin ortalamadan (ortalamanın sıfır özelliği) sapmalarının toplamından kaçınmak için, ya sapma işaretlerini yok saymak, yani bu toplam modüloyu almak ya da sapma değerlerinin karesini almak gerekir. sıfıra.

Ortalama doğrusal ve standart sapma

Ortalama doğrusal sapma- bu, özniteliğin bireysel değerlerinin ortalamadan mutlak sapmalarının aritmetik ortalamasıdır.

Ortalama doğrusal sapma basittir:

Beş başvuranın önceki işteki iş tecrübesi: 2,3,4,7 ve 9 yıldır.

Örneğimizde: yıllar;

Cevap: 2.4 yıl.

Ağırlıklı ortalama doğrusal sapma gruplandırılmış veriler için geçerlidir:

Konvansiyonu nedeniyle ortalama doğrusal sapma pratikte nispeten nadiren kullanılır (özellikle, teslimatın tekdüzeliği için sözleşmeden doğan yükümlülüklerin yerine getirilmesini karakterize etmek için; üretimin teknolojik özelliklerini dikkate alarak ürün kalitesinin analizinde).

Standart sapma

Varyasyonun en mükemmel özelliği, standart (veya standart sapma) olarak adlandırılan standart sapmadır. Standart sapma() özniteliğin bireysel değerlerinin aritmetik ortalamadan sapmalarının ortalama karesinin kareköküne eşittir:

Standart sapma basittir:

Gruplandırılmış veriler için ağırlıklı standart sapma kullanılır:

Normal dağılım koşulları altında ortalama kare ve standart doğrusal sapmalar arasında aşağıdaki ilişki gerçekleşir: ~ 1.25.

Varyasyonun ana mutlak ölçüsü olan standart sapma, normal dağılım eğrisinin koordinatlarının değerlerini belirlemek için, numune gözlemini organize etme ve numune özelliklerinin doğruluğunu belirleme ile ilgili hesaplamalarda ve ayrıca değerlendirme yaparken kullanılır. homojen bir popülasyonda bir özelliğin varyasyon sınırları.

Tecrübeden elde edilen değerler, çok çeşitli sebeplerden dolayı kaçınılmaz olarak hatalar içermektedir. Bunlar arasında sistematik ve rastgele hatalar arasında ayrım yapılmalıdır. Sistematik hatalar, çok kesin bir şekilde hareket eden sebeplerden kaynaklanır ve her zaman ortadan kaldırılabilir veya doğru bir şekilde dikkate alınabilir. Rastgele hatalar, doğru bir şekilde açıklanamayan ve her bir ayrı boyutta farklı şekillerde hareket eden çok sayıda ayrı nedenden kaynaklanır. Bu hatalar tamamen göz ardı edilemez; sadece ortalama olarak dikkate alınabilirler, bunun için rastgele hataları yöneten yasaları bilmek gerekir.

Ölçülen değeri A ile ve x'in ölçümündeki rastgele hatayı göstereceğiz. Hata x herhangi bir değer alabildiğinden, tamamen kendi dağılım yasası ile karakterize edilen sürekli bir rastgele değişkendir.

Gerçekliği en basit ve en doğru bir şekilde yansıtan (vakaların ezici çoğunluğunda) sözde hataların normal dağılımı:

Bu dağıtım yasası, çeşitli teorik öncüllerden, özellikle, aynı doğruluk derecesinde doğrudan ölçümle bir dizi değerin elde edildiği bilinmeyen bir miktarın en olası değerinin aritmetik olması şartından elde edilebilir. bu değerlerin anlamı. 2. miktar denir varyans bu normal yasanın

Ortalama

Deneysel verilerden varyansın belirlenmesi. Herhangi bir A niceliği için doğrudan ölçüm elde edilirse, aynı doğruluk derecesine sahip n değerleri a i ise ve A niceliğinin hataları normal dağılım yasasına tabi ise, o zaman en olası A değeri olacaktır. ortalama:

a - aritmetik ortalama,

a i - i. adımda ölçülen değer.

A değerinin gözlemlenen değerinin (her gözlem için) a i'nin aritmetik ortalama: bir ben - bir.

Bu durumda hataların normal dağılımının varyansını belirlemek için aşağıdaki formülü kullanın:

2 - varyans,
a - aritmetik ortalama,
n parametrenin ölçüm sayısıdır,

Standart sapma

Standart sapmaölçülen değerlerin mutlak sapmasını gösterir aritmetik ortalama... Doğrusal bir kombinasyonun doğruluk ölçüsü formülüne göre kök ortalama kare hatası aritmetik ortalama şu formülle belirlenir:

, nerede


a - aritmetik ortalama,
n parametrenin ölçüm sayısıdır,
a i - i. adımda ölçülen değer.

varyasyon katsayısı

varyasyon katsayısıölçülen değerlerin sapmasının göreceli ölçüsünü karakterize eder aritmetik ortalama:

, nerede

V, varyasyon katsayısıdır,
- standart sapma,
a - aritmetik ortalama.

Değer ne kadar büyükse varyasyon katsayısı, incelenen değerlerin dağılımı nispeten daha büyük ve daha az tekdüzelik. Eğer varyasyon katsayısı%10'dan az ise, varyasyon serisinin değişkenliği önemsiz olarak kabul edilir, %10 ila %20 arası ortalamayı ifade eder, %20'den fazla ve %33'ten az ise anlamlı olarak kabul edilir ve eğer varyasyon katsayısı%33'ü aşarsa, bu, bilginin heterojenliğini ve en büyük ve en küçük değerleri hariç tutma ihtiyacını gösterir.

Ortalama doğrusal sapma

Varyasyon aralığının ve yoğunluğunun göstergelerinden biri - ortalama doğrusal sapma(ortalama sapma modülü) aritmetik ortalamadan. Ortalama doğrusal sapma formülle hesaplanır:

, nerede

_
a - ortalama doğrusal sapma,
a - aritmetik ortalama,
n parametrenin ölçüm sayısıdır,
a i - i. adımda ölçülen değer.

Araştırılan değerlerin normal dağılım yasasına uygunluğunu kontrol etmek için ilişkiyi uygulayın asimetri indeksi hatasına ve tavrına basıklık oranı onun hatasına.

asimetri indeksi

asimetri indeksi(A) ve hatası (m a) aşağıdaki formüller kullanılarak hesaplanır:

, nerede

A - asimetri göstergesi,
- standart sapma,
a - aritmetik ortalama,
n parametrenin ölçüm sayısıdır,
a i - i. adımda ölçülen değer.

basıklık göstergesi

basıklık göstergesi(E) ve hatası (m e) aşağıdaki formüller kullanılarak hesaplanır:

, nerede



 


Okumak:



Rusya'nın yıldızı, Eski Kilise Slav sembolünün kutsal anlamını korudu

Rusya'nın yıldızı, Eski Kilise Slav sembolünün kutsal anlamını korudu

Slav muska Rusya'nın Yıldızı veya Svarog Meydanı, yalnızca Svarog'un değil, aynı zamanda ...

Runa Hyera - ana anlam ve yorum

Runa Hyera - ana anlam ve yorum

Hyera rününün doğrudan veya ters bir konumu olmadığı için anlamı ve uygulaması açıktır. Bu gerçek bir zenginlik runesi ve ...

Elizabeth adı ne anlama geliyor, karakter ve kader

Elizabeth adı ne anlama geliyor, karakter ve kader

Elizabeth adında bir kızın hayatı nasıl şekillenecek? isim, karakter ve kaderin anlamı, bu makalemizin konusu. Lisa'nın kaderi hakkında konuşmadan önce, ...

Madam Hasse'nin rüya yorumu: rüyaların sayılarla yorumlanması

Madam Hasse'nin rüya yorumu: rüyaların sayılarla yorumlanması

Hasse'nin rüya kitabı, çok ünlü medyum Bayan Hasse tarafından birkaç eski ve modern temele dayanarak derlendi ...

besleme görüntüsü TL