Ev - Onarım geçmişi
Standart sapmanın belirlenmesi. Standart sapma

Ders No.4

Konu: “Açıklayıcı istatistikler. Toplamda özellik çeşitliliğinin göstergeleri"

İstatistiksel bir popülasyondaki bir özelliğin çeşitliliğine ilişkin ana kriterler şunlardır: sınır, genlik, ortalama standart sapma, salınım katsayısı ve değişim katsayısı. Önceki derste, ortalama değerlerin toplamda incelenen özelliğin yalnızca genelleştirilmiş bir özelliğini sağladığı ve bireysel değişkenlerinin değerlerini dikkate almadığı tartışılmıştı: minimum ve maksimum değerler, ortalamanın üstünde, altında ortalama vb.

Örnek. İki farklı sayı dizisinin ortalama değerleri: -100; -20; 100; 20 ve 0,1; -0,2; 0,1 kesinlikle aynı ve eşittirHAKKINDA.Ancak bu göreceli ortalama dizi verilerinin dağılım aralıkları çok farklıdır.

Bir özelliğin çeşitliliği için listelenen kriterlerin belirlenmesi, öncelikle istatistiksel popülasyonun bireysel unsurlarındaki değeri dikkate alınarak gerçekleştirilir.

Bir özelliğin varyasyonunu ölçmek için göstergeler mutlak Ve akraba. Mutlak varyasyon göstergeleri şunları içerir: varyasyon aralığı, limit, standart sapma, dağılım. Değişim katsayısı ve salınım katsayısı göreceli değişim ölçümlerini ifade eder.

Limit (lim)– Bu, bir varyasyon serisindeki bir varyantın uç değerleri tarafından belirlenen bir kriterdir. Başka bir deyişle bu kriter, özelliğin minimum ve maksimum değerleriyle sınırlıdır:

Genlik (Am) veya çeşitlilik aralığı – Aşırı seçenekler arasındaki fark budur. Bu kriterin hesaplanması, minimum değerinin özelliğin maksimum değerinden çıkarılmasıyla gerçekleştirilir; bu, seçeneğin dağılım derecesini tahmin etmemizi sağlar:

Değişkenlik kriteri olarak limit ve genliğin dezavantajı, bunların tamamen varyasyon serisindeki karakteristiğin uç değerlerine bağlı olmasıdır. Bu durumda bir seri içindeki nitelik değerlerindeki dalgalanmalar dikkate alınmaz.

İstatistiksel bir popülasyondaki bir özelliğin çeşitliliğinin en eksiksiz tanımı şu şekilde sağlanır: standart sapma(sigma), bir seçeneğin ortalama değerinden sapmasının genel bir ölçüsüdür. Standart sapmaya sıklıkla denir standart sapma.

Standart sapma, her seçeneğin belirli bir popülasyonun aritmetik ortalaması ile karşılaştırılmasına dayanır. Toplamda her zaman ondan daha az ve daha fazla seçenek olacağından, "" işaretli sapmaların toplamı "" işaretli sapmaların toplamı ile iptal edilecektir, yani. tüm sapmaların toplamı sıfırdır. Farklılıkların işaretlerinin etkisinden kaçınmak için aritmetik ortalamanın karesinden sapmalar alınır; . Sapmaların karelerinin toplamı sıfıra eşit değildir. Değişkenliği ölçebilen bir katsayı elde etmek için kareler toplamının ortalamasını alın - bu değere denir farklılıklar:

Aslında dağılım, bir özelliğin bireysel değerlerinin ortalama değerinden sapmalarının ortalama karesidir. Dağılım standart sapmanın karesi.

Varyans boyutlu bir miktardır (adlandırılır). Yani bir sayı serisinin varyantları metre cinsinden ifade edilirse varyans metrekareyi verir; seçenekler kilogram cinsinden ifade edilirse, varyans bu ölçümün karesini (kg 2) vb. verir.

Standart sapma– varyansın karekökü:

, daha sonra kesirin paydasındaki dağılım ve standart sapmayı hesaplarken, yerinekonulmalı.

Standart sapmanın hesaplanması, belirli bir sırayla yapılması gereken altı aşamaya ayrılabilir:

Standart sapmanın uygulanması:

a) varyasyon serilerinin değişkenliğini değerlendirmek ve aritmetik ortalamaların tipikliğinin (temsil edilebilirliğinin) karşılaştırmalı değerlendirilmesi için. Semptomların stabilitesini belirlerken ayırıcı tanıda bu gereklidir.

b) varyasyon serisini yeniden oluşturmak, yani. frekans tepkisinin restorasyonu üç sigma kuralı. Aralıkta (М±3σ) Serinin tüm varyantlarının %99,7'si (М±2σ) - %95,5 ve aralığında (М±1σ) - %68,3 satır seçeneği(Şekil 1).

c) “açılır” seçenekleri tanımlamak

d) sigma tahminlerini kullanarak norm ve patoloji parametrelerini belirlemek

e) Değişim katsayısını hesaplamak

f) Aritmetik ortalamanın ortalama hatasını hesaplamak.

Herhangi bir popülasyonu karakterize etmek içinnormal dağılım türü için iki parametreyi bilmek yeterlidir: aritmetik ortalama ve standart sapma.

Şekil 1. Üç Sigma kuralı

Örnek.

Pediatride standart sapma, belirli bir çocuğun verilerini karşılık gelen standart göstergelerle karşılaştırarak çocukların fiziksel gelişimini değerlendirmek için kullanılır. Sağlıklı çocukların fiziksel gelişiminin aritmetik ortalaması standart olarak alınır. Göstergelerin standartlarla karşılaştırılması, standartların ilgili sigma ölçekleriyle birlikte verildiği özel tablolar kullanılarak gerçekleştirilir. Çocuğun fiziksel gelişim göstergesinin standart (aritmetik ortalama) ±σ dahilinde olması durumunda, o zaman olduğuna inanılmaktadır. fiziksel gelişimçocuk (bu göstergeye göre) normlara karşılık gelir. Gösterge standart ±2σ dahilindeyse, normdan hafif bir sapma vardır. Gösterge bu sınırların ötesine geçerse, çocuğun fiziksel gelişimi normdan keskin bir şekilde farklılık gösterir (patoloji mümkündür).

İstatistiksel araştırmalar, mutlak değerlerle ifade edilen varyasyon göstergelerine ek olarak, göreceli değerlerle ifade edilen varyasyon göstergelerini de kullanır. Salınım katsayısı - bu, varyasyon aralığının özelliğin ortalama değerine oranıdır. Değişim katsayısı - standart sapmanın oranıdır ortalama imza. Tipik olarak bu değerler yüzde olarak ifade edilir.

Göreli varyasyon göstergelerini hesaplamak için formüller:

Yukarıdaki formüllerden katsayının ne kadar büyük olduğu açıktır. V sıfıra yaklaştıkça karakteristik değerlerin değişimi o kadar küçük olur. Daha fazla V işareti ne kadar değişken olursa.

İstatistiksel uygulamada en sık varyasyon katsayısı kullanılır. Yalnızca varyasyonun karşılaştırmalı bir değerlendirmesi için değil, aynı zamanda popülasyonun homojenliğini karakterize etmek için de kullanılır. Varyasyon katsayısı %33'ü geçmiyorsa (normale yakın dağılımlar için) popülasyon homojen kabul edilir. Aritmetik olarak, σ ve aritmetik ortalamanın oranı etkiyi nötralize eder mutlak değer Bu özellikler ve yüzde oranı, varyasyon katsayısını boyutsuz (isimsiz) bir miktar haline getirir.

Varyasyon katsayısının ortaya çıkan değeri, özelliğin çeşitlilik derecesinin yaklaşık derecelerine göre tahmin edilir:

Zayıf - %10'a kadar

Ortalama - %10 - 20

Güçlü - %20'den fazla

Boyut ve boyut bakımından farklı özellikleri karşılaştırmanın gerekli olduğu durumlarda varyasyon katsayısının kullanılması tavsiye edilir.

Değişim katsayısı ile diğer dağılım kriterleri arasındaki fark açıkça gösterilmiştir. örnek.

Tablo 1

Endüstriyel işletme çalışanlarının bileşimi

Örnekte verilen istatistiksel özelliklere dayanarak, ankete katılan grubun düşük mesleki istikrarı göz önüne alındığında, işletme çalışanlarının yaş kompozisyonunun ve eğitim düzeyinin göreceli homojenliği hakkında bir sonuca varabiliriz. Bu sosyal eğilimleri standart sapmaya göre yargılama girişiminin hatalı bir sonuca yol açacağını ve "iş deneyimi" ve "yaş" muhasebe özelliklerini muhasebe göstergesi "eğitim" ile karşılaştırma girişiminin genellikle yanlış olacağını görmek kolaydır. Bu özelliklerin heterojenliği nedeniyle yanlış.

Medyan ve yüzdelikler

Serinin ortası için kriterin medyan olduğu sıralı (sıralı) dağılımlar için standart sapma ve dağılım, varyantın dağılımının özellikleri olarak hizmet edemez.

Aynı şey açık varyasyon serileri için de geçerlidir. Bu durum, varyans ve σ'nun hesaplandığı sapmaların, açık varyasyon serilerinde ve niteliksel özelliklerin dağılım serilerinde hesaplanmayan aritmetik ortalamadan ölçülmesinden kaynaklanmaktadır. Bu nedenle, dağılımların sıkıştırılmış bir açıklaması için başka bir dağılım parametresi kullanılır - yüzdelik dilim(eşanlamlı - “yüzdelik”), herhangi bir dağılım biçiminde niteliksel ve niceliksel özellikleri tanımlamak için uygundur. Bu parametre aynı zamanda niceliksel özellikleri niteliksel özelliklere dönüştürmek için de kullanılabilir. Bu durumda, bu tür derecelendirmeler, belirli bir seçeneğin hangi nicelik sırasına karşılık geldiğine bağlı olarak atanır.

Biyomedikal araştırma pratiğinde en sık aşağıdaki miktarlar kullanılır:

– medyan;

, – çeyrekler (çeyrekler), burada – alt çeyrekler, üst çeyrek.

Nicelikler, bir varyasyon serisindeki olası değişikliklerin alanını belirli aralıklara böler. Medyan (kantil), bir varyasyon serisinin ortasında yer alan ve bu seriyi ikiye iki eşit parçaya bölen bir seçenektir ( 0,5 Ve 0,5 ). Çeyrek, bir seriyi dört parçaya böler: ilk bölüm (alt çeyrek), sayısal değerleri mümkün olan maksimum değerin %25'ini aşmayan seçenekleri ayıran bir seçenektir. bu seri, çeyrek, mümkün olan maksimumun %50'sine kadar sayısal değere sahip seçenekleri ayırır. Üst çeyrek (), mümkün olan maksimum değerlerin %75'ine kadar olan seçenekleri ayırır.

Asimetrik dağılım durumunda Aritmetik ortalamaya göre değişken, onu karakterize etmek için medyan ve çeyrekler kullanılır. Bu durumda, ortalama değerin görüntülenmesi için aşağıdaki biçim kullanılır: Meh (;). Örneğin, incelenen özellik olan “çocuğun bağımsız yürümeye başladığı dönem” çalışma grubunda asimetrik bir dağılıma sahiptir. Aynı zamanda, alt çeyrek () yürümenin başlangıcına karşılık gelir - 9,5 ay, ortanca - 11 ay, üst çeyrek () - 12 ay. Buna göre belirtilen niteliğin ortalama trend özelliği 11 (9,5; 12) ay olarak sunulacaktır.

Araştırma sonuçlarının istatistiksel anlamlılığının değerlendirilmesi

Verilerin istatistiksel önemi, gösterilen gerçekliğe karşılık gelme derecesi olarak anlaşılır; istatistiksel olarak anlamlı veriler, nesnel gerçekliği çarpıtmayan ve doğru şekilde yansıtan verilerdir.

Araştırma sonuçlarının istatistiksel anlamlılığının değerlendirilmesi, örneklem evreninden elde edilen sonuçların evrenin tamamına aktarılmasının hangi olasılıkla mümkün olduğunu belirlemek anlamına gelir. İstatistiksel anlamlılığın değerlendirilmesi, bir olgunun ne kadarının, bir bütün olarak olguyu ve onun kalıplarını yargılamak için kullanılabileceğini anlamak için gereklidir.

Araştırma sonuçlarının istatistiksel anlamlılığının değerlendirilmesi aşağıdakilerden oluşur:

1. temsil hataları (ortalama ve göreceli değerlerdeki hatalar) - M;

2. Ortalama veya göreceli değerlerin güven sınırları;

3. Kriterlere göre ortalama veya göreceli değerlerdeki farkın güvenilirliği T.

Aritmetik ortalamanın standart hatası veya temsil hatası ortalamanın dalgalanmalarını karakterize eder. Örneklem büyüklüğü ne kadar büyük olursa, ortalama değerlerin yayılımının o kadar küçük olduğuna dikkat edilmelidir. Ortalamanın standart hatası aşağıdaki formül kullanılarak hesaplanır:

Modern bilimsel literatürde aritmetik ortalama temsil hatasıyla birlikte yazılır:

veya standart sapmayla birlikte:

Örnek olarak ülkedeki (genel nüfus) 1.500 şehir kliniğine ilişkin verileri düşünün. Klinikte hizmet verilen ortalama hasta sayısı 18.150 kişidir. Sitelerin %10'unun (150 klinik) rastgele seçilmesi, ortalama 20.051 kişiye eşit hasta sayısını verir. Açıkça 1500 kliniğin tamamının örnekleme dahil edilmemesinden kaynaklanan örnekleme hatası, bu ortalamalar arasındaki farka, yani genel ortalamaya eşittir ( M gen) ve örnek ortalaması ( M seçildi). Popülasyonumuzdan aynı büyüklükte başka bir örneklem oluşturursak farklı bir hata değeri verecektir. Yeterince büyük numunelere sahip tüm bu numune araçları, yeterince büyük numunelerle genel ortalama etrafında normal olarak dağıtılır. büyük sayı bir popülasyondan aynı sayıda nesnenin bir örneğinin tekrarları. Ortalamanın standart hatası M- bu, örnek ortalamaların genel ortalama etrafında kaçınılmaz yayılmasıdır.

Araştırma sonuçlarının göreceli miktarlarda (örneğin yüzdeler) sunulması durumunda - hesaplanır kesrin standart hatası:

burada P % cinsinden göstergedir, n ise gözlem sayısıdır.

Sonuç şu şekilde görüntülenir: (P±m)%. Örneğin, hastalarda iyileşme yüzdesi (95,2±2,5)% idi.

Popülasyonun eleman sayısının artması durumunda, daha sonra kesirin paydasındaki ortalamanın ve kesrin standart hatalarını hesaplarken, yerinekonulmalı.

Normal bir dağılım için (örnek ortalamalarının dağılımı normaldir), popülasyonun hangi kısmının ortalamanın etrafındaki herhangi bir aralığa düştüğünü biliyoruz. Özellikle:

Uygulamada sorun, genel popülasyonun özelliklerinin bizim tarafımızdan bilinmemesi ve numunenin tam olarak bunları tahmin etmek amacıyla yapılmasıdır. Bu şu anlama gelir; eğer aynı boyutta numuneler yaparsak N genel popülasyondan, vakaların %68,3'ünde aralık değeri içerecektir M(vakaların %95,5'inde aralıkta ve vakaların %99,7'sinde aralıkta olacaktır).

Aslında yalnızca bir örnek alındığı için bu ifade olasılık açısından formüle edilmiştir: %68,3 olasılıkla, popülasyondaki özelliğin ortalama değeri %95,5 olasılıkla aralıkta yer almaktadır. - aralıkta vb.

Uygulamada, örnek değer etrafında belirli (yeterince yüksek) bir olasılıkla bir aralık oluşturulur. güven olasılığı – bu parametrenin genel popülasyondaki gerçek değerini “kapsar”. Bu aralığa denir güven aralığı.

Güven olasılığıP bu, güven aralığının aslında popülasyondaki parametrenin gerçek (bilinmeyen) değerini içereceğine dair güven derecesidir.

Örneğin güven olasılığı R%90'dır; bu, 100 örnekten 90'ının popülasyondaki parametrenin doğru tahminini vereceği anlamına gelir. Buna göre hata olasılığı, yani. Örneklem için genel ortalamanın yanlış tahmini yüzde olarak eşittir: . Bu örnek için bu, 100 örnekten 10'unun yanlış tahmin vereceği anlamına gelir.

Açıkçası, güven derecesi (güven olasılığı) aralığın büyüklüğüne bağlıdır: aralık ne kadar geniş olursa, popülasyon için bilinmeyen bir değerin bu aralıkta yer alacağına dair güven o kadar yüksek olur. Uygulamada, en az %95,5 güven sağlayacak bir güven aralığı oluşturmak için örnekleme hatasının en az iki katı kullanılır.

Ortalamaların ve göreceli değerlerin güven sınırlarını belirlemek, iki uç değerini bulmamızı sağlar - çalışılan göstergenin tüm popülasyonda oluşabileceği mümkün olan minimum ve mümkün olan maksimum. Buna dayanarak, güven sınırları (veya güven aralığı)- bunlar, rastgele dalgalanmalar nedeniyle önemsiz bir olasılığın bulunduğu ortalama veya göreceli değerlerin sınırlarıdır.

Güven aralığı şu şekilde yeniden yazılabilir: T– güven kriteri.

Popülasyondaki aritmetik ortalamanın güven sınırları aşağıdaki formülle belirlenir:

M gen = M seçme + t m M

göreceli değer için:

R gen = P seçme + t m R

Nerede M gen Ve R gen- genel nüfus için ortalama ve göreceli değerlerin değerleri; M seçme Ve R seçme- örnek popülasyondan elde edilen ortalama ve göreceli değerlerin değerleri; M M Ve M P- ortalama ve göreceli değerlerdeki hatalar; T- güven kriteri (çalışmayı planlarken oluşturulan ve 2 veya 3'e eşit olabilen doğruluk kriteri); t m- bu bir güven aralığıdır veya Δ - örnek bir çalışmada elde edilen göstergenin maksimum hatasıdır.

Kriterin değerinin dikkate alınması gerekir. T% olarak ifade edilen, hatasız bir tahminin olasılığı (p) ile belirli bir dereceye kadar ilgilidir. Sonucu gerekli doğruluk derecesiyle elde etme ihtiyacının rehberliğinde araştırmacının kendisi tarafından seçilir. Böylece %95,5'lik hatasız tahmin olasılığı için kriterin değeri T 2, %99,7 - 3'tür.

Verilen güven aralığı tahminleri yalnızca 30'dan fazla gözlem içeren istatistiksel popülasyonlar için kabul edilebilir. Daha küçük popülasyon boyutunda (küçük örnekler), t kriterini belirlemek için özel tablolar kullanılır. Bu tablolarda istenilen değer popülasyon büyüklüğüne karşılık gelen çizginin kesişim noktasında yer almaktadır. (n-1) ve araştırmacı tarafından seçilen hatasız bir tahminin (%95,5; %99,7) olasılık düzeyine karşılık gelen bir sütun. Tıbbi araştırmalarda herhangi bir gösterge için güven sınırları belirlenirken hatasız tahmin olasılığı %95,5 veya daha fazladır. Bu, örnek popülasyondan elde edilen göstergenin değerinin vakaların en az %95,5'inde genel popülasyonda bulunması gerektiği anlamına gelir.

    Dersin konusuyla ilgili sorular:

    İstatistiksel bir popülasyondaki özellik çeşitliliği göstergelerinin önemi.

    Mutlak değişim göstergelerinin genel özellikleri.

    Standart sapma, hesaplama, uygulama.

    Göreli varyasyon ölçüleri.

    Medyan, çeyrek puanı.

    Çalışma sonuçlarının istatistiksel anlamlılığının değerlendirilmesi.

    Aritmetik ortalamanın standart hatası, hesaplama formülü, kullanım örneği.

    Oranın hesaplanması ve standart hatası.

    Güven olasılığı kavramı, bir kullanım örneği.

10. Güven aralığı kavramı ve uygulaması.

    Konuyla ilgili görevleri standart yanıtlarla test edin:

1. MUTLAK DEĞİŞİKLİK GÖSTERGELERİ BAKINIZ

1) varyasyon katsayısı

2) salınım katsayısı

4) medyan

2. BAĞIL DEĞİŞİKLİK GÖSTERGELERİ BAKINIZ

1) dağılım

4) varyasyon katsayısı

3. BİR VARYASYON SERİSİNDEKİ BİR OPSİYONUN AŞIRI DEĞERLERİNE GÖRE BELİRLENEN KRİTER

2) genlik

3) dağılım

4) varyasyon katsayısı

4. EXTREME SEÇENEKLERİN FARKI

2) genlik

3) ortalama standart sapma

4) varyasyon katsayısı

5. BİR KARAKTERİSTİĞİN BİREYSEL DEĞERLERİNİN ORTALAMA DEĞERLERİNDEN SAPMALARININ ORTALAMA KAREİ

1) salınım katsayısı

2) medyan

3) dağılım

6. DEĞİŞİKLİK ÖLÇEĞİNİN BİR KARAKTERİN ORTALAMA DEĞERİNE ORANI

1) varyasyon katsayısı

2) standart sapma

4) salınım katsayısı

7. ORTALAMA KARE SAPMANIN BİR KARAKTERİSTİĞİN ORTALAMA DEĞERİNE ORANI

1) dağılım

2) varyasyon katsayısı

3) salınım katsayısı

4) genlik

8. VARYASYON SERİSİNİN ORTASINDA YER ALAN VE İKİ EŞİT PARCAYA BÖLEN SEÇENEK

1) medyan

3) genlik

9. TIBBİ ARAŞTIRMALARDA HERHANGİ BİR GÖSTERGE İÇİN GÜVEN SINIRLARI OLUŞTURULURKEN HATASIZ TAHMİN OLASILIĞI KABUL EDİLİR

10. 100 ÖRNEKTEN 90'I Popülasyondaki Bir Parametrenin Doğru Tahminini Veriyorsa Bu, GÜVEN OLASILIĞININ DEĞERLENDİRİLDİĞİ ANLAMINA GELİR P EŞİT

11. 100 ÖRNEKTEN 10'U YANLIŞ TAHMİN VERİRSE HATA OLASILIĞI EŞİTTİR

12. ORTALAMA VEYA BAĞIL DEĞERLERİN SINIRLARI, RASTGELE SALINIMLAR NEDENİYLE DIŞINA ÇIKMA OLASILIĞI KÜÇÜK - BU

1) güven aralığı

2) genlik

4) varyasyon katsayısı

13. İÇİNDEKİ NÜFUSUN KÜÇÜK BİR ÖRNEKLEMİ DEĞERLENDİRİLİYOR

1) n, 100'den küçük veya ona eşittir

2) n 30'dan küçük veya eşittir

3) n, 40'tan küçük veya ona eşittir

4) n 0'a yakındır

14. HATASIZ BİR TAHMİN OLASILIĞI İÇİN %95 KRİTER DEĞERİ T IS

15. HATASIZ BİR TAHMİN OLASILIĞI İÇİN %99 KRİTER DEĞERİ T IS

16. NORMAL DAĞILIMLARDA, DEĞİŞİM KATSAYISININ AŞILMAMASI DURUMUNDA NÜFUS HOMOJEN KABUL EDİLİR

17. SAYISAL DEĞERLERİ VERİLEN BİR SERİDE MÜMKÜN OLAN MAKSİMUMUN %25'İNİ AŞMAYAN SEÇENEK, AYIRMA SEÇENEKLERİ – BU

2) alt çeyrek

3) üst çeyrek

4) çeyrek

18. BOZULMAYAN VE OBJEKTİF GERÇEKLİĞİ DOĞRU YANSITAN VERİLERE ADI VERİLİR

1) imkansız

2) eşit derecede mümkün

3) güvenilir

4) rastgele

19. "ÜÇ Sigma" KURALI'NA GÖRE, BİR KARAKTERİSTİĞİN İÇERİSİNDE NORMAL DAĞILIMI İLE
YER ALACAK

1) %68,3 opsiyonu

Standart sapma, tanımlayıcı istatistiklerden değişkenliğin klasik bir göstergesidir.

Standart Sapma, standart sapma, Standart sapma, örneklem standart sapması (İng. standart sapma, STD, STDev), tanımlayıcı istatistiklerde dağılımın çok yaygın bir göstergesidir. Ama çünkü teknik analiz istatistiklere benzer; bu gösterge, analiz edilen enstrümanın fiyatının zaman içindeki dağılım derecesini tespit etmek için teknik analizde kullanılabilir (ve kullanılmalıdır). Yunan sembolü Sigma "σ" ile gösterilir.

Standart sapmayı kullanmamıza izin verdikleri için Karl Gauss ve Pearson'a teşekkür ederiz.

Kullanma teknik analizde standart sapma, bunu çeviriyoruz "dağılım indeksi"" V "volatilite göstergesi“Anlamı koruyor ama terimleri değiştiriyor.

Standart sapma nedir

Ancak ara yardımcı hesaplamaların yanı sıra, bağımsız hesaplama için standart sapma oldukça kabul edilebilir ve teknik analizdeki uygulamalar. Dergimizin aktif bir okuyucusunun belirttiği gibi dulavratotu, “ Yurt içi işlem merkezlerinin standart göstergelerine standart sapmanın neden dahil edilmediğini hala anlamıyorum«.

Gerçekten mi, standart sapma, bir enstrümanın değişkenliğini klasik ve "saf" bir şekilde ölçebilir. Ancak ne yazık ki bu gösterge menkul kıymet analizlerinde çok yaygın değildir.

Standart sapmanın uygulanması

Standart sapmanın manuel olarak hesaplanması çok ilginç değil, ancak deneyim için faydalıdır. Standart sapma ifade edilebilir formül STD=√[(∑(x-x ) 2)/n] , bu, numunenin elemanları ile ortalama arasındaki farkların karelerinin toplamının numunedeki eleman sayısına bölünmesiyle elde edilen kök gibi görünür.

Örnekteki element sayısı 30'u geçerse kök altındaki kesrin paydası n-1 değerini alır. Aksi takdirde n kullanılır.

Adım adım standart sapma hesaplaması:

  1. veri örneğinin aritmetik ortalamasını hesaplayın
  2. bu ortalamayı her örnek öğeden çıkarın
  3. ortaya çıkan tüm farklılıkların karesini alıyoruz
  4. ortaya çıkan tüm kareleri topla
  5. elde edilen miktarı numunedeki elementlerin sayısına bölün (veya n>30 ise n-1'e bölün)
  6. elde edilen bölümün karekökünü hesaplayın (buna denir) dağılım)

Değişimin en mükemmel özelliği, standart (veya standart sapma) olarak adlandırılan ortalama kare sapmadır. Standart sapma() özelliğin bireysel değerlerinin aritmetik ortalamadan ortalama kare sapmasının kareköküne eşittir:

Standart sapma basittir:

Gruplandırılmış verilere ağırlıklı standart sapma uygulanır:

Koşullar altında ortalama kare ve ortalama doğrusal sapmalar arasında normal dağılımşu oran gerçekleşir: ~ 1.25.

Değişimin ana mutlak ölçüsü olan standart sapma, normal dağılım eğrisinin ordinat değerlerinin belirlenmesinde, numune gözleminin organizasyonu ile ilgili hesaplamalarda ve numune özelliklerinin doğruluğunun belirlenmesinde ve ayrıca numune özelliklerinin değerlendirilmesinde kullanılır. Homojen bir popülasyonda bir özelliğin varyasyonunun sınırları.

Dispersiyon, çeşitleri, standart sapma.

Rastgele bir değişkenin varyansı— belirli bir rastgele değişkenin yayılımının ölçüsü, yani onun matematiksel beklenti. İstatistiklerde veya gösterimi sıklıkla kullanılır. Karekök varyansın değerine standart sapma, standart sapma veya standart yayılma denir.

Toplam varyans (σ2) bir özelliğin varyasyonunu, bu varyasyona neden olan tüm faktörlerin etkisi altında bütünüyle ölçer. Aynı zamanda gruplama yöntemi sayesinde gruplama özelliğinden kaynaklanan varyasyonu ve hesaba katılmayan faktörlerin etkisiyle ortaya çıkan varyasyonu tespit etmek ve ölçmek mümkündür.

Gruplararası varyans (σ 2 mgr) sistematik varyasyonu, yani grubun temelini oluşturan faktör olan özelliğin etkisi altında ortaya çıkan incelenen özelliğin değerindeki farklılıkları karakterize eder.

Standart sapma(eş anlamlılar: standart sapma, standart sapma, kare sapma; ilgili terimler: standart sapma, standart yayılma) - olasılık teorisi ve istatistikte, rastgele bir değişkenin değerlerinin matematiksel beklentisine göre dağılımının en yaygın göstergesi. Değer örneklerinin sınırlı dizileri ile matematiksel beklenti yerine örnek kümesinin aritmetik ortalaması kullanılır.

Standart sapma, rastgele değişkenin kendisinin ölçüm birimlerinde ölçülür ve aritmetik ortalamanın standart hatasını hesaplarken, güven aralıkları oluştururken, hipotezleri istatistiksel olarak test ederken, rastgele değişkenler arasındaki doğrusal ilişkiyi ölçerken kullanılır. Bir rastgele değişkenin varyansının karekökü olarak tanımlanır.


Standart sapma:

Standart Sapma(rastgele bir değişkenin standart sapmasının tahmini X varyansının tarafsız bir tahminine dayanan matematiksel beklentisine göre):

dağılım nerede; — Ben seçimin inci unsuru; — numune boyutu; — numunenin aritmetik ortalaması:

Her iki tahminin de taraflı olduğunu belirtmek gerekir. İÇİNDE genel durum Tarafsız bir tahmin yapmak mümkün değildir. Ancak tarafsız varyans tahminine dayalı tahmin tutarlıdır.

Mod ve medyanın belirlenmesinin özü, kapsamı ve prosedürü.

İstatistiklerdeki güç ortalamalarına ek olarak, değişen bir özelliğin değerinin göreceli özellikleri ve iç yapı dağıtım serileri, esas olarak aşağıdakilerle temsil edilen yapısal ortalamaları kullanır: moda ve medyan.

Moda- Bu serinin en yaygın çeşididir. Moda, örneğin müşteriler arasında en çok talep gören giysi ve ayakkabıların bedeninin belirlenmesinde kullanılır. Ayrık bir serinin modu, en yüksek frekansa sahip olandır. Bir aralık varyasyon serisi için modu hesaplarken, önce mod aralığını (maksimum frekansa göre) ve ardından aşağıdaki formülü kullanarak özelliğin modal değerinin değerini belirlemeniz gerekir:

- - moda değeri

- — modal aralığın alt sınırı

- — aralık boyutu

- — modal aralık frekansı

- — modaldan önceki aralığın frekansı

- — modalı takip eden aralığın frekansı

Medyan - bu, sıralanmış serinin temelini oluşturan ve bu seriyi iki eşit parçaya bölen özelliğin değeridir.

Frekansların varlığında ayrı bir serideki medyanı belirlemek için, önce frekansların yarı toplamını hesaplayın ve ardından hangi değişken değerinin buna uyduğunu belirleyin. (Sıralanan seri tek sayıda özellik içeriyorsa ortanca sayı şu formül kullanılarak hesaplanır:

M e = (n (toplam özellik sayısı) + 1)/2,

özelliklerin çift sayıda olması durumunda medyan, satırın ortasındaki iki özelliğin ortalamasına eşit olacaktır).

Hesaplarken medyanlar bir aralık varyasyon serisi için, önce medyanın bulunduğu medyan aralığını belirleyin ve ardından aşağıdaki formülü kullanarak medyanın değerini belirleyin:

- — gerekli medyan

- - medyanı içeren aralığın alt sınırı

- — aralık boyutu

- — frekansların toplamı veya seri terimlerinin sayısı

Medyandan önceki aralıkların birikmiş frekanslarının toplamı

- — medyan aralığın frekansı

Örnek. Modu ve medyanı bulun.

Çözüm:
İÇİNDE bu örnekte modal aralık 25-30 yaş grubu içindedir, çünkü bu aralık en yüksek frekansı oluşturur (1054).

Modun büyüklüğünü hesaplayalım:

Bu, öğrencilerin modal yaşının 27 olduğu anlamına gelir.

Medyanı hesaplayalım. Medyan aralık 25-30 yaş aralığındadır, çünkü bu aralıkta nüfusu iki eşit parçaya bölen bir seçenek vardır (Σf i /2 = 3462/2 = 1731). Daha sonra gerekli sayısal verileri formülde yerine koyarız ve medyan değeri alırız:

Bu da öğrencilerin yarısının 27,4 yaşın altında, diğer yarısının ise 27,4 yaşın üzerinde olduğu anlamına geliyor.

Mod ve medyanın yanı sıra sıralanan seriyi 4 eşit parçaya bölen çeyrekler gibi göstergeler de kullanılabilir, ondalık dilimler- 10 parça ve yüzdelik dilimler - 100 parça başına.

Seçici gözlem kavramı ve kapsamı.

Seçici gözlem sürekli gözetim kullanıldığında geçerlidir fiziksel olarak imkansızçok miktarda veri nedeniyle veya ekonomik olarak mümkün değil. Örneğin yolcu akışlarını, piyasa fiyatlarını ve aile bütçelerini incelerken fiziksel imkansızlık ortaya çıkar. Ekonomik uygunsuzluk, örneğin tatmak, tuğlaları dayanıklılık açısından test etmek vb. gibi, imhalarıyla ilişkili malların kalitesini değerlendirirken ortaya çıkar.

Gözlem için seçilen istatistiksel birimler örnekleme çerçevesini veya örneği oluşturur ve bunların dizisinin tamamı genel popülasyonu (GS) oluşturur. Bu durumda numunedeki birim sayısı şu şekilde gösterilir: N ve tüm HS'de - N. Davranış bilinmiyor numunenin göreceli büyüklüğü veya oranı denir.

Numune gözlem sonuçlarının kalitesi numunenin temsil gücüne, yani GS'de ne kadar temsili olduğuna bağlıdır. Numunenin temsil edilebilirliğini sağlamak için aşağıdakilere uymak gerekir: birimlerin rastgele seçimi ilkesi Bu, bir HS biriminin numuneye dahil edilmesinin şans dışında herhangi bir faktörden etkilenemeyeceğini varsayar.

Var Rastgele seçimin 4 yoluörneklemek için:

  1. Aslında rastgele seçim veya “loto yöntemi”, istatistiksel miktarlara seri numaraları atandığında, belirli nesnelere (örneğin varillere) kaydedilir, bunlar daha sonra bir kapta (örneğin bir torbada) karıştırılır ve rastgele seçilir. Pratikte bu yöntem bir jeneratör kullanılarak gerçekleştirilir. rastgele sayılar veya rastgele sayıların matematiksel tabloları.
  2. Mekanik her birine göre seçim ( Bilmiyorum Genel popülasyonun )-th değeri. Örneğin 100.000 değer içeriyorsa ve 1.000 seçmeniz gerekiyorsa her 100.000 / 1000 = 100'üncü değer örneğe dahil edilecektir. Üstelik sıralama yapılmamışsa ilk yüz içinden rastgele birincisi seçilir, diğerlerinin sayısı yüz fazla olur. Örneğin, ilk ünite 19 numaraysa, sonraki ünite 119 numara, ardından 219 numara, ardından 319 numara vb. olmalıdır. Nüfus birimleri sıralanırsa önce 50 numara, ardından 150 numara, ardından 250 numara vb. seçilir.
  3. Heterojen bir veri dizisinden değerlerin seçimi gerçekleştirilir tabakalı(tabakalı) yöntem, popülasyonun ilk önce rastgele veya mekanik seçimin uygulandığı homojen gruplara bölünmesidir.
  4. Özel bir örnekleme yöntemi seri bireysel değerleri değil, rastgele veya mekanik olarak seçtikleri, ancak sürekli gözlemin gerçekleştirildiği serilerini (bir sayıdan arka arkaya bir sayıya kadar diziler) seçtikleri seçim.

Örnek gözlemlerin kalitesi aynı zamanda şunlara da bağlıdır: numune türü: tekrarlandı veya tekrarlanamaz.

Şu tarihte: yeniden seçimÖrneğe dahil edilen istatistiksel değerler veya bunların serileri, kullanım sonrasında genel popülasyona geri döndürülerek yeni bir örneğe dahil edilme şansı elde edilir. Üstelik popülasyondaki tüm değerlerin örneğe dahil edilme olasılığı aynıdır.

Tekrarsız seçimörneğe dahil edilen istatistiksel değerlerin veya serilerinin kullanımdan sonra genel popülasyona geri dönmediği ve dolayısıyla kalan değerlerin bir sonraki örneğe dahil olma olasılığının arttığı anlamına gelir.

Tekrarlı olmayan örnekleme daha doğru sonuçlar verdiğinden daha sık kullanılır. Ancak uygulanamadığı durumlar vardır (yolcu akışlarının, tüketici talebinin incelenmesi vb.) ve ardından tekrarlanan bir seçim gerçekleştirilir.

Maksimum gözlem örnekleme hatası, ortalama örnekleme hatası, bunların hesaplanması için prosedür.

Yukarıda sıraladığımız örnek popülasyon oluşturma yöntemlerini ve bunu yaparken ortaya çıkan hataları detaylı olarak ele alalım. temsiliyet .
Uygun şekilde rastgeleÖrnekleme, herhangi bir sistematik unsur olmadan popülasyondan rastgele birimlerin seçilmesine dayanmaktadır. Teknik olarak, gerçek rastgele seçim kura çekilerek (örneğin piyangolar) veya rastgele sayılar tablosu kullanılarak gerçekleştirilir.

Seçici gözlem uygulamasında "saf haliyle" uygun rastgele seçim nadiren kullanılır, ancak diğer seçilim türleri arasında orijinaldir ve seçici gözlemin temel ilkelerini uygular. Basit rastgele örnekleme için örnekleme yöntemi teorisi ve hata formülü ile ilgili bazı soruları ele alalım.

Örnekleme yanlılığı parametrenin genel popülasyondaki değeri ile örnek gözlem sonuçlarından hesaplanan değeri arasındaki farktır. Ortalama niceliksel bir özellik için örnekleme hatası şu şekilde belirlenir:

Gösterge marjinal örnekleme hatası olarak adlandırılır.
Örnek ortalaması, alabilen rastgele bir değişkendir. farklı anlamlarörneğe hangi birimlerin dahil edildiğine bağlı olarak. Dolayısıyla örnekleme hataları da rastgele değişkenlerdir ve farklı değerler alabilirler. Bu nedenle ortalamayı belirleyin olası hatalar - ortalama örnekleme hatası, şunlara bağlıdır:

Örneklem büyüklüğü: sayı ne kadar büyük olursa ortalama hata o kadar küçük olur;

İncelenen özellikteki değişimin derecesi: özelliğin varyasyonu ve dolayısıyla dağılım ne kadar küçük olursa, ortalama örnekleme hatası da o kadar küçük olur.

Şu tarihte: rastgele yeniden seçim ortalama hata hesaplanır:
.
Pratikte genel varyans kesin olarak bilinmemekle birlikte olasılık teorisi kanıtlanmıştır
.
Yeterince büyük n'nin değeri 1'e yakın olduğundan, bunu varsayabiliriz. Daha sonra ortalama örnekleme hatası hesaplanabilir:
.
Ancak küçük bir örnek durumunda (n ile)<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Şu tarihte: rastgele tekrarlanmayan örnekleme Verilen formüller değere göre ayarlanır. Bu durumda ortalama tekrarlı olmayan örnekleme hatası:
Ve .
Çünkü her zaman daha azsa, çarpan () her zaman 1'den küçüktür. Bu, tekrarlanmayan seçim sırasındaki ortalama hatanın, tekrarlanan seçime göre her zaman daha az olduğu anlamına gelir.
Mekanik numune alma genel nüfusun bir şekilde sıralandığı durumlarda kullanılır (örneğin alfabetik seçmen listeleri, telefon numaraları, ev numaraları, daire numaraları). Birimlerin seçimi, örnekleme yüzdesinin tersine eşit olan belirli bir aralıkta gerçekleştirilir. Yani %2'lik bir örneklemle genel popülasyonun her 50 birimi = 1/0,02, %5'lik bir örneklemle her 1/0,05 = 20 birimi seçilir.

Referans noktası farklı şekillerde seçilir: aralığın ortasından rastgele, referans noktasında bir değişiklikle. Önemli olan sistematik hatalardan kaçınmaktır. Örneğin %5'lik bir örneklemde ilk birim 13. ise sonraki birimler 33, 53, 73 vb. olur.

Doğruluk açısından, mekanik seçim gerçek rastgele örneklemeye yakındır. Bu nedenle, mekanik örneklemenin ortalama hatasını belirlemek için uygun rastgele seçim formülleri kullanılır.

Şu tarihte: tipik seçim İncelenen nüfus öncelikle homojen, benzer gruplara ayrılır. Örneğin, işletmeleri araştırırken bunlar endüstriler, alt sektörler olabilir; nüfus incelerken bunlar bölgeler, sosyal veya yaş grupları olabilir. Daha sonra her gruptan bağımsız bir seçim mekanik olarak veya tamamen rastgele yapılır.

Tipik örnekleme diğer yöntemlere göre daha doğru sonuçlar üretir. Genel popülasyonun yazılması, her tipolojik grubun örnekte temsil edilmesini sağlar, bu da ortalama örnekleme hatası üzerindeki gruplar arası varyansın etkisini ortadan kaldırmayı mümkün kılar. Sonuç olarak, varyansları toplama kuralına () göre tipik bir numunenin hatasını bulurken, yalnızca grup varyanslarının ortalamasını hesaba katmak gerekir. O zaman ortalama örnekleme hatası:
yeniden seçildiğinde
,
tekrarlanmayan seçimle
,
Nerede - numunedeki grup içi varyansların ortalaması.

Seri (veya yuva) seçimi Örneklem araştırmasının başlamasından önce popülasyon serilere veya gruplara ayrıldığında kullanılır. Bu seriler bitmiş ürünlerin, öğrenci gruplarının, ekiplerin paketlenmesi olabilir. İncelemeye yönelik seriler mekanik olarak veya tamamen rastgele seçilir ve seriler içerisinde birimlerin sürekli incelenmesi gerçekleştirilir. Bu nedenle, ortalama örnekleme hatası yalnızca aşağıdaki formül kullanılarak hesaplanan gruplar arası (seriler arası) varyansa bağlıdır:

burada r, seçilen serilerin sayısıdır;
- i-inci serinin ortalaması.

Ortalama seri örnekleme hatası hesaplanır:

yeniden seçildiğinde:
,
tekrarlanmayan seçimle:
,
burada R, toplam bölüm sayısıdır.

Kombine seçim dikkate alınan seçim yöntemlerinin bir kombinasyonudur.

Herhangi bir örnekleme yöntemi için ortalama örnekleme hatası, esas olarak numunenin mutlak büyüklüğüne ve daha az ölçüde numunenin yüzdesine bağlıdır. İlk durumda 4.500 birimlik bir popülasyondan, ikinci durumda ise 225.000 birimlik bir popülasyondan 225 gözlem yapıldığını varsayalım. Her iki durumda da varyanslar 25'e eşittir. Bu durumda ilk durumda, %5 seçimle örnekleme hatası şöyle olacaktır:

İkinci durumda, %0,1 seçimle şuna eşit olacaktır:


BöyleceÖrnekleme yüzdesinin 50 kat azalmasıyla birlikte örneklem büyüklüğü değişmediğinden örnekleme hatası biraz arttı.
Örneklem büyüklüğünün 625 gözleme çıkarıldığını varsayalım. Bu durumda örnekleme hatası:

Aynı popülasyon büyüklüğü ile örneklemin 2,8 kat arttırılması, örnekleme hatasının boyutunu 1,6 kattan fazla azaltır.

Örnek popülasyon oluşturma yöntem ve teknikleri.

İstatistikte, çalışmanın amaçlarına göre belirlenen ve çalışma nesnesinin özelliklerine bağlı olarak örnek popülasyonlar oluşturmak için çeşitli yöntemler kullanılır.

Örneklem araştırması yapmanın temel koşulu, örnekleme dahil edilecek genel nüfusun her birimi için fırsat eşitliği ilkesinin ihlalinden kaynaklanan sistematik hataların oluşmasının önlenmesidir. Sistematik hataların önlenmesi, örnek popülasyon oluşturmak için bilimsel temelli yöntemlerin kullanılmasıyla sağlanır.

Popülasyondan birimleri seçmek için aşağıdaki yöntemler vardır:

1) bireysel seçim - numune için bireysel birimler seçilir;

2) grup seçimi - örnek, niteliksel olarak homojen grupları veya incelenen birim dizilerini içerir;

3) birleşik seçilim, bireysel ve grup seçiliminin birleşimidir.
Seçim yöntemleri, örnek popülasyon oluşturma kurallarına göre belirlenir.

Örnek şunlar olabilir:

  • aslında rastgeleÖrnek popülasyonun, genel popülasyondan bireysel birimlerin rastgele (kasıtsız) seçilmesi sonucu oluşması gerçeğinden oluşur. Bu durumda örnek popülasyonda seçilen birim sayısı genellikle kabul edilen örnek oranına göre belirlenir. Örnek oranı, örnek popülasyon n'deki birim sayısının genel popülasyon N'deki birim sayısına oranıdır, yani.
  • mekanikÖrnek popülasyondaki birimlerin seçiminin, eşit aralıklara (gruplara) bölünmüş genel popülasyondan yapılması gerçeğinden oluşur. Bu durumda popülasyondaki aralığın büyüklüğü örneklem oranının tersine eşit olur. Yani, %2'lik bir örnekle her 50. birim seçilir (1:0.02), %5'lik bir örnekle her 20. birim (1:0.05) vb. seçilir. Böylece, kabul edilen seçilim oranına uygun olarak genel nüfus, adeta mekanik olarak eşit büyüklükteki gruplara bölünür. Her gruptan örnek için yalnızca bir birim seçilir.
  • tipik - genel nüfusun ilk olarak homojen tipik gruplara ayrıldığı yer. Daha sonra, her bir tipik gruptan tamamen rastgele veya mekanik bir örnek, birimlerin örnek popülasyona ayrı ayrı seçilmesi için kullanılır. Tipik bir numunenin önemli bir özelliği, numune popülasyonundaki diğer birimleri seçme yöntemleriyle karşılaştırıldığında daha doğru sonuçlar vermesidir;
  • seri- genel nüfusun eşit büyüklükteki gruplara bölündüğü seriler. Örnek popülasyona seriler seçilir. Seri içerisinde seriye dahil olan birimlerin sürekli gözlemi yapılmakta;
  • kombine- örnekleme iki aşamalı olabilir. Bu durumda nüfus önce gruplara ayrılır. Daha sonra gruplar seçilir ve ikincisinin içinde bireysel birimler seçilir.

İstatistikte örnek popülasyondaki birimleri seçmek için aşağıdaki yöntemler vardır::

  • tek kademeliörnekleme - seçilen her birim, belirli bir kritere göre (uygun rastgele ve seri örnekleme) derhal çalışmaya tabi tutulur;
  • çok aşamalıörnekleme - bireysel grupların genel popülasyonundan bir seçim yapılır ve bireysel birimler gruplardan seçilir (örnek popülasyona birimlerin seçilmesi için mekanik bir yöntemle tipik örnekleme).

Ayrıca şunlar da vardır:

  • yeniden seçim- geri dönen topun şemasına göre. Bu durumda örneğe dahil edilen her birim veya seri genel popülasyona geri döner ve dolayısıyla tekrar örneğe dahil olma şansına sahip olur;
  • seçimi tekrarla- geri dönmeyen top şemasına göre. Aynı örneklem büyüklüğü ile daha doğru sonuçlara sahiptir.

Gerekli numune boyutunun belirlenmesi (Student's t-table kullanılarak).

Örnekleme teorisindeki bilimsel ilkelerden biri yeterli sayıda birimin seçilmesini sağlamaktır. Teorik olarak bu prensibe uyma ihtiyacı, olasılık teorisindeki limit teoremlerinin kanıtlarında sunulmakta olup, bu, yeterli olacak şekilde popülasyondan hangi hacimde birimlerin seçilmesi gerektiğini belirlemeyi mümkün kılar ve numunenin temsil edilebilirliğini sağlar.

Standart örnekleme hatasındaki bir azalma ve dolayısıyla tahminin doğruluğundaki bir artış, her zaman numune büyüklüğündeki bir artışla ilişkilidir, bu nedenle, numune gözlemini organize etme aşamasında, numune boyutunun ne olduğuna karar vermek gerekir. Örnek popülasyon, gözlem sonuçlarının gerekli doğruluğunu sağlayacak şekilde olmalıdır. Gerekli numune büyüklüğünün hesaplanması, belirli bir türe ve seçim yöntemine karşılık gelen maksimum numune alma hatalarına (A) ilişkin formüllerden türetilen formüller kullanılarak oluşturulur. Yani, rastgele tekrarlanan bir örneklem büyüklüğü (n) için elimizde:

Bu formülün özü, gerekli sayının rastgele tekrarlanan seçimiyle örneklem büyüklüğünün güven katsayısının karesiyle doğru orantılı olmasıdır. (t2) ve varyasyon karakteristiğinin varyansı (?2) ve maksimum örnekleme hatasının (?2) karesiyle ters orantılıdır. Özellikle, maksimum hatanın iki kat artmasıyla gerekli örneklem büyüklüğü dört kat azaltılabilir. Üç parametreden ikisi (t ve?) araştırmacı tarafından belirlenir.

Aynı zamanda araştırmacı, buna dayanarakÖrneklem araştırmasının amaç ve hedeflerinden şu sorunun çözülmesi gerekir: Optimum seçeneği sağlamak için bu parametreleri hangi niceliksel kombinasyona dahil etmek daha iyidir? Bir durumda, doğruluk ölçüsünden (?) ziyade elde edilen sonuçların güvenilirliğinden (t) daha memnun olabilir, diğer durumda ise tam tersi olabilir. Maksimum örnekleme hatasının değeri ile ilgili sorunu çözmek daha zordur, çünkü araştırmacı örnek gözlemi tasarlama aşamasında bu göstergeye sahip değildir, bu nedenle pratikte maksimum örnekleme hatasının değerini ayarlamak gelenekseldir, genellikle özelliğin beklenen ortalama seviyesinin %10'u dahilindedir. Tahmini ortalamanın belirlenmesine farklı yollarla yaklaşılabilir: daha önceki benzer araştırmalardan elde edilen veriler kullanılarak veya örnekleme çerçevesinden alınan veriler kullanılarak ve küçük bir pilot örneklem gerçekleştirilerek.

Bir örnek gözlem tasarlarken belirlenmesi en zor şey formül (5.2)'deki üçüncü parametredir - örnek popülasyonun varyansı. Bu durumda araştırmacının elinde bulunan, daha önce yapılmış benzer ve pilot araştırmalarda elde edilen tüm bilgilerin kullanılması gerekmektedir.

Tanımla ilgili soruÖrnekleme araştırması örnekleme birimlerinin çeşitli özelliklerinin incelenmesini içeriyorsa gerekli örneklem büyüklüğü daha karmaşık hale gelir. Bu durumda, her bir özelliğin ortalama seviyeleri ve bunların varyasyonları, kural olarak farklıdır ve bu nedenle, hangi özelliklerin hangi varyansının tercih edileceğine karar vermek, yalnızca araştırmanın amaç ve hedeflerini dikkate alarak mümkündür. anket.

Bir örnek gözlem tasarlarken, belirli bir çalışmanın hedeflerine ve gözlem sonuçlarına dayalı sonuçların olasılığına uygun olarak izin verilen örnekleme hatasının önceden belirlenmiş bir değeri varsayılır.

Genel olarak, numune ortalamasının maksimum hatasına ilişkin formül şunları belirlememize olanak tanır:

Genel nüfus göstergelerinin örnek nüfus göstergelerinden olası sapmalarının büyüklüğü;

Olası hata sınırlarının belirli bir değeri aşmayacağı, gerekli doğruluğu sağlayan gerekli numune boyutu;

Bir numunedeki hatanın belirli bir sınıra sahip olma olasılığı.

Öğrenci dağılımı olasılık teorisinde, kesinlikle sürekli dağılımların tek parametreli bir ailesidir.

Dinamik seriler (aralık, moment), kapanış dinamik serileri.

Dinamik serisi- bunlar belirli bir kronolojik sırayla sunulan istatistiksel göstergelerin değerleridir.

Her zaman serisi iki bileşen içerir:

1) zaman aralıklarının göstergeleri (yıllar, çeyrekler, aylar, günler veya tarihler);

2) seri seviyeleri olarak adlandırılan, zaman dilimleri veya karşılık gelen tarihler için incelenen nesneyi karakterize eden göstergeler.

Serinin seviyeleri ifade ediliyor hem mutlak hem de ortalama veya göreceli değerler. Göstergelerin niteliğine bağlı olarak mutlak, göreceli ve ortalama değerlerden oluşan zaman serileri oluşturulur. Göreceli ve ortalama değerlerden oluşan dinamik seriler, türetilmiş mutlak değer serileri esas alınarak oluşturulur. Dinamiklerin aralık ve moment serileri vardır.

Dinamik aralık serisi belirli zaman aralıklarına ait gösterge değerlerini içerir. Bir aralık serisinde, olgunun daha uzun bir periyottaki hacmini veya birikmiş toplamları elde etmek için seviyeler toplanabilir.

Dinamik an serisi göstergelerin değerlerini belirli bir zaman noktasında (tarih tarihi) yansıtır. Moment serilerinde araştırmacı yalnızca serinin belirli tarihler arasındaki düzeyindeki değişimi yansıtan olgulardaki farkla ilgilenebilir, çünkü buradaki düzeylerin toplamı gerçek bir içeriğe sahip değildir. Kümülatif toplamlar burada hesaplanmaz.

Zaman serilerinin doğru kurgulanmasının en önemli koşulu, serilerin farklı dönemlere ait seviyelerinin karşılaştırılabilir olmasıdır. Düzeyler homojen miktarlarda sunulmalı ve olgunun farklı bölümlerinin kapsamı eşit derecede eksiksiz olmalıdır.

İçin Gerçek dinamiklerin bozulmasını önlemek için, istatistiksel bir çalışmada zaman serisinin istatistiksel analizinden önce ön hesaplamalar yapılır (dinamik serilerin kapatılması). Dinamik serilerin kapanışı, seviyeleri farklı metodoloji kullanılarak hesaplanan veya bölgesel sınırlara vb. karşılık gelmeyen iki veya daha fazla seriden oluşan bir serinin birleşimi olarak anlaşılmaktadır. Dinamik serilerin kapatılması aynı zamanda dinamik serilerin mutlak seviyelerinin ortak bir temele getirilmesi anlamına da gelebilir, bu da dinamik serilerin seviyelerinin karşılaştırılamazlığını etkisiz hale getirir.

Dinamik serilerin, katsayıların, büyüme ve büyüme oranlarının karşılaştırılabilirliği kavramı.

Dinamik serisi- bunlar doğal ve sosyal olayların zaman içindeki gelişimini karakterize eden bir dizi istatistiksel göstergedir. Rusya Devlet İstatistik Komitesi tarafından yayınlanan istatistik koleksiyonları, tablo halinde çok sayıda dinamik seri içermektedir. Dinamik seriler, incelenen olgunun gelişim kalıplarını tanımlamayı mümkün kılar.

Dynamics serisi iki tür gösterge içerir. Zaman göstergeleri(yıllar, üç aylık dönemler, aylar vb.) veya zaman içindeki noktalar (yılın başında, her ayın başında vb.). Satır düzeyi göstergeleri. Dinamik serilerin seviyelerinin göstergeleri mutlak değerler (ton veya ruble cinsinden ürün üretimi), göreceli değerler (% olarak kentsel nüfusun payı) ve ortalama değerler (sanayi çalışanlarının yıllara göre ortalama ücretleri) olarak ifade edilebilir. , vesaire.). Tablo biçiminde bir zaman serisi iki sütun veya iki satır içerir.

Zaman serilerinin doğru şekilde oluşturulması bir dizi gereksinimin yerine getirilmesini gerektirir:

  1. bir dizi dinamiğin tüm göstergeleri bilimsel temelli ve güvenilir olmalıdır;
  2. Bir dizi dinamiğin göstergeleri zaman içinde karşılaştırılabilir olmalıdır; aynı dönemler için veya aynı tarihlerde hesaplanmalıdır;
  3. bir dizi dinamiğin göstergeleri bölge genelinde karşılaştırılabilir olmalıdır;
  4. Bir dizi dinamiğin göstergeleri içerik açısından karşılaştırılabilir olmalıdır; aynı şekilde tek bir metodolojiye göre hesaplanır;
  5. Bir dizi dinamiğin göstergeleri, dikkate alınan çiftlikler arasında karşılaştırılabilir olmalıdır. Bir dizi dinamiğin tüm göstergeleri aynı ölçüm birimlerinde verilmelidir.

İstatistiksel göstergeler belirli bir süre boyunca incelenen sürecin sonuçlarını veya incelenen olgunun belirli bir andaki durumunu karakterize edebilir; göstergeler aralıklı (periyodik) ve anlık olabilir. Buna göre başlangıçta dinamik seriler aralıklı veya anlık olabilir. Moment dinamiği serileri ise eşit veya eşit olmayan zaman aralıklarında olabilir.

Başlangıçtaki dinamik seriler, bir dizi ortalama değere ve bir dizi göreceli değere (zincir ve temel) dönüştürülebilir. Bu tür zaman serilerine türetilmiş zaman serileri denir.

Dinamik serilerdeki ortalama seviyenin hesaplanmasına yönelik metodoloji, dinamik serinin türüne bağlı olarak farklıdır. Örnekleri kullanarak, ortalama seviyeyi hesaplamak için dinamik seri türlerini ve formülleri ele alacağız.

Mutlak artışlar (Δy) serinin sonraki seviyesinin bir öncekine (gr. 3. - zincir mutlak artışları) veya başlangıç ​​seviyesine (gr. 4. - temel mutlak artışlara) göre kaç birim değiştiğini gösterir. Hesaplama formülleri aşağıdaki gibi yazılabilir:

Serinin mutlak değerleri azaldığında sırasıyla “azalma” veya “azalma” meydana gelecektir.

Mutlak büyüme göstergeleri, örneğin 1998 yılında “A” ürününün üretiminin 1997 yılına göre 4 bin ton, 1994 yılına göre ise 34 bin ton arttığını; diğer yıllar için tabloya bakınız. 11,5 gr. 3 ve 4.

Büyüme oranı serinin seviyesinin bir öncekine (gr. 5 - zincir büyüme veya düşüş katsayıları) veya başlangıç ​​​​seviyesine (gr. 6 - temel büyüme veya düşüş katsayıları) kıyasla kaç kez değiştiğini gösterir. Hesaplama formülleri aşağıdaki gibi yazılabilir:

Büyüme oranı serinin bir sonraki seviyesinin bir öncekiyle (gr. 7 - zincir büyüme oranları) veya başlangıç ​​seviyesiyle (gr. 8 - temel büyüme oranları) yüzde kaçını karşılaştırdığını gösterir. Hesaplama formülleri aşağıdaki gibi yazılabilir:

Örneğin 1997 yılında “A” ürününün üretim hacmi 1996 yılına göre %105,5 idi (

Büyüme oranı raporlama dönemi seviyesinin bir öncekine (sütun 9 - zincirleme büyüme oranları) veya başlangıç ​​​​seviyesine (sütun 10 - temel büyüme oranları) kıyasla yüzde kaç oranında arttığını gösterin. Hesaplama formülleri aşağıdaki gibi yazılabilir:

T pr = T r - %100 veya T pr = mutlak büyüme / önceki dönemin seviyesi * %100

Örneğin, 1996 yılında, 1995 yılına kıyasla “A” ürünü %3,8 (%103,8 - %100) veya (8:210)x%100 daha fazla ve 1994 ile karşılaştırıldığında ise %9 (%109 -) daha fazla üretildi. %100).

Serideki mutlak seviyelerin azalması durumunda oran %100'ün altına inecek ve buna bağlı olarak bir düşüş oranı (eksi işaretli artış oranı) oluşacaktır.

%1 artışın mutlak değeri(sütun 11), bir önceki dönemin seviyesinin %1 artması için belirli bir dönemde kaç adet üretilmesi gerektiğini gösterir. Örneğimizde 1995'te 2,0 bin ton, 1998'de ise 2,3 bin ton üretmek gerekiyordu. çok daha fazlası.

%1 büyümenin mutlak değeri iki şekilde belirlenebilir:

Bir önceki dönemin düzeyi 100'e bölünür;

Zincir mutlak artışları karşılık gelen zincir büyüme oranlarına bölünür.

%1 artışın mutlak değeri =

Dinamiklerde, özellikle uzun bir süre boyunca, büyüme oranının her yüzde artış veya azalışın içeriğiyle ortak analizi önemlidir.

Zaman serilerini analiz etmek için dikkate alınan metodolojinin, hem seviyeleri mutlak değerlerle (t, bin ruble, çalışan sayısı vb.) İfade edilen zaman serileri için hem de seviyeleri olan zaman serileri için geçerli olduğunu unutmayın. göreceli göstergeler (kusurların yüzdesi, kömürün kül içeriği yüzdesi vb.) veya ortalama değerler (c/ha cinsinden ortalama verim, ortalama ücret vb.) ile ifade edilir.

Dinamik serileri analiz ederken, her yıl için bir önceki veya başlangıç ​​seviyesine kıyasla hesaplanan dikkate alınan analitik göstergelerin yanı sıra, döneme ait ortalama analitik göstergeleri de hesaplamak gerekir: serinin ortalama seviyesi, ortalama yıllık mutlak artış (azalış) ve ortalama yıllık büyüme oranı ve büyüme oranı.

Bir dizi dinamiğin ortalama seviyesini hesaplama yöntemleri yukarıda tartışılmıştır. İncelediğimiz aralık dinamiği serisinde serinin ortalama seviyesi basit aritmetik ortalama formülü kullanılarak hesaplanır:

Ürünün 1994-1998 yılları için ortalama yıllık üretim hacmi. 218,4 bin ton olarak gerçekleşti.

Ortalama yıllık mutlak büyüme de basit aritmetik ortalama formülü kullanılarak hesaplanır:

Yıllık mutlak artışlar yıllar içinde 4 ila 12 bin ton arasında değişiyordu (bkz. sütun 3) ve 1995-1998 dönemi için üretimdeki ortalama yıllık artış. 8,5 bin ton olarak gerçekleşti.

Ortalama büyüme oranını ve ortalama büyüme oranını hesaplama yöntemleri daha ayrıntılı bir değerlendirme gerektirir. Tabloda verilen yıllık seri seviyesi göstergeleri örneğini kullanarak bunları ele alalım.

Dinamik serisinin ortalama seviyesi.

Dinamik seri (veya zaman serisi)- bunlar, belirli bir istatistiksel göstergenin ardışık anlarda veya zaman dilimlerinde (yani kronolojik sıraya göre düzenlenmiş) sayısal değerleridir.

Dinamik seriyi oluşturan bir veya başka bir istatistiksel göstergenin sayısal değerlerine denir. seri seviyeleri ve genellikle harfle gösterilir sen. Serinin ilk dönemi y 1 ilk veya denir temel seviye ve sonuncusu e-n - son. Seviyelerin ilgili olduğu anlar veya zaman dilimleri şu şekilde belirlenir: T.

Dinamik seriler genellikle tablo veya grafik şeklinde sunulur ve apsis ekseni boyunca bir zaman ölçeği oluşturulur. T ve ordinat ekseni boyunca - seri düzeylerinin ölçeği sen.

Dinamik serisinin ortalama göstergeleri

Her dinamik serisi belirli bir set olarak düşünülebilir N Ortalamalar olarak özetlenebilecek zamanla değişen göstergeler. Bu tür genelleştirilmiş (ortalama) göstergeler, belirli bir göstergede farklı dönemlerde, farklı ülkelerde vb. meydana gelen değişiklikleri karşılaştırırken özellikle gereklidir.

Dinamik serisinin genelleştirilmiş bir özelliği her şeyden önce şuna hizmet edebilir: orta sıra seviyesi. Ortalama seviyeyi hesaplamanın yöntemi, serinin anlık mı yoksa aralıklı (periyodik) olmasına bağlıdır.

Durumunda aralık Bir serinin ortalama seviyesi, serinin seviyelerinin basit aritmetik ortalamasının formülü ile belirlenir;

=
Varsa an içeren satır N seviyeler ( y1, y2,…, yn) tarihler (saatler) arasında eşit aralıklar varsa, böyle bir seri kolaylıkla bir ortalama değerler serisine dönüştürülebilir. Bu durumda her dönemin başındaki gösterge (seviye) aynı zamanda bir önceki dönemin sonundaki göstergedir. Daha sonra göstergenin her dönem için ortalama değeri (tarihler arasındaki aralık) değerlerin toplamının yarısı kadar hesaplanabilir. en dönemin başında ve sonunda, yani Nasıl . Bu tür ortalamaların sayısı olacaktır. Daha önce de belirtildiği gibi, ortalama değer serileri için ortalama düzey, aritmetik ortalama kullanılarak hesaplanır.

Bu nedenle şunu yazabiliriz:
.
Payı dönüştürdükten sonra şunu elde ederiz:
,

Nerede Y1 Ve Yn— satırın ilk ve son seviyeleri; Yi— orta seviyeler.

Bu ortalama istatistiklerde şu şekilde bilinir: ortalama kronolojik an serisi için. Zamanla değişen göstergelerden hesaplandığı için adını “cronos” (zaman, Latince) kelimesinden almıştır.

Eşitsizlik durumunda tarihler arasındaki aralıklar, bir an serisi için kronolojik ortalama, tarihler arasındaki mesafeler (zaman aralıkları) ile ağırlıklandırılan, her bir an çifti için ortalama seviye değerlerinin aritmetik ortalaması olarak hesaplanabilir;
.
Bu durumda tarihler arasındaki aralıklarda seviyelerin farklı değerler aldığı varsayılmaktadır ve biz bilinen iki kişiden biriyiz ( evet Ve yi+1) ortalamaları belirliyoruz ve bundan sonra analiz edilen dönemin tamamı için genel ortalamayı hesaplıyoruz.
Her bir değerin olduğu varsayılırsa evet bir sonrakine kadar değişmeden kalır (i+ 1)- o an, yani Seviyelerdeki değişimin kesin tarihi biliniyorsa, ağırlıklı aritmetik ortalama formülü kullanılarak hesaplama yapılabilir:
,

seviyenin değişmeden kaldığı süre nerede.

Dinamik serilerdeki ortalama seviyeye ek olarak, diğer ortalama göstergeler de hesaplanır - seri seviyelerindeki ortalama değişim (temel ve zincir yöntemler), ortalama değişim oranı.

Taban çizgisi mutlak değişim anlamına gelir temeldeki son mutlak değişikliğin değişiklik sayısına bölümüdür. yani

Zincir demek mutlak değişim demektir serinin seviyeleri, tüm zincir mutlak değişikliklerinin toplamının değişiklik sayısına bölünmesinin bölümüdür; yani

Ortalama mutlak değişimlerin işareti aynı zamanda bir olgudaki değişimin doğasını ortalama olarak yargılamak için de kullanılır: büyüme, gerileme veya istikrar.

Temel ve zincir mutlak değişiklikleri kontrol etme kuralından, temel ve zincir ortalama değişikliklerinin eşit olması gerektiği sonucu çıkar.

Ortalama mutlak değişimin yanı sıra, temel ve zincirleme yöntemler kullanılarak göreceli ortalama da hesaplanır.

Temel ortalama bağıl değişim formülle belirlenir:

Zincir ortalaması bağıl değişimi formülle belirlenir:

Doğal olarak, temel ve zincir ortalama göreceli değişiklikler aynı olmalıdır ve bunları kriter değeri 1 ile karşılaştırarak ortalama olarak fenomendeki değişimin doğası hakkında bir sonuca varılır: büyüme, gerileme veya istikrar.
Temel veya zincir ortalama bağıl değişiminden 1 çıkarılarak karşılık gelen ortalama değişim oranı, bu dinamik dizisinin yansıttığı, incelenen olgudaki değişimin doğasının da yargılanabileceği işaretiyle.

Mevsimsel dalgalanmalar ve mevsimsellik endeksleri.

Mevsimsel dalgalanmalar yıl içi istikrarlı dalgalanmalardır.

Maksimum etkiyi elde etmek için yönetimin temel ilkesi, geliri maksimuma çıkarmak ve maliyetleri minimuma indirmektir. Mevsimsel dalgalanmalar incelenerek maksimum denklem problemi yılın her seviyesinde çözülür.

Mevsimsel dalgalanmaları incelerken birbiriyle ilişkili iki sorun çözülür:

1. Yıl içi dinamiklerde olgunun gelişiminin özelliklerinin belirlenmesi;

2. Mevsimsel dalga modeli oluşturularak mevsimsel dalgalanmaların ölçülmesi;

Mevsimsel değişimi ölçmek için genellikle mevsimlik hindiler sayılır. Genel olarak, dinamik serilerin orijinal denklemlerinin, karşılaştırmaya temel oluşturan teorik denklemlere oranıyla belirlenirler.

Rastgele sapmalar mevsimsel dalgalanmaların üzerine bindirildiğinden, bunları ortadan kaldırmak için mevsimsellik endekslerinin ortalaması alınır.

Bu durumda, yıllık döngünün her dönemi için genelleştirilmiş göstergeler ortalama mevsimsel endeksler şeklinde belirlenir:

Ortalama mevsimsel dalgalanma endeksleri ana gelişme eğilimindeki rastgele sapmaların etkisinden muaftır.

Trendin niteliğine bağlı olarak ortalama mevsimsellik endeksi formülü aşağıdaki biçimleri alabilir:

1.Açıkça ifade edilen ana gelişme eğilimine sahip bir dizi yıl içi dinamik için:

2. Artış veya azalış eğilimi olmayan veya önemsiz olan yıl içi dinamikler serisi için:

Genel ortalama nerede;

Ana eğilimi analiz etme yöntemleri.

Fenomenlerin zaman içindeki gelişimi, farklı nitelikteki faktörlerden ve etki gücünden etkilenir. Bazıları doğası gereği rastgeledir, bazıları ise neredeyse sürekli bir etkiye sahiptir ve dinamiklerde belirli bir gelişme eğilimi oluşturur.

İstatistiğin önemli bir görevi, çeşitli rastgele faktörlerin etkisinden bağımsız olarak trend dinamiklerini seriler halinde belirlemektir. Bu amaçla zaman serileri aralık genişletme, hareketli ortalama ve analitik seviyeleme vb. yöntemlerle işlenir.

Aralık genişletme yöntemi bir dizi dinamiğin seviyelerini içeren zaman periyotlarının genişletilmesine dayanmaktadır; küçük zaman dilimlerine ait verilerin daha büyük dönemlere ait verilerle değiştirilmesidir. Serinin başlangıç ​​seviyeleri kısa zaman dilimleriyle ilgili olduğunda özellikle etkilidir. Örneğin günlük olaylarla ilgili gösterge dizilerinin yerini haftalık, aylık vb. göstergelerle ilgili diziler alıyor. Bu daha net gösterecek “Olayın gelişim ekseni”. Genişletilmiş aralıklarla hesaplanan ortalama, ana gelişme eğiliminin yönünü ve doğasını (büyümenin hızlanması veya yavaşlaması) belirlememize olanak tanır.

Hareketli ortalama yöntemiöncekine benzer, ancak bu durumda gerçek seviyelerin yerini, ardışık olarak hareket eden (kayan) büyütülmüş aralıklar için hesaplanan ortalama seviyeler alır. M seri seviyeleri.

Örneğin eğer kabul edersek m=3, daha sonra önce serinin ilk üç seviyesinin ortalaması hesaplanır, ardından aynı sayıda seviyeden, ancak ikinciden başlayarak, sonra üçüncüden başlayarak vb. Böylece ortalama, dinamik seri boyunca bir dönem hareket ederek "kayar". Şu tarihten itibaren hesaplandı: Müyeler için hareketli ortalamalar her aralığın ortasını (ortasını) ifade eder.

Bu yöntem yalnızca rastgele dalgalanmaları ortadan kaldırır. Eğer seride mevsimsel bir dalga varsa, hareketli ortalama yöntemi kullanılarak yumuşatıldıktan sonra bile bu dalga devam edecektir.

Analitik hizalama. Rastgele dalgalanmaları ortadan kaldırmak ve bir trendi belirlemek için, analitik formüller (veya analitik seviyelendirme) kullanılarak seri seviyelerinin seviyelendirilmesi kullanılır. Bunun özü, ampirik (gerçek) seviyeleri, teorik seviyelerin zamanın bir fonksiyonu olarak kabul edildiği, matematiksel bir eğilim modeli olarak benimsenen belirli bir denklem kullanılarak hesaplanan teorik seviyelerle değiştirmektir: . Bu durumda her bir gerçek seviye iki bileşenin toplamı olarak kabul edilir: sistematik bir bileşen olan ve belirli bir denklemle ifade edilen ve trend etrafında dalgalanmalara neden olan rastgele bir değişkendir.

Analitik hizalamanın görevi aşağıdakilere iner:

1. İncelenen göstergenin gelişim eğilimini en uygun şekilde yansıtabilecek varsayımsal fonksiyon türünün gerçek verilere dayalı olarak belirlenmesi.

2. Belirtilen fonksiyonun (denklem) parametrelerinin ampirik verilerden bulunması

3. Teorik (hizalanmış) seviyelerin bulunan denklemini kullanarak hesaplama.

Belirli bir fonksiyonun seçimi, kural olarak ampirik verilerin grafiksel gösterimi temelinde gerçekleştirilir.

Modeller, parametreleri en küçük kareler yöntemi kullanılarak hesaplanan regresyon denklemleridir.

Aşağıda zaman serilerini hizalamak için en sık kullanılan regresyon denklemleri yer almakta olup bunların hangi gelişme eğilimlerini yansıtmak için en uygun olduğu belirtilmektedir.

Yukarıdaki denklemlerin parametrelerini bulmak için özel algoritmalar ve bilgisayar programları vardır. Özellikle bir düz çizgi denkleminin parametrelerini bulmak için aşağıdaki algoritma kullanılabilir:

Zamanın periyotları veya anları St = 0 olacak şekilde numaralandırılırsa, yukarıdaki algoritmalar önemli ölçüde basitleştirilecek ve

Grafikteki hizalanmış seviyeler, bu dinamik serinin gerçek seviyelerinden en yakın mesafeden geçen tek bir düz çizgi üzerinde yer alacaktır. Sapmaların karelerinin toplamı rastgele faktörlerin etkisinin bir yansımasıdır.

Bunu kullanarak denklemin ortalama (standart) hatasını hesaplıyoruz:

Burada n gözlem sayısıdır ve m denklemdeki parametre sayısıdır (bunlardan iki tane var - b 1 ve b 0).

Ana eğilim (trend), sistematik faktörlerin bir dizi dinamiğin seviyelerini nasıl etkilediğini gösterir ve seviyelerin trend () etrafındaki dalgalanması, artık faktörlerin etkisinin bir ölçüsü olarak hizmet eder.

Kullanılan zaman serisi modelinin kalitesini değerlendirmek için ayrıca kullanılır. Fisher'in F testi. İki varyansın oranı, yani regresyonun neden olduğu varyansın oranı, yani. çalışılan faktörden rastgele nedenlerin neden olduğu varyansa, yani. artık dağılım:

Genişletilmiş formda bu kriterin formülü şu şekilde sunulabilir:

burada n gözlemlerin sayısıdır, yani. satır düzeyi sayısı,

m denklemdeki parametre sayısıdır, y serinin gerçek düzeyidir,

Hizalanmış satır düzeyi - orta satır düzeyi.

Diğerlerine göre daha başarılı olan bir model her zaman yeterince tatmin edici olmayabilir. Yalnızca F kriterinin bilinen kritik sınırı aşması durumunda bu şekilde tanınabilir. Bu sınır F-dağıtım tabloları kullanılarak belirlenir.

Endekslerin özü ve sınıflandırılması.

İstatistikte bir endeks, bir olgunun büyüklüğündeki zaman, mekan veya herhangi bir standartla karşılaştırmalı değişimi karakterize eden göreceli bir gösterge olarak anlaşılmaktadır.

İndeks ilişkisinin ana unsuru indekslenen değerdir. Endekslenmiş bir değer, değişimi çalışmanın amacı olan istatistiksel bir popülasyonun bir özelliğinin değeri olarak anlaşılmaktadır.

Dizinler kullanılarak üç ana görev çözülür:

1) karmaşık bir olgudaki değişikliklerin değerlendirilmesi;

2) bireysel faktörlerin karmaşık bir olgudaki değişiklikler üzerindeki etkisinin belirlenmesi;

3) bir olgunun büyüklüğünün geçmiş dönemin büyüklüğüyle, başka bir bölgenin büyüklüğünün yanı sıra standartlar, planlar ve tahminlerle karşılaştırılması.

Endeksler 3 kritere göre sınıflandırılır:

2) nüfus unsurlarının kapsanma derecesine göre;

3) genel endeksleri hesaplama yöntemlerine göre.

İçeriğe göre endeksli miktarlar, endeksler niceliksel (hacim) göstergelerin endekslerine ve niteliksel göstergelerin endekslerine bölünmüştür. Niceliksel gösterge endeksleri - endüstriyel ürünlerin fiziksel hacmi, fiziksel satış hacmi, personel sayısı vb. endeksleri. Niteliksel gösterge endeksleri - fiyat, maliyet, işgücü verimliliği, ortalama ücret vb. endeksleri.

Nüfus birimlerinin kapsanma derecesine göre endeksler bireysel ve genel olmak üzere iki sınıfa ayrılmaktadır. Bunları karakterize etmek için indeks yöntemini kullanma pratiğinde benimsenen aşağıdaki kuralları sunuyoruz:

Q- herhangi bir ürünün fiziksel anlamda miktarı (hacmi) ; R- birim fiyat; z- birim üretim maliyeti; T- Bir birim ürün üretmek için harcanan zaman (emek yoğunluğu) ; w- birim zaman başına değer cinsinden ürünlerin üretimi; v- birim zaman başına fiziksel olarak üretim çıktısı; T— harcanan toplam süre veya çalışan sayısı.

İndekslenen değerlerin hangi döneme veya nesneye ait olduğunu ayırt edebilmek için ilgili sembolün sağ alt kısmına alt simgeler konulması adettir. Yani örneğin dinamik endekslerde kural olarak karşılaştırılan dönemler (cari, raporlama) ve karşılaştırmanın yapıldığı dönemler için 1 alt simgesi kullanılır,

Bireysel endeksler karmaşık bir olgunun bireysel öğelerindeki değişiklikleri karakterize etmeye hizmet eder (örneğin, bir tür ürünün çıktı hacmindeki değişiklik). Dinamiklerin göreceli değerlerini, yükümlülüklerin yerine getirilmesini, endeksli değerlerin karşılaştırılmasını temsil ederler.

Ürünlerin fiziksel hacminin bireysel endeksi belirlenir

Analitik açıdan bakıldığında, verilen bireysel dinamik endeksler büyüme katsayılarına (oranlarına) benzer ve cari dönemde endekslenen değerin baz döneme göre değişimini karakterize eder, yani kaç kez arttığını (azaldığını) gösterir. ya da büyümenin (azalmanın) yüzde kaçı olduğunu. Endeks değerleri katsayı veya yüzde olarak ifade edilir.

Genel (bileşik) endeks karmaşık bir olgunun tüm öğelerindeki değişiklikleri yansıtır.

Toplam endeks bir endeksin temel biçimidir. Toplam olarak adlandırılmasının nedeni pay ve paydanın bir dizi “toplam” olmasıdır.

Ortalama endeksler, tanımları.

İstatistiklerde toplu endekslere ek olarak bunların bir başka biçimi olan ağırlıklı ortalama endeksleri de kullanılmaktadır. Mevcut bilgiler genel toplam endeksin hesaplanmasına izin vermediğinde bunların hesaplanmasına başvurulur. Dolayısıyla fiyatlara ilişkin veri yoksa, ancak ürünlerin cari dönemdeki maliyetine ilişkin bilgi varsa ve her ürün için ayrı fiyat endeksleri biliniyorsa, genel fiyat endeksi toplu olarak belirlenemez ancak mümkündür. Bunu bireysel olanların ortalaması olarak hesaplamak için. Aynı şekilde, üretilen bireysel türdeki ürünlerin miktarları bilinmiyor ancak bireysel endeksler ve temel döneme ait üretim maliyeti biliniyorsa, fiziksel üretim hacminin genel endeksi ağırlıklı ortalama olarak belirlenebilir. değer.

Ortalama endeks - Bu Bireysel endekslerin ortalaması olarak hesaplanan bir endeks. Toplu endeks, genel endeksin temel biçimidir, dolayısıyla ortalama endeksin toplam endeksle aynı olması gerekir. Ortalama endeksleri hesaplarken iki ortalama türü kullanılır: aritmetik ve harmonik.

Aritmetik ortalama endeks, eğer bireysel endekslerin ağırlıkları, toplam endeksin paydasının terimleri ise, toplam endeksle aynıdır. Ancak bu durumda aritmetik ortalama formülü kullanılarak hesaplanan endeksin değeri toplam endekse eşit olacaktır.

Basit geometrik ortalamayı hesaplamak için formül kullanılır:

Geometrik ağırlıklı

Ağırlıklı geometrik ortalamayı belirlemek için aşağıdaki formül kullanılır:

Tekerleklerin, boruların ortalama çapları ve karelerin ortalama kenarları, ortalama kare kullanılarak belirlenir.

Kök-ortalama-kare değerleri, örneğin üretim ritmini karakterize eden varyasyon katsayısı gibi bazı göstergeleri hesaplamak için kullanılır. Burada belirli bir süre için planlanan üretim çıktısından standart sapma aşağıdaki formül kullanılarak belirlenir:

Bu değerler, ortalama değerinde alınan baz değerlerine kıyasla ekonomik göstergelerdeki değişimi doğru bir şekilde karakterize eder.

İkinci dereceden basit

Kök ortalama kare şu formül kullanılarak hesaplanır:

İkinci dereceden ağırlıklı

Ağırlıklı ortalama kare şuna eşittir:

22. Mutlak değişkenlik göstergeleri şunları içerir:

çeşitlilik aralığı

ortalama doğrusal sapma

dağılım

standart sapma

Değişim aralığı (r)

Varyasyon aralığı- özelliğin maksimum ve minimum değerleri arasındaki farktır

İncelenen popülasyonda bir özelliğin değerinin değiştiği sınırları gösterir.

Beş başvuranın önceki işlerindeki iş tecrübeleri: 2,3,4,7 ve 9 yıldır. Çözüm: Değişim aralığı = 9 - 2 = 7 yıl.

Nitelik değerlerindeki farklılıkların genelleştirilmiş bir açıklaması için, ortalama değişim göstergeleri, aritmetik ortalamadan sapmalar dikkate alınarak hesaplanır. Fark ortalamadan sapma olarak alınır.

Bu durumda, bir karakteristiğin değişkenlerinin ortalamadan sıfıra dönüşünün toplamından kaçınmak için (ortalamanın sıfır özelliği), ya sapmanın işaretleri göz ardı edilmeli, yani bu toplam modülo alınmalı veya sapma değerlerinin karesini alın

Ortalama doğrusal ve kare sapma

Ortalama doğrusal sapma bir özelliğin bireysel değerlerinin ortalamadan mutlak sapmalarının aritmetik ortalamasıdır.

Ortalama doğrusal sapma basittir:

Beş başvuranın önceki işlerindeki iş tecrübeleri: 2,3,4,7 ve 9 yıldır.

Örneğimizde: yıllar;

Cevap: 2,4 yıl.

Ortalama doğrusal sapma ağırlıklı gruplandırılmış veriler için geçerlidir:

Konvansiyonelliği nedeniyle, ortalama doğrusal sapma pratikte nispeten nadiren kullanılır (özellikle, teslimatın tekdüzeliğine ilişkin sözleşme yükümlülüklerinin yerine getirilmesini karakterize etmek için; üretimin teknolojik özellikleri dikkate alınarak ürün kalitesinin analizinde).

Standart sapma

Değişimin en mükemmel özelliği, standart (veya standart sapma) olarak adlandırılan ortalama kare sapmadır. Standart sapma() aritmetik ortalama özelliğinin bireysel değerlerinin ortalama kare sapmasının kareköküne eşittir:

Standart sapma basittir:

Gruplandırılmış verilere ağırlıklı standart sapma uygulanır:

Normal dağılım koşullarında ortalama karekök ile ortalama doğrusal sapmalar arasında şu oran ortaya çıkar: ~ 1,25.

Değişimin ana mutlak ölçüsü olan standart sapma, normal dağılım eğrisinin ordinat değerlerinin belirlenmesinde, numune gözleminin organizasyonu ile ilgili hesaplamalarda ve numune özelliklerinin doğruluğunun belirlenmesinde ve ayrıca numune özelliklerinin değerlendirilmesinde kullanılır. Homojen bir popülasyonda bir özelliğin varyasyonunun sınırları.

Tecrübeyle elde edilen değerler kaçınılmaz olarak çok çeşitli nedenlerden dolayı hatalar içerir. Bunlar arasında sistematik ve rastgele hatalar arasında ayrım yapılmalıdır. Sistematik hatalar, çok spesifik bir şekilde hareket eden nedenlerden kaynaklanır ve her zaman oldukça doğru bir şekilde ortadan kaldırılabilir veya dikkate alınabilir. Rastgele hatalar, doğru bir şekilde açıklanamayan ve her bir ölçümde farklı şekillerde etki eden çok sayıda bireysel nedenden kaynaklanır. Bu hatalar tamamen göz ardı edilemez; bunlar yalnızca ortalama olarak dikkate alınabilir; bunun için rastgele hataları yöneten yasaların bilinmesi gerekir.

Ölçülen miktarı A ile ve ölçümdeki rastgele hatayı x ile göstereceğiz. X hatası herhangi bir değeri alabileceğinden, tamamen dağıtım yasasıyla karakterize edilen sürekli bir rastgele değişkendir.

Gerçeği en basit ve en doğru şekilde yansıtan (çoğu durumda) sözde normal hata dağılımı kanunu:

Bu dağıtım yasası, çeşitli teorik öncüllerden, özellikle, aynı doğruluk derecesine sahip bir dizi değerin doğrudan ölçümle elde edildiği bilinmeyen bir miktarın en olası değerinin, aşağıdakilerin aritmetik ortalaması olması gerekliliğinden elde edilebilir: bu değerler. 2. miktar denir dağılım bu normal yasanın.

Aritmetik ortalama

Deneysel verilerden dağılımın belirlenmesi. Herhangi bir A değeri için, n değerleri ai aynı doğruluk derecesiyle doğrudan ölçümle elde edilirse ve A değerinin hataları normal dağılım yasasına tabiyse, o zaman A'nın en olası değeri şöyle olacaktır: aritmetik ortalama:

a - aritmetik ortalama,

a i - i'inci adımda ölçülen değer.

A değerinin gözlemlenen değerinin (her gözlem için) sapması aritmetik ortalama: a ben - a.

Bu durumda normal hata dağılım yasasının varyansını belirlemek için aşağıdaki formülü kullanın:

2 - dağılım,
a - aritmetik ortalama,
n - parametre ölçümlerinin sayısı,

Standart sapma

Standart sapmaölçülen değerlerin mutlak sapmasını gösterir aritmetik ortalama. Doğrusal bir kombinasyonun doğruluk ölçümü formülüne uygun olarak ortalama kare hatası Aritmetik ortalama aşağıdaki formülle belirlenir:

, Nerede


a - aritmetik ortalama,
n - parametre ölçümlerinin sayısı,
a i - i'inci adımda ölçülen değer.

Değişim katsayısı

Değişim katsayısıölçülen değerlerin göreceli sapma ölçüsünü karakterize eder aritmetik ortalama:

, Nerede

V - varyasyon katsayısı,
- standart sapma,
a - aritmetik ortalama.

Değer ne kadar yüksek olursa varyasyon katsayısıçalışılan değerlerin dağılımı nispeten daha büyük ve tekdüzeliği daha az olur. Eğer varyasyon katsayısı%10'dan az olması durumunda varyasyon serisinin değişkenliği önemsiz olarak kabul edilir, %10 ila %20 arası ortalama olarak kabul edilir, %20'den fazlası ve %33'ten azı anlamlı kabul edilir ve eğer varyasyon katsayısı%33'ü aşarsa bu, bilgilerin heterojenliğini ve en büyük ve en küçük değerlerin hariç tutulması gerektiğini gösterir.

Ortalama doğrusal sapma

Değişimin kapsamı ve yoğunluğunun göstergelerinden biri ortalama doğrusal sapma(ortalama sapma modülü) aritmetik ortalamadan. Ortalama doğrusal sapma formülle hesaplanır:

, Nerede

_
a - ortalama doğrusal sapma,
a - aritmetik ortalama,
n - parametre ölçümlerinin sayısı,
a i - i'inci adımda ölçülen değer.

Çalışılan değerlerin normal dağılım yasasına uygunluğunu kontrol etmek için ilişki kullanılır asimetri göstergesi hatasına ve tutumuna basıklık göstergesi onun hatasına.

Asimetri göstergesi

Asimetri göstergesi(A) ve hatası (m a) aşağıdaki formüller kullanılarak hesaplanır:

, Nerede

A - asimetri göstergesi,
- standart sapma,
a - aritmetik ortalama,
n - parametre ölçümlerinin sayısı,
a i - i'inci adımda ölçülen değer.

Basıklık göstergesi

Basıklık göstergesi(E) ve hatası (m e) aşağıdaki formüller kullanılarak hesaplanır:

, Nerede



 


Okumak:



Bütçe ile yerleşimlerin muhasebeleştirilmesi

Bütçe ile yerleşimlerin muhasebeleştirilmesi

Muhasebedeki Hesap 68, hem işletme masraflarına düşülen bütçeye yapılan zorunlu ödemeler hakkında bilgi toplamaya hizmet eder hem de...

Bir tavada süzme peynirden cheesecake - kabarık cheesecake için klasik tarifler 500 g süzme peynirden Cheesecake

Bir tavada süzme peynirden cheesecake - kabarık cheesecake için klasik tarifler 500 g süzme peynirden Cheesecake

Malzemeler: (4 porsiyon) 500 gr. süzme peynir 1/2 su bardağı un 1 yumurta 3 yemek kaşığı. l. şeker 50 gr. kuru üzüm (isteğe bağlı) bir tutam tuz kabartma tozu...

Kuru erikli siyah inci salatası Kuru erikli siyah inci salatası

Salata

Günlük diyetlerinde çeşitlilik için çabalayan herkese iyi günler. Monoton yemeklerden sıkıldıysanız ve sizi memnun etmek istiyorsanız...

Domates salçası tarifleri ile Lecho

Domates salçası tarifleri ile Lecho

Kışa hazırlanan Bulgar leçosu gibi domates salçalı çok lezzetli leço. Ailemizde 1 torba biberi bu şekilde işliyoruz (ve yiyoruz!). Ve ben kimi...

besleme resmi RSS