Ev - Onarımı kendim yapabilirim
Standart sapma ölçülür. Fark: genel, örnek, düzeltilmiş

Hipotezlerin istatistiksel olarak test edilmesinde, rastgele değişkenler arasındaki doğrusal bir ilişki ölçülürken.

Ortalama standart sapma:

Standart Sapma(rastgele değişken Zemin, etrafımızdaki duvarlar ve tavanın standart sapmasının tahmini, X onunla ilgili matematiksel beklenti varyansının tarafsız bir tahminine dayanarak):

dağılım nerede; - Zemin, etrafımızdaki duvarlar ve tavan, Ben seçimin inci unsuru; - numune boyutu; - numunenin aritmetik ortalaması:

Her iki tahminin de taraflı olduğunu belirtmek gerekir. İÇİNDE genel durum Tarafsız bir tahmin yapmak mümkün değildir. Ancak tarafsız varyans tahminine dayalı tahmin tutarlıdır.

Üç sigma kuralı

Üç sigma kuralı() - normal olarak dağıtılan bir rastgele değişkenin neredeyse tüm değerleri aralıkta yer alır. Daha kesin olarak - %99,7'den az olmayan bir güvenle, normal olarak dağıtılan bir rastgele değişkenin değeri, belirtilen aralıkta yer alır (değerin doğru olması ve numune işlemenin bir sonucu olarak elde edilmemesi koşuluyla).

Eğer gerçek değeri bilinmiyorsa o zaman Zemini, etrafımızdaki duvarları ve tavanı kullanmamalıyız. S. Böylece üç sigma kuralı üç kat kuralına, etrafımızdaki duvarlara ve tavana dönüşür. S .

Standart sapma değerinin yorumlanması

Büyük bir standart sapma değeri, sunulan setteki değerlerin, setin ortalama değeri ile geniş bir yayılımını gösterir; buna göre küçük bir değer, kümedeki değerlerin ortalama değer etrafında gruplandığını gösterir.

Örneğin üç sayı kümemiz var: (0, 0, 14, 14), (0, 6, 8, 14) ve (6, 6, 8, 8). Her üç kümenin de ortalama değerleri 7'ye ve standart sapmaları sırasıyla 7, 5 ve 1'e eşittir. Son kümenin küçük bir standart sapması vardır, çünkü kümedeki değerler ortalama değer etrafında gruplandırılmıştır; ilk set en fazlasına sahip büyük değer standart sapma - küme içindeki değerler ortalama değerden büyük ölçüde farklıdır.

Genel anlamda standart sapma bir belirsizlik ölçüsü olarak düşünülebilir. Örneğin fizikte standart sapma, bir niceliğin ardışık ölçümlerinin hatasını belirlemek için kullanılır. Bu değer, teorinin öngördüğü değerle karşılaştırıldığında incelenen olgunun makullüğünü belirlemek için çok önemlidir: ölçümlerin ortalama değeri teorinin öngördüğü değerlerden büyük ölçüde farklıysa (büyük standart sapma), daha sonra elde edilen değerler veya bunları elde etme yöntemi yeniden kontrol edilmelidir.

Pratik Uygulama

Uygulamada standart sapma, bir kümedeki değerlerin ortalama değerden ne kadar farklı olabileceğini belirlemenizi sağlar.

İklim

Diyelim ki aynı ortalama maksimum günlük sıcaklığa sahip iki şehir var, ancak biri sahilde, diğeri ise iç kesimlerde. Kıyıda yer alan şehirlerin birçok farklı maksimum gündüz sıcaklığına sahip olduğu ve iç kesimlerde bulunan şehirlerden daha düşük olduğu bilinmektedir. Bu nedenle, ortalama değerleri aynı olmasına rağmen, bir kıyı kenti için maksimum günlük sıcaklıkların standart sapması, ikinci kentten daha az olacaktır; bu, pratikte her bir kentin maksimum hava sıcaklığının aynı olma ihtimali anlamına gelir. belirli gün Yıllık ortalama değer, kıtanın içinde yer alan bir şehir için daha yüksek olan ortalama değerden daha güçlü bir şekilde farklılaşacaktır.

Spor

Atılan ve yenilen gol sayısı, gol şansı vb. gibi bazı parametrelere göre değerlendirilen birkaç futbol takımının olduğunu varsayalım. Bu gruptaki en iyi takımın büyük olasılıkla bu takıma sahip olması muhtemeldir. en iyi değerlerİle Daha parametreler. Sunulan parametrelerin her biri için takımın standart sapması ne kadar küçük olursa, bu tür takımların sonucu o kadar öngörülebilir olur; Öte yandan takımla büyük değer standart sapma, sonucu tahmin etmeyi zorlaştırır ve bu da bir dengesizlikle açıklanır; örneğin güçlü savunma ancak zayıf saldırı.

Takım parametrelerinin standart sapmasını kullanmak, iki takım arasındaki bir maçın sonucunu bir dereceye kadar tahmin etmeyi, güçlü yönleri değerlendirmeyi ve zayıflıklar emirler ve dolayısıyla seçilen mücadele yöntemleri.

Teknik analiz

Ayrıca bakınız

Edebiyat

* Borovikov, V.İSTATİSTİK. Bilgisayarda veri analizi sanatı: Profesyoneller için / V. Borovikov. - St.Petersburg. : Peter, 2003. - 688 s. - ISBN 5-272-00078-1.

Bu yazımda bunlardan bahsedeceğim standart sapma nasıl bulunur. Bu materyal matematiğin tam olarak anlaşılması için son derece önemlidir, bu nedenle bir matematik öğretmeninin ayrı bir ders, hatta birkaç dersi bu konuyu incelemeye ayırması gerekir. Bu yazıda standart sapmanın ne olduğunu ve nasıl bulunacağını açıklayan detaylı ve anlaşılır bir video eğitiminin bağlantısını bulacaksınız.

Standart sapma Belirli bir parametrenin ölçülmesi sonucunda elde edilen değerlerin yayılımının değerlendirilmesini mümkün kılar. Sembolle gösterilir (Yunanca "sigma" harfi).

Hesaplama formülü oldukça basittir. Standart sapmayı bulmak için varyansın karekökünü almanız gerekir. Şimdi şunu sormalısınız: "Farklılık nedir?"

Varyans nedir

Varyansın tanımı şu şekildedir. Dağılım, değerlerin ortalamadan karesel sapmalarının aritmetik ortalamasıdır.

Varyansı bulmak için aşağıdaki hesaplamaları sırayla gerçekleştirin:

  • Ortalamayı belirleyin (bir dizi değerin basit aritmetik ortalaması).
  • Daha sonra her bir değerden ortalamayı çıkarın ve ortaya çıkan farkın karesini alın (sonucu elde edersiniz) kare farkı).
  • Bir sonraki adım, ortaya çıkan kareler farklarının aritmetik ortalamasını hesaplamaktır (Karelerin tam olarak neden olduğunu aşağıda bulabilirsiniz).

Bir örneğe bakalım. Diyelim ki siz ve arkadaşlarınız köpeklerinizin boyunu (milimetre cinsinden) ölçmeye karar verdiniz. Ölçümler sonucunda aşağıdaki yükseklik ölçümlerini aldınız (omuzlarda): 600 mm, 470 mm, 170 mm, 430 mm ve 300 mm.

Ortalamayı, varyansı ve standart sapmayı hesaplayalım.

İlk önce ortalama değeri bulalım. Bildiğiniz gibi, bunu yapmak için ölçülen tüm değerleri toplamanız ve ölçüm sayısına bölmeniz gerekir. Hesaplama ilerlemesi:

Ortalama mm.

Yani ortalama (aritmetik ortalama) 394 mm'dir.

Şimdi belirlememiz gerekiyor her köpeğin boyunun ortalamadan sapması:

Nihayet, varyansı hesaplamak, ortaya çıkan farkların her birinin karesini alırız ve ardından elde edilen sonuçların aritmetik ortalamasını buluruz:

Dağılım mm2 .

Böylece dağılım 21704 mm2 olur.

Standart sapma nasıl bulunur?

Peki varyansı bilerek standart sapmayı şimdi nasıl hesaplayabiliriz? Hatırladığımız gibi bunun karekökünü alalım. Yani standart sapma şuna eşittir:

Mm (mm cinsinden en yakın tam sayıya yuvarlanır).

Bu yöntemi kullanarak bazı köpeklerin (örneğin Rottweiler) çok büyük köpekler olduğunu bulduk. Ama aynı zamanda çok küçük köpekler de var (örneğin daksundlar, ama bunu onlara söylememelisin).

En ilginç şey, standart sapmanın da beraberinde gelmesidir faydalı bilgiler. Artık ortalamadan standart sapmayı (her iki tarafa) çizersek, elde edilen yükseklik ölçüm sonuçlarından hangisinin elde ettiğimiz aralıkta olduğunu gösterebiliriz.

Yani standart sapmayı kullanarak, hangi değerlerin normal (istatistiksel olarak ortalama) olduğunu ve hangisinin olağanüstü derecede büyük veya tam tersi küçük olduğunu bulmamızı sağlayan bir "standart" yöntem elde ederiz.

Standart sapma nedir

Ama... analiz edersek her şey biraz farklı olacak örnek veri. Örneğimizde düşündük genel nüfus. Yani 5 köpeğimiz dünyada ilgimizi çeken tek köpeklerdi.

Ancak veriler bir örnekse (büyük bir popülasyondan seçilen değerler), o zaman hesaplamaların farklı yapılması gerekir.

Değerler varsa, o zaman:

Ortalamanın belirlenmesi de dahil olmak üzere diğer tüm hesaplamalar benzer şekilde yapılır.

Örneğin, beş köpeğimiz köpek popülasyonunun (gezegendeki tüm köpekler) yalnızca bir örneğiyse, şuna bölmeliyiz: 5 değil 4 yani:

Örneklem varyansı = mm2.

Bu durumda numunenin standart sapması şuna eşittir: mm (en yakın tam sayıya yuvarlanır).

Değerlerimizin sadece küçük bir örnek olması durumunda bir miktar “düzeltme” yaptığımızı söyleyebiliriz.

Not. Neden tam olarak kare farklar?

Peki varyansı hesaplarken neden tam olarak farkların karelerini alıyoruz? Diyelim ki bazı parametreleri ölçerken aşağıdaki değer kümesini aldınız: 4; 4; -4; -4. Ortalamadan mutlak sapmaları (farklar) basitçe toplarsak... negatif değerler pozitif olanlarla birbirini götürür:

.

Bu seçeneğin işe yaramaz olduğu ortaya çıktı. O zaman belki sapmaların mutlak değerlerini (yani bu değerlerin modüllerini) denemeye değer mi?

İlk bakışta iyi görünüyor (bu arada ortaya çıkan değere ortalama mutlak sapma denir), ancak her durumda değil. Başka bir örnek deneyelim. Ölçüm sonucunun aşağıdaki değer kümesiyle sonuçlanmasını sağlayın: 7; 1; -6; -2. O halde ortalama mutlak sapma:

Vay! Farklar çok daha büyük bir dağılıma sahip olsa da yine 4 sonucunu aldık.

Şimdi farkların karesini alırsak (ve sonra toplamlarının karekökünü alırsak) ne olacağını görelim.

İlk örnek için şöyle olacaktır:

.

İkinci örnek için şöyle olacaktır:

Şimdi tamamen farklı bir konu! Farklılıklar ne kadar geniş olursa, standart sapma da o kadar büyük olur... Bizim hedeflediğimiz de buydu.

Aslında bu yöntem, noktalar arasındaki mesafeyi hesaplarken kullanılan fikrin aynısını kullanır, ancak farklı bir şekilde uygulanır.

Matematiksel açıdan bakıldığında karelerin kullanımı ve karekökler Sapmaların mutlak değerlerinden elde edebileceğimizden daha fazla fayda sağlayarak standart sapmayı diğer matematik problemlerine uygulanabilir hale getirir.

Sergey Valerievich size standart sapmayı nasıl bulacağınızı anlattı

Ders No.4

Konu: “Açıklayıcı istatistikler. Toplamda özellik çeşitliliğinin göstergeleri"

İstatistiksel bir popülasyondaki bir özelliğin çeşitliliğine ilişkin ana kriterler şunlardır: limit, genlik, standart sapma, salınım katsayısı ve varyasyon katsayısı. Önceki derste, ortalama değerlerin toplamda incelenen özelliğin yalnızca genelleştirilmiş bir özelliğini sağladığı ve bireysel değişkenlerinin değerlerini dikkate almadığı tartışılmıştı: minimum ve maksimum değerler, ortalamanın üstünde, altında ortalama vb.

Örnek. İki farklı sayı dizisinin ortalama değerleri: -100; -20; 100; 20 ve 0,1; -0,2; 0,1 kesinlikle aynı ve eşittirHAKKINDA.Ancak bu göreceli ortalama dizi verilerinin dağılım aralıkları çok farklıdır.

Bir özelliğin çeşitliliği için listelenen kriterlerin belirlenmesi, öncelikle istatistiksel popülasyonun bireysel unsurlarındaki değeri dikkate alınarak gerçekleştirilir.

Bir özelliğin varyasyonunu ölçmek için göstergeler mutlak Ve akraba. Mutlak varyasyon göstergeleri şunları içerir: varyasyon aralığı, limit, standart sapma, dağılım. Değişim katsayısı ve salınım katsayısı göreceli değişim ölçümlerini ifade eder.

Limit (lim)– Bu, bir varyasyon serisindeki bir varyantın uç değerleri tarafından belirlenen bir kriterdir. Başka bir deyişle bu kriter, özelliğin minimum ve maksimum değerleriyle sınırlıdır:

Genlik (Am) veya çeşitlilik aralığı – Aşırı seçenekler arasındaki fark budur. Bu kriterin hesaplanması, minimum değerinin özelliğin maksimum değerinden çıkarılmasıyla gerçekleştirilir; bu, seçeneğin dağılım derecesini tahmin etmemizi sağlar:

Değişkenlik kriteri olarak limit ve genliğin dezavantajı, bunların tamamen varyasyon serisindeki özelliğin uç değerlerine bağlı olmasıdır. Bu durumda bir seri içindeki nitelik değerlerindeki dalgalanmalar dikkate alınmaz.

İstatistiksel bir popülasyondaki bir özelliğin çeşitliliğinin en eksiksiz tanımı şu şekilde sağlanır: standart sapma(sigma), bir seçeneğin ortalama değerinden sapmasının genel bir ölçüsüdür. Standart sapmaya sıklıkla denir standart sapma.

Standart sapma, her seçeneğin belirli bir popülasyonun aritmetik ortalaması ile karşılaştırılmasına dayanır. Toplamda her zaman ondan daha az ve daha fazla seçenek olacağından, "" işaretli sapmaların toplamı "" işaretli sapmaların toplamı ile iptal edilecektir, yani. tüm sapmaların toplamı sıfırdır. Farklılıkların işaretlerinin etkisinden kaçınmak için aritmetik ortalamanın karesinden sapmalar alınır; . Sapmaların karelerinin toplamı sıfıra eşit değildir. Değişkenliği ölçebilecek bir katsayı elde etmek için kareler toplamının ortalamasını alın; bu değere denir. farklılıklar:

Aslında dağılım, bir özelliğin bireysel değerlerinin ortalama değerinden sapmalarının ortalama karesidir. Dağılım standart sapmanın karesi.

Varyans boyutlu bir miktardır (adlandırılır). Yani bir sayı serisinin varyantları metre cinsinden ifade edilirse varyans metrekareyi verir; seçenekler kilogram cinsinden ifade edilirse, varyans bu ölçümün karesini (kg 2) vb. verir.

Standart sapma– varyansın karekökü:

, daha sonra kesirin paydasındaki dağılım ve standart sapmayı hesaplarken, yerinekonulmalı.

Standart sapmanın hesaplanması, belirli bir sırayla yapılması gereken altı aşamaya ayrılabilir:

Standart sapmanın uygulanması:

a) varyasyon serilerinin değişkenliğini değerlendirmek ve aritmetik ortalamaların tipikliğinin (temsil edilebilirliğinin) karşılaştırmalı değerlendirilmesi için. Semptomların stabilitesini belirlerken ayırıcı tanıda bu gereklidir.

b) varyasyon serisini yeniden oluşturmak, yani. frekans tepkisinin restorasyonu üç sigma kuralı. Aralıkta (М±3σ) Serinin tüm varyantlarının %99,7'si (М±2σ) - %95,5 ve aralığında (М±1σ) - %68,3 satır seçeneği(Şekil 1).

c) “açılır” seçenekleri tanımlamak

d) sigma tahminlerini kullanarak norm ve patoloji parametrelerini belirlemek

e) Değişim katsayısını hesaplamak

f) Aritmetik ortalamanın ortalama hatasını hesaplamak.

Herhangi bir popülasyonu karakterize etmek içinnormal dağılım türü için iki parametreyi bilmek yeterlidir: aritmetik ortalama ve standart sapma.

Şekil 1. Üç Sigma kuralı

Örnek.

Pediatride standart sapma, belirli bir çocuğun verilerini karşılık gelen standart göstergelerle karşılaştırarak çocukların fiziksel gelişimini değerlendirmek için kullanılır. Sağlıklı çocukların fiziksel gelişiminin aritmetik ortalaması standart olarak alınır. Göstergelerin standartlarla karşılaştırılması, standartların ilgili sigma ölçekleriyle birlikte verildiği özel tablolar kullanılarak gerçekleştirilir. Çocuğun fiziksel gelişim göstergesinin standart (aritmetik ortalama) ±σ dahilinde olması durumunda, o zaman olduğuna inanılmaktadır. fiziksel gelişimçocuk (bu göstergeye göre) normlara karşılık gelir. Gösterge ±2σ standardı dahilindeyse, normdan hafif bir sapma vardır. Gösterge bu sınırların ötesine geçerse, çocuğun fiziksel gelişimi normdan keskin bir şekilde farklılık gösterir (patoloji mümkündür).

İstatistiksel araştırmalar, mutlak değerlerle ifade edilen varyasyon göstergelerine ek olarak, göreceli değerlerle ifade edilen varyasyon göstergelerini de kullanır. Salınım katsayısı - bu, varyasyon aralığının özelliğin ortalama değerine oranıdır. Değişim katsayısı - Bu, standart sapmanın özelliğin ortalama değerine oranıdır. Tipik olarak bu değerler yüzde olarak ifade edilir.

Göreli varyasyon göstergelerini hesaplamak için formüller:

Yukarıdaki formüllerden katsayının ne kadar büyük olduğu açıktır. V sıfıra ne kadar yakınsa, karakteristik değerlerindeki değişim o kadar küçük olur. Daha fazla V işareti ne kadar değişken olursa.

İstatistiksel uygulamada en sık varyasyon katsayısı kullanılır. Yalnızca varyasyonun karşılaştırmalı değerlendirmesi için değil, aynı zamanda popülasyonun homojenliğini karakterize etmek için de kullanılır. Varyasyon katsayısı %33'ü geçmiyorsa (normale yakın dağılımlar için) popülasyon homojen kabul edilir. Aritmetik olarak, σ ve aritmetik ortalamanın oranı etkiyi nötralize eder mutlak değer Bu özellikler ve yüzde oranı, varyasyon katsayısını boyutsuz (isimsiz) bir miktar haline getirir.

Varyasyon katsayısının ortaya çıkan değeri, özelliğin çeşitlilik derecesinin yaklaşık derecelerine göre tahmin edilir:

Zayıf - %10'a kadar

Ortalama - %10 - 20

Güçlü - %20'den fazla

Boyut ve boyut bakımından farklı özellikleri karşılaştırmanın gerekli olduğu durumlarda varyasyon katsayısının kullanılması tavsiye edilir.

Değişim katsayısı ile diğer dağılım kriterleri arasındaki fark açıkça ortaya konmuştur örnek.

Tablo 1

Endüstriyel işletme çalışanlarının bileşimi

Örnekte verilen istatistiksel özelliklere dayanarak, ankete katılan grubun düşük mesleki istikrarı göz önüne alındığında, işletme çalışanlarının yaş kompozisyonunun ve eğitim düzeyinin göreceli homojenliği hakkında bir sonuca varabiliriz. Bu sosyal eğilimleri standart sapmaya göre yargılama girişiminin hatalı bir sonuca yol açacağını ve "iş deneyimi" ve "yaş" muhasebe özelliklerini muhasebe göstergesi "eğitim" ile karşılaştırma girişiminin genellikle yanlış olacağını görmek kolaydır. Bu özelliklerin heterojenliği nedeniyle yanlış.

Medyan ve yüzdelikler

Serinin ortası için kriterin medyan olduğu sıralı (sıralı) dağılımlar için standart sapma ve dağılım, varyantın dağılımının özellikleri olarak hizmet edemez.

Aynı şey açık varyasyon serileri için de geçerlidir. Bu durum, varyans ve σ'nun hesaplandığı sapmaların, açık varyasyon serilerinde ve niteliksel özelliklerin dağılım serilerinde hesaplanmayan aritmetik ortalamadan ölçülmesinden kaynaklanmaktadır. Bu nedenle, dağılımların sıkıştırılmış bir açıklaması için başka bir dağılım parametresi kullanılır - yüzdelik dilim(eşanlamlı - “yüzdelik”), herhangi bir dağılım biçiminde niteliksel ve niceliksel özellikleri tanımlamak için uygundur. Bu parametre aynı zamanda niceliksel özellikleri niteliksel özelliklere dönüştürmek için de kullanılabilir. Bu durumda, bu tür derecelendirmeler, belirli bir seçeneğin hangi nicelik sırasına karşılık geldiğine bağlı olarak atanır.

Biyomedikal araştırma pratiğinde en sık aşağıdaki miktarlar kullanılır:

– medyan;

, – çeyrekler (çeyrekler), burada – alt çeyrekler, üst çeyrek.

Nicelikler, bir varyasyon serisindeki olası değişikliklerin alanını belirli aralıklara böler. Medyan (kantil), bir varyasyon serisinin ortasında yer alan ve bu seriyi ikiye iki eşit parçaya bölen bir seçenektir ( 0,5 Ve 0,5 ). Bir çeyrek, bir seriyi dört parçaya böler: ilk bölüm (alt çeyrek), sayısal değerleri mümkün olan maksimum değerin %25'ini aşmayan seçenekleri ayıran bir seçenektir. bu seri, çeyrek, mümkün olan maksimumun %50'sine kadar sayısal değere sahip seçenekleri ayırır. Üst çeyrek (), mümkün olan maksimum değerlerin %75'ine kadar olan seçenekleri ayırır.

Asimetrik dağılım durumunda Aritmetik ortalamaya göre değişken, onu karakterize etmek için medyan ve çeyrekler kullanılır. Bu durumda, ortalama değerin görüntülenmesi için aşağıdaki biçim kullanılır: Meh (;). Örneğin Buna göre incelenen özellik olan “çocuğun bağımsız yürümeye başladığı dönem” çalışma grubunda asimetrik bir dağılıma sahiptir. Aynı zamanda, alt çeyrek () yürümenin başlangıcına karşılık gelir - 9,5 ay, ortanca - 11 ay, üst çeyrek () - 12 ay. Buna göre belirtilen niteliğin ortalama trend özelliği 11 (9,5; 12) ay olarak sunulacaktır.

Araştırma sonuçlarının istatistiksel anlamlılığının değerlendirilmesi

Verilerin istatistiksel önemi, gösterilen gerçekliğe karşılık gelme derecesi olarak anlaşılır; istatistiksel olarak anlamlı veriler, nesnel gerçekliği çarpıtmayan ve doğru şekilde yansıtan verilerdir.

Araştırma sonuçlarının istatistiksel anlamlılığının değerlendirilmesi, örneklem evreninden elde edilen sonuçların evrenin tamamına hangi olasılıkla aktarılabileceğinin belirlenmesi anlamına gelir. İstatistiksel anlamlılığın değerlendirilmesi, bir olgunun ne kadarının, bir bütün olarak olguyu ve onun kalıplarını yargılamak için kullanılabileceğini anlamak için gereklidir.

Araştırma sonuçlarının istatistiksel anlamlılığının değerlendirilmesi aşağıdakilerden oluşur:

1. temsil hataları (ortalama ve göreceli değerlerdeki hatalar) - M;

2. Ortalama veya göreceli değerlerin güven sınırları;

3. Kriterlere göre ortalama veya göreceli değerlerdeki farkın güvenilirliği T.

Aritmetik ortalamanın standart hatası veya temsil hatası ortalamanın dalgalanmalarını karakterize eder. Örneklem büyüklüğü ne kadar büyük olursa, ortalama değerlerin yayılımının o kadar küçük olduğuna dikkat edilmelidir. Ortalamanın standart hatası aşağıdaki formül kullanılarak hesaplanır:

Modern bilimsel literatürde aritmetik ortalama temsil hatasıyla birlikte yazılır:

veya standart sapmayla birlikte:

Örnek olarak ülkedeki (genel nüfus) 1.500 şehir kliniğine ilişkin verileri düşünün. Klinikte hizmet verilen ortalama hasta sayısı 18.150 kişidir. Sitelerin %10'unun (150 klinik) rastgele seçilmesi, ortalama 20.051 kişiye eşit hasta sayısını verir. Açıkça 1500 kliniğin tamamının örnekleme dahil edilmemesinden kaynaklanan örnekleme hatası, bu ortalamalar arasındaki farka, yani genel ortalamaya eşittir ( M gen) ve örnek ortalaması ( M seçildi). Popülasyonumuzdan aynı büyüklükte başka bir örneklem oluşturursak farklı bir hata değeri verecektir. Yeterince büyük numunelere sahip tüm bu numune araçları, yeterince büyük numunelerle genel ortalama etrafında normal şekilde dağıtılır. büyük sayı bir popülasyondan aynı sayıda nesnenin bir örneğinin tekrarları. Ortalamanın standart hatası M- bu, örnek ortalamaların genel ortalama etrafında kaçınılmaz yayılmasıdır.

Araştırma sonuçlarının göreceli miktarlarda (örneğin yüzdeler) sunulması durumunda - hesaplanır kesrin standart hatası:

burada P % cinsinden göstergedir, n ise gözlem sayısıdır.

Sonuç şu şekilde görüntülenir: (P±m)%. Örneğin, hastalarda iyileşme yüzdesi (95,2±2,5)% idi.

Popülasyonun eleman sayısının artması durumunda, daha sonra kesirin paydasındaki ortalamanın ve kesrin standart hatalarını hesaplarken, yerinekonulmalı.

Normal bir dağılım için (örnek ortalamalarının dağılımı normaldir), popülasyonun hangi kısmının ortalamanın etrafındaki herhangi bir aralığa düştüğünü biliyoruz. Özellikle:

Pratikte sorun, genel popülasyonun özelliklerinin bizim tarafımızdan bilinmemesi ve numunenin tam olarak bunları tahmin etmek amacıyla yapılmasıdır. Bu şu anlama gelir; eğer aynı boyutta numuneler yaparsak N genel popülasyondan, vakaların %68,3'ünde aralık değeri içerecektir M(vakaların %95,5'inde aralıkta ve vakaların %99,7'sinde aralıkta olacaktır).

Aslında yalnızca bir örnek alındığı için bu ifade olasılık açısından formüle edilmiştir: %68,3 olasılıkla, popülasyondaki özelliğin ortalama değeri %95,5 olasılıkla aralıkta yer almaktadır. - aralıkta vb.

Uygulamada, örnek değer etrafında belirli (yeterince yüksek) bir olasılıkla bir aralık oluşturulur. güven olasılığı – bu parametrenin genel popülasyondaki gerçek değerini “kapsar”. Bu aralığa denir güven aralığı.

Güven olasılığıP bu, güven aralığının aslında popülasyondaki parametrenin gerçek (bilinmeyen) değerini içereceğine dair güven derecesidir.

Örneğin güven olasılığı R%90'dır; bu, 100 örnekten 90'ının popülasyondaki parametrenin doğru tahminini vereceği anlamına gelir. Buna göre hata olasılığı, yani. Örneklem için genel ortalamanın yanlış tahmini yüzde olarak eşittir: . İçin bu örnek bu, 100 örnekten 10'unun yanlış tahmin vereceği anlamına gelir.

Açıkçası, güven derecesi (güven olasılığı) aralığın büyüklüğüne bağlıdır: aralık ne kadar geniş olursa, popülasyon için bilinmeyen bir değerin bu aralıkta yer alacağına dair güven o kadar yüksek olur. Uygulamada, en az %95,5 güven sağlayacak bir güven aralığı oluşturmak için örnekleme hatasının en az iki katı kullanılır.

Ortalamaların ve göreceli değerlerin güven sınırlarını belirlemek, iki uç değerini bulmamızı sağlar - çalışılan göstergenin tüm popülasyonda oluşabileceği mümkün olan minimum ve mümkün olan maksimum. Buna dayanarak, güven sınırları (veya güven aralığı)- bunlar, rastgele dalgalanmalar nedeniyle önemsiz bir olasılığın bulunduğu ortalama veya göreceli değerlerin sınırlarıdır.

Güven aralığı şu şekilde yeniden yazılabilir: T– güven kriteri.

Popülasyondaki aritmetik ortalamanın güven sınırları aşağıdaki formülle belirlenir:

M gen = M seçme + tm M

göreceli değer için:

R gen = P seçme + tm R

Nerede M gen Ve R gen- genel nüfus için ortalama ve göreceli değerlerin değerleri; M seçme Ve R seçme- örnek popülasyondan elde edilen ortalama ve göreceli değerlerin değerleri; M M Ve M P- ortalama ve göreceli değerlerdeki hatalar; T- güven kriteri (çalışmayı planlarken oluşturulan ve 2 veya 3'e eşit olabilen doğruluk kriteri); tm- bu bir güven aralığıdır veya Δ - örnek bir çalışmada elde edilen göstergenin maksimum hatasıdır.

Kriterin değerinin dikkate alınması gerekir. T% olarak ifade edilen, hatasız bir tahminin olasılığı (p) ile belirli bir dereceye kadar ilgilidir. Sonucu gerekli doğruluk derecesiyle elde etme ihtiyacının rehberliğinde araştırmacının kendisi tarafından seçilir. Böylece %95,5'lik hatasız tahmin olasılığı için kriterin değeri T 2, %99,7 - 3'tür.

Verilen güven aralığı tahminleri yalnızca 30'dan fazla gözlem içeren istatistiksel popülasyonlar için kabul edilebilir. Daha küçük popülasyon boyutunda (küçük örnekler), t kriterini belirlemek için özel tablolar kullanılır. Bu tablolarda istenilen değer popülasyon büyüklüğüne karşılık gelen çizginin kesişim noktasında yer almaktadır. (n-1) ve araştırmacı tarafından seçilen hatasız bir tahminin (%95,5; %99,7) olasılık düzeyine karşılık gelen bir sütun. Tıbbi araştırmalarda herhangi bir gösterge için güven sınırları belirlenirken hatasız tahmin olasılığı %95,5 veya daha fazladır. Bu, örnek popülasyondan elde edilen göstergenin değerinin vakaların en az %95,5'inde genel popülasyonda bulunması gerektiği anlamına gelir.

    Dersin konusuyla ilgili sorular:

    İstatistiksel bir popülasyondaki özellik çeşitliliği göstergelerinin önemi.

    Mutlak değişim göstergelerinin genel özellikleri.

    Standart sapma, hesaplama, uygulama.

    Göreli varyasyon ölçüleri.

    Medyan, çeyrek puanı.

    Çalışma sonuçlarının istatistiksel anlamlılığının değerlendirilmesi.

    Aritmetik ortalamanın standart hatası, hesaplama formülü, kullanım örneği.

    Oranın hesaplanması ve standart hatası.

    Güven olasılığı kavramı, bir kullanım örneği.

10. Güven aralığı kavramı ve uygulaması.

    Konuyla ilgili görevleri standart yanıtlarla test edin:

1. MUTLAK DEĞİŞİKLİK GÖSTERGELERİ BAKINIZ

1) varyasyon katsayısı

2) salınım katsayısı

4) medyan

2. İLGİLİ DEĞİŞİKLİK GÖSTERGELERİ

1) dağılım

4) varyasyon katsayısı

3. BİR VARYASYON SERİSİNDEKİ BİR OPSİYONUN AŞIRI DEĞERLERİNE GÖRE BELİRLENEN KRİTER

2) genlik

3) dağılım

4) varyasyon katsayısı

4. EXTREME SEÇENEKLERİN FARKI

2) genlik

3) standart sapma

4) varyasyon katsayısı

5. BİR KARAKTERİSTİĞİN BİREYSEL DEĞERLERİNİN ORTALAMA DEĞERLERİNDEN SAPMALARININ ORTALAMA KAREİ

1) salınım katsayısı

2) medyan

3) dağılım

6. DEĞİŞİKLİK ÖLÇEĞİNİN BİR KARAKTERİN ORTALAMA DEĞERİNE ORANI

1) varyasyon katsayısı

2) standart sapma

4) salınım katsayısı

7. ORTALAMA KARE SAPMANIN BİR KARAKTERİSTİĞİN ORTALAMA DEĞERİNE ORANI

1) dağılım

2) varyasyon katsayısı

3) salınım katsayısı

4) genlik

8. VARYASYON SERİSİNİN ORTASINDA YER ALAN VE İKİ EŞİT PARCAYA BÖLEN SEÇENEK

1) medyan

3) genlik

9. TIBBİ ARAŞTIRMALARDA HERHANGİ BİR GÖSTERGE İÇİN GÜVEN SINIRLARI OLUŞTURULURKEN HATASIZ TAHMİN OLASILIĞI KABUL EDİLİR

10. 100 ÖRNEKTEN 90'I Popülasyondaki Bir Parametrenin Doğru Tahminini Veriyorsa Bu, GÜVEN OLASILIĞININ DEĞERLENDİRİLDİĞİ ANLAMINA GELİR P EŞİT

11. 100 ÖRNEKTEN 10'U YANLIŞ TAHMİN VERİRSE HATA OLASILIĞI EŞİTTİR

12. ORTALAMA VEYA BAĞIL DEĞERLERİN SINIRLARI, RASTGELE SALINIMLAR NEDENİYLE DIŞINA ÇIKMA OLASILIĞI KÜÇÜK OLUR – BU

1) güven aralığı

2) genlik

4) varyasyon katsayısı

13. İÇİNDEKİ NÜFUSUN KÜÇÜK BİR ÖRNEKLEMİ DEĞERLENDİRİLİYOR

1) n, 100'den küçük veya ona eşittir

2) n 30'dan küçük veya eşittir

3) n, 40'tan küçük veya ona eşittir

4) n 0'a yakındır

14. HATASIZ BİR TAHMİN OLASILIĞI İÇİN %95 KRİTER DEĞERİ T IS

15. HATASIZ BİR TAHMİN OLASILIĞI İÇİN %99 KRİTER DEĞERİ T IS

16. NORMAL DAĞILIMLARDA, DEĞİŞİM KATSAYISININ AŞILMAMASI DURUMUNDA NÜFUS HOMOJEN KABUL EDİLİR

17. SAYISAL DEĞERLERİ VERİLEN BİR SERİDE MÜMKÜN OLAN MAKSİMUMUN %25'İNİ AŞMAYAN SEÇENEK, AYIRMA SEÇENEKLERİ – BU

2) alt çeyrek

3) üst çeyrek

4) çeyrek

18. BOZULMAYAN VE OBJEKTİF GERÇEKLİĞİ DOĞRU YANSITAN VERİLERE ADI VERİLİR

1) imkansız

2) eşit derecede mümkün

3) güvenilir

4) rastgele

19. "ÜÇ Sigma" KURALINA GÖRE, İÇERİSİNDE BİR KARAKTERİSTİĞİN NORMAL DAĞILIMI İLE
YER ALACAK

1) %68,3 opsiyonu

Standart sapma, tanımlayıcı istatistiklerden değişkenliğin klasik bir göstergesidir.

Standart Sapma, standart sapma, Standart sapma, örneklem standart sapması (İng. standart sapma, STD, STDev), tanımlayıcı istatistiklerde dağılımın çok yaygın bir göstergesidir. Ama çünkü teknik analiz istatistiklere benzer; bu gösterge, analiz edilen enstrümanın fiyatının zaman içindeki dağılım derecesini tespit etmek için teknik analizde kullanılabilir (ve kullanılmalıdır). Yunan sembolü Sigma "σ" ile gösterilir.

Standart sapmayı kullanmamıza izin verdikleri için Carl Gauss ve Pearson'a teşekkür ederiz.

Kullanma teknik analizde standart sapma, bunu çeviriyoruz "dağılım indeksi"" V "volatilite göstergesi“Anlamı koruyor ama terimleri değiştiriyor.

Standart sapma nedir

Ancak ara yardımcı hesaplamaların yanı sıra, bağımsız hesaplama için standart sapma oldukça kabul edilebilir ve teknik analizdeki uygulamalar. Dergimizin aktif bir okuyucusunun belirttiği gibi dulavratotu, “ Yurt içi işlem merkezlerinin standart göstergelerine standart sapmanın neden dahil edilmediğini hala anlamıyorum«.

Gerçekten mi, standart sapma, bir enstrümanın değişkenliğini klasik ve "saf" bir şekilde ölçebilir. Ancak ne yazık ki bu gösterge menkul kıymet analizlerinde çok yaygın değildir.

Standart sapmanın uygulanması

Standart sapmanın manuel olarak hesaplanması çok ilginç değil, ancak deneyim için faydalıdır. Standart sapma ifade edilebilir formül STD=√[(∑(x-x ) 2)/n] , bu, numunenin elemanları ile ortalama arasındaki farkların karelerinin toplamının numunedeki eleman sayısına bölünmesiyle elde edilen kök gibi görünür.

Örnekteki element sayısı 30'u geçerse kök altındaki kesrin paydası n-1 değerini alır. Aksi halde n kullanılır.

Adım adım standart sapma hesaplaması:

  1. veri örneğinin aritmetik ortalamasını hesaplayın
  2. bu ortalamayı her örnek öğeden çıkarın
  3. ortaya çıkan tüm farklılıkların karesini alıyoruz
  4. ortaya çıkan tüm kareleri topla
  5. elde edilen miktarı numunedeki elementlerin sayısına bölün (veya n>30 ise n-1'e bölün)
  6. elde edilen bölümün karekökünü hesaplayın (buna denir) dağılım)

Bir özelliğin toplamdaki varyasyonunun boyutunun genelleştirici bir özelliği olarak tanımlanır. Özelliğin bireysel değerlerinin aritmetik ortalamadan ortalama kare sapmasının kareköküne eşittir, yani. ve'nin kökü şu şekilde bulunabilir:

1. Birincil satır için:

2. Varyasyon serisi için:

Standart sapma formülünü dönüştürmek onu pratik hesaplamalar için daha uygun bir forma getirir:

Standart sapma belirli seçeneklerin ortalama değerlerinden ne kadar saptığını belirler ve aynı zamanda bir özelliğin değişkenliğinin mutlak bir ölçüsüdür ve seçeneklerle aynı birimlerle ifade edilir ve bu nedenle iyi yorumlanır.

Standart sapmayı bulma örnekleri: ,

Alternatif özellikler için ortalama formül kare sapmaşuna benziyor:

burada p, popülasyondaki belirli bir özelliğe sahip birimlerin oranıdır;

q, bu özelliğe sahip olmayan birimlerin oranıdır.

Ortalama doğrusal sapma kavramı

Ortalama doğrusal sapma bireysel seçeneklerin sapmalarının mutlak değerlerinin aritmetik ortalaması olarak tanımlanır.

1. Birincil satır için:

2. Varyasyon serisi için:

toplam n nerede varyasyon serilerinin frekanslarının toplamı.

Ortalama doğrusal sapmayı bulma örneği:

Değişim aralığı üzerindeki dağılım ölçüsü olarak ortalama mutlak sapmanın avantajı açıktır, çünkü bu ölçü tüm olası sapmaların dikkate alınmasına dayanmaktadır. Ancak bu göstergenin önemli dezavantajları vardır. Cebirsel sapma işaretlerinin keyfi olarak reddedilmesi, bu göstergenin matematiksel özelliklerinin temel olmaktan uzak olmasına yol açabilir. Bu, olasılıksal hesaplamalar içeren problemleri çözerken ortalama mutlak sapmanın kullanılmasını çok zorlaştırır.

Bu nedenle, bir özelliğin değişiminin bir ölçüsü olarak ortalama doğrusal sapma istatistiksel uygulamada nadiren kullanılır; yani göstergeleri dikkate almadan ekonomik açıdan anlamlı olan göstergeleri özetlemek için kullanılır. Onun yardımıyla örneğin ciro analiz edilir dış ticaret, işçilerin bileşimi, üretim ritmi vb.

Ortalama kare

Uygulanan ortalama kareörneğin n kare kesitin kenarlarının ortalama boyutunu hesaplamak için, gövdelerin, boruların vb. ortalama çaplarını hesaplamak için iki türe ayrılır.

Basit ortalama kare. Bir özelliğin bireysel değerlerini değiştirirken ortalama değer Orijinal değerlerin karelerinin toplamının sabit tutulması gerekiyorsa, ortalama ikinci dereceden bir ortalama değer olacaktır.

Bireysel nitelik değerlerinin karelerinin toplamını sayılarına bölme bölümünün kareköküdür:

Ağırlıklı ortalama kare şu formül kullanılarak hesaplanır:

burada f ağırlık işaretidir.

Ortalama kübik

Ortalama kübik geçerlidirörneğin bir kenarın ve küplerin ortalama uzunluğunu belirlerken. İki türe ayrılmıştır.
Ortalama kübik basit:

Aralık dağılım serisinde ortalama değerler ve dağılım hesaplanırken, niteliğin gerçek değerleri, aralıkların ortalamadan farklı olan merkezi değerleri ile değiştirilir. aritmetik değerler aralığa dahildir. Bu, varyansın hesaplanmasında sistematik bir hataya yol açar. V.F. Sheppard bunu belirledi varyans hesaplamasında hata Gruplandırılmış verilerin kullanılmasından kaynaklanan , dağılımın büyüklüğünün hem artan yönünde hem de azalması yönünde aralığın değerinin karesinin 1/12'sidir.

Sheppard Değişikliği Dağılım normale yakınsa, sürekli değişkenlik gösteren bir karakteristikle ilgiliyse ve önemli miktarda başlangıç ​​verisine (n > 500) dayanıyorsa kullanılmalıdır. Bununla birlikte, bazı durumlarda, farklı yönlerde hareket eden her iki hatanın da birbirini telafi ettiği gerçeğine dayanarak, bazen düzeltme yapmayı reddetmek mümkündür.

Varyans ve standart sapma ne kadar küçükse, popülasyon o kadar homojen ve ortalama da o kadar tipik olacaktır.
İstatistik uygulamalarında sıklıkla çeşitli özelliklerin varyasyonlarını karşılaştırmaya ihtiyaç vardır. Örneğin, işçilerin yaşları ve nitelikleri, hizmet süreleri ve büyüklükleri arasındaki farklılıkları karşılaştırmak büyük ilgi görmektedir. ücretler, maliyet ve kâr, hizmet süresi ve işgücü verimliliği vb. Bu tür karşılaştırmalar için, özelliklerin mutlak değişkenliğine ilişkin göstergeler uygun değildir: Yıllar olarak ifade edilen iş deneyimi değişkenliğini, ruble cinsinden ifade edilen ücretlerdeki değişiklikle karşılaştırmak imkansızdır.

Bu tür karşılaştırmaların yanı sıra, farklı aritmetik ortalamalara sahip çeşitli popülasyonlarda aynı özelliğin değişkenliğinin karşılaştırılması için göreceli bir varyasyon göstergesi - varyasyon katsayısı - kullanılır.

Yapısal ortalamalar

İstatistiksel dağılımlardaki merkezi eğilimi karakterize etmek için, aritmetik ortalamayla birlikte, dağıtım serisindeki konumunun belirli özellikleri nedeniyle seviyesini karakterize edebilen X karakteristiğinin belirli bir değerini kullanmak genellikle rasyoneldir.

Bu, özellikle bir dağılım serisinde bir özelliğin uç değerlerinin belirsiz sınırlara sahip olduğu durumlarda önemlidir. Bundan dolayı kesin tanım Aritmetik ortalama genellikle imkansızdır veya çok zordur. Bu gibi durumlarda örneğin frekans serisinin ortasında yer alan veya mevcut seride en sık ortaya çıkan özelliğin değeri alınarak ortalama seviye belirlenebilir.

Bu değerler yalnızca frekansların doğasına, yani dağılımın yapısına bağlıdır. Bir dizi frekansta konum olarak tipiktirler, bu nedenle bu tür değerler dağılımın merkezinin özellikleri olarak kabul edilir ve bu nedenle yapısal ortalamaların tanımını alır. Çalışmak için kullanılıyorlar iç yapı ve nitelik değerlerinin dağılım serisinin yapısı. Bu tür göstergeler şunları içerir:



 


Okumak:



Bütçe ile yerleşimlerin muhasebeleştirilmesi

Bütçe ile yerleşimlerin muhasebeleştirilmesi

Muhasebedeki Hesap 68, hem işletme masraflarına düşülen bütçeye yapılan zorunlu ödemeler hakkında bilgi toplamaya hizmet eder hem de...

Bir tavada süzme peynirden cheesecake - kabarık cheesecake için klasik tarifler 500 g süzme peynirden Cheesecake

Bir tavada süzme peynirden cheesecake - kabarık cheesecake için klasik tarifler 500 g süzme peynirden Cheesecake

Malzemeler: (4 porsiyon) 500 gr. süzme peynir 1/2 su bardağı un 1 yumurta 3 yemek kaşığı. l. şeker 50 gr. kuru üzüm (isteğe bağlı) bir tutam tuz kabartma tozu...

Kuru erikli siyah inci salatası Kuru erikli siyah inci salatası

Salata

Günlük diyetlerinde çeşitlilik için çabalayan herkese iyi günler. Monoton yemeklerden sıkıldıysanız ve sizi memnun etmek istiyorsanız...

Domates salçası tarifleri ile Lecho

Domates salçası tarifleri ile Lecho

Kışa hazırlanan Bulgar leçosu gibi domates salçalı çok lezzetli leço. Ailemizde 1 torba biberi bu şekilde işliyoruz (ve yiyoruz!). Ve ben kimi...

besleme resmi RSS