Dom - Zidovi
Kako pronaći željenu vrijednost standardnom devijacijom. formula standardne devijacije u excelu

Prema istraživanju uzorka, štediše su grupirane prema veličini depozita u Sberbank grada:

Definirati:

1) raspon varijacije;

2) prosječni iznos depozita;

3) prosječno linearno odstupanje;

4) disperzija;

5) standardna devijacija;

6) koeficijent varijacije doprinosa.

Riješenje:

Ovaj niz distribucije sadrži otvorene intervale. U takvim nizovima vrijednost intervala prve skupine konvencionalno se pretpostavlja jednakom vrijednosti intervala sljedeće, a vrijednost intervala posljednje skupine jednaka je vrijednosti intervala prethodne skupine. jedan.

Vrijednost intervala druge grupe je 200, dakle, vrijednost prve grupe je također 200. Vrijednost intervala pretposljednje grupe je 200, što znači da će i posljednji interval imati vrijednost jednaku 200.

1) Definirajte raspon varijacije kao razliku između najveće i najmanje vrijednosti značajke:

Raspon varijacije u veličini doprinosa je 1000 rubalja.

2) Prosječna veličina doprinosa određena je formulom aritmetičke ponderirane sredine.

Odredimo preliminarno diskretnu vrijednost atributa u svakom intervalu. Da bismo to učinili, koristeći jednostavnu formulu aritmetičke sredine, nalazimo sredine intervala.

Prosječna vrijednost prvog intervala bit će jednaka:

drugi - 500, itd.

Stavimo rezultate izračuna u tablicu:

Iznos depozita, rub.Broj suradnika, fSredina intervala, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Ukupno 400 - 312000

Prosječni depozit u gradskoj Sberbanci bit će 780 rubalja:

3) Prosječno linearno odstupanje je aritmetički prosjek apsolutnih odstupanja pojedinačnih vrijednosti atributa od ukupnog prosjeka:

Postupak za izračunavanje prosječnog linearnog odstupanja u seriji intervalne distribucije je sljedeći:

1. Izračunava se aritmetički ponderirani prosjek, kao što je prikazano u stavku 2).

2. Određena su apsolutna odstupanja varijante od srednje vrijednosti:

3. Dobivena odstupanja se množe s frekvencijama:

4. Zbroj ponderiranih odstupanja nalazi se bez uzimanja u obzir predznaka:

5. Zbroj ponderiranih odstupanja dijeli se sa zbrojem frekvencija:

Prikladno je koristiti tablicu izračunatih podataka:

Iznos depozita, rub.Broj suradnika, fSredina intervala, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Ukupno 400 - - - 81280

Prosječna linearna devijacija veličine depozita klijenata Sberbanke iznosi 203,2 rublja.

4) Disperzija je aritmetička sredina kvadrata odstupanja vrijednosti svake značajke od aritmetičke sredine.

Izračun varijance u seriji intervalne distribucije provodi se prema formuli:

Postupak za izračunavanje varijance u ovom slučaju je sljedeći:

1. Odredite aritmetički ponderirani prosjek, kao što je prikazano u paragrafu 2).

2. Pronađite odstupanja od srednje vrijednosti:

3. Kvadriranje odstupanja svake opcije od srednje vrijednosti:

4. Pomnožite kvadrate odstupanja s težinama (frekvencijama):

5. Rezimirajte pristigle radove:

6. Dobiveni iznos se dijeli sa zbrojem težina (učestalosti):

Stavimo izračune u tablicu:

Iznos depozita, rub.Broj suradnika, fSredina intervala, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Ukupno 400 - - - 23040000

Program Excel visoko cijene i profesionalci i amateri, jer s njim može raditi korisnik bilo koje razine obuke. Na primjer, svatko s minimalnim vještinama "komunikacije" s Excelom može nacrtati jednostavan grafikon, napraviti pristojan znak itd.

U isto vrijeme, ovaj program vam čak omogućuje izvođenje raznih vrsta izračuna, na primjer, izračun, ali to već zahtijeva nešto drugačiju razinu obuke. Međutim, ako ste tek započeli blisko upoznavanje s ovim programom i zanima vas sve što će vam pomoći da postanete napredniji korisnik, ovaj je članak za vas. Danas ću vam reći koji je prosjek standardna devijacija formula u excelu, zašto je uopće potrebna i, zapravo, kada se koristi. Ići!

Što je

Počnimo s teorijom. Standardna devijacija se zove Korijen, dobivenih iz aritmetičke sredine svih kvadrata razlika između dostupnih vrijednosti, kao i njihove aritmetičke sredine. Usput, ova se vrijednost obično naziva grčko slovo "sigma". Standardna devijacija izračunava se pomoću formule STDEV, odnosno program to radi za samog korisnika.

Bit ovog koncepta je identificirati stupanj varijabilnosti instrumenta, odnosno on je na svoj način pokazatelj iz deskriptivne statistike. Otkriva promjene u volatilnosti instrumenta u bilo kojem vremenskom razdoblju. Koristeći STDEV formule, možete procijeniti standardnu ​​devijaciju u uzorku, dok je logično i tekstualne vrijednosti ignoriraju se.

Formula

Pomaže izračunati standardnu ​​devijaciju u excel formula, koji se automatski daje u Excelu. Da biste ga pronašli, morate pronaći odjeljak formule u Excelu i već tamo odabrati onu koja ima naziv STDEV, tako da je vrlo jednostavno.

Nakon toga će se pred vama pojaviti prozor u koji ćete morati unijeti podatke za izračun. Posebno treba unijeti dva broja u posebna polja, nakon čega će program automatski izračunati standardnu ​​devijaciju za uzorak.

Bez sumnje, matematičke formule i izračuni prilično su komplicirano pitanje i ne mogu se svi korisnici nositi s njim odmah. Međutim, ako kopate malo dublje i malo detaljnije shvatite problem, ispada da nije sve tako tužno. Nadam se da ste se u to uvjerili na primjeru izračuna standardne devijacije.

Video za pomoć

X i - slučajne (trenutne) vrijednosti;

X prosječna vrijednost slučajnih varijabli u uzorku izračunava se po formuli:

Tako, varijanca je srednji kvadrat odstupanja . Odnosno, prosječna vrijednost se prvo izračunava, a zatim uzima razlika između svake izvorne i srednje vrijednosti, na kvadrat , dodaje se i zatim dijeli s brojem vrijednosti u danoj populaciji.

Razlika između pojedinačne vrijednosti i srednje vrijednosti odražava mjeru odstupanja. Kvadtira se tako da sva odstupanja postaju isključivo pozitivni brojevi te izbjegavati međusobno poništavanje pozitivnih i negativnih odstupanja pri njihovom zbrajanju. Zatim, s obzirom na kvadrat odstupanja, jednostavno izračunamo aritmetičku sredinu.

trag čarobna riječ"disperzija" su samo ove tri riječi: prosjek - kvadrat - odstupanja.

Standardna devijacija (RMS)

Uzimajući kvadratni korijen disperzije, dobivamo tzv. standardna devijacija". Ima imena "standardna devijacija" ili "sigma" (od naziva grčkog slova σ .). Formula za standardnu ​​devijaciju je:

Tako, varijanca je sigma kvadrat ili - standardna devijacija na kvadrat.

Standardna devijacija, očito, također karakterizira mjeru disperzije podataka, ali se sada (za razliku od disperzije) može usporediti s izvornim podacima, budući da imaju iste mjerne jedinice (to je jasno iz formule za izračun). Raspon varijacije je razlika između ekstremnih vrijednosti. Standardna devijacija, kao mjera nesigurnosti, također je uključena u mnoge statističke izračune. Postavlja stupanj točnosti razne procjene i prognoze. Ako je varijacija vrlo velika, tada će i standardna devijacija biti velika, stoga će prognoza biti netočna, što će se izraziti, primjerice, u vrlo širokim intervalima pouzdanosti.

Stoga se u metodama statističke obrade podataka u procjenama nekretnina, ovisno o zahtijevanoj točnosti zadatka, koristi pravilo dvije ili tri sigme.

Za usporedbu pravila dvije sigme i pravila tri sigme koristimo Laplaceovu formulu:

F - F,

gdje je F(x) Laplaceova funkcija;



Minimalna vrijednost

β = maksimalna vrijednost

s = sigma vrijednost (standardna devijacija)

a = srednja vrijednost

U ovom slučaju se koristi privatni pogled Laplaceove formule kada su granice α i β vrijednosti nasumična varijabla X je jednako udaljen od distribucijskog centra a = M(X) za neku vrijednost d: a = a-d, b = a+d. Ili (1) Formula (1) određuje vjerojatnost zadanog odstupanja d slučajne varijable X s normalnim zakonom distribucije od njenog matematičkog očekivanja M(X) = a. Ako u formuli (1) uzastopno uzmemo d = 2s i d = 3s, tada dobivamo: (2), (3).

Pravilo dvije sigme

Gotovo pouzdano (s vjerojatnošću pouzdanosti od 0,954) može se tvrditi da sve vrijednosti slučajne varijable X s normalnim zakonom distribucije odstupaju od njenog matematičkog očekivanja M(X) = a za iznos koji nije veći od 2s (dva standardna odstupanja). Vjerojatnost povjerenja (Pd) je vjerojatnost događaja koji se uvjetno prihvaćaju kao pouzdani (vjerojatnost im je blizu 1).

Ilustrirajmo pravilo dvije sigme geometrijski. Na sl. Slika 6 prikazuje Gaussovu krivulju s distribucijskim centrom a. Površina omeđena cijelom krivuljom i osi Ox je 1 (100%), a površina krivuljastog trapeza između apscisa a–2s i a+2s, prema pravilu dvije sigme, iznosi 0,954 (95,4% ukupne površine). Površina osjenčanih područja jednaka je 1-0,954 = 0,046 (>5% ukupne površine). Ti se dijelovi nazivaju kritičnim rasponom slučajne varijable. Vrijednosti slučajne varijable koje spadaju u kritično područje malo su vjerojatne iu praksi se uvjetno uzimaju kao nemoguće.

Vjerojatnost Uvjetno nemoguće vrijednosti naziva se razina značajnosti slučajne varijable. Razina značajnosti povezana je s razinom pouzdanosti formulom:

gdje je q razina značajnosti, izražena kao postotak.

Pravilo tri sigme

Kod rješavanja problema koji zahtijevaju veću pouzdanost, kada se vjerojatnost povjerenja (Pd) uzme jednaka 0,997 (točnije 0,9973), umjesto pravila dvije sigme, prema formuli (3), koristi se pravilo tri sigme.



Prema pravilo tri sigme s razinom pouzdanosti od 0,9973, kritično područje bit će područje vrijednosti atributa izvan intervala (a-3s, a+3s). Razina značajnosti je 0,27%.

Drugim riječima, vjerojatnost da apsolutna vrijednost odstupanja će premašiti tri puta standardnu ​​devijaciju, vrlo je mala, naime jednaka 0,0027=1-0,9973. To znači da se to može dogoditi samo u 0,27% slučajeva. Takvi se događaji, temeljeni na načelu nemogućnosti malo vjerojatnih događaja, mogu smatrati praktički nemogućima. Oni. visoko precizno uzorkovanje.

Ovo je bit pravila tri sigme:

Ako je slučajna varijabla normalno raspodijeljena, tada apsolutna vrijednost njezina odstupanja od matematičkog očekivanja ne prelazi trostruku standardnu ​​devijaciju (RMS).

U praksi se pravilo tri sigme primjenjuje na sljedeći način: ako je distribucija slučajne varijable koja se proučava nepoznata, ali je ispunjen uvjet naveden u gornjem pravilu, tada postoji razlog za pretpostavku da je proučavana varijabla normalno raspodijeljena; inače se ne distribuira normalno.

Razina značajnosti uzima se ovisno o dopuštenom stupnju rizika i zadatku. Za procjene nekretnina obično se uzima manje točan uzorak, slijedeći pravilo dvije sigme.

Disperzija. Standardna devijacija

Disperzija je aritmetička sredina kvadrata odstupanja svake vrijednosti značajke od ukupne sredine. Ovisno o izvornim podacima, varijanca može biti neponderirana (jednostavna) ili ponderirana.

Disperzija se izračunava pomoću sljedećih formula:

za negrupirane podatke

za grupirane podatke

Postupak za izračunavanje ponderirane varijance:

1. odrediti aritmetički ponderirani prosjek

2. Određena su odstupanja varijanti od srednje vrijednosti

3. kvadrirajte odstupanje svake opcije od srednje vrijednosti

4. pomnožiti kvadrate odstupanja s težinama (frekvencijama)

5. sažeti pristigle radove

6. dobiveni iznos se podijeli sa zbrojem utega

Formula za određivanje varijance može se pretvoriti u sljedeću formulu:

- jednostavno

Postupak za izračunavanje varijance je jednostavan:

1. odrediti aritmetičku sredinu

2. kvadrirati aritmetičku sredinu

3. kvadrat svaki red opcija

4. pronađite opciju zbroja kvadrata

5. zbroj kvadrata opcije podijeliti njihovim brojem, tj. odrediti srednji kvadrat

6. odrediti razliku između srednjeg kvadrata obilježja i kvadrata srednje vrijednosti

Također se formula za određivanje ponderirane varijance može pretvoriti u sljedeću formulu:

oni. varijanca je jednaka razlici između sredine kvadrata vrijednosti obilježja i kvadrata aritmetičke sredine. Pri korištenju transformirane formule isključen je dodatni postupak za izračunavanje odstupanja pojedinačnih vrijednosti značajke od x i isključena je pogreška u izračunu povezana s odstupanjima zaokruživanja

Disperzija ima niz svojstava, od kojih neka olakšavaju izračun:

1) disperzija konstantne vrijednosti je nula;

2) ako su sve varijante vrijednosti atributa smanjene za isti broj, tada se varijanca neće smanjiti;

3) ako su sve varijante vrijednosti atributa smanjene za isti broj puta (puta), tada će se varijanca smanjiti za faktor

Standardna devijacija S- je kvadratni korijen varijance:

Za negrupirane podatke:

;

Za seriju varijacija:

Raspon varijacije, srednja linearna i srednja kvadratna devijacija su imenovane veličine. Imaju iste jedinice kao pojedinačne vrijednosti znak.

Disperzija i standardna devijacija najčešće su korištene mjere varijacije. To se objašnjava činjenicom da su uključeni u većinu teorema teorije vjerojatnosti, koja služi kao temelj matematičke statistike. Osim toga, varijanca se može rastaviti na svoje sastavne elemente, što omogućuje procjenu učinka razni faktori koji određuju varijaciju svojstva.

Izračun pokazatelja varijacije za banke grupirane prema dobiti prikazan je u tablici.

Dobit, milijun rubalja Broj banaka izračunati pokazatelji
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Ukupno: 121,70 17,640 23,126

Srednja linearna i srednja kvadratna devijacija pokazuju koliko vrijednost atributa u prosjeku fluktuira za jedinice i populaciju koja se proučava. Da, unutra ovaj slučaj Prosječna vrijednost fluktuacije u iznosu dobiti je: prema prosječnom linearnom odstupanju od 0,882 milijuna rubalja; prema standardnoj devijaciji - 1,075 milijuna rubalja. Standardna devijacija uvijek je veća od prosječne linearne devijacije. Ako je raspodjela svojstva bliska normalnoj, tada između S i d postoji odnos: S=1,25d, odnosno d=0,8S. Standardna devijacija pokazuje kako se većina jedinica populacije nalazi u odnosu na aritmetičku sredinu. Bez obzira na oblik distribucije, 75 vrijednosti atributa spada unutar x 2S intervala, a najmanje 89 svih vrijednosti spada u x 3S interval (teorem P.L. Chebysheva).

Kvadratni korijen varijance naziva se standardna devijacija od srednje vrijednosti, koja se izračunava na sljedeći način:

elementarni algebarska transformacija formule za standardnu ​​devijaciju dovodi do sljedećeg oblika:

Ova formula je često prikladnija u praksi izračuna.

Standardna devijacija, kao i prosječna linearna devijacija, pokazuje koliko pojedine vrijednosti atributa u prosjeku odstupaju od svoje prosječne vrijednosti. Standardna devijacija uvijek je veća od prosječne linearne devijacije. Između njih postoji odnos:

Poznavajući ovaj omjer, moguće je odrediti nepoznanicu iz poznatih pokazatelja, na primjer, ali (ja izračunati i obrnuto. Standardna devijacija mjeri apsolutnu veličinu fluktuacije atributa i izražava se u istim jedinicama kao i vrijednosti atributa (rubalje, tone, godine itd.). To je apsolutna mjera varijacije.

Za alternativne karakteristike, npr. prisutnost ili odsutnost više obrazovanje, formule osiguranja, varijance i standardne devijacije su:

Prikazat ćemo izračun standardne devijacije prema podacima diskretne serije koja karakterizira distribuciju studenata jednog od fakulteta sveučilišta prema dobi (tablica 6.2).

Tablica 6.2.

Rezultati pomoćnih proračuna dani su u stupcima 2-5 tablice. 6.2.

Prosječna dob učenika, godina, određena je formulom ponderirane aritmetičke sredine (stupac 2):

Kvadrati odstupanja individualne dobi učenika od prosjeka nalaze se u stupcima 3-4, a umnošci kvadrata odstupanja s pripadajućim frekvencijama u stupcu 5.

Disperziju dobi učenika, godine, nalazimo formulom (6.2):

Tada je o \u003d l / 3,43 1,85 * oda, tj. svaka pojedinačna vrijednost dobi učenika odstupa od prosječne vrijednosti za 1,85 godina.

Koeficijent varijacije

Standardna devijacija u svojoj apsolutnoj vrijednosti ne ovisi samo o stupnju varijacije svojstva, već i o apsolutnim razinama varijanti i prosjeku. Stoga, za usporedbu prosjeka standardne devijacije varijacijski nizovi s različitim prosječnim razinama nisu izravno mogući. Da bismo mogli napraviti takvu usporedbu, moramo pronaći specifična gravitacija prosječno odstupanje (linearno ili kvadratno) u aritmetičkoj sredini, izraženo u postocima, tj. izračunati relativni pokazatelji varijacije.

Linearni koeficijent varijacije izračunati prema formuli

Koeficijent varijacije određuje se sljedećom formulom:

U koeficijentima varijacije eliminira se ne samo nekompatibilnost povezana s različitim mjernim jedinicama proučavanog svojstva, već i nekompatibilnost koja proizlazi iz razlika u vrijednosti aritmetičkih sredina. Osim toga, pokazatelji varijacije daju karakteristiku homogenosti populacije. Skup se smatra homogenim ako koeficijent varijacije ne prelazi 33%.

Prema tablici. 6.2 i rezultatima gore dobivenih izračuna, određujemo koeficijent varijacije,%, prema formuli (6.3):

Ako koeficijent varijacije prelazi 33%, to ukazuje na heterogenost ispitivane populacije. Dobivena vrijednost u našem slučaju ukazuje na to da je populacija učenika po dobi homogena po sastavu. Stoga je važna funkcija generalizirajućih pokazatelja varijacije procjena pouzdanosti prosjeka. Manje c1, a2 i V, što je rezultirajući skup pojava homogeniji i što je dobiveni prosjek pouzdaniji. Prema "pravilu tri sigme" koje razmatra matematička statistika, u normalno raspodijeljenim ili njima bliskim serijama, odstupanja od aritmetičke sredine, koja ne prelaze ± 3, pojavljuju se u 997 slučajeva od 1000. Dakle, znajući x i a, možete dobiti opću početnu ideju o seriji varijacija. Ako je npr. prosjek plaća zaposlenika u tvrtki iznosila 25 000 rubalja, a a je jednako 100 rubalja, tada se s vjerojatnošću bliskom pouzdanosti može tvrditi da plaće zaposlenika tvrtke fluktuiraju unutar (25 000 ± 3 x 100) tj. od 24.700 do 25.300 rubalja.



 


Čitati:



Sve knjige o: "uzbudljive priče ...

Sve knjige o:

Intimnost i malo fantazije dvije su važne komponente dobrog seksa. Posljednjih godina, prema Women's Weeklyju, 30 posto...

Zašto se temperatura diže na živce? Temperatura od živčane napetosti kod odraslih

Zašto se temperatura diže na živce? Temperatura od živčane napetosti kod odraslih

Psihogena groznica je stanje organizma kada se tjelesna temperatura povisi ne zbog bilo kakve virusne ili zarazne ...

Stvarne priče alkoholičara koji su prestali piti

Stvarne priče alkoholičara koji su prestali piti

Prvi put sam probao alkohol sa 13 godina. Mislim da je to bilo pivo. Moj razrednik i ja smo kupili dvije boce od džeparca i popili ih odmah na ...

Homogeno i stacionarno polje

Homogeno i stacionarno polje

Koncept "polja" u fizici je vrlo čest. S formalnog gledišta, definicija polja može se formulirati na sljedeći način: ako u svakom ...

feed slike RSS