Kodu - Saan ise remonti teha
Standardhälvet mõõdetakse. Häire: üldine, näidis, parandatud

Hüpoteeside statistilisel testimisel juhuslike suuruste vahelise lineaarse seose mõõtmisel.

Keskmine standardhälve:

Standardhälve(juhusliku suuruse põrand, meid ümbritsevad seinad ja lagi standardhälbe hinnang, x tema suhtes matemaatiline ootus põhineb selle dispersiooni erapooletul hinnangul):

kus on dispersioon; - põrand, meid ümbritsevad seinad ja lagi, i valiku element; - valimi suurus; - valimi aritmeetiline keskmine:

Tuleb märkida, et mõlemad hinnangud on kallutatud. IN üldine juhtum Erapooletut hinnangut on võimatu koostada. Siiski on erapooletu dispersioonihinnangul põhinev hinnang järjepidev.

Kolme sigma reegel

Kolme sigma reegel() - peaaegu kõik normaalse jaotusega juhusliku muutuja väärtused asuvad intervallis. Täpsemalt – mitte vähem kui 99,7% usaldusväärsusega asub normaalse jaotusega juhusliku suuruse väärtus määratud intervallis (eeldusel, et väärtus on tõene ja seda ei saadud valimi töötlemise tulemusena).

Kui tegelik väärtus on teadmata, siis peaksime kasutama mitte põrandat, meid ümbritsevaid seinu ja lage, s. Seega muudetakse kolme sigma reegel kolme sigma reegliks. Korrus, seinad meie ümber ja lagi, s .

Standardhälbe väärtuse tõlgendamine

Suur standardhälbe väärtus näitab väärtuste suurt levikut esitatud komplektis koos komplekti keskmise väärtusega; väike väärtus näitab vastavalt, et komplekti väärtused on rühmitatud keskmise väärtuse ümber.

Näiteks on meil kolm arvukomplekti: (0, 0, 14, 14), (0, 6, 8, 14) ja (6, 6, 8, 8). Kõigil kolmel komplektil on keskmised väärtused 7 ja standardhälbed vastavalt 7, 5 ja 1. Viimasel komplektil on väike standardhälve, kuna komplekti väärtused on rühmitatud keskmise väärtuse ümber; esimeses komplektis on kõige rohkem suur väärtus standardhälve - seatud väärtused erinevad suuresti keskmisest väärtusest.

Üldises mõttes võib standardhälvet pidada määramatuse mõõdupuuks. Näiteks füüsikas kasutatakse standardhälvet mingi suuruse järjestikuste mõõtmiste jada vea määramiseks. See väärtus on väga oluline uuritava nähtuse usutavuse määramiseks võrreldes teooria ennustatud väärtusega: kui mõõtmiste keskmine väärtus erineb suuresti teoorias ennustatud väärtustest (suur standardhälve), siis tuleks saadud väärtused või nende saamise meetod uuesti üle kontrollida.

Praktiline rakendus

Praktikas võimaldab standardhälve määrata, kui palju võivad komplekti väärtused keskmisest väärtusest erineda.

Kliima

Oletame, et on kaks linna, mille keskmine ööpäevane maksimaalne temperatuur on sama, kuid üks asub rannikul ja teine ​​sisemaal. On teada, et rannikul asuvates linnades on palju erinevaid maksimaalseid päevaseid temperatuure, mis on madalamad kui sisemaal asuvates linnades. Seetõttu on rannikulinna maksimaalsete ööpäevaste temperatuuride standardhälve väiksem kui teise linna puhul, hoolimata asjaolust, et nende keskmine väärtus on sama, mis praktikas tähendab, et tõenäosus, et iga linna maksimaalne õhutemperatuur konkreetne päev aastas erineb keskmisest väärtusest tugevamini, kontinendi sees asuva linna puhul suurem.

Sport

Oletame, et on mitu jalgpallimeeskonda, keda hinnatakse teatud parameetrite järgi, näiteks löödud ja löödud väravate arv, väravavõimalused jne. Suure tõenäosusega saab selle grupi parim meeskond. parimad väärtused Autor rohkem parameetrid. Mida väiksem on meeskonna standardhälve iga esitatud parameetri puhul, seda prognoositavam on meeskonna tulemus. Teisalt meeskond koos suur väärtus standardhälve muudab tulemuse ennustamise keeruliseks, mis omakorda on seletatav tasakaalustamatusega, näiteks tugev kaitse, aga nõrk rünnak.

Meeskonna parameetrite standardhälbe kasutamine võimaldab ühel või teisel määral ennustada kahe meeskonna vahelise matši tulemust, hinnates tugevusi ja nõrkused käsud ja seega ka valitud võitlusmeetodid.

Tehniline analüüs

Vaata ka

Kirjandus

* Borovikov, V. STATISTIKA. Andmeanalüüsi kunst arvutis: Professionaalidele / V. Borovikov. - Peterburi. : Peeter, 2003. - 688 lk. - ISBN 5-272-00078-1.

Selles artiklis räägin sellest kuidas leida standardhälvet. See materjal on matemaatika täielikuks mõistmiseks äärmiselt oluline, seega peaks matemaatikaõpetaja pühendama selle õppimisele eraldi tunni või isegi mitu. Sellest artiklist leiate lingi üksikasjalikule ja arusaadavale videoõpetusele, mis selgitab, mis on standardhälve ja kuidas seda leida.

Standardhälve võimaldab hinnata teatud parameetri mõõtmise tulemusena saadud väärtuste levikut. Tähistatakse sümboliga (kreeka täht "sigma").

Arvutamise valem on üsna lihtne. Standardhälbe leidmiseks peate võtma dispersiooni ruutjuure. Nüüd peate küsima: "Mis on dispersioon?"

Mis on dispersioon

Dispersiooni määratlus on järgmine. Dispersioon on aritmeetiline keskmine väärtuste ruudus kõrvalekalletest keskmisest.

Dispersiooni leidmiseks tehke järjestikku järgmised arvutused:

  • Määrake keskmine (väärtuste jada lihtne aritmeetiline keskmine).
  • Seejärel lahutage igast väärtusest keskmine ja saadud erinevus ruuduga (saate ruudus vahe).
  • Järgmise sammuna tuleb arvutada saadud ruuduerinevuste aritmeetiline keskmine (Altpoolt saate teada, miks täpselt ruudud).

Vaatame näidet. Oletame, et teie ja teie sõbrad otsustate mõõta oma koerte kõrgust (millimeetrites). Mõõtmiste tulemusena saite järgmised kõrguse mõõdud (turjast): 600 mm, 470 mm, 170 mm, 430 mm ja 300 mm.

Arvutame välja keskmise, dispersiooni ja standardhälbe.

Kõigepealt leiame keskmise väärtuse. Nagu te juba teate, peate selleks liitma kõik mõõdetud väärtused ja jagama mõõtmiste arvuga. Arvutamise edenemine:

Keskmine mm.

Seega on keskmine (aritmeetiline keskmine) 394 mm.

Nüüd peame kindlaks tegema iga koera pikkuse kõrvalekalle keskmisest:

Lõpuks dispersiooni arvutamiseks, paneme kõik saadud erinevused ruudusse ja seejärel leiame saadud tulemuste aritmeetilise keskmise:

Dispersioon mm 2 .

Seega on dispersioon 21704 mm2.

Kuidas leida standardhälvet

Niisiis, kuidas me saame nüüd arvutada standardhälbe, teades dispersiooni? Nagu mäletame, võtke selle ruutjuur. See tähendab, et standardhälve on võrdne:

Mm (ümardatud lähima täisarvuni mm).

Seda meetodit kasutades leidsime, et mõned koerad (näiteks rottweilerid) on väga suured koerad. Kuid on ka väga väikeseid koeri (näiteks taksid, kuid te ei tohiks neile seda öelda).

Kõige huvitavam on see, et standardhälve toob endaga kaasa kasulikku teavet. Nüüd saame näidata, millised saadud kõrguse mõõtmise tulemused jäävad intervallisse, mille saame, kui joonistame standardhälbe keskmisest (selle mõlemale poole).

See tähendab, et standardhälbe abil saame "standardse" meetodi, mis võimaldab meil välja selgitada, milline väärtustest on normaalne (statistiliselt keskmine) ja milline on erakordselt suur või vastupidi väike.

Mis on standardhälve

Aga... kõik on natuke teistmoodi, kui analüüsime näidis andmeid. Meie näites kaalusime üldine elanikkond. See tähendab, et meie 5 koera olid ainsad koerad maailmas, kes meid huvitasid.

Aga kui andmed on valim (väärtused on valitud suurest populatsioonist), tuleb arvutused teha teisiti.

Kui väärtused on olemas, siis:

Kõik muud arvutused tehakse sarnaselt, sealhulgas keskmise määramine.

Näiteks kui meie viis koera on vaid valim koerte populatsioonist (kõik koerad planeedil), peame jagama 4, mitte 5, nimelt:

Valimi dispersioon = mm 2.

Sel juhul on valimi standardhälve võrdne mm (ümardatuna lähima täisarvuni).

Võib öelda, et oleme teinud mõningase “paranduse” juhul, kui meie väärtused on vaid väike valim.

Märkus. Miks täpselt ruudus erinevused?

Aga miks me võtame dispersiooni arvutamisel täpselt ruudus erinevused? Oletame, et mõne parameetri mõõtmisel saite järgmise väärtuste komplekti: 4; 4; -4; -4. Kui liidame lihtsalt absoluutsed kõrvalekalded keskmisest (erinevus) kokku, siis negatiivsed väärtused tühistavad positiivsed:

.

Selgub, et see valik on kasutu. Siis võib-olla tasub proovida hälvete absoluutväärtusi (st nende väärtuste mooduleid)?

Esmapilgul selgub see hästi (saadud väärtust, muide, nimetatakse keskmiseks absoluuthälbeks), kuid mitte kõigil juhtudel. Proovime teist näidet. Olgu mõõtmistulemus järgmises väärtuste komplektis: 7; 1; -6; -2. Siis on keskmine absoluutne hälve:

Vau! Jällegi saime tulemuseks 4, kuigi erinevused on palju suuremad.

Nüüd vaatame, mis juhtub, kui me erinevused ruudustame (ja seejärel võtame nende summa ruutjuure).

Esimese näite puhul on see:

.

Teise näite puhul on see:

Nüüd on asi hoopis teine! Mida suurem on erinevuste levik, seda suurem on standardhälve... mida me püüdsimegi.

Tegelikult kasutab see meetod sama ideed nagu punktidevahelise kauguse arvutamisel, kuid seda kasutatakse ainult erineval viisil.

Ja matemaatilisest vaatenurgast ruutude kasutamine ja ruutjuured annab rohkem kasu, kui me saaksime hälvete absoluutväärtustest, muutes standardhälbe muude matemaatiliste probleemide jaoks kohaldatavaks.

Sergei Valerievich rääkis teile, kuidas standardhälvet leida

Õppetund nr 4

Teema: “Kirjeldav statistika. Tunnuste mitmekesisuse näitajad kokku"

Karakteristiku mitmekesisuse peamised kriteeriumid statistilises populatsioonis on: piir, amplituud, standardhälve, võnketegur ja variatsioonikoefitsient. Eelmises õppetükis arutati, et keskmised väärtused annavad ainult uuritava tunnuse üldistatud karakteristikud kokku ja ei võta arvesse selle üksikute variantide väärtusi: miinimum- ja maksimumväärtused, üle keskmise, allapoole. keskmine jne.

Näide. Kahe erineva numbrijada keskmised väärtused: -100; -20; 100; 20 ja 0,1; -0,2; 0,1 on absoluutselt identsed ja võrdsedKOHTA.Nende suhteliste keskmiste järjestuste andmete hajuvusvahemikud on aga väga erinevad.

Loetletud tunnuse mitmekesisuse kriteeriumide kindlaksmääramisel võetakse eelkõige arvesse selle väärtust statistilise üldkogumi üksikutes elementides.

Tunnuse varieerumise mõõtmise indikaatorid on absoluutne Ja sugulane. Variatsiooni absoluutnäitajate hulka kuuluvad: varieeruvuse vahemik, piir, standardhälve, dispersioon. Variatsioonitegur ja võnketegur viitavad suhtelistele variatsioonimõõtudele.

Limiit (lim) – See on kriteerium, mille määravad variatsiooniseerias oleva variandi äärmuslikud väärtused. Teisisõnu, see kriteerium on piiratud atribuudi minimaalse ja maksimaalse väärtusega:

Amplituud (am) või variatsiooni vahemik - See on äärmuslike võimaluste erinevus. Selle kriteeriumi arvutamiseks lahutatakse atribuudi maksimaalsest väärtusest selle minimaalne väärtus, mis võimaldab meil hinnata valiku hajumise astet:

Piiri ja amplituudi kui varieeruvuse kriteeriumide puuduseks on see, et need sõltuvad täielikult variatsioonirea karakteristiku äärmuslikest väärtustest. Sel juhul ei võeta seeriasiseseid atribuutide väärtuste kõikumisi arvesse.

Kõige täielikuma kirjelduse tunnuse mitmekesisusest statistilises populatsioonis annab standardhälve(sigma), mis on optsiooni keskmisest väärtusest kõrvalekaldumise üldine mõõt. Sageli nimetatakse standardhälvet standardhälve.

Standardhälve põhineb iga variandi võrdlusel antud üldkogumi aritmeetilise keskmisega. Kuna agregaadis on alati valikuid nii vähem kui ka rohkem, siis märgiga "" kõrvalekallete summa tühistatakse märgiga "" kõrvalekallete summa võrra, st. kõigi kõrvalekallete summa on null. Et vältida erinevuste märkide mõju, võetakse kõrvalekalded aritmeetilisest keskmisest ruudust, s.o. . Ruuthälvete summa ei võrdu nulliga. Muutuvust mõõtva koefitsiendi saamiseks võtke ruutude summa keskmine - seda väärtust nimetatakse hälbed:

Sisuliselt on dispersioon tunnuse üksikute väärtuste kõrvalekallete keskmine ruut selle keskmisest väärtusest. Dispersioon standardhälbe ruut.

Dispersioon on mõõtmete suurus (nimetatakse). Seega, kui arvurea variandid on väljendatud meetrites, siis dispersioon annab ruutmeetreid; kui variandid on väljendatud kilogrammides, siis dispersioon annab selle mõõdu ruudu (kg 2) jne.

Standardhälve– dispersiooni ruutjuur:

, siis dispersiooni ja standardhälbe arvutamisel murdosa nimetaja asemeltuleb panna.

Standardhälbe arvutamise võib jagada kuueks etapiks, mis tuleb läbi viia kindlas järjekorras:

Standardhälbe rakendamine:

a) variatsiooniridade varieeruvuse hindamiseks ja aritmeetiliste keskmiste tüüpilisuse (representatiivsuse) võrdlevaks hindamiseks. See on vajalik diferentsiaaldiagnostikas sümptomite stabiilsuse määramisel.

b) rekonstrueerida variatsioonirida, s.o. alusel selle sageduskarakteristiku taastamine kolm sigma reeglit. Vaheajal (М±3σ) 99,7% seeria kõigist variantidest asuvad intervallis (М±2σ) - 95,5% ja vahemikus (М±1σ) - 68,3% rea variant(joonis 1).

c) "hüpikakna" valikute tuvastamiseks

d) määrata normi ja patoloogia parameetrid sigma hinnangute abil

e) variatsioonikoefitsiendi arvutamiseks

f) arvutada aritmeetilise keskmise keskmine viga.

Et iseloomustada mis tahes populatsiooni, millel onnormaaljaotuse tüüp , piisab kahe parameetri teadmisest: aritmeetilisest keskmisest ja standardhälbest.

Joonis 1. Kolme sigma reegel

Näide.

Pediaatrias kasutatakse standardhälvet laste füüsilise arengu hindamiseks, võrreldes konkreetse lapse andmeid vastavate standardnäitajatega. Standardiks võetakse tervete laste füüsilise arengu aritmeetiline keskmine. Näitajate võrdlemine standarditega toimub spetsiaalsete tabelite abil, milles on toodud standardid koos neile vastavate sigma skaaladega. Arvatakse, et kui lapse füüsilise arengu näitaja jääb normi (aritmeetilise keskmise) ±σ piiresse, siis füüsiline areng laps (selle näitaja järgi) vastab normile. Kui indikaator jääb normi ±2σ piiresse, siis on normist väike kõrvalekalle. Kui näitaja ületab neid piire, erineb lapse füüsiline areng normist järsult (patoloogia on võimalik).

Lisaks absoluutväärtustes väljendatud variatsiooninäitajatele kasutatakse statistilistes uuringutes suhtelistes väärtustes väljendatud variatsiooninäitajaid. võnkekoefitsient - see on variatsioonivahemiku ja tunnuse keskmise väärtuse suhe. Variatsioonikoefitsient - See on standardhälbe ja tunnuse keskmise väärtuse suhe. Tavaliselt väljendatakse neid väärtusi protsentides.

Suhtelise variatsiooni näitajate arvutamise valemid:

Ülaltoodud valemitest on selge, et mida suurem on koefitsient V on nullilähedane, seda väiksem on iseloomulike väärtuste kõikumine. Mida rohkem V, seda muutuvam on märk.

Statistilises praktikas kasutatakse kõige sagedamini variatsioonikordajat. Seda ei kasutata mitte ainult variatsioonide võrdlevaks hindamiseks, vaid ka populatsiooni homogeensuse iseloomustamiseks. Populatsioon loetakse homogeenseks, kui variatsioonikordaja ei ületa 33% (normaallähedaste jaotuste korral). Aritmeetiliselt neutraliseerib σ ja aritmeetilise keskmise suhe mõju absoluutväärtus need omadused ja protsentuaalne suhe muudab variatsioonikordaja mõõtmeteta (nimeta) suuruseks.

Saadud variatsioonikordaja väärtust hinnatakse vastavalt tunnuse mitmekesisuse astme ligikaudsele gradatsioonile:

nõrk - kuni 10%

Keskmine – 10–20%

Tugev - üle 20%

Variatsioonikoefitsiendi kasutamine on soovitatav juhtudel, kui on vaja võrrelda erineva suuruse ja mõõtmetega omadusi.

Variatsioonikoefitsiendi ja muude hajuvuskriteeriumide erinevus on selgelt näidatud näiteks.

Tabel 1

Tööstusettevõtete töötajate koosseis

Näites toodud statistiliste tunnuste põhjal saame teha järelduse ettevõtte töötajate vanuselise koosseisu ja haridustaseme suhtelise homogeensuse kohta, arvestades uuritava kontingendi madalat ametialast stabiilsust. On lihtne mõista, et katse hinnata neid sotsiaalseid suundumusi standardhälbe järgi viiks ekslikule järeldusele ning katse võrrelda raamatupidamistunnuseid "töökogemus" ja "vanus" raamatupidamisnäitajaga "haridus" oleks üldiselt nende omaduste heterogeensuse tõttu valed.

Mediaan ja protsentiilid

Järjekorraliste (asukoha) jaotuste puhul, kus rea keskkoha kriteeriumiks on mediaan, ei saa standardhälvet ja dispersiooni kasutada variandi dispersiooni tunnustena.

Sama kehtib ka avatud variatsiooniseeriate kohta. See asjaolu on tingitud asjaolust, et hälbeid, millest dispersioon ja σ arvutatakse, mõõdetakse aritmeetilisest keskmisest, mida ei arvutata avatud variatsiooniridades ja kvalitatiivsete tunnuste jaotuste jadades. Seetõttu kasutatakse jaotuste tihendatud kirjelduse jaoks teist hajumise parameetrit - kvantiil(sünonüüm - "protsentiil"), sobib kvalitatiivsete ja kvantitatiivsete omaduste kirjeldamiseks nende mis tahes jaotusvormis. Seda parameetrit saab kasutada ka kvantitatiivsete tunnuste teisendamiseks kvalitatiivseteks. Sel juhul määratakse sellised hinnangud sõltuvalt sellest, millisele kvantiili järjekorrale konkreetne valik vastab.

Biomeditsiiniliste uuringute praktikas kasutatakse kõige sagedamini järgmisi kvantiile:

– mediaan;

, – kvartiilid (kvartiilid), kus – alumine kvartiil, ülemine kvartiil.

Kvantiilid jagavad variatsioonirea võimalike muutuste ala teatud intervallideks. Mediaan (kvantiil) on variant, mis on variatsioonirea keskel ja jagab selle seeria pooleks kaheks võrdseks osaks ( 0,5 Ja 0,5 ). Kvartiil jagab seeria neljaks osaks: esimene osa (alumine kvartiil) on optsioon, mis eraldab optsioonid, mille arvväärtused ei ületa 25% maksimaalsest võimalikust. see seeria, kvartiil eraldab valikud, mille arvväärtus on kuni 50% maksimaalsest võimalikust. Ülemine kvartiil () eraldab valikud kuni 75% maksimaalsetest võimalikest väärtustest.

Asümmeetrilise jaotuse korral muutuja aritmeetilise keskmise suhtes, selle iseloomustamiseks kasutatakse mediaani ja kvartiile. Sel juhul kasutatakse keskmise väärtuse kuvamiseks järgmist vormi - meh (;). Näiteks, on uuritav tunnus – „periood, mil laps hakkas iseseisvalt kõndima” – jaotus õpperühmas asümmeetriliselt. Samal ajal vastab alumine kvartiil () kõndimise algusele - 9,5 kuud, mediaan - 11 kuud, ülemine kvartiil () - 12 kuud. Vastavalt sellele esitatakse määratud atribuudi keskmise trendi tunnuseks 11 (9,5; 12) kuud.

Õppetulemuste statistilise olulisuse hindamine

Andmete statistilise olulisuse all mõistetakse seda, mil määral need vastavad kuvatavale reaalsusele, s.t. statistiliselt olulised andmed on need, mis ei moonuta ja kajastavad õigesti objektiivset tegelikkust.

Uurimistulemuste statistilise olulisuse hindamine tähendab määramist, millise tõenäosusega on võimalik valimikogumilt saadud tulemusi üle kanda kogu üldkogumile. Statistilise olulisuse hindamine on vajalik, et mõista, kui suure osa nähtusest saab hinnata nähtust tervikuna ja selle mustreid.

Uurimistulemuste statistilise olulisuse hindamine koosneb:

1. esindusvead (keskmiste ja suhteliste väärtuste vead) - m;

2. keskmiste või suhteliste väärtuste usalduspiirid;

3. keskmiste või suhteliste väärtuste erinevuse usaldusväärsus vastavalt kriteeriumile t.

Aritmeetilise keskmise standardviga või esindusviga iseloomustab keskmise kõikumist. Tuleb märkida, et mida suurem on valimi suurus, seda väiksem on keskmiste väärtuste levik. Keskmise standardviga arvutatakse järgmise valemi abil:

Kaasaegses teaduskirjanduses kirjutatakse aritmeetiline keskmine koos representatiivsusveaga:

või koos standardhälbega:

Vaatleme näiteks andmeid riigi 1500 linnakliiniku kohta (üldelanikkond). Kliinikus teenindatavate patsientide keskmine arv on 18 150 inimest. Juhuslik valik 10% kohtadest (150 kliinikut) annab keskmiseks patsientide arvuks 20 051 inimest. Valimi võtmise viga, mis tuleneb ilmselt asjaolust, et valimisse ei kaasatud kõiki 1500 kliinikut, on võrdne nende keskmiste erinevusega - üldkeskmise ( M geen) ja proovi keskmine ( M valitud). Kui moodustame oma populatsioonist teise sama suurusega valimi, annab see erineva veaväärtuse. Kõik need piisavalt suurte valimitega valimi keskmised jaotuvad tavaliselt piisavalt suurte valimitega üldkeskmise ümber suur hulk populatsioonist sama arvu objektide valimi kordused. Keskmise standardviga m- see on valimi keskmiste vältimatu levik üldkeskmise ümber.

Juhul, kui uurimistulemused esitatakse suhtelistes kogustes (näiteks protsentides) - arvutatakse murdosa standardviga:

kus P on näitaja %, n on vaatluste arv.

Tulemus kuvatakse kujul (P ± m)%. Näiteks paranemise protsent patsientide seas oli (95,2±2,5)%.

Juhul, kui populatsiooni elementide arv, siis keskväärtuse standardvigade arvutamisel ja murdosa nimetaja murdosa asemeltuleb panna.

Normaaljaotuse korral (valimi keskmiste jaotus on normaalne) teame, milline osa populatsioonist jääb mis tahes keskmist ümbritsevasse intervalli. Eelkõige:

Praktikas on probleem selles, et üldkogumi tunnused on meile tundmatud ning valim tehakse just nende hindamise eesmärgil. See tähendab, et kui teeme sama suurusega proovid nüldkogumikust, siis 68,3% juhtudest sisaldab intervall väärtust M(95,5% juhtudest on see intervallil ja 99,7% juhtudest intervallil).

Kuna tegelikult võetakse ainult üks valim, on see väide sõnastatud tõenäosuse alusel: tõenäosusega 68,3%, atribuudi keskmine väärtus üldkogumis asub intervallis, tõenäosusega 95,5%. - intervallis jne.

Praktikas ehitatakse valimi väärtuse ümber intervall nii, et etteantud (piisavalt suure) tõenäosusega usalduse tõenäosus – kataks selle parameetri tegeliku väärtuse üldpopulatsioonis. Seda intervalli nimetatakse usaldusvahemik.

Usalduse tõenäosusP see on usaldusväärsuse aste, et usaldusvahemik sisaldab tegelikult üldkogumi parameetri tõelist (tundmatut) väärtust.

Näiteks kui usalduse tõenäosus R on 90%, see tähendab, et 90 proovi 100-st annavad populatsiooni parameetri õige hinnangu. Vastavalt sellele on vea tõenäosus, s.o. valimi üldkeskmise vale hinnang on võrdne protsentides: . Sest see näide see tähendab, et 10 proovi 100-st annavad vale hinnangu.

Ilmselgelt sõltub usalduse aste (usaldustõenäosus) intervalli suurusest: mida laiem on intervall, seda suurem on kindlus, et sellesse satub üldkogumi jaoks tundmatu väärtus. Praktikas kasutatakse vähemalt 95,5% usaldusväärsuse tagamiseks usaldusvahemiku koostamiseks vähemalt kahekordset valimiviga.

Keskmiste ja suhteliste väärtuste usalduspiiride määramine võimaldab meil leida nende kaks äärmist väärtust - minimaalne võimalik ja maksimaalne võimalik, mille piires võib uuritav näitaja esineda kogu populatsioonis. Selle põhjal usalduspiirid (või usaldusvahemik)- need on keskmiste või suhteliste väärtuste piirid, millest üle on juhuslike kõikumiste tõttu ebaoluline tõenäosus.

Usaldusvahemiku saab ümber kirjutada järgmiselt: , kus t– usalduskriteerium.

Aritmeetilise keskmise usalduspiirid üldkogumis määratakse järgmise valemiga:

M geen = M vali + t m M

suhtelise väärtuse jaoks:

R geen = P vali + t m R

Kus M geen Ja R geen- üldrahvastiku keskmiste ja suhteliste väärtuste väärtused; M vali Ja R vali- valimipopulatsioonist saadud keskmiste ja suhteliste väärtuste väärtused; m M Ja m P- keskmiste ja suhteliste väärtuste vead; t- usalduskriteerium (täpsuskriteerium, mis kehtestatakse uuringu planeerimisel ja võib olla võrdne 2 või 3-ga); t m- see on usaldusvahemik või Δ - näidisuuringus saadud indikaatori maksimaalne viga.

Tuleb märkida, et kriteeriumi väärtus t teatud määral seotud veavaba prognoosi tõenäosusega (p), väljendatuna %. Selle valib uurija ise, juhindudes vajadusest saada nõutava täpsusega tulemus. Seega veavaba prognoosi tõenäosuse 95,5% korral on kriteeriumi väärtus t on 2, 99,7% - 3 puhul.

Usaldusvahemiku antud hinnangud on vastuvõetavad ainult statistiliste populatsioonide puhul, mille vaatluste arv on üle 30. Väiksema populatsiooni (väikesed valimid) korral kasutatakse t-kriteeriumi määramiseks spetsiaalseid tabeleid. Nendes tabelites asub soovitud väärtus populatsiooni suurusele vastava joone ristumiskohas (n-1), ja veerg, mis vastab teadlase valitud veavaba prognoosi tõenäosustasemele (95,5%; 99,7%). Meditsiiniuuringutes on mis tahes näitaja usalduspiiride kehtestamisel veavaba prognoosi tõenäosus 95,5% või rohkem. See tähendab, et valimikogumist saadud näitaja väärtus tuleb leida üldkogumist vähemalt 95,5% juhtudest.

    Küsimused tunni teemal:

    Tunnuste mitmekesisuse näitajate asjakohasus statistilises populatsioonis.

    Absoluutsete variatsiooninäitajate üldised omadused.

    Standardhälve, arvutamine, rakendamine.

    Variatsiooni suhtelised mõõdud.

    Mediaan, kvartiil.

    Õpitulemuste statistilise olulisuse hindamine.

    Aritmeetilise keskmise standardviga, arvutusvalem, kasutusnäide.

    Proportsiooni ja selle standardvea arvutamine.

    Usaldustõenäosuse mõiste, kasutusnäide.

10. Usaldusvahemiku mõiste, selle rakendamine.

    Testülesanded sellel teemal standardvastustega:

1. MUUTUMISE ABSOLUUTSEID NÄITAJAID, KUIDAS VIIDATE

1) variatsioonikoefitsient

2) võnkekoefitsient

4) mediaan

2. VARIATSIOONI SUHTELISED NÄITAJAD SEOTUD

1) dispersioon

4) variatsioonikoefitsient

3. KRITEERIUM, MIS ON MÄÄRATUD VARIATSIOONSERIA OPTIONI ÄRIVÄÄRTUSTE ALUSEL

2) amplituud

3) hajutamine

4) variatsioonikoefitsient

4. Äärmusvalikud ERINEVUSED ON

2) amplituud

3) standardhälve

4) variatsioonikoefitsient

5. ISELOOMULIKU KESKMISEST VÄÄRTUSEST ON INDIVIDUAALVÄÄRTUSTE HÕLMETE KESKMINE RUUT

1) võnkekoefitsient

2) mediaan

3) hajutamine

6. VARIATION SSKAALA SUHE MÄRGI KESKMISSE VÄÄRTUSEGA ON

1) variatsioonikoefitsient

2) standardhälve

4) võnkekoefitsient

7. KESKMISE RUUTHÄLBE SUHE TUNNUSLIKU KESKMISSE VÄÄRTUSEGA ON

1) dispersioon

2) variatsioonikoefitsient

3) võnkekoefitsient

4) amplituud

8. VARIANT, MIS ON VARIATSIOONIDE SERIA KESKES JA JAGAB SELLE KAHEKS VÕRDSEKS OSAKS, ON

1) mediaan

3) amplituud

9. MEDITSIINILISES UURINGUS MIS TAHES INDIKAATORILE KINNITUSLIIME KEHTES ON AKTSEPTEERITUD VEATETA ENNUSTUSE TÕENÄOSUSEGA

10. KUI 90 PROOVI 100-st ANNAVAD POPULATSIOONI PARAMEETRI ÕIGE HINNANGUSE, TÄHENDAB SEE, ET KINNITUSE TÕENÄOSUS P VÕRDSED

11. KUI 10 NÄIDIST 100-st ANNAVAD VALE HINNANGUSE, ON VEA TÕENÄOSUS VÕRDNE

12. KESKMISTE VÕI SUHTELISTE VÄÄRTUSTE PIIRID, MIS LÄHEB ÜLEMINE JUHUSLIKUTE VÕNKUMISTE PÄRAST ON VÄIKE TÕENÄOSUS – SEE ON

1) usaldusvahemik

2) amplituud

4) variatsioonikoefitsient

13. VÄIKSEKS VALIMIKS LOETAKSE, KELLES

1) n on väiksem kui 100 või sellega võrdne

2) n on väiksem kui 30 või sellega võrdne

3) n on väiksem kui 40 või sellega võrdne

4) n on nullilähedane

14. 95% KRITEERIUMI VÄÄRTUSE VEATEVABA PROGNOOSIDE TÕENÄOSUSE KOHTA t ON

15. 99% KRITEERIUMI VÄÄRTUSE VEATETA PROGNOOSIDE TÕENÄOSUSE KOHTA t ON

16. NORMAALSELE LÄHEDASTE JAOTUSTE PUHUL LOETAKSE RAHVASTIK HOMOGEENSEKS, KUI VARIatsiooniKOefitsient EI ÜLETA

17. VALIK, ERALDUSVÕIMALUSED, MILLISTE ARVUVÄÄRTUSED EI ÜLE 25% ANNETUD SERIES MAKSIMAALSEST VÕIMALIKUST – SEE ON

2) alumine kvartiil

3) ülemine kvartiil

4) kvartiil

18. ANDMEID, MIS EI MOONUTA JA OBJEKTIIVSET REAALSUST ÕIGESTI Peegeldavad, nimetatakse

1) võimatu

2) võrdselt võimalik

3) usaldusväärne

4) juhuslik

19. VASTAVALT "KOLME SigMA" REEGLILE, KES TAVALINE JAOTUS
ASUTAKSE

1) 68,3% optsioon

Standardhälve on kirjeldava statistika varieeruvuse klassikaline näitaja.

Standardhälve, standardhälve, Standardhälve, valimi standardhälve (ing. standard deviation, STD, STDev) on kirjeldavas statistikas väga levinud hajuvuse näitaja. Aga, kuna tehniline analüüs on sarnane statistikaga, seda näitajat saab (ja peakski) kasutama tehnilises analüüsis, et tuvastada analüüsitava instrumendi hinna hajumise määr ajas. Tähistatakse kreeka sümboliga Sigma "σ".

Täname Karl Gaussi ja Pearsoni standardhälbe kasutamise lubamise eest.

Kasutades standardhälve tehnilises analüüsis, keerame selle ümber "hajumise indeks""V "volatiilsuse indikaator“, säilitades tähenduse, kuid muutes termineid.

Mis on standardhälve

Kuid peale vahepealsete abiarvutuste standardhälve on sõltumatuks arvutamiseks üsna vastuvõetav ja rakendused tehnilises analüüsis. Nagu meie ajakirja aktiivne lugeja Burdock märkis, " Ma ei saa siiani aru, miks standardhälve ei sisaldu kodumaiste kaubanduskeskuste standardnäitajate komplektis«.

Tõesti, standardhälbe abil saab mõõta instrumendi varieeruvust klassikalisel ja “puhtal” viisil. Kuid kahjuks pole see näitaja väärtpaberianalüüsis nii levinud.

Standardhälbe rakendamine

Standardhälbe käsitsi arvutamine pole eriti huvitav, kuid kogemuse jaoks kasulik. Standardhälvet saab väljendada valem STD=√[(∑(x-x ) 2)/n] , mis kõlab kui valimi elementide ja keskmise erinevuste ruutude summa juur, mis on jagatud valimi elementide arvuga.

Kui valimi elementide arv ületab 30, siis juure all oleva murdosa nimetaja saab väärtuse n-1. Muidu kasutatakse n.

Samm-sammult standardhälbe arvutamine:

  1. arvutada andmevalimi aritmeetiline keskmine
  2. lahutage see keskmine igast valimielemendist
  3. paneme kõik saadud erinevused ruudusse
  4. summeerige kõik saadud ruudud
  5. jagage saadud summa valimi elementide arvuga (või n-1-ga, kui n>30)
  6. arvutage saadud jagatise ruutjuur (nn dispersioon)

Määratletakse agregaadi tunnuse variatsiooni suuruse üldistava tunnusena. See võrdub atribuudi üksikute väärtuste keskmise ruuthälbe ruutjuurega aritmeetilisest keskmisest, s.o. Ja juure võib leida järgmiselt:

1. Põhirea jaoks:

2. Variatsiooniseeria jaoks:

Standardhälbe valemi teisendamine viib selle praktiliste arvutuste jaoks mugavamasse vormi:

Standardhälve määrab, kui palju konkreetsed valikud keskmiselt oma keskmisest väärtusest kõrvale kalduvad, ning on ka tunnuse varieeruvuse absoluutne mõõdik ning väljendub optsioonidega samades ühikutes ning on seetõttu hästi tõlgendatav.

Näited standardhälbe leidmiseks: ,

Alternatiivsete omaduste puhul keskmine valem ruuthälve näeb välja selline:

kus p on teatud tunnusega üksuste osakaal üldkogumis;

q on ühikute osakaal, millel seda tunnust ei ole.

Keskmise lineaarhälbe mõiste

Keskmine lineaarne hälve on määratletud kui üksikute valikute kõrvalekallete absoluutväärtuste aritmeetiline keskmine.

1. Põhirea jaoks:

2. Variatsiooniseeria jaoks:

kus on summa n variatsiooniridade sageduste summa.

Näide keskmise lineaarse hälbe leidmiseks:

Keskmise absoluuthälbe eelis dispersiooni mõõtjana variatsioonivahemikus on ilmne, kuna see mõõt põhineb kõigi võimalike kõrvalekallete arvessevõtmisel. Kuid sellel indikaatoril on olulisi puudusi. Hälvete algebraliste märkide meelevaldne tagasilükkamine võib viia selleni, et selle indikaatori matemaatilised omadused pole kaugeltki elementaarsed. See muudab tõenäosusarvutustega seotud ülesannete lahendamisel keskmise absoluuthälbe kasutamise väga keeruliseks.

Seetõttu kasutatakse keskmist lineaarset hälvet tunnuse varieerumise mõõdikuna statistikapraktikas harva, nimelt siis, kui näitajate liitmine ilma märke arvestamata on majanduslikult mõttekas. Selle abil analüüsitakse näiteks käivet väliskaubandus, töötajate koosseis, tootmise rütm jne.

Keskmine ruut

Rakendatakse keskmist ruut, näiteks n ruudukujulise sektsiooni külgede keskmise suuruse, tüvede, torude jne keskmise läbimõõdu arvutamiseks. See jaguneb kahte tüüpi.

Lihtne keskmine ruut. Kui tunnuse üksikute väärtuste asendamisel keskmine väärtus Kui on vaja hoida algväärtuste ruutude summa konstantsena, on keskmine ruutkeskmine väärtus.

See on ruutjuur jagatisest, mis jagatakse üksikute atribuutide väärtuste ruutude summa nende arvuga:

Kaalutud keskmine ruut arvutatakse järgmise valemi abil:

kus f on kaalumärk.

Keskmine kuup

Kehtib keskmine kuup, näiteks külje ja kuubikute keskmise pikkuse määramisel. See on jagatud kahte tüüpi.
Keskmine kuupmeetri lihtne:

Intervallide jaotussarjade keskmiste väärtuste ja dispersiooni arvutamisel asendatakse atribuudi tegelikud väärtused intervallide keskväärtustega, mis erinevad keskmisest aritmeetilised väärtused sisaldub intervallis. See toob kaasa süstemaatilise vea dispersiooni arvutamisel. V.F. Sheppard tegi selle kindlaks viga dispersiooni arvutamisel, mis on põhjustatud grupeeritud andmete kasutamisest, on 1/12 intervalli väärtuse ruudust nii dispersiooni suuruse suurenemise kui ka vähenemise suunas.

Sheppardi muudatusettepanek tuleks kasutada, kui jaotus on normaalsele lähedane, on seotud pideva varieerumisega tunnusega ja põhineb olulisel hulgal algandmetel (n > 500). Kuid lähtudes asjaolust, et mõnel juhul kompenseerivad mõlemad eri suundades toimivad vead teineteist, on mõnikord võimalik paranduste tegemisest keelduda.

Mida väiksem on dispersioon ja standardhälve, seda homogeensem on üldkogum ja seda tüüpilisem on keskmine.
Statistika praktikas on sageli vajadus võrrelda erinevate tunnuste variatsioone. Näiteks on väga huvitav võrrelda töötajate vanuse ja kvalifikatsiooni, tööstaaži ja suuruse erinevusi palgad, kulu ja kasum, tööstaaž ja tööviljakus jne. Sellisteks võrdlusteks ei sobi tunnuste absoluutse varieeruvuse näitajad: aastates väljendatud töökogemuse varieeruvust pole võimalik võrrelda rublades väljendatud töötasu kõikumisega.

Selliste võrdluste läbiviimiseks, samuti sama tunnuse varieeruvuse võrdlemiseks mitmes erineva aritmeetilise keskmisega populatsioonis, kasutatakse suhtelist variatsiooninäitajat - variatsioonikordajat.

Struktuursed keskmised

Statistiliste jaotuste keskse tendentsi iseloomustamiseks on sageli ratsionaalne koos aritmeetilise keskmisega kasutada tunnuse X teatud väärtust, mis jaotusreas paiknemise teatud tunnuste tõttu saab iseloomustada selle taset.

See on eriti oluline, kui jaotuseseerias on tunnuse äärmuslikel väärtustel ebaselged piirid. Tänu sellele täpne määratlus Aritmeetiline keskmine on tavaliselt võimatu või väga raske. Sellistel juhtudel saab keskmise taseme määrata, võttes näiteks selle tunnuse väärtuse, mis asub sagedusrea keskel või mis esineb kõige sagedamini jooksvas jadas.

Sellised väärtused sõltuvad ainult sageduste olemusest, st jaotuse struktuurist. Need on tüüpilised sageduste seerias, seetõttu peetakse selliseid väärtusi jaotuse keskpunkti tunnusteks ja seetõttu on need saanud struktuursete keskmiste määratluse. Neid kasutatakse õppimiseks sisemine struktuur ja atribuutide väärtuste jaotussarja struktuur. Sellised näitajad hõlmavad järgmist:



 


Loe:



Eelarvega arvelduste arvestus

Eelarvega arvelduste arvestus

Konto 68 raamatupidamises kogub teavet kohustuslike maksete kohta eelarvesse, mis on maha arvatud nii ettevõtte kui ka...

Kodujuustust pannil valmistatud juustukoogid - kohevate juustukookide klassikalised retseptid Juustukoogid 500 g kodujuustust

Kodujuustust pannil valmistatud juustukoogid - kohevate juustukookide klassikalised retseptid Juustukoogid 500 g kodujuustust

Koostis: (4 portsjonit) 500 gr. kodujuust 1/2 kl jahu 1 muna 3 spl. l. suhkur 50 gr. rosinad (valikuline) näputäis soola söögisoodat...

Musta pärli salat ploomidega Musta pärli salat ploomidega

Salat

Head päeva kõigile neile, kes püüavad oma igapäevases toitumises vaheldust. Kui olete üksluistest roogadest väsinud ja soovite meeldida...

Lecho tomatipastaga retseptid

Lecho tomatipastaga retseptid

Väga maitsev letšo tomatipastaga, nagu Bulgaaria letšo, talveks valmistatud. Nii töötleme (ja sööme!) oma peres 1 koti paprikat. Ja keda ma tahaksin...

feed-image RSS