Koti - ovet
Kroonisen sepelvaltimotaudin diagnoosi ja hoito Kroonisen sepelvaltimotaudin diagnoosi (ch2). Prior probability Menetelmät aiemman todennäköisyyden arvioimiseksi

Pelkästään tarkkoihin tosiasioihin perustuvaa päättelyä ja näihin tosiasioihin perustuvia tarkkoja johtopäätöksiä kutsutaan ankariksi huomioiksi. Tapauksissa, joissa päätösten tekemiseen on käytettävä epävarmoja tosiasioita, tiukka perustelu ei sovellu. Siksi yksi minkä tahansa asiantuntijajärjestelmän vahvuuksista on sen kyky muodostaa päättelyä epävarmuudessa yhtä hyvin kuin ihmisten asiantuntijat tekevät. Tällainen perustelu ei ole tiukka. Voit turvallisesti puhua läsnäolosta sumea logiikka.

Epävarmuus, ja sen seurauksena sumeaa logiikkaa voidaan pitää päätöksentekoon riittävän tiedon puutteena. Epävarmuus muodostuu ongelmaksi, koska se voi estää parhaan ratkaisun luomisen ja johtaa jopa huonolaatuisen ratkaisun löytämiseen. On huomattava, että reaaliajassa löydettyä laadukasta ratkaisua pidetään usein hyväksyttävämpänä kuin parasta ratkaisua, jonka laskeminen kestää kauan. Esimerkiksi hoidon viivästyminen lisäkokeiden suorittamiseksi voi johtaa potilaan kuolemaan ilman apua.

Syynä epävarmuuteen on erilaisten virheiden esiintyminen tiedoissa. Yksinkertaistettu luokittelu Nämä virheet voidaan esittää jaettuna seuraaviin tyyppeihin:

  • tiedon moniselitteisyys, jonka esiintyminen johtuu siitä, että jotkin tiedot voidaan tulkita eri tavoin;
  • joidenkin tietojen puutteeseen liittyvä tietojen epätäydellisyys;
  • tietojen käytöstä johtuva riittämättömyys ei vastaa todellista tilannetta (mahdolliset syyt ovat subjektiivisia virheitä: valheet, väärät tiedot, laitteiden toimintahäiriöt);
  • mittausvirheet, jotka johtuvat kvantitatiivisen tiedon esittämisen kriteerien oikeellisuutta ja tarkkuutta koskevien vaatimusten noudattamatta jättämisestä;
  • satunnaiset virheet, joiden ilmentymä on tietojen satunnainen vaihtelu suhteessa niiden keskiarvoon (syynä voi olla: laitteiston epäluotettavuus, Brownin liike, lämpövaikutukset jne.).

Tähän mennessä on kehitetty huomattava määrä epävarmuusteorioita, jotka yrittävät eliminoida jotkin tai jopa kaikki virheet ja tarjoavat luotettavia johtopäätöksiä epävarmuudesta. Käytännössä eniten käytettyjä teorioita, jotka perustuvat klassiseen todennäköisyyden määritelmään ja jälkikäteen todennäköisyyteen.

Todennäköisyyslaskenta on yksi vanhimmista ja tärkeimmistä keinoista tekoälyongelmien ratkaisemisessa. Todennäköisyys on kvantitatiivinen tapa laskea epävarmuutta. Klassinen todennäköisyys on peräisin teoriasta, jonka Pascal ja Fermat ehdottivat ensimmäisen kerran vuonna 1654. Sen jälkeen on tehty paljon työtä todennäköisyyslaskentaan ja lukuisten todennäköisyyslaskentasovellusten toteuttamiseen tieteen, teknologian, liike-elämän, talouden ja muilla aloilla.

klassinen todennäköisyys

klassinen todennäköisyys kutsutaan myös a priori todennäköisyydeksi, koska sen määritelmä viittaa ihanteellisiin järjestelmiin. Termi "a priori" tarkoittaa todennäköisyyttä, joka on määritetty "tapahtumiin" ottamatta huomioon monia todellisessa maailmassa tapahtuvia tekijöitä. A priori todennäköisyyden käsite ulottuu tapahtumiin, jotka tapahtuvat ihanteellisissa järjestelmissä, jotka ovat alttiita kulumiselle tai muiden järjestelmien vaikutuksille. Ihanteellisessa järjestelmässä minkä tahansa tapahtuman esiintyminen tapahtuu samalla tavalla, mikä tekee niiden analysoinnista paljon helpompaa.

Klassisen todennäköisyyden (P) peruskaava määritellään seuraavasti:

Tässä kaavassa W on odotettujen tapahtumien määrä ja N on sellaisten tapahtumien kokonaismäärä, joilla on sama todennäköisyys ja jotka ovat mahdollisia kokeen tai testin tuloksia. Esimerkiksi todennäköisyys saada mikä tahansa kuusisivuisen nopan kasvot on 1/6, ja minkä tahansa kortin nostaminen 52 eri korttia sisältävästä pakasta on 1/52.

Todennäköisyysteorian aksioomat

Muodollinen todennäköisyysteoria voidaan luoda kolmen aksiooman perusteella:

Yllä olevat aksioomit mahdollistivat perustan todennäköisyysteorialle, mutta ne eivät ota huomioon tapahtumien todennäköisyyttä todellisissa - ei-ideaalisissa järjestelmissä. Toisin kuin a priori lähestymistapa, todellisissa järjestelmissä jonkin tapahtuman todennäköisyyden määrittämiseen P(E), käytetään menetelmää kokeellisen todennäköisyyden määrittämiseksi taajuusjakauman rajana:

Posteriorinen todennäköisyys

Tässä kaavassa f(E) ilmaisee jonkin tapahtuman esiintymistiheyttä välillä N kokonaistulosten havaintojen määrä. Tällaista todennäköisyyttä kutsutaan myös posteriorinen todennäköisyys, eli todennäköisyys määritetään "tapahtumien jälkeen". Posteriorin todennäköisyyden määritelmä perustuu tapahtuman esiintymistiheyden mittaamiseen useiden testien aikana. Esimerkiksi luottokelpoisen pankkiasiakkaan sosiaalisen tyypin määrittäminen empiirisen kokemuksen perusteella.

Tapahtumat, jotka eivät ole toisiaan poissulkevia, voivat vaikuttaa toisiinsa. Tällaiset tapahtumat kuuluvat monimutkaisten tapahtumien luokkaan. Monimutkaisten tapahtumien todennäköisyys voidaan laskea analysoimalla niiden vastaavat näyteavaruudet. Nämä näytetilat voidaan esittää käyttämällä Venn-diagrammeja, kuten kuvassa 2 on esitetty. 1

Kuva 1 Esimerkkitila kahdelle ei-toisiaan poissulkevalle tapahtumalle

Tapahtuman A esiintymistodennäköisyyttä, joka määritetään ottaen huomioon, että tapahtuma B tapahtui, kutsutaan ehdolliseksi todennäköisyydeksi ja merkitään P(A|B). Ehdollinen todennäköisyys määritellään seuraavasti:

Aikaisempi todennäköisyys

Tässä kaavassa todennäköisyys P(B) ei saa olla nolla, ja se on ennakkotodennäköisyys, joka määritetään ennen kuin muuta lisätietoa tiedetään. aiempi todennäköisyys, jota sovelletaan ehdollisen todennäköisyyden käytön yhteydessä, kutsutaan joskus absoluuttiseksi todennäköisyydeksi.

On ongelma, joka on olennaisesti päinvastainen kuin ehdollisen todennäköisyyden laskemisen ongelma. Se koostuu käänteisen todennäköisyyden määrittämisestä, joka osoittaa edellisen tapahtuman todennäköisyyden, ottaen huomioon ne tapahtumat, jotka tapahtuivat tulevaisuudessa. Käytännössä tällaista todennäköisyyttä esiintyy melko usein esimerkiksi suoritettaessa lääketieteellistä diagnostiikkaa tai laitteiden diagnostiikkaa, jossa havaitaan tiettyjä oireita ja tehtävänä on löytää mahdollinen syy.

Tämän ongelman ratkaisemiseksi sitä käytetään Bayesin lause, joka on nimetty 1700-luvun brittiläisen matemaatikon Thomas Bayesin mukaan. Bayesilaista teoriaa käytetään nykyään laajalti talous- ja yhteiskuntatieteiden päätöspuiden analysointiin. Bayesilaista ratkaisuhakumenetelmää käytetään myös PROSPECTOR-asiantuntijajärjestelmässä lupaavien mineraalien etsintäkohteiden tunnistamisessa. PROSPECTOR-järjestelmä saavutti laajan suosion ensimmäisenä asiantuntijajärjestelmänä, jonka avulla löydettiin arvokas molybdeeniesiintymä, joka maksoi 100 miljoonaa dollaria.

C7 Tässä modernissa muodossa Bayesin lauseen itse asiassa muotoili Laplace. Thomas Bayes omistaa ongelman muotoilun. Hän muotoili sen tunnetun Bernoullin ongelman käänteiseksi. Jos Bernoulli etsi "kaarevan" kolikon heittämisen erilaisten tulosten todennäköisyyttä, niin Bayes päinvastoin yritti määrittää tämän "kaarevuuden" asteen kolikon heittämisen empiirisesti havaittujen tulosten perusteella. Hänen ratkaisussaan ei ollut aiempaa todennäköisyyttä.


Vaikka sääntö näyttää hyvin yksinkertaiselta, sitä on vaikea soveltaa käytännössä, koska posterioritodennäköisyydet (tai jopa yksinkertaistettujen päätösfunktioiden arvot) ovat usein tuntemattomia. Niiden arvo voidaan arvioida. Bayesin lauseen perusteella a posteriori todennäköisyydet voidaan ilmaista a priori todennäköisyyksien ja tiheysfunktioiden avulla kaavan mukaisesti

Arvioimalla luokittelun tuloksia MDA-menetelmällä näemme huomattavan osan virheellisistä päätöksistä konkurssiin menneistä yrityksistä (ryhmä 1) - yksi niistä olisi saanut lainaa. Yrityksiä, joiden asema on epäselvä (ryhmä 2), on vaikea luokitella oikein, koska ne voivat päätyä ryhmään 1 tai 3. Asiaa ei voida parantaa saattamalla aikaisemmat todennäköisyydet linjaan pankin käsityksen kanssa yrityksen kuulumisen todennäköisyydestä eri ryhmiin. Ennusteen oikeellisuuden kokonaisindikaattori oli vain 56,6 % ja vain 30 % 1. ryhmästä luokiteltiin oikein.

Nykyisen monimutkaisuuden ja meneillään olevien prosessien samanaikaisuuden vuoksi kausaalisuhteisiin perustuvilla malleilla on rajalliset käyttömahdollisuudet; uudet tapahtumat muuttavat jatkuvasti kaikkien muuttujien (sekä malliin sisältyvien että ulkoisten) määrityksiä ja niiden arvoja. a priori eri strategioiden todennäköisyydet ja maksut ovat erittäin epävarmoja ja vaihtelevat dramaattisesti talouskasvun, korkojen, valuuttakurssien ja ei-lainatransaktioiden kannattavuuden muuttuessa (esimerkiksi transaktiopalkkioiden ja palkkioiden muuttuessa).

Koska todellisessa tilanteessa on mahdotonta tietää etukäteen, mikä osa satunnaisotokseen kuuluvista yrityksistä menee konkurssiin vuoden aikana, ja koska näiden kahden mallin laatijat, kuten voidaan olettaa, asettivat erotustasot perustuen Yksinkertaistimme vertailumenettelyä ja otimme käyttöön suhteelliset erotustasot joidenkin erityisten oletusten perusteella a priori konkurssin todennäköisyyksistä ja virheiden hinnasta. Toisin sanoen kunkin mallin kohdalla pidettiin konkurssisignaaleina alimman 10 % mallin antamista signaaleista seuraavalle vuodelle. Itse asiassa tämä lähestymistapa tarkoittaa yleistä 10 %:n ennakkotodennäköisyyttä konkurssiin ja sellaista konkurssisignaalien lukumäärän suhdetta todellisiin konkursseihin edellisessä testissä, joka määritetään optimointikynnyksen avulla. Lisäksi tällä menetelmällä on se etu, että se minimoi vääristymät, joita syntyy Altmanin Z-pisteen julkaisemisen ja kokeen välisestä suuresta aikaerosta. Keskiarvot ovat saattaneet muuttua tänä aikana, ja siksi yritysten jako vahvoihin ja heikkoihin tietyn osuuden perusteella vaikuttaa luotettavammalta. Taulukossa. Kohdassa 9.2 esitetään konkurssien ennustamista seuraavan vuoden kokeen tulokset ja kunkin mallin virhe.

Ottaen aikaisemman todennäköisyyden tosiasiaksi, arvioi odotettu voitto sivuliikkeen avaamisen yhteydessä.

Merkitse A:lla tapahtumaa, että q b [

Valitaan esimerkiksi seuraavat parametrit - pääomasijoitusten arvo, käyttökustannusten arvo ja valmiiden tuotteiden hinta, jotka vastaavasti voivat saada arvot K C, joiden todennäköisyys on pt = 0,1, K2:lle , E2, C2 todennäköisyys on p2 = 0,8 ja K3, E3, C3 - p3 = 0,1.

Olkoon a priori todennäköisyys saada suunnitteluprosessin lopussa tekninen ratkaisu, joka tyydyttää

Jos pelaajalla 2 on pelissä Γ useampi kuin yksi strategia ja pelaaja 1 tuntee niiden käytön a priori todennäköisyydet tai ei edes ole mitään järkeä puhua näistä todennäköisyyksistä ollenkaan, niin kaikki sanottu ei sovellu.

Kuten olemme aiemmin nähneet, aiempien todennäköisyyksien p ja q muutos riippuu signaalin virityksestä.

Tästä seuraa, että jos meillä on riskineutraali kohde, joka uskoo, että osto-optio maksaa C todennäköisyydellä tr ja j todennäköisyydellä (1 - r), niin tämä kohde laskee option nykyhinnan täysin yhtälön mukaisesti. johdimme. Huomaa, että emme ole koskaan olettaneet, että tietyn osakkeen hinnan toteutumiselle on ennakkoon olemassa todennäköisyys ja vastaavasti option tuleva arvo . Tätä lähestymistapaa kutsutaan riskineutraaliksi arvostukseksi.

Anna m(

(7.53):n oikea puoli ei ole tiheys varsinaisessa merkityksessä, koska sen integraalia ei ole määritelty, mutta kuitenkin, kun lasketaan parametrien posteriorijakauman tiheyttä Bayesin kaavalla, muodollisia vaikeuksia ei joko esiinny työskentelyssä kanssa (7.53), tai ne voidaan helposti voittaa . Kuten alla osiossa 7.3.2 tulemme näkemään, valinta (7.53) on analyyttisesti kätevä ja näyttää ilmeisesti heijastavan hyvin sitä, että parametrien jakautumisesta ei ole tietoa etukäteen. Se kuitenkin kätkee itse asiassa erittäin vahvat oletukset - parametrien välisen korrelaation puuttumisen (jota ei pidä sekoittaa parametriarvojen estimaattien väliseen korrelaatioon, joka riippuu regressorien jakaumasta ja a:n arvosta), jättäen huomiotta sen a priori todennäköisyyden pienuus, että parametrivektori sijaitsee missä tahansa eteenpäin tietyssä äärellisessä tilavuudessa, olipa sen koko mikä tahansa jne. Tämä johtaa joskus vakaviin vaikeuksiin Bayesin estimoinnin tulosten tulkinnassa.

Tarkastellaanpa Bayesin lauseen sisältöä hieman eri näkökulmasta. Tätä varten kirjoitamme ylös kaikki kokeilumme mahdolliset tulokset. Olkoon symbolit H0, h tarkoittavat, että kolikon lopputulos ei ole peitetty ja sen yläpuoli on vaakuna Jos arvioit toteutuksen a priori todennäköisyyden

I kuin V2i, määritellyn tuloksen todennäköisyys on Va X x1/2=1/4- Alla on luettelo kaikista tuloksista ja niiden aikaisemmista todennäköisyyksistä

Joten esimerkissä, jossa on kolikon ja noppaa, P(Na) on ennakkotodennäköisyys, P(Na K) on posteriori todennäköisyys ja P(N Na) on todennäköisyys.

Jos nyt ennakkotodennäköisyydeksi P(H0) voidaan katsoa joko 1 tai 0, sanotaan päätöksentekijän

Kuvittele nyt, että kokeilija tarjoaa päätöksentekijälle täysin luotettavaa (tai täydellistä) tietoa siitä, mitä kohdetta ei kata. Päättäjä joutuu kuitenkin maksamaan tällaisen täysin luotettavan tiedon ilmoittamisen palvelusta ennen tiedon saamista. Mitä arvoa tällaisella tiedolla olisi Hän voi katsoa eteenpäin ja kysyä itseltään, mitä hän aikoo tehdä vastauksena jokaiseen kahdesta mahdollisesta viestistä, jonka tämä palvelu voi tarjota, ja laskea tulonsa saatujen vastausten perusteella. Punnitsemalla näitä tuloja mahdollisten ilmoitusten aiempien todennäköisyyksien perusteella hän voisi arvioida odotettujen tulojensa määrän, jos hän maksaisi jonkin verran täysin luotettavista tiedoista ennen sen tosiasiallista vastaanottamista. Koska tämä odotettu tulo olisi enemmän kuin 0,5 dollaria, eli se, mitä hän odottaa pelkän ennakkotietojen perusteella, niin tulojen kasvu olisi maksimisumma, joka hänen olisi järkevää maksaa tietopalvelusta.

Yrityksen on ostettava suuri määrä tavaroita joko tänään tai huomenna. Nykyään tuotteen hinta on 14,5 dollaria per yksikkö. Yrityksen mukaan huomenna sen hinta on yhtä suurella todennäköisyydellä joko 10 tai 20 dollaria. Olkoon x huomisen hinta, jolloin pre-todennäköisyydet ovat

Viimeisessä vaiheessa tarkistetaan a priori todennäköisyyksien valinnan luotettavuus markkinaolosuhteiden esiintymiselle ja lasketaan näiden todennäköisyyksien jalostamisen odotettu hyöty. Tätä varten rakennetaan päätöspuu. Jos lisämarkkinatutkimusta tarvitaan, on suositeltavaa keskeyttää valitun uuden tuoteversion käyttöönotto, kunnes saadaan luotettavampia tuloksia.

Yrityksen markkinointikäytännössä on usein tarpeen verrata osittaisen (epätäydellisen) tiedon hankinnan kustannuksia ja uuden lisätiedon hankintakustannuksia paremman päätöksen tekemiseksi. Esimiehen (DM) tulee arvioida, kuinka paljon lisätiedon hyöty kattaa sen hankkimisesta aiheutuvat kustannukset. Tässä tapauksessa voidaan soveltaa Bayesin päätösteoriaa. Lähtötiedot ovat markkinatilan Z ilmaantumisen a priori todennäköisyydet P(Sk) ja ehdolliset todennäköisyydet P(Z Sk), edellyttäen, että tilan 5A esiintyminen oletetaan. Kun uutta tietoa saadaan, lasketaan kunkin strategian odotettu hyöty ja valitaan sitten se strategia, jolla on odotetun hyödyn maksimiarvo. Uuden tiedon avulla päätöksentekijä voi korjata a priori todennäköisyydet P(Sk), mikä on erittäin tärkeää päätöksiä tehtäessä.

Nyt on toivottavaa selvittää, mikä on objektiivisen tilan Sk ilmaantumisen todennäköisyys, kun uutta tietoa saadaan. Siten on löydettävä P(Sk Z), jossa k,q = 1,p. Tämä on ehdollinen todennäköisyys ja se on tarkennettu ennakkotodennäköisyys. P(Sk Z) laskemiseen käytetään Bayesin kaavaa

Olemme siis saaneet tarkennetut a priori todennäköisyydet objektiivisten markkinaolosuhteiden ilmaantuvuudelle. Koko laskentaprosessi ja saadut tulokset on esitetty taulukossa. 9.11 ja 9.12.

Bayesin lähestymistavan (6.47) käyttö edellyttää a priori todennäköisyyksien ja todennäköisyysjakauman tiheyksien tuntemista.

AGC:stä saatujen kohteiden numeeristen ominaisuuksien avulla suoritimme standardin lineaarisen monidiskriminanttianalyysin samoilla (vastaa 33 %) a priori todennäköisyyksillä kuulua elementtiin. ryhmiä. 41 % tapausten kokonaismäärästä luokiteltiin oikein, mikä on hieman parempi kuin 33 %:n tarkkuus, joka saataisiin kohdistamalla kohde satunnaisesti yhteen tai toiseen ryhmään. Tab. 8.6 alla on virheluokitustaulukko, jota kutsutaan myös virhematriisiksi.

Seuraava ongelma on standardin kehittäminen testausta varten. Useimmissa tapauksissa MDA-mallien arvioimiseksi otetaan pieni määrä näytteitä, mikä lisää todennäköisyyttä, että malli sopii liian lähelle testidataa. Otokset sisältävät yleensä yhtä paljon konkurssiin menneitä ja ei-konkuroituneita yrityksiä, ja itse tiedot vastaavat pääsääntöisesti intensiivisten konkurssien jaksoja. Tästä voidaan päätellä, että vain mallin arvioinnin tulokset uudella tiedolla ovat luotettavia. Taulukosta. Kuva 9.1 osoittaa, että jopa edullisimmissa testeissä uusilla tiedoilla (kun kaikki esimerkit on otettu samalta ajanjaksolta ja lisäksi homogeenisiä toimialoittain ja yrityskoon suhteen) laatu on huonompi kuin näytteillä, joista malli on otettu. parametrit määritettiin. Koska käytännössä luokittelumallien käyttäjät eivät pysty virittämään mallia muihin konkurssiprioreihin, yrityksen kokoon tai toimialaan, mallin todellinen laatu voi olla vieläkin huonompi. Laatu voi heikentyä myös sen vuoksi, että MDA-mallien testaamiseen käytetyissä näytteissä on vähän yrityksiä, jotka eivät ole konkurssissa, mutta ovat vaarassa. Jos tällaisia ​​selviytyviä yrityksiä on vain neljä tai viisi, tämä vääristää riskiyritysten todellista osuutta ja seurauksena tyypin 2 virheiden esiintymistiheys aliarvioituu.

Vertailussa mukana olleet MDA-menetelmät laskettiin ja optimoitiin perustuen väärien signaalien osuuteen 10 1 tietyillä a priori todennäköisyyksillä ja virhekustannusten perusteella. Ennakkokriteerinä haluaisimme käyttää alle 10 prosenttia mahdollisista konkursseista väestöstä, mutta tämä ei sovi mallien parametreihin. Se on myös ristiriidassa sen käytännön kanssa, että kynnyksen alentaminen alle 10 prosentin tason ei johtanut konkurssiin. Joten kun väärien signaalien osuus leikattiin 7 prosenttiin, Taffler Z -asteikko lopetti konkurssien tunnistamisen kokonaan ja Datastream-malli törmäsi tähän esteeseen noin 8 prosentissa. Sen sijaan hermoverkko tunnisti kaksi konkurssia alle 4,5 %:n erotustason, ts. verkko pystyy toimimaan olosuhteissa, joissa yhdelle oikealle konkurssitunnisteelle on vain viisi väärää signaalia. Tämä on verrattavissa MDA-mallien parhaisiin tuloksiin paljon vähemmän vaativissa jälkitesteissä. Tästä seuraa kaksi johtopäätöstä: ensinnäkin hermomallit ovat luotettava luokittelumenetelmä luottoalalla, ja toiseksi osakekurssin käyttäminen tavoitemuuttujana koulutuksessa voi olla hyödyllisempää kuin itse konkurssi/selviytymisindikaattori. Osakkeen hinta heijastaa

Ks. Kuvat 3-5 kuvaavat tulevien tapahtumien mieltymysten (painojen) skaalausmenetelmiä, kvantitatiivisia arvioita paremmuusasteesta ja voimme laskea minkä tahansa otostuloksen ehdottoman todennäköisyyden.

I. Ehdolliset todennäköisyydet. Aikaisempi ja jälkikäteen todennäköisyys. 3

II Itsenäiset tapahtumat. 5

III Tilastollisten hypoteesien testaus. Tilastollinen validiteetti. 7

IV. Khin-neliötestin käyttäminen 19

1. Taajuusjoukon ja todennäköisyysjoukon välisen eron luotettavuuden määrittäminen. 19

2. Useiden taajuusjoukkojen välisen eron luotettavuuden määrittäminen. 26

YKSILÖTEHTÄVÄ 33

Oppitunti #2

  1. Ehdolliset todennäköisyydet. Aikaisempi ja jälkikäteen todennäköisyys.

Satunnaismuuttuja annetaan kolmella objektilla: alkeistapahtumien joukko, tapahtumajoukko ja tapahtumien todennäköisyys. Arvoja, jotka satunnaismuuttuja voi saada, kutsutaan alkeellisia tapahtumia. Alkeistapahtumien joukkoja kutsutaan Tapahtumat. Numeerisille ja muille ei kovin monimutkaisille satunnaismuuttujille mikä tahansa konkreettisesti annettu alkeistapahtumien joukko on tapahtuma.

Otetaan esimerkki: nopan heittäminen.

Yhteensä on 6 perustapahtumaa: "piste", "2 pistettä", "3 pistettä" ... "6 pistettä". Tapahtuma - mikä tahansa alkeistapahtumien joukko, esimerkiksi "parillinen" - alkeistapahtumien summa "2 pistettä", "4 pistettä" ja "6 pistettä".

Minkä tahansa alkeistapahtuman P(A) todennäköisyys on 1/6:

tapahtuman todennäköisyys on siihen sisältyvien alkeistapahtumien lukumäärä jaettuna kuudella.

Melko usein tunnetun tapahtuman todennäköisyyden lisäksi on jotain lisätietoa, joka muuttaa tätä todennäköisyyttä. Esimerkiksi potilaiden kuolleisuus. sairaalaan akuutin verenvuoto mahahaava, on noin 10%. Jos potilas on kuitenkin yli 80-vuotias, tämä kuolleisuus on 30 %.

Tällaisten tilanteiden kuvaamiseksi ns ehdolliset todennäköisyydet. Ne on merkitty P(A/B) ja lukevat "tapahtuman A tietyn tapahtuman B todennäköisyys". Ehdollisen todennäköisyyden laskemiseen käytetään kaavaa:

Palataanpa edelliseen esimerkkiin:

Anna sairaalaan otettujen potilaiden joukossa akuutti verenvuoto mahahaava 20% - yli 80-vuotiaita potilaita. Lisäksi kaikista potilaista kuolleiden yli 80-vuotiaiden potilaiden osuus on 6 % (muista, että osuus kaikista kuolemista on 10 %). Tässä tapauksessa

Ehdollisia todennäköisyyksiä määriteltäessä termejä käytetään usein a priori(kirjaimellisesti - kokea) ja a posteriori(kirjaimellisesti - kokemuksen jälkeen) todennäköisyyksiä.

Ehdollisten todennäköisyyksien avulla yhdestä todennäköisyydestä voidaan laskea muita, esimerkiksi vaihtamalla tapahtuma ja ehto.

Tarkastellaan tätä tekniikkaa käyttämällä esimerkkiä, jossa analysoidaan reumakuumeriskin (reumakuume) ja yhden sen riskitekijän antigeenin välistä suhdetta.

Reumakuumeen ilmaantuvuus on noin 1 %. Merkitsemme reuman esiintymistä R +:lla, kun taas P(R +) = 0,01.

Antigeenin läsnäolo merkitään A+:lla. Sitä esiintyy 95 %:lla reumapotilaista ja 6 %:lla henkilöistä, jotka eivät kärsi reumasta. Merkinnöissämme nämä ovat: ehdolliset todennäköisyydet P (A + / R +) \u003d 0,95 ja P (A + / R -) \u003d 0,06.

Näiden kolmen todennäköisyyden perusteella määritämme peräkkäin muut todennäköisyydet.

Ensinnäkin, jos reuman ilmaantuvuus on P(R+)=0,01, niin todennäköisyys olla sairastumatta on P(R-)=1-P(R+)=0,99.

Ehdollisen todennäköisyyden kaavasta löydämme sen

P (A + ja R +) \u003d P (A + / R +) * P (R +) \u003d 0,95 * 0,01 \u003d 0,0095 eli 0,95 % väestöstä kärsii samanaikaisesti reumatismista ja heillä on antigeeni.

samalla lailla

P (A + ja R -) \u003d P (A + / R -) * P (R -) \u003d 0,06 * 0,99 \u003d 0,0594 eli 5,94% väestöstä kantaa antigeeniä, mutta eivät kärsi reumatismista.

Koska kaikilla, joilla on antigeeni, joko on reuma tai he eivät sairastu (mutta ei molempia samanaikaisesti), kahden viimeisen todennäköisyyden summa antaa antigeenin kantamisen tiheyden koko populaatiossa:

P (A +) \u003d P (A + ja R +) + P (A + ja R -) \u003d 0,0095 + 0,0594 \u003d 0,0689

Vastaavasti niiden ihmisten osuus, joilla ei ole antigeeniä, on

P (A -) \u003d 1 - P (A +) \u003d 0,9311

Koska reuman ilmaantuvuus on 1 % ja antigeenia ja reumaa sairastavien osuus on 0,95 %, reumaa sairastavien ja joilla ei ole antigeeniä osuus on:

P (A - ja R +) \u003d P (R +) - P (A + ja R +) \u003d 0,01 - 0,0095 \u003d 0,0005

Nyt siirrymme päinvastaiseen suuntaan siirtymällä tapahtumien todennäköisyyksistä ja niiden yhdistelmistä ehdollisiin todennäköisyyksiin. Alkuperäisen ehdollisen todennäköisyyskaavan mukaan P (A + / R +) \u003d P (R + ja A +) / P (A +) \u003d 0,0095 / 0,0689 0,1379, eli noin 13,8 % antigeeniä käyttävistä henkilöistä sairastuu reumaan kuume. Koska koko väestön ilmaantuvuus on vain 1%, antigeenin havaitseminen lisää reuman todennäköisyyttä 14-kertaiseksi.

Vastaavasti P (R + /A -) \u003d P (R + ja A -) / P (A -) \u003d 0,0005 / 0,9311 0,000054, eli se, että antigeeniä ei havaittu testin aikana, pienenee 19 kertaa todennäköisemmin reumakuume.

Muotoillaan tämä tehtävä Excel-laskentataulukkoon:

Reuman esiintyminen R+

Antigeenin esiintyminen potilailla, joilla on A+

Antigeenin läsnäolo ei-sairaassa A+:ssa

Todennäköisyys, että ei sairastu

P(R-) = 1 - P(R+)

Samaan aikaan he kärsivät reumasta ja heillä on antigeeni

P (A + ja R +) \u003d P (A + / R +) * P (R +)

Ne kantavat antigeeniä, mutta eivät saa reumaa

P (A + ja R -) \u003d P (A + / R -) * P (R -)

Antigeenin kantajataajuus väestössä kokonaisuudessaan

P (A +) \u003d P (A + ja R +) + P (A + ja R -)

Niiden ihmisten osuus, joilla ei ole antigeeniä

P (A -) \u003d 1 - P (A +)

Niiden ihmisten osuus, joilla on reumakuume, joilla ei ole antigeeniä

P (A - ja R +) \u003d P (R +) - P (A + ja R +)

Ihmisille, jotka kantavat antigeeniä, kehittyy reumakuume

P (A + / R +) \u003d P (R + ja A +) / P (A +)

Henkilöt, jotka eivät kanna antigeeniä, eivät kehitä reumaa

P (R + / A -) \u003d P (R + ja A -) / P (A -)

Voit nähdä taulukon rakentamisprosessin picture2\p2-1.gif

Satunnainen tapahtuma arvioidaan numerolla, joka määrittää tämän tapahtuman ilmentymisen intensiteetin. Tätä numeroa kutsutaan todennäköisyys Tapahtumat P() . Alkeistapahtuman todennäköisyys on . Tapahtuman todennäköisyys on objektiivisuuden asteen numeerinen mitta, tämän tapahtuman mahdollisuus. Mitä suurempi todennäköisyys, sitä todennäköisempi tapahtuma.

Mikä tahansa tapahtuma, joka vastaa koko tulosavaruutta S, kutsutaan tietty tapahtuma, eli tapahtuma, jonka täytyy välttämättä tapahtua kokeen seurauksena (esimerkiksi minkä tahansa pistemäärän menetys 1-6 nopana). Jos tapahtuma ei kuulu joukkoon S, niin sitä harkitaan mahdotonta(esimerkiksi pudottamalla noppaa suuremman pistemäärän kuin 6). Mahdottoman tapahtuman todennäköisyys on 0, tietyn tapahtuman todennäköisyys on 1. Kaikkien muiden tapahtumien todennäköisyys on 0-1.

Tapahtumat E Ja nimeltään vastapäätä, Jos E tulee kun ei . Esimerkiksi tapahtuma E– "parillisen pistemäärän menetys", sitten tapahtuma - Pariton määrä pisteitä. Kaksi tapahtumaa E 1 Ja E 2 nimeltään yhteensopimaton jos molemmille tapahtumille ei ole yhteistä tulosta.

Satunnaistapahtumien todennäköisyyksien määrittämiseen käytetään suoria tai epäsuoria menetelmiä. Todennäköisyyttä suoraan laskettaessa erotetaan a priori ja a posteriori laskentakaaviot, kun suorittaa havaintoja (kokeita) tai laskea etukäteen kokeiden lukumäärä m, jossa tapahtuma ilmeni, ja suoritettujen kokeiden kokonaismäärä n. Epäsuorat menetelmät perustuvat aksiomaattiseen teoriaan. Koska tapahtumat määritellään joukoiksi, niille voidaan suorittaa kaikki joukkoteoreettiset operaatiot. Joukkoteorian ja funktionaalisen analyysin ehdotti akateemikko A.N. Kolmogorov ja muodosti perustan aksiomaattiselle todennäköisyysteorialle. Esittelemme todennäköisyyksien aksioomat.

Axiomminä. TapahtumakenttäF(S) on joukkojen algebra.

Tämä aksiooma viittaa joukkoteorian ja todennäköisyysteorian väliseen analogiaan.

AxiomII. Jokaiseen sarjaanalkaenF(S) liittyy reaalilukuon P(), kutsutaan tapahtuman todennäköisyydeksi:

olettaen että S 1 S 2 =  (yhteensopimattomille tapahtumille S 1 Ja S 2 ), tai joukko yhteensopimattomia tapahtumia

Missä N– perustapahtumien määrä (mahdolliset seuraukset).

Satunnaisen tapahtuman todennäköisyys

,

Missä ovat alkeistapahtumien todennäköisyyksiä , sisältyy osajoukkoon .

Esimerkki 1.1. Määritä todennäköisyys saada jokainen numero noppaa heittäessä, saada parillinen luku, numero 4 .

Ratkaisu. Todennäköisyys, että jokainen numero putoaa joukosta

S = (1, 2, 3, 4, 5, 6)
1/6.

Parillisen luvun saamisen todennäköisyys, ts.
={2,
4, 6}, (1.6) perusteella se tulee olemaan P(
) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2
.

Todennäköisyys saada luku  4 , eli
= {4, 5, 6 } ,

P(
) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2.

Tehtävät itsenäiseen työhön

1. Korissa on 20 valkoista, 30 mustaa ja 50 punaista palloa. Määritä todennäköisyys, että ensimmäinen korista vedetty pallo on valkoinen. musta; punainen.

2. Oppilasryhmässä on 12 poikaa ja 10 tyttöä. Millä todennäköisyydellä todennäköisyysteorian seminaari puuttuu: 1) nuori mies; 2) tyttö; 3) kaksi nuorta miestä?

3. Vuoden aikana 51 päivää erottui siitä, että näinä päivinä satoi (tai lunta). Millä todennäköisyydellä joudut sateeseen (tai lumeen): 1) menet töihin; 2) lähdetkö telttailemaan 5 päiväksi?

4. Keksi ongelma tämän tehtävän aiheesta ja ratkaise se.

1.1.3. Jälkimmäisen todennäköisyyden määritelmä (tilastollinen todennäköisyys tai taajuus

satunnainen tapahtuma)

A priori todennäköisyyden määrittämisessä oletettiin, että yhtä todennäköistä. Tämä ei ole läheskään aina totta, useammin tapahtuu niin
klo
. Oletus
johtaa virheeseen a priori määritelmässä P( ) vahvistetun kaavan mukaan. Määrittämistä varten , mutta yleisesti P( ) tehdä kohdennettuja testejä. Tällaisten testien aikana (esimerkiksi testitulokset esimerkeissä 1.2, 1.3) erilaisissa olosuhteissa erilaisissa olosuhteissa, vaikutuksissa, syy-tekijöissä, ts. erilaisissa tapaukset, voi olla erilaisia tuloksia(erilaisia ​​ilmenemismuotoja tutkittavan kohteen tiedosta) Jokainen testitulos vastaa yhtä elementtiä tai yksi alajoukko sarjat S.Jos määrittelet m myönteisten tapahtumien lukumääränä A tuloksena n testit, sitten posteriori todennäköisyys (satunnaistapahtuman tilastollinen todennäköisyys tai esiintymistiheys A)

Perustuu suurten lukujen lakiin A

, n ,

nuo. kokeiden määrän kasvaessa satunnaisen tapahtuman esiintymistiheys (a posteriori eli tilastollinen todennäköisyys) pyrkii tämän tapahtuman todennäköisyyteen.

Esimerkki 1.2. Tapauskaavion mukaan määritetty todennäköisyys saada hännät, kun kolikkoa heitetään, on 0,5. On tarpeen heittää kolikkoa 10, 20, 30 ... kertaa ja määrittää satunnaisten tapahtumien loppujen taajuus jokaisen koesarjan jälkeen.

Ratkaisu. K. Poisson heitti kolikon 24 000 kertaa, kun taas hännät putosivat 11 998 kertaa. Sitten kaavan (1.7) mukaan todennäköisyys saada häntää

.

Tehtävät itsenäiseen työhön

    Perustuu laajaan tilastoaineistoon ( n ) saatiin venäjän aakkosten yksittäisten kirjainten ja välilyönnin () esiintymistodennäköisyyksien arvot teksteissä, jotka on esitetty taulukossa 1.1.

Taulukko 1.1. Aakkosten kirjainten esiintymisen todennäköisyys tekstissä

Ota sivu mitä tahansa tekstiä ja määritä sivun eri kirjainten esiintymistiheys. Kasvata testien laajuutta kahdelle sivulle. Vertaa saatuja tuloksia taulukon tietoihin. Tee johtopäätös.

    Maaleja ammuttaessa saatiin seuraava tulos (katso taulukko 1.2).

Taulukko 1.2. Tavoiteammuntatulos

Millä todennäköisyydellä maaliin olisi osunut ensimmäisestä laukauksesta, jos se olisi kooltaan pienempi kuin "kymmenen", "yhdeksän" jne.?

3. Suunnittele ja suorita samanlaisia ​​testejä muille tapahtumille. Esittele heidän tulokset.



 


Lukea:



Tarot-kortin tulkinta paholainen parisuhteessa Mitä lassopaholainen tarkoittaa

Tarot-kortin tulkinta paholainen parisuhteessa Mitä lassopaholainen tarkoittaa

Tarot-kortit antavat sinun löytää vastauksen jännittävään kysymykseen. He voivat myös ehdottaa oikeaa päätöstä vaikeassa tilanteessa. Oppimista riittää...

Ympäristöskenaariot kesäleirien tietokilpailuihin kesäleirillä

Ympäristöskenaariot kesäleirien tietokilpailuihin kesäleirillä

Satukilpailu 1. Kuka lähetti tällaisen sähkeen: "Pelasta minut! Auta! Harmaa susi söi meidät! Mikä on tämän sadun nimi? (Lapset, "Susi ja...

Yhteisprojekti "Työ on elämän perusta"

Kollektiivinen projekti

A. Marshallin määritelmän mukaan työ on "mitä tahansa henkistä ja fyysistä ponnistelua, joka suoritetaan osittain tai kokonaan tarkoituksena saavuttaa...

Tee-se-itse lintujen syöttölaite: valikoima ideoita Lintujen ruokinta kenkälaatikosta

Tee-se-itse lintujen syöttölaite: valikoima ideoita Lintujen ruokinta kenkälaatikosta

Oman lintujen syöttölaitteen tekeminen ei ole vaikeaa. Talvella linnut ovat suuressa vaarassa, niitä on ruokittava. Tätä varten ihminen ...

syötteen kuva RSS