bahay - Mga pintuan
Diagnosis at paggamot ng talamak na ischemic na sakit sa puso Diagnosis ng talamak na ischemic na sakit sa puso (bahagi 2). Naunang posibilidad Mga pamamaraan para sa pagtatantya ng naunang posibilidad

Ang pangangatwiran na nakabatay lamang sa mga tiyak na katotohanan at tumpak na mga hinuha mula sa mga katotohanang iyon ay tinatawag na mahigpit na pangangatwiran. Sa mga kaso kung saan ang mga hindi tiyak na katotohanan ay dapat gamitin upang gumawa ng mga desisyon, ang mahigpit na pangangatwiran ay nagiging hindi angkop. Samakatuwid, ang isa sa mga pinakadakilang lakas ng anumang sistema ng eksperto ay ang kakayahang bumuo ng pangangatwiran sa ilalim ng mga kondisyon ng kawalan ng katiyakan bilang matagumpay na ginagawa ng mga eksperto ng tao. Ang ganitong pangangatwiran ay hindi mahigpit. Maaari naming ligtas na pag-usapan ang tungkol sa presensya malabo na lohika.

Kawalang-katiyakan, at bilang kinahinatnan, ang malabo na lohika ay maaaring ituring bilang isang kakulangan ng sapat na impormasyon para sa paggawa ng desisyon. Ang kawalan ng katiyakan ay nagiging problema dahil maaari itong hadlangan ang paglikha ng pinakamahusay na solusyon at maging sanhi ng hindi magandang solusyon na matagpuan. Dapat tandaan na ang isang mataas na kalidad na solusyon na natagpuan sa real time ay madalas na itinuturing na mas katanggap-tanggap kaysa sa isang mas mahusay na solusyon na tumatagal ng mahabang panahon upang makalkula. Halimbawa, ang pagkaantala sa paggamot upang payagan ang karagdagang pagsusuri ay maaaring magresulta sa pagkamatay ng pasyente bago tumanggap ng paggamot.

Ang dahilan ng kawalan ng katiyakan ay ang pagkakaroon ng iba't ibang mga pagkakamali sa impormasyon. Pinasimpleng pag-uuri Ang mga error na ito ay maaaring ipakita sa kanilang paghahati sa mga sumusunod na uri:

  • kalabuan ng impormasyon, ang paglitaw nito ay dahil sa ang katunayan na ang ilang impormasyon ay maaaring bigyang-kahulugan sa iba't ibang paraan;
  • hindi kumpletong impormasyon dahil sa kakulangan ng ilang partikular na data;
  • kakulangan ng impormasyon dahil sa paggamit ng data na hindi tumutugma sa totoong sitwasyon (mga posibleng dahilan ay mga subjective na pagkakamali: kasinungalingan, maling impormasyon, malfunction ng kagamitan);
  • mga error sa pagsukat na lumitaw dahil sa hindi pagsunod sa mga kinakailangan para sa kawastuhan at katumpakan ng mga pamantayan para sa dami ng presentasyon ng data;
  • mga random na error, ang pagpapakita kung saan ay mga random na pagbabagu-bago sa data na nauugnay sa kanilang average na halaga (ang dahilan ay maaaring: hindi mapagkakatiwalaan ng kagamitan, Brownian motion, thermal effect, atbp.).

Ngayon, ang isang makabuluhang bilang ng mga teorya ng kawalan ng katiyakan ay nabuo, na nagtatangkang alisin ang ilan o maging ang lahat ng mga pagkakamali at magbigay ng maaasahang lohikal na hinuha sa ilalim ng mga kondisyon ng kawalan ng katiyakan. Ang mga teoryang pinakakaraniwang ginagamit sa pagsasanay ay ang mga batay sa klasikal na kahulugan ng probabilidad at sa posterior probability.

Ang isa sa mga pinakaluma at pinakamahalagang tool para sa paglutas ng mga problema sa artificial intelligence ay probabilidad. Probability ay isang quantitative na paraan ng accounting para sa kawalan ng katiyakan. Ang klasikal na posibilidad ay nagmula sa isang teorya na unang iminungkahi nina Pascal at Fermat noong 1654. Simula noon, maraming gawain ang nagawa sa larangan ng probabilidad at ang pagpapatupad ng maraming aplikasyon ng probabilidad sa agham, teknolohiya, negosyo, ekonomiya at iba pang larangan.

Classical na posibilidad

Classical na posibilidad tinatawag ding priori probability, dahil nalalapat ang kahulugan nito sa mga ideal na sistema. Ang terminong "a priori" ay tumutukoy sa isang posibilidad na tinutukoy "sa mga kaganapan," nang hindi isinasaalang-alang ang maraming mga kadahilanan na nangyayari sa totoong mundo. Ang konsepto ng isang priori probability ay umaabot sa mga kaganapang nagaganap sa mga ideal na sistema na madaling masira o ang impluwensya ng ibang mga sistema. Sa isang perpektong sistema, ang paglitaw ng alinman sa mga kaganapan ay nangyayari sa parehong paraan, na ginagawang mas madali ang kanilang pagsusuri.

Ang pangunahing pormula ng klasikal na posibilidad (P) ay tinukoy bilang mga sumusunod:

Sa formula na ito W- ang bilang ng mga inaasahang kaganapan, at N- ang kabuuang bilang ng mga kaganapan na may pantay na probabilidad na posibleng resulta ng isang eksperimento o pagsubok. Halimbawa, ang posibilidad na makakuha ng anumang panig ng isang anim na panig na die ay 1/6, at ang posibilidad ng pagguhit ng anumang card mula sa isang deck na naglalaman ng 52 magkakaibang card ay 1/52.

Axioms of probability theory

Ang isang pormal na teorya ng probabilidad ay maaaring malikha batay sa tatlong axioms:

Ang mga axiom sa itaas ay naging posible upang ilatag ang pundasyon ng teorya ng probabilidad, ngunit hindi nila isinasaalang-alang ang posibilidad ng mga kaganapan na nagaganap sa tunay na mga sistemang hindi mainam. Sa kaibahan sa isang priori na diskarte, sa mga tunay na sistema, upang matukoy ang posibilidad ng ilang kaganapan P(E), ang isang paraan ay ginagamit upang matukoy ang pang-eksperimentong probabilidad bilang limitasyon sa pamamahagi ng dalas:

Posterior probabilidad

Sa formula na ito f(E) nagsasaad ng dalas ng paglitaw ng ilang kaganapan sa pagitan N-bilang ng mga obserbasyon ng pangkalahatang mga resulta. Ang ganitong uri ng posibilidad ay tinatawag din posterior probability, ibig sabihin. natukoy ang posibilidad "pagkatapos ng mga kaganapan". Ang batayan para sa pagtukoy ng posterior probability ay ang pagsukat ng dalas kung saan ang isang kaganapan ay nangyayari sa isang malaking bilang ng mga pagsubok. Halimbawa, ang pagtukoy sa uri ng panlipunan ng isang karapat-dapat na kliyente sa bangko batay sa karanasang empirikal.

Maaaring makaimpluwensya sa isa't isa ang mga kaganapang hindi eksklusibo sa isa't isa. Ang ganitong mga kaganapan ay inuri bilang kumplikado. Ang posibilidad ng mga kumplikadong kaganapan ay maaaring kalkulahin sa pamamagitan ng pagsusuri sa kanilang mga kaukulang sample space. Ang mga sample na puwang na ito ay maaaring katawanin gamit ang mga Venn diagram, tulad ng ipinapakita sa Fig. 1

Fig. 1 Sample na espasyo para sa dalawang hindi magkaparehong eksklusibong mga kaganapan

Ang posibilidad ng paglitaw ng kaganapan A, na tinutukoy na isinasaalang-alang ang katotohanan na ang kaganapan B ay naganap, ay tinatawag na kondisyon na posibilidad at ipinahiwatig P(A|B). Ang kondisyong posibilidad ay tinukoy bilang mga sumusunod:

Naunang posibilidad

Sa formula na ito, ang posibilidad P(B) hindi dapat katumbas ng zero, at kumakatawan sa isang priori probability na natutukoy bago malaman ang iba pang karagdagang impormasyon. Naunang posibilidad, na ginagamit na may kaugnayan sa paggamit ng conditional probability, kung minsan ay tinatawag na absolute probability.

Mayroong isang problema na mahalagang kabaligtaran ng problema ng pagkalkula ng kondisyon na posibilidad. Binubuo ito sa pagtukoy ng kabaligtaran na posibilidad, na nagpapakita ng posibilidad ng isang nakaraang kaganapan na isinasaalang-alang ang mga kaganapang naganap sa hinaharap. Sa pagsasagawa, ang ganitong uri ng posibilidad ay madalas na nangyayari, halimbawa, sa panahon ng mga medikal na diagnostic o mga diagnostic ng kagamitan, kung saan natukoy ang ilang mga sintomas, at ang gawain ay upang makahanap ng isang posibleng dahilan.

Upang malutas ang problemang ito, gamitin Teorama ni Bayes, na ipinangalan sa ika-18 siglong British mathematician na si Thomas Bayes. Ang teoryang Bayesian ay malawakang ginagamit ngayon upang pag-aralan ang mga puno ng desisyon sa ekonomiya at agham panlipunan. Ang paraan ng paghahanap ng solusyon sa Bayesian ay ginagamit din sa sistema ng ekspertong PROSPECTOR kapag tinutukoy ang mga promising site para sa paggalugad ng mineral. Ang sistema ng PROSPECTOR ay nakakuha ng malawak na katanyagan bilang ang unang ekspertong sistema sa tulong kung saan natuklasan ang isang mahalagang molibdenum na deposito, na nagkakahalaga ng $100 milyon.

C7 Sa modernong anyo nito, ang theorem ni Bayes ay aktwal na binuo ni Laplace. Si Thomas Bayes ay responsable para sa pagbabalangkas ng problema mismo. Binumula niya ito bilang kabaligtaran ng sikat na problemang Bernoulli. Kung hinahanap ni Bernoulli ang posibilidad ng iba't ibang resulta ng paghagis ng isang "baluktot" na barya, kung gayon ang Bayes, sa kabaligtaran, ay naghangad na matukoy ang antas ng "kurbada" na ito mula sa empirikal na naobserbahang mga resulta ng paghagis ng barya. Walang priori probability sa kanyang desisyon.  


Kahit na ang panuntunan ay mukhang napaka-simple, mahirap ilapat ito sa pagsasanay, dahil ang posterior probabilities (o kahit na ang mga halaga ng pinasimple na mga function ng desisyon) ay maaaring hindi alam. Ang kanilang mga halaga ay maaaring matantya. Sa bisa ng teorama ni Bayes, ang posterior probabilities ay maaaring ipahayag sa pamamagitan ng naunang probabilities at density functions gamit ang formula Р С, Iх = Р С, (Р(х I С, / Р Су Р xI С,  

Ang pagsusuri sa mga resulta ng pag-uuri gamit ang paraan ng MDA, nakikita namin ang isang makabuluhang proporsyon ng mga maling desisyon tungkol sa mga bangkarota na kumpanya (pangkat 1) - ang isa sa kanila ay nabigyan ng pautang. Ang mga kumpanyang may hindi malinaw na posisyon (pangkat 2) ay mahirap na maayos na maiuri dahil maaari silang mapunta sa pangkat 1 o 3. Ang bagay ay hindi maaaring mapabuti sa pamamagitan ng pagdadala ng mga naunang probabilidad sa linya sa mga paniniwala ng bangko tungkol sa posibilidad ng kumpanya na kabilang sa iba't ibang grupo. Ang kabuuang rate ng katumpakan ng hula ay 56.6% lamang, at 30% lamang ng pangkat 1 ang wastong inuri.  

Dahil sa kasalukuyang antas ng pagiging kumplikado at pagkakasabay ng mga patuloy na proseso, ang mga modelong batay sa mga ugnayang sanhi ay may mga limitadong posibilidad para sa paggamit ng mga bagong kaganapan na patuloy na nagbabago sa mga pagtutukoy ng lahat ng mga variable (kapwa kasama at hindi kasama sa modelo), at ang mga halaga ng; a priori probabilities and amount of payments for various strategy are very uncertain and fluctuate dramatically with changes in economic growth, interest rates, exchange rates and the profitability of non-lending transactions (halimbawa, mga pagbabago sa transaction fees and commissions).  

Dahil sa totoong sitwasyon, imposibleng malaman nang maaga kung aling bahagi ng mga kumpanyang kinakatawan sa isang random na sample ang mabangkarote sa loob ng isang taon at dahil ang mga may-akda ng dalawang modelong isinasaalang-alang, gaya ng maaaring ipagpalagay, itakda ang mga antas ng paghihiwalay batay sa ilang partikular na pagpapalagay tungkol sa isang priori na probabilidad ng pagkabangkarote at ang halaga ng mga error, pinasimple namin ang pamamaraan ng paghahambing at ipinakilala ang mga kamag-anak na antas ng paghahati. Sa madaling salita, para sa bawat modelo ay isinasaalang-alang namin ang pinakamababang 10% ng mga signal na inilabas ng modelo para sa susunod na taon bilang mga senyales ng pagkabangkarote. Sa katotohanan, ang diskarteng ito ay nangangahulugan ng pangkalahatang 10% na naunang posibilidad ng pagkabangkarote at isang ratio ng bilang ng mga signal ng pagkabangkarote sa mga aktwal na pagkabangkarote sa nakaraang pagsubok, na tinutukoy gamit ang pag-optimize na threshold. Bilang karagdagan, ang pamamaraang ito ay may kalamangan na pinapaliit nito ang mga pagbaluktot na nagreresulta mula sa malaking lag ng oras sa pagitan ng paglalathala ng Altman Z-score at ang pagsasagawa ng eksperimento. Ang mga karaniwang tagapagpahiwatig ay maaaring nagbago sa panahong ito, at samakatuwid ang paghahati ng mga kumpanya sa malakas at mahina, batay sa isang tiyak na proporsyon, ay tila mas maaasahan. Sa mesa Ipinapakita ng talahanayan 9.2 ang mga resulta ng isang eksperimento sa paghula ng mga pagkabangkarote sa isang taon nang maaga, na nagpapahiwatig ng error para sa bawat modelo.  

Isinasaalang-alang ang isang priori probabilidad bilang isang katotohanan, tantyahin ang inaasahang kita sa kaganapan ng pagbubukas ng isang sangay.  

Tukuyin natin sa pamamagitan ng A. ang pangyayari na q b [

Hayaan, halimbawa, piliin ang mga sumusunod na parameter: ang halaga ng mga pamumuhunan sa kapital, ang halaga ng mga gastos sa pagpapatakbo at ang presyo ng mga natapos na produkto, na maaaring ayon sa pagkakabanggit ay kunin ang mga halaga Kb K2, K3 Eb E2, E3 Ts C2, Ts- Ang bawat isa sa mga halagang ito ay tumutugma sa isang tiyak na isang priori na posibilidad, halimbawa, ang Kb Eb C ay may posibilidad na pt = 0.1, para sa K2, E2, C2 ang posibilidad ay magiging p2 = 0.8, at para sa K3, E3, C3 - p3 = 0.1.  

Hayaan ang isang priori na posibilidad na makakuha sa dulo ng proseso ng disenyo ng isang teknikal na solusyon na nakakatugon sa mga kinakailangan  

Kung ang manlalaro 2 ay may higit sa isang diskarte sa laro D at ang mga naunang probabilidad ng kanilang paggamit ay hindi alam ng manlalaro 1 o kahit na walang saysay na pag-usapan ang tungkol sa mga probabilidad na ito, kung gayon ang lahat ng sinabi ay hindi naaangkop.  

Tulad ng nakita natin dati, ang mga pagbabago sa mga naunang probabilidad p at q ay nakasalalay sa mga setting ng signal.  

Ito ay sumusunod na kung mayroon tayong isang risk-neutral na paksa na naniniwala na ang call option ay nagkakahalaga ng C na may probability tg at j na may probability (1 - tg), pagkatapos ay ang paksang ito ay kalkulahin ang kasalukuyang presyo ng opsyon nang buong alinsunod sa equation. nagmula kami. Tandaan na hindi namin kailanman ipinapalagay ang pagkakaroon ng isang priori probabilities ng paglitaw ng isang partikular na presyo ng stock at, nang naaayon, ang hinaharap na pagtatasa ng opsyon. Ang diskarte na nakabalangkas ay tinatawag na risk-neutral na pagtatasa.  

Hayaan tg(

Ang kanang bahagi ng (7.53) ay hindi isang density sa wastong kahulugan, dahil ang integral nito ay hindi tinukoy gayunpaman, kapag kinakalkula ang density ng posterior distribution ng mga parameter gamit ang formula ng Bayes, mga pormal na paghihirap kapag nagtatrabaho sa (7.53) alinman ay hindi bumangon, o sila ay madaling madaig. Tulad ng makikita natin sa ibaba sa seksyon 7.3.2, ang pagpipilian (7.53) ay maginhawa sa analytical na mga termino at, ito ay tila, well sumasalamin sa kumpletong kakulangan ng isang priori kaalaman tungkol sa pamamahagi ng mga parameter. Gayunpaman, talagang itinatago nito ang napakalakas na mga pagpapalagay: ang kawalan ng ugnayan sa pagitan ng mga parameter (hindi ang ugnayan sa pagitan ng mga pagtatantya ng mga halaga ng parameter, na nakasalalay sa distribusyon ng mga regressor at ang halaga ng a), ang hindi gaanong kaliit ng a priori na posibilidad na ang vector ng mga parameter ay namamalagi sa anumang ibinigay na finite volume, anuman ang halaga nito, atbp. Ito minsan ay humahantong sa malubhang kahirapan sa pagbibigay-kahulugan sa mga resulta ng pagtatantya ng Bayesian.  

Isaalang-alang natin ang nilalaman ng teorama ni Bayes mula sa isang bahagyang naiibang pananaw. Para magawa ito, isusulat namin ang lahat ng posibleng resulta ng aming eksperimento. Hayaang ang mga simbolo na H0, h ay nangangahulugan ng kinalabasan: ang barya ay hindi natatakpan at ang tuktok na bahagi nito ay ang coat of arms." Kung tinatantya mo ang isang priori na posibilidad ng paglitaw  

Ako bilang V2i kung gayon ang posibilidad ng tinukoy na kinalabasan ay Va X x1/2=1/4 - Sa ibaba ay nagbibigay kami ng isang listahan ng lahat ng mga resulta at ang kanilang mga naunang probabilidad  

Kaya, sa halimbawa na may isang barya at isang die, ang P(Na) ay ang isang priori na posibilidad, ang P(Na K) ay ang posterior probability, at ang P(Na) ay ang posibilidad.  

Kung ngayon ang naunang probabilidad na P(H0) ay maaaring kunin na katumbas ng alinman sa 1 o 0, ang gumagawa ng desisyon ay sinasabing  

Isipin natin ngayon na nag-aalok ang eksperimento sa gumagawa ng desisyon ng ganap na maaasahan (o kumpletong) impormasyon tungkol sa kung aling partikular na bagay ang hindi sakop. Ang gumagawa ng desisyon ay dapat, gayunpaman, magbayad para sa serbisyo ng pakikipag-usap ng naturang ganap na maaasahang impormasyon bago niya matanggap ang impormasyong ito. Ano ang magiging halaga ng naturang impormasyon? Maaari siyang tumingin sa unahan at tanungin ang kanyang sarili kung ano ang kanyang gagawin bilang tugon sa bawat isa sa dalawang posibleng mensahe na maibibigay ng isang ibinigay na serbisyo, at kalkulahin ang kanyang kita batay sa mga tugon na natanggap. Ang pagtimbang sa kita na ito sa pamamagitan ng mga naunang probabilidad ng mga posibleng mensahe ay magbibigay-daan sa kanya na tantyahin ang halaga ng kanyang inaasahang kita kung magbabayad siya ng isang tiyak na halaga para sa ganap na maaasahang impormasyon bago ito aktwal na matanggap. Dahil ang inaasahang kita na ito ay magiging higit sa $0.5, ibig sabihin, kung ano ang inaasahan niya sa batayan lamang ng isang priori na impormasyon, kung gayon ang pagtaas ng kita ay ang pinakamataas na halaga na makatuwiran para sa kanya na magbayad para sa serbisyo ng impormasyon.  

Ang kumpanya ay dapat bumili ng isang malaking dami ng mga kalakal ngayon o bukas. Ngayon ang presyo ng produkto ay $14.5 kada yunit. Ayon sa kompanya, bukas ang presyo nito ay alinman sa 10 o 20 dolyar na may pantay na posibilidad. Hayaang ipahiwatig ng x ang presyo ng bukas at ang mga naunang probabilidad ay pantay  

Sa huling yugto, ang pagiging maaasahan ng pagpili ng isang priori probabilities ng paglitaw ng mga kondisyon ng merkado ay nasuri at ang inaasahang utility mula sa pagpino sa mga probabilities na ito ay kinakalkula. Para dito, binuo ang isang puno ng desisyon. Kung kinakailangan ang karagdagang pananaliksik sa merkado, inirerekumenda na i-pause ang proseso ng pagpapakilala ng napiling bagong opsyon sa produkto hanggang sa makuha ang mas maaasahang mga resulta.  

Sa mga praktikal na aktibidad sa marketing ng isang kumpanya, madalas na kinakailangan upang ihambing ang mga gastos sa pagkuha ng bahagyang (hindi kumpleto) na impormasyon at ang mga gastos sa pagkuha ng karagdagang bagong impormasyon upang makagawa ng isang mas mahusay na desisyon. Dapat suriin ng manager (DM) kung magkano ang mga benepisyong natanggap mula sa karagdagang impormasyon ay sumasakop sa mga gastos sa pagkuha nito. Sa kasong ito, maaaring ilapat ang teorya ng desisyon ng Bayesian. Ang paunang data ay isang priori probabilities P(Sk) at conditional probabilities P(Z Sk) ng paglitaw ng market state Z, sa kondisyon na ang hitsura ng state 5A ay ipinapalagay. Kapag natanggap ang bagong impormasyon, kinakalkula ang inaasahang mga utility ng bawat diskarte, at pagkatapos ay pipiliin ang diskarte na may pinakamataas na inaasahang utility. Sa tulong ng bagong impormasyon, maaaring itama ng gumagawa ng desisyon ang mga naunang probabilidad P(Sk), at ito ay napakahalaga kapag gumagawa ng mga desisyon.  

Ngayon ay kanais-nais na malaman kung ano ang posibilidad ng paglitaw ng layunin ng estado na Sk kapag natanggap ang bagong impormasyon. Kaya, ito ay kinakailangan upang mahanap ang P(Sk Z), kung saan k,q = 1,p. Ito ay isang kondisyon na posibilidad at ito ay isang pinong naunang posibilidad. Upang kalkulahin ang P(Sk Z) ginagamit namin ang formula ng Bayes  

Kaya, nakuha namin ang na-update na priori probabilities ng paglitaw ng layunin ng mga kondisyon ng merkado. Ang buong proseso ng pagkalkula at ang mga resultang nakuha ay ipinapakita sa talahanayan. 9.11 at 9.12.  

Ang paggamit ng Bayesian approach (6.47) ay nangangailangan ng kaalaman sa mga naunang probabilidad at probability distribution density.  

Gamit ang mga numerical na katangian ng mga bagay na nakuha mula sa PCA, nagsagawa kami ng standard linear multiple discriminant analysis na may parehong (katumbas ng 33%) na priori probabilities ng element membership. mga pangkat. 41% ng kabuuang bilang ng mga kaso ang wastong inuri, at ito ay bahagyang mas mahusay kaysa sa 33% na katumpakan na nakuha sana sa pamamagitan ng random na pagtatalaga ng isang bagay sa isang grupo o iba pa. mesa 8.6 sa ibaba ay isang talahanayan ng mga maling pag-uuri, na tinatawag ding error matrix.  

Ang susunod na problema ay ang pagbuo ng isang pamantayan para sa pagsubok. Karamihan sa mga modelo ng MDA ay sinusuri gamit ang isang maliit na bilang ng mga sample, na nagpapataas ng posibilidad na ang modelo ay mag-overfit sa data ng pagsubok. Ang mga sample ay karaniwang naglalaman ng pantay na halo ng mga bangkarota at hindi nabangkarote na kumpanya, at ang data mismo ay may posibilidad na tumutugma sa mga panahon ng matinding pagkabangkarote. Ito ay humahantong sa konklusyon na tanging ang mga resulta ng pagsusuri ng modelo sa bagong data ang maaasahan. Mula sa mesa Ipinapakita ng 9.1 na kahit na sa pinakakanais-nais na mga pagsubok na may bagong data (kapag ang lahat ng mga halimbawa ay kinuha mula sa parehong yugto ng panahon at, bukod dito, homogenous sa mga tuntunin ng mga industriya at laki ng negosyo), ang kalidad ay mas masahol kaysa sa mga sample kung saan ang mga parameter ng modelo ay determinado. Dahil sa pagsasagawa ng mga gumagamit ng mga modelo ng pag-uuri ay hindi magagawang ibagay ang modelo sa iba pang mga naunang probabilidad ng pagkabangkarote, laki ng kompanya, o industriya, ang aktwal na kalidad ng modelo ay maaaring mas malala pa. Ang kalidad ay maaari ding lumala dahil sa katotohanan na ang mga sample na ginamit upang subukan ang mga modelo ng MDA ay naglalaman ng ilang mga kumpanya na hindi nabigo ngunit nasa panganib. Kung mayroon lamang apat o limang ganoong peligrosong nabubuhay na mga kumpanya, kung gayon, binabaluktot nito ang tunay na bahagi ng mga peligrosong kumpanya, at bilang resulta, ang dalas ng mga error sa uri 2 ay minamaliit.  

Ang mga pamamaraan ng MDA na kasangkot sa paghahambing ay kinakalkula at na-optimize batay sa isang maling rate ng signal na 10 1 na may ilang mga naunang probabilidad at ang halaga ng mga error. Gusto kong gamitin bilang ex ante criterion ang bilang ng mga potensyal na bangkarota sa populasyon na mas mababa sa 10 porsiyento, ngunit hindi ito angkop sa mga parameter ng mga modelo. Taliwas din ito sa kaugalian kung saan ang pagbaba ng threshold sa ibaba ng 10 porsiyentong antas ay hindi humantong sa pagkabangkarote. Kaya, nang ang proporsyon ng mga maling signal ay pinutol sa 7%, ang Taffler Z-score ay tumigil sa pagtukoy ng mga pagkabangkarote nang buo, at ang Datastream na modelo ay nakatagpo ng balakid na ito sa humigit-kumulang 8%. Sa kabaligtaran, kinilala ng neural network ang dalawang kaso ng pagkabangkarote sa ibaba ng antas ng cutoff na 4.5%, i.e. Ang network ay maaaring gumana sa mga kondisyon kung saan mayroon lamang limang maling signal sa bawat tamang pagkakakilanlan ng bangkarota. Ang figure na ito ay maihahambing sa pinakamahusay na mga resulta na nakuha ng mga modelo ng MDA sa hindi gaanong hinihingi na mga pagsusulit sa ex post. Dalawang konklusyon ang sumusunod mula dito: una, ang mga neural na modelo ay isang maaasahang paraan ng pag-uuri sa industriya ng kredito, at pangalawa, ang paggamit ng presyo ng stock bilang target na variable sa pagsasanay ay maaaring mas kumikita kaysa sa mismong bankruptcy/survival indicator. Ang presyo ng pagbabahagi ay sumasalamin  

Sa ch. Ang 3-5 ay naglalarawan ng mga pamamaraan para sa pag-scale ng mga kagustuhan (mga timbang) para sa mga kaganapan sa hinaharap, mga quantitative na pagtatantya ng antas ng kagustuhan, at maaari naming kalkulahin ang walang kondisyong posibilidad ng anumang sample na resulta  

I. Mga probabilidad na may kondisyon. Bago at posterior na posibilidad. 3

II.Malayang pangyayari. 5

III.Pagsubok ng mga istatistikal na hypotheses. Kahalagahan ng istatistika. 7

IV.Paggamit ng chi-square test 19

1. Pagtukoy sa pagiging maaasahan ng pagkakaiba sa pagitan ng isang set ng mga frequency at isang set ng mga probabilities. 19

2. Pagpapasiya ng pagiging maaasahan ng pagkakaiba sa pagitan ng ilang hanay ng mga frequency. 26

MATINDING GAWAIN 33

Aralin Blg. 2

  1. Mga probabilidad na may kondisyon. Bago at posterior na posibilidad.

Ang isang random na variable ay tinukoy ng tatlong bagay: isang set ng elementarya na mga kaganapan, isang set ng mga kaganapan, at isang posibilidad ng mga kaganapan. Ang mga halaga na maaaring kunin ng isang random na variable ay tinatawag mga pangyayari sa elementarya. Tinatawag ang mga set ng elementarya na kaganapan mga pangyayari. Para sa numerical at iba pang hindi masyadong kumplikadong random variable, ang anumang partikular na ibinigay na set ng elementarya na mga kaganapan ay isang kaganapan.

Kumuha tayo ng isang halimbawa: paghahagis ng dice.

Mayroong 6 na elementarya na kaganapan sa kabuuan: "puntos", "2 puntos", "3 puntos"... "6 puntos". Kaganapan - anumang hanay ng mga elementarya na kaganapan, halimbawa "kahit" - ang kabuuan ng mga elementarya na kaganapan "2 puntos", "4 puntos" at "6 puntos".

Ang posibilidad ng anumang elementarya na kaganapan P(A) ay 1/6:

ang posibilidad ng isang kaganapan ay ang bilang ng mga elementarya na kaganapan na kasama dito, na hinati sa 6.

Kadalasan, bilang karagdagan sa alam na posibilidad ng isang kaganapan, mayroong ilang karagdagang impormasyon na nagbabago sa posibilidad na ito. Halimbawa, ang pagkamatay ng pasyente. sa mga na-admit sa ospital na may acute bleeding gastric ulcer ay humigit-kumulang 10%. Gayunpaman, kung ang pasyente ay higit sa 80 taong gulang, ang dami ng namamatay na ito ay 30%.

Upang ilarawan ang mga ganitong sitwasyon, ang tinatawag na mga kondisyon na probabilidad. Ang mga ito ay tinukoy bilang P(A/B) at binasa ang "probalidad ng kaganapan A ibinigay na kaganapan B." Upang kalkulahin ang kondisyong posibilidad, ginagamit ang formula:

Bumalik tayo sa nakaraang halimbawa:

Ipagpalagay na sa mga pasyenteng na-admit sa ospital na may talamak na pagdurugo ng gastric ulcer, 20% ay mga pasyenteng higit sa 80 taong gulang. Bukod dito, sa lahat ng mga pasyente, ang proporsyon ng mga namatay na pasyente na higit sa 80 taong gulang ay 6% (tandaan na ang proporsyon ng lahat ng pagkamatay ay 10%). Sa kasong ito

Kapag tinutukoy ang mga probabilidad na may kondisyon, kadalasang ginagamit ang mga termino isang priori(literal – bago ang karanasan) at isang posterior(literal - pagkatapos ng karanasan) posibilidad.

Gamit ang mga probabilidad na may kondisyon, maaari kang gumamit ng isang probabilidad upang kalkulahin ang iba, halimbawa, magpalit ng isang kaganapan at isang kundisyon.

Isaalang-alang natin ang pamamaraang ito gamit ang halimbawa ng pagsusuri sa kaugnayan sa pagitan ng panganib ng rheumatic fever (rheumatic fever) at isa sa mga antigen na isang panganib na kadahilanan para dito.

Ang saklaw ng rayuma ay tungkol sa 1%. Tukuyin natin ang pagkakaroon ng rayuma bilang R +, habang ang P(R +) = 0.01.

Ang pagkakaroon ng antigen ay itatalaga bilang A +. Ito ay matatagpuan sa 95% ng mga pasyenteng may rayuma at sa 6% ng mga taong hindi nagdurusa sa rayuma. Sa aming notasyon ang mga ito ay: conditional probabilities P(A + /R +) = 0.95 at P(A + /R -) = 0.06.

Batay sa tatlong probabilities na ito, sunud-sunod nating tutukuyin ang iba pang probabilities.

Una sa lahat, kung ang insidente ng rayuma ay P(R +) = 0.01, ang posibilidad na hindi magkasakit ay P(R -) = 1-P(R +) = 0.99.

Mula sa pormula para sa kondisyon na posibilidad ay makikita natin iyon

P(A + andR +) = P(A + /R +) * P(R +) = 0.95*0.01 = 0.0095, o 0.95% ng populasyon ay parehong dumaranas ng rayuma at may antigen.

Ganun din

P(A + andR -) = P(A + /R -) * P(R -) = 0.06*0.99 = 0.0594, o 5.94% ng populasyon ang nagdadala ng antigen, ngunit hindi nagdurusa sa rayuma.

Dahil ang lahat na may antigen ay maaaring nagdurusa sa rayuma o hindi nagdurusa sa rayuma (ngunit hindi pareho sa parehong oras), ang kabuuan ng huling dalawang probabilidad ay nagbibigay ng dalas ng pagdadala ng antigen sa populasyon sa kabuuan:

P(A +)= P(A + andR +) + P(A + andR -) = 0.0095 + 0.0594 = 0.0689

Alinsunod dito, ang proporsyon ng mga taong walang antigen ay katumbas ng

P(A -)=1- P(A +) = 0.9311

Dahil ang saklaw ng rayuma ay 1%, at ang proporsyon ng mga taong may antigen at dumaranas ng rayuma ay 0.95%, kung gayon ang proporsyon ng mga taong may rayuma at walang antigen ay katumbas ng:

P(A - andR +) = P(R +) - P(A + andR +) = 0.01 – 0.0095 = 0.0005

Ngayon ay lilipat tayo sa kabaligtaran na direksyon, lumilipat mula sa mga probabilidad ng mga kaganapan at ang kanilang mga kumbinasyon sa mga probabilidad na may kondisyon. Ayon sa orihinal na conditional probability formula P(A + /R +) = P(R + and A +)/ P(A +) = 0.0095/0.06890.1379, o humigit-kumulang 13.8% ng mga indibidwal na nagdadala ng antigen , ay magkakaroon ng rayuma. . Dahil ang saklaw ng populasyon sa kabuuan ay 1% lamang, ang katotohanan ng pagkilala sa isang antigen ay nagdaragdag ng posibilidad na magkaroon ng rayuma ng 14 na beses.

Katulad nito, ang P(R + /A -) = P(R + atA -)/ P(A -) = 0.0005/0.93110.000054, ibig sabihin, ang katotohanang walang nakitang antigen sa panahon ng pagsusuri ay binabawasan ang posibilidad na magkaroon ng rayuma ay 19 beses.

I-format natin ang gawaing ito sa isang Excel spreadsheet:

Pagkakaroon ng rayuma R+

Ang pagkakaroon ng antigen sa mga pasyente na may A+

Pagkakaroon ng antigen sa mga pasyenteng walang sakit na A+

Ang posibilidad na hindi magkasakit

P(R -)=1- P(R +)

Kasabay nito ay nagdurusa sila sa rayuma at may antigen

P(A + at R +)= P(A + /R +) * P(R +)

Dala nila ang antigen, ngunit hindi nagkakasakit ng rayuma

P(A + at R -)= P(A + /R -) * P(R -)

Dalas ng antigen carriage sa pangkalahatang populasyon

P(A +)= P(A + at R +) + P(A + at R -)

Proporsyon ng mga taong walang antigen

P(A -)=1- P(A +)

Proporsyon ng mga taong may rayuma na walang antigen

P(A - at R +) = P(R +) - P(A + at R +)

Ang mga taong nagdadala ng antigen ay magkakaroon ng rayuma

P(A + /R +)= P(R + at A +)/ P(A +)

Ang mga taong hindi nagdadala ng antigen ay hindi magkakaroon ng rayuma

P(R + /A -)=P(R + at A -)/ P(A -)

Makikita mo ang proseso ng paggawa ng table picture2\p2-1.gif

Ang isang random na kaganapan ay tinasa ng isang numero na tumutukoy sa intensity ng pagpapakita ng kaganapang ito. Ang numerong ito ay tinatawag probabilidad mga pangyayari P() . Ang posibilidad ng isang elementarya na kaganapan - . Ang posibilidad ng isang kaganapan ay isang numerical na sukatan ng antas ng objectivity, ang posibilidad ng kaganapang ito. Kung mas mataas ang posibilidad, mas posible ang kaganapan.

Anumang kaganapan na nag-tutugma sa buong espasyo ng kinalabasan S, tinawag mapagkakatiwalaang kaganapan, ibig sabihin. tulad ng isang kaganapan na bilang isang resulta ng eksperimento ay kinakailangang mangyari (halimbawa, ang pagkawala ng anumang bilang ng mga puntos mula 1 hanggang 6 sa isang dice). Kung ang kaganapan ay hindi kabilang sa set S, pagkatapos ito ay isinasaalang-alang imposible(halimbawa, pag-roll ng numerong mas malaki sa 6 sa isang die). Ang posibilidad ng isang imposibleng kaganapan ay 0, ang posibilidad ng isang tiyak na kaganapan ay 1. Ang lahat ng iba pang mga kaganapan ay may posibilidad mula 0 hanggang 1.

Mga kaganapan E At ay tinatawag kabaligtaran, Kung E darating kapag hindi dumating . Halimbawa, kaganapan E– “pag-roll ng pantay na bilang ng mga puntos”, pagkatapos ay ang kaganapan - "pag-roll ng isang kakaibang bilang ng mga puntos." Dalawang kaganapan E 1 At E 2 ay tinatawag hindi magkatugma, kung walang resultang karaniwan sa parehong mga kaganapan.

Upang matukoy ang mga probabilidad ng mga random na kaganapan, direkta o hindi direktang pamamaraan ay ginagamit. Kapag direktang kinakalkula ang posibilidad, ang isang priori at posterior na mga scheme ng pagkalkula ay nakikilala, kapag magsagawa ng mga obserbasyon (mga eksperimento) o isang priori na bilangin ang bilang ng mga eksperimento m, kung saan nagpakita ang kaganapan, at ang kabuuang bilang ng mga eksperimento na isinagawa n. Ang mga di-tuwirang pamamaraan ay batay sa teoryang axiomatic. Dahil ang mga kaganapan ay tinukoy bilang mga set, lahat ng set-theoretic na operasyon ay maaaring gawin sa kanila. Ang set theory at functional analysis ay iminungkahi ng academician na si A.N. Kolmogorov at nabuo ang batayan ng axiomatic theory of probability. Ipakita natin ang mga axiom ng probabilidad.

Axiomako. Field ng kaganapanF(S) ay isang algebra ng mga set.

Ang axiom na ito ay tumuturo sa pagkakatulad sa pagitan ng set theory at probability theory.

AxiomII. Sa bawat setmula saF(S) ay nauugnay sa isang tunay na numerong P(), na tinatawag na probabilidad ng kaganapan:

Kung ganoon S 1 S 2 = (para sa mga hindi tugmang kaganapan S 1 At S 2 ), o para sa isang hanay ng mga hindi tugmang kaganapan

saan N– ang bilang ng mga elementarya na kaganapan (mga posibleng resulta).

Probability ng isang random na kaganapan

,

saan – mga posibilidad ng mga pangyayari sa elementarya kasama sa subset .

Halimbawa 1.1. Tukuyin ang posibilidad na makuha ang bawat numero kapag naghagis ng die, pagkuha ng even na numero, numero 4 .

Solusyon. Ang posibilidad ng pagbagsak ng bawat numero sa set

S = (1, 2, 3, 4, 5, 6)
1/6.

Ang posibilidad ng pag-roll ng even number, i.e.
={2,
4, 6}, batay sa (1.6) ito ay magiging P(
) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2
.

Probabilidad na makakuha ng numero  4 , ibig sabihin.
= {4, 5, 6 } ,

P(
) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2.

Mga gawain para sa malayang gawain

1. Mayroong 20 puti, 30 itim at 50 pulang bola sa isang basket. Tukuyin ang posibilidad na ang unang bola na nakuha mula sa basket ay magiging puti; itim; pula.

2. Mayroong 12 lalaki at 10 babae sa pangkat ng mag-aaral. Ano ang posibilidad na ang mga sumusunod ay wala sa seminar ng probability theory: 1) isang binata; 2) babae; 3) dalawang binata?

3. Sa panahon ng taon, 51 araw ay nakikilala sa pamamagitan ng katotohanan na sa mga araw na ito umulan (o nag-snow). Ano ang posibilidad na ikaw ay nasa panganib na mahuli sa ulan (o niyebe): 1) pagpunta sa trabaho; 2) magha-hike ng 5 araw?

4. Bumuo ng isang suliranin sa paksa ng takdang-aralin na ito at lutasin ito.

1.1.3. Kahulugan ng posterior probability (statistical probability o frequency

random na kaganapan)

Kapag tinutukoy ang posibilidad ng isang priori, ipinapalagay na pare-pareho ang posibilidad. Ito ay hindi palaging totoo;
sa
. Assumption
humahantong sa isang pagkakamali sa isang priori na pagpapasiya P( ) ayon sa itinatag na pamamaraan. Para sa pagtukoy , at sa pangkalahatang kaso P( ) magsagawa ng mga naka-target na pagsubok. Sa panahon ng naturang mga pagsubok (halimbawa, ang mga resulta ng pagsubok sa mga halimbawa 1.2, 1.3) sa ilalim ng iba't ibang mga kondisyon ng iba't ibang mga kondisyon, impluwensya, sanhi ng mga kadahilanan, i.e. sa iba't ibang kaso, iba-iba kinalabasan(iba't ibang mga pagpapakita ng impormasyon ng bagay na pinag-aaralan). Ang bawat resulta ng pagsubok ay tumutugma sa isang elemento o isang subset set S.Kung tutukuyin natin m bilang ang bilang ng mga paborableng kaganapan A kinalabasan na nagmumula sa n mga pagsusulit, pagkatapos ay ang posterior probability (statistical probability o frequency ng isang random na kaganapan A)

Batay sa batas ng malalaking numero para sa A

, n ,

mga. habang ang bilang ng mga pagsubok ay tumataas, ang dalas ng isang random na kaganapan (posterior, o istatistika, posibilidad) ay may posibilidad sa posibilidad ng kaganapang ito.

Halimbawa 1.2. Natutukoy ng scheme ng mga kaso, ang posibilidad ng mga landing head kapag naghagis ng barya ay 0.5. Kailangan mong maghagis ng barya ng 10, 20, 30... beses at matukoy ang dalas ng random na kaganapan ng mga ulo pagkatapos ng bawat serye ng mga pagsubok.

Solusyon. Si C. Poisson ay naghagis ng barya ng 24,000 beses at dumapo sa mga ulo ng 11,998 beses. Pagkatapos, ayon sa formula (1.7), ang posibilidad ng mga landing head

.

Mga gawain para sa malayang gawain

    Batay sa malaking istatistikal na materyal ( n ) ang mga halaga ng mga posibilidad ng paglitaw ng mga indibidwal na titik ng alpabetong Ruso at espasyo () sa mga teksto ay nakuha, na ibinigay sa Talahanayan 1.1.

Talahanayan 1.1. Ang posibilidad ng paglitaw ng mga titik ng alpabeto sa teksto

Kumuha ng isang pahina ng anumang teksto at tukuyin ang dalas ng paglitaw ng iba't ibang mga titik sa pahinang iyon. Dagdagan ang haba ng mga pagsubok sa dalawang pahina. Ihambing ang mga resulta na nakuha sa data sa talahanayan. Gumuhit ng konklusyon.

    Kapag bumaril sa mga target, ang sumusunod na resulta ay nakuha (tingnan ang Talahanayan 1.2).

Talahanayan 1.2. Target na mga resulta ng pagbaril

Ano ang posibilidad na ang target ay matamaan ng unang putok kung ito ay mas maliit sa laki kaysa sa "sampu", "siyam", atbp.?

3. Magplano at magsagawa ng mga katulad na pagsusulit para sa iba pang mga kaganapan. Ipakita ang kanilang mga resulta.



 


Basahin:



Cheesecake mula sa cottage cheese sa isang kawali - mga klasikong recipe para sa malambot na cheesecake Mga cheesecake mula sa 500 g ng cottage cheese

Cheesecake mula sa cottage cheese sa isang kawali - mga klasikong recipe para sa malambot na cheesecake Mga cheesecake mula sa 500 g ng cottage cheese

Mga sangkap: (4 na servings) 500 gr. cottage cheese 1/2 tasa ng harina 1 itlog 3 tbsp. l. asukal 50 gr. mga pasas (opsyonal) kurot ng asin baking soda...

Black pearl salad na may prun Black pearl salad na may prun

Salad

Magandang araw sa lahat ng nagsusumikap para sa pagkakaiba-iba sa kanilang pang-araw-araw na pagkain. Kung ikaw ay pagod na sa mga monotonous na pagkain at gusto mong masiyahan...

Lecho na may mga recipe ng tomato paste

Lecho na may mga recipe ng tomato paste

Napakasarap na lecho na may tomato paste, tulad ng Bulgarian lecho, na inihanda para sa taglamig. Ito ay kung paano namin pinoproseso (at kumakain!) 1 bag ng mga sili sa aming pamilya. At sino ang gusto kong...

Aphorisms at quotes tungkol sa pagpapakamatay

Aphorisms at quotes tungkol sa pagpapakamatay

Narito ang mga quotes, aphorism at nakakatawang kasabihan tungkol sa pagpapakamatay. Ito ay medyo kawili-wili at hindi pangkaraniwang seleksyon ng mga tunay na "perlas...

feed-image RSS