domicile - Des portes
Diagnostic et traitement de la cardiopathie ischémique chronique Diagnostic de la maladie coronarienne chronique (p2). Probabilité a priori Méthodes d'estimation de la probabilité a priori

Un raisonnement basé uniquement sur des faits précis et des conclusions exactes basées sur ces faits sont appelés des considérations rigoureuses. Dans les cas où il est nécessaire d'utiliser des faits incertains pour prendre des décisions, un raisonnement rigoureux devient inapproprié. Par conséquent, l'une des forces de tout système expert est considérée comme sa capacité à former un raisonnement dans des conditions d'incertitude avec autant de succès que les experts humains. Un tel raisonnement est de nature lâche. Vous pouvez parler de présence en toute sécurité logique floue.

Incertitude, et par conséquent, la logique floue peut être considérée comme une information insuffisante pour prendre une décision. L'incertitude devient un problème car elle peut entraver la création de la meilleure solution et même entraîner la recherche d'une mauvaise solution. Il est à noter qu'une solution de qualité trouvée en temps réel est souvent considérée comme plus acceptable qu'une meilleure solution, qui prend beaucoup de temps à calculer. Par exemple, un retard dans la fourniture d'un traitement pour des tests supplémentaires peut entraîner la mort d'un patient sans attendre de l'aide.

La raison de l'incertitude est la présence de diverses erreurs dans les informations. Classement simplifié ces erreurs peuvent être présentées dans leur division en les types suivants :

  • ambiguïté des informations, dont l'apparition est due au fait que certaines informations peuvent être interprétées de différentes manières;
  • informations incomplètes en raison de l'absence de certaines données ;
  • l'inadéquation des informations causée par l'utilisation des données ne correspond pas à la situation réelle (les raisons possibles sont des erreurs subjectives : mensonges, désinformation, dysfonctionnement de l'équipement) ;
  • erreurs de mesure résultant du non-respect des exigences d'exactitude et d'exactitude des critères de présentation quantitative des données ;
  • erreurs aléatoires, dont la manifestation est des fluctuations aléatoires des données par rapport à leur valeur moyenne (la raison peut être : manque de fiabilité des équipements, mouvement brownien, effets thermiques, etc.).

À ce jour, un nombre important de théories de l'incertitude ont été développées, dans lesquelles une tentative est faite pour éliminer certaines ou même toutes les erreurs et fournir une inférence fiable dans des conditions d'incertitude. Les plus couramment utilisées en pratique sont les théories basées sur la définition classique de la probabilité et sur la probabilité a posteriori.

L'un des outils les plus anciens et les plus importants pour résoudre les problèmes d'intelligence artificielle est la probabilité. Probabilité est un moyen quantitatif de tenir compte de l'incertitude. La probabilité classique provient d'une théorie proposée pour la première fois par Pascal et Fermat en 1654. Depuis lors, de nombreux travaux ont été réalisés dans l'étude des probabilités et la mise en œuvre de nombreuses applications des probabilités dans les domaines de la science, de la technologie, des affaires, de l'économie et d'autres.

Probabilité classique

Probabilité classique aussi appelée probabilité a priori, puisque sa définition renvoie à des systèmes idéaux. Le terme « précédent » désigne une probabilité qui est déterminée « aux événements », sans tenir compte de nombreux facteurs qui ont lieu dans le monde réel. Le concept de probabilité a priori s'applique aux événements se produisant dans des systèmes idéaux sujets à l'usure ou à l'influence d'autres systèmes. Dans un système idéal, l'occurrence de n'importe lequel des événements se produit de la même manière, ce qui rend leur analyse beaucoup plus facile.

La formule fondamentale de la probabilité classique (P) est définie comme suit :

Dans cette formule W est le nombre d'événements attendus, et N- le nombre total d'événements avec des probabilités égales qui sont des résultats possibles d'une expérience ou d'un test. Par exemple, la probabilité d'obtenir n'importe quelle face d'un dé à six faces est de 1/6, et tirer n'importe quelle carte d'un jeu contenant 52 cartes différentes est de 1/52.

Axiomes de la théorie des probabilités

Une théorie formelle des probabilités peut être créée sur la base de trois axiomes :

Les axiomes ci-dessus ont permis de jeter les bases de la théorie des probabilités, mais ils ne considèrent pas la probabilité que des événements se produisent dans des systèmes réels - non idéaux. Contrairement à l'approche a priori, dans les systèmes réels, pour déterminer la probabilité d'un événement P (E), la méthode de détermination de la probabilité expérimentale comme limite de la distribution de fréquence est appliquée :

Probabilité postérieure

Dans cette formule f (E) désigne la fréquence d'occurrence d'un événement entre N nombre d'observations des résultats globaux. Ce type de probabilité est aussi appelé probabilité postérieure, c'est à dire. probabilité déterminée "après les événements". La base pour déterminer la probabilité postérieure est la mesure de la fréquence avec laquelle un événement se produit au cours d'un grand nombre de tests. Par exemple, la définition du type social d'un client bancaire solvable à partir de l'expérience empirique.

Des événements qui ne s'excluent pas mutuellement peuvent s'influencer mutuellement. De tels événements sont classés comme complexes. La probabilité d'événements complexes peut être calculée en analysant les espaces d'échantillonnage correspondants. Ces exemples d'espaces peuvent être représentés à l'aide de diagrammes de Venn, comme le montre la Fig. 1

Fig. 1 Exemple d'espace pour deux événements non mutuellement exclusifs

La probabilité d'occurrence de l'événement A, qui est déterminée en tenant compte du fait que l'événement B s'est produit, est appelée probabilité conditionnelle et est notée P (A | B)... La probabilité conditionnelle est définie comme suit :

Probabilité antérieure

Dans cette formule, la probabilité P (B) ne doit pas être égal à zéro, et est une probabilité a priori, qui est déterminée avant que d'autres informations supplémentaires ne soient connues. Probabilité antérieure ce qui est utilisé en rapport avec l'utilisation de la probabilité conditionnelle est parfois appelé probabilité absolue.

Il y a un problème qui est essentiellement à l'opposé du problème du calcul de la probabilité conditionnelle. Elle consiste à déterminer la probabilité inverse, qui montre la probabilité d'un événement antérieur, en tenant compte des événements survenus dans le futur. En pratique, ce type de probabilité se rencontre assez souvent, par exemple lors de diagnostics médicaux ou de diagnostics d'équipements, dans lesquels certains symptômes sont détectés, et il s'agit de trouver une cause possible.

Pour résoudre ce problème, nous utilisons théorème de Bayes, du nom du mathématicien britannique du XVIIIe siècle Thomas Bayes. La théorie bayésienne est aujourd'hui largement utilisée pour l'analyse des arbres de décision en sciences économiques et sociales. La recherche bayésienne de solutions est également utilisée dans le système expert PROSPECTOR lors de l'identification de sites prometteurs pour l'exploration minérale. Le système PROSPECTOR a gagné en popularité en tant que premier système expert à l'aide duquel un précieux gisement de molybdène a été découvert, ce qui a coûté 100 millions de dollars.

C7 Sous cette forme moderne, le théorème de Bayes a en fait été formulé par Laplace. La formulation même du problème appartient à Thomas Bayes. Il l'a formulé comme l'inverse du problème bien connu de Bernoulli. Si Bernoulli recherchait la probabilité de résultats différents de la "courbe" du tirage au sort, alors Bayes, au contraire, cherchait à déterminer le degré de cette "courbure" par les résultats observés empiriquement du tirage au sort. Il n'y avait aucune probabilité préalable dans sa solution.


Bien que la règle paraisse très simple, elle s'avère difficile à appliquer en pratique, car les probabilités postérieures (ou même les valeurs des fonctions de décision simplifiées) sont inconnues. Leurs valeurs peuvent être estimées. En vertu du théorème de Bayes, les probabilités a posteriori peuvent être exprimées en termes de probabilités a priori et de fonctions de densité par la formule P C, Ix = P C, (P (x I C, / P Cy P xI C,

En évaluant les résultats du classement par la méthode MDA, on constate une proportion importante de décisions erronées pour les entreprises en faillite (groupe 1) - l'une d'entre elles aurait bénéficié d'un prêt. Les entreprises dont les positions ne sont pas claires (groupe 2) sont difficiles à classer correctement car, au final, elles peuvent appartenir au 1er ou au 3e groupe. La question ne peut pas être améliorée en mettant les probabilités a priori en conformité avec les perceptions de la banque de la probabilité qu'une entreprise appartienne à des groupes différents. L'indicateur global de l'exactitude de la prévision n'était que de 56,6%, et du 1er groupe, seuls 30% ont été correctement classés.

Avec le niveau actuel de complexité et de simultanéité des processus en cours, les modèles basés sur les relations causales ont des possibilités d'application limitées ; les événements nouvellement survenus modifient constamment les spécifications de toutes les variables (à la fois incluses et non incluses dans le modèle) et les valeurs des probabilités a priori et des paiements pour diverses stratégies sont très incertains et fluctuent fortement avec les changements dans la croissance économique, les taux d'intérêt, les taux de change et la rentabilité des opérations hors prêt (par exemple, lorsque les frais d'exploitation et de commission changent).

Étant donné qu'en situation réelle il est impossible de savoir à l'avance quelle partie des entreprises représentées dans un échantillon aléatoire fera faillite dans un an et que les auteurs des deux modèles considérés, comme on peut le supposer, fixent des seuils de certaines hypothèses spécifiques sur les probabilités a priori de faillite et le coût des erreurs, nous avons simplifié la procédure de comparaison et introduit des niveaux de séparation relatifs. En d'autres termes, pour chaque modèle, nous avons considéré les 10 % inférieurs des signaux générés par le modèle pour l'année suivante comme des signaux de faillite. En fait, cette approche signifie une probabilité totale de faillite antérieure de 10 % et le rapport du nombre de signaux de faillite aux faillites réelles dans le test précédent, qui est déterminé à l'aide du seuil d'optimisation. De plus, cette méthode a l'avantage de minimiser les distorsions dues au décalage important entre la publication du Z-score Altman et la conduite de l'expérience. Les indicateurs moyens au cours de cette période peuvent avoir changé, et donc la division des entreprises en fortes et faibles, basée sur une certaine proportion, semble être plus fiable. Table 9.2 montre les résultats d'une expérience pour prédire les faillites pour un an avec une indication de l'erreur pour chaque modèle.

En prenant la probabilité a priori comme un fait, estimez le bénéfice attendu en cas d'ouverture d'une succursale.

On note A. l'événement que q 6 [

Supposons, par exemple, que les paramètres suivants soient sélectionnés : la valeur des investissements en capital, la valeur des coûts d'exploitation et le prix des produits finis, qui, respectivement, peuvent prendre les valeurs de Кb К2, К3 Эь Э2, Э3 Ць Ц2 , Цз- Chacune de ces valeurs correspond à une probabilité a priori, par exemple, Кь Эь Ts ont une probabilité pt = 0,1, pour K2, A2, Ts2 la probabilité sera p2 = 0,8, et pour K3, E3, Ts3 - p3 = 0,1.

Soit la probabilité a priori d'obtenir à la fin du processus de conception une solution technique satisfaisant aux

Si le joueur 2 a plus d'une stratégie dans le jeu Г et que les probabilités a priori de leur utilisation sont inconnues du joueur 1, ou qu'il n'a même pas de sens de parler de ces probabilités, alors tout ce qui vient d'être dit est inapplicable.

Comme nous l'avons vu précédemment, les changements dans les probabilités a priori p et q dépendent de l'accord du signal.

Il s'ensuit que si nous avons une entité neutre au risque qui croit qu'une option d'achat vaudra C avec une probabilité m et j avec une probabilité (1 - m), alors ce sujet calculera le prix actuel de l'option conformément à notre équation. .. Il est à noter que nous n'avons jamais supposé l'existence de probabilités a priori d'occurrence d'un cours d'action particulier et, par conséquent, l'évaluation future des options. Cette approche est appelée évaluation neutre au risque.

Laisse moi (

Le membre de droite de (7.53) n'est pas une densité au sens propre, puisque l'intégrale de celui-ci n'est pas définie ; néanmoins, lors du calcul de la densité de la distribution postérieure des paramètres à l'aide de la formule de Bayes, des difficultés formelles en travaillant avec ( 7.53) soit ne surviennent pas, soit ils peuvent être facilement surmontés ... Comme nous le verrons plus loin dans la section 7.3.2, le choix (7.53) est analytiquement commode et, semble-t-il, reflète bien l'absence totale de connaissance a priori sur la distribution des paramètres. Cependant, il cache en réalité des hypothèses très fortes sur l'absence de corrélation entre les paramètres (à ne pas confondre avec la corrélation entre les estimations des valeurs des paramètres, qui dépend de la distribution des régresseurs et de la valeur de a), le négligeable a probabilité a priori que le vecteur de paramètres se trouve dans un volume fini quelconque, quelle que soit sa valeur, etc. Cela conduit parfois à de sérieuses difficultés d'interprétation des résultats de l'estimation bayésienne.

Considérez le contenu du théorème de Bayes d'un point de vue légèrement différent. Pour ce faire, notons tous les résultats possibles de notre expérience. Soit les symboles Н0, h signifier le résultat, la pièce n'est pas couverte et sa face supérieure est le blason. "

Je suis comme V2i, alors la probabilité du résultat spécifié sera Va X x1 / 2 = 1 / 4- Ci-dessous, nous donnons une liste de tous les résultats et de leurs probabilités antérieures

Ainsi, dans l'exemple avec une pièce de monnaie et un dé, P (Ha) est la probabilité a priori, P (Na K) est la probabilité a posteriori et P (H Ha) est la vraisemblance.

Si maintenant la probabilité a priori P (H0) peut être prise égale à 1 ou 0, on dit que le décideur

Imaginez maintenant que l'expérimentateur offre au décideur des informations totalement fiables (ou complètes) sur quel objet particulier n'est pas couvert. Le décideur doit cependant payer pour le service de communication de telles informations parfaitement fiables avant de recevoir ces informations. Quelle serait la valeur de telles informations ?Il peut se projeter dans l'avenir et se demander ce qu'il fera face à chacun des deux messages possibles qu'un service donné peut apporter, et calculer ses revenus en fonction des réponses reçues. Peser ce revenu à l'aide des probabilités a priori de messages possibles lui permettrait d'estimer le montant de son revenu attendu s'il payait une somme pour une information parfaitement fiable avant de la recevoir réellement. Puisque ce revenu attendu serait supérieur à 0,5 $, c'est-à-dire ce qu'il attend sur la base des seules informations a priori, alors l'augmentation de revenu serait le montant maximum qu'il aurait du sens pour lui de payer pour le service d'information.

L'entreprise doit acheter une grande quantité de marchandises aujourd'hui ou demain. Aujourd'hui, le prix du produit est de 14,5 $ l'unité. Selon la firme, demain son prix sera soit de 10 $, soit de 20 $ avec une probabilité égale. Soit x le prix de demain, alors les probabilités a priori sont

Au dernier stade, la fiabilité du choix des probabilités a priori d'occurrence des conditions de marché est vérifiée et l'utilité attendue du raffinement de ces probabilités est calculée. Pour cela, un arbre de décision est construit. Si le besoin d'une étude de marché supplémentaire se fait sentir, il est recommandé de suspendre la mise en œuvre de l'option sélectionnée pour un nouveau produit jusqu'à ce que des résultats plus fiables soient obtenus.

Dans la pratique marketing d'une entreprise, il est souvent nécessaire de comparer les coûts d'obtention d'informations partielles (incomplètes) et les coûts d'obtention de nouvelles informations supplémentaires afin de prendre une meilleure décision. Le gestionnaire (décideur) doit évaluer dans quelle mesure le bénéfice tiré des informations supplémentaires couvre les coûts de leur obtention. Dans ce cas, la théorie de la décision bayésienne peut être appliquée. Les données initiales sont les probabilités a priori P (Sk) et les probabilités conditionnelles P (Z Sk) d'émergence de l'état de marché Z, à condition de supposer l'émergence de l'état 5A. Lorsque de nouvelles informations sont reçues, l'utilité attendue de chaque stratégie est calculée, puis la stratégie avec la valeur maximale de l'utilité attendue est sélectionnée. À l'aide de nouvelles informations, le décideur peut corriger les probabilités a priori P (Sk), ce qui est très important lors de la prise de décisions.

Or, il est souhaitable de savoir quelle sera la probabilité d'apparition de l'état objectif Sk lors de la réception de nouvelles informations. Ainsi, il faut trouver P (Sk Z), où k, q = 1, n. C'est la probabilité conditionnelle et c'est la probabilité a priori ajustée. Pour calculer P (Sk Z), on utilise la formule de Bayes

Ainsi, nous avons obtenu les probabilités a priori affinées d'apparition de conditions de marché objectives. L'ensemble du processus de calcul et les résultats obtenus sont présentés dans le tableau. 9.11 et 9.12.

L'utilisation de l'approche bayésienne (6.47) nécessite la connaissance des probabilités a priori et des densités de distribution de probabilité.

En utilisant les caractéristiques numériques des objets obtenus à partir de l'AGC, nous avons effectué une analyse discriminante multiple linéaire standard avec les mêmes probabilités a priori (égales à 33 %) d'appartenance à un élément. groupes. 41 % du nombre total de cas ont été classés correctement, ce qui est légèrement meilleur que la précision de 33 % qui serait obtenue si un objet était assigné au hasard à l'un ou l'autre groupe. Languette. 8.6 ci-dessous est un tableau de classification erronée, également appelé matrice d'erreurs.

Le prochain défi consiste à développer une norme pour les tests. Dans la plupart des cas, peu d'échantillons sont prélevés pour évaluer les modèles MDA, ce qui augmente la probabilité que le modèle corresponde trop étroitement aux données de test. Les échantillons contiennent généralement une proportion égale d'entreprises en faillite et non en faillite, et les données elles-mêmes, en règle générale, correspondent à des périodes de faillite intense. Ceci conduit à la conclusion que seuls les résultats de l'évaluation du modèle sur de nouvelles données sont fiables. Du tableau. 9.1, on peut voir que même sur les tests les plus favorables avec de nouvelles données (lorsque tous les exemples sont tirés de la même période et, de plus, sont homogènes en termes d'industries et de taille d'entreprise), la qualité est moins bonne que sur les échantillons, qui ont servi à déterminer les paramètres du modèle. Étant donné que, dans la pratique, les utilisateurs de modèles de classification ne seront pas en mesure d'adapter le modèle à d'autres probabilités antérieures de faillite, de taille d'entreprise ou de secteur, la qualité réelle du modèle peut être encore pire. La qualité peut également se détériorer en raison du fait qu'il y a peu d'entreprises dans les échantillons utilisés pour tester les modèles MDA qui n'ont pas fait faillite mais qui sont à risque. S'il n'y a que quatre ou cinq de ces entreprises qui survivent à risque, cela fausse la part réelle des entreprises à risque et, par conséquent, la fréquence des erreurs de type II s'avère être sous-estimée.

Les méthodes MDA impliquées dans la comparaison ont été calculées et optimisées sur la base d'un taux de faux signaux de 10 1 avec quelques probabilités et coûts d'erreur antérieurs. Je voudrais utiliser comme critère ex ante moins de 10 %, le nombre de faillis potentiels dans la population, mais ce n'est pas en bon accord avec les paramètres des modèles. Il est également contraire à la pratique selon laquelle l'abaissement du seuil en dessous de 10 % n'a pas entraîné la faillite. Ainsi, lorsque la part des faux signaux a été réduite à 7 %, l'échelle Z de Tuffler a complètement cessé d'identifier les faillites et le modèle Datastream a rencontré cet obstacle à environ 8 %. En revanche, le réseau de neurones a reconnu deux cas de faillite en deçà du seuil de division de 4,5%, c'est-à-dire le réseau est capable de fonctionner dans des conditions où il n'y a que cinq faux signaux pour une identification correcte de la faillite. Ce chiffre est comparable aux meilleurs résultats obtenus par les modèles MDA sur des tests ex post beaucoup moins exigeants. Cela conduit à deux conclusions : d'une part, les modèles neuronaux représentent une méthode de classification fiable dans le secteur du crédit, et, d'autre part, utiliser le cours de l'action comme variable cible dans la formation peut être plus rentable que l'indicateur faillite/survie lui-même. Le cours de l'action reflète-

Pouce. 3-5 décrivent des méthodes de mise à l'échelle des préférences (poids) des événements futurs, des estimations quantitatives du degré de préférence et nous pouvons calculer la probabilité inconditionnelle de tout résultat d'échantillon

I. Probabilités conditionnelles. Probabilités a priori et a posteriori. 3

II. Evénements indépendants. 5

III. Tester des hypothèses statistiques. Fiabilité statistique. sept

IV.Utilisation du test du Khi deux 19

1. Détermination de la fiabilité de la différence entre un ensemble de fréquences et un ensemble de probabilités. dix-neuf

2. Détermination de la fiabilité de la différence entre plusieurs séries de fréquences. 26

V EMPLOI INDÉPENDANT 33

Leçon numéro 2

  1. Probabilités conditionnelles. Probabilités a priori et a posteriori.

Une variable aléatoire est définie par trois objets : un ensemble d'événements élémentaires, un ensemble d'événements et la probabilité d'événements. Ces valeurs qu'une variable aléatoire peut prendre sont appelées événements élémentaires. Les ensembles d'événements élémentaires sont appelés événements... Pour les variables aléatoires numériques et autres variables peu complexes, tout ensemble donné d'événements élémentaires est un événement.

Prenons un exemple : lancer un dé.

Il y a 6 événements élémentaires au total : "point", "2 points", "3 points"... "6 points". Événement - tout ensemble d'événements élémentaires, par exemple, "pair" est la somme des événements élémentaires "2 points", "4 points" et "6 points".

La probabilité de tout événement élémentaire P (A) est de 1/6 :

la probabilité d'un événement est le nombre d'événements élémentaires qu'il contient, divisé par 6.

Assez souvent, en plus de la probabilité connue d'un événement, il existe des informations supplémentaires qui modifient cette probabilité. Par exemple, la létalité des patients. de ceux admis à l'hôpital avec un ulcère gastrique hémorragique aigu est d'environ 10 %. Cependant, si le patient a plus de 80 ans, ce taux de mortalité est de 30 %.

Pour décrire de telles situations, la soi-disant probabilités conditionnelles... Ils sont notés P (A / B) et se lisent "la probabilité de l'événement A sous la condition de l'événement B". Pour calculer la probabilité conditionnelle, la formule est utilisée :

Revenons à l'exemple précédent :

Soit parmi les patients admis à l'hôpital avec un ulcère gastrique aigu hémorragique, 20% sont des patients de plus de 80 ans. De plus, parmi tous les patients, la proportion de patients décédés à plus de 80 ans est de 6 % (rappelons que la proportion de tous les décès est de 10 %). Dans ce cas

Lors de la définition des probabilités conditionnelles, les termes a priori(littéralement - avant l'expérience) et a postériori(littéralement - après expérience) probabilités.

En utilisant des probabilités conditionnelles, on peut en calculer d'autres à partir d'une probabilité, par exemple, pour échanger un événement et une condition.

Considérons cette technique sur l'exemple de l'analyse de la relation entre le risque de maladie rhumatismale (fièvre rhumatismale) et l'un des antigènes, qui en sont un facteur de risque.

L'incidence des rhumatismes est d'environ 1%. Désignons la présence de rhumatismes par R +, tandis que P (R +) = 0,01.

La présence d'antigène sera désignée par A+. Elle est retrouvée chez 95% des patients atteints de rhumatisme et chez 6% de ceux sans rhumatisme. Dans notre notation, ce sont : les probabilités conditionnelles P (A + / R +) = 0,95 et P (A + / R -) = 0,06.

Sur la base de ces trois probabilités, nous déterminerons séquentiellement d'autres probabilités.

Tout d'abord, si l'incidence du rhumatisme est P (R +) = 0,01, alors la probabilité de ne pas tomber malade est P (R -) = 1-P (R +) = 0,99.

A partir de la formule de la probabilité conditionnelle, on trouve que

P (A+ et R+) = P (A+/R+) * P (R+) = 0,95 * 0,01 = 0,0095, soit 0,95% de la population souffre simultanément de rhumatismes et possède un antigène.

également

P (A + et R -) = P (A + / R -) * P (R -) = 0,06 * 0,99 = 0,0594, soit 5,94 % de la population porte l'antigène, mais n'a pas de rhumatisme.

Étant donné que tout le monde avec l'antigène a des rhumatismes ou ne tombe pas malade (mais pas les deux en même temps), la somme des deux dernières probabilités donne la fréquence du portage de l'antigène dans la population dans son ensemble :

P (A +) = P (A + u R +) + P (A + u R -) = 0,0095 + 0,0594 = 0,0689

En conséquence, la proportion de personnes sans antigène est égale à

P (A -) = 1- P (A +) = 0,9311

Étant donné que l'incidence des rhumatismes est de 1 % et que la proportion de personnes atteintes d'antigène et de rhumatismes est de 0,95 %, la proportion de personnes atteintes de rhumatismes et sans antigène est :

P (A - et R +) = P (R +) - P (A + et R +) = 0,01 - 0,0095 = 0,0005

Nous allons maintenant aller dans la direction opposée, en passant des probabilités d'événements et de leurs combinaisons aux probabilités conditionnelles. Selon la formule de probabilité conditionnelle initiale P (A+/R+) = P(R+ et A+)/P(A+) = 0,0095/0,06890,1379, soit environ 13,8% des personnes porteuses de l'antigène tombent malades d'un rhumatisme . Étant donné que l'incidence de la population dans son ensemble n'est que de 1%, le fait de détecter l'antigène augmente de 14 fois la probabilité de rhumatisme.

De même, P (R + / A -) = P (R + et A -) / P (A -) = 0,0005 / 0,93110,000054, c'est-à-dire que le fait qu'aucun antigène n'ait été détecté lors du test réduit la probabilité de contracter un rhumatisme. 19 fois.

Formatons cette tâche dans une feuille de calcul Excel :

Présence de rhumatisme R+

La présence d'antigène chez les patients avec A +

La présence d'antigène dans A+ non malade

La probabilité de ne pas tomber malade

P (R -) = 1- P (R +)

En même temps, ils souffrent de rhumatismes et ont des antigènes

P (A + et R +) = P (A + / R +) * P (R +)

Porter l'antigène, mais ne pas avoir de rhumatisme

P (A + et R -) = P (A + / R -) * P (R -)

Fréquence du portage de l'antigène dans la population générale

P (A +) = P (A + et R +) + P (A + et R -)

Proportion de personnes sans antigène

P (A -) = 1- P (A +)

La proportion de personnes souffrant de rhumatismes et sans antigène

P (A - et R +) = P (R +) - P (A + et R +)

Les personnes porteuses de l'antigène développeront des rhumatismes

P (A + / R +) = P (R + et A +) / P (A +)

Les personnes qui ne portent pas l'antigène ne développeront pas de rhumatisme

P (R + / A -) = P (R + et A -) / P (A -)

Vous pouvez voir le processus de construction d'un tableau picture2 \ p2-1.gif

Un événement aléatoire est évalué par un nombre qui détermine l'intensité de la manifestation de cet événement. Ce numéro s'appelle probabilité développements P () ... La probabilité d'un événement élémentaire est ... La probabilité d'un événement est une mesure numérique du degré d'objectivité, de la possibilité de cet événement. Plus la probabilité est grande, plus l'événement est probable.

Tout événement qui correspond à l'ensemble de l'espace de résultat S est appelé événement crédible, c'est à dire. un tel événement qui, à la suite de l'expérience, doit nécessairement se produire (par exemple, la chute d'un nombre quelconque de points de 1 à 6 sur les dés). Si l'événement n'appartient pas à l'ensemble S, alors il est considéré impossible(par exemple, l'apparition d'un nombre de points supérieur à 6 sur un dé). La probabilité d'un événement impossible est de 0, la probabilité d'un certain événement est de 1. Tous les autres événements ont une probabilité de 0 à 1.

Événements E et sont appelés opposé, si E vient quand il ne vient pas ... Par exemple, l'événement E- "perte d'un nombre pair de points", puis l'événement - "la perte d'un nombre impair de points". Deux événements E 1 et E 2 sont appelés inconsistant s'il n'y a pas de résultat commun aux deux événements.

Pour déterminer les probabilités d'événements aléatoires, des méthodes directes ou indirectes sont utilisées. Lors du calcul direct de la probabilité, on distingue les schémas de calcul a priori et a posteriori, lorsque effectuer des observations (expériences) ou a priori compter le nombre d'expériences m dans lequel l'événement s'est manifesté, et le nombre total d'expériences réalisées m... Les méthodes indirectes sont basées sur la théorie axiomatique. Puisque les événements sont définis comme des ensembles, toutes les opérations de théorie des ensembles peuvent être effectuées sur eux. La théorie des ensembles, l'analyse fonctionnelle ont été proposées par l'académicien A.N. Kolmogorov et a constitué la base de la théorie axiomatique des probabilités. Voici les axiomes des probabilités.

Axiomeje. Champ d'événementF(S) est l'algèbre des ensembles.

Cet axiome indique une analogie entre la théorie des ensembles et la théorie des probabilités.

AxiomeII. À chaque ensembledeF(S) le nombre réel P (), appelée la probabilité de l'événement:

fourni S 1 S 2 =  (pour les événements incohérents S 1 et S 2 ), ou pour de nombreux événements incohérents

N- le nombre d'événements élémentaires (issues possibles).

La probabilité d'un événement aléatoire

,

- probabilités d'événements élémentaires inclus dans le sous-ensemble .

Exemple 1.1. Déterminer la probabilité de tomber de chaque numéro lors du lancer d'un dé, tomber d'un nombre pair, nombre 4 .

Solution... La probabilité que chaque nombre tombe de l'ensemble

S = (1, 2, 3, 4, 5, 6)
1/6.

La probabilité d'obtenir un nombre pair, c'est-à-dire
={2,
4, 6}, basé sur (1.6) sera P (
) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2
.

La probabilité d'obtenir un nombre  4 , c'est à dire.
= {4, 5, 6 } ,

P (
) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2.

Travaux d'auto-apprentissage

1. Il y a 20 balles blanches, 30 noires et 50 rouges dans le panier. Déterminez la probabilité que la première balle sortie du panier soit blanche ; noir; rouge.

2. Il y a 12 garçons et 10 filles dans le groupe d'étudiants. Quelle est la probabilité qu'au séminaire sur la théorie des probabilités soient absents: 1) un jeune homme; 2) une fille ; 3) deux garçons ?

3. Au cours de l'année, 51 jours se distinguaient par le fait qu'il pleuvait (ou neigeait) ces jours-là. Quelle est la probabilité que vous couriez le risque de vous faire prendre par la pluie (ou la neige) : 1) aller travailler ; 2) randonner pendant 5 jours ?

4. Créez un problème sur le sujet de cette tâche et résolvez-le.

1.1.3. Détermination de la probabilité postérieure (probabilité statistique ou fréquence

Événement aléatoire)

Pour déterminer la probabilité a priori, on a supposé que sont également probables. C'est loin d'être toujours vrai, il arrive plus souvent que
à
... Hypothèse
conduit à une erreur dans la définition a priori P ( ) selon le schéma établi. Pour déterminer , et en général P ( ) effectuer des tests ciblés. Au cours de la réalisation de tels tests (par exemple, les résultats des tests dans les exemples 1.2, 1.3) dans diverses conditions, diverses conditions, influences, facteurs de causalité, c'est-à-dire dans différents cas, différent résultats(différentes manifestations de l'information de l'objet étudié) Chaque résultat de test correspond à un élément ou un sous-ensemble multitudes S.Si vous définissez m comme le nombre d'événements favorables UNE résultats obtenus en conséquence m tests, la probabilité a posteriori (probabilité statistique ou fréquence d'un événement aléatoire UNE)

Basé sur la loi des grands nombres pour UNE

, m ,

celles. avec une augmentation du nombre d'essais, la fréquence d'un événement aléatoire (probabilité a posteriori ou statistique) tend vers la probabilité de cet événement.

Exemple 1.2. La probabilité d'obtenir face au tirage au sort, déterminée à partir du schéma de cas, est de 0,5. Il est nécessaire de lancer 10, 20, 30... fois à pile ou face et de déterminer la fréquence d'un événement aléatoire de pile après chaque série de tests.

Solution... K. Poisson a lancé la pièce 24 000 fois, avec 11998 queues. Ensuite, par la formule (1.7), la probabilité d'obtenir pile

.

Travaux d'auto-apprentissage

    Sur la base d'un important matériel statistique ( m ), les valeurs des probabilités d'apparition de lettres individuelles de l'alphabet russe et l'espace () dans les textes ont été obtenues, qui sont données dans le tableau 1.1.

Tableau 1.1. La probabilité d'apparition de lettres de l'alphabet dans le texte

Prenez une page de n'importe quel texte et déterminez la fréquence d'apparition de diverses lettres sur cette page. Augmentez le volume des tests à deux pages. Comparez les résultats obtenus avec les données du tableau. Faire une conclusion.

    En tirant sur des cibles, le résultat suivant a été obtenu (voir tableau 1.2).

Tableau 1.2. Résultat de tir à la cible

Quelle est la probabilité que la cible ait été touchée dès le premier coup si sa taille était inférieure à dix, neuf, etc. ?

3. Planifier et effectuer des tests similaires pour d'autres événements. Présentez leurs résultats.



 


Lire:



Youri Trutnev Youri Trutnev vie personnelle

Youri Trutnev Youri Trutnev vie personnelle

Qui aurait pensé, tout récemment, que les divorces siégeraient tout à fait ouvertement au gouvernement fédéral? Cependant, les temps sont un peu...

Le gouverneur de Sakhaline, Alexander Horoshavin, a été arrêté parce qu'il était soupçonné d'avoir accepté un pot-de-vin Qu'est-il arrivé à Horoshavin

Le gouverneur de Sakhaline, Alexander Horoshavin, a été arrêté parce qu'il était soupçonné d'avoir accepté un pot-de-vin Qu'est-il arrivé à Horoshavin

Un ancien responsable s'est plaint à Poutine du manque de yachts, de villas et d'hôtels au bord de la mer Le coût total est de plus de 240 millions de roubles. Voitures ...

L'ancien souverain. III. Le souverain et sa cour. Dioclétien : Quae fuerunt vitia, mores sunt - Ce qu'étaient les vices est maintenant entré dans les mœurs

L'ancien souverain.  III.  Le souverain et sa cour.  Dioclétien : Quae fuerunt vitia, mores sunt - Ce qu'étaient les vices est maintenant entré dans les mœurs

Il y a 400 ans, la dynastie des Romanov monta sur le trône de Russie. Dans le contexte de cette date mémorable, des discussions s'enflamment sur l'influence du pouvoir tsariste...

Réforme de l'ordre en Russie

Réforme de l'ordre en Russie

Le système des organes du pouvoir central de l'État, qui a commencé à se former sous Ivan III, a reçu une forme relativement complète au cours des réformes d'Ivan ...

image de flux RSS