domicile - Pas vraiment de rénovation
Tester l'hypothèse de l'insignifiance de l'asymétrie et de l'aplatissement. Asymétrie et aplatissement de la distribution d'une variable aléatoire. Évaluation de la matérialité de l'asymétrie

Définition. Mode La variable aléatoire discrète M 0 est appelée sa valeur la plus probable. Pour une variable aléatoire continue, le mode est la valeur de la variable aléatoire à laquelle la densité de distribution a un maximum.

Si le polygone de distribution pour une variable aléatoire discrète ou la courbe de distribution pour une variable aléatoire continue a deux maxima ou plus, alors une telle distribution est appelée bimodal ou multimodal.

Si une distribution a un minimum, mais n'a pas de maximum, alors elle est appelée anti-modal.

Définition. Médian M D d'une variable aléatoire X est appelée sa valeur par rapport à laquelle il est également probable d'obtenir une valeur plus ou moins grande de la variable aléatoire.

Géométriquement, la médiane est l'abscisse du point auquel l'aire délimitée par la courbe de distribution est divisée par deux.

Notez que si la distribution est unimodale, alors le mode et la médiane coïncident avec l'espérance mathématique.

Définition. Le point de départ ordre k la variable aléatoire X est appelée l'espérance mathématique de la valeur X k .

Pour une variable aléatoire discrète :.

.

Le moment initial du premier ordre est égal à l'espérance mathématique.

Définition. Point central ordre k la variable aléatoire X est appelée l'espérance mathématique de la valeur

Pour une variable aléatoire discrète : .

Pour une variable aléatoire continue : .

Le moment central du premier ordre est toujours nul et le moment central du deuxième ordre est égal à la variance. Le moment central du troisième ordre caractérise l'asymétrie de la distribution.

Définition. Le rapport entre le moment central du troisième ordre et l'écart type du troisième degré est appelé coefficient d'asymétrie.

Définition. Pour caractériser la pointe et la planéité de la distribution, une quantité appelée aplatissement.

En plus des grandeurs considérées, les moments dits absolus sont également utilisés :

Point de départ absolu :.

Point central absolu : .

Quantile correspondant à un niveau de probabilité donné R, est appelée une telle valeur à laquelle la fonction de distribution prend une valeur égale à R, c'est à dire. où R- un niveau de probabilité donné.

En d'autres termes quantile il existe une valeur d'une variable aléatoire à laquelle

Probabilité R donné en pourcentage, donne un nom au quantile correspondant, par exemple, on l'appelle le quantile 40 %.

20. Espérance mathématique et variance du nombre d'occurrences d'un événement dans des expériences indépendantes.

Définition. Attente mathématique une variable aléatoire continue X, dont les valeurs possibles appartiennent à un intervalle, est appelée une intégrale définie

Si les valeurs possibles d'une variable aléatoire sont considérées sur tout l'axe numérique, alors l'espérance mathématique est trouvée par la formule :

Dans ce cas, bien sûr, on suppose que l'intégrale impropre converge.

Attente mathématique une variable aléatoire discrète est la somme des produits de ses valeurs possibles par les probabilités correspondantes :

M(N.-É.) =N.-É. 1 R 1 +N.-É. 2 R 2 + … +N.-É. N.-É. R N.-É. . (7.1)

Si le nombre de valeurs possibles d'une variable aléatoire est infini, alors
si la série résultante converge absolument.

Remarque 1. L'espérance mathématique est parfois appelée moyenne pondérée, puisqu'elle est approximativement égale à la moyenne arithmétique des valeurs observées de la variable aléatoire pour un grand nombre d'expériences.

Remarque 2. De la définition de l'espérance mathématique, il s'ensuit que sa valeur n'est pas inférieure à la plus petite valeur possible d'une variable aléatoire et pas supérieure à la plus grande.

Remarque 3. L'espérance mathématique d'une variable aléatoire discrète est pas de hasard(constant. Dans ce qui suit, nous verrons qu'il en est de même pour les variables aléatoires continues.

Propriétés d'espérance mathématique.

    L'espérance mathématique d'une constante est égale à la plus constante :

M(AVEC) =AVEC.(7.2)

Preuve. Considérant AVEC en tant que variable aléatoire discrète ne prenant qu'une seule valeur AVEC avec probabilité R= 1, alors M(AVEC) =AVEC 1 = AVEC.

    Le facteur constant peut être retiré du signe de l'espérance mathématique :

M(SH) =CM(N.-É.). (7.3)

Preuve. Si une variable aléatoire N.-É. donnée par une série de distribution

X je

X m

p je

p m

puis la série de distribution pour SH ressemble à:

AVECX je

AVECX 1

AVECX 2

AVECX m

p je

p m

Puis M(SH) =Cx 1 R 1 +Cx 2 R 2 + … +Cx N.-É. R N.-É. =AVEC(N.-É. 1 R 1 +N.-É. 2 R 2 + … +N.-É. N.-É. R N.-É.) =CM(N.-É.).

Attente mathématique variable aléatoire continue est appelée

(7.13)

Remarque 1. La définition générale de la variance reste la même pour une variable aléatoire continue que pour une variable discrète (déf. 7.5), et la formule pour son calcul est de la forme :

(7.14)

L'écart type est calculé par la formule (7.12).

Remarque 2. Si toutes les valeurs possibles d'une variable aléatoire continue ne dépassent pas l'intervalle [ une, b], alors les intégrales des formules (7.13) et (7.14) sont calculées dans ces limites.

Théorème. La variance du nombre d'occurrences d'un événement dans des essais indépendants est égale au produit du nombre d'essais par la probabilité d'occurrence et de non-occurrence d'un événement dans un essai :.

Preuve. Soit le nombre d'occurrences d'un événement dans des essais indépendants. Il est égal à la somme des occurrences de l'événement dans chaque essai :. Puisque les tests sont indépendants, les variables aléatoires - sont donc indépendants.

Comme indiqué ci-dessus, et.

Ensuite, pendant que .

Dans ce cas, comme mentionné précédemment, l'écart type.

58. Coefficients d'asymétrie et d'aplatissement.

Moments centraux de distribution

Pour une étude plus approfondie de la nature de la variation, les valeurs moyennes de différents degrés d'écarts des valeurs individuelles de l'attribut par rapport à sa moyenne arithmétique sont utilisées. Ces indicateurs sont appelés points focaux des distributions de l'ordre correspondant au degré d'augmentation des écarts, ou simplement des moments.

Indicateurs de formulaire de distribution

Asymétrie de distribution


L'exposant de Pearson dépend du degré d'asymétrie dans la partie médiane de la série de distribution, et l'indice d'asymétrie, basé sur le moment du troisième ordre, sur les valeurs extrêmes de la caractéristique.

Évaluation de la matérialité de l'asymétrie

Pour évaluer l'importance de l'asymétrie, l'erreur quadratique moyenne du coefficient d'asymétrie est calculée

Si l'attitude a une valeur supérieure à 2, alors cela indique un caractère significatif de l'asymétrie

Aplatissement de la distribution

Indicateur d'aplatissement
représente l'écart du sommet de la distribution empirique vers le haut ou vers le bas ("cool") par rapport au sommet de la courbe de distribution normale, MAIS ! Le graphique de distribution peut sembler arbitrairement raide selon la force de la variation du trait : plus la variation est faible, plus la courbe de distribution est raide à une échelle donnée. Sans parler du fait qu'en changeant les échelles le long des axes des abscisses et des ordonnées, toute distribution peut être artificiellement rendue "raide" et "plate". Pour montrer en quoi consiste l'aplatissement de la distribution et pour l'interpréter correctement, il est nécessaire de comparer les séries avec la même force de variation (la même valeur ) et des indices d'aplatissement différents. Afin de ne pas confondre kurtosis et asymétrie, toutes les lignes comparées doivent être symétriques. Cette comparaison est illustrée à la Fig.

Puisque l'aplatissement de la distribution normale est de 3, l'indice d'aplatissement est calculé par la formule


Évaluation de la matérialité de l'aplatissement

Pour évaluer l'importance de l'aplatissement, l'indicateur de son erreur quadratique moyenne est calculé

Si l'attitude a une valeur supérieure à 3, alors cela indique un caractère significatif de l'excès

Coefficient d'asymétrie montre l'« asymétrie » de la série de distribution par rapport au centre :

où est le moment central du troisième ordre ;

- cube d'écart type.

Pour cette méthode de calcul : si, la distribution est de droite (asymétrie positive), si, la distribution est de gauche (asymétrie négative)

En plus du moment central, l'asymétrie peut être calculée en utilisant le mode ou la médiane :

ou, (6.69)

Pour cette méthode de calcul : si dans la distribution il y a un côté droit (asymétrie positive), si, dans la distribution, il y a un côté gauche (asymétrie négative) (Fig. 4).


Riz. 4. Distributions asymétriques

La valeur indiquant la "pente" de la distribution est appelée aplatissement:

Si, dans la distribution, il y a pointe - l'aplatissement est positif si, dans la distribution, il y a platitude - l'aplatissement est négatif (Fig. 5).

Riz. 5. Excès de distribution

Exemple 5. Il existe des données sur le nombre de moutons dans les fermes de district (tableau 9).

1. Nombre moyen de moutons par ménage.

3. Médiane.

4. Indicateurs de variation

Variance;

· écart-type;

· le coefficient de variation.

5. Indicateurs d'asymétrie et d'aplatissement.

Solution.

1. Étant donné que la valeur des options dans l'agrégat est répétée plusieurs fois, avec une certaine fréquence pour calculer la valeur moyenne, nous utilisons la formule de la moyenne arithmétique pondérée :

2. Cette ligne est discrète, donc le mode sera l'option avec la fréquence la plus élevée -.

3. Cette série est paire, dans ce cas la médiane de la série discrète est trouvée par la formule :

C'est-à-dire que la moitié des ménages de la population étudiée ont un nombre de moutons allant jusqu'à 4,75 mille têtes. et moitié plus que ce nombre.

4. Pour calculer les indicateurs de variation, nous établirons le tableau 10, dans lequel nous calculerons les écarts, les carrés de ces écarts, le calcul peut être effectué à la fois à l'aide de formules de calcul simples et pondérées (dans l'exemple, nous utilisons un simple une):

Tableau 10

2,00 -2,42 5,84
2,50 -1,92 3,67
2,50 -1,92 3,67
3,00 -1,42 2,01
3,00 -1,42 2,01
4,00 -0,42 0,17
5,50 1,08 1,17
5,50 1,08 1,17
5,50 1,08 1,17
6,00 1,58 2,51
6,50 2,08 4,34
7,00 2,58 6,67
Le total 53,00 0,00 34,42
Moyenne 4,4167

Calculons la variance :

Calculons l'écart type :

Calculons le coefficient de variation :

5. Pour calculer les indicateurs d'asymétrie et d'aplatissement, nous construisons le tableau 11, dans lequel nous calculons,,

Tableau 11

2,00 -2,42 -14,11 34,11
2,50 -1,92 -7,04 13,50
2,50 -1,92 -7,04 13,50
3,00 -1,42 -2,84 4,03
3,00 -1,42 -2,84 4,03
4,00 -0,42 -0,07 0,03
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
6,00 1,58 3,97 6,28
6,50 2,08 9,04 18,84
7,00 2,58 17,24 44,53
Le total 53,00 0,00 0,11 142,98
Moyenne 4,4167

L'asymétrie de la distribution est égale à :

C'est-à-dire qu'une asymétrie du côté gauche est observée, car, ce qui est confirmé par le calcul selon la formule:

Dans ce cas, qui pour cette formule indique également une asymétrie du côté gauche

Le kurtosis de distribution est égal à :

Dans notre cas, le kurtosis est négatif, c'est-à-dire qu'un sommet plat est observé.

Exemple 6... Pour l'exploitation, les données sur les salaires des ouvriers sont présentées (tab. 12)

Solution.

Pour une série de variation d'intervalle, le mode est calculé par la formule :

intervalle modal - l'intervalle avec la fréquence la plus élevée, dans notre cas 3600-3800, avec une fréquence

La frontière minimale de l'intervalle modal (3600) ;

La valeur de l'intervalle modal (200) ;

La fréquence de l'intervalle précédant l'intervalle modal (25);

La fréquence du prochain intervalle modal (29);

Fréquence d'intervalle modal (68).

Tableau 12

Pour une série de variation d'intervalle, la médiane est calculée par la formule :

intervalle médian il s'agit d'un intervalle dont la fréquence cumulée (cumulée) est égale ou supérieure à la moitié de la somme des fréquences, dans notre exemple elle est de 3600-3800.

La frontière minimale de l'intervalle médian (3600) ;

La valeur de l'intervalle médian (200);

La somme des fréquences de la série (154);

La somme des fréquences accumulées, tous les intervalles précédant la médiane (57);

Est la fréquence de l'intervalle médian (68).

Exemple 7. Pour trois exploitations d'une région, il existe des informations sur l'intensité capitalistique de la production (le nombre de coûts d'immobilisations pour 1 rouble de produits manufacturés): I - 1,29 roubles, II - 1,32 roubles, III - 1,27 roubles. Il est nécessaire de calculer l'intensité capitalistique moyenne.

Solution... L'intensité capitalistique étant l'indicateur inverse de la rotation du capital, nous utilisons la formule de moyenne harmonique simple.

Exemple 8. Pour trois exploitations dans une région, il existe des données sur la récolte brute de céréales et le rendement moyen (tableau 13).

Solution... Le calcul du rendement moyen par la moyenne arithmétique est impossible, car il n'y a pas d'information sur le nombre de surfaces semées, nous utilisons donc la formule de la moyenne pondérée harmonique :

Exemple 9. Il existe des données sur le rendement moyen des pommes de terre dans les parcelles individuelles et le nombre de buttes (tableau 14)

Tableau 14

Regroupons les données (tableau 15) :

Tableau 15

Regroupement des parcelles selon le "nombre de désherbage"

1. Calculons la variance totale de l'échantillon (tableau 16).

2.6 Asymétrie et aplatissement

En statistique mathématique, pour connaître la forme géométrique de la densité de probabilité d'une variable aléatoire, deux caractéristiques numériques associées aux moments centraux des troisième et quatrième ordres sont utilisées.

Définition 2.22 Exemple de coefficient d'asymétrieX 1 , X 2 , …, X m est un nombre égal au rapport du moment central d'échantillonnage du troisième ordre au cube de l'écart type S:

Depuis et , alors le coefficient d'asymétrie est exprimé en fonction des moments centraux par la formule suivante :

Cela donne une formule exprimant le coefficient d'asymétrie en fonction des moments initiaux :

ce qui facilite les calculs pratiques.

La caractéristique théorique correspondante est introduite à l'aide de points théoriques.

Définition 2.23 Le coefficient d'asymétrie d'une variable aléatoireXappelé le numéroégal au rapport du moment central du troisième ordreau cube d'écart type :

Si une variable aléatoire X a une distribution symétrique par rapport à l'espérance mathématique μ, alors son coefficient d'asymétrie théorique est 0, si la distribution de probabilité est asymétrique, alors le coefficient d'asymétrie est non nul. La valeur positive du coefficient d'asymétrie indique que la plupart des valeurs de la variable aléatoire sont situées à droite de l'espérance mathématique, c'est-à-dire que la branche droite de la courbe de densité de probabilité est plus allongée que la gauche. Une valeur négative du coefficient d'asymétrie indique que la partie la plus longue de la courbe est située à gauche. Cette déclaration est illustrée dans la figure suivante.

Figure 2.1 - Asymétrie positive et négative

répartitions

Exemple 2.29 Retrouvons l'exemple de coefficient d'asymétrie d'après l'étude des situations stressantes de l'exemple 2.28.

En utilisant les valeurs précédemment calculées des moments d'échantillonnage centraux, nous obtenons

.

Arrondi = 0,07. La valeur non nulle trouvée du coefficient d'asymétrie montre l'asymétrie de la distribution par rapport à la moyenne. Une valeur positive indique que la branche la plus longue de la courbe de densité de probabilité est à droite.

Les caractéristiques de la distribution des valeurs d'une variable aléatoire autour de sa valeur modale X modes sont caractérisées par la constante suivante.

Définition 2.24 Échantillonnage de l'aplatissementX 1 , X 2 , …, X mappelé le numéro , égal

,

- moment central sélectif du quatrième ordre,

S 4 - le quatrième degré de la normeécartsS.

Le concept théorique d'aplatissement est analogue à l'aplatissement sélectif.

Définition 2.25 Par aplatissement d'une variable aléatoireXappelé le numéro e,égal

,

point central théorique du quatrième ordre,

quatrième degré d'écart type.

Le sens de l'aplatissement e caractérise la pente relative du sommet de la courbe de densité de distribution autour du point maximum. Si l'aplatissement est un nombre positif, la courbe de distribution correspondante a un sommet plus net. La distribution avec aplatissement négatif a un sommet plus lisse et plus plat. La figure suivante illustre les cas possibles.

Figure 2.2 - Distributions avec des valeurs positives, nulles et négatives d'aplatissement

L'asymétrie est calculée par la fonction SKOS. Son argument est la plage de cellules avec des données, par exemple, = RMS (A1 : A100) si les données sont contenues dans la plage de cellules de A1 à A100.

Le kurtosis est calculé par la fonction EXCESS, dont l'argument est une donnée numérique, spécifiée, en règle générale, sous la forme d'un intervalle de cellules, par exemple : = EXCESS (A1 : A100).

§2.3. Outil d'analyse Statistiques descriptives

V Exceller il est possible de calculer toutes les caractéristiques ponctuelles de l'échantillon à la fois à l'aide de l'outil d'analyse Statistiques descriptives qui est contenu dans Paquet d'analyse.

Statistiques descriptives crée un tableau de statistiques de base pour l'ensemble de données. Ce tableau contiendra les caractéristiques suivantes : moyenne, erreur standard, variance, écart type, mode, médiane, plage de variation d'intervalle, valeurs maximales et minimales, asymétrie, kurtosis, taille de la population, somme de tous les éléments de la population, intervalle de confiance (niveau de fiabilité ). Outil Statistiques descriptives simplifie grandement l'analyse statistique en éliminant le besoin d'appeler chaque fonction pour calculer les caractéristiques statistiques séparément.

Afin d'appeler Statistiques descriptives, suit :

1) dans le menu Service choisis une équipe L'analyse des données;

2) dans la liste Outils d'analyse boite de dialogue L'analyse des données choisir un outil Statistiques descriptives et appuyez sur D'ACCORD.

Dans la fenêtre Statistiques descriptives nécessaire:

· dans un groupe Des données d'entrée dans le champ Intervalle d'entrée spécifier la plage de cellules contenant des données ;

Si la première ligne de la plage d'entrée contient un en-tête de colonne, alors dans le champ Libellés sur la première ligne cochez la case ;

· dans un groupe Options de sortie activer l'interrupteur (cocher la case) Statistiques récapitulatives si vous avez besoin d'une liste complète des caractéristiques ;

Activer l'interrupteur Niveau de fiabilité et indiquer la fiabilité en% s'il est nécessaire de calculer l'intervalle de confiance (par défaut, la fiabilité est de 95%). Cliquez sur D'ACCORD.

En conséquence, un tableau apparaîtra avec les valeurs calculées des caractéristiques statistiques ci-dessus. Immédiatement, sans effacer la sélection de cette table, exécutez la commande Format® Colonne® Largeur d'ajustement automatique.

Affichage de la boîte de dialogue Statistiques descriptives:

Tâches pratiques

2.1. Calcul des statistiques de points de base à l'aide de fonctions standard Exceller

Le même voltmètre a mesuré la tension aux bornes du circuit 25 fois. À la suite des expériences, les valeurs de tension suivantes en volts ont été obtenues:

32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35,

34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30.

Trouvez la moyenne, la variance échantillonnée et corrigée, l'écart type, la plage, le mode, la médiane. Vérifiez l'écart par rapport à la distribution normale en calculant l'asymétrie et l'aplatissement.

Effectuez les étapes suivantes pour effectuer cette tâche.

1. Saisissez les résultats de votre expérience dans la colonne A.

2. Dans la cellule B1, tapez « Moyenne », en B2 - « Ecart type sélectionné », en B3 - « Ecart type », en B4 - « Ecart corrigé », en B5 - « Ecart type corrigé », en B6 - « Maximum » , en B7 - « Minimum », en B8 - « Plage de variation », en B9 - « Mode », en B10 - « Médiane », en B11 - « Asymétrie », en B12 - « Excès ».

3. Alignez la largeur de cette colonne avec Ajustement automatique largeur.

4. Sélectionnez la cellule C1 et cliquez sur le bouton avec le signe "=" dans la barre de formule. En utilisant Assistants de fonction dans la catégorie Statistique trouvez la fonction MOYENNE, puis mettez en surbrillance la plage de cellules de données et appuyez sur D'ACCORD.

5. Sélectionnez la cellule C2 et cliquez sur le signe = dans la barre de formule. En utilisant Assistants de fonction dans la catégorie Statistique trouvez la fonction VARP, puis mettez en surbrillance la plage de cellules de données et appuyez sur D'ACCORD.

6. Faites de même pour vous-même pour calculer le reste des caractéristiques.

7. Pour calculer la plage de variation dans la cellule C8, entrez la formule : = C6-C7.

8. Ajoutez une ligne devant votre tableau, dans laquelle tapez les en-têtes des colonnes correspondantes : "Nom des caractéristiques" et "Valeurs numériques".



 


Lire:



Horoscope individuel par date de naissance gratuit avec décodage de l'horoscope oriental de demain

Horoscope individuel par date de naissance gratuit avec décodage de l'horoscope oriental de demain

BÉLIER DATE DE NAISSANCE: 21.03 - 20.04 Lundi Tout travail sera effectué par vous aujourd'hui facilement et naturellement. Ils se précipiteront rapidement et en douceur ...

Calendrier des semis pour la table d'avril

Calendrier des semis pour la table d'avril

Vous pouvez difficilement trouver un jardin sans tulipes. Mais peu importe la richesse de la variété des variétés, nous voulons toujours quelque chose ...

Quelle sera l'année du Coq pour le Rat ?

Quelle sera l'année du Coq pour le Rat ?

Les rats sont des créatures indépendantes, et en 2017, ils pourront faire leurs preuves dans le domaine de l'entrepreneuriat - il est temps d'ouvrir votre propre entreprise et de lui donner vie ...

Horoscope commun et amour : Homme-serpent

Horoscope commun et amour : Homme-serpent

L'homme serpent est le signe le plus étrange et le plus imprévisible de l'horoscope oriental. Sa vie est entourée de secrets, tout comme sa personnalité. Un animal peut...

image de flux RSS