domicile - Des murs
Comment trouver la valeur souhaitée par l'écart type. écart type de formule dans excel

Selon l'enquête par sondage, les déposants ont été regroupés en fonction de la taille du dépôt à la Sberbank de la ville :

Définir:

1) plage de variation ;

2) montant moyen du dépôt ;

3) écart linéaire moyen ;

4) dispersion ;

5) écart type ;

6) coefficient de variation des cotisations.

Solution:

Cette série de distribution contient des intervalles ouverts. Dans de telles séries, la valeur de l'intervalle du premier groupe est conventionnellement supposée égale à la valeur de l'intervalle du suivant, et la valeur de l'intervalle du dernier groupe est égale à la valeur de l'intervalle du précédent. un.

La valeur d'intervalle du deuxième groupe est 200, par conséquent, la valeur du premier groupe est également 200. La valeur d'intervalle de l'avant-dernier groupe est 200, ce qui signifie que le dernier intervalle aura également une valeur égale à 200.

1) Définissez la plage de variation comme la différence entre la plus grande et la plus petite valeur de l'attribut :

La plage de variation de la taille de la contribution est de 1000 roubles.

2) La taille moyenne de la contribution est déterminée par la formule de la moyenne pondérée arithmétique.

Déterminons au préalable la valeur discrète de l'attribut dans chaque intervalle. Pour ce faire, en utilisant la simple formule de la moyenne arithmétique, nous trouvons les milieux des intervalles.

La valeur moyenne du premier intervalle sera égale à :

la seconde - 500, etc.

Mettons les résultats des calculs dans le tableau:

Montant du dépôt, frotter.Nombre de contributeurs, fLe milieu de l'intervalle, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Le total 400 - 312000

Le dépôt moyen dans la Sberbank de la ville sera de 780 roubles :

3) L'écart linéaire moyen est la moyenne arithmétique des écarts absolus des valeurs individuelles de l'attribut par rapport à la moyenne totale :

La procédure de calcul de l'écart linéaire moyen dans la série de distribution d'intervalle est la suivante :

1. La moyenne pondérée arithmétique est calculée, comme indiqué au paragraphe 2).

2. Les écarts absolus de la variante par rapport à la moyenne sont déterminés :

3. Les écarts obtenus sont multipliés par les fréquences :

4. La somme des écarts pondérés est trouvée sans tenir compte du signe :

5. La somme des écarts pondérés est divisée par la somme des fréquences :

Il est pratique d'utiliser le tableau des données calculées :

Montant du dépôt, frotter.Nombre de contributeurs, fLe milieu de l'intervalle, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Le total 400 - - - 81280

L'écart linéaire moyen de la taille du dépôt des clients de la Sberbank est de 203,2 roubles.

4) La dispersion est la moyenne arithmétique des écarts au carré de chaque valeur de caractéristique par rapport à la moyenne arithmétique.

Le calcul de la variance dans la série de distribution d'intervalle est effectué selon la formule :

La procédure de calcul de la variance dans ce cas est la suivante :

1. Déterminer la moyenne arithmétique pondérée, comme indiqué au paragraphe 2).

2. Trouvez les écarts par rapport à la moyenne :

3. Mise au carré de l'écart de chaque option par rapport à la moyenne :

4. Multipliez les écarts au carré par les poids (fréquences) :

5. Résumez les travaux reçus :

6. Le montant obtenu est divisé par la somme des pondérations (fréquences) :

Mettons les calculs dans un tableau :

Montant du dépôt, frotter.Nombre de contributeurs, fLe milieu de l'intervalle, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Le total 400 - - - 23040000

Le programme Excel est très apprécié des professionnels et des amateurs, car un utilisateur de tout niveau de formation peut travailler avec. Par exemple, toute personne ayant des compétences minimales en "communication" avec Excel peut dessiner un graphique simple, faire un signe décent, etc.

Dans le même temps, ce programme vous permet même d'effectuer différents types de calculs, par exemple des calculs, mais cela nécessite déjà un niveau de formation légèrement différent. Cependant, si vous venez de vous familiariser avec ce programme et que vous êtes intéressé par tout ce qui vous aidera à devenir un utilisateur plus avancé, cet article est pour vous. Aujourd'hui je vais vous dire quelle est la moyenne écart-type formule dans Excel, pourquoi est-elle nécessaire et, en fait, quand est-elle utilisée. Aller!

Ce que c'est

Commençons par la théorie. L'écart type est appelé Racine carrée, obtenu à partir de la moyenne arithmétique de toutes les différences au carré entre les valeurs disponibles, ainsi que leur moyenne arithmétique. Soit dit en passant, cette valeur est généralement appelée la lettre grecque "sigma". L'écart type est calculé à l'aide de la formule STDEV, respectivement, le programme le fait pour l'utilisateur lui-même.

L'essence de ce concept est d'identifier le degré de variabilité de l'instrument, c'est-à-dire qu'il est, à sa manière, un indicateur issu des statistiques descriptives. Il révèle les changements dans la volatilité de l'instrument à n'importe quelle période. À l'aide des formules STDEV, vous pouvez estimer l'écart type dans un échantillon, tandis que les valeurs logique et valeurs de texte sont ignorés.

Formule

Aide à calculer l'écart type en formule excel, qui est automatiquement fourni dans Excel. Pour le trouver, vous devez trouver la section de formule dans Excel, et déjà sélectionner celle qui porte le nom STDEV, c'est donc très simple.

Après cela, une fenêtre apparaîtra devant vous dans laquelle vous devrez saisir des données pour le calcul. En particulier, deux nombres doivent être entrés dans des champs spéciaux, après quoi le programme calculera automatiquement l'écart type pour l'échantillon.

Sans aucun doute, les formules mathématiques et les calculs sont un problème assez compliqué, et tous les utilisateurs ne peuvent pas y faire face dès le départ. Cependant, si vous creusez un peu plus et comprenez le problème un peu plus en détail, il s'avère que tout n'est pas si triste. J'espère que vous en êtes convaincu par l'exemple du calcul de l'écart type.

Vidéo pour aider

X je - valeurs aléatoires (actuelles);

X la valeur moyenne des variables aléatoires dans l'échantillon est calculée par la formule :

Alors, la variance est le carré moyen des écarts . Autrement dit, la valeur moyenne est d'abord calculée, puis prise la différence entre chaque valeur originale et moyenne, au carré , est additionné puis divisé par le nombre de valeurs dans la population donnée.

La différence entre la valeur individuelle et la moyenne reflète la mesure de l'écart. Il est au carré de sorte que tous les écarts deviennent exclusivement nombres positifs et pour éviter l'annulation mutuelle des écarts positifs et négatifs lors de leur addition. Ensuite, étant donné les écarts au carré, nous calculons simplement la moyenne arithmétique.

indice mot magique"dispersion" n'est que ces trois mots: moyenne - carré - déviations.

Écart-type (RMS)

En prenant la racine carrée de la dispersion, on obtient le soi-disant " écart-type". Il y a des noms "écart-type" ou "sigma" (du nom de la lettre grecque σ .). La formule de l'écart type est :

Alors, la variance est sigma au carré, ou - l'écart type au carré.

L'écart type, évidemment, caractérise également la mesure de la dispersion des données, mais maintenant (contrairement à la dispersion) il peut être comparé aux données d'origine, car elles ont les mêmes unités de mesure (cela ressort clairement de la formule de calcul). La plage de variation est la différence entre les valeurs extrêmes. L'écart type, en tant que mesure de l'incertitude, est également impliqué dans de nombreux calculs statistiques. Il définit le degré de précision diverses estimations et prévisions. Si la variation est très importante, l'écart type se révélera également important, par conséquent, la prévision sera inexacte, ce qui sera exprimé, par exemple, dans des intervalles de confiance très larges.

Par conséquent, dans les méthodes de traitement statistique des données dans les évaluations immobilières, en fonction de la précision requise de la tâche, la règle de deux ou trois sigmas est utilisée.

Pour comparer la règle des deux sigma et la règle des trois sigma, nous utilisons la formule de Laplace :

F - F,

où Ф(x) est la fonction de Laplace ;



Valeur minimum

β = valeur maximum

s = valeur sigma (écart type)

a = valeur moyenne

Dans ce cas, il est utilisé vue privée Formules de Laplace lorsque les limites des valeurs α et β Variable aléatoire X est également espacé du centre de distribution a = M(X) par une certaine valeur d : a = a-d, b = a+d. Ou (1) La formule (1) détermine la probabilité d'un écart donné d d'une variable aléatoire X avec une loi de distribution normale à partir de son espérance mathématique М(X) = a. Si dans la formule (1) on prend successivement d = 2s et d = 3s, alors on obtient : (2), (3).

Règle des deux sigma

De manière presque fiable (avec une probabilité de confiance de 0,954), on peut affirmer que toutes les valeurs d'une variable aléatoire X avec une loi de distribution normale s'écartent de son espérance mathématique M(X) = a d'une quantité non supérieure à 2s (deux normes écarts). La probabilité de confiance (Pd) est la probabilité d'événements acceptés conditionnellement comme fiables (leur probabilité est proche de 1).

Illustrons géométriquement la règle des deux sigma. Sur la fig. 6 montre une courbe gaussienne avec un centre de distribution a. L'aire délimitée par la courbe entière et l'axe Ox vaut 1 (100%), et l'aire du trapèze curviligne entre les abscisses a–2s et a+2s, selon la règle des deux sigma, vaut 0,954 (95,4% de la superficie totale). L'aire des zones ombrées est égale à 1-0,954 = 0,046 (>5% de l'aire totale). Ces sections sont appelées la plage critique de la variable aléatoire. Les valeurs d'une variable aléatoire qui tombent dans la région critique sont peu probables et en pratique sont conditionnellement considérées comme impossibles.

Probabilité Conditionnellement valeurs impossibles est appelé niveau de signification de la variable aléatoire. Le niveau de signification est lié au niveau de confiance par la formule :

où q est le niveau de signification, exprimé en pourcentage.

Règle des trois sigma

Lors de la résolution de problèmes nécessitant une plus grande fiabilité, lorsque la probabilité de confiance (Pd) est prise égale à 0,997 (plus précisément, 0,9973), au lieu de la règle des deux sigma, selon la formule (3), la règle est utilisée trois sigma.



Selon règle des trois sigma avec un niveau de confiance de 0,9973, la zone critique sera la zone des valeurs d'attribut en dehors de l'intervalle (a-3s, a+3s). Le seuil de signification est de 0,27 %.

Autrement dit, la probabilité que valeur absolue les écarts dépasseront trois fois l'écart-type, est très faible, à savoir égal à 0,0027 = 1-0,9973. Cela signifie que cela ne peut se produire que dans 0,27% des cas. De tels événements, basés sur le principe de l'impossibilité d'événements improbables, peuvent être considérés comme pratiquement impossibles. Celles. échantillonnage de haute précision.

C'est l'essence de la règle des trois sigma :

Si une variable aléatoire est distribuée normalement, la valeur absolue de son écart par rapport à l'espérance mathématique ne dépasse pas trois fois l'écart type (RMS).

En pratique, la règle des trois sigma s'applique comme suit : si la distribution de la variable aléatoire étudiée est inconnue, mais que la condition spécifiée dans la règle ci-dessus est remplie, alors il y a lieu de supposer que la variable étudiée est distribuée normalement ; sinon, il n'est pas distribué normalement.

Le niveau d'importance est pris en fonction du degré de risque autorisé et de la tâche. Pour les évaluations immobilières, un échantillon moins précis est généralement prélevé, suivant la règle des deux sigma.

Dispersion. Écart-type

Dispersion est la moyenne arithmétique des écarts au carré de chaque valeur de caractéristique par rapport à la moyenne totale. Selon les données sources, la variance peut être non pondérée (simple) ou pondérée.

La dispersion est calculée à l'aide des formules suivantes :

pour les données non groupées

pour les données groupées

La procédure de calcul de la variance pondérée :

1. déterminer la moyenne pondérée arithmétique

2. Les écarts de variante par rapport à la moyenne sont déterminés

3. Mettez au carré l'écart de chaque option par rapport à la moyenne

4. multiplier les écarts au carré par des poids (fréquences)

5. résumer les travaux reçus

6. le montant obtenu est divisé par la somme des poids

La formule pour déterminer la variance peut être convertie en la formule suivante :

- Facile

La procédure de calcul de la variance est simple :

1. déterminer la moyenne arithmétique

2. mettre au carré la moyenne arithmétique

3. carré chaque option de ligne

4. trouver l'option somme des carrés

5. diviser la somme des carrés de l'option par leur nombre, c'est-à-dire déterminer le carré moyen

6. déterminer la différence entre le carré moyen de la caractéristique et le carré de la moyenne

De plus, la formule de détermination de la variance pondérée peut être convertie en la formule suivante :

celles. la variance est égale à la différence entre la moyenne des carrés des valeurs des caractéristiques et le carré de la moyenne arithmétique. Lors de l'utilisation de la formule convertie, une procédure supplémentaire de calcul des écarts des valeurs individuelles de l'attribut par rapport à x est exclue et l'erreur de calcul associée à l'arrondi des écarts est exclue

La dispersion a un certain nombre de propriétés, dont certaines facilitent le calcul :

1) la dispersion d'une valeur constante est nulle ;

2) si toutes les variantes des valeurs d'attribut sont réduites du même nombre, la variance ne diminuera pas ;

3) si toutes les variantes des valeurs d'attribut sont réduites du même nombre de fois (fois), alors la variance diminuera d'un facteur de

Écart type S- est la racine carrée de la variance :

Pour les données non groupées :

;

Pour une série de variantes :

La plage de variation, l'écart linéaire moyen et l'écart quadratique moyen sont appelés quantités. Ils ont les mêmes unités que valeurs individuelles signe.

La dispersion et l'écart type sont les mesures de variation les plus largement utilisées. Cela s'explique par le fait qu'ils sont inclus dans la plupart des théorèmes de la théorie des probabilités, qui sert de fondement aux statistiques mathématiques. De plus, la variance peut être décomposée en ses éléments constitutifs, ce qui permet d'estimer l'effet divers facteurs qui déterminent la variation du trait.

Le calcul des indicateurs de variation pour les banques regroupées par résultat est présenté dans le tableau.

Bénéfice, millions de roubles Nombre de banques indicateurs calculés
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Le total: 121,70 17,640 23,126

L'écart moyen linéaire et l'écart quadratique moyen montrent à quel point la valeur de l'attribut fluctue en moyenne pour les unités et la population étudiées. Oui, dans ce cas valeur moyenne les fluctuations du montant des bénéfices sont: selon l'écart linéaire moyen de 0,882 million de roubles; selon l'écart type - 1,075 million de roubles. L'écart type est toujours supérieur à l'écart linéaire moyen. Si la distribution du trait est proche de la normale, alors il existe une relation entre S et d : S=1,25d, ou d=0,8S. L'écart-type montre comment la majeure partie des unités de population sont situées par rapport à la moyenne arithmétique. Quelle que soit la forme de distribution, 75 valeurs d'attributs se situent dans l'intervalle x 2S, et au moins 89 de toutes les valeurs se situent dans l'intervalle x 3S (théorème de P.L. Chebyshev).

La racine carrée de la variance est appelée l'écart type par rapport à la moyenne, qui est calculé comme suit :

élémentaire transformation algébrique formules pour l'écart-type le conduit à la forme suivante :

Cette formule est souvent plus commode dans la pratique des calculs.

L'écart type, ainsi que l'écart linéaire moyen, indiquent dans quelle mesure les valeurs spécifiques de l'attribut s'écartent en moyenne de leur valeur moyenne. L'écart type est toujours supérieur à l'écart linéaire moyen. Il y a une relation entre eux :

Connaissant ce rapport, il est possible de déterminer l'inconnue à partir des indicateurs connus, par exemple, mais (JE calculer et inversement. L'écart type mesure la taille absolue de la fluctuation des attributs et est exprimé dans les mêmes unités que les valeurs des attributs (roubles, tonnes, années, etc.). C'est une mesure absolue de la variation.

Pour fonctionnalités alternatives, par exemple présence ou absence l'enseignement supérieur, d'assurance, de variance et d'écart type sont :

Montrons le calcul de l'écart-type selon les données d'une série discrète caractérisant la répartition des étudiants d'une des facultés de l'université selon l'âge (tableau 6.2).

Tableau 6.2.

Les résultats des calculs auxiliaires sont donnés dans les colonnes 2 à 5 du tableau. 6.2.

L'âge moyen d'un élève, ans, est déterminé par la formule moyenne arithmétique pondérée (colonne 2) :

Les carrés de l'écart de l'âge individuel de l'élève par rapport à la moyenne sont contenus dans les colonnes 3-4, et les produits des carrés des écarts par les fréquences correspondantes sont dans la colonne 5.

La dispersion de l'âge des étudiants, en années, on trouve par la formule (6.2) :

Alors o \u003d l / 3,43 1,85 * oda, c'est-à-dire chaque valeur spécifique de l'âge de l'élève s'écarte de la valeur moyenne de 1,85 an.

Le coefficient de variation

En valeur absolue, l'écart-type dépend non seulement du degré de variation du trait, mais aussi des niveaux absolus des variants et de la moyenne. Par conséquent, pour comparer les moyennes écarts types série variationnelle avec des niveaux moyens différents n'est pas directement possible. Pour pouvoir faire une telle comparaison, il faut trouver gravité spécifique l'écart moyen (linéaire ou quadratique) de la moyenne arithmétique, exprimé en pourcentage, c'est-à-dire calculer indicateurs relatifs de variation.

Coefficient de variation linéaire calculé selon la formule

Le coefficient de variation déterminé par la formule suivante :

Dans les coefficients de variation, non seulement l'incompatibilité associée aux différentes unités de mesure du trait étudié est éliminée, mais également l'incompatibilité résultant des différences dans la valeur des moyennes arithmétiques. De plus, les indicateurs de variation donnent une caractéristique de l'homogénéité de la population. L'ensemble est considéré comme homogène si le coefficient de variation ne dépasse pas 33 %.

Selon le tableau. 6.2 et les résultats des calculs obtenus ci-dessus, nous déterminons le coefficient de variation,%, selon la formule (6.3):

Si le coefficient de variation dépasse 33%, cela indique l'hétérogénéité de la population étudiée. La valeur obtenue dans notre cas indique que la population d'étudiants par âge est homogène dans sa composition. Ainsi, une fonction importante des indicateurs de variation généralisants est l'évaluation de la fiabilité des moyennes. Le moins c1, a2 et V, plus l'ensemble de phénomènes résultant est homogène et plus la moyenne obtenue est fiable. Selon la « règle des trois sigmas » considérée par la statistique mathématique, dans les séries normalement distribuées ou proches de celles-ci, des écarts à la moyenne arithmétique, n'excédant pas ± 3e, surviennent dans 997 cas sur 1000. Ainsi, sachant X et a, vous pouvez vous faire une première idée générale de la série de variations. Si, par exemple, la moyenne salaire employé dans l'entreprise s'élevait à 25 000 roubles et a est égal à 100 roubles, alors avec une probabilité proche de la fiabilité, on peut affirmer que les salaires des employés de l'entreprise varient de (25 000 ± 3 x 100) c'est-à-dire de 24 700 à 25 300 roubles.



 


Lire:



Systèmes de stockage : DAS, NAS, SAN

Systèmes de stockage : DAS, NAS, SAN

Pendant la majeure partie des années 2000, la plupart des familles possédant un ordinateur n'avaient qu'un seul PC avec un seul disque dur. Si vous aviez besoin...

Comment filigraner votre photo facilement de quelques façons sympas

Comment filigraner votre photo facilement de quelques façons sympas

Parfois, il devient extrêmement nécessaire de protéger vos photos ou images contre le vol et la distribution sur d'autres ressources qui sont généralement...

Services réseau et services réseau

Services réseau et services réseau

La tâche de la couche de données est de fournir des services à la couche réseau. Le service principal est le transfert de données depuis la couche réseau...

Quel est le meilleur Intel ou AMD. Intel ou AMD ? Nous assemblons un bureau et un PC universel

Quel est le meilleur Intel ou AMD.  Intel ou AMD ?  Nous assemblons un bureau et un PC universel

Construire un ordinateur peut être très difficile, surtout si vous n'êtes pas expérimenté dans la résolution de tels problèmes. Il y a une somme énorme...

flux d'images RSS