Maison - Je peux faire les réparations moi-même
L'écart type est mesuré en. Variance : générale, échantillon, corrigée

Dans les tests statistiques d'hypothèses, lors de la mesure d'une relation linéaire entre des variables aléatoires.

Moyenne écart type:

Écart type(estimation de l'écart type de la variable aléatoire Sol, des murs qui nous entourent et du plafond, xà son sujet espérance mathématique sur la base d’une estimation impartiale de sa variance) :

où est la dispersion ; - Le sol, les murs qui nous entourent et le plafond, jeème élément de la sélection ; - taille de l'échantillon ; - moyenne arithmétique de l'échantillon :

Il convient de noter que les deux estimations sont biaisées. DANS cas général Il est impossible de construire une estimation impartiale. Cependant, l'estimation basée sur l'estimation de la variance sans biais est cohérente.

Règle des trois sigma

Règle des trois sigma() - presque toutes les valeurs d'une variable aléatoire normalement distribuée se trouvent dans l'intervalle. Plus strictement - avec un degré de confiance d'au moins 99,7 %, la valeur d'une variable aléatoire normalement distribuée se situe dans l'intervalle spécifié (à condition que la valeur soit vraie et non obtenue à la suite d'un traitement d'échantillon).

Si la vraie valeur est inconnue, alors nous ne devrions pas utiliser, mais le sol, les murs qui nous entourent et le plafond, s. Ainsi, la règle des trois sigma se transforme en règle des trois. Sol, murs qui nous entourent et plafond, s .

Interprétation de la valeur de l'écart type

Une valeur d'écart type élevée montre un large écart de valeurs dans l'ensemble présenté avec la valeur moyenne de l'ensemble ; une petite valeur, par conséquent, montre que les valeurs de l'ensemble sont regroupées autour de la valeur moyenne.

Par exemple, nous avons trois ensembles de nombres : (0, 0, 14, 14), (0, 6, 8, 14) et (6, 6, 8, 8). Les trois ensembles ont des valeurs moyennes égales à 7 et des écarts types, respectivement égaux à 7, 5 et 1. Le dernier ensemble a un petit écart type, puisque les valeurs de l'ensemble sont regroupées autour de la valeur moyenne ; le premier ensemble a le plus grande valeurécart type - les valeurs de l'ensemble s'écartent considérablement de la valeur moyenne.

D'une manière générale, l'écart type peut être considéré comme une mesure de l'incertitude. Par exemple, en physique, l’écart type est utilisé pour déterminer l’erreur d’une série de mesures successives d’une certaine quantité. Cette valeur est très importante pour déterminer la plausibilité du phénomène étudié par rapport à la valeur prédite par la théorie : si la valeur moyenne des mesures diffère fortement des valeurs prédites par la théorie (grand écart type), alors les valeurs obtenues ou la méthode pour les obtenir doivent être revérifiées.

Application pratique

En pratique, l'écart type permet de déterminer dans quelle mesure les valeurs d'un ensemble peuvent différer de la valeur moyenne.

Climat

Supposons qu’il y ait deux villes avec la même température quotidienne maximale moyenne, mais l’une est située sur la côte et l’autre à l’intérieur des terres. On sait que les villes situées sur la côte ont de nombreuses températures diurnes maximales différentes, inférieures à celles des villes situées à l'intérieur des terres. Par conséquent, l'écart type des températures quotidiennes maximales pour une ville côtière sera inférieur à celui de la deuxième ville, malgré le fait que leur valeur moyenne soit la même, ce qui signifie en pratique que la probabilité que la température maximale de l'air de chaque jour spécifique par an différera plus fortement de la valeur moyenne, plus élevée pour une ville située à l’intérieur du continent.

Sport

Supposons qu'il existe plusieurs équipes de football qui sont évaluées en fonction d'un certain ensemble de paramètres, par exemple le nombre de buts marqués et encaissés, les occasions de marquer, etc. Il est fort probable que la meilleure équipe de ce groupe aura meilleures valeurs Par plus paramètres. Plus l’écart type de l’équipe pour chacun des paramètres présentés est petit, plus le résultat de l’équipe est prévisible ; En revanche, l'équipe avec grande valeur L'écart type rend difficile la prévision du résultat, qui à son tour s'explique par un déséquilibre, par exemple une défense forte mais une attaque faible.

L'utilisation de l'écart type des paramètres d'équipe permet, à un degré ou à un autre, de prédire le résultat d'un match entre deux équipes, en évaluant les forces et faiblesses les commandements, et donc les méthodes de lutte choisies.

Analyse technique

Voir aussi

Littérature

* Borovikov, V. STATISTIQUES. L'art de l'analyse des données sur ordinateur : Pour les professionnels / V. Borovikov. - Saint-Pétersbourg. : Pierre, 2003. - 688 p. -ISBN5-272-00078-1.

Dans cet article, je parlerai de comment trouver l'écart type. Ce matériel est extrêmement important pour une compréhension complète des mathématiques, c'est pourquoi un tuteur en mathématiques devrait consacrer une leçon distincte, voire plusieurs, à son étude. Dans cet article, vous trouverez un lien vers un didacticiel vidéo détaillé et compréhensible qui explique ce qu'est l'écart type et comment le trouver.

Écart type permet d'évaluer l'étalement des valeurs obtenues suite à la mesure d'un certain paramètre. Indiqué par le symbole (lettre grecque "sigma").

La formule de calcul est assez simple. Pour trouver l’écart type, vous devez prendre la racine carrée de la variance. Alors maintenant, vous devez vous demander : « Qu’est-ce que la variance ? »

Qu'est-ce que la variance

La définition de la variance est la suivante. La dispersion est la moyenne arithmétique des carrés des écarts des valeurs par rapport à la moyenne.

Pour trouver la variance, effectuez les calculs suivants de manière séquentielle :

  • Déterminer la moyenne (simple moyenne arithmétique d'une série de valeurs).
  • Soustrayez ensuite la moyenne de chaque valeur et mettez au carré la différence résultante (vous obtenez différence au carré).
  • L'étape suivante consiste à calculer la moyenne arithmétique des carrés des différences résultants (vous pouvez découvrir pourquoi exactement les carrés ci-dessous).

Regardons un exemple. Disons que vous et vos amis décidez de mesurer la taille de vos chiens (en millimètres). Suite aux mesures, vous avez reçu les mesures de hauteur suivantes (au garrot) : 600 mm, 470 mm, 170 mm, 430 mm et 300 mm.

Calculons la moyenne, la variance et l'écart type.

Trouvons d'abord la valeur moyenne. Comme vous le savez déjà, pour ce faire, vous devez additionner toutes les valeurs mesurées et diviser par le nombre de mesures. Avancement du calcul :

Moyenne mm.

Ainsi, la moyenne (moyenne arithmétique) est de 394 mm.

Il nous faut maintenant déterminer écart de la taille de chaque chien par rapport à la moyenne:

Enfin, calculer l'écart, on met au carré chacune des différences résultantes, puis on trouve la moyenne arithmétique des résultats obtenus :

Dispersion mm 2 .

Ainsi, la dispersion est de 21704 mm 2.

Comment trouver l'écart type

Alors, comment pouvons-nous maintenant calculer l’écart type, connaissant la variance ? Comme nous nous en souvenons, prenez-en la racine carrée. Autrement dit, l’écart type est égal à :

Mm (arrondi au nombre entier le plus proche en mm).

Grâce à cette méthode, nous avons constaté que certains chiens (par exemple les Rottweilers) sont de très gros chiens. Mais il y a aussi de très petits chiens (par exemple les teckels, mais il ne faut pas leur dire ça).

Le plus intéressant c'est que l'écart type entraîne informations utiles. Nous pouvons maintenant montrer lesquels des résultats de mesure de hauteur obtenus se situent dans l'intervalle que nous obtenons si nous traçons l'écart type par rapport à la moyenne (des deux côtés de celle-ci).

C'est-à-dire qu'en utilisant l'écart type, nous obtenons une méthode « standard » qui nous permet de savoir laquelle des valeurs est normale (statistiquement moyenne) et laquelle est extraordinairement grande ou, au contraire, petite.

Qu'est-ce que l'écart type

Mais... tout sera un peu différent si on analyse échantillon données. Dans notre exemple, nous avons considéré population générale. Autrement dit, nos 5 chiens étaient les seuls chiens au monde qui nous intéressaient.

Mais si les données sont un échantillon (valeurs sélectionnées parmi une large population), alors les calculs doivent être effectués différemment.

S'il y a des valeurs, alors :

Tous les autres calculs sont effectués de la même manière, y compris la détermination de la moyenne.

Par exemple, si nos cinq chiens ne sont qu’un échantillon de la population canine (tous les chiens de la planète), il faut diviser par 4, pas 5,à savoir:

Variance de l'échantillon = mm2.

Dans ce cas, l’écart type de l’échantillon est égal à mm (arrondi au nombre entier le plus proche).

On peut dire que nous avons fait quelques « corrections » dans le cas où nos valeurs ne sont qu'un petit échantillon.

Note. Pourquoi exactement les différences au carré ?

Mais pourquoi prenons-nous exactement les carrés des différences lors du calcul de la variance ? Disons qu'en mesurant un paramètre, vous avez reçu l'ensemble de valeurs suivant : 4 ; 4 ; -4 ; -4. Si l'on additionne simplement les écarts absolus par rapport à la moyenne (différences)... les valeurs négatives s'annulent avec les positives :

.

Il s’avère que cette option est inutile. Alors peut-être vaut-il la peine d'essayer les valeurs absolues des écarts (c'est-à-dire les modules de ces valeurs) ?

À première vue, cela s'avère bien (la valeur résultante est d'ailleurs appelée l'écart absolu moyen), mais pas dans tous les cas. Essayons un autre exemple. Soit le résultat de la mesure dans l'ensemble de valeurs suivant : 7 ; 1 ; -6 ; -2. Alors l’écart absolu moyen est :

Ouah! Encore une fois, nous avons obtenu un résultat de 4, même si les différences sont beaucoup plus étendues.

Voyons maintenant ce qui se passe si nous mettons les différences au carré (et prenons ensuite la racine carrée de leur somme).

Pour le premier exemple ce sera :

.

Pour le deuxième exemple ce sera :

Maintenant, c’est une tout autre affaire ! Plus les différences sont étendues, plus l'écart type est grand... ce que nous visions.

En fait, cette méthode utilise la même idée que pour calculer la distance entre les points, mais appliquée de manière différente.

Et d'un point de vue mathématique, l'utilisation des carrés et racines carrées offre plus d'avantages que ce que nous pourrions obtenir des valeurs absolues des écarts, rendant l'écart type applicable à d'autres problèmes mathématiques.

Sergey Valerievich vous a expliqué comment trouver l'écart type

Leçon n°4

Sujet : « Statistiques descriptives. Indicateurs de diversité des traits dans l'ensemble"

Les principaux critères de diversité d'une caractéristique dans une population statistique sont : la limite, l'amplitude, l'écart type, le coefficient d'oscillation et le coefficient de variation. Dans la leçon précédente, il a été discuté du fait que les valeurs moyennes ne fournissent qu'une caractéristique généralisée de la caractéristique étudiée dans son ensemble et ne prennent pas en compte les valeurs de ses variantes individuelles : valeurs minimales et maximales, supérieures à la moyenne, inférieures moyenne, etc.

Exemple. Valeurs moyennes de deux séquences de nombres différentes : -100 ; -20 ; 100 ; 20 et 0,1 ; -0,2 ; 0,1 sont absolument identiques et égauxÀ PROPOS DE.Cependant, les plages de dispersion de ces données de séquence moyenne relative sont très différentes.

La détermination des critères énumérés pour la diversité d'une caractéristique s'effectue principalement en tenant compte de sa valeur dans les éléments individuels de la population statistique.

Les indicateurs permettant de mesurer la variation d'un trait sont absolu Et relatif. Les indicateurs absolus de variation comprennent : la plage de variation, la limite, l'écart type, la dispersion. Le coefficient de variation et le coefficient d'oscillation font référence à des mesures relatives de variation.

Limite (lim)– Il s'agit d'un critère déterminé par les valeurs extrêmes d'une variante dans une série de variations. Autrement dit, ce critère se limite aux valeurs minimale et maximale de l'attribut :

Amplitude (Am) ou plage de variation – C'est la différence entre les options extrêmes. Le calcul de ce critère s'effectue en soustrayant sa valeur minimale de la valeur maximale de l'attribut, ce qui permet d'estimer le degré de dispersion de l'option :

L'inconvénient de la limite et de l'amplitude comme critères de variabilité est qu'ils dépendent entièrement des valeurs extrêmes de la caractéristique dans la série de variation. Dans ce cas, les fluctuations des valeurs d'attribut au sein d'une série ne sont pas prises en compte.

La description la plus complète de la diversité d'un trait dans une population statistique est fournie par écart type(sigma), qui est une mesure générale de l’écart d’une option par rapport à sa valeur moyenne. L'écart type est souvent appelé écart type.

L'écart type est basé sur une comparaison de chaque option avec la moyenne arithmétique d'une population donnée. Puisque dans l'ensemble il y aura toujours des options à la fois inférieures et supérieures, la somme des écarts avec le signe "" sera annulée par la somme des écarts avec le signe "", c'est-à-dire la somme de tous les écarts est nulle. Afin d'éviter l'influence des signes des différences, des écarts par rapport à la moyenne arithmétique quadratique sont pris en compte, c'est-à-dire . La somme des carrés des écarts n’est pas égale à zéro. Pour obtenir un coefficient permettant de mesurer la variabilité, prenez la moyenne de la somme des carrés - cette valeur est appelée écarts :

Essentiellement, la dispersion est le carré moyen des écarts des valeurs individuelles d'une caractéristique par rapport à sa valeur moyenne. Dispersion carré de l’écart type.

La variance est une quantité dimensionnelle (nommée). Ainsi, si les variantes d'une série de nombres sont exprimées en mètres, alors la variance donne des mètres carrés ; si les options sont exprimées en kilogrammes, alors la variance donne le carré de cette mesure (kg 2), etc.

Écart type– racine carrée de la variance :

, puis lors du calcul de la dispersion et de l'écart type au dénominateur de la fraction, au lieu deil faut mettre.

Le calcul de l'écart type peut être divisé en six étapes, qui doivent être effectuées dans un certain ordre :

Application de l’écart type :

a) pour juger de la variabilité des séries de variations et évaluation comparative de la typicité (représentativité) des moyennes arithmétiques. Ceci est nécessaire dans le diagnostic différentiel pour déterminer la stabilité des symptômes.

b) reconstruire la série de variations, c'est-à-dire restauration de sa réponse en fréquence basée sur règles des trois sigma. Dans l'intervalle (М±3σ) 99,7% de toutes les variantes de la série se situent dans l'intervalle (М±2σ) - 95,5% et dans la fourchette (М±1σ) - Option de ligne 68,3 %(Fig.1).

c) pour identifier les options « pop-up »

d) déterminer les paramètres de norme et de pathologie à l'aide d'estimations sigma

e) pour calculer le coefficient de variation

e) calculer l'erreur moyenne de la moyenne arithmétique.

Pour caractériser toute population qui atype de distribution normale , il suffit de connaître deux paramètres : la moyenne arithmétique et l'écart type.

Figure 1. Règle des Trois Sigma

Exemple.

En pédiatrie, l'écart type est utilisé pour évaluer le développement physique des enfants en comparant les données d'un enfant particulier avec les indicateurs standard correspondants. La moyenne arithmétique du développement physique des enfants en bonne santé est prise comme norme. La comparaison des indicateurs avec les normes est effectuée à l'aide de tableaux spéciaux dans lesquels les normes sont indiquées ainsi que leurs échelles sigma correspondantes. On pense que si l'indicateur de développement physique de l'enfant se situe dans la norme (moyenne arithmétique) ±σ, alors développement physique l'enfant (selon cet indicateur) correspond à la norme. Si l'indicateur se situe dans la norme ±2σ, il y a alors un léger écart par rapport à la norme. Si l'indicateur dépasse ces limites, alors le développement physique de l'enfant diffère fortement de la norme (une pathologie est possible).

Outre les indicateurs de variation exprimés en valeurs absolues, la recherche statistique utilise des indicateurs de variation exprimés en valeurs relatives. Coefficient d'oscillation - Il s’agit du rapport entre l’étendue de variation et la valeur moyenne du trait. Coefficient de variation - c'est le rapport de l'écart type à la valeur moyenne de la caractéristique. Généralement, ces valeurs sont exprimées en pourcentages.

Formules de calcul des indicateurs de variation relative :

D'après les formules ci-dessus, il ressort clairement que plus le coefficient est grand V est plus proche de zéro, plus la variation des valeurs de la caractéristique est faible. Plus V, plus le signe est variable.

Dans la pratique statistique, le coefficient de variation est le plus souvent utilisé. Il est utilisé non seulement pour une évaluation comparative de la variation, mais également pour caractériser l'homogénéité de la population. La population est considérée comme homogène si le coefficient de variation ne dépasse pas 33 % (pour des distributions proches de la normale). Arithmétiquement, le rapport de σ et la moyenne arithmétique neutralise l'influence valeur absolue ces caractéristiques, et le rapport en pourcentage fait du coefficient de variation une quantité sans dimension (sans nom).

La valeur résultante du coefficient de variation est estimée en fonction des gradations approximatives du degré de diversité du trait :

Faible - jusqu'à 10%

Moyenne - 10 - 20%

Fort - plus de 20 %

L'utilisation du coefficient de variation est conseillée dans les cas où il est nécessaire de comparer des caractéristiques différentes en taille et en dimension.

La différence entre le coefficient de variation et les autres critères de dispersion est clairement démontrée exemple.

Tableau 1

Composition des travailleurs des entreprises industrielles

Sur la base des caractéristiques statistiques données dans l’exemple, nous pouvons tirer une conclusion sur la relative homogénéité de la composition par âge et du niveau d’éducation des salariés de l’entreprise, compte tenu de la faible stabilité professionnelle du contingent interrogé. Il est facile de voir qu'une tentative de juger ces tendances sociales par l'écart type conduirait à une conclusion erronée, et une tentative de comparer les caractéristiques comptables « expérience professionnelle » et « âge » avec l'indicateur comptable « formation » serait généralement incorrect en raison de l’hétérogénéité de ces caractéristiques.

Médiane et percentiles

Pour les distributions ordinales (de rang), où le critère du milieu de la série est la médiane, l'écart type et la dispersion ne peuvent pas servir de caractéristiques de dispersion de la variante.

Il en va de même pour les séries ouvertes à variations. Cette circonstance est due au fait que les écarts à partir desquels la variance et σ sont calculés sont mesurés à partir de la moyenne arithmétique, qui n'est pas calculée en séries de variations ouvertes et en séries de distributions de caractéristiques qualitatives. Par conséquent, pour une description compressée des distributions, un autre paramètre de dispersion est utilisé - quantile(synonyme - « percentile »), adapté pour décrire des caractéristiques qualitatives et quantitatives sous toute forme de leur distribution. Ce paramètre peut également être utilisé pour convertir des caractéristiques quantitatives en caractéristiques qualitatives. Dans ce cas, ces notes sont attribuées en fonction de l'ordre de quantile auquel correspond une option particulière.

Dans la pratique de la recherche biomédicale, les quantiles suivants sont le plus souvent utilisés :

– médiane ;

, – quartiles (quarts), où – quartile inférieur, quartile supérieur.

Les quantiles divisent la zone de changements possibles dans une série de variations en certains intervalles. La médiane (quantile) est une option qui se situe au milieu d'une série de variations et divise cette série en deux en deux parties égales ( 0,5 Et 0,5 ). Un quartile divise une série en quatre parties : la première partie (quartile inférieur) est une option séparant les options dont les valeurs numériques n'excèdent pas 25% du maximum possible dans cette série, le quartile sépare les options avec une valeur numérique allant jusqu'à 50 % du maximum possible. Le quartile supérieur () sépare les options jusqu'à 75 % des valeurs maximales possibles.

En cas de distribution asymétrique variable par rapport à la moyenne arithmétique, la médiane et les quartiles sont utilisés pour la caractériser. Dans ce cas, la forme suivante d'affichage de la valeur moyenne est utilisée - Meh (;). Par exemple, la caractéristique étudiée – « la période à laquelle l'enfant a commencé à marcher de manière autonome » – a une distribution asymétrique dans le groupe d'étude. Parallèlement, le quartile inférieur () correspond au début de la marche - 9,5 mois, la médiane - 11 mois, le quartile supérieur () - 12 mois. En conséquence, la caractéristique de la tendance moyenne de l'attribut spécifié sera présentée sur 11 (9,5 ; 12) mois.

Évaluation de la signification statistique des résultats de l'étude

La signification statistique des données s'entend comme le degré avec lequel elles correspondent à la réalité affichée, c'est-à-dire les données statistiquement significatives sont celles qui ne déforment pas et ne reflètent pas correctement la réalité objective.

Évaluer la signification statistique des résultats de la recherche signifie déterminer avec quelle probabilité il est possible de transférer les résultats obtenus de la population échantillon à l'ensemble de la population. L’évaluation de la signification statistique est nécessaire pour comprendre dans quelle mesure un phénomène peut être utilisé pour juger le phénomène dans son ensemble et ses tendances.

L'évaluation de la signification statistique des résultats de la recherche consiste à :

1. erreurs de représentativité (erreurs de valeurs moyennes et relatives) - m;

2. limites de confiance des valeurs moyennes ou relatives ;

3. fiabilité de la différence de valeurs moyennes ou relatives selon le critère t.

Erreur type de la moyenne arithmétique ou erreur de représentativité caractérise les fluctuations de la moyenne. Il convient de noter que plus la taille de l’échantillon est grande, plus la dispersion des valeurs moyennes est faible. L'erreur type de la moyenne est calculée à l'aide de la formule :

Dans la littérature scientifique moderne, la moyenne arithmétique est écrite avec l'erreur de représentativité :

ou avec l'écart type :

À titre d’exemple, considérons les données de 1 500 cliniques urbaines du pays (population générale). Le nombre moyen de patients soignés dans la clinique est de 18 150 personnes. La sélection aléatoire de 10 % des sites (150 cliniques) donne un nombre moyen de patients égal à 20 051 personnes. L'erreur d'échantillonnage, évidemment due au fait que les 1 500 cliniques n'ont pas été incluses dans l'échantillon, est égale à la différence entre ces moyennes - la moyenne générale ( M. gène) et la moyenne de l'échantillon ( M. choisi). Si nous formons un autre échantillon de même taille à partir de notre population, cela donnera une valeur d’erreur différente. Toutes ces moyennes d'échantillons avec des échantillons suffisamment grands sont réparties normalement autour de la moyenne générale avec des échantillons suffisamment grands. grand nombre répétitions d'un échantillon du même nombre d'objets d'une population. Erreur type de la moyenne m- c'est l'inévitable dispersion des moyennes d'échantillon autour de la moyenne générale.

Dans le cas où les résultats de la recherche sont présentés en quantités relatives (par exemple, pourcentages) - calculé erreur type de fraction :

où P est l'indicateur en %, n est le nombre d'observations.

Le résultat s'affiche sous la forme (P ± m)%. Par exemple, le pourcentage de guérison parmi les patients était de (95,2 ± 2,5) %.

Dans le cas où le nombre d'éléments de la population, puis lors du calcul des erreurs types de la moyenne et de la fraction au dénominateur de la fraction, au lieu deil faut mettre.

Pour une distribution normale (la distribution des moyennes de l'échantillon est normale), nous savons quelle partie de la population se situe dans n'importe quel intervalle autour de la moyenne. En particulier:

En pratique, le problème est que les caractéristiques de la population générale nous sont inconnues et que l’échantillon est constitué précisément dans le but de les estimer. Cela signifie que si nous faisons des échantillons de même taille n de la population générale, alors dans 68,3 % des cas l'intervalle contiendra la valeur M.(dans 95,5% des cas ce sera sur l'intervalle et dans 99,7% des cas – sur l'intervalle).

Puisqu'un seul échantillon est effectivement prélevé, cette affirmation est formulée en termes de probabilité : avec une probabilité de 68,3 %, la valeur moyenne de l'attribut dans la population se situe dans l'intervalle, avec une probabilité de 95,5 %. - dans l'intervalle, etc.

En pratique, un intervalle est construit autour de la valeur de l'échantillon tel que, avec une probabilité donnée (suffisamment élevée), probabilité de confiance –« couvrirait » la vraie valeur de ce paramètre dans la population générale. Cet intervalle est appelé intervalle de confiance.

Probabilité de confianceP. il s'agit du degré de confiance selon lequel l'intervalle de confiance contiendra réellement la valeur vraie (inconnue) du paramètre dans la population.

Par exemple, si la probabilité de confiance R. est de 90%, cela signifie que 90 échantillons sur 100 donneront l'estimation correcte du paramètre dans la population. En conséquence, la probabilité d'erreur, c'est-à-dire l'estimation incorrecte de la moyenne générale de l'échantillon est égale en pourcentage : . Pour cet exemple cela signifie que 10 échantillons sur 100 donneront une estimation incorrecte.

Évidemment, le degré de confiance (probabilité de confiance) dépend de la taille de l'intervalle : plus l'intervalle est large, plus la confiance qu'une valeur inconnue pour la population y entrera est élevée. En pratique, au moins deux fois l'erreur d'échantillonnage est utilisée pour construire un intervalle de confiance afin de fournir un niveau de confiance d'au moins 95,5 %.

La détermination des limites de confiance des moyennes et des valeurs relatives permet de trouver leurs deux valeurs extrêmes - le minimum possible et le maximum possible, à l'intérieur desquelles l'indicateur étudié peut apparaître dans l'ensemble de la population. Sur cette base, limites de confiance (ou intervalle de confiance)- ce sont les limites des valeurs moyennes ou relatives, au-delà desquelles, en raison de fluctuations aléatoires, il existe une probabilité insignifiante.

L'intervalle de confiance peut être réécrit comme suit : , où t– critère de confiance.

Les limites de confiance de la moyenne arithmétique dans la population sont déterminées par la formule :

M. gène =M sélectionner + tm M.

pour la valeur relative :

R. gène =P sélectionner + tm R.

M. gène Et R. gène- valeurs de valeurs moyennes et relatives pour la population générale ; M. sélectionner Et R. sélectionner- les valeurs des valeurs moyennes et relatives obtenues à partir de l'échantillon de population ; m M. Et m P.- les erreurs de valeurs moyennes et relatives ; t- critère de confiance (critère de précision, qui est établi lors de la planification de l'étude et peut être égal à 2 ou 3) ; tm- il s'agit d'un intervalle de confiance ou Δ - l'erreur maximale de l'indicateur obtenu dans une étude par sondage.

Il convient de noter que la valeur du critère t dans une certaine mesure liée à la probabilité d'une prévision sans erreur (p), exprimée en %. Il est choisi par le chercheur lui-même, guidé par la nécessité d'obtenir le résultat avec le degré de précision requis. Ainsi, pour une probabilité d'une prévision sans erreur de 95,5%, la valeur du critère t est 2, pour 99,7% - 3.

Les estimations de l'intervalle de confiance données ne sont acceptables que pour les populations statistiques comportant plus de 30 observations. Avec une taille de population plus petite (petits échantillons), des tableaux spéciaux sont utilisés pour déterminer le critère t. Dans ces tableaux, la valeur souhaitée se situe à l'intersection de la droite correspondant à la taille de la population (n-1), et une colonne correspondant au niveau de probabilité d'une prévision sans erreur (95,5 % ; 99,7 %) choisi par le chercheur. Dans la recherche médicale, lors de l'établissement de limites de confiance pour un indicateur, la probabilité d'une prévision sans erreur est de 95,5 % ou plus. Cela signifie que la valeur de l'indicateur obtenu à partir de la population échantillon doit être retrouvée dans la population générale dans au moins 95,5 % des cas.

    Questions sur le sujet de la leçon :

    Pertinence des indicateurs de diversité des traits dans une population statistique.

    Caractéristiques générales des indicateurs de variation absolue.

    Écart type, calcul, application.

    Mesures relatives de variation.

    Score médian, quartile.

    Évaluer la signification statistique des résultats de l'étude.

    Erreur type de la moyenne arithmétique, formule de calcul, exemple d'utilisation.

    Calcul de la proportion et de son erreur type.

    Le concept de probabilité de confiance, un exemple d'utilisation.

10. La notion d'intervalle de confiance, son application.

    Testez des tâches sur le sujet avec des réponses standard :

1. INDICATEURS ABSOLUS DE VARIATION SE REFERENT A

1) coefficient de variation

2) coefficient d'oscillation

4) médiane

2. INDICATEURS RELATIFS DE VARIATION RELATIFS

1) dispersion

4) coefficient de variation

3. CRITÈRE QUI EST DÉTERMINÉ PAR LES VALEURS EXTRÊMES D'UNE OPTION DANS UNE SÉRIE DE VARIATION

2) amplitude

3) dispersion

4) coefficient de variation

4. LA DIFFÉRENCE DES OPTIONS EXTRÊMES EST

2) amplitude

3) écart type

4) coefficient de variation

5. LE CARRÉ MOYEN DES ÉVIATIONS DES VALEURS INDIVIDUELLES D'UNE CARACTÉRISTIQUE PAR RAPPORT À SES VALEURS MOYENNES EST

1) coefficient d'oscillation

2) médiane

3) dispersion

6. LE RAPPORT DE L'ÉCHELLE DE VARIATION À LA VALEUR MOYENNE D'UN PERSONNAGE EST

1) coefficient de variation

2) écart type

4) coefficient d'oscillation

7. LE RAPPORT DE L'ÉCART CARRÉ MOYEN À LA VALEUR MOYENNE D'UNE CARACTÉRISTIQUE EST

1) dispersion

2) coefficient de variation

3) coefficient d'oscillation

4) amplitude

8. L'OPTION QUI EST AU MILIEU DE LA SÉRIE DE VARIATION ET LA DIVISE EN DEUX PARTIES ÉGALES EST

1) médiane

3) amplitude

9. DANS LA RECHERCHE MÉDICALE, LORS DE L'ÉTABLISSEMENT DE LIMITES DE CONFIANCE POUR TOUT INDICATEUR, LA PROBABILITÉ D'UNE PRÉVISION SANS ERREUR EST ACCEPTÉE

10. SI 90 ÉCHANTILLONS SUR 100 DONNENT L'ESTIMATION CORRECTE D'UN PARAMÈTRE DANS LA POPULATION, CELA SIGNIFIE QUE LA PROBABILITÉ DE CONFIANCE P.ÉGAL

11. SI 10 ÉCHANTILLONS SUR 100 DONNENT UNE ESTIMATION INCORRECTE, LA PROBABILITÉ D'ERREUR EST ÉGALE

12. LIMITES DES VALEURS MOYENNES OU RELATIVES, AU-DELÀ DEQUELLES, EN RAISON D'OSCILLATIONS ALÉATOIRES, A UNE FAIBLE PROBABILITÉ – CECI EST

1) intervalle de confiance

2) amplitude

4) coefficient de variation

13. UN PETIT ÉCHANTILLON EST CONSIDÉRÉ CETTE POPULATION DANS LAQUELLE

1) n est inférieur ou égal à 100

2) n est inférieur ou égal à 30

3) n est inférieur ou égal à 40

4) n est proche de 0

14. POUR LA PROBABILITÉ D'UNE PRÉVISION SANS ERREUR VALEUR DU CRITÈRE 95 % t EST

15. POUR LA PROBABILITÉ D'UNE PRÉVISION SANS ERREUR VALEUR DU CRITÈRE 99 % t EST

16. POUR DES DISTRIBUTIONS PROCHES DE LA NORMALE, LA POPULATION EST CONSIDÉRÉE HOMOGÈNE SI LE COEFFICIENT DE VARIATION NE DÉPASSE PAS

17. OPTION, OPTIONS DE SÉPARATION DONT LES VALEURS NUMÉRIQUES NE DÉPASSENT PAS 25% DU MAXIMUM POSSIBLE DANS UNE SÉRIE DONNÉE – CECI EST

2) quartile inférieur

3) quartile supérieur

4) quartile

18. LES DONNÉES QUI NE DÉFORMENT PAS ET REFLÈTENT CORRECTEMENT LA RÉALITÉ OBJECTIVE SONT APPELÉES

1) impossible

2) également possible

3) fiable

4) aléatoire

19. SELON LA RÈGLE DES « TROIS Sigma », AVEC DISTRIBUTION NORMALE D'UNE CARACTÉRISTIQUE À L'INTÉRIEUR
SERA SITUÉ

1) Option 68,3%

L'écart type est un indicateur classique de variabilité des statistiques descriptives.

Écart type, écart type, L'écart type, l'écart type de l'échantillon (eng. écart type, STD, STDev) est un indicateur de dispersion très courant dans les statistiques descriptives. Mais, parce que l'analyse technique s'apparente à des statistiques ; cet indicateur peut (et doit) être utilisé en analyse technique pour détecter le degré de dispersion du prix de l'instrument analysé dans le temps. Désigné par le symbole grec Sigma "σ".

Merci à Carl Gauss et Pearson de nous avoir permis d'utiliser l'écart type.

En utilisant écart type en analyse technique, on tourne ça "indice de dispersion""V "indicateur de volatilité», en conservant le sens, mais en changeant les termes.

Qu'est-ce que l'écart type

Mais outre les calculs auxiliaires intermédiaires, l'écart type est tout à fait acceptable pour un calcul indépendant et applications en analyse technique. Comme l’a noté un lecteur actif de notre magazine bardane : « Je ne comprends toujours pas pourquoi l'écart type n'est pas inclus dans l'ensemble des indicateurs standard des centres de négociation nationaux«.

Vraiment, l’écart type permet de mesurer la variabilité d’un instrument de manière classique et « pure ». Mais malheureusement, cet indicateur n'est pas si courant dans l'analyse des titres.

Application de l'écart type

Calculer manuellement l'écart type n'est pas très intéressant, mais utile pour l'expérience. L'écart type peut être exprimé formule STD=√[(∑(x-x ) 2)/n] , qui ressemble à la racine de la somme des carrés des différences entre les éléments de l'échantillon et la moyenne, divisée par le nombre d'éléments de l'échantillon.

Si le nombre d'éléments dans l'échantillon dépasse 30, alors le dénominateur de la fraction sous la racine prend la valeur n-1. Sinon, n est utilisé.

Pas à pas calcul de l'écart type:

  1. calculer la moyenne arithmétique de l'échantillon de données
  2. soustraire cette moyenne de chaque élément de l'échantillon
  3. nous mettons au carré toutes les différences qui en résultent
  4. résumer tous les carrés résultants
  5. divisez le montant obtenu par le nombre d'éléments dans l'échantillon (ou par n-1, si n>30)
  6. calculer la racine carrée du quotient résultant (appelé dispersion)

Défini comme une caractéristique généralisante de l’ampleur de la variation d’un trait dans l’ensemble. Il est égal à la racine carrée de l'écart carré moyen des valeurs individuelles de l'attribut par rapport à la moyenne arithmétique, c'est-à-dire La racine de et peut être trouvée comme ceci :

1. Pour la ligne principale :

2. Pour la série de variations :

La transformation de la formule de l'écart type l'amène à une forme plus pratique pour les calculs pratiques :

Écart type détermine dans quelle mesure en moyenne des options spécifiques s'écartent de leur valeur moyenne, et constitue également une mesure absolue de la variabilité d'une caractéristique et est exprimée dans les mêmes unités que les options, et est donc bien interprétée.

Exemples de recherche de l'écart type : ,

Pour les caractéristiques alternatives, la formule moyenne écart carréça ressemble à ça :

où p est la proportion d’unités de la population qui possèdent une certaine caractéristique ;

q est la proportion d'unités qui ne possèdent pas cette caractéristique.

Le concept d'écart linéaire moyen

Déviation linéaire moyenne est défini comme la moyenne arithmétique des valeurs absolues des écarts des options individuelles par rapport à .

1. Pour la ligne principale :

2. Pour la série de variations :

où la somme n est somme des fréquences des séries de variations.

Un exemple de recherche de l'écart linéaire moyen :

L'avantage de l'écart absolu moyen comme mesure de dispersion sur la plage de variation est évident, puisque cette mesure repose sur la prise en compte de tous les écarts possibles. Mais cet indicateur présente des inconvénients importants. Le rejet arbitraire des signes algébriques d'écarts peut conduire au fait que les propriétés mathématiques de cet indicateur sont loin d'être élémentaires. Cela rend très difficile l’utilisation de l’écart absolu moyen lors de la résolution de problèmes impliquant des calculs probabilistes.

Par conséquent, l'écart linéaire moyen comme mesure de variation d'une caractéristique est rarement utilisé dans la pratique statistique, notamment lorsque la sommation d'indicateurs sans prendre en compte les signes a un sens économique. Avec son aide, par exemple, le chiffre d'affaires est analysé commerce extérieur, composition des ouvriers, rythme de production, etc.

Carré moyen

Le carré moyen est appliqué, par exemple, pour calculer la taille moyenne des côtés de n sections carrées, les diamètres moyens des troncs, des canalisations, etc. Il est divisé en deux types.

Carré moyen simple. Si, lors du remplacement des valeurs individuelles d'une caractéristique par valeur moyenne S'il est nécessaire de maintenir constante la somme des carrés des valeurs d'origine, alors la moyenne sera une valeur moyenne quadratique.

Il s'agit de la racine carrée du quotient de la division de la somme des carrés des valeurs d'attributs individuels par leur nombre :

Le carré moyen pondéré est calculé à l'aide de la formule :

où f est le signe du poids.

Cube moyen

Le cube moyen s'applique, par exemple, lors de la détermination de la longueur moyenne d'un côté et de cubes. Il est divisé en deux types.
Cube simple moyen :

Lors du calcul des valeurs moyennes et de la dispersion dans les séries de distribution d'intervalles, les vraies valeurs de l'attribut sont remplacées par les valeurs centrales des intervalles, qui sont différentes de la moyenne valeurs arithmétiques inclus dans l'intervalle. Cela conduit à une erreur systématique lors du calcul de la variance. V.F. Sheppard a déterminé que erreur dans le calcul de l'écart, provoqué par l'utilisation de données groupées, est égal à 1/12 du carré de la valeur de l'intervalle, à la fois dans le sens de l'augmentation et dans le sens de la diminution de l'ampleur de la dispersion.

Amendement Sheppard doit être utilisé si la distribution est proche de la normale, se rapporte à une caractéristique avec une nature de variation continue et est basée sur une quantité significative de données initiales (n > 500). Cependant, étant donné que dans certains cas les deux erreurs, agissant dans des directions différentes, se compensent mutuellement, il est parfois possible de refuser d'introduire des corrections.

Plus la variance et l’écart type sont petits, plus la population est homogène et plus la moyenne sera typique.
Dans la pratique des statistiques, il est souvent nécessaire de comparer les variations de diverses caractéristiques. Il est par exemple très intéressant de comparer les variations de l'âge des travailleurs et de leurs qualifications, de leur ancienneté et de leur taille. salaires, coût et profit, durée de service et productivité du travail, etc. Pour de telles comparaisons, les indicateurs de variabilité absolue des caractéristiques ne conviennent pas : il est impossible de comparer la variabilité de l'expérience professionnelle, exprimée en années, avec la variation des salaires, exprimée en roubles.

Pour effectuer de telles comparaisons, ainsi que des comparaisons de la variabilité d'une même caractéristique dans plusieurs populations avec des moyennes arithmétiques différentes, un indicateur relatif de variation est utilisé - le coefficient de variation.

Moyennes structurelles

Pour caractériser la tendance centrale des distributions statistiques, il est souvent rationnel d'utiliser, avec la moyenne arithmétique, une certaine valeur de la caractéristique X, qui, en raison de certaines caractéristiques de sa localisation dans la série de distribution, peut caractériser son niveau.

Ceci est particulièrement important lorsque, dans une série de distribution, les valeurs extrêmes d'une caractéristique ont des limites peu claires. À cause de cela définition précise La moyenne arithmétique est généralement impossible, voire très difficile. Dans de tels cas, le niveau moyen peut être déterminé en prenant, par exemple, la valeur de la caractéristique qui se situe au milieu de la série de fréquences ou qui apparaît le plus souvent dans la série courante.

Ces valeurs dépendent uniquement de la nature des fréquences, c'est-à-dire de la structure de la distribution. Ils sont typiques en termes d'emplacement dans une série de fréquences, c'est pourquoi ces valeurs sont considérées comme des caractéristiques du centre de distribution et ont donc reçu la définition de moyennes structurelles. Ils sont utilisés pour étudier structure interne et la structure de la série de distribution des valeurs d'attribut. Ces indicateurs comprennent :



 


Lire:



Comptabilisation des règlements avec le budget

Comptabilisation des règlements avec le budget

Le compte 68 en comptabilité sert à collecter des informations sur les paiements obligatoires au budget, déduits à la fois aux frais de l'entreprise et...

Cheesecakes au fromage cottage dans une poêle - recettes classiques de cheesecakes moelleux Gâteaux au fromage à partir de 500 g de fromage cottage

Cheesecakes au fromage cottage dans une poêle - recettes classiques de cheesecakes moelleux Gâteaux au fromage à partir de 500 g de fromage cottage

Ingrédients : (4 portions) 500 gr. de fromage cottage 1/2 tasse de farine 1 œuf 3 c. l. sucre 50 gr. raisins secs (facultatif) pincée de sel bicarbonate de soude...

Salade de perles noires aux pruneaux Salade de perles noires aux pruneaux

Salade

Bonne journée à tous ceux qui recherchent de la variété dans leur alimentation quotidienne. Si vous en avez marre des plats monotones et que vous souhaitez faire plaisir...

Recettes de lecho à la pâte de tomate

Recettes de lecho à la pâte de tomate

Lecho très savoureux à la pâte de tomate, comme le lecho bulgare, préparé pour l'hiver. C'est ainsi que nous transformons (et mangeons !) 1 sac de poivrons dans notre famille. Et qui devrais-je...

image de flux RSS