le principal - Je peux faire des réparations moi-même
La déviation quadratique moyenne est mesurée dans. Dispersion: générale, sélective, corrigée

Avec une vérification statistique des hypothèses, lors de la mesure de la relation linéaire entre les valeurs aléatoires.

Milieu déviation quadratique:

Écart-type (Évaluation de la déviation de plancher aléatoire aléatoire, des murs autour de nous et du plafond, x. En ce qui concerne attente mathématique Basé sur une évaluation non compensée de sa dispersion):

où - dispersion; - Paul, murs autour de nous et de plafond, jE. - échantillonnage de l'élément; - la taille de l'échantillon; - échantillon d'arithmétique moyen:

Il convient de noter que les deux estimations sont compensées. DANS général Une évaluation améliorée est impossible à construire. Cependant, l'évaluation basée sur la dispersion estimée est riche.

Règle trois Sigm

Règle trois Sigm () - Presque toutes les valeurs de la variable aléatoire normalement distribuée se trouvent dans l'intervalle. Plus strictement - pas moins de 99,7% de fiabilité La valeur d'une variable aléatoire répartie normale réside à l'intervalle spécifié (à condition que la valeur soit vraie et non obtenue à la suite du traitement des échantillons).

Si la valeur réelle est inconnue, elle devrait être utilisée non et le sol, les murs autour de nous et au plafond, s. . Ainsi, la règle de trois Sigms est convertie en une règle de trois pieds, les murs autour de nous et au plafond, s. .

Interprétation de la taille de l'écart type

La grande valeur de la déviation RMS montre une variation importante des valeurs dans l'ensemble présenté de la valeur moyenne de l'ensemble; Une petite valeur, respectivement, indique que les valeurs de l'ensemble sont regroupées autour de la valeur moyenne.

Par exemple, nous avons trois ensembles numériques: (0, 0, 14, 14), (0, 6, 8, 14) et (6, 6, 8, 8). Dans les trois ensembles, les valeurs moyennes sont 7 et les écarts carrés moyens sont respectivement 7, 5 et 1. Dans le dernier ensemble, la déviation carrée moyenne racine est faible, car les valeurs de la définir sont regroupés autour de la valeur moyenne; Le premier set est le plus grande importance Déviation radiale - Les valeurs à l'intérieur de l'ensemble divergent fortement avec une valeur moyenne.

En général, la déviation type peut être considérée comme une mesure de l'incertitude. Par exemple, en physique, la déviation réglementaire est utilisée pour déterminer l'erreur d'une série de mesures consécutives de toute valeur. Cette valeur est très importante pour déterminer la différenciabilité du phénomène étudié par rapport à la valeur de la théorie prévue: si la valeur de mesure moyenne est très différente de la théorie prédite des valeurs (la valeur large de la gamme de composition moyenne), puis les valeurs obtenues ou la méthode d'obtention doivent être réhiquées.

Utilisation pratique

En pratique, la déviation type vous permet de déterminer la quantité de valeurs dans l'ensemble peut différer de la valeur moyenne.

Climat

Supposons qu'il y ait deux villes avec la même température moyenne moyenne de la journée maximale, mais l'une est située sur la côte et l'autre à l'intérieur du continent. On sait que dans les villes situées sur la côte, de nombreuses températures quotidiennes maximales sont plus petites que les villes situées à l'intérieur du continent. Par conséquent, l'écart riconductique des températures de jour maximum à la ville côtière sera inférieure à la deuxième ville, malgré le fait que la valeur moyenne de cette valeur a la même chose, ce qui signifie en pratique que la probabilité que la température de l'air maximale de Chaque journée particulière sera plus forte différente de la moyenne, supérieure à la ville, située à l'intérieur du continent.

sport

Supposons que plusieurs équipes de football soient estimées à un certain ensemble de paramètres, par exemple, le nombre de têtes marquées et manquées, des moments de notation, etc. Il est fort probable que la meilleure équipe aura le meilleur dans ce groupe. meilleures valeurs par suite paramètres. Plus la commande de la déviation RMS est petite pour chacun des paramètres présentés, la commande prévisible est le résultat de la commande, de telles commandes sont équilibrées. D'autre part, l'équipe avec grande signification L'écart type est difficile de prédire le résultat, ce qui est due à un déséquilibre, par exemple une protection forte, mais une attaque faible.

L'utilisation de l'écart type des paramètres de commande permet de prédire le résultat du match de deux équipes, d'évaluer le fort et côtés faibles Les équipes, ce qui signifie que les méthodes élues de lutte.

Analyse technique

voir également

Littérature

* Borovikov, V. Statistica. L'art de l'analyse des données sur un ordinateur: pour les professionnels / V. Borovikov. - Saint-Pétersbourg. : Peter, 2003. - 688 p. - ISBN 5-272-00078-1.

Dans cet article, je parlerai de comment trouver une déviation RMS. Ce matériau est extrêmement important pour une compréhension complète des mathématiques, de sorte que le tuteur en mathématiques doit le consacrer à l'étude d'une leçon distincte ou même quelques-uns. Dans cet article, vous trouverez un lien vers un didacticiel vidéo détaillé et compréhensible, dans lequel il est décrit sur ce qui est l'écart type et sur la manière de le trouver.

Déviation radiale permet d'estimer la dispersion des valeurs obtenues à la suite de la mesure de la mesure d'un paramètre. Dénote le symbole (lettre grecque "Sigma").

La formule de calcul est assez simple. Pour trouver la déviation RMS, vous devez prendre une racine carrée de la dispersion. Alors maintenant, vous devez demander: "Quelle est la dispersion?"

Quelle est la dispersion

La définition de la dispersion sonne comme celle-ci. La dispersion est la moyenne arithmétique des carrés des valeurs de la moyenne.

Pour trouver la dispersion, dessinez régulièrement les calculs suivants:

  • Déterminer la moyenne (moyenne arithmétique simple des valeurs).
  • Puis, de chacune des valeurs, emportez la moyenne et prenez la différence résultante dans la place (reçue différence carrée).
  • L'étape suivante sera le calcul des matchs arithmétiques moyens des carrés des différences (pourquoi vous pouvez trouver les carrés ci-dessous).

Considérer sur l'exemple. Supposons que vous ayez décidé de mesurer la croissance de vos chiens (en millimètres) avec des amis. À la suite des mesures, vous avez reçu les données de mesure de la croissance suivantes (dans les Withers): 600 mm, 470 mm, 170 mm, 430 mm et 300 mm.

Calculer la valeur moyenne de la valeur, de la dispersion et de la déviation RMS.

Au début, nous trouverons la moyenne. Comme vous le savez déjà, il est nécessaire d'ajouter toutes les valeurs mesurées et de se diviser sur le nombre de mesures. Calculs:

Milieu mm.

Ainsi, la moyenne (moyenne immétique) est de 394 mm.

Maintenant, vous devez déterminer déviation de la croissance de chacun des chiens de la moyenne:

Pour terminer, calculer la dispersionChacune des différences obtenues est érigée dans un carré, puis trouve la moyenne arithmétique des résultats obtenus:

Dispersion mm 2.

Ainsi, la dispersion est de 21704 mm 2.

Comment trouver une déviation RMS

Alors, comment puis-je calculer la déviation RMS, sachant la dispersion? Comme nous nous souvenons, prenez une racine carrée. C'est-à-dire que la déviation type est la suivante:

Mm (arrondi à la valeur entière la plus proche en mm).

Appliquer cette méthode, nous avons découvert que certains chiens (par exemple, Rottweilelers) sont de très gros chiens. Mais il y a très peu de chiens (par exemple, les taxes, tout simplement pas la peine).

La chose la plus intéressante est que la déviation type se porte en soi informations utiles. Nous pouvons maintenant montrer que les résultats obtenus de la mesure de la croissance sont dans l'intervalle, que nous recevrons, si nous reports de la moyenne (des deux côtés de celui-ci), l'écart type.

C'est-à-dire avec l'aide de l'écart type, nous obtenons une méthode «standard» qui vous permet de déterminer la quelle des valeurs normales (moyenne) et qui est extraordinaire ou, au contraire, petite.

Qu'est-ce qu'un écart type

Mais ... tout sera un peu différent si nous analysons goûter Les données. Dans notre exemple, nous avons considéré agrégat général.C'est-à-dire que nos 5 chiens étaient les seuls chiens du monde intéressé.

Mais si les données sont un échantillon (valeurs choisies parmi une grande population en général), les calculs doivent alors être effectués autrement.

S'il y a des valeurs, alors:

Tous les autres calculs sont fabriqués de la même manière, y compris la définition de la moyenne.

Par exemple, si nos cinq chiens ne sont qu'un échantillon de la population générale des chiens (tous les chiens de la planète), nous devons diviser sur 4, et pas sur 5,à savoir:

Dispersion d'échantillonnage \u003d. mm 2.

Dans le même temps, l'écart d'échantillon standard est égal mm (arrondi à l'entier le plus proche).

Nous pouvons dire que nous avons fait une "correction" dans le cas lorsque nos valeurs ne sont qu'un petit échantillon.

Noter. Pourquoi exactement des carrés de différences?

Mais pourquoi, lors du calcul de la dispersion, prenez-nous les carrés des différences? Supposons que lorsque vous mesurez certains paramètres, vous avez reçu l'ensemble de valeurs suivant: 4; quatre; -four; -four. Si nous ajoutons simplement des écarts absolus du milieu (différence) entre eux ... Les valeurs négatives sont mutuellement détruites avec positif:

.

Il s'avère que cette option est inutile. Ensuite, vous devriez peut-être essayer les valeurs absolues des déviations (c'est-à-dire les modules de ces valeurs)?

À première vue, il s'avère pas mal (la valeur résultante, à la manière, est appelée écart absolue moyen), mais pas dans tous les cas. Essayons un autre exemple. Soit à la suite de la mesure, l'ensemble de valeurs suivant a été obtenu: 7; une; -6; -2. Ensuite, la déviation absolue moyenne est la suivante:

Blimey! Reçu à nouveau 4, bien que les différences aient une dispersion beaucoup plus grande.

Voyons maintenant ce qui se passe si vous construisez une différence dans un carré (puis prenez une racine carrée de sa somme).

Pour le premier exemple, il se passera:

.

Pour le deuxième exemple, il se passera:

Maintenant - une autre chose! L'écart type est obtenu par le plus grand, plus la dispersion est grande, ils ont une différence ... Ce que nous avons cherché.

En fait, cette méthode utilisait la même idée que lors du calcul de la distance entre les points, appliquée uniquement de manière différente.

Et d'un point de vue mathématique, l'utilisation de carrés et de racines carrées donne plus d'avantages que nous pourrions obtenir sur la base de valeurs de déviation absolues, de sorte que l'écart type soit également applicable à d'autres tâches mathématiques.

Sur la façon de trouver un écart-type, vous vous l'avez dit, Sergey Valerevich

Leçon numéro 4.

Objet: "Statistiques descriptives. Indicateurs d'une variété de fonctionnalités de l'agrégat "

Les principaux critères de la diversité de la fonctionnalité de l'agrégat statistique sont les suivants: limite, amplitude, écart quadratique moyen, coefficient d'oscillation et coefficient de variation. Dans la leçon précédente, il a été discuté que les valeurs moyennes ne donnent que des caractéristiques généralisantes de l'attribution étudiée et ne prennent pas compte des valeurs de son option individuelle: la valeur minimale et maximale, au-dessus de la moyenne, inférieure à la moyenne. , etc.

Exemple. Les valeurs moyennes de deux séquences numériques différentes: -100; -vingt; 100; 20 et 0,1; -0.2; 0,1 est absolument identique et égalÀ PROPOS DE.Cependant, la plage de diffusion de données de ces séquences de la valeur moyenne relative est fortement différente.

La définition des critères énumérées pour une diversité d'une caractéristique est principalement réalisée en tenant compte de sa valeur dans des éléments individuels d'un agrégat statistique.

Indicateurs de mesure pour les signes de signe absolu et relatif. Les indicateurs absolus sont des variations: variation de variation, limite, écart quadratique secondaire, dispersion. Le coefficient de variation et le coefficient d'oscillation fait référence aux indicateurs relatifs de la variation.

Limite (lim) - Il s'agit d'un critère déterminé par les valeurs extrêmes de la variation de la ligne de variation. En d'autres termes, ce critère est limité aux valeurs minimales et maximales de la fonctionnalité:

Amplitude (am)ou alors variation de variation - C'est la différence d'option extrême. Le calcul de ce critère est effectué en soustrayant de la valeur maximale du signe de sa valeur minimale, ce qui permet d'estimer le degré d'option de diffusion:

L'inconvénient de la limite et de l'amplitude en tant que variabilité des critères est qu'ils dépendent complètement des signes extrêmes du signe dans la série de variantes. Il ne prend pas en compte les oscillations des signes du panneau dans la ligne.

Les caractéristiques les plus complètes de la diversité d'un signe dans un agrégat statistique donne déviation quadratique moyenne (Sigma), qui est une mesure générale de l'option de déviation de sa valeur moyenne. La déviation quadratique moyenne est souvent appelée également Écart-type.

La déviation quadratique moyenne est basée sur la comparaison de chaque option du flux arithmétique moyen. Étant donné que dans l'ensemble, il y aura toujours des options de moins et plus que celles-ci, la quantité d'écarts qui ont un signe "" sera atteint par la quantité d'écarts qui ont un signe "", c'est-à-dire La somme de tous les écarts est zéro. Afin d'éviter l'influence des signes de différence, les écarts proviennent de l'arithmétique moyenne sur la place, c'est-à-dire . La somme des carrés des déviations n'est pas nulle. Pour obtenir un coefficient capable de mesurer la variabilité, prenez la moyenne de la somme des carrés - cette valeur est appelée dispersion:

En signification, la dispersion est le carré moyen des écarts de valeurs individuelles de la fonctionnalité de sa valeur moyenne. Dispersion carré de la déviation quadratique moyenne.

La dispersion est une valeur dimensionnelle (nommée). Donc, si les variantes des séries numériques sont exprimées en mètres, la dispersion donne des mètres carrés; Si les options sont exprimées en kilogrammes, la dispersion donne au carré de cette mesure (kg 2), etc.

Déviation quadratique moyenne - racine carrée de la dispersion:

, lors du calcul de la dispersion et de la déviation quadratique moyenne dans le dénomoter dénomoter à la place Besoin de mettre.

Le calcul de la déviation quadratique moyenne peut être divisé en six étapes à mettre en œuvre dans une séquence spécifique:

L'utilisation de la déviation RMS:

a) pour le jugement sur la variation de la série variationnelle et l'évaluation comparative de la typique (représentativité) des valeurs arithmétiques moyennes. Cela est nécessaire dans le diagnostic différentiel pour déterminer la stabilité des signes.

b) Pour la reconstruction de la série variationnelle, c'est-à-dire Récupération de sa réponse en fréquence basée sur règles "Trois Sigm". Dans l'intervalle (M ± 3σ) il y a 99,7% de toutes les variantes de la série, dans l'intervalle (M ± 2σ) - 95,5% et dans l'intervalle (M ± 1σ) - 68,3% de variante de la série (Fig. 1).

c) identifier l'option "Popping"

d) Déterminer les paramètres de la norme et de la pathologie à l'aide des estimations sigmales

e) calculer le coefficient de variation

e) calculer l'erreur moyenne de la valeur arithmétique moyenne.

Caractériser toute population générale ayanttype de distribution normal Il suffit de connaître deux paramètres: une écart quadratique arithmétique et secondaire moyen.

Figure 1. La règle "Trois Sigm"

Exemple.

En pédiatrie, la déviation type est utilisée pour évaluer le développement physique des enfants en comparant les données d'un enfant particulier avec les indicateurs standard pertinents. La norme adopte les indicateurs d'arithmétique moyens du développement physique des enfants en bonne santé. La comparaison des indicateurs avec des normes est effectuée selon des tables spéciales dans lesquelles des normes sont présentées avec les échelles de sigmales correspondantes. On croit que si l'indicateur du développement physique de l'enfant est dans la norme (moyenne arithmétique) ± σ, puis développement physique L'enfant (pour cet indicateur) correspond à la norme. Si l'indicateur se trouve dans la norme ± 2σ, il y a une légère déviation de la norme. Si l'indicateur sort de ces limites, le développement physique de l'enfant est fortement différent de la norme (la pathologie est possible).

Outre les indicateurs des variations exprimées en valeurs absolues, l'examen statistique utilise des indicateurs de variation exprimés en valeurs relatives. Coefficient d'oscillation -ceci est le rapport de la variation de la taille de la caractéristique moyenne. Le coefficient de variation - Il s'agit du rapport de la déviation quadratique moyenne à la taille moyenne de la fonctionnalité. En règle générale, ces valeurs sont exprimées en pourcentage.

Formules pour calculer des indicateurs relatifs de variation:

Des formules ci-dessus, on peut voir que le plus grand coefficient V. approximatif à zéro, plus la variation des valeurs de signe. Le plus gros V.Surtout en changeant le signe.

Dans la pratique statistique, le coefficient de variation est le plus souvent utilisé. Il est utilisé non seulement pour une estimation comparative de la variation, mais également pour les caractéristiques de l'uniformité de la totalité. Une combinaison est considérée comme homogène si le coefficient de variation ne dépasse pas 33% (pour les distributions proches de la normale). Rapport arithmétique σ et niveau de niveau d'arithmétique moyen effet valeur absolue Ces caractéristiques et le taux de pourcentage rend le coefficient de variation de la magnitude de la dimension (non nommée).

La valeur obtenue du coefficient de variation est estimée conformément aux gradations estimées du degré de diversité de la caractéristique:

Faible - jusqu'à 10%

Moyenne - 10 - 20%

Fort - plus de 20%

L'utilisation du coefficient de variation est souhaitable dans les cas où vous devez comparer les signes de différentes dimensions dans sa taille et sa dimension.

La différence entre le coefficient de variation des autres critères de dispersion démontre clairement exemple.

Tableau 1

La composition des travailleurs de l'entreprise industrielle

Sur la base des caractéristiques statistiques données dans l'exemple, il est possible de conclure l'homogénéité relative de la composition d'âge et du niveau éducatif des employés d'entreprise avec la faible durabilité professionnelle du contingent interrogé. Il est facile de noter que la tentative de juger ces tendances sociales sur la déviation quadratique moyenne entraînerait une conclusion erronée et une tentative de comparer les pouvoirs de «expérience de travail» et de «âge» avec une "éducation" comptable serait généralement être incorrect en raison de l'hétérogénéité de ces signes.

Médiane et cent

Pour les distributions ordinales (grades), où le critère du milieu d'une série est une médiane, la déviation standard et la dispersion ne peuvent pas servir d'option de caractéristiques de diffusion.

La même chose est également caractéristique de la série variationnelle ouverte. Cette circonstance est due au fait que les écarts pour lesquels la dispersion et σ sont calculés sont comptabilisés à partir de l'arithmétique moyen, qui n'est pas calculé en rangées de variation ouverte et dans les rangs de caractéristiques qualitatives. Par conséquent, pour une description compressée des distributions, un autre paramètre de variation est utilisé - kwanttil (Synonyme - "Neurente"), adapté pour décrire des signes de haute qualité et quantitatifs sous toute forme de leur distribution. Ce paramètre peut être utilisé pour transférer des fonctionnalités quantitatives à de haute qualité. Dans ce cas, ces estimations sont attribuées en fonction de la quelle ou une autre option spécifique correspond à QUANTIL.

Dans la pratique de la recherche médicale et biologique, les quantins suivants sont les plus courants:

- médiane;

- Quartiles (quartiers), où - Quartile inférieur, quartile supérieur.

Quantili Partagez la zone des modifications possibles de l'option de la ligne de variation à certains intervalles. Mediana (Quantile) est une option située au milieu de la série variationnelle et divise cette rangée en deux en deux parties égales ( 0,5 et 0,5 ). L'appartement divise un certain nombre de quatre parties: la première partie (Quartile inférieur) est une option de séparation des options dont les valeurs numériques ne dépassent pas 25% du maximum possible. cette ligneL'appartement sépare des options avec une valeur numérique jusqu'à 50% du maximum possible. Quartile supérieur () sépare les variantes allant jusqu'à 75% des valeurs maximales possibles.

En cas de distribution asymétrique Une variable par rapport à l'arithmétique moyenne de sa caractéristique utilise la médiane et le quartile. Dans ce cas, le formulaire d'affichage moyen suivant est utilisé - Moi. (;). par exampleLa caractéristique étudiée est "une période dans laquelle l'enfant a commencé à marcher seul" - dans le groupe d'étude a une répartition asymétrique. Dans le même temps, la Quarte inférieure () correspond à la période de marche - 9,5 mois, médiane - 11 mois, top $ () - 12 mois. En conséquence, la caractéristique de la tendance moyenne de la fonctionnalité spécifiée sera présentée comme 11 (9,5; 12) mois.

Évaluation de la signification statistique des résultats de l'étude

Sous la signification statistique des données, le degré de conformité de la réalité affichée est compris, c'est-à-dire Selon des données statistiquement significatives, celles qui ne disistent pas et reflètent correctement la réalité objective.

Évaluez la signification statistique des résultats de l'étude - des moyens de déterminer la probabilité qu'il est possible de transférer les résultats obtenus sur l'ensemble de l'ensemble de la population générale sélective. L'évaluation de la signification statistique est nécessaire pour comprendre la manière dont une partie du phénomène peut être jugée sur le phénomène dans son ensemble et ses schémas.

L'évaluation de la signification statistique des résultats de l'étude se développe de:

1. Erreurs représentatives (erreurs moyennes et relatives) - m.;

2. faire confiance aux frontières des valeurs moyennes ou relatives;

3. La précision de la différence entre les valeurs moyennes ou relatives par le critère t..

Erreur d'arithmétique moyenne standardou alors erreur de représentation caractérise les fluctuations au milieu. Il convient de noter que plus la taille de l'échantillon est grande, plus la variation de la valeur moyenne est réduite. L'erreur médiane standard est calculée par la formule:

Dans la littérature scientifique moderne, l'arithmétique moyen est écrite avec une erreur représentée:

ou ensemble avec la déviation RMS:

À titre d'exemple, examinez les données sur 1500 cliniques urbaines du pays (la population en général). Le nombre moyen de patients entretenus dans la clinique est de 18150 personnes. La sélection aléatoire de 10% des objets (150 polycliniques) donne un nombre moyen de patients égaux à 20051. L'erreur d'échantillonnage est évidemment associée au fait que tous les 1500 polycliniques ne sont pas tombés dans l'échantillon, égal à la différence entre ces moyennes - la moyenne générale ( M. Gene) et moyenne sélective ( M. Sélectionner). Si vous formez un échantillon différent du même volume de notre agrégat général, cela donnera une autre magnitude de l'erreur. Toutes ces moyennes sélectives avec des échantillons suffisamment importants sont distribuées normalement autour de la moyenne générale avec suffisamment grand nombre Répétez l'échantillon du même nombre d'objets de la population générale. Moyen d'erreur standard m. - C'est une variation inévitable du milieu sélectif autour de la moyenne générale.

Dans le cas où les résultats de l'étude sont représentés par des valeurs relatives (par exemple, des pourcentages) - calculé erreur de lobe standard:

lorsque P est un indicateur en%, N - Le nombre d'observations.

Le résultat est affiché comme (P ± m)%. Par example,le pourcentage de récupération chez les patients était (95,2 ± 2,5)%.

Dans le cas où le nombre d'éléments de l'agrégat, lors du calcul du milieu standard et partage des erreurs dans le dénoter, à la place Besoin de mettre.

Pour une distribution normale (la distribution du milieu d'échantillon est normale), il est connu que la partie de la totalité tombe dans tout intervalle autour de la valeur moyenne. En particulier:

En pratique, le problème est que les caractéristiques de l'agrégat général ne nous sont inconnues et l'échantillon est effectué avec précision dans le but de leur évaluation. Cela signifie que si nous faisons des échantillons du même volume n. De la population générale, puis dans 68,3% des cas, l'intervalle sera M. (Il sera dans 95,5% des cas à l'intervalle et dans 99,7% des cas - sur l'intervalle).

Étant donné qu'un seul échantillon est réellement formulé, cette déclaration est formulée en termes de probabilité: une probabilité de 68,3% la moyenne de la signature de la population en général est dans l'intervalle, avec une probabilité de 95,5% - Dans l'intervalle, etc.

En pratique, un tel intervalle, qui, avec une probabilité (assez haut), est construit autour de la valeur sélective. probabilité de confiance -"Couvert" le vrai sens de ce paramètre dans la population en général. Cet intervalle est appelé intervalle confidentiel.

Probabilité de confianceP. ce degré de confiance est que l'intervalle de confiance contiendra une valeur véritable (inconnue) du paramètre dans la population en général.

Par exemple, si la probabilité de confiance R Il est alors de 90%, cela signifie que 90 échantillons de 100 donneront l'estimation correcte du paramètre dans la population en général. En conséquence, la probabilité d'erreur, c'est-à-dire Une estimation incorrecte du milieu général dans l'échantillon est égale à un pourcentage :. Pour cet exemple Cela signifie que 10 échantillons de 100 donneront une évaluation incorrecte.

De toute évidence, le degré de confiance (probabilité de confiance) dépend de la taille de l'intervalle: plus l'intervalle est plus large, plus la confiance en une valeur inconnue pour l'agrégat général tombera. Dans la pratique, au minimum, une double erreur d'échantillonnage est prise pour créer un intervalle de confiance pour assurer la confiance d'au moins 95,5%.

La détermination des frontières de confiance des valeurs de moyenne et relative vous permet de trouver deux de leurs valeurs extrêmes - le minimum possible et maximum possible, dans lequel l'indicateur étudié peut survenir dans toute la population générale. Basé sur ceci, faire confiance aux frontières (ou intervalle de confiance)- Ce sont les limites des valeurs moyennes ou relatives, la sortie au-delà de laquelle des oscillations aléatoires a une légère probabilité.

L'intervalle de confiance peut être réécrit sous la forme: où t. - critère de confiance.

Les limites de confiance de la valeur arithmétique moyenne de la population en général sont déterminées par la formule:

M. gène \u003d M. choisir + t M.

pour la taille relative:

R gène \u003d R. choisir + t R

M. gène et R gène - valeurs de la valeur moyenne et relative pour la population en général; M. choisir et R choisir - les valeurs des valeurs moyennes et relatives obtenues sur l'agrégat sélectif; m. M. et m. P. - des erreurs de valeurs moyennes et relatives; t. - critère de confiance (critère de précision, établi lors de la planification d'une étude et peut être égal à 2 ou 3); t - C'est un intervalle de confiance ou Δ - l'erreur limite de l'indicateur obtenu lors de l'étude d'échantillon.

Il convient de noter que la valeur du critère t. Une certaine mesure est associée à la probabilité d'une prévision sans erreur (P), exprimée en%. Elle a élu le chercheur lui-même, guidé par la nécessité d'obtenir le résultat avec le degré de précision souhaité. Ainsi, pour la probabilité d'une prévision sans erreur 95,5% du critère t. est 2, pour 99,7% - 3.

Les estimations ci-dessus de l'intervalle de confiance sont acceptables uniquement pour les agrégats statistiques avec le nombre d'observations de plus de 30. Avec une quantité inférieure de l'ensemble (petits échantillons), pour déterminer le critère T Utiliser des tables spéciales. Dans ces tables, la valeur souhaitée est à l'intersection d'une chaîne correspondant au nombre d'agrégats. (N-1)et une colonne correspondant au niveau de probabilité d'une prévision sans erreur (95,5%; 99,7%) sélectionnée par le chercheur. Dans les études médicales, lors de l'établissement des frontières de confiance de tout indicateur, la probabilité d'une prévision sans erreur est adoptée de 95,5% ou plus. Cela signifie que l'ampleur de l'indicateur obtenu à l'ensemble sélectif doit être trouvée dans la population générale d'au moins 95,5% des cas.

    Questions sur le sujet des cours:

    La pertinence des indicateurs de la diversité d'un signe dans un agrégat statistique.

    Les caractéristiques globales des indicateurs de variation absolus.

    Déviation quadratique moyenne, calcul, application.

    Indicateurs de variation relative.

    Médian, estimation de l'appartement.

    Évaluation de la signification statistique des résultats de l'étude.

    Erreur standard de la formule d'arithmétique moyenne, de calcul, un exemple d'utilisation.

    Calcul de la part et de son erreur standard.

    Le concept de probabilité de confiance, un exemple d'utilisation.

10. Le concept d'intervalle confidentiel, son application.

    Testez les tâches sur le sujet des normes de référence:

1. Les indicateurs absolus de la variation se réfèrent

1) coefficient de variation

2) coefficient d'oscillation

4) Mediana

2. Les indicateurs relatifs de variation font référence

1) dispersion

4) coefficient de variation

3. Critère déterminé par des valeurs extrêmes de la variante dans la ligne de variation

2) amplitude

3) dispersion

4) coefficient de variation

4. La différence de l'option extrême est

2) amplitude

3) Déviation quadratique secondaire

4) coefficient de variation

5. Le carré moyen des écarts de valeurs individuelles de la caractéristique de sa taille moyenne est

1) coefficient d'oscillation

2) mediana

3) dispersion

6. Le rapport de la variation de la caractéristique moyenne du signe est

1) coefficient de variation

2) Déviation quadratique secondaire

4) coefficient d'oscillation

7. Le ratio de la déviation quadratique moyenne à la taille de la caractéristique moyenne est

1) dispersion

2) coefficient de variation

3) coefficient d'oscillation

4) amplitude

8. Une option située au milieu de la série variationnelle et la divise en deux parties égales est

1) Mediana

3) amplitude

9. Dans les études médicales, lors de l'établissement des frontières de confiance de tout indicateur adopté la probabilité d'une prévision sans erreur

10. Si 90 échantillons de 100 donnent la bonne estimation du paramètre dans la population en général, cela signifie que la probabilité de confiance P. Égal

11. Dans le cas où 10 échantillons de 100 donnent une estimation incorrecte, la probabilité d'erreur est égale

12. Les limites des valeurs moyennes ou relatives, la sortie au-delà de laquelle des oscillations aléatoires ont une légère probabilité - ceci

1) Intervalle de confiance

2) amplitude

4) coefficient de variation

13. La combustion est considérée comme un petit échantillon dans lequel

1) N moins ou égal à 100

2) n moins ou égal à 30

3) n moins ou égal à 40

4) n près de 0

14. Pour la probabilité d'une prévision sans erreur, 95% de critère t. Se réconcilier

15. Pour la probabilité d'une prévision sans erreur, 99% de critères t. Se réconcilier

16. Pour les distributions proches de la normale, la totalité est considérée comme homogène si le coefficient de variation ne dépasse pas

17. Une option de séparation des options dont les valeurs numériques ne dépassent pas 25% du maximum possible dans cette série - cette

2) Quartile inférieur

3) Quartile supérieur

4) Quartile

18. Les données qui ne disistent pas et reflètent correctement la réalité objective, appelées

1) impossible

2) Equilibre

3) fiable

4) aléatoire

19. Selon la règle «Trois Sigm», avec la distribution normale de la fonctionnalité dans
Sera situé

1) Option de 68,3%

L'écart-type est un indicateur de variabilité classique des statistiques descriptives.

Écart-type, déviation RMS, Déviation standard approximative (eng. L'écart type, STD, STDEV) est un taux de diffusion très courant dans les statistiques descriptives. Mais parce que Analyse technique de l'appréciation des statistiques, cet indicateur peut (et nécessaire) utiliser dans l'analyse technique pour détecter le degré de diffusion du prix de l'outil analysé à temps. Il est indiqué par le symbole grec de Sigma "σ".

Merci Karlam Gaussu et Pearson pour que nous ayons la possibilité d'utiliser l'écart type.

Utilisant déviation type dans l'analyse technique, nous tournons cela "Indicateur de diffusion" dans "L'indicateur de la volatilité", Gardant le sens, mais changer les termes.

Qu'est-ce qu'un écart type

Mais en plus des calculs auxiliaires intermédiaires, l'écart-type est tout à fait acceptable pour l'auto-calcul et des applications dans l'analyse technique. Comme le lecteur actif de notre bardane de magazine " je ne comprends toujours pas pourquoi la vitesse n'est pas incluse dans l'ensemble des indicateurs standard des centres de diligence nationale«.

Vraiment, l'écart-type peut être un moyen classique et «propre» pour mesurer la variabilité des outils. Mais malheureusement, cet indicateur n'est pas aussi courant dans l'analyse des titres.

Application de l'écart type

Calculer manuellement la déviation standard n'est pas très intéressanteMais utile pour l'expérience. L'écart type peut être exprimé La formule std \u003d √ [(σ (x-x) 2) / n], ce qui ressemble à la racine de la somme des carrés des différences entre les éléments de l'échantillon et la moyenne divisée par le nombre d'éléments dans le goûter.

Si le nombre d'éléments de l'échantillon dépasse 30, le dénominateur de la fraction sous la racine prend la valeur N-1. Sinon n.

Stephago calculer la déviation standard:

  1. calculer l'échantillon de données arithmétiques moyen
  2. prenez cette moyenne de chaque élément de l'échantillon
  3. toutes les différences obtenues sont érigées dans un carré
  4. nous résumons tous les squares à venir
  5. nous divisons le montant résultant par le nombre d'éléments de l'échantillon (ou sur N-1, si N\u003e 30)
  6. calculer la racine carrée du privé reçu (appelé dispersion)

Déterminé comme une caractéristique généralisante de la taille de la variation de la fonctionnalité de l'agrégat. Il s'agit également d'une racine carrée de la place moyenne des déviations des valeurs individuelles de la caractéristique de l'arithmétique moyen, c'est-à-dire La racine de et peut être trouvée comme ceci:

1. Pour la ligne principale:

2. Pour les séries variationnelles:

La transformation de la formule de la déviation quadratique moyenne conduit à la forme, plus pratique pour les calculs pratiques:

Déviation quadratique moyenne Détermine la manière dont la moyenne, les options spécifiques sont déviées sur leur valeur moyenne et, outre, il s'agit d'une mesure absolue de la transmission de la fonctionnalité et est exprimée dans les mêmes unités que les options, et donc bien interprétées.

Exemples de recherche d'une déviation quadratique moyenne: ,

Pour des signes alternatifs de la formule moyenne déviation quadratique Ressemble à ça:

où p est la proportion d'unités dans l'agrégat avec une certaine caractéristique;

q est la proportion d'unités qui n'ont pas cette fonctionnalité.

Le concept de déviation linéaire moyenne

Déviation linéaire moyenne Déterminé comme les valeurs absolues arithmétiques moyennes des écarts d'options individuelles de.

1. Pour la ligne principale:

2. Pour les séries variationnelles:

où la somme n est fréquence de variation.

Un exemple de recherche d'une déviation linéaire valide:

L'avantage de la déviation absolue moyenne en tant que mesure de la dispersion avant la variation est évidente, car cette mesure est basée sur la comptabilisation de tous les écarts possibles. Mais cet indicateur a des inconvénients importants. Les signes algébriques jettes d'écarts arbitraires peuvent entraîner des propriétés mathématiques de cet indicateur sont loin d'être élémentaires. Cela rend fortement difficile d'utiliser la déviation absolue moyenne lors de la résolution des problèmes associés aux calculs probabilistes.

Par conséquent, la déviation linéaire moyenne comme mesure de la caractérisation de la caractéristique est rarement appliquée dans la pratique statistique, à savoir, lorsque la somme d'indicateurs sans enregistrer des signes a une signification économique. Avec elle, par exemple, le chiffre d'affaires du commerce extérieur est analysé, la composition du travail, le rythme de production, etc.

Quadratique moyen

Moyenne quadratique appliquée, Par exemple, pour calculer la taille moyenne de la partie de n sections carrées, les diamètres moyens des tiges, des tuyaux, etc. Il est divisé en deux types.

Le quadratique moyen moyen. Si lors du remplacement des valeurs individuelles de la fonctionnalité sur valeur moyenne Il est nécessaire de maintenir la somme inchangée des carrés des valeurs initiales, puis la moyenne sera une moyenne quadratique.

Elle se trouve être racine carrée Des valeurs partielles du signe des valeurs individuelles pour leur nombre de carrés,

Le quadratique moyen pondéré est calculé par la formule:

où f est un signe de poids.

Moyen cubique

Moyen Cubic appliqué, par exemple, lors de la détermination du côté de la longueur moyenne et des cubes. Il est divisé en deux types.
Moyen Cubic Simple:

Lors du calcul des valeurs moyennes et de la dispersion dans les rangées d'intervalle de distribution, les valeurs réelles de l'attribut sont remplacées par les valeurs centrales des intervalles, qui sont différentes de la moyenne valeurs arithmétiquesinclus dans l'intervalle. Cela conduit à une erreur systématique lors du calcul de la dispersion. V.f. Sheppard a déterminé que erreur dans le calcul de la dispersionCausé par l'utilisation de données groupées est de 1/12 carré de la taille de l'intervalle à la fois en augmentant et dans la direction de réduire la variance de la dispersion.

Amendement Sheppard Il devrait être utilisé si la distribution est proche de la normale, fait référence à un signe avec la nature continue de la variation, est construite par un nombre important de données source (N\u003e 500). Toutefois, sur la base du fait que, dans certains cas, les erreurs, agissant dans différentes directions se compensent, peuvent parfois abandonner l'introduction d'amendements.

Plus la différence entre la dispersion et la déviation quadratique moyenne, plus l'unité est la totalité de la totalité et plus la valeur moyenne sera la valeur moyenne.
En pratique, les statistiques proviennent souvent la nécessité de comparer les variations de différents signes. Par exemple, un grand intérêt est une comparaison des variations de l'âge des travailleurs et de leurs qualifications, de l'expérience de travail et de la taille. les salaires, coût et profit, expérience de travail et productivité du travail, etc. Pour de telles comparaisons, les indicateurs de sections absolues des signes ne conviennent pas: on ne peut pas comparer les quantités d'expérience de travail exprimée depuis des années, avec une variation de salaire exprimée en roubles.

Pour effectuer de telles comparaisons, ainsi que des comparaisons de la variance de la même caractéristique dans plusieurs ensembles d'arithmétiques moyens moyennes, le taux de variation relative est utilisé - le coefficient de variation.

Milieu structurel

Pour caractériser la tendance centrale des distributions statistiques, il n'est pas rarement rationnel avec une utilisation en arithmétique moyenne d'une certaine valeur d'un signe X, qui, en vertu de certaines caractéristiques de l'emplacement dans un certain nombre de distribution, peut caractériser son niveau.

Ceci est particulièrement important lorsque, dans un certain nombre de distributions, les signes extrêmes du panneau ont des limites floues. Concernant définition précise L'arithmétique moyenne, en règle générale, n'est pas possible, ni très difficile. Dans de tels cas, le niveau moyen peut être déterminé en prenant par exemple la valeur de l'attribut situé au milieu d'une série de fréquences ou qui se trouve le plus souvent dans la rangée en cours.

Ces valeurs ne dépendent que de la nature de la fréquence, c'est-à-dire de la structure de distribution. Ils sont typiques à l'emplacement d'une rangée de fréquences. De telles valeurs sont donc considérées comme des caractéristiques du centre de distribution et ont donc obtenu la définition des moyennes structurelles. Ils sont utilisés pour explorer structure intérieure et la structure de la ligne de la distribution des signes de la fonctionnalité. Ces indicateurs incluent.



 


Lis:



Applique de feuilles - joyeux désolé-tort

Applique de feuilles - joyeux désolé-tort

Sujet: Désoléle du contenu du logiciel: 1. Continuez à développer des intérêts sur de nouvelles façons de fabriquer des appliqués de papier. 2. Exercice dans ...

Signaler photo "Créativité artistique

Signaler photo

Sujet: Désoléle du contenu du logiciel: 1. Continuez à développer des intérêts sur de nouvelles façons de fabriquer des appliqués de papier. 2. Exercice dans ...

Que cuisiner de coing. Coing. Recettes en blanc pour l'hiver de coing. Traitement thermique du gâteau

Que cuisiner de coing. Coing. Recettes en blanc pour l'hiver de coing. Traitement thermique du gâteau

Coingué apparut en Asie il y a 4000 ans. Les fruits ont une saveur astringente et contiennent la base de tarte aigre-douce. Le goût des fruits ressemble à une combinaison ...

Alice au pays des merveilles Alice au pays des merveilles: Pozolota

Alice au pays des merveilles Alice au pays des merveilles: Pozolota

Lors de l'application de la technologie de la dorure, vous pouvez revenir à l'ancienne attractivité à presque toutes les décors de cuivre ou d'argent. Produits avec dorure ...

image d'alimentation. RSS.