hogar - Realmente no se trata de renovación
Prueba de la hipótesis sobre la insignificancia de la asimetría y la curtosis. Asimetría y curtosis de distribución de una variable aleatoria. Evaluación de la materialidad de la asimetría

Definición. Moda La variable aleatoria discreta M 0 se denomina valor más probable. Para una variable aleatoria continua, la moda es el valor de la variable aleatoria en la que la densidad de distribución tiene un máximo.

Si el polígono de distribución para una variable aleatoria discreta o la curva de distribución para una variable aleatoria continua tiene dos o más máximos, entonces dicha distribución se llama bimodal o multimodal.

Si una distribución tiene un mínimo pero no un máximo, entonces se llama antimodal.

Definición. Mediana M D de una variable aleatoria X se llama su valor relativo al cual es igualmente probable obtener un valor mayor o menor de la variable aleatoria.

Geométricamente, la mediana es la abscisa del punto en el que el área delimitada por la curva de distribución se divide a la mitad.

Tenga en cuenta que si la distribución es unimodal, la moda y la mediana coinciden con la expectativa matemática.

Definición. El punto de partida pedido k de una variable aleatoria X se llama la expectativa matemática de la cantidad X k .

Para una variable aleatoria discreta :.

.

El momento inicial del primer orden es igual a la expectativa matemática.

Definición. Punto central pedido k La variable aleatoria X se llama la expectativa matemática del valor.

Para una variable aleatoria discreta: .

Para una variable aleatoria continua: .

El momento central de primer orden es siempre cero y el momento central de segundo orden es igual a la varianza. El momento central del tercer orden caracteriza la asimetría de la distribución.

Definición. La relación entre el momento central de tercer orden y la desviación estándar de tercer grado se llama coeficiente de asimetría.

Definición. Para caracterizar el pico y la planitud de la distribución, una cantidad llamada curtosis.

Además de las cantidades consideradas, también se utilizan los denominados momentos absolutos:

Punto de partida absoluto :.

Punto central absoluto: .

Cuantil correspondiente a un nivel dado de probabilidad R, se llama un valor en el que la función de distribución toma un valor igual a R, es decir. dónde R- un nivel dado de probabilidad.

En otras palabras cuantil hay un valor de una variable aleatoria en el que

Probabilidad R, dado como porcentaje, da un nombre al cuantil correspondiente, por ejemplo, se le llama cuantil del 40%.

20. Expectativa matemática y varianza del número de ocurrencias de un evento en experimentos independientes.

Definición. Expectativa matemática una variable aleatoria continua X, cuyos posibles valores pertenecen a un intervalo, se llama integral definida

Si los posibles valores de una variable aleatoria se consideran en todo el eje numérico, entonces la expectativa matemática se encuentra mediante la fórmula:

En este caso, por supuesto, se supone que la integral impropia converge.

Expectativa matemática Una variable aleatoria discreta es la suma de los productos de sus posibles valores por las probabilidades correspondientes:

METRO(NS) =NS 1 R 1 +NS 2 R 2 + … +NS NS R NS . (7.1)

Si el número de valores posibles de una variable aleatoria es infinito, entonces
si la serie resultante converge absolutamente.

Observación 1. La expectativa matemática a veces se llama peso promedio, ya que es aproximadamente igual a la media aritmética de los valores observados de la variable aleatoria para un gran número de experimentos.

Observación 2. De la definición de la expectativa matemática se deduce que su valor no es menor que el valor más pequeño posible de una variable aleatoria y no más que el mayor.

Observación 3. La expectativa matemática de una variable aleatoria discreta es sin coincidencia(constante. En lo que sigue, veremos que lo mismo ocurre con las variables aleatorias continuas.

Propiedades de la expectativa matemática.

    La expectativa matemática de una constante es igual a la más constante:

METRO(CON) =CON.(7.2)

Prueba. Considerando CON como una variable aleatoria discreta que toma solo un valor CON con probabilidad R= 1, entonces METRO(CON) =CON 1 = CON.

    El factor constante se puede sacar del signo de la expectativa matemática:

METRO(SH) =CM(NS). (7.3)

Prueba. Si una variable aleatoria NS dado por una serie de distribución

X I

X norte

pag I

pag norte

luego la serie de distribución para SH parece:

CONX I

CONX 1

CONX 2

CONX norte

pag I

pag norte

Luego METRO(SH) =Cx 1 R 1 +Cx 2 R 2 + … +Cx NS R NS =CON(NS 1 R 1 +NS 2 R 2 + … +NS NS R NS) =CM(NS).

Expectativa matemática la variable aleatoria continua se llama

(7.13)

Observación 1. La definición general de varianza para una variable aleatoria continua es la misma que para una discreta (def. 7.5), y la fórmula para su cálculo es:

(7.14)

La desviación estándar se calcula mediante la fórmula (7.12).

Observación 2. Si todos los valores posibles de una variable aleatoria continua no van más allá del intervalo [ a, B], entonces las integrales en las fórmulas (7.13) y (7.14) se calculan dentro de estos límites.

Teorema. La varianza del número de ocurrencias de un evento en ensayos independientes es igual al producto del número de ensayos por la probabilidad de ocurrencia y no ocurrencia de un evento en un ensayo :.

Prueba. Sea el número de ocurrencias de un evento en ensayos independientes. Es igual a la suma de las ocurrencias del evento en cada ensayo :. Dado que las pruebas son independientes, entonces las variables aleatorias - son independientes, por tanto.

Como se muestra arriba y.

Entonces, mientras .

En este caso, como se mencionó anteriormente, la desviación estándar.

58. Coeficientes de asimetría y curtosis.

Distribución de momentos centrales

Para un estudio más detallado de la naturaleza de la variación, se utilizan los valores promedio de los diferentes grados de desviación de los valores individuales del atributo de su media aritmética. Estos indicadores se llaman puntos focales distribuciones del orden correspondiente al grado en que se elevan las desviaciones, o simplemente momentos.

Indicadores de formulario de distribución

Asimetría de distribución


El exponente de Pearson depende del grado de asimetría en la parte media de la serie de distribución y el índice de asimetría, basado en el momento de tercer orden, de los valores extremos de la característica.

Evaluación de la materialidad de la asimetría

Para evaluar la importancia de la asimetría, se calcula el error cuadrático medio del coeficiente de asimetría

Si la actitud tiene un valor mayor que 2, esto indica una naturaleza significativa de la asimetría

Curtosis de distribución

Indicador de curtosis
representa la desviación de la parte superior de la distribución empírica hacia arriba o hacia abajo ("frialdad") desde la parte superior de la curva de distribución normal, ¡PERO! El gráfico de distribución puede parecer arbitrariamente empinado dependiendo de la fuerza de la variación del rasgo: cuanto más débil es la variación, más empinada es la curva de distribución en una escala determinada. Sin mencionar el hecho de que al cambiar las escalas a lo largo de los ejes de abscisas y ordenadas, cualquier distribución se puede hacer artificialmente “empinada” y “plana”. Para mostrar en qué consiste la curtosis de distribución e interpretarla correctamente, es necesario comparar series con la misma fuerza de variación (el mismo valor de σ) y diferentes índices de curtosis. Para no confundir curtosis con asimetría, todas las filas comparadas deben ser simétricas. Esta comparación se muestra en la Fig.

Dado que la curtosis de la distribución normal es 3, el índice de curtosis se calcula mediante la fórmula


Evaluar la materialidad de la curtosis

Para evaluar la importancia de la curtosis, se calcula el indicador de su error cuadrático medio.

Si la actitud tiene un valor de más de 3, entonces esto indica una naturaleza significativa del exceso

Coeficiente de asimetría muestra la "asimetría" de la serie de distribución en relación con el centro:

donde es el momento central del tercer orden;

- cubo de desviación estándar.

Para este método de cálculo: si, la distribución es del lado derecho (asimetría positiva), si, la distribución es del lado izquierdo (asimetría negativa)

Además del momento central, la asimetría se puede calcular utilizando la moda o la mediana:

o, (6,69)

Para este método de cálculo: si, en la distribución, hay un lado derecho (asimetría positiva), si, en la distribución, hay un lado izquierdo (asimetría negativa) (Fig. 4).


Arroz. 4. Distribuciones asimétricas

El valor que muestra la "inclinación" de la distribución se llama curtosis:

Si en la distribución hay pico - la curtosis es positiva si, en la distribución, hay llanura - la curtosis es negativa (Fig. 5).

Arroz. 5. Exceso de distribución

Ejemplo 5. Hay datos sobre el número de ovejas en las granjas del distrito (Cuadro 9).

1. Número medio de ovejas por hogar.

3. Mediana.

4. Indicadores de variación

Diferencia;

· Desviación Estándar;

· El coeficiente de variación.

5. Indicadores de asimetría y curtosis.

Solución.

1. Dado que el valor de las opciones en el agregado se repite varias veces, con cierta frecuencia para calcular el valor promedio, usamos la fórmula de la media aritmética ponderada:

2. Esta fila es discreta, por lo que el modo será la opción con mayor frecuencia -.

3. Esta serie es par, en este caso la mediana de la serie discreta se encuentra mediante la fórmula:

Es decir, la mitad de los hogares de la población estudiada tienen el número de ovinos hasta 4,75 mil cabezas. y la mitad más que este número.

4. Para calcular los indicadores de variación, compondremos la tabla 10, en la cual calcularemos las desviaciones, los cuadrados de estas desviaciones, el cálculo se puede realizar usando fórmulas de cálculo simples y ponderadas (en el ejemplo usamos una uno):

Tabla 10

2,00 -2,42 5,84
2,50 -1,92 3,67
2,50 -1,92 3,67
3,00 -1,42 2,01
3,00 -1,42 2,01
4,00 -0,42 0,17
5,50 1,08 1,17
5,50 1,08 1,17
5,50 1,08 1,17
6,00 1,58 2,51
6,50 2,08 4,34
7,00 2,58 6,67
Total 53,00 0,00 34,42
Promedio 4,4167

Calculemos la varianza:

Calculemos la desviación estándar:

Calculemos el coeficiente de variación:

5. Para calcular los indicadores de asimetría y curtosis, construimos la tabla 11, en la que calculamos ,,

Cuadro 11

2,00 -2,42 -14,11 34,11
2,50 -1,92 -7,04 13,50
2,50 -1,92 -7,04 13,50
3,00 -1,42 -2,84 4,03
3,00 -1,42 -2,84 4,03
4,00 -0,42 -0,07 0,03
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
6,00 1,58 3,97 6,28
6,50 2,08 9,04 18,84
7,00 2,58 17,24 44,53
Total 53,00 0,00 0,11 142,98
Promedio 4,4167

La asimetría de la distribución es igual a:

Es decir, se observa asimetría del lado izquierdo, ya que, lo cual se confirma mediante el cálculo según la fórmula:

En este caso, que para esta fórmula también indica asimetría del lado izquierdo

La curtosis de distribución es igual a:

En nuestro caso, la curtosis es negativa, es decir, se observa planitud.

Ejemplo 6... Para la finca, se presentan datos sobre los salarios de los trabajadores (tab. 12)

Solución.

Para una serie de variación de intervalo, la moda se calcula mediante la fórmula:

dónde intervalo modal - el intervalo con la frecuencia más alta, en nuestro caso 3600-3800, con una frecuencia

El borde mínimo del intervalo modal (3600);

El valor del intervalo modal (200);

La frecuencia del intervalo que precede al intervalo modal (25);

La frecuencia del siguiente intervalo modal (29);

Frecuencia de intervalo modal (68).

Cuadro 12

Para una serie de variación de intervalo, la mediana se calcula mediante la fórmula:

dónde intervalo mediano este es un intervalo, cuya frecuencia acumulada (acumulada) es igual o mayor que la mitad de la suma de frecuencias, en nuestro ejemplo es 3600-3800.

El borde mínimo del intervalo mediano (3600);

El valor del intervalo mediano (200);

La suma de las frecuencias de la serie (154);

La suma de las frecuencias acumuladas, todos los intervalos que preceden a la mediana (57);

Es la frecuencia del intervalo mediano (68).

Ejemplo 7. Para tres granjas en una región, hay información sobre la intensidad de capital de producción (el número de costos de activos fijos por 1 rublo de productos manufacturados): I - 1.29 rublos, II - 1.32 rublos, III - 1.27 rublos. Es necesario calcular la intensidad media de capital.

Solución... Dado que la intensidad de capital es el indicador inverso de la rotación de capital, utilizamos la fórmula de promedio armónico simple.

Ejemplo 8. Para tres fincas en una región, hay datos sobre la cosecha bruta de granos y el rendimiento promedio (Cuadro 13).

Solución... El cálculo del rendimiento promedio por la media aritmética es imposible, ya que no hay información sobre el número de áreas sembradas, por lo que usamos la fórmula para el promedio ponderado armónico:

Ejemplo 9. Existen datos sobre el rendimiento promedio de papa en parcelas individuales y el número de lomas (Cuadro 14)

Cuadro 14

Agrupemos los datos (Tabla 15):

Mesa 15

Agrupación de parcelas según el "número de deshierbe"

1. Calculemos la varianza total de la muestra (Tabla 16).

2.6 Asimetría y curtosis

En estadística matemática, para conocer la forma geométrica de la densidad de probabilidad de una variable aleatoria, se utilizan dos características numéricas asociadas con momentos centrales de tercer y cuarto orden.

Definición 2.22 Coeficiente de asimetría de la muestraX 1 , X 2 , …, X norte es un número igual a la relación entre el momento central de muestreo de tercer orden y el cubo de la desviación estándar S:

Desde y , entonces el coeficiente de asimetría se expresa en términos de los momentos centrales mediante la siguiente fórmula:

Esto da una fórmula que expresa el coeficiente de asimetría en términos de los momentos iniciales:

lo que facilita los cálculos prácticos.

La característica teórica correspondiente se introduce con la ayuda de puntos teóricos.

Definición 2.23 El coeficiente de asimetría de una variable aleatoriaXllamó al númeroigual a la relación del momento central de tercer ordenal cubo de desviación estándar:

Si una variable aleatoria X tiene una distribución simétrica con respecto a la expectativa matemática μ, entonces su coeficiente de asimetría teórico es 0, si la distribución de probabilidad es asimétrica, entonces el coeficiente de asimetría es distinto de cero. Un valor positivo del coeficiente de asimetría indica que la mayoría de los valores de la variable aleatoria están ubicados a la derecha de la expectativa matemática, es decir, la rama derecha de la curva de densidad de probabilidad es más alargada que la izquierda. Un valor negativo del coeficiente de asimetría indica que la parte más larga de la curva está ubicada a la izquierda. Esta declaración se ilustra en la siguiente figura.

Figura 2.1 - Asimetría positiva y negativa

distribuciones

Ejemplo 2.29 Encontremos el coeficiente muestral de asimetría según el estudio de situaciones estresantes del ejemplo 2.28.

Usando los valores previamente calculados de los momentos centrales de muestreo, obtenemos

.

Redondeado = 0,07. El valor distinto de cero encontrado del coeficiente de asimetría muestra la asimetría de la distribución en relación con la media. Un valor positivo indica que la rama más larga de la curva de densidad de probabilidad está a la derecha.

Las características de la distribución de valores de una variable aleatoria alrededor de sus modos de valor modal X se caracterizan por la siguiente constante.

Definición 2.24 Muestreo de curtosisX 1 , X 2 , …, X nortellamó al número , igual

,

dónde- momento central selectivo de cuarto orden,

S 4 - el cuarto grado del estándardesviacionesS.

El concepto teórico de curtosis es análogo al de curtosis selectiva.

Definición 2.25 Por curtosis de una variable aleatoriaXllamó al número mi, igual

,

dóndepunto central teórico de cuarto orden,

cuarto grado de desviación estándar.

El significado de la curtosis mi caracteriza la inclinación relativa de la parte superior de la curva de densidad de distribución alrededor del punto máximo. Si la curtosis es un número positivo, entonces la curva de distribución correspondiente tiene una parte superior más pronunciada. La distribución con curtosis negativa tiene una parte superior más suave y plana. La siguiente figura ilustra posibles casos.

Figura 2.2 - Distribuciones con valores positivos, cero y negativos de curtosis

La asimetría es calculada por la función SKOS. Su argumento es el rango de celdas con datos, por ejemplo, = RMS (A1: A100) si los datos están contenidos en el rango de celdas de A1 a A100.

La curtosis se calcula mediante la función EXCESO, cuyo argumento son datos numéricos, especificados, como regla, en forma de un intervalo de celdas, por ejemplo: = EXCESO (A1: A100).

§2.3. Herramienta de análisis Estadísticas descriptivas

V Sobresalir es posible calcular todas las características puntuales de la muestra a la vez utilizando la herramienta de análisis Estadísticas descriptivas que está contenido en Paquete de análisis.

Estadísticas descriptivas crea una tabla de estadísticas básicas para un conjunto de datos. Esta tabla contendrá las siguientes características: media, error estándar, varianza, desviación estándar, moda, mediana, rango de variación de intervalo, valores máximos y mínimos, asimetría, curtosis, tamaño de la población, suma de todos los elementos de la población, intervalo de confianza (nivel de confiabilidad ). Herramienta Estadísticas descriptivas simplifica enormemente el análisis estadístico al eliminar la necesidad de llamar a cada función para calcular las características estadísticas por separado.

Para llamar Estadísticas descriptivas, sigue:

1) en el menú Servicio selecciona un equipo Análisis de los datos;

2) en la lista Herramientas de análisis caja de diálogo Análisis de los datos elige una herramienta Estadísticas descriptivas y presione está bien.

En la ventana Estadísticas descriptivas necesario:

· en un grupo Los datos de entrada en el campo Intervalo de entrada especificar el rango de celdas que contienen datos;

Si la primera fila del rango de entrada contiene un encabezado de columna, entonces en el campo Etiquetas en la primera línea revisa la caja;

· en un grupo Opciones de salida activar el interruptor (marque la casilla) Resumen estadístico si necesita una lista completa de características;

Activar interruptor Nivel de confiabilidad e indicar la confiabilidad en%, si es necesario calcular el intervalo de confianza (por defecto, la confiabilidad es del 95%). prensa está bien.

Como resultado, aparecerá una tabla con los valores calculados de las características estadísticas anteriores. Inmediatamente, sin borrar la selección de esta tabla, ejecute el comando Formato® Columna® Ancho de Autoajuste.

Vista de cuadro de diálogo Estadísticas descriptivas:

Tareas practicas

2.1. Cálculo de estadísticas de puntos básicos utilizando funciones estándar Sobresalir

El mismo voltímetro midió el voltaje en el circuito 25 veces. Como resultado de los experimentos, se obtuvieron los siguientes valores de voltaje en voltios:

32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35,

34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30.

Encuentre la media, la varianza muestreada y corregida, la desviación estándar, el rango, la moda y la mediana. Verifique la desviación de la distribución normal calculando la asimetría y la curtosis.

Complete los siguientes pasos para completar esta tarea.

1. Escriba los resultados de su experimento en la columna A.

2. En la celda B1, escriba "Promedio", en B2 - "Varianza seleccionada", en B3 - "Desviación estándar", en B4 - "Varianza corregida", en B5 - "Desviación estándar corregida", en B6 - "Máxima" , en B7 - “Mínimo”, en B8 - “Rango de variación”, en B9 - “Modo”, en B10 - “Mediana”, en B11 - “Asimetría”, en B12 - “Exceso”.

3. Alinee el ancho de esta columna con Autoajuste ancho.

4. Seleccione la celda C1 y haga clic en el botón con el signo "=" en la barra de fórmulas. Mediante el uso Asistentes de funciones en categoria Estadístico busque la función PROMEDIO, luego resalte el rango de celdas de datos y presione está bien.

5. Seleccione la celda C2 y haga clic en el signo = en la barra de fórmulas. Mediante el uso Asistentes de funciones en categoria Estadístico busque la función VARP, luego resalte el rango de celdas de datos y presione está bien.

6. Haz lo mismo por ti mismo para calcular el resto de características.

7. Para calcular el rango de variación en la celda C8, ingrese la fórmula: = C6-C7.

8. Agregue una línea al frente de su tabla, en la que ingrese los títulos de las columnas correspondientes: "Nombre de las características" y "Valores numéricos".



 


Leer:



Determinar el sexo del niño por latido del corazón.

Determinar el sexo del niño por latido del corazón.

Siempre es emocionante. Para todas las mujeres, evoca una variedad de emociones y experiencias, pero ninguna de nosotras percibe la situación a sangre fría y ...

Cómo hacer una dieta para un niño con gastritis: recomendaciones generales.

Cómo hacer una dieta para un niño con gastritis: recomendaciones generales.

Para que el tratamiento de la gastritis sea efectivo y exitoso, el niño debe recibir una alimentación adecuada. Las recomendaciones de los gastroenterólogos ayudarán ...

¿Cuál es la forma correcta de comportarse con un chico para que se enamore?

¿Cuál es la forma correcta de comportarse con un chico para que se enamore?

Mencione a un amigo en común. Mencionar a un amigo en común en una conversación puede ayudarte a crear un vínculo personal con el chico, incluso si no eres muy bueno ...

Bogatyrs de la tierra rusa: lista, historia y hechos interesantes

Bogatyrs de la tierra rusa: lista, historia y hechos interesantes

Probablemente no exista tal persona en Rusia que no haya oído hablar de los héroes. Los héroes que nos llegaron de las antiguas canciones, leyendas y epopeyas rusas, siempre han sido ...

imagen de alimentación Rss