- 리노베이션에 관한 것이 아니라
비대칭 및 첨도의 무의미성에 대한 가설 테스트. 확률 변수 분포의 비대칭 및 첨도. 비대칭의 중요성 평가

정의. 패션 M 0 이산 확률 변수를 가장 가능성 있는 값이라고 합니다. 연속형 확률 변수의 경우 모드는 분포 밀도가 최대인 확률 변수의 값입니다.

이산 확률 변수에 대한 분포 다각형 또는 연속 확률 변수에 대한 분포 곡선의 최대값이 두 개 이상인 경우 이러한 분포를 바이모달또는 멀티모달.

분포에 최소값이 있지만 최대값이 없는 경우 이를 호출합니다. 안티 모달.

정의. 중앙값확률 변수 X의 M D는 확률 변수의 더 크거나 작은 값을 얻을 확률이 동등하게 상대적인 값이라고 합니다.

기하학적으로 중앙값은 분포 곡선으로 둘러싸인 면적이 절반이 되는 점의 가로 좌표입니다.

분포가 단봉이면 최빈값과 중앙값이 수학적 기대값과 일치합니다.

정의. 출발점주문하다 케이 확률 변수 X의 수학적 기대값은 수량 X 케이 .

이산 확률 변수의 경우:.

.

1차의 초기 모멘트는 수학적 기대치와 같습니다.

정의. 중심점주문하다 케이확률 변수 X는 값의 수학적 기대값이라고 합니다.

이산 확률 변수의 경우: .

연속 확률 변수의 경우: .

1차 중심 모멘트는 항상 0이고 2차 중심 모멘트는 분산과 같습니다. 3차의 중심 모멘트는 분포의 비대칭을 특징으로 합니다.

정의. 3차 표준편차에 대한 3차 중심 모멘트의 비율을 비대칭 계수.

정의. 분포의 뾰족함과 평탄함을 특성화하기 위해 첨도.

고려되는 수량 외에도 소위 절대 모멘트도 사용됩니다.

절대 시작점:.

절대 중심점: .

분위수 주어진 확률 수준에 해당 NS, 분포 함수가 다음과 같은 값을 취하는 값이라고 합니다. NS, 즉. 어디 NS- 주어진 확률 수준.

다시 말해 분위수 임의의 변수 값이 있습니다.

개연성 NS백분율로 주어지면 해당 분위수에 이름을 부여합니다(예: 40% 분위수라고 합니다.

20. 독립적인 실험에서 사건의 발생 횟수에 대한 수학적 기대와 분산.

정의. 수학적 기대치가능한 값이 간격에 속하는 연속 확률 변수 X를 한정적분이라고 합니다.

확률 변수의 가능한 값이 전체 숫자 축에서 고려되면 수학적 기대치는 다음 공식으로 찾습니다.

물론 이 경우에도 부적절한 적분은 수렴한다고 가정한다.

수학적 기대치이산 확률 변수는 해당 확률에 의한 가능한 값의 곱의 합입니다.

미디엄(NS) =NS 1 NS 1 +NS 2 NS 2 + … +NS NS NS NS . (7.1)

확률 변수의 가능한 값의 수가 무한이면
결과 시리즈가 절대적으로 수렴하는 경우.

비고 1.수학적 기대는 때때로 가중 평균, 많은 실험에 대한 확률 변수의 관찰 값의 산술 평균과 거의 같기 때문입니다.

비고 2.수학적 기대치의 정의에 따르면 그 값은 확률 변수의 가능한 가장 작은 값보다 작지 않고 가장 큰 값보다 크지 않습니다.

비고 3.이산 확률 변수의 수학적 기대치는 다음과 같습니다. 우연이 아니다(일정한. 다음 내용에서 연속 확률 변수에 대해서도 마찬가지임을 알 수 있습니다.

수학적 기대 속성.

    상수에 대한 수학적 기대치는 가장 일정한 것과 같습니다.

미디엄(와 함께) =와 함께.(7.2)

증거. 고려하면 와 함께하나의 값만 취하는 이산 확률 변수 와 함께확률로 NS= 1, 그럼 미디엄(와 함께) =와 함께 1 = 와 함께.

    상수 요인은 수학적 기대치의 부호에서 제거할 수 있습니다.

미디엄() =센티미터(NS). (7.3)

증거. 확률변수라면 NS분포 시리즈에 의해 주어진

NS NS

NS N

NS NS

NS N

그런 다음 배포 시리즈 다음과 같이 보입니다.

와 함께NS NS

와 함께NS 1

와 함께NS 2

와 함께NS N

NS NS

NS N

그 다음에 미디엄() =Cx 1 NS 1 +Cx 2 NS 2 + … +Cx NS NS NS =와 함께(NS 1 NS 1 +NS 2 NS 2 + … +NS NS NS NS) =센티미터(NS).

수학적 기대치연속 확률 변수라고 합니다.

(7.13)

비고 1.연속 확률 변수에 대한 분산의 일반적인 정의는 이산 변수(def. 7.5)와 동일하며 계산 공식은 다음과 같습니다.

(7.14)

표준 편차는 공식 (7.12)에 의해 계산됩니다.

비고 2.연속 확률 변수의 가능한 모든 값이 구간 [ NS, NS], 공식 (7.13) 및 (7.14)의 적분은 이러한 한계 내에서 계산됩니다.

정리. 독립 시행에서 사건 발생 횟수의 분산은 한 시행에서 사건이 발생할 확률과 발생하지 않을 확률에 의한 시행 횟수의 곱과 같습니다.

증거. 독립 시행에서 사건의 발생 횟수를 라 합시다. 각 시행에서 이벤트 발생의 합계와 같습니다. 검정이 독립적이므로 확률 변수 - 따라서 독립적입니다.

위와 같이, 그리고.

그런 다음 동안 .

이 경우, 앞서 언급했듯이 표준 편차입니다.

58. 비대칭 및 첨도 계수.

유통 중심 모멘트

변동의 특성에 대한 추가 연구를 위해 산술 평균에서 속성의 개별 값의 편차 정도가 다른 평균 값이 사용됩니다. 이러한 지표를 초점 편차가 증가하는 정도 또는 단순히 모멘트에 해당하는 차수의 분포.

배포 형태 표시기

분포 비대칭


Pearson 지수는 분포 계열의 중간 부분의 비대칭 정도에 따라 달라지며, 비대칭 지수는 3차 모멘트를 기반으로 한 특징의 극단값에 따라 달라집니다.

비대칭의 중요성 평가

비대칭의 중요성을 평가하기 위해 비대칭 계수의 평균 제곱 오차가 계산됩니다.

태도라면 값이 2보다 크면 비대칭의 중요한 특성을 나타냅니다.

분포 첨도

첨도 표시기
정규 분포 곡선의 상단에서 경험적 분포 상단의 위 또는 아래("차가움") 편차를 나타냅니다. 그러나! 분포 그래프는 특성 변이의 강도에 따라 임의로 가파르게 보일 수 있습니다. 변이가 ​​약할수록 주어진 척도에서 분포 곡선이 가파르게 나타납니다. 가로축과 세로축을 따라 눈금을 변경하여 모든 분포를 인위적으로 "가파르고" "평평하게" 만들 수 있다는 사실은 말할 것도 없습니다. 분포 첨도가 무엇으로 구성되어 있는지 보여주고 이를 올바르게 해석하기 위해서는 변동 강도가 동일하고(같은 σ 값) 첨도 지수가 다른 계열을 비교할 필요가 있습니다. 첨도와 비대칭을 혼동하지 않으려면 비교되는 모든 행이 대칭이어야 합니다. 이 비교는 그림 1에 나와 있습니다.

정규 분포의 첨도가 3이므로 첨도 지수는 다음 공식으로 계산됩니다.


첨도의 중요성 평가

첨도의 중요성을 평가하기 위해 제곱 평균 오차의 지표가 계산됩니다.

태도라면 값이 3보다 크면 초과의 중요한 특성을 나타냅니다.

비대칭 계수중심을 기준으로 한 분포 계열의 "왜도"를 보여줍니다.

세 번째 주문의 중심 모멘트는 어디에 있습니까?

- 표준편차의 세제곱.

이 계산 방법의 경우: 분포가 오른쪽인 경우(양의 비대칭), 분포가 왼쪽인 경우(음의 비대칭)

중심 모멘트 외에도 모드 또는 중앙값을 사용하여 비대칭을 계산할 수 있습니다.

또는, (6.69)

이 계산 방법의 경우: 분포에 오른쪽(양의 비대칭)이 있는 경우 분포에 왼쪽(음의 비대칭)이 있는 경우(그림 4).


쌀. 4. 비대칭 분포

분포의 "가파름"을 나타내는 값을 첨도:

만약, 배포판에 정점 - 분포에 다음이 있는 경우 첨도는 양수입니다. 평탄 - 첨도는 음수입니다(그림 5).

쌀. 5. 유통의 과잉

예 5.지역 농장의 양 수에 대한 데이터가 있습니다(표 9).

1. 가구당 평균 양의 수.

3. 중앙값.

4. 변동 지표

· 차이;

· 표준 편차;

· 변동 계수.

5. 비대칭 및 첨도의 지표.

해결책.

1. 집계의 옵션 값이 여러 번 반복되므로 특정 빈도로 평균 값을 계산하므로 가중 산술 평균 공식을 사용합니다.

2. 이 행은 이산형이므로 모드가 가장 높은 주파수를 갖는 옵션이 됩니다. -.

3. 이 시리즈는 짝수입니다. 이 경우 이산 시리즈의 중앙값은 다음 공식으로 구합니다.

즉, 연구 인구의 가구 중 절반이 최대 475,000 마리의 양을 가지고 있습니다. 그리고 이 숫자의 절반 이상입니다.

4. 변동 지표를 계산하기 위해 표 10을 컴파일합니다. 여기에서 편차, 이러한 편차의 제곱을 계산합니다. 계산은 단순 계산 공식과 가중 계산 공식을 모두 사용하여 수행할 수 있습니다(예제에서는 단순 하나):

표 10

2,00 -2,42 5,84
2,50 -1,92 3,67
2,50 -1,92 3,67
3,00 -1,42 2,01
3,00 -1,42 2,01
4,00 -0,42 0,17
5,50 1,08 1,17
5,50 1,08 1,17
5,50 1,08 1,17
6,00 1,58 2,51
6,50 2,08 4,34
7,00 2,58 6,67
53,00 0,00 34,42
평균 4,4167

분산을 계산해 보겠습니다.

표준 편차를 계산해 보겠습니다.

변동 계수를 계산해 보겠습니다.

5. 비대칭 및 첨도의 지표를 계산하기 위해 다음을 계산하는 표 11을 구성합니다.

표 11

2,00 -2,42 -14,11 34,11
2,50 -1,92 -7,04 13,50
2,50 -1,92 -7,04 13,50
3,00 -1,42 -2,84 4,03
3,00 -1,42 -2,84 4,03
4,00 -0,42 -0,07 0,03
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
6,00 1,58 3,97 6,28
6,50 2,08 9,04 18,84
7,00 2,58 17,24 44,53
53,00 0,00 0,11 142,98
평균 4,4167

분포의 비대칭은 다음과 같습니다.

즉, 다음 공식에 따른 계산으로 확인되는 왼쪽 비대칭이 관찰됩니다.

이 경우 이 공식에 대해 왼쪽 비대칭도 나타냅니다.

분포의 첨도는 다음과 같습니다.

우리의 경우 첨도는 음수, 즉 평평함이 관찰됩니다.

실시예 6... 농장의 경우 근로자의 임금에 대한 데이터가 표시됩니다(탭 12).

해결책.

구간 변동 시리즈의 경우 모드는 다음 공식으로 계산됩니다.

어디 모달 간격 - 주파수가 가장 높은 간격(우리의 경우 3600-3800, 주파수 포함)

모달 간격의 최소 경계(3600).

모달 간격의 값(200);

모달 간격(25)에 선행하는 간격의 빈도;

다음 모달 간격의 빈도(29);

모달 간격 주파수(68).

표 12

구간 변동 계열의 경우 중앙값은 다음 공식으로 계산됩니다.

어디 중간 간격 이것은 간격이며 누적(누적) 빈도는 빈도 합계의 절반 이상이며 이 예에서는 3600-3800입니다.

중앙값 간격의 최소 경계(3600);

중간 간격 값(200)

시리즈 주파수의 합(154);

중앙값(57) 이전의 모든 간격으로 누적된 빈도의 합입니다.

중앙값 간격(68)의 빈도입니다.

예 7.한 지역의 세 농장의 경우 생산 자본 집약도(제조 제품 1루블당 고정 자산 비용 수)에 대한 정보가 있습니다. I - 1.29루블, II - 1.32루블, III - 1.27루블. 평균 자본 집약도를 계산할 필요가 있습니다.

해결책... 자본 집약도는 자본 회전율의 역 지표이므로 단순 조화 평균 공식을 사용합니다.

예 8.한 지역의 3개 농장의 경우 총 곡물 수확량과 평균 수확량에 대한 데이터가 있습니다(표 13).

해결책... 뿌린 면적에 대한 정보가 없기 때문에 산술 평균에 의한 평균 수확량 계산은 불가능하므로 조화 가중 평균 공식을 사용합니다.

예 9.개별 구획에서 감자의 평균 수확량과 언덕의 수에 대한 데이터가 있습니다(표 14).

표 14

데이터를 그룹화합시다(표 15).

표 15

"제초 횟수"에 따른 플롯 그룹화

1. 표본의 총 분산을 계산해 보겠습니다(표 16).

2.6 비대칭과 첨도

수학적 통계에서는 확률변수의 확률밀도의 기하학적 형태를 찾기 위해 3차와 4차의 중심모멘트와 관련된 두 가지 수치적 특성을 사용한다.

정의 2.22 표본 왜도 계수NS 1 , NS 2 , …, NS N표준 편차의 세제곱에 대한 3차 중심 샘플링 모멘트의 비율과 같은 숫자입니다. NS:

이후로 , 비대칭 계수는 다음 공식에 의해 중심 모멘트로 표현됩니다.

이것은 초기 모멘트의 관점에서 비대칭 계수를 표현하는 공식을 제공합니다:

실용적인 계산을 용이하게 합니다.

상응하는 이론적 특성은 이론적 요점의 도움으로 소개됩니다.

정의 2.23 확률변수의 비대칭 계수에 의한 것NS번호를 불렀다3차 중심 모멘트의 비율과 동일표준 편차 큐브:

확률 변수 X가 수학적 기대치 μ에 대해 대칭 분포를 갖는다면 이론적인 왜도 계수는 0이지만 확률 분포가 비대칭이면 왜도 계수는 0이 아닙니다. 왜도 계수의 양수 값은 대부분의 확률 변수 값이 수학적 기대치의 오른쪽에 있음을 나타냅니다. 즉, 확률 밀도 곡선의 오른쪽 분기가 왼쪽보다 더 길다는 의미입니다. 왜도 계수의 음수 값은 곡선의 긴 부분이 왼쪽에 있음을 나타냅니다. 이 문은 다음 그림에 나와 있습니다.

그림 2.1 - 포지티브 및 네거티브 비대칭

분포

예 2.29예제 2.28에서 스트레스 상황에 대한 연구에 따라 샘플 비대칭 계수를 찾아봅시다.

이전에 계산된 중심 샘플링 모멘트 값을 사용하여 다음을 얻습니다.

.

반올림 = 0.07. 왜도 계수의 발견된 0이 아닌 값은 평균에 상대적인 분포의 왜도를 보여줍니다. 양수 값은 확률 밀도 곡선의 더 긴 분기가 오른쪽에 있음을 나타냅니다.

모달 값 X 모드 주변의 랜덤 변수 값 분포의 특징은 다음 상수가 특징입니다.

정의 2.24 첨도 샘플링NS 1 , NS 2 , …, NS N번호를 불렀다 , 동일한

,

어디- 4차의 선택적 중심 모멘트,

NS 4 - 표준의 네 번째 등급편차NS.

첨도의 이론적 개념은 선택적 첨도와 유사합니다.

정의 2.25 확률변수의 첨도에 의한 것NS번호를 불렀다 이자형,동일한

,

어디4차 이론의 중심점,

4차 표준편차.

첨도의 의미 이자형최대 지점 주변의 분포 밀도 곡선 상단의 상대적 급경사를 특성화합니다. 첨도가 양수이면 해당 분포 곡선의 상단이 더 뾰족합니다. 음의 첨도가 있는 분포는 위쪽이 더 부드럽고 평평합니다. 다음 그림은 가능한 경우를 보여줍니다.

그림 2.2 - 첨도의 양수, 0 및 음수 값을 가진 분포

비대칭은 SKOS 함수에 의해 계산됩니다. 인수는 데이터가 있는 셀의 범위입니다. 예를 들어 데이터가 A1에서 A100까지의 셀 범위에 포함된 경우 = RMS(A1: A100)입니다.

첨도는 EXCESS 함수에 의해 계산되며, 그 인수는 숫자 데이터이며 일반적으로 = EXCESS (A1: A100)와 같이 셀 간격의 형태로 지정됩니다.

§2.3. 분석 도구 기술 통계

V 뛰어나다분석 도구를 사용하여 샘플의 모든 점 특성을 한 번에 계산할 수 있습니다. 기술 통계에 포함되어 있는 분석 패키지.

기술 통계데이터 세트에 대한 기본 통계 테이블을 생성합니다. 이 표에는 평균, 표준 오차, 분산, 표준 편차, 최빈값, 중위수, 구간 변동 범위, 최대값 및 최소값, 왜도, 첨도, 모집단 크기, 모든 모집단 요소의 합, 신뢰 구간(신뢰도 수준 ). 도구 기술 통계통계 특성을 별도로 계산하기 위해 각 함수를 호출할 필요가 없어 통계 분석을 크게 단순화합니다.

전화를 하려면 기술 통계, 다음과 같습니다.

1) 메뉴에서 서비스팀을 선택 데이터 분석;

2) 목록에서 분석 도구대화 상자 데이터 분석도구를 선택 기술 통계그리고 누르다 좋아요.

창에서 기술 통계필요한:

· 그룹에서 입력 데이터현장에서 입력 간격데이터를 포함하는 셀의 범위를 지정합니다.

입력 범위의 첫 번째 행에 열 머리글이 포함된 경우 첫 번째 줄의 레이블 필드확인란을 선택하십시오.

· 그룹에서 출력 옵션스위치를 활성화하십시오(상자를 선택하십시오) 요약 통계전체 특성 목록이 필요한 경우

스위치 활성화 신뢰성 수준신뢰 구간을 계산해야 하는 경우 신뢰도를 %로 표시합니다(기본적으로 신뢰도는 95%). 딸깍 하는 소리 좋아요.

결과적으로 위의 통계적 특성을 계산한 표가 나타납니다. 즉시 이 테이블의 선택을 취소하지 않고 명령을 실행합니다. 체재® ® 자동 맞춤 너비.

대화 상자 보기 기술 통계:

실제 작업

2.1. 표준 함수를 사용한 기본 포인트 통계 계산 뛰어나다

동일한 전압계가 회로의 전압을 25번 측정했습니다. 실험 결과, 볼트 단위로 다음과 같은 전압 값이 얻어졌습니다.

32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35,

34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30.

평균, 샘플링 및 수정된 분산, 표준 편차, 범위, 모드, 중앙값을 찾습니다. 왜도와 첨도를 계산하여 정규 분포로부터의 편차를 확인합니다.

이 작업을 완료하려면 다음 단계를 완료하십시오.

1. A열에 실험 결과를 입력합니다.

2. B1 셀에 "평균", B2 - "선택한 분산", B3 - "표준 편차", B4 - "수정된 분산", B5 - "수정된 표준 편차", B6 - "최대"를 입력합니다. , B7 - "최소", B8 - "변동 범위", B9 - "모드", B10 - "중앙값", B11 - "비대칭", B12 - "초과".

3. 이 열의 너비를 자동 맞춤너비.

4. C1 셀을 선택하고 수식 입력줄에서 "=" 기호가 있는 버튼을 클릭합니다. 사용하여 기능 마법사카테고리에서 통계 AVERAGE 함수를 찾은 다음 데이터 셀 범위를 강조 표시하고 좋아요.

5. C2 셀을 선택하고 수식 입력줄에서 = 기호를 클릭합니다. 사용하여 기능 마법사카테고리에서 통계 VARP 기능을 찾은 다음 데이터 셀 범위를 강조 표시하고 좋아요.

6. 나머지 특성을 계산하기 위해 동일한 작업을 수행합니다.

7. C8 셀의 변동 범위를 계산하려면 다음 공식을 입력하십시오. = C6-C7.

8. 테이블 앞에 "특성 이름" 및 "숫자 값"이라는 해당 열의 제목을 입력하는 한 줄을 추가합니다.



 


읽다:



네 부분으로 된 아이콘, 신의 어머니의 아이콘 악한 마음을 부드럽게 하는 것(체스토호와), 내 슬픔을 달래는 것, 문제의 고통을 전달하는 것, 잃어버린 것을 회복하는 것

네 부분으로 된 아이콘, 신의 어머니의 아이콘 악한 마음을 부드럽게 하는 것(체스토호와), 내 슬픔을 달래는 것, 문제의 고통을 전달하는 것, 잃어버린 것을 회복하는 것

이 아이콘에 문서가 첨부되어 있습니다 - 역사와 문화의 대상에 대한 조사 및 평가를위한 국립 연구소의 시험 ...

색상을 선택하는 것은 쉬운 일이 아닙니다. 검정은 항상 관련이 있습니다.

색상을 선택하는 것은 쉬운 일이 아닙니다. 검정은 항상 관련이 있습니다.

iPhone 6은 참신함과는 거리가 멀지만, 수요가 떨어질 것 같지도 않고 오히려 몇 년은 더 상위 스마트폰에서 버티며 점차 저렴해질 것입니다...

아기는 매일 딸꾹질을 한다

아기는 매일 딸꾹질을 한다

아기가 딸꾹질을 하면 귀엽고 달콤하게 들리지만 걱정이 됩니다. 엄마가 제자리에 걸었을 때 아기는 이미 딸꾹질을 하고 있었습니다. 모든 것...

사람의 이름과 생년월일로 아이콘을 선택하는 방법 sergey라는 이름의 남성을 위한 아이콘

사람의 이름과 생년월일로 아이콘을 선택하는 방법 sergey라는 이름의 남성을 위한 아이콘

Sergeevs의 가장 중요한 천상의 후원자는 Trinity-Sergius Lavra의 창립자이며 Radonezh의 Sergius는 가장 사랑 받고 ...

피드 이미지 Rss