[통계학 기초]5. 모평균 검정 #z-검정 #t-검정 #유의성검정
* 아래 내용은 통계학 기초 2~4 강의 내용을 종합한 것입니다. 정규분포표, t-분포표 도 해당 글에서 확인하세요
Z-검정 (모집단의 표준편차를 알고 있는 경우)
귀무가설 : 모평균이 뮤이고 표준편차가 시그마인 정규분포에서 뽑힌 크기n의 랜덤표본할때 표본 평균의 분포가 N(뮤,시그마^2/n) 정규분포를 따른다
1) p-value를 이용한 방법
- 귀무가설이 맞다는 가정하에 표본으로부터 얻은 관측치 만큼 또는 그보다 더 극단적인(대립가설의 방향으로) 관측치가 얻어질 확률
검정통계량 : (관측치가 가정된 값으로 부터 몇 표준편차만큼 떨어져 있는가?)
예제1)
227g으로 담는 기계가 있는데 4개를 뽑아 평균을 내보니 222g이었다. 이때 기계에 이상이 있는지 없는지 알 고 싶다.
모평균 227g 표본평균 222g 표본표준편차 5 표본 수n 4 양측검정
귀무가설 : 표본 평균이 227이다.
대립가설 : 표본 평균이 227이 아니다.
p-value
z는 정규분포를 따르며 정규분포표에 의해 z가 -2인 관측치를 얻을 확률은 2*2.28%=4.56% (양측검정)
p-value에 의한 확률이 작기 때문에 귀무가설을 기각하고 대립가설을 채택한다. 즉, 기계에 이상이 있다.
2) 신뢰구간을 이용한 방법
- 양측검정은 대칭이므로 신뢰구간을 이용하여 검증 시행 가능
예제)
227g으로 담는 기계가 있는데 4개를 뽑아 평균을 내보니 222g이었다. 이때 기계에 이상이 있는지 없는지 알 고 싶다.
모평균 227g 표본평균 222g 표본표준편차 5 표본 수n 4
귀무가설 : 표본 평균이 227이다.
대립가설 : 표본 평균이 227이 아니다.
신뢰구간CI (95%)
227g은 위 신뢰구간에 포함되지 않으므로 귀무가설을 기각하고 대립가설을 채택한다. 즉, 기계에 이상이 있다
t-검정 (모집단의 표준편차를 모르는 경우)
검정통계량(관측치가 가정된 값으로 부터 몇 표준편차만큼 떨어져 있는가?)
예제1) 콜라의 단맛 감소에 대한 표본 측정
표본평균 1.02 표본표준편차 1.196 표본 갯수 n 10 모평균 0 자유도 9 단측 검정
신뢰수준 95%으로 단맛 감소가 일어난다는 증거가 있는가?
귀무가설 : 모평균이 0이다 즉, 단맛 감소가 없다
대립가설 : 모평균이 0이상이다 즉, 단맛 감소가 있다
t는 t-분포를 따르며 t-분포표의 자유도 9, 확률 5%의 값인 1.833보다 t값이 크기 때문에 통계적으로 유의하며 귀무가설을 기각하고 대립가설을 채택한다.
즉, 단맛 감소가 있다
여기서 p-value는 SW를 이용하면 나오는데 t-분포표에서도 대략적으로 알아낼 수 있다.
2.70이 t-분포표의 자유도 9에서 2%~1%사이에 값이 있다. p-value도 그 사이에 있다.
예제2) 성적 중에 8명의 성적
60, 62, 67, 69, 70, 72, 75, 80
전체 평균이 65보다 크다고 할 수 있는가 (a=0.05)
1) 귀무가설 : 모평균은 65이다
대립가설 : 모평균은 65 이상이다
2) 유의수준 95%
3) 검정통계량
4) 표본 평균 69.375 표본표준편차s 6.5452 일때
자유도 7, 확률 5%의 값인 1.895보다 t값이 작기 때문에 통계적으로 유의하지 않고 귀무가설을 채택한다
p-value도 0.0503으로 a 0.05보다 크기 때문에 귀무가설을 기각할 수 없다.
유의성 검정의 주의점
- 귀무가설의 기각할때의 파장에 따라 유의수준 조절 필요
- 관례적으로 p-value에 따라 약간유의, 유의, 매우 유의 하다고 표현할 수 있다 (a = 0.05 또는 0.01)
- 통계적 유의성은 랜덤 표본에서 얻어진 결과가 우연히 발생한 것인지 아닌지 말해주며,
표본이 많을 경우 실제로 의미 없을 수도 있다
- Absence of evidence is not evidence of absence
살인의 증거가 없다는 것이 살인이 일어나지 않았다는 것을 말하는 것은 아니다
- 귀무가설을 기각하지 않는 것이 귀무가설이 옳다고 말하는 것은 아니다
- 모집단의 분포가 정규분포와 다르거나 표본의 크기가 작으면 정규성 가정이 어렵다
'Data > Statistics' 카테고리의 다른 글
[통계학 Talk]공분산Covariance과 상관계수Correlation (2) | 2017.06.13 |
---|---|
[통계학 기초]6. 상관 분석 (0) | 2016.03.04 |
[통계학 기초]4. 통계적 검정, 유의 수준, 유의성 검정 (1) | 2016.03.03 |
[통계학 기초]3. 표본분포, 중심극한정리, 통계적 추론, 신뢰구간 (0) | 2016.03.03 |
[통계학 기초] 2. 확률변수와 분포, 정규분포 (3) | 2016.03.02 |