본문 바로가기
  • Let's go grab a data
Data/Statistics

[통계학 기초]5. 모평균 검정

by pub-lican-ai 2016. 3. 4.
반응형

[통계학 기초]5. 모평균 검정 #z-검정 #t-검정 #유의성검정

* 아래 내용은 통계학 기초 2~4 강의 내용을 종합한 것입니다. 정규분포표, t-분포표 도 해당 글에서 확인하세요


Z-검정 (모집단의 표준편차를 알고 있는 경우)

귀무가설 : 모평균이 뮤이고 표준편차가 시그마인 정규분포에서 뽑힌 크기n의 랜덤표본할때 표본 평균의 분포가 N(뮤,시그마^2/n) 정규분포를 따른다

1) p-value를 이용한 방법

- 귀무가설이 맞다는 가정하에 표본으로부터 얻은 관측치 만큼 또는 그보다 더 극단적인(대립가설의 방향으로) 관측치가 얻어질 확률

검정통계량 : (관측치가 가정된 값으로 부터 몇 표준편차만큼 떨어져 있는가?)


예제1)

227g으로 담는 기계가 있는데 4개를 뽑아 평균을 내보니 222g이었다. 이때 기계에 이상이 있는지 없는지 알 고 싶다.

모평균 227g 표본평균 222g 표본표준편차 5 표본 수n 4 양측검정


귀무가설 : 표본 평균이 227이다.

대립가설 : 표본 평균이 227이 아니다.

p-value

z는 정규분포를 따르며 정규분포표에 의해 z가 -2인 관측치를 얻을 확률은 2*2.28%=4.56% (양측검정)

p-value에 의한 확률이 작기 때문에 귀무가설을 기각하고 대립가설을 채택한다. 즉, 기계에 이상이 있다.


2) 신뢰구간을 이용한 방법

- 양측검정은 대칭이므로 신뢰구간을 이용하여 검증 시행 가능


예제)

227g으로 담는 기계가 있는데 4개를 뽑아 평균을 내보니 222g이었다. 이때 기계에 이상이 있는지 없는지 알 고 싶다.

모평균 227g 표본평균 222g 표본표준편차 5 표본 수n 4

귀무가설 : 표본 평균이 227이다.

대립가설 : 표본 평균이 227이 아니다. 

신뢰구간CI (95%)


227g은 위 신뢰구간에 포함되지 않으므로 귀무가설을 기각하고 대립가설을 채택한다. 즉, 기계에 이상이 있다


t-검정 (모집단의 표준편차를 모르는 경우)

귀무가설 : 모평균과 표준편차를 모르는 정규분포에서 크기n의 랜덤표본할때 표본 평균의 분포가 t(n-1) t-분포를 따른다

검정통계량(관측치가 가정된 값으로 부터 몇 표준편차만큼 떨어져 있는가?)


예제1) 콜라의 단맛 감소에 대한 표본 측정

표본평균 1.02 표본표준편차 1.196 표본 갯수 n 10 모평균 0 자유도 9 단측 검정

신뢰수준 95%으로 단맛 감소가 일어난다는 증거가 있는가?


귀무가설 : 모평균이 0이다 즉, 단맛 감소가 없다

대립가설 : 모평균이 0이상이다 즉, 단맛 감소가 있다

t는 t-분포를 따르며 t-분포표의 자유도 9, 확률 5%의 값인 1.833보다 t값이 크기 때문에 통계적으로 유의하며 귀무가설을 기각하고 대립가설을 채택한다. 

즉, 단맛 감소가 있다

여기서 p-value는 SW를 이용하면 나오는데 t-분포표에서도 대략적으로 알아낼 수 있다.

2.70이 t-분포표의 자유도 9에서 2%~1%사이에 값이 있다. p-value도 그 사이에 있다.


예제2) 성적 중에 8명의 성적

60, 62, 67, 69, 70, 72, 75, 80

전체 평균이 65보다 크다고 할 수 있는가 (a=0.05)


1) 귀무가설 : 모평균은 65이다

   대립가설 : 모평균은 65 이상이다

2) 유의수준 95%

3) 검정통계량 

4) 표본 평균 69.375 표본표준편차s 6.5452 일때

자유도 7, 확률 5%의 값인 1.895보다 t값이 작기 때문에 통계적으로 유의하지 않고 귀무가설을 채택한다

p-value도 0.0503으로 a 0.05보다 크기 때문에 귀무가설을 기각할 수 없다.


유의성 검정의 주의점

- 귀무가설의 기각할때의 파장에 따라 유의수준 조절 필요

- 관례적으로 p-value에 따라 약간유의, 유의, 매우 유의 하다고 표현할 수 있다 (a = 0.05 또는 0.01)

- 통계적 유의성은 랜덤 표본에서 얻어진 결과가 우연히 발생한 것인지 아닌지 말해주며, 

   표본이 많을 경우 실제로 의미 없을 수도 있다

- Absence of evidence is not evidence of absence 

   살인의 증거가 없다는 것이 살인이 일어나지 않았다는 것을 말하는 것은 아니다

- 귀무가설을 기각하지 않는 것이 귀무가설이 옳다고 말하는 것은 아니다

- 모집단의 분포가 정규분포와 다르거나 표본의 크기가 작으면 정규성 가정이 어렵다


출처 : http://www.kocw.net/home/cview.do?cid=08b0c5f1f6959396

반응형