본문 바로가기
  • On the ball
Data/Statistics

[통계학 기초] 2. 확률변수와 분포, 정규분포

by pub-lican-ai 2016. 3. 2.
반응형

[통계학 기초] 2.확률변수 분포, 정규분포 #평균 #분산 #연속확률변수 #확률밀도함수 #정규분포 #표준화 #확률분포표


랜덤 : 개별적인 결과를 예측할 수 없으나 여러번 반복시 그 결과가 규칙적인 분포를 나타내는 것을 가정함

확률변수Random Variable : 랜덤한 현상 or 실험의 결과로 결정되는 수치적인 양 numerical quantity


동전던지기

각 시행이 독립적 ( 이미 나온 결과에 의해 새로운 결과가 영향 받지 않는다)

무수히 많이 던졌을 경우 확률은 0.5에 수렴한다


이산 확률 변수 X는 각 항목 값별 확률 값을 가짐 

확률분포표

X1, X2,...Xk

P1, P2,...Pk


평균 : 각 값들과 그 값의 확률을 곱해 모두 더한 것

분산 : 각 값들과 평균 차이의 제곱과 그 값의 확률을 곱해 모두 더한 것

분산 계산 방법 -> 각 값의 제곱에 확률을 곱해 모두 더한 값 - 평균의 제곱



연속 확률 변수 X는 각 구간 별 면적으로 확률 값을 가짐

구간내의 확률밀도함수 f(x) =  즉, 면적이 확률 값

평균 : 각 구간의 값 x에 확률밀도함수를 곱해 적분한 값

분산 : 각 구간의 값 x와 평균 차이의 제곱과 확률밀도함수를 곱해 적분한 값


예제)

확률밀도 함수가 아래와 같을 때 C값은?


 


예제)

P(X>1) 값은?


정규 분포Normal curve : 뮤u(모평균) - 분산의 가운데 시그마o(모분산) - 분산의 퍼진정도


68-95-99.7 Rule



표준화된 자료 z-score Z~N(0,1)

z구하기 예제)

가정: 표준화가 가능한 정규분포 (모평균: 250, 분산:20)

알고 싶은 것 : x가 240이하인 확률(면적)


z=-0.5인 확률값을 아래 표준정규분포 표에서 확인 

1-0.6915 = 0.3085 즉, 30.85%




출처 : http://www.kocw.net/home/cview.do?cid=08b0c5f1f6959396



반응형