반응형
상관 분석 Correlation analysis
양의 상관 positive correlation : 한 변수X의 값이 증가하면 다른 변수 Y도 증가한다 (상관계수 1에 가까움)
음의 상관 negative correlation : 한 변수X의 값이 증가하면 다른 변수 Y가 감소한다 (상관계수 -1에 가까움)
Linear / Nonlinear
상관계수 : 두 양적 변수의 선형 관계의 강약 과 방향을 나타내주는 측도
X와 Y의 표본상관계수
표본 공분산으로 표본상관계수 구하기
상관계수 특징
- 표준화를 통해 항상 -1~1사이의 값만 가짐
- 두 변수의 측정단위를 바꾸어도 상관계수는 불변
- 상관계수의 절대값은 강약을 나타내고, 부호는 선형관계의 방향을 나타냄
예제) X, Y 의 결합확률분포
Y\X |
0 |
1 |
2 |
3 | 합계 |
0 |
0.05 |
0.05 |
0.10 |
0 | 0.2 |
1 |
0.05 |
0.10 |
0.25 |
0.10 | 0.5 |
2 |
0 |
0.15 |
0.1 |
0.05 | 0.3 |
합계 |
0.1 |
0.3 |
0.45 |
0.15 | 1 |
X 평균 E(X) = 0*0.1+1*0.3+2*0.45+3*0.15 = 1.65
Y 평균 E(Y) = 0*0.2+1*0.5+2*0.3 = 1.1
X 분산 V(X) = E(X^2)-E(X)^2 = 0^2*0.1+1^2*0.3+2^2*0.45+3^2*0.15 - (1.65)^2 = 0.85^2
Y 분산 V(Y) = (0.7)^2
XY평균 E(XY) = 1*0.10+2*0.25+3*0.10+2*0.15+4*0.10+6*0.05 = 1.90
반응형
'Data > Statistics' 카테고리의 다른 글
EDA(Exploratory Data Analysis) - 이산형(범주형) 변수 (0) | 2019.07.23 |
---|---|
[통계학 Talk]공분산Covariance과 상관계수Correlation (2) | 2017.06.13 |
[통계학 기초]5. 모평균 검정 (0) | 2016.03.04 |
[통계학 기초]4. 통계적 검정, 유의 수준, 유의성 검정 (1) | 2016.03.03 |
[통계학 기초]3. 표본분포, 중심극한정리, 통계적 추론, 신뢰구간 (0) | 2016.03.03 |