상관분석
- 연속 변수로 측정된 두 변수간의 선형 관계를 분석하는 기법
- 두 변수 중 적어도 하나의 변수는 정규분포일 것
- 연속형 두 변수 간에는 선형적인 관계일 것
공분산
- 2개의 확률 변수의 상관 정도를 나타내는 값
- 만약 하나의 값이 상승하는 경향을 보이면서 다른 값도 상승
-> 공분산 값은 양수, 반대면 음수를 보임 - 공분산 값만으로는 상승, 하강 경향을 알 수는 있으나 어느정도의 상관관계인지는 알 수 없음
-> 따라서 공분산을 표준화 시킨 “상관계수”를 통해 파악
피어슨 상관계수
- 두 변수의 선형적인 관계 정도를 나타냄
- 일반적으로 피어슨 상관계수를 의미