R

상관분석

상관분석

  • 연속 변수로 측정된 두 변수간의 선형 관계를 분석하는 기법
  1. 두 변수 중 적어도 하나의 변수는 정규분포일 것
  2. 연속형 두 변수 간에는 선형적인 관계일 것

공분산

  • 2개의 확률 변수의 상관 정도를 나타내는 값
  • 만약 하나의 값이 상승하는 경향을 보이면서 다른 값도 상승
    -> 공분산 값은 양수, 반대면 음수를 보임
  • 공분산 값만으로는 상승, 하강 경향을 알 수는 있으나 어느정도의 상관관계인지는 알 수 없음
    -> 따라서 공분산을 표준화 시킨 “상관계수”를 통해 파악

피어슨 상관계수

  • 두 변수의 선형적인 관계 정도를 나타냄
  • 일반적으로 피어슨 상관계수를 의미
Share