R

가설 설정

가설 설정

모집단과 표본 설정

  • 모집단 : 특성을 알고 하는, 연구의 대상이 되는 모든 개체들의 전체 집합
  • 모수 : 모집단의 특성을 나타내는 값
  • 표본 : 연구를 위해서 모집단에서 추출된 일부 값
  • 통계량 : 표본의 특성을 나타내는 결과치

가설의 설정

  • 어떤 사실이나 현상에 대한 법칙이나 결과를 얻어내기 위해 연구 모델을 설계하는 과정 중 하나

  • 검정하고자 하는 모수에 대하여 귀무가설과 대립가설로 설정한다.

가설검정

  • 모집단의 특성에 대한 통계적 가설을 모집단으로부터 추출한 표본을 사용하여 검토하는 통계적 추론
  • 통계적 유의성을 검정하는 것

가설검정의 절차

통계적 가설 검정 절차는 5가지의 절차를 거칩니다.

  1. 유의수준의 결정, 귀무가설과 대립가설 설정
  2. 검정통계량 설정
  3. 기각역의 설정
  4. 검정통계량 계산
  5. 통계적인의사결정

가설검정에 대한 예

  • 어느 과자제품의 용량표기에 200g이라 표기되어 있는데 질소 없이 순수하게 200g인가?
  • 새로 개발한 전자제품이 과거의 같은 라인의 제품보다 전성비가 좋은 것이 사실인가?

가설에 대한 답을 주는 것이 가설검정이다.
표본을 통해 모집단 모수에 대한 두 가지 가설을 놓고 통계적 의사결정

귀무가설

  • 모집단과 Sample의 평균은 같다.
  • 비교하는 값과 차이가 없다는 것을 기본개념으로 하는 가설.

대립가설

  • 모집단과 Sample의 평균은 다르다.
  • 뚜렷한 증거가 있을 때 주장하고자 하는 가설로 차이가 있다는 것이 기본개념.
  • 양측 가설과 단측 가설로 나눌 수 있다.

양측가설과 검정

  • 모수 값이, 귀무가설에서 지정한 값보다 크거나 작을 수 있는 가설

단측가설과 검정

  • 이전 데이터와 비교해 달라진 점
  • 모수값이, 귀무가설에서 지정한 값보다 크다 혹은 작다 처럼 한쪽 방항으로만 진술되는 가설

단측검정

주제 : 카페에서 파는 커피용량이 200ml보다 적다.

  • 귀무가설 : 커피의 용량은 200ml
  • 대립가설 : 커피의 용량은 200ml보다 적다.

오류

  • 제 1종의 오류 : 귀무가설이 옳은데도 기각하게 되는 오류.
  • 제 2종의 오류 : 귀무가설이 옳지 않은데도 채택하는 오류.

제 1종의 오류 확률의 최대 허용치를 미리 특정값으로 지정해놓고 제 2종의 오류의 확률을 가장 작게 하는 검정 방법이 일반적

검정통계량과 기각역

  • 검정통계량 : 관찰된 표본으로부터 구하는 통계량으로 분포가 가설에서 주어지는 모수에 의존한다. 가설의 진위를 판단하는 수단
  • 기각역 : 검정통계량의 분포에서 유의수준 a의 크기에 해당하는 영역으로 계산된 검정통계량의 유의성을 판정하는 기준이 된다.

유의수준(a) 결정

  • 유의수준 : 표본평균이 모평균과 같은데, 표본평균이 모평균과 다르다라고 선택하는 오류를 범할 허용한계
  • 0.01 -> 의료계통
  • 0.05 -> 논문
  • 0.10 -> 사회과학 등
  • 신뢰도 : 검정하려는 귀무가설이 참인 경우, 이를 옳다고 판단하는 확률

유의확률

  • p-Value : 귀무가설이 맞다고 가정할 때 얻은 결과보다 극단적인 결과가 실제로 관측될 확률
Share