가설 설정
모집단과 표본 설정
- 모집단 : 특성을 알고 하는, 연구의 대상이 되는 모든 개체들의 전체 집합
- 모수 : 모집단의 특성을 나타내는 값
- 표본 : 연구를 위해서 모집단에서 추출된 일부 값
- 통계량 : 표본의 특성을 나타내는 결과치
가설의 설정
어떤 사실이나 현상에 대한 법칙이나 결과를 얻어내기 위해 연구 모델을 설계하는 과정 중 하나
검정하고자 하는 모수에 대하여 귀무가설과 대립가설로 설정한다.
가설검정
- 모집단의 특성에 대한 통계적 가설을 모집단으로부터 추출한 표본을 사용하여 검토하는 통계적 추론
- 통계적 유의성을 검정하는 것
가설검정의 절차
통계적 가설 검정 절차는 5가지의 절차를 거칩니다.
- 유의수준의 결정, 귀무가설과 대립가설 설정
- 검정통계량 설정
- 기각역의 설정
- 검정통계량 계산
- 통계적인의사결정
가설검정에 대한 예
- 어느 과자제품의 용량표기에 200g이라 표기되어 있는데 질소 없이 순수하게 200g인가?
- 새로 개발한 전자제품이 과거의 같은 라인의 제품보다 전성비가 좋은 것이 사실인가?
가설에 대한 답을 주는 것이 가설검정이다.
표본을 통해 모집단 모수에 대한 두 가지 가설을 놓고 통계적 의사결정
귀무가설
- 모집단과 Sample의 평균은 같다.
- 비교하는 값과 차이가 없다는 것을 기본개념으로 하는 가설.
대립가설
- 모집단과 Sample의 평균은 다르다.
- 뚜렷한 증거가 있을 때 주장하고자 하는 가설로 차이가 있다는 것이 기본개념.
- 양측 가설과 단측 가설로 나눌 수 있다.
양측가설과 검정
- 모수 값이, 귀무가설에서 지정한 값보다 크거나 작을 수 있는 가설
단측가설과 검정
- 이전 데이터와 비교해 달라진 점
- 모수값이, 귀무가설에서 지정한 값보다 크다 혹은 작다 처럼 한쪽 방항으로만 진술되는 가설
단측검정
주제 : 카페에서 파는 커피용량이 200ml보다 적다.
- 귀무가설 : 커피의 용량은 200ml
- 대립가설 : 커피의 용량은 200ml보다 적다.
오류
- 제 1종의 오류 : 귀무가설이 옳은데도 기각하게 되는 오류.
- 제 2종의 오류 : 귀무가설이 옳지 않은데도 채택하는 오류.
제 1종의 오류 확률의 최대 허용치를 미리 특정값으로 지정해놓고 제 2종의 오류의 확률을 가장 작게 하는 검정 방법이 일반적
검정통계량과 기각역
- 검정통계량 : 관찰된 표본으로부터 구하는 통계량으로 분포가 가설에서 주어지는 모수에 의존한다. 가설의 진위를 판단하는 수단
- 기각역 : 검정통계량의 분포에서 유의수준 a의 크기에 해당하는 영역으로 계산된 검정통계량의 유의성을 판정하는 기준이 된다.
유의수준(a) 결정
- 유의수준 : 표본평균이 모평균과 같은데, 표본평균이 모평균과 다르다라고 선택하는 오류를 범할 허용한계
- 0.01 -> 의료계통
- 0.05 -> 논문
- 0.10 -> 사회과학 등
- 신뢰도 : 검정하려는 귀무가설이 참인 경우, 이를 옳다고 판단하는 확률
유의확률
- p-Value : 귀무가설이 맞다고 가정할 때 얻은 결과보다 극단적인 결과가 실제로 관측될 확률