가설검정을 왜 하는가?
어떤 모수에 관한 증명되지 않은 주장이나 추측을 표본자료를 통해 증명할 때 가설검정을 사용합니다. 그렇다면 왜 가설검정이 필요할까? 이유는 간단합니다. 비용과 시간이 들기 때문입니다. 예를 들어 대통령 선거를 예로 들겠습니다. 선거가 다가오면 내가 응답도 안 했는데 대통령 후보들의 지지율이 나옵니다. 이 지지율을 어디서 나왔을까요? 바로 전화 및 설문조사를 통해 대한민국 국민 일부의 응답을 통계치로 나타낸 것입니다. 이런 지지율을 맞는 경우도 있고 틀린 경우도 있습니다. 그 이유는 모든 국민을 대상으로 하지 않았기 때문이죠. 그렇기 때문에 표본의 통계량이 모수(전 국민)를 대표할 수 있는지 증명하기 위해 가설검정을 사용합니다. 가설검정을 하기 위해서는 우선 가설을 세우는데 이때 귀무가설과 대립가설이 나옵니다.
예를 들자면 어떤 연구자는 대한민국 남자의 평균 키가 173cm 보다 크다고 생각합니다. 이를 증명하기 위해 전국에 모든 남자 중 1000명을 임의로 뽑은 뒤 표본평균을 계산합니다. 그렇다면 표본을 통해 얻은 평균으로 모 평균(전국 모든 남자의 평균 키)이 173cm보다 크다는 주장을 통계적으로 증명하기 위해서 이 결과를 어떻게 이용해야 할까요?
귀무가설 대립가설
제기된 주장의 타당성을 검정할 때 귀무가설(H0)과 대립가설(H1)이 사용됩니다. 증명을 필요로 하는 주장 즉, 연구자의 주장을 대립가설이라 하고 이 가설과 다르거나 혹은 기존의 주장을 귀무가설(H0)이라 합니다.
위의 예를 들어 전국 모든 남자 키의 모평균 u가 173cm보다 크다는 연구자의 주장은 대립가설(H1) : u > 173cm이 됩니다. 귀무가설은 이 대립가설에 반대되는 경우(u < 173cm, u= 173cm)으로 세워집니다. 그러나 기본적으로 두 가지를 분류하지 않고 "대한민국 남자의 평균 키는 173cm이다" 를 귀무가설로 세웁니다. 따라서 다음과 같은 가설을 세울 수 있습니다.
H0 : u = 173cm H1 : u > 173cm
가설검정의 형태
가설검정의 형태는 단측검정과 양측검정이 있다.
- 단측검정
단측검정은 앞의 예에서 H0 : u = 173cm H1 : u > 173cm로 사용했으며 반대로 전국 모든 남자의 평균키가 173cm보다 작다는 주장으로
H0 : u = 173cm H1 : u < 173cm 이다 라는 가설을 설정합니다. 이때의 귀무가설은 동일합니다.
- 양측검정
양측검정은 귀무가설을 기각하는 영역이 양쪽에 있습니다. 예를 들어 연구자가 전국 모든 남자의 평균키는 173cm가 아니다 라고 주장하면
H0 : u = 173cm H1 : u ≠173cm이란 가설이 설정되고 이는 양측검정입니다.
- 가설검정의 예시
u- 홈럼볼 평균g
1. 홈런볼이 46g이라는데 진짜인가?(연구자 = 46g은 아닌거같은데)
H0 : u = 46g H1 : u ≠ 46g - 양측검정
2. 홈런볼이 46g이라는데 진짜인가?(연구자 = 먹어보니 더 많은거같아)
H0 : u = 46g H1 : u > 46g - 단측검정(우측)
3. 홈런볼이 46g이라는데 진짜인가?(연구자 = 먹어보니 과대포장이네..)
H0 : u = 46g H1 : u < 46g - 단측검정(좌측)
'통계' 카테고리의 다른 글
ROC curve? (0) | 2019.11.09 |
---|---|
혼돈행렬(confusion matrix)에 대해 알아보자 (2) | 2019.11.07 |
차원의 저주란? (0) | 2019.03.21 |
데이터사이언티스트 질문 (0) | 2019.03.21 |
xgboost general parameters (0) | 2019.03.19 |