Gae Ko's Blog

[수리통계] 통계적 가설검정이란(정의) 본문

통계/통계학에 대한 정보

[수리통계] 통계적 가설검정이란(정의)

Gae Ko 2018. 2. 26. 14:51

통계적 가설검정


생활 속에서 우리가 입증하고 싶은 주장과 그에 상반된 주장이 있으며 이 두 주장 가운데 하나를 선택할 기준이 필요하다.

여기서 '통계적 가설 검정'이란 H0를 기각할 지의 여부를 결정하는 규칙이다. 검정은 기각역(critical region) C를 사용하여 나타낸다. 즉 (x₁, ..., xn) ∈ C이면 H0를 기각한다.

(==> 기각역 찾는 것을 목표)



정의1.

객관적 근거에 의해 입증하고자하는 주장을 대립가설(alternative hypothesis)이라 하고 H1라고 표기하며, 그 반대되는 주장을 귀무가설(null hypothesis)이라 하고 H0로 표시한다. 


정의2.

옳은 H0를 기각하는 잘못된 결정을 내리면 제 1종 오류(type 1 error)를 범했다고 하며, 반대로 h0를 채택하는 잘못된 결정을 내리면 제 2종 오류(type 2 error)를 범했다고 한다.


정의3. 

검정력함수(power function)  β(θ)는 모수의 참값이 θ일 때 H0를 기각할 확률로 정의된다.

// 모수값 θ에 따라 귀무가설을 기각할 확률이 달라짐 // 검정력함수는 모수의 함수.



 →  검정력함수는 다음과 같은 ①와 ②의 정보를 포함한다.

 ① 귀무가설이 맞을 경우(μ∈Ω0)에 검정력함수는 제 1종오류 확률을 의미.

 ② 대립가설이 맞을 경우(μ∈Ω₁)에 검정력 함수는 바른 결정할 확률을 의미.

   // 틀린 귀무가설을 기각할 확률 




정의4. 

θ의 모수공간이 Ω일 때 Ω0∪Ω₁=Ω, Ω0∩Ω₁=를 만족하는 집합 Ω0와 Ω₁에 대하여 H0 : θ∈Ω0, H1 : θ∈Ω₁이라 하면 검정의 크기, 즉 1종오류 확률의 최대값으로 정의된다.


정의5. 

검정통계량(test statistic)이란 귀무가설과 대립가설 중 어느 하나를 택하는데 사용되는 통계량 


※ 통계적 가설 검정에서는 바람직한 기준을 찾는게 목적인데, 그런 바람직한 검정이 되기 위해서는 1종 오류와 2종 오류 모두 작은 경우의 기준을 원한다. 하지만 두 확률은 어느 한 쪽을 줄이면 다른 한 쪽이 늘어나는 관계이기 때문에 동시에 최소화하는 검정을 찾는 것은 불가능하다. 전통적으로 1종 오류를 더 중요시여기므로 1종 오류를 범할 수 있는 허용치를 제시하여 이를 초과하지 않는 범위 내에서 제 2종 오류 확률(검정력)이 모든 θ∈Ω₁에서 최소화되는 검정을 찾는 방법을 사용한다.


▶ 방법1. 최강력 검정 (Most Powerful Test, MP test)


우도비가 큰 표본점부터 기각역에 포함시키되 검정의 크기가 주어진 유의수준을 넘지 않을 때까지 최대한 많은 표본점을 포함시켜야한다.

//우도(가능도, likelihood) // 네이먼-피어슨 정리 [각주:1]


1) 우도함수구하기 

2) 우도비 L(θ0)/L(θ₁) 를 구한다. 이 비율이 큰 경우일수록 H1이 옮을 가증성이 높으므로 이 비율이 크게 되는 표본점부터 기각역에 포함시켜준다. 

3) 2)에서 가급적이면 많은 표본점을 포함하되 검정의 크기가 유의수준을 넘지 않을 만큼하여야함


네이먼- 피어슨 정리는 귀무가설과 대립가설이 모두 단순가설일 경우에만 적용할 수 있다. 

하지만 현실에서는 모수가 취할 수 있는 값이 실수값의 구간으로 주어지는 경우가 대부분이다. 대표적으로 H0 : θ=θ0, H1 : θ≠θ0 또는 H0 : θ≤θ0, H1 : θ>θ0 등이다. 이 와 같은 경우에도 네이먼-피어슨 정리이 기본 원리를 응용하면 최상의 기각역이라는 보장은 없지만 매우 바람직한 기각역을 얻을 수 있다. ==》 우도비 검정 


▶ 방법2. 우도비 검정 (Generalized Likelihood Ratio test, GLR test)


매우 대중적인 가설 검정방법이 이 우도비 검정이다. 우도비 검정에 대한 정의는 다음과 같다.


θ의 모수공간이 Ω이고 Ω0∪Ω₁=Ω, Ω0∩Ω₁=를 만족할 때  H0 : θ∈Ω0의 H1 : θ∈Ω₁에 대한 기각역이 

인 검정을 우도비검정이라 한다. 여기서 k는 검정의 크기가 유의수준 α를 초과하지 않는 최대값이다. 


귀무가설이 참일 때 검정통계량의 값이 표본으로부터 관측된 값과 같거나 h1를 지지하는 쪽으로 더 치우칠 확률유의확률 또는 p-값이라 한다. 따라서 p-값이 주어진 유의수준보다 작으면 귀무가설을 기각하게 된다. 일반적으로 주어진 유의수준에 해당하는 기각역을 제시하기 보다는 유의확률을 제시하는 것이 의사결정자에 따른 유의수준의 차이에 구애받지 않으므로 더 바람직하다고 볼 수 있다.


//////// 수리통계책에서 검정통계량에 대해서 다시 찾아보기 

====== > 내가 아는 검정통계량 (z값, f값, t값 등)은 저 위 두가지 방법과 별개인거 같은데.... 아 헷갈린다 ㅠㅠ 찾아보자 ! 



  1. 대립가설 H0이 단순가설인 경우, 네이먼과 피어슨의 최적인 검정법, 즉 최량 기각역을 찾아내는 방법을 제시한다. 이를 네이먼-피어슨 정리라 한다. 네이먼-피어슨 정리에 따르면, 귀무가설 H0에 대한 가능도 함수의 값과 대립가설 H1의 가능도 함수값을 가지고 비(ratio)를 구한 값인 가능도비(likelihood ratio)가 적절한 상수 k보다 작은 경우 해당 기각역 C는 최량 기각역이 된다. [본문으로]

'통계 > 통계학에 대한 정보' 카테고리의 다른 글

[통계] T 분포  (0) 2018.02.28
[통계] 우도(likelihood) // 링크  (0) 2018.02.28
[통계] 가설검정  (0) 2017.12.20
[통계] 편차 / 오차 / 잔차  (0) 2017.11.23
[수리통계] MSE (평균제곱오차)  (0) 2017.11.23