일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 대칭형 알고리즘
- mutate()
- samp;e_frac()
- groupe_by()
- summarize()
- filter()
- AES
- dplyr
- sample_n()
- proc contents
- distinct()
- select()
- arrange()
- Today
- Total
Gae Ko's Blog
[수리통계] 통계적 가설검정이란(정의) 본문
통계적 가설검정
생활 속에서 우리가 입증하고 싶은 주장과 그에 상반된 주장이 있으며 이 두 주장 가운데 하나를 선택할 기준이 필요하다.
여기서 '통계적 가설 검정'이란 H0를 기각할 지의 여부를 결정하는 규칙이다. 검정은 기각역(critical region) C를 사용하여 나타낸다. 즉 (x₁, ..., xn) ∈ C이면 H0를 기각한다.
(==> 기각역 찾는 것을 목표)
정의1.
객관적 근거에 의해 입증하고자하는 주장을 대립가설(alternative hypothesis)이라 하고 H1라고 표기하며, 그 반대되는 주장을 귀무가설(null hypothesis)이라 하고 H0로 표시한다.
정의2.
옳은 H0를 기각하는 잘못된 결정을 내리면 제 1종 오류(type 1 error)를 범했다고 하며, 반대로 h0를 채택하는 잘못된 결정을 내리면 제 2종 오류(type 2 error)를 범했다고 한다.
정의3.
검정력함수(power function) β(θ)는 모수의 참값이 θ일 때 H0를 기각할 확률로 정의된다.
// 모수값 θ에 따라 귀무가설을 기각할 확률이 달라짐 // 검정력함수는 모수의 함수.
→ 검정력함수는 다음과 같은 ①와 ②의 정보를 포함한다.
① 귀무가설이 맞을 경우(μ∈Ω0)에 검정력함수는 제 1종오류 확률을 의미.
② 대립가설이 맞을 경우(μ∈Ω₁)에 검정력 함수는 바른 결정할 확률을 의미.
// 틀린 귀무가설을 기각할 확률
정의4.
θ의 모수공간이 Ω일 때 Ω0∪Ω₁=Ω, Ω0∩Ω₁=를 만족하는 집합 Ω0와 Ω₁에 대하여 H0 : θ∈Ω0, H1 : θ∈Ω₁이라 하면 검정의 크기는, 즉 1종오류 확률의 최대값으로 정의된다.
정의5.
검정통계량(test statistic)이란 귀무가설과 대립가설 중 어느 하나를 택하는데 사용되는 통계량
※ 통계적 가설 검정에서는 바람직한 기준을 찾는게 목적인데, 그런 바람직한 검정이 되기 위해서는 1종 오류와 2종 오류 모두 작은 경우의 기준을 원한다. 하지만 두 확률은 어느 한 쪽을 줄이면 다른 한 쪽이 늘어나는 관계이기 때문에 동시에 최소화하는 검정을 찾는 것은 불가능하다. 전통적으로 1종 오류를 더 중요시여기므로 1종 오류를 범할 수 있는 허용치를 제시하여 이를 초과하지 않는 범위 내에서 제 2종 오류 확률(검정력)이 모든 θ∈Ω₁에서 최소화되는 검정을 찾는 방법을 사용한다.
▶ 방법1. 최강력 검정 (Most Powerful Test, MP test)
우도비가 큰 표본점부터 기각역에 포함시키되 검정의 크기가 주어진 유의수준을 넘지 않을 때까지 최대한 많은 표본점을 포함시켜야한다.
//우도(가능도, likelihood) // 네이먼-피어슨 정리 1
1) 우도함수구하기
2) 우도비 L(θ0)/L(θ₁) 를 구한다. 이 비율이 큰 경우일수록 H1이 옮을 가증성이 높으므로 이 비율이 크게 되는 표본점부터 기각역에 포함시켜준다.
3) 2)에서 가급적이면 많은 표본점을 포함하되 검정의 크기가 유의수준을 넘지 않을 만큼하여야함
네이먼- 피어슨 정리는 귀무가설과 대립가설이 모두 단순가설일 경우에만 적용할 수 있다.
하지만 현실에서는 모수가 취할 수 있는 값이 실수값의 구간으로 주어지는 경우가 대부분이다. 대표적으로 H0 : θ=θ0, H1 : θ≠θ0 또는 H0 : θ≤θ0, H1 : θ>θ0 등이다. 이 와 같은 경우에도 네이먼-피어슨 정리이 기본 원리를 응용하면 최상의 기각역이라는 보장은 없지만 매우 바람직한 기각역을 얻을 수 있다. ==》 우도비 검정
▶ 방법2. 우도비 검정 (Generalized Likelihood Ratio test, GLR test)
매우 대중적인 가설 검정방법이 이 우도비 검정이다. 우도비 검정에 대한 정의는 다음과 같다.
θ의 모수공간이 Ω이고 Ω0∪Ω₁=Ω, Ω0∩Ω₁=를 만족할 때 H0 : θ∈Ω0의 H1 : θ∈Ω₁에 대한 기각역이
인 검정을 우도비검정이라 한다. 여기서 k는 검정의 크기가 유의수준 α를 초과하지 않는 최대값이다.
※ 귀무가설이 참일 때 검정통계량의 값이 표본으로부터 관측된 값과 같거나 h1를 지지하는 쪽으로 더 치우칠 확률을 유의확률 또는 p-값이라 한다. 따라서 p-값이 주어진 유의수준보다 작으면 귀무가설을 기각하게 된다. 일반적으로 주어진 유의수준에 해당하는 기각역을 제시하기 보다는 유의확률을 제시하는 것이 의사결정자에 따른 유의수준의 차이에 구애받지 않으므로 더 바람직하다고 볼 수 있다.
//////// 수리통계책에서 검정통계량에 대해서 다시 찾아보기
====== > 내가 아는 검정통계량 (z값, f값, t값 등)은 저 위 두가지 방법과 별개인거 같은데.... 아 헷갈린다 ㅠㅠ 찾아보자 !
- 대립가설 H0이 단순가설인 경우, 네이먼과 피어슨의 최적인 검정법, 즉 최량 기각역을 찾아내는 방법을 제시한다. 이를 네이먼-피어슨 정리라 한다. 네이먼-피어슨 정리에 따르면, 귀무가설 H0에 대한 가능도 함수의 값과 대립가설 H1의 가능도 함수값을 가지고 비(ratio)를 구한 값인 가능도비(likelihood ratio)가 적절한 상수 k보다 작은 경우 해당 기각역 C는 최량 기각역이 된다. [본문으로]
'통계 > 통계학에 대한 정보' 카테고리의 다른 글
[통계] T 분포 (0) | 2018.02.28 |
---|---|
[통계] 우도(likelihood) // 링크 (0) | 2018.02.28 |
[통계] 가설검정 (0) | 2017.12.20 |
[통계] 편차 / 오차 / 잔차 (0) | 2017.11.23 |
[수리통계] MSE (평균제곱오차) (0) | 2017.11.23 |