Gae Ko's Blog

[통계] F분포 본문

통계/통계학에 대한 정보

[통계] F분포

Gae Ko 2018. 2. 28. 17:12

F 분포 


F분포란 연속확률분포이면서 표본분포로, 카이제곱분포와 마찬가지로 분산을 추정하고 검정할 때 사용되는 분포이다.

그래서 분산의 제곱된 값을 다루기에 +값만 존재하며, 그렇기 때문에 그래프가 비대칭 모양을 하고 있다. 


F분포와 카이제곱분포의 차이가 있는데, 그것은 카이제곱분포는 한 집단의 분산을 파악할 때 사용하는 반면 F분포는 두 집단의 분산을 비교할 때 사용된다. 


그리고 3개 이상 집단의 분산을 비교하는 분산분석(ANOVA, Analysis of Variance) 혹은 실험계획법(DOC, Design of Experiment)이라고 하는데,  이 분산분석에서 F분포는 정말 많이 나온다.


두 개의 독립적인 표본이 각각 정규모집단 N(μ₁, σ₁²)에서 추출한 n₁개의 표본과 N(μ₁₂ σ₂²)에서 추출한 n₂개의 표본일 때

다음의 값은 분자의 자유도가 (n₁-1)이고 분모의 자유도는 (n₂-1)인 F-distribution을 따른다. 



【수리적 정의】


두 확률변수 X ~ χ²(d₁), Y ~ χ²(d₂)이고 서로 독립이면


의 pdf는 다음과 같다 :


 


이때 W는 자유도가 (d₁, d₂)인 F분포를 따른다고 하며 로 표기한다.