본문 바로가기

확률론과 수리통계

카이제곱분포

#1. 정의

모집단 $X\sim\mathrm{N}(0,1)$에서 크기가 $n$인 단순무작위표본 $X_1, X_2,\cdots,X_n$을 추출했다고 가정하자. 이때 통계량 $\chi^2:=X_1^2+X_2^2+\cdots+X_n^2$의 분포를 자유도가 $n$인 카이제곱분포(Chi-squared Distribution; 卡方分布)이라고 하며, 기호로는 $\chi^2(n)$으로 나타낸다.

카이제곱분포의 정의에 의해, $\chi^2\sim\chi^2(n)$이다. 한편, 지난 글에서 표준정규분포를 따르는 확률변수의 제곱합은 $\Gamma(n/2,1/2)$를 따르는 것을 유도했다. (표본추출분포 참조.) 따라서 카이제곱분포의 확률밀도함수는 다음과 같이 주어진다.

$$ f_{\chi^2}(k)= \begin{cases} \frac{(1/2)^{n/2}}{\Gamma(n/2)}k^{n/2-1}e^{-k/2},&k>0 \\ 0,&\mathrm{otherwise} \end{cases} $$

#2. 의의

왜 이런 통계량과 분포가 필요한 것일까? 카이제곱분포는 표본분산과 관련된 분포이기 때문이다. 즉, 표본분산에 $(n-1)$을 곱하고, $\sigma^2$을 나누면, 자유도가 $(n-1)$인 카이제곱분포를 따른다.

$$ \frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1) $$

카이제곱분포가 ‘표본분산의 분포’가 아니라 ‘표본분산과 관련된 분포’인 것이 조금 마음에 걸린다. 하지만 실제 응용에서는 식을 변형하는 형태로 이용되기 때문에 관련성만 있으면 충분하다. 예를 들어 카이제곱분포는 표본분산과 관련이 있으므로 모분산의 구간추정에서 활용될 수 있으며, 두개의 서로 다른 모분산을 비교할 때도 활용이 가능하다.

#3. 성질

(1) $\Gamma(n/2,1/2)=\chi^2(n)$

카이제곱분포의 본질은 서로 독립이며 표준정규분포를 따르는 $n$개의 확률변수의 제곱합임을 보여주는 성질이다.

(2) $\chi^2(n)\ast\chi^2(m)=\chi^2(n+m)$

카이제곱분포의 본질은 감마분포이므로, 감마분포의 성질을 그대로 물려받았다.

(3) $\chi_\alpha^2(n)\approx\frac{1}{2}(z_\alpha+\sqrt{2n-1})^2$

카이제곱분포와 z분포 사이의 근사식이다.

'확률론과 수리통계' 카테고리의 다른 글

‘표본분산의 분포’의 이해와 증명  (0) 2023.02.12
자유도  (0) 2023.02.12
z분포  (0) 2023.02.11
분위수  (0) 2023.02.11
경험적 분포함수  (0) 2023.02.10