본문 바로가기

확률론과 수리통계

단일표본, 독립표본, 대응표본 t검정

지난 글에서 평균비교 관련 가설검정법은 z검정보다는 t검정이 대세임을 결론내렸다.

t검정은 상황에 따라서 단일표본, 독립표본, 대응표본의 3가지로 나뉜다. 지금까지 논의했던 방법들을 정리하는 느낌으로 간단히 요약해보자.

# 단일표본 t검정

단일표본 t검정(One Sample T test; 单样本t检验)은 모집단 $X$의 평균에 관한 가설검정을 할 때 쓴다. ‘단일표본’이라고 하는 이유는 모집단에서 표본을 1개 뽑고, 그 표본평균과 모집단의 평균을 비교하기 때문이다.

영가설의 기각역을 정리하면

$$ \begin{split} &양측:\left\vert\frac{\bar X-\mu_0}{S/\sqrt{n}}\right\vert>t_{\alpha/2}(n-1) \\[2ex] &좌측:\frac{\bar X-\mu_0}{S/\sqrt{n}}<-t_{\alpha}(n-1) \\[2ex] &우측:\frac{\bar X-\mu_0}{S/\sqrt{n}}>t_{\alpha}(n-1) \end{split} $$

# 독립표본 t검정

독립표본 t검정(Independent Samples T Test; 独立样本t检验)은 서로 독립인 두 모집단 $X$, $Y$의 평균 비교에 관한 가설검정을 할 때 쓴다. ‘독립표본’이라고 하는 이유는 서로 ‘독립’인 두 모집단에서 표본을 각각 1개씩 뽑아서 서로 ‘독립’인 두 표본평균을 비교하기 때문이다.

등분산 가정이 성립할 때 영가설의 기각역을 정리하면

$$ \begin{split} &양측:\left\vert\frac{\bar X-\bar Y}{S_w\sqrt{\frac{1}{n_X}+\frac{1}{n_Y}}}\right\vert>t_{\alpha/2}(n_X+n_Y-2) \\[2ex] &좌측:\frac{\bar X-\bar Y}{S_w\sqrt{\frac{1}{n_X}+\frac{1}{n_Y}}}<-t_{\alpha}(n_X+n_Y-2) \\[2ex] &우측:\frac{\bar X-\bar Y}{S_w\sqrt{\frac{1}{n_X}+\frac{1}{n_Y}}}>t_{\alpha}(n_X+n_Y-2) \end{split} $$

note: $S_w^2=\frac{(n_X-1)S_X^2+(n_Y-1)S_Y^2}{n_X+n_Y-2}$는 표본분산의 가중평균으로, 합동표본분산(Pooled Sample Variance; 合并样本方差)이라고 부른다. 지난 글에서 표본평균의 가중평균이 모평균의 불편추정량임을 밝혔는데, 합동표본분산도 비슷한 논리로 서로 같은 두 모분산의 불편추정량임을 유도할 수 있다.

등분산 가정이 성립하지 않지만 대신 표본의 크기가 충분히 클 때 영가설의 기각역을 정리하면

$$ \begin{split} &양측:\left\vert\frac{\bar X-\bar Y}{\sqrt{\frac{S_X^2}{n_X}+\frac{S_Y^2}{n_Y}}}\right\vert>t_{\alpha/2}(n_X+n_Y-2) \\[2ex] &좌측:\frac{\bar X-\bar Y}{\sqrt{\frac{S_X^2}{n_X}+\frac{S_Y^2}{n_Y}}}<-t_{\alpha}(n_X+n_Y-2) \\[2ex] &우측:\frac{\bar X-\bar Y}{\sqrt{\frac{S_X^2}{n_X}+\frac{S_Y^2}{n_Y}}}>t_{\alpha}(n_X+n_Y-2) \end{split} $$

독립표본 t검정은 처치집단과 통제집단의 데이터를 비교하는 피험자간 설계(Between Subject Design; 被试间设计)에 적합하다.

# 대응표본 t검정

대응표본 t검정(Paired Samples T Test; 配对样本t检验)은 이전 글에서는 다루지 않았던 t검정 방법으로, 하나의 모집단의 평균 비교에 관한 가설검정을 할 때 쓴다. 대응표본 t검정은 독립표본 t검정과 헷갈리기 쉬운데, 대응표본 t검정의 핵심은 비교하려는 두 표본평균이 모두 하나의 모집단에서 나온것이다.

같은 모집단이므로 대응표본 t검정에서는 등분산 가정이 성립한다. 또한, 2개의 데이터가 짝을 이뤄 대응해야 하므로, 두 표본의 크기도 같다.

대응표본 t검정은 처치전과 처치후의 데이터를 비교하는 피험자내 설계(Within Subject Design; 被试内设计)에 적합하다. 개체 $i$의 처치 전, 후의 데이터 차이를 $D_i:=X_{1i}-X_{2i}\sim\mathrm{N}(\mu_D,\sigma_D^2)$로 두고 영가설로 $H_0:\mu_D=0$을 제안한다. 기각역을 정리하면

$$ \begin{split} &양측:\left\vert\frac{\bar D}{S_D/\sqrt{n}}\right\vert>t_{\alpha/2}(n-1) \\[2ex] &좌측:\frac{\bar D}{S_D/\sqrt{n}}<-t_{\alpha}(n-1) \\[2ex] &우측:\frac{\bar D}{S_D/\sqrt{n}}>t_{\alpha}(n-1) \\[2ex] \end{split} $$