지난 글에서 평균비교 관련 가설검정법은 z검정보다는 t검정이 대세임을 결론내렸다.
t검정은 상황에 따라서 단일표본, 독립표본, 대응표본의 3가지로 나뉜다. 지금까지 논의했던 방법들을 정리하는 느낌으로 간단히 요약해보자.
# 단일표본 t검정
단일표본 t검정(One Sample T test; 单样本t检验)은 모집단 $X$의 평균에 관한 가설검정을 할 때 쓴다. ‘단일표본’이라고 하는 이유는 모집단에서 표본을 1개 뽑고, 그 표본평균과 모집단의 평균을 비교하기 때문이다.
영가설의 기각역을 정리하면
$$ \begin{split} &양측:\left\vert\frac{\bar X-\mu_0}{S/\sqrt{n}}\right\vert>t_{\alpha/2}(n-1) \\[2ex] &좌측:\frac{\bar X-\mu_0}{S/\sqrt{n}}<-t_{\alpha}(n-1) \\[2ex] &우측:\frac{\bar X-\mu_0}{S/\sqrt{n}}>t_{\alpha}(n-1) \end{split} $$
# 독립표본 t검정
독립표본 t검정(Independent Samples T Test; 独立样本t检验)은 서로 독립인 두 모집단 $X$, $Y$의 평균 비교에 관한 가설검정을 할 때 쓴다. ‘독립표본’이라고 하는 이유는 서로 ‘독립’인 두 모집단에서 표본을 각각 1개씩 뽑아서 서로 ‘독립’인 두 표본평균을 비교하기 때문이다.
등분산 가정이 성립할 때 영가설의 기각역을 정리하면
$$ \begin{split} &양측:\left\vert\frac{\bar X-\bar Y}{S_w\sqrt{\frac{1}{n_X}+\frac{1}{n_Y}}}\right\vert>t_{\alpha/2}(n_X+n_Y-2) \\[2ex] &좌측:\frac{\bar X-\bar Y}{S_w\sqrt{\frac{1}{n_X}+\frac{1}{n_Y}}}<-t_{\alpha}(n_X+n_Y-2) \\[2ex] &우측:\frac{\bar X-\bar Y}{S_w\sqrt{\frac{1}{n_X}+\frac{1}{n_Y}}}>t_{\alpha}(n_X+n_Y-2) \end{split} $$
note: $S_w^2=\frac{(n_X-1)S_X^2+(n_Y-1)S_Y^2}{n_X+n_Y-2}$는 표본분산의 가중평균으로, 합동표본분산(Pooled Sample Variance; 合并样本方差)이라고 부른다. 지난 글에서 표본평균의 가중평균이 모평균의 불편추정량임을 밝혔는데, 합동표본분산도 비슷한 논리로 서로 같은 두 모분산의 불편추정량임을 유도할 수 있다.
등분산 가정이 성립하지 않지만 대신 표본의 크기가 충분히 클 때 영가설의 기각역을 정리하면
$$ \begin{split} &양측:\left\vert\frac{\bar X-\bar Y}{\sqrt{\frac{S_X^2}{n_X}+\frac{S_Y^2}{n_Y}}}\right\vert>t_{\alpha/2}(n_X+n_Y-2) \\[2ex] &좌측:\frac{\bar X-\bar Y}{\sqrt{\frac{S_X^2}{n_X}+\frac{S_Y^2}{n_Y}}}<-t_{\alpha}(n_X+n_Y-2) \\[2ex] &우측:\frac{\bar X-\bar Y}{\sqrt{\frac{S_X^2}{n_X}+\frac{S_Y^2}{n_Y}}}>t_{\alpha}(n_X+n_Y-2) \end{split} $$
독립표본 t검정은 처치집단과 통제집단의 데이터를 비교하는 피험자간 설계(Between Subject Design; 被试间设计)에 적합하다.
# 대응표본 t검정
대응표본 t검정(Paired Samples T Test; 配对样本t检验)은 이전 글에서는 다루지 않았던 t검정 방법으로, 하나의 모집단의 평균 비교에 관한 가설검정을 할 때 쓴다. 대응표본 t검정은 독립표본 t검정과 헷갈리기 쉬운데, 대응표본 t검정의 핵심은 비교하려는 두 표본평균이 모두 하나의 모집단에서 나온것이다.
같은 모집단이므로 대응표본 t검정에서는 등분산 가정이 성립한다. 또한, 2개의 데이터가 짝을 이뤄 대응해야 하므로, 두 표본의 크기도 같다.
대응표본 t검정은 처치전과 처치후의 데이터를 비교하는 피험자내 설계(Within Subject Design; 被试内设计)에 적합하다. 개체 $i$의 처치 전, 후의 데이터 차이를 $D_i:=X_{1i}-X_{2i}\sim\mathrm{N}(\mu_D,\sigma_D^2)$로 두고 영가설로 $H_0:\mu_D=0$을 제안한다. 기각역을 정리하면
$$ \begin{split} &양측:\left\vert\frac{\bar D}{S_D/\sqrt{n}}\right\vert>t_{\alpha/2}(n-1) \\[2ex] &좌측:\frac{\bar D}{S_D/\sqrt{n}}<-t_{\alpha}(n-1) \\[2ex] &우측:\frac{\bar D}{S_D/\sqrt{n}}>t_{\alpha}(n-1) \\[2ex] \end{split} $$
'Mathematics' 카테고리의 다른 글
검정력, 적당한 표본의 크기 (0) | 2023.03.13 |
---|---|
제1종 오류와 제2종 오류 (0) | 2023.03.12 |
t검정과 p값에 대해 (2) | 2023.03.11 |
두 정규분포 모집단의 가설검정 (0) | 2023.03.10 |
정규분포 모집단의 가설검정 (2) | 2023.03.10 |