Loading [MathJax]/jax/output/HTML-CSS/jax.js
본문 바로가기

Mathematics

F분포

728x90

# 용도, 정의

정규분포의 자손들인 z분포, 카이제곱분포, t분포는 모두 구간추정과 가설검정에 이용되는 분포다. z분포와 t분포는 모평균과 관련해서, 카이제곱분포는 모분산과 관련해서 이용된다. t분포 평균과 관련되었지만 분산을 모를때 쓰며, z분포와 카이제곱분포를 이용해서 만든다.

단일 모평균이 아닌 모평균의 차이와 관련해서도 이 3가지 분포가 등장한다. 모분산의 비와 관련해서는 새로운 분포가 필요한데 그것이 바로 F분포다. F분포는 분산의 비와 관련된 분포이며, 분산은 카이제곱분포와 관련있으므로, F분포를 따르는 확률변수(F 통계량)는 서로 독립이며 두 카이제곱분포를 따르는 확률변수의 비로 이루어진다.

note: F분포에 카이제곱분포가 들어가는 이상, F분포와 관련된 구간추정과 검정에서 모집단은 정규분포를 따라야 한다는 제약이 붙는다.

흔히 다음과 같은 식이 구간추정과 가설검정 등에서 이용된다. 모집단 X1, X2에 대해

F:=S21/σ21S22/σ22=(n11)S21σ21/(n11)(n21)S22σ22/(n21)F(n11,n21)

먼저 자유도가 ni1인 카이제곱분포 확률변수를 다음과 같이 나타낸다.

χ2ni1:=(ni1)S2iσ2iχ2(ni1)

그러면 자유도가 (n11,n21)인 F분포 확률변수는 다음과 같이 정의된다. 단, χ2ni1는 서로 독립이다.

Fn11,n21:=χ2n11/(n11)χ2n21/(n21)F(n11,n21)

만약 μ1, μ2를 안다면 F 통계량을 만들 때 다음과 같이 표본분산 S2i 대신 표본의 2차 중심적률 (β2)i을 사용할 수 있지만, 이런 경우는 드물다.

Fn1,n2:=(β2)1/σ21(β2)2/σ22=n1(β2)1σ21/n1n2(β2)2σ22/n2=χ2n1/n1χ2n2/n2F(n1,n2)

# F분포의 확률밀도함수

이제 F분포의 확률밀도함수를 구해보자. 계산의 편리함을 위해 다음과 같이 카이제곱분포 확률변수를 U2, V2, 자유도를 m, n으로 설정한다.

U2χ2(m), V2χ2(n)F:=U2/mV2/nF(m,n)

결과물: F분포의 확률밀도함수는 다음과 같다.

fF(x)=Γ(m+n2)Γ(m2)Γ(n2)(mn)m2xm21(1+mnx)m+n21(x>0)

# F분포의 성질


(1) F(m,n)=1/F(n,m)

단순히 두 카이제곱분포 확률변수의 위치를 바꾼 것이라고 이해하면 된다. 나눗셈의 순서를 바꿔도 자유도 위치만 다른 같은 분포가 나온다는 것은 F분포 특유의 성질이다. t분포는 이런 성질이 없다.


(2) F1α(m,n)=1/Fα(n,m)

분위수를 통일해서 모분산 관련 구간추정과 가설검정을 쉽게 해주는 중요한 성질이다. 1αα로 바꾸는 대신, 역수를 취하고 자유도의 자리를 바꿔준다.

증명: 분위수의 정의에 의해

P(U2/mV2/nFα(m,n))=1α

이것을 변형하면

P(V2/nU2/m1Fα(m,n))=1α1P(V2/nU2/m1Fα(m,n))=1αP(V2/nU2/m1Fα(m,n))=α(a)

또 다시 분위수의 정의에 의해

P(V2/nU2/mFα(n,m))=1α

이것을 변형하면(α자리에 1α를 넣는다.)

P(V2/nU2/mF1α(n,m))=α(b)

(a)(b)가 모두 성립하므로 1Fα(m,n)=F1α(n,m)가 성립한다.


(3) F(1,n)=t2(n)

t분포의 정의를 떠올려보자. z분포 확률변수와 자유도가 n인 카이제곱분포 확률변수로 만들어진다.

Tn:=Zχ2n/n

이것을 제곱하면 다음과 같다. 카이제곱분포의 정의에 의해 Z2=χ21이 되기 때문이다.

T2n=Z2χ2n/n=χ21/1χ2n/n=F1,n


728x90

'Mathematics' 카테고리의 다른 글