지난 글에서 논의한 적률 추정법과 최대가능도 추정법은 모두 점추정(Point Estimation; 点估计)의 방법이다. 좋은 추정량의 3가지 기준인 불편성, 효율성, 일치성도 점추정에서 논의되는 개념이다.
점추정은 합리적인 방법이지만 모수를 추정한답시고 특정 수치(점)를 콕 집어서 ‘이거야!’라고 단언하는 것이 부담스러울수가 있다. 이를 보완하려고 하는 방법이 바로 구간추정(Interval Estimation; 区间估计)이다. ‘이거야!’ 대신 ‘이 근처야!’라고 하는 것이다.
정확히는 ‘이 근처에 있지 않을 확률이 매우 낮아!’라고 하는 것이다. 다시 말해 모수 θ가 특정 구간에 속할 확률을 매우 크게 만드는 것이다. 다음과 같은 확률을 생각해보자.
P(θ_<θ<¯θ)=1−α
여기서 θ_과 ¯θ는 각각 θ의 하한과 상한이다. 지금 하려는 것은 표본을 추출하고 적당한 구간을 잡는 것이기 때문에 모수의 상한과 하한은 표본의 함수, 즉 통계량이 된다.
θ_=θ_(X1,⋯,Xn), ¯θ=¯θ(X1,⋯,Xn)
이 적당한 구간 (θ_(X1,⋯,Xn),¯θ(X1,⋯,Xn))을 θ의 신뢰구간(Confidence Interval, CI; 置信区间)이라고 한다. 그리고 표본을 추출하여 열심히 계산한 신뢰구간이 모수를 포함할 확률
P(θ_(X1,⋯,Xn)<θ<¯θ(X1,⋯,Xn))=1−α
을 신뢰수준(Confidence Level; 置信水平)이라고 한다.
여기서 유의수준(Significance Level; 显著性水平) α는 매우 작은 확률이다. 예를 들어 α=0.05로 놓는다고 가정해보자. 하나의 표본과 하나의 신뢰구간은 대응되며, 표본을 100개 추출하면 100개의 신뢰구간을 얻을 수 있을 것이다. 이때, 모수를 포함하지 못하는 신뢰구간이 이론상 5개 밖에 안 되며, 나머지 95개는 모두 모수를 포함하고 있다는 뜻이다. (큰 수의 법칙에 의해 빈도는 확률과 같아진다.) 따라서 α가 작을 수록 신뢰구간의 신뢰수준 (1−α)가 높다고 할 수 있다. 더 믿을만한 신뢰구간이라는 뜻이다.
note: 왜 신뢰구간이 모수를 포함할 확률인 신뢰수준을 α라고 직접적으로 놓지 않고, (1−α)라고 간접적으로 놓았을까? 아마도 통계적 가설검정의 유의수준과 관련이 있는 것 같다.
결국 구간추정은 먼저 신뢰수준 (1−α)를 정한 뒤, 표본 X1,⋯,Xn을 추출해서 θ가 포함될만한 구간 (θ_,¯θ)를 계산하는 작업이다. 유의수준 α는 0.01이나 0.05로 주어진다. 따라서 구간추정의 성패는 모수의 하한과 상한을 어떻게 정의하느냐에 달려있다.
'Mathematics' 카테고리의 다른 글
구간추정 실제 예시 (0) | 2023.03.05 |
---|---|
정규분포 모집단의 구간추정 (0) | 2023.03.04 |
베셀 보정, 표본분산의 분모 (0) | 2023.03.02 |
크라메르-라오 하한, 피셔 정보 (0) | 2023.02.28 |
최소분산 불편추정량 (2) | 2023.02.27 |