Loading [MathJax]/jax/output/HTML-CSS/jax.js
본문 바로가기

Mathematics

제1종 오류와 제2종 오류

728x90

# α오류, β오류

지금까지 했던 논의를 되돌아보면, 통계적 가설검정법은 제1종 오류의 발생률인 유의확률(=p값) p와 제1종 오류의 발생률의 상한선인 유의수준 α의 비교가 핵심이다. 구체적인 p값과 유의수준을 비교하거나, 우회적으로 관측값과 임계값을 비교하는 방법을 쓰거나, 결국 핵심은 제1종 오류, 즉, 옳은 영가설을 기각할 오류의 발생률을 줄이는 것이다.

‘옳은 영가설을 기각’한다는 것은, 다시 말해 ‘실제로 없는 차이를 있다’고 하는 것이다. 그런데 실제 응용측면에서는 ‘틀린 영가설을 채택’할 오류, 즉, ‘실제 있는 차이를 없다’고 하는 오류도 신경써야 한다. 이것을 제2종 오류라고 한다.

제2종 오류는 제1종 오류와 달리 유의확률이나 유의수준 같은 개념이 없다. 그만큼 가설검정에서는 상대적으로 경시되는 개념인 것이다. 하지만 실전에서는 분명히 제1, 2종 오류를 동시에 신경써야 하는 상황이 온다.

두 오류를 함께 논의하는 경우, 제1종 오류의 발생률을 α로 놓고, 제2종 오류의 발생률을 이것에 대응해서 β로 놓는다. 제1종 오류와 제2종 오류를 간단히 α오류와 β오류라고 한다.

# 두 가지 오류의 trade-off 관계

αβ나 작을 수록 좋다. 그런데 늘 그렇듯 두 마리 토끼를 다 잡을 수는 없다. MMSE 문제에서 편향과 분산이 trade-off 관계에 있었듯이, αβ도 trade-off 관계에 있다.

단일표본 우측 z검정을 예시로 생각해보자. 유의수준 α에 영가설 H0:μ=μ0과 대립가설 H1:μ>μ0을 제안할 것이다. 그리고 H0이 옳다는 가정하에 적당한 검정통계량 Z:=ˉXμ0σ/n의 확률분포를 그래프로 나타낸다. 검정통계량의 임계값은 zα가 된다.

데이터를 얻어 검정통계량의 관측값 z를 계산한 뒤, 임계값 zα와 비교한다. z<zα이면 기각역 밖에 있으므로 H0을 채택하고, z>zα이면 기각역에 속하므로 H0을 기각한다. 그림처럼 점 z0에서 영가설 채택이, 점 z1에서 영가설 기각이 발생한다.

상술한 과정이 바로 제1종 오류만 신경썼던 전통적인 z검정이다. 이제 제2종 오류를 고려해보자. 위의 빨간색 분포는 H0을 기반으로 만든 분포인데, 사실 원래 얻어야할 실제 분포는 파란색이었다고 ‘가정’하자. 파란색 분포는 빨간색 분포와 평균만 다를 뿐, 분산은 같다.

파란색 분포는 대립가설 H1:μ>μ0에 기반한 분포다. H0이 틀렸다는 가정 하에 μ>μ0이므로 μ의 실제 값은 μ0이 아닌 μ1로 놓자.

이렇게 실제 분포(가정)와 영가설의 분포를 나란히 놓고 영가설 채택점 z0을 보자. 실제 분포가 옳다는 가정하에, z0은 제2종 오류를 범한 것이 된다. 실제 분포가 옳다는 가정하에 H0은 틀렸고, z0은 틀린 H0을 채택하는 것이 되기 때문이다.

note: H0의 기반한 분포든 실제 분포든 모두 하나의 가정일 뿐이다. 실제로 평균이 μ0인지 μ1인지는 알 수 없다.

반면, 실제 분포가 옳다는 가정하에, z1은 옳은 판단이 된다. 실제 분포가 옳다는 가정하에 H0은 틀렸고, z1은 틀린 H0을 기각했기 때문이다. 이 논리를 그대로 따르면 실제 분포(가정)의 확률밀도함수를 (,zα) 구간에서 적분한 값이 β가 되며, (zα,) 구간에서 적분한 값이 1β가 된다.

만약 β를 줄이고 싶다면, 임계값 zα를 왼쪽으로 이동시켜야만 한다. 이 과정에서 필연적으로 α가 증가한다. 반대로, α를 줄이고 싶어서 임계값 zα를 오른쪽으로 이동시키면 β는 증가한다.

그래프 아래 면적을 통해 논의하지 않고, 직관적으로 생각해보자. H0:, H1:와 같이 프로그래밍 된 AI 판사가 있다. AI 판사가 범죄자를 놓치기 싫어서 유죄판결 성향이 강한 경우, 실제로 유죄일 때 무죄판결을 할 확률(β)은 감소한다. 범죄자를 놓칠 확률은 감소하는 것이다. 하지만 이와 반대급부로 실제로 무죄일 때 유죄판결을 할 확률(α)은 증가한다. 동시에 억울한 사람이 생길 확률도 증가하는 것이다. 반면, 무죄판결 성향이 강한 경우 억울한 사람이 생길 확률(α)은 감소하지만 범죄자를 놓칠 확률(β)이 증가한다.

note: 범죄자를 놓치는 것(제2종 오류, β오류)보다 억울한 사람이 생기는 것(제1종 오류, α오류)이 더 심각하므로 ‘무죄추정의 원칙’에 의해 무죄판결 성향이 더 강하도록 프로그래밍 하는 것이 옳다고 본다.

αβ는 trade-off 관계에 있지만, α+β를 최소화하는 것은 가능하다. 다음 그림처럼 α=β가 되도록 임계값을 설정하면, α+β가 최소화된다. 위 그림과 비교해서 ‘위에 튀어나온 면적’이 없어졌기 때문이다.

728x90