Loading [MathJax]/jax/output/HTML-CSS/jax.js
본문 바로가기

Mathematics

확률변수의 변환

728x90

실제 응용에서 확률변수는 함수의 형태로 쓰이는 경우가 많다. 예를 들어 속력을 확률변수 V로 놓았을 때, 운동에너지 K=12mV2V에 관한 함수이다. 이것은 확률변수 V에 변환 T:t12mt2를 적용한 것이라고 보아도 무방하다.

그런데 V의 분포를 이미 알고 있다면, 변환 T를 적용하여 얻은 K는 어떤 분포를 따르는지가 중요하다. 가령 VN(μ,σ2)이라고 하면, KN(12mμ2,12mσ2)인가? 확실하지 않다. 모수는 둘째치고, K가 정규분포를 따르는지의 여부도 장담할 수 없다.

이번 글에서는 위와 같은 문제를 해결하는 방법을 알아보자.

#1. 이산확률변수의 변환

먼저 이산확률변수의 변환을 보자. 이산확률변수의 변환문제는 비교적 간단하며 몇 가지만 주의하면 된다. 예를 들어 XPois(λ)일 때, 그것의 선형변환 Y=2X1의 분포를 구하는 문제를 생각해보자.

P(Y=2x+1)=P(X=x)=eλλxx!,x{0,1,2,}

P(Y=2x+1)x를 순차적으로 대입하여 다음과 같은 결과를 얻는다. 표나 행렬은 이산확률분포를 표현하는 좋은 방법이다.

Y[1132y1eλeλλeλλ22!eλλyy!]

note: 이 방법 대신에 fY(y)=P(Y=y)=P(X=y+12)=eλλy+12y+12!로 구하고 싶을 수도 있다. 그런데 이 경우 y+12이 음이 아닌 정수라는 것이 보장되지 않는다는 문제가 있다. 그래서 저렇게 간접적으로 구하고, 표 또는 행렬로 나타내는 편이 좋다.

또 다른 예시를 들어보자. 확률변수 X의 분포가 다음과 같다.

X[101131313]

이때 Y=X2의 분포를 구하면 다음과 같다.

Y[(1)2012131313]=[011323]

핵심은 (1)2=12=1이므로 합쳐서 나타내야 한다는 점이다.

#2. 연속확률변수의 변환

연속확률변수 X에 변환 T를 적용하여 새로운 연속확률변수 Y=T(X)로 변환할 때, 원래 있던 확률밀도는 어떻게 변화하는가? 즉, 이미 fX(x)를 알고 있을 때 새로운 확률밀도 fY(y)는 어떻게 구할까?

본격적인 유도를 시작하기 전에, 미적분학에서 유용한 공식을 정리하고 넘어가자. 함수 f와 그것의 원시함수 F에 대해 다음이 성립한다.

h(x)g(x)f(x) dx=[F(x)]h(x)g(x)=F(h(x))F(g(x))

따라서 다음이 성립한다.

ddx(h(x)g(x)f(x) dx)=F(h(x))h(x)F(g(x))g(x)=f(h(x))h(x)f(g(x))g(x)

만약 g(x)h(x)가 상수(a)라면, 다음이 성립한다. a±로 발산해도 마찬가지이다.

ddx(h(x)af(x) dx)=f(h(x))h(x)ddx(ag(x)f(x) dx)=f(g(x))g(x)

이제 이 결과를 토대로 새로운 확률밀도를 구하는 공식을 유도해보자. 먼저 누적분포함수를 다음과 같이 구하고, 확률밀도함수는 그것의 미분으로 구할 것이다. 이 방법은 자주 쓰이는 방법이므로 익혀두자. (여기서는 괄호가 너무 많아 헷갈리므로 소괄호 대신 대괄호를 썼다.)

FY(y):=P[Yy]=P[T(X)T(T1(y))]

부등식 T(X)T(T1(y))의 해는 T의 단조성에 따라 다르다. T가 단조증가이면

FY(y)=P[XT1(y)]=T1(y)fX(x) dx,fY(y)=ddyFY(y)=fX(T1(y))ddyT1(y)

반대로 T가 단조감소라면

FY(y)=P[XT1(y)]=T1(y)fX(x) dx,fY(y)=ddyFY(y)=fX(T1(y))ddyT1(y)

이 두 결과를 절댓값 기호로 합치면 다음과 같은 변환공식을 얻는다. (fX는 확률밀도이기 때문에 음수가 될 수 없으므로 절댓값 기호는 T1을 감싸야 한다.)

fY(y)=fX(T1(y))|ddyT1(y)|

이 공식은 T의 역함수 T1이 유일한 형태임을 전제로 하고 있다. 만약 T1i(i=1,2,,n)와 같이 여러가지 형태라면 이 공식을 다음과 같이 바꾸면 될 것이다.

fY(y)=ni=1fX(T1i(y))|ddyT1i(y)|

그리고 함수가 단조롭지 않아 역함수가 존재하지 않는 구간에서는 fY(y)=0을 취하면 될 것이다.

note: 확률밀도는 거의 어디서나(Almost Everywhere, a.e.; 几乎处处) 음이 아니면 된다. 측도론에서 어떤 명제가 거의 어디서나 성립한다는 것은 명제가 성립하지 않는 곳이 영집합 뿐이라는 것을 의미한다. 확률론에서는 거의 확실하게(Almost Surely, a.s.; 几乎必然)라는 용어를 쓰기도 한다. 추후 작성 예정.

#3. 예시

#3-1.

Y=aX+b,a0의 확률밀도를 구해보자. 변환 y=T(x)=ax+b이므로 x=T1(y)=yba이고, |ddyT1(y)|=|1a|이다. 따라서

fY(y)=|1a|fX(yba)

#3-2.

Y=kX2,k>0의 확률밀도를 구해보자. Y=kX2,k>0은 음이 아니므로 y<0일 때 fY(y)=0이다. Y>0인 경우를 고려해보자. 변환 y=T(x)=kx2이므로 x=T1(y)=±y/k의 두 가지 형태이다. 한편, |ddyT1i(y)|=1/(2ky)이므로 y=0일 때도 fY(y)=0으로 정하자. 따라서

fY(y)={12ky(fX(y/k)+fX(y/k)),y>00,y0

여기서 k=1, XN(0,12)이면 변환 후의 YΓ(12,12)임을 알 수 있다. 즉, 표준정규분포를 제곱한 것은 어떤 감마분포를 따른다. 그런데 Γ(12,12)은 자유도가 1인 카이제곱분포 χ2(1)과 같다. 따라서 표준정규분포를 제곱하면 자유도가 1인 카이제곱분포를 얻을 수 있다.

728x90

'Mathematics' 카테고리의 다른 글

야코비 행렬식  (0) 2022.11.28
확률벡터의 변환  (0) 2022.11.28
결합분포, 주변분포, 조건부분포  (0) 2022.11.17
확률변수  (0) 2022.11.14
베이즈 정리  (0) 2022.11.05