실제 응용에서 확률변수는 함수의 형태로 쓰이는 경우가 많다. 예를 들어 속력을 확률변수 V로 놓았을 때, 운동에너지 K=12mV2은 V에 관한 함수이다. 이것은 확률변수 V에 변환 T:t↦12mt2를 적용한 것이라고 보아도 무방하다.
그런데 V의 분포를 이미 알고 있다면, 변환 T를 적용하여 얻은 K는 어떤 분포를 따르는지가 중요하다. 가령 V∼N(μ,σ2)이라고 하면, K∼N(12mμ2,12mσ2)인가? 확실하지 않다. 모수는 둘째치고, K가 정규분포를 따르는지의 여부도 장담할 수 없다.
이번 글에서는 위와 같은 문제를 해결하는 방법을 알아보자.
#1. 이산확률변수의 변환
먼저 이산확률변수의 변환을 보자. 이산확률변수의 변환문제는 비교적 간단하며 몇 가지만 주의하면 된다. 예를 들어 X∼Pois(λ)일 때, 그것의 선형변환 Y=2X−1의 분포를 구하는 문제를 생각해보자.
P(Y=2x+1)=P(X=x)=e−λλxx!,x∈{0,1,2,⋯}
P(Y=2x+1)에 x를 순차적으로 대입하여 다음과 같은 결과를 얻는다. 표나 행렬은 이산확률분포를 표현하는 좋은 방법이다.
Y∼[−113⋯2y−1⋯e−λe−λλe−λλ22!⋯e−λλyy!⋯]
note: 이 방법 대신에 fY(y)=P(Y=y)=P(X=y+12)=e−λλy+12y+12!로 구하고 싶을 수도 있다. 그런데 이 경우 y+12이 음이 아닌 정수라는 것이 보장되지 않는다는 문제가 있다. 그래서 저렇게 간접적으로 구하고, 표 또는 행렬로 나타내는 편이 좋다.
또 다른 예시를 들어보자. 확률변수 X의 분포가 다음과 같다.
X∼[−101131313]
이때 Y=X2의 분포를 구하면 다음과 같다.
Y∼[(−1)2012131313]=[011323]
핵심은 (−1)2=12=1이므로 합쳐서 나타내야 한다는 점이다.
#2. 연속확률변수의 변환
연속확률변수 X에 변환 T를 적용하여 새로운 연속확률변수 Y=T(X)로 변환할 때, 원래 있던 확률밀도는 어떻게 변화하는가? 즉, 이미 fX(x)를 알고 있을 때 새로운 확률밀도 fY(y)는 어떻게 구할까?
본격적인 유도를 시작하기 전에, 미적분학에서 유용한 공식을 정리하고 넘어가자. 함수 f와 그것의 원시함수 F에 대해 다음이 성립한다.
∫h(x)g(x)f(x) dx=[F(x)]h(x)g(x)=F(h(x))−F(g(x))
따라서 다음이 성립한다.
ddx(∫h(x)g(x)f(x) dx)=F′(h(x))h′(x)−F′(g(x))g′(x)=f(h(x))h′(x)−f(g(x))g′(x)
만약 g(x)나 h(x)가 상수(a)라면, 다음이 성립한다. a→±∞로 발산해도 마찬가지이다.
ddx(∫h(x)af(x) dx)=f(h(x))h′(x)ddx(∫ag(x)f(x) dx)=−f(g(x))g′(x)
이제 이 결과를 토대로 새로운 확률밀도를 구하는 공식을 유도해보자. 먼저 누적분포함수를 다음과 같이 구하고, 확률밀도함수는 그것의 미분으로 구할 것이다. 이 방법은 자주 쓰이는 방법이므로 익혀두자. (여기서는 괄호가 너무 많아 헷갈리므로 소괄호 대신 대괄호를 썼다.)
FY(y):=P[Y≤y]=P[T(X)≤T(T−1(y))]
부등식 T(X)≤T(T−1(y))의 해는 T의 단조성에 따라 다르다. T가 단조증가이면
FY(y)=P[X≤T−1(y)]=∫T−1(y)−∞fX(x) dx,fY(y)=ddyFY(y)=fX(T−1(y))ddyT−1(y)
반대로 T가 단조감소라면
FY(y)=P[X≥T−1(y)]=∫∞T−1(y)fX(x) dx,fY(y)=ddyFY(y)=−fX(T−1(y))ddyT−1(y)
이 두 결과를 절댓값 기호로 합치면 다음과 같은 변환공식을 얻는다. (fX는 확률밀도이기 때문에 음수가 될 수 없으므로 절댓값 기호는 T−1을 감싸야 한다.)
fY(y)=fX(T−1(y))|ddyT−1(y)|
이 공식은 T의 역함수 T−1이 유일한 형태임을 전제로 하고 있다. 만약 T−1i(i=1,2,⋯,n)와 같이 여러가지 형태라면 이 공식을 다음과 같이 바꾸면 될 것이다.
fY(y)=n∑i=1fX(T−1i(y))|ddyT−1i(y)|
그리고 함수가 단조롭지 않아 역함수가 존재하지 않는 구간에서는 fY(y)=0을 취하면 될 것이다.
note: 확률밀도는 거의 어디서나(Almost Everywhere, a.e.; 几乎处处) 음이 아니면 된다. 측도론에서 어떤 명제가 거의 어디서나 성립한다는 것은 명제가 성립하지 않는 곳이 영집합 뿐이라는 것을 의미한다. 확률론에서는 거의 확실하게(Almost Surely, a.s.; 几乎必然)라는 용어를 쓰기도 한다. 추후 작성 예정.
#3. 예시
#3-1.
Y=aX+b,a≠0의 확률밀도를 구해보자. 변환 y=T(x)=ax+b이므로 x=T−1(y)=y−ba이고, |ddyT−1(y)|=|1a|이다. 따라서
fY(y)=|1a|fX(y−ba)
#3-2.
Y=kX2,k>0의 확률밀도를 구해보자. Y=kX2,k>0은 음이 아니므로 y<0일 때 fY(y)=0이다. Y>0인 경우를 고려해보자. 변환 y=T(x)=kx2이므로 x=T−1(y)=±√y/k의 두 가지 형태이다. 한편, |ddyT−1i(y)|=1/(2√ky)이므로 y=0일 때도 fY(y)=0으로 정하자. 따라서
fY(y)={12√ky(fX(√y/k)+fX(−√y/k)),y>00,y≤0
여기서 k=1, X∼N(0,12)이면 변환 후의 Y∼Γ(12,12)임을 알 수 있다. 즉, 표준정규분포를 제곱한 것은 어떤 감마분포를 따른다. 그런데 Γ(12,12)은 자유도가 1인 카이제곱분포 χ2(1)과 같다. 따라서 표준정규분포를 제곱하면 자유도가 1인 카이제곱분포를 얻을 수 있다.
'Mathematics' 카테고리의 다른 글
야코비 행렬식 (0) | 2022.11.28 |
---|---|
확률벡터의 변환 (0) | 2022.11.28 |
결합분포, 주변분포, 조건부분포 (0) | 2022.11.17 |
확률변수 (0) | 2022.11.14 |
베이즈 정리 (0) | 2022.11.05 |