결합분포, 주변분포, 조건부분포
#1. 결합분포 실제 응용 측면에서는 여러 확률변수를 동시에 다뤄야 하는 경우가 생긴다. 다변수함수가 있듯이, 다차원 확률변수의 분포함수 역시 있을 것이다. 다변수함수 $f(x,y)$는 $x$와 $y$의 함수로 볼 수도 있지만, $(x,y)$라는 이차원 벡터의 함수로 볼 수도 있다. 마찬가지로 $X$와 $Y$의 확률분포 역시 $(X,Y)$라는 이차원 확률벡터의 함수로 볼 수 있다. 일반적인 $n$차원 확률벡터와 그 분포의 정의는 다음과 같다. $\space$ $X_i(i=1,2,\cdots,n)$는 같은 확률공간 $(\Omega,\mathcal{F},P)$ 위에서 정의된 $n$개의 확률변수들이다. 이것들을 한데 모은 순서쌍 $\mathbf{X}:=(X_1,X_2,\cdots,X_n)$을 $n$차원 확률벡..
확률변수
#1. 확률변수의 정의 이번 글에서는 수리통계의 꽃인 확률변수(Random Variable, RV; 随机变量)를 엄밀하게 정의해보자. 확률변수는 사건의 결과를 숫자로 나타낸 것이다. 예를 들어 동전을 3회 던지는 확률시행에서 앞면이 두 번 나오는 사건은 다음과 같다. $$ \lbrace (H,H,T),(H,T,H),(T,H,H) \rbrace $$ 그렇다면 동전을 3회 던져 앞면이 두 번 나올 사건의 확률은 다음과 같을 것이다. $$ P(\lbrace (H,H,T),(H,T,H),(T,H,H) \rbrace) $$ 이렇게 확률은 나타내면 매우 번거롭다. 동전을 던지는 횟수가 늘어날 수록, 더욱 복잡한 표기가 필요할 것이다. 심지어 ‘동전을 100회 던져 앞면이 두 번 이상 10번 미만 나올 확률’같은 복..
조건부 확률
이번 글에서는 조건부 확률모형에 대해 알아보자. 조건부 확률에서 가장 유명한 문제는 역시 다음과 같은 ‘아들 딸 문제’일 것이다: “두 자녀가 있는 가정을 방문하여 이미 아들을 한 명 보았다. 남은 한 자녀도 아들일 확률을 구하여라.” 아들을 낳을 확률과 딸을 낳을 확률이 동일하다고 가정하자. ‘아들’을 ‘1’, 딸을 ‘0’으로 두면, 표본공간 $\Omega=\lbrace(1,1),(1,0),(0,1),(0,0)\rbrace$이고 각 근원사건의 확률은 같다. 그런데 이미 아들을 한명 보았으므로 $\lbrace(0,0)\rbrace$은 일어날 수 없다. 다시 말해 ‘이미 아들을 한 명 보았다’는 조건이 붙은 이상, 표본공간은 $\Omega^\prime=\lbrace(1,1),(1,0),(0,1)\rbrac..