드디어 기초적인 이산분포의 작성을 끝냈다. 이제 연속분포의 세계로 넘어갈 차례이다. 그전에, 여러가지 이산분포를 총정리하고, 이들 간의 관계를 되짚어보자.
우선 베르누이 분포에 대해서 공부했다. 베르누이 시행은 시행의 결과가 두 가지(성공, 실패)인 시행이다. 이 시행을 한 번하면 베르누이 분포 $\mathrm{Bern}(p)$를 얻고, 독립적으로 $n$번 하면 이항분포 $\mathrm{Bin}(n,p)$를 얻는다. 즉, 다음과 같은 관계가 성립했다.
2022.10.06 - [확률론과 수리통계] - 베르누이 분포
2022.10.06 - [확률론과 수리통계] - 이항분포
$$
\mathrm{Bin}(1,p)=\mathrm{Bern}(p)
$$
이항분포의 독립성을 가리켜 복원추출이라고도 했다. 비복원추출로 인해 $n$번의 베르누이 시행이 독립적이지 않았을 때는 초기하분포 $\mathrm{HG}(n,p,N)$를 얻었다. 그리고 $N \rightarrow \infty$일 때, 초기하분포가 이항분포에 수렴함을 보였다.
2022.10.12 - [확률론과 수리통계] - 초기하분포
$$
\lim_{N \rightarrow \infty}\mathrm{HG}(n,p,N)=\mathrm{Bin}(n,p)
$$
이항분포와 마찬가지로, 초기하분포도 베르누이 분포와 연관이 있다.
$$
\mathrm{HG}(1,p,N)=\mathrm{Bern}(p)
$$
한편, $(n,p)\rightarrow(\infty,0)$일 때, 이항분포 $\mathrm{Bin}(n,p)$는 푸아송 분포 $\mathrm{Pois}(np)$로 근사시킬 수 있다.
2022.10.12 - [확률론과 수리통계] - 푸아송 분포
$$
\lim_
{(n,p)\rightarrow(\infty,0)
}\mathrm{Bin}(n,p)=\mathrm{Pois}(np)
$$
베르누이 분포든, 이항분포든, 초기하분포든 결국 베르누이 시행의 횟수를 정해놓은 상황에서 사용할 수 있다. 푸아송 분포도 결국은 정해진 시행을 하나의 단위시간, 공간으로 묶어 생각하기 때문에 이 4가지는 같은 종류라고 볼 수 있다.
그런데 베르누이 시행을 정해놓지 않고, 그 성공횟수를 정해놓고 만족할 때까지 시행을 하는 분포 2가지를 공부했다. 기하분포 $\mathrm{Geo}(p)$는 성공이 1번 나올 때까지 시행을 하는 상황에서 쓸 수 있고, 음이항분포 $\mathrm{NB}(r,p)$는 성공이 $r$번 나올 때까지 시행을 하는 상황에서 쓸 수 있다. 즉, 다음과 같은 관계가 성립했다.
2022.10.06 - [확률론과 수리통계] - 기하분포
2022.10.08 - [확률론과 수리통계] - 음이항분포
$$
\mathrm{Geo}(p)=\mathrm{NB}(1,p)
$$
이 이산분포들의 관계를 다음 그림과 같이 요약하자.
결국 여태까지 공부한 이산분포들은 모두 베르누이 시행에 기초해있다는 것을 알 수 있다. 단 2가지의 결과만을 갖는 시행인 베르누이 시행, 즉 동전던지기에서 이토록 많은 종류의 이산분포가 파생되는 것이 너무 재미있고, 놀랍다.