확률변수 $T$가 모수가 $\lambda$인 지수분포(Exponential Distribution; 指数分布)를 따를 때, $T \sim \mathrm{Exp}(\lambda)$라고 표현하고, $T$는 다음과 같은 PDF를 갖는다:
$$
f_
{T}(t)=\lambda e^{-\lambda t}\mathbf{1}_
{[0,\infty)}(t)
$$
지수분포의 확률변수 $T$, 모수 $\lambda$는 다음과 같은 의미를 갖는다:
$\space$
$T$: 평균 발생횟수가 $\lambda t$인 어떤 사건이 1번 발생하기까지 걸린 시간.
$\lambda$: 단위시간내 어떤 사건의 평균 발생횟수.
$\space$
지수분포의 이해는 푸아송 분포에서 출발한다. 지수분포의 정의에서 모수 $\lambda$에 주목하자. 푸아송 분포가 모수 $\lambda$를 가졌다. $\lambda$의 의미는 ‘단위시간내 어떤 사건의 평균 발생횟수’였다. 이 단위시간을 1시간이라고 정하자. $\lambda t(t \ge 0)$의 의미는 ‘임의의 $t$시간내 어떤 사건의 평균 발생횟수’일 것이다.
그렇다면 다음과 같은 식의 의미는 ‘평균 발생횟수가 $\lambda t$인 어떤 사건이 $t$시간내 $x$번 발생할 확률’이다.
$$
P(X=x)=\frac{e^{-\lambda t}(\lambda t)^{x}}{x!}
$$
관측값 $x=0$이라고 두면, $P(X=0)=e^{-\lambda t}$는 ‘평균 발생횟수가 $\lambda t$인 어떤 사건이 $t$시간내 1번도 발생하지 않을 확률’이다. 이를 뒤집어서 생각하면 ‘평균 발생횟수가 $\lambda t$인 어떤 사건이 1번 발생하기까지 $t$시간이 넘게 걸릴 확률’이다.
이제 확률변수 $T$를 평균 발생횟수가 $\lambda t$인 어떤 사건이 1번 발생하기까지 걸린 시간이라고 두자. 그러면 $P(T>t)=P(X=0)=e^{-\lambda t}$이다. $T$의 CDF는 다음과 같다.
$$
F_T(t):=P(T \le t)=1-P(T>t)=1-e^{-\lambda t}
$$
그런데 $t$는 시간의 관측값이므로 $t < 0$일 때는 의미가 없어야 한다. 즉, $F_T(t)=0$이어야 한다. 그러므로 $F_T(t)$는 다음과 같고, 이것이 지수분포의 CDF이다.
$$
F_T(t)=\left( 1-e^{-\lambda t} \right)\mathbf{1}_
{[0,\infty)}(t)
$$
지수분포의 PDF는 다음과 같이 CDF를 미분하여 구할 수 있다. 즉, $f_T(t)=F^\prime_T(t)$이므로
$$
f_T(t)=\lambda e^{-\lambda t}\mathbf{1}_
{[0,\infty)}(t)
$$
note: 이런 식으로 먼저 CDF를 구하고, PDF는 그것을 미분함으로써 구하는 방식은 기억해두고 써먹을 필요가 있을 것 같다.
지수분포의 유도과정을 보면, 결국 푸아송 분포를 뒤집은 것이라고 볼 수 있다. 푸아송 분포는 임의의 $t$시간 내 어떤 사건의 발생횟수를 모델링한다. 그리고 지수분포는 어떤 사건이 1회 발생하기까지 걸린 시간을 모델링한다.
note: 푸아송 분포에서 $\mathrm{E}(X)=\lambda$이고, 지수분포에서 $\mathrm{E}(T)=\frac{1}{\lambda}$이다. 문자 그대로 뒤집혔다. 너무너무 재미있는 사실이 아닌가?
이산분포에서 이런 비슷한 관계가 있었다. 이항분포는 임의의 $n$회의 베르누이 시행에서 어떤 사건의 발생횟수를 모델링한다. 그리고 기하분포는 어떤 사건이 1회 발생하기까지의 베르누이 시행횟수를 모델링한다. 기하분포는 이항분포를 뒤집어 생각한 것이다.
푸아송 분포를 설명할 때, 수많은 베르누이 시행횟수를 하나의 단위시간으로 바꾸었다고 했다. 이렇게 이항분포에 극한을 취하여 푸아송 분포를 얻은것을 생각하면, 지수분포도 기하분포와 관련이 있을 것이다. 기하분포는 성공이 1회 나올 때까지의 베르누이 시행의 횟수를 모델링하는 분포이다. 그리고 지수분포는 성공이 1회 나올 때까지의 대기시간을 모델링하는 분포이다. 즉, 지수분포는 기하분포의 연속형 버전이라고 생각해도 무방하다.
기하분포에서 발생횟수 1회를 임의의 $r$회로 확장하여 음이항분포를 얻었듯이, 지수분포에서도 발생횟수 1회를 임의의 $r$회로 확장한 분포를 얻을 수 있다. 바로 다음 글에서 설명할 감마분포이다.
note: 결국 음‘이항’분포라는 이름은 이항분포를 뒤집어서(Negative) 생각했기 때문에 나왔지 않을까 싶다. 그렇다면 ‘반전이항분포’라는 이름도 괜찮지 않을까?