728x90

기하분포란?

성공 확률이 $p$이고 실패 확률이 $q=1-p$인 어떤 게임을 한 번 성공할 때까지 계속 반복한다고 가정하자. 반복이 끝났을 때의 누적된 반복 횟수를 $Y$라고 하자.

$$ P(Y=y)=pq^{y-1},\quad y=1,2,\cdots $$

이것은 $Y$가 실제로 $y$라는 값을 가지는 확률을 표현한 공식, 즉, 확률분포이고, 이 확률분포의 이름은 기하분포이다.

기하분포는 한 번의 성공까지 얼마나 많은 시행이 필요한가에 대한 물음에 확률을 통해 답을 준다.

단 1번에 성공하고 반복 시행을 끝낼 확률은 $P(Y=1)=p$이고

2번만에 성공하여 끝낼 확률은 $P(Y=2)=pq$,

3번만에 성공하여 끝낼 확률은 $P(Y=3)=pq^2$이다.

기하분포의 무기억성

한 번의 성공을 관측하기까지 연속되는 실패 횟수에 관하여 다음 두 가지 확률을 생각해보자.

(1) $b$번 연속으로 실패하는 확률 $P(Y>b)$

(2) 이미 $a$번 연속으로 실패했는데, 추가로 $b$번 연속으로 실패하는 확률 $P(Y>a+b\vert Y>a)$

직관적으로는 $P(Y>a+b\vert Y>a)<P(Y>b)$인 것 같다.

이미 $a$번이나 연속된 실패를 맛보았는데, 앞으로는 조금 다르지 않을까?

하지만 수학적으로 이 두 확률은 같다. 증명은 매우 간단하다.

$$ P(Y>b)=q^b $$

$$ P(Y>a+b\vert Y>a)=\frac{P(Y>a+b\text{ and }Y>a)}{P(Y>a)}=\frac{P(Y>a+b)}{P(Y>a)}=\frac{q^{a+b}}{q^{a}}=q^b $$

여기서 $Y>a+b\text{ and }Y>a$는 $Y>\max(a+b,a)$와 같고, 즉 $Y>a+b$와 같다.

즉, 이미 $a$번 실패한 것은 앞으로의 결과에 아무런 영향을 미치지 않는다는 뜻이다.

이를 기하분포의 무기억성 (Memorylessness)이라고 한다. 실패를 기억하지 않는다는 뜻이다.

도박사의 오류와 현실

사람들은 특히 도박을 할 때 과거의 실패가 그 다음 결과에 좋은 영향을 준다고 생각한다.

예: 지금까지 계속 홀이 나왔으니 앞으로는 짝이 나온다.

이것이 바로 도박사의 오류 (Gambler's Fallacy)이다.

사람들에게는 사건들 사이에서 관계를 찾으려고 노력하는 심리가 존재한다. 그런데 왜 이것을 오류라고 부를까? 각 시행이 독립적이라고 가정하기 때문이다.

반대로 말하면 각 시행이 독립적이지 않을 때는 오류라고 할 수 없다. 실제로 누적된 실패 횟수에 대해 성공확률 보너스가 있다면 이때는 오류가 아니다.

기하분포가 무기억성을 가지는 핵심 원인은 각 시행이 독립적이라는 것을 가정하기 때문이다. 과거의 결과가 실패이더라도 그 다음 시행에서 성공확률이 높아지지 않는 것이 근본 원인이다.

현실에서 많은 상황은 기하분포로 모델링할 수도 있고, 그렇지 않을 수도 있다.

단순한 도박은 기하분포로 모델링할 수 있다. 그러나 인간의 성공을 향한 도전은 기하분포로 모델링할 수 없다. 실패는 성공의 어머니라는 말처럼, 거듭된 실패가 쌓여 경험이 되고, 그 다음 도전에서 성공확률은 높아진다. 실패의 원인을 기억하고, 실력을 높이는 한, 각 도전은 독립적이지 않다.

728x90

저작자표시 비영리 변경금지 (새창열림)

'Mathematics' 카테고리의 다른 글

와이블 분포 (0)	2025.03.09
생존함수와 위험함수 (0)	2025.03.08
몬티 홀 문제의 간단한 풀이 (직관 & 계산) (0)	2025.03.06
다항계수 (0)	2025.03.05
음이항분포 (기하분포)의 2가지 관점 (0)	2025.02.24

mathnotes

기하분포의 무기억성, 도박사의 오류

기하분포란?

기하분포의 무기억성

도박사의 오류와 현실

'Mathematics' 카테고리의 다른 글

티스토리툴바

기하분포의 무기억성, 도박사의 오류

기하분포란?

기하분포의 무기억성

도박사의 오류와 현실

'Mathematics' 카테고리의 다른 글

'Mathematics' Related Articles

티스토리툴바