본문 바로가기

Mathematics

기하분포의 무기억성, 도박사의 오류

728x90

기하분포란?

성공 확률이 p이고 실패 확률이 q=1p인 어떤 게임을 한 번 성공할 때까지 계속 반복한다고 가정하자. 반복이 끝났을 때의 누적된 반복 횟수를 Y라고 하자.

P(Y=y)=pqy1,y=1,2,

이것은 Y가 실제로 y라는 값을 가지는 확률을 표현한 공식, 즉, 확률분포이고, 이 확률분포의 이름은 기하분포이다.

기하분포는 한 번의 성공까지 얼마나 많은 시행이 필요한가에 대한 물음에 확률을 통해 답을 준다.

단 1번에 성공하고 반복 시행을 끝낼 확률은 P(Y=1)=p이고

2번만에 성공하여 끝낼 확률은 P(Y=2)=pq,

3번만에 성공하여 끝낼 확률은 P(Y=3)=pq2이다.

기하분포의 무기억성

한 번의 성공을 관측하기까지 연속되는 실패 횟수에 관하여 다음 두 가지 확률을 생각해보자.

(1) b번 연속으로 실패하는 확률 P(Y>b)

(2) 이미 a번 연속으로 실패했는데, 추가로 b번 연속으로 실패하는 확률 P(Y>a+b|Y>a)

직관적으로는 P(Y>a+b|Y>a)<P(Y>b)인 것 같다.

이미 a번이나 연속된 실패를 맛보았는데, 앞으로는 조금 다르지 않을까?

하지만 수학적으로 이 두 확률은 같다. 증명은 매우 간단하다.

P(Y>b)=qb

P(Y>a+b|Y>a)=P(Y>a+b and Y>a)P(Y>a)=P(Y>a+b)P(Y>a)=qa+bqa=qb

여기서 Y>a+b and Y>aY>max(a+b,a)와 같고, 즉 Y>a+b와 같다.

즉, 이미 a번 실패한 것은 앞으로의 결과에 아무런 영향을 미치지 않는다는 뜻이다.

이를 기하분포의 무기억성 (Memorylessness)이라고 한다. 실패를 기억하지 않는다는 뜻이다.

도박사의 오류와 현실

사람들은 특히 도박을 할 때 과거의 실패가 그 다음 결과에 좋은 영향을 준다고 생각한다.

예: 지금까지 계속 홀이 나왔으니 앞으로는 짝이 나온다.

이것이 바로 도박사의 오류 (Gambler's Fallacy)이다.

사람들에게는 사건들 사이에서 관계를 찾으려고 노력하는 심리가 존재한다. 그런데 왜 이것을 오류라고 부를까? 각 시행이 독립적이라고 가정하기 때문이다.

반대로 말하면 각 시행이 독립적이지 않을 때는 오류라고 할 수 없다. 실제로 누적된 실패 횟수에 대해 성공확률 보너스가 있다면 이때는 오류가 아니다.

기하분포가 무기억성을 가지는 핵심 원인은 각 시행이 독립적이라는 것을 가정하기 때문이다. 과거의 결과가 실패이더라도 그 다음 시행에서 성공확률이 높아지지 않는 것이 근본 원인이다.

현실에서 많은 상황은 기하분포로 모델링할 수도 있고, 그렇지 않을 수도 있다.

단순한 도박은 기하분포로 모델링할 수 있다. 그러나 인간의 성공을 향한 도전은 기하분포로 모델링할 수 없다. 실패는 성공의 어머니라는 말처럼, 거듭된 실패가 쌓여 경험이 되고, 그 다음 도전에서 성공확률은 높아진다. 실패의 원인을 기억하고, 실력을 높이는 한, 각 도전은 독립적이지 않다.

728x90

'Mathematics' 카테고리의 다른 글