음이항분포는 주어진 회의 이벤트가 발생할 때까지의 대기 시간을 모델링하는데
여기서 대기 시간을 어떻게 해석하는가에 따라 확률질량함수의 모습이 바뀐다.
- 첫번째 관점: 대기 시간 = 발생 시간 + 미발생 시간
- 두번째 관점: 대기 시간 = 미발생 시간
첫번째 관점
이벤트의 발생확률은 이고, 총 회의 관찰이 끝났을 때, 발생 회, 미발생 회가 있었다고 보는 관점.
확률질량함수:
!여기서 조합수 부분은 를 사용해도 좋음 (조합수의 성질).
기대치와 분산:
유도 과정
확률질량함수
총 회의 관찰에 회의 발생과 회의 미발생을 배치하는데, 마지막 자리는 발생으로 고정이고, 남은 자리에 회의 발생과 회의 미발생을 배치.
한편, 최소 회의 관찰이 필요하므로 서포트 (의 범위)는
기대치와 분산
먼저 발생 횟수가 인 특수한 경우 의 모멘트를 고려한다. (이것은 첫번째 관점의 기하분포라고 할 수 있음.)
다음 공식과 정의를 사용.
계산에 쓰일 기하급수의 변형 ():
계산 과정:
각 관찰이 독립이므로 임의의 회 발생 횟수에서 개의 과 을 더할 수 있음, 즉 를 곱해서 일반화된 을 얻는다.
두번째 관점 (위키피디아)
( https://en.wikipedia.org/wiki/Negative_binomial_distribution )
이벤트의 발생확률은 이고, 총 회의 관찰이 끝났을 때, 발생 회, 미발생 회가 있었다고 보는 관점. 즉, 이번에는 미발생 횟수가 관심 대상이다.
확률질량함수:
!여기서 조합수 부분은 를 사용해도 좋음 (조합수의 성질).
기대치와 분산:
유도 과정
확률질량함수
총 회의 관찰에 회의 발생과 회의 미발생을 배치하는데, 마지막 자리는 발생으로 고정이고, 남은 자리에 회의 발생과 회의 미발생을 배치.
한편, 관찰이 끝날 때까지 운이 매우 좋은 경우 회의 미발생이 있고, 운이 매우 안좋은 경우 미발생 횟수는 무한으로 발산. 따라서 서포트 (의 범위)는
기대치와 분산
먼저 발생 횟수가 인 특수한 경우 의 모멘트를 고려한다. (이것은 두번째 관점의 기하분포라고 할 수 있음.)
이번에도 다음 공식과 정의를 사용.
계산에 쓰일 기하급수의 변형 ():
계산 과정:
이번에도 마찬가지로 각 관찰이 독립이므로 임의의 회 발생 횟수에서 개의 과 을 더할 수 있음, 즉 를 곱해서 일반화된 을 얻는다.