본문 바로가기

확률론과 수리통계

베르누이 분포

2022.10.05 - [확률론과 수리통계] - 이산확률변수, 확률질량함수, 이산분포, 누적분포함수

지난 글(이산확률변수, 확률질량함수, 이산분포, 누적분포함수)에서 이산분포는 여러가지가 있다고 했다. 이번 글에서는 가장 기초적인 이산분포인 베르누이 분포에 대해 이해해보자.

확률변수 $X$가 모수가 $p$인 베르누이 분포(Bernoulli Distribution; 伯努利分布)를 따를 때, $X \sim \mathrm{Bern}(p)$라고 표현하고, $X$는 다음과 같은 PMF를 갖는다:

$$
f_{X}(x)=p^{x}(1-p)^{1-x}
$$

베르누이 분포의 확률변수 $X$, 모수 $p$는 다음과 같은 의미를 갖는다:

$\space$


$X$: 베르누이 확률변수. $X:=
\begin{cases}
1, & \mathrm{성공}
\\
0, & \mathrm{실패}
\end{cases}$

$p$: 베르누이 시행의 성공확률.


$\space$

비교적 새로운 용어가 많으니 차근차근 정리해보자.

어떤 사건이든지 ‘발생한다’, ‘발생하지 않는다’의 두 가지의 경우로 나눌 수 있다. 이 두 사건을 확률변수를 이용해서 나타내고 싶다. 사건 $\lbrace\mathrm{발생함}\rbrace$은 $X=1$과 같이 나타내고, 사건 $\lbrace\mathrm{발생하지\enspace않음}\rbrace$은 $X=0$과 같이 나타내자. 즉, 다음과 같이 베르누이 확률변수(Bernoulli RV; 伯努利随机变量) $X$를 정의하자:

$$
X:=
\begin{cases}
1, & \mathrm{발생함}
\\
0, & \mathrm{발생하지\enspace않음}
\end{cases}
$$

note: 사건(event; 事件)은 집합이다.

이제 어떤 사건이 발생할 확률을 $p$라고 하면, $P(X=1)=p$이고 $P(X=0)=1-p$이다. 즉, 베르누이 확률변수의 PMF는 다음과 같다:

$$
f(x)=p^{x}(1-p)^{1-x}=
\begin{cases}
p, & x=1
\\
1-p, & x=0
\end{cases}
$$

쉽게 말해 어떤 확률변수가 두 가지의 값만 가진다면, 그 확률변수의 PMF는 이런 형태이다. 그런데 매번 이렇게 PMF를 쓰는것이 번거롭다. 그래서 간단히 $X \sim \mathrm{Bern}(p)$라고 쓰고, ‘확률변수 $X$는 모수가 $p$인 베르누이 분포를 따른다(Follow; 服从).’라고 표현한다.

여기서 모수(Parameter; 参数)의 개념이 중요하다. 모수가 무엇인지에 따라서 분포가 결정되기 때문이다. 예를 들어, $X \sim \mathrm{Bern}(0.6)$일 때와 $X \sim \mathrm{Bern}(0.7)$일 때의 PMF는 각각 $f_{X}(x)=(0.6)^{x}(0.4)^{1-x}$와 $f_{X}(x)=(0.7)^{x}(0.3)^{1-x}$처럼 다른 형태이다. 모수는 보통 $\theta$로 나타내거나, 모수 역시 확률변수임을 강조하고 싶을 때는 $\Theta$처럼 대문자를 써서 나타내고, 소문자 $\theta$는 모수가 가지는 값으로 정의한다.

어떤 분포(e.g., 이항분포)는 모수가 여러개일 수도 있다. 이럴 때는 $\boldsymbol{\Theta}$, $\boldsymbol{\theta}$와 같이 볼드체를 써서 벡터로 나타낸다. 모수의 의미는 확률변수의 의미와 함께, 어떤 분포를 이해하는 데 있어 항상 핵심내용으로 작용한다. 추후 어떤 분포를 설명할 때, 그 분포의 확률변수의 의미와 함께, 모수의 의미도 중점적으로 다룰 것이다.

베르누이 분포는 단순하지만, 앞으로 언급된 모든 이산분포의 출발점이라는 점에서 중요한 의미를 갖는다. (3D그래픽에서 가장 단순한 도형인 삼각형으로 온갖 물체를 묘사하는 것을 떠올려보자.) 정확히는 추후 언급될 모든 이산분포가 성공(=원하는 결과가 발생함), 실패(=원하는 결과가 발생하지 않음) 두 가지의 결과만을 갖는 시행인 베르누이 시행(Bernoulli Trial; 伯努利试验)에 근거한다. 매번 ‘발생함’, ‘발생하지 않음’으로 길게 쓸 수 없으니, 베르누이 시행을 도입하고, 베르누이 확률변수 $X$를 다음과 같이 쓸 것이다.

$$
X:=
\begin{cases}
1, & \mathrm{성공}
\\
0, & \mathrm{실패}
\end{cases}
$$

note: 결과(Outcome; 结果)는 사건과 달리 집합이 아니다.

베르누이 분포에서 파생된 각종 이산분포들은 다른 분포로 근사(심지어 연속확률분포로도 근사 가능) 또는 확장할 수 있다. 따라서 베르누이 분포는 수많은 분포의 학습에 있어서 기초가 된다.

'확률론과 수리통계' 카테고리의 다른 글

기하분포  (0) 2022.10.06
이항분포  (0) 2022.10.06
이산확률변수와 이산분포  (0) 2022.10.05
베타분포의 응용  (0) 2022.10.03
베타분포의 이해  (1) 2022.10.02