본문 바로가기

전체 글

(87)
가우스 적분 이번 글에서는 자주 쓰이는 적분값 $\int_{-\infty}^{\infty}\exp (-x^2)\space\mathrm{d}x=\sqrt\pi$를 증명할 것이다. 이 적분은 가우스 적분(Gaussian Integral; 高斯积分)이라고 부르며 확률과 통계를 공부하다보면 자주 만나는 적분이므로 따로 정리할 필요가 있다. $\int_{-\infty}^{\infty}\exp (-x^2)\space\mathrm{d}x=\int_{-\infty}^{\infty}\exp (-y^2)\space\mathrm{d}y$이므로, $I:=\int_{-\infty}^{\infty}\exp (-x^2)\space\mathrm{d}x$으로 두면, $$ I^2=\int_{-\infty}^{\infty}\exp (-x^2)\spa..
정규분포 이번 글에서는 통계학에서 약방의 감초같은 역할을 하는 정규분포를 다루겠다. #1. 정규분포의 정의 확률변수 $X$가 모수가 $(\mu,\sigma^{2})$인 정규분포(Normal Distribution; 正态分布)를 따를 때, $X \sim \mathrm{N}(\mu,\sigma^{2})$라고 표현하고, $X$는 다음과 같은 PDF를 갖는다: $$ f_{X}(x)=\frac{1}{\sqrt{2\pi}\sigma}\exp\left(-\frac{\left(x-\mu\right)^{2}}{2\sigma^{2}}\right) $$ 정규분포의 확률변수 $X$, 모수 $(\mu,\sigma^{2})$는 다음과 같은 의미를 갖는다: $\space$ $X$: 정규분포를 따르는 확률변수. $\mu$: 정규분포를 따르는..
균등분포 이번 글에서는 가장 간단한 연속분포인 균등분포를 설명하겠다. 확률변수 $X$가 모수가 $(a,b)$인 균등분포(Uniform Distribution; 均匀分布)를 따를 때, $X \sim \mathrm{U}(a,b)$라고 표현하고, $X$는 다음과 같은 PDF를 갖는다: $$ f_ {X}(x)=\frac{\mathbf{1}_ {\lbrack a,b \rbrack}(x)}{b-a} $$ 균등분포의 확률변수 $X$, 모수 $(a,b)$는 다음과 같은 의미를 갖는다: $\space$ $X$: 구간 $\lbrack a,b \rbrack$에서만 관측값을 가지며, 그 구간내의 모든 점의 근처의 값을 가질 확률이 동일한 변수. $a$: 구간의 시작점. $b$: 구간의 끝점. $\space$ 정의가 복잡한 듯 보이지만..
연속확률변수와 연속분포 #1. 연속확률변수, 누적분포함수, 확률밀도함수 이산확률변수에 대해, 확률질량함수의 정의는 다음과 같았다. 2022.10.05 - [확률론과 수리통계] - 이산확률변수, 확률질량함수, 이산분포, 누적분포함수 $$ f_{X}(x):=P(X=x) $$ 그런데 연속확률변수(Continuous RV; 连续型随机变量)는 이런 정의를 쓸 수 없다. 선분 위에 점을 무작위로 하나 찍는다고 해보자. 선분 위의 점이 찍히는 위치를 확률변수 $X$로 두자. 그리고 이 선분이 $n$개의 점으로 이루어져 있다고 하자. 모든 관측값 $x$에 대해 $P(X=x)=\lim_{n \rightarrow \infty} \frac{1}{n}=0$이다. 선분은 무한개의 점으로 이루어져 있기 때문이다. 즉, 연속확률변수가 가질 수 있는 관측..
이산분포 총정리 드디어 기초적인 이산분포의 작성을 끝냈다. 이제 연속분포의 세계로 넘어갈 차례이다. 그전에, 여러가지 이산분포를 총정리하고, 이들 간의 관계를 되짚어보자. 우선 베르누이 분포에 대해서 공부했다. 베르누이 시행은 시행의 결과가 두 가지(성공, 실패)인 시행이다. 이 시행을 한 번하면 베르누이 분포 $\mathrm{Bern}(p)$를 얻고, 독립적으로 $n$번 하면 이항분포 $\mathrm{Bin}(n,p)$를 얻는다. 즉, 다음과 같은 관계가 성립했다. 2022.10.06 - [확률론과 수리통계] - 베르누이 분포 2022.10.06 - [확률론과 수리통계] - 이항분포 $$ \mathrm{Bin}(1,p)=\mathrm{Bern}(p) $$ 이항분포의 독립성을 가리켜 복원추출이라고도 했다. 비복원추출로 ..
초기하분포 확률변수 $X$가 모수가 $(n,K,N)$인 초기하분포(Hypergeometric Distribution; 超几何分布)를 따를 때, $X \sim \mathrm{HG}(n,K,N)$라고 표현하고, $X$는 다음과 같은 PMF를 갖는다: $$ f_{X}(k)= \frac{{K \choose k}{N-K \choose n-k}}{N \choose n} $$ 초기하분포의 확률변수 $X$, 모수 $(n,K,N)$는 다음과 같은 의미를 갖는다: $\space$ $X$: 비복원추출로 뽑은 목표의 개수. $n$: 비복원추출의 총 횟수. $K$: 목표의 개수. $N$: 전체 개수. $\space$ note: 초기하분포의 모수의 순서는 특별히 정해진 것은 없고 정의하기 나름이다. 그러므로 어떤 글에서 초기하분포가 언급되..
푸아송 분포 드디어 푸아송 분포까지 왔다. 푸아송 분포는 확률론과 수리통계를 배울 때 갑툭튀하여 수많은 중도포기자를 발생시키는 데 악명이 높다. 그 이유는 분포를 이해하는 데 핵심사항인 확률변수 ($X$)의 정의와 모수 ($\lambda$)의 정의를 잘 모르는 것일 수도 있고, 난해한 PMF 때문일 수도 있다. 이번 글에서는 푸아송 분포의 모수와 확률변수를 설명하는 데 중점을 두고, 그 PMF를 직접 유도할 것이다. PMF의 유도과정에서 $e$가 왜 튀어나오는지, 팩토리얼은 왜 달려있는지 등을 자연스럽게 이해할 수 있을 것이다. #1. 푸아송 분포의 정의 확률변수 $X$가 모수가 $\lambda$인 푸아송 분포(Poisson Distribution; 泊松分布)를 따를 때, $X \sim \mathrm{Pois}(\l..
음이항분포 확률변수 $X$가 모수가 $(r,p)$인 음이항분포(Negative Binomial Distribution; 负二项分布)를 따를 때, $X \sim \mathrm{NB}(r,p)$라고 표현하고, $X$는 다음과 같은 PMF를 갖는다: $$ f_{X}(x)={x-1 \choose r-1}p^{r}(1-p)^{x-r} $$ 음이항분포의 확률변수 $X$, 모수 $(r,p)$는 다음과 같은 의미를 갖는다: $\space$ $X$: 베르누이 시행의 결과가 $r$번 성공일 때까지의 총 독립시행횟수. $r$: 목표 성공 횟수. $p$: 각 베르누이 시행의 성공 확률. $\space$ 음이항분포는 어떤 의미를 가질까? 지난 글에서 공부한 기하분포와 비교 해보자. 2022.10.06 - [확률론과 수리통계] - 기하분포..