그 동안 사건, 결과, 확률 등의 용어를 엄밀한 정의 없이 써왔는데, 사실 이 용어들의 명확한 정의를 위해서는 확률공간(Probability Space; 概率空间)이라는 개념을 알아야 한다. 확률공간은 확률론(Probability Theory; 概率论)을 기술하는데 있어서 가장 기초적인 내용이다. 확률론을 제대로 공부하려면 반드시 알아두어야 하기에 시간을 내서 정리했다.
그런데 확률공간은 여러 측도공간(Measure Space; 测度空间) 중 한 종류이다. 그러므로 확률공간의 이해를 위해서 먼저 측도공간이 무엇인지 감을 잡아야한다. 측도공간은 전체집합, 시그마대수, 그리고 측도를 모아놓은 것으로 측도론(Measure Theory; 测度论)의 핵심이다.
내용이 난해하고 추상적이지만 차근차근 정리해보자.
#1. 측도
측정가능한 대상의 모임 $\Sigma$를 생각하자. 이제 $\Sigma$의 원소인 측정가능한 대상을 측정한 결과가 필요할 것이다. 일상생활에서의 각종 측정결과들을 떠올려보면 측정결과는 숫자로 나타내는 편이 좋다. 그러므로 다음과 같은 함수를 생각하자.
$$
\mu:\Sigma \to \mathbb{R}
$$
즉, ‘측정결과’를 수학적으로 이야기한다면, ‘측정가능한 대상을 숫자로 바꿔주는 함수’라고 할 수 있다. 이 ‘측정결과’는 어떤 성질을 가져야할까? 우리의 일상생활의 경험에 의거하여 ‘측정결과’에 알맞은 성질을 부여해주자.
$\space$
(1) 비음수(non-Negative; 非负性): 온도 같은 측정결과는 음수도 가능하지만, 키, 몸무게, 길이, 부피, 면적 등 많은 경우에서 측정결과는 양수 또는 0이었다. 그러므로 다음과 같은 성질을 부여하자.
$$
\forall M \in \Sigma: \mu(M) \ge 0
$$
(2) 공집합의 측도(Measure of Empty Set; 空集的测度): 우리는 흔히 ‘없다’는 것에 0이라는 숫자를 부여한다. 예를 들어 텅빈 물병을 두고 “물병에 물이 얼마만큼 남았는가?”라는 질문에 “물이 없다.”라고 답하기도 하지만 “물이 0 ml 남았다.”라고 답할 수도 있다. 좀 특이한 화법이지만 아무튼 의미전달상 문제가 없다. 수학적으로 표현하면 ‘공집합의 측정결과는 0이다’라고 할 수 있다. 즉, 다음과 같은 성질을 부여하자.
$$
\mu(\emptyset)=0
$$
(3) 가산가법성(Countable Additivity; 可数可加性): 이번에는 30 cm 자로 책장의 높이를 잰다고 해보자. 책장의 높이는 보통 30 cm가 넘으므로, 사다리를 타고 올라가서 책장의 최상단부터 아래로 30 cm를 재고, 그 부분을 표시한 후 다시 겹치지 않게 30 cm을 재는 방식을 반복한다. 책장의 높이가 300 cm라고 해보자. 이 방식을 10번 반복하면 책장의 높이의 측정결과를 얻을 수 있다. 그런데 300 cm 줄자를 가져와서 한꺼번에 책장의 높이를 재도 같은 결과를 얻는다. 즉, 측정결과는 합칠 수 있어야 하고, 겹치지 않게 측정한 값을 합친 것이 올바른 측정결과가 되어야한다. 수학적으로는 다음과 같이 나타낸다.
$$
\mu\left(\bigcup_{i=1}^{\infty}M_i\right)=\sum_{i=1}^{\infty}\mu(M_i),
\space
M_i \cap M_j=\emptyset, i \neq j
$$
$\space$
note: 겹치지 않는다는 것을 $M_i \cap M_j=\emptyset, i \neq j$대신에 여러 집합 중 임의의 두 집합이 서로소(Pairwise Disjoint; 两两不相交)라고 표현하기도 한다. 상호배제적(Mutually Exclusive; 互斥)도 같은 말이다.
이상의 3가지 성질은 ‘측정결과’라면 마땅히 가져야할 성질이다. 이제 표현을 고급스럽게 다듬어서, 다음과 같이 측도라는 것을 정의한다.
$\space$
$\Sigma$를 측정가능한 대상의 모임이라고 생각하자. 함수 $\mu:\Sigma \to \mathbb{R}$이 다음 조건을 만족하면, $\mu$를 $\Sigma$ 위의 측도(Measurement; 测度)라고 한다.
(1) 비음수: $\forall M \in \Sigma: \mu(M) \ge 0$
(2) 공집합의 측도: $\mu(\emptyset)=0$
(3) 가산가법성: $\mu\left(\bigcup_{i=1}^{\infty}M_i\right)=\sum_{i=1}^{\infty}\mu(M_i),\space
M_i \cap M_j=\emptyset, i \neq j$
$\space$
note: 조건 (1)을 $\mu:\Sigma \to \left[ 0,\infty \right)$로 정의하여 생략할 수도 있다. 조건 (3)의 가산가법성을 시그마 가법성($\sigma$-Additivity)이라고도 한다.
#2. 시그마대수
측도를 정의할 때, $\Sigma$를 측정가능한 대상의 모임이라고 생각했다. 측도를 엄밀히 정의했으니 이제 ‘측정가능한 대상의 모임’도 엄밀히 정의해보자. 정의할 때, 앞서 정의한 측도의 정의와 잘 맞도록 해야하는 것을 염두에 두자.
$\space$
집합 $X$와 그것의 멱집합(Power Set; 幂集) $\mathcal{P}(X)$을 생각하자. 집합 $\Sigma \subseteq \mathcal{P}(X)$에 대해, 다음이 성립하면 $\Sigma$를 $X$ 위의 시그마대수($\sigma$-Algebra; $\sigma$代数)라고 한다.
(1) $X \in \Sigma$
(2) $M \in \Sigma$이면 $M^c:=X-M \in \Sigma$이다.
(3) $M_i \in \Sigma,i=1,2,\cdots$이면 $\bigcup_{i=1}^{\infty}M_i \in \Sigma$이다.
$\space$
note1: 조건 (2)와 (3)을 각각 여집합에 대해 닫혀있다, 가산무한개의 합집합(Countably Infinite Unions; 可数无限个并集)에 대해 닫혀있다(Closed; 封闭)라고 한다.
note2: 조건 (3)을 약화시켜서 유한개의 합집합(Finite Unions; 有限个并集)으로 바꾼 것을 대수(Algebra; 代数)라고 한다. 즉, 시그마 대수에서 시그마는 가산무한개를 뜻한다.
시그마대수 $\Sigma$를 ‘측정가능한 대상을 모아놓은 것’이라고 했다. 이렇게 생각하면 위에서 열거한 조건들은 다음과 같이 쓸 수 있다.
$\space$
(1) $X$는 측정가능하다.
(2) $M$이 측정가능하면 그것의 여집합 $M^c:=X-M$도 측정가능하다.
(3) 가산무한개의 $M_i,i=1,2,\cdots$가 측정가능하면 합집합 $\bigcup_{i=1}^{\infty}M_i$도 측정가능하다.
$\space$
시그마대수의 이 3가지 조건으로부터 다른 성질을 유도할 수도 있다. 먼저 조건 (1)과 (2)로 부터, $\emptyset \in \Sigma$를 얻을 수 있다. 즉, 공집합은 측정가능하다. 측도의 성질에서, 공집합의 측도는 0이다라고 정했음을 상기하자. 그리고 드 모르간 법칙(De Morgan’s Laws; 德·摩根律)에 의해
$$
\bigcap_{i=1}^{\infty}M_i=\bigcap_{i=1}^{\infty} \left(\left( M_i \right)^c\right)^c=\left(\bigcup_{i=1}^{\infty} \left( M_i \right)^c\right)^c
$$
이 성립하므로, 여기에 조건 (2)와 (3)을 이용하면 가산무한개의 교집합도 측정가능하다는 것을 보일 수 있다. 어떤 사람은 이렇게 얻은 2가지 조건도 시그마대수의 조건에 포함시키기도 한다. 하지만 꼭 필요한 조건을 꼽자면 저 3가지이고, 나머지 2개는 자동으로 얻어지는 성질이다.
이제 각 조건을 분석해보자. 조건 (2)와 (3)은 이해하기 쉽다. 조건 (2)는 다음과 같이 생각할 수 있다: 벽에 페인트칠을 할 때, 페인트칠을 한 부분의 면적이 측정가능하면 페인트칠을 하지 않은 부분의 면적도 측정이 가능해야 한다. 조건 (3)은 측도를 정의할 때 이미 생각한 바 있다.
그런데 조건 (1)은 이해하기 어렵다. 갑자기 $X$는 왜 나오고 그것의 멱집합인 $\mathcal{P}(X)$는 왜 또 튀어나온 것인가? $X$의 정체를 측정대상(위 예시의 책장의 높이)이라고 이해하면 쉽다. $X$는 측정대상이므로 $X$는 측정가능해야한다. 그리고 300 cm의 책장을 30 cm자로 여러번 나눠 측정하듯이 $X$를 여러 조각으로 나눈 것들도 모두 측정가능해야 한다.
note: 조건 (2)를 보면 $X$는 전체집합(Universal Set; 全集)처럼 취급하는 것을 알 수 있다. 여집합 $M^c$의 범위를 설정하기 위해 전체집합 $X$를 정했다고 생각해도 된다.
$X$를 여러 조각으로 나눠 측정하는 방법을 모아놓은 것이 바로 $X$의 멱집합이다. 예를 들어 $X=\lbrace 1,2,3 \rbrace$이라고 할 때, 멱집합 $\mathcal{P}(X)$는 다음과 같다.
$$
\mathcal{P}(X)=\lbrace\emptyset, \lbrace 1\rbrace,\lbrace 2\rbrace,\lbrace 3\rbrace,\lbrace 1,2\rbrace,\lbrace 1,3\rbrace,\lbrace 2,3\rbrace ,X \rbrace
$$
다시 말해 책장의 높이를 상, 중, 하의 3부분으로 나누고, 각 부분을 측정한 것, 각 부분을 합쳐놓은 것 모두 측정의 대상이 될 수 있다. 전체 책장의 높이($X$)도 측정 대상이다. 측도의 성질 (1)에 의해 $\emptyset$도 하나의 측정대상이고, 그 측정결과는 0이다.
시그마대수의 정의에 의해 $\Sigma \subseteq \mathcal{P}(X)$이므로 $\Sigma$의 원소는 집합이다. 이제 쇼핑을 하듯이 자유롭게 원소를 담아보자. 시그마대수를 쇼핑카트라고 생각하는 것이다. 이때, $\emptyset$이나 $X$를 제외할 수 있을까? 다시말해, $\Sigma=\lbrace\lbrace 1\rbrace,\lbrace 2\rbrace,\lbrace 1,2\rbrace,\lbrace 1,3\rbrace \rbrace$처럼 정해도 될까?
이렇게 정하면 조건 (1)에서 벌써 막힌다. $X$는 제외할 수 없다. 그런데 조건 (2)에 의해 $\emptyset$도 제외할 수 없다. 즉, 전체집합과 공집합은 필수적으로 담아야 한다.
그렇다면 필수적인 이 둘만 담는 것도 가능할까? 가능하다. $\Sigma=\lbrace \emptyset,X \rbrace$는 조건 (1)(2)(3)모두 막힘 없이 만족시킬 수 있다. 즉, $X$의 가장 작은 시그마대수는 $\lbrace \emptyset,X \rbrace$이다. 여기에 다른 원소들을 추가해서 점점 늘려나가는 것이다. 그 한계, 즉 가장 큰 시그마대수는 무엇일까? $\Sigma \subseteq \mathcal{P}(X)$이므로 가장 큰 시그마대수는 $\mathcal{P}(X)$이다.
그런데 원소를 추가적으로 담을 때, 아무렇게나 담을 수 없다. 예를 들어 $\lbrace 1\rbrace$을 추가하면 조건 (2)에 의해 그것의 여집합인 $\lbrace 2,3\rbrace$도 담아야한다.
만약 $\lbrace 1\rbrace$, $\lbrace 2\rbrace$를 담았으면 조건(2)에 의해 여집합 $\lbrace 2,3\rbrace$, $\lbrace 1,3\rbrace$도 담아야 한다. 그리고 합집합인 $\lbrace 1,2 \rbrace$도 담아야 한다. 합집합의 합집합인 $\lbrace 1,2,3\rbrace$은 이미 $X$라는 이름으로 담겨있다. 그리고 $\lbrace 1,2,3\rbrace^{c}$는 $\emptyset$라는 이름으로 담겨있다. 결국 ‘자유롭게’라는 말이 무색하게 $\lbrace 3\rbrace$빼고 다 담아야 한다.
여기서 알 수 있는 것은, 시그마대수는 측정하려는 전체적인 대상 $X=\lbrace 1,2,3 \rbrace$을 쪼개는 방법을 모아놓는 특별한 규칙 내지는 제약이라는 것이다. 멱집합 $\mathcal{P}(X)$는 $X=\lbrace 1,2,3 \rbrace$를 쪼개는 모든 방법이고 항상 $X$ 그 자신을 포함한다. 시그마대수는 이 방법들중 필요한 것만 골라서 취하는 것인데, 까다로운 골라담기 규칙 (1), (2), (3)으로 인해, $X$자신은 반드시 시그마대수에 포함됨을 알 수 있다. 집합 $X$를 측정하려면 $X$가 측정가능해야함을 고려하면 당연한 사실이다. 결국 $\mathcal{P}(X)$의 핵심적인 역할은 $X$자신이 시그마대수에 포함되도록 돕는것이다.
note: 측도와 시그마대수에 대해 뭔가 추상적인 얘기들을 잔뜩 늘어놓았지만, 시그마대수의 조건은 ‘측정가능한 대상이 마땅히 만족해야할 조건’들이고, 측도의 조건은 ‘측정가능한 대상을 측정했을 때 측정결과가 마땅히 만족해야할 조건’이라고 이해하면 충분할 것이다. 이 글에서 두 개념을 정의할 때는 측도를 먼저 함수로서 정의하고, 그것의 정의역인 시그마대수를 끼워 맞추었다.
#3. 측도공간
전체집합 $X$와 $X$ 위의 시그마대수 $\Sigma$를 묶어서 $(X,\Sigma)$라고 쓰고, 이것을 가측공간(Measurable Space; 可测空间)이라고 한다. 수학에서 공간(Space; 空间)은 수학적 구조(Mathematical Structure; 数学结构), 즉 일종의 규칙이 가미된 집합이라고 보면 된다. 가측공간은 전체집합 $X$에 시그마대수 $\Sigma$라는 규칙을 추가한 것이다. 그리고 시그마대수 $\Sigma$의 원소 $M$은 가측집합(Measurable Set; 可测集)이라고 한다.
전체집합 $X$에 시그마대수 $\Sigma$, 그리고 측도 $\mu$까지 추가해서 $(X,\Sigma,\mu)$를 측도공간(Measure Space; 测度空间)이라고 한다. 즉, 측도공간이란 시그마대수와 측도를 갖춘 집합이다.
note1: 수학적 구조를 이해하기 위한 예시. 실수의 집합 $\mathbb{R}$에 대해, 다음과 같은 구조들을 생각해보자: (1) 연산(Operation; 运算)-덧셈, 뺄셈, 곱셈, 나눗셈 등; (2) 관계(Relation; 关系): 크다, 작다, 같다, 나누어 떨어진다 등. 그리고 이번 글에서는 새로운 구조인 (3) 시그마대수-측정가능성과 (4) 측도-측정결과를 설명했다.
note2: 굳이 이렇게 묶어서 측도공간이라고 표현하는 이유에 대해서, 나는 필통을 떠올렸다. 필통에는 내가 쓸 샤프, 샤프심, 지우개, 자 등 각종 준비물들이 들어있다. ‘시험’이라는 것을 본다면, 이 필통을 들고 시험장에 들어가면 된다. 마찬가지로 ‘측도론’이라는 것을 연구한다면 거기에서 사용될 준비물을 모아놓은 측도공간을 들고가면 되겠다. 측도공간에는 측도론을 기술할 때 유용한 도구인 전체집합, 시그마대수, 측도가 다 들어있다.