그 동안 사건, 결과, 확률 등의 용어를 엄밀한 정의 없이 써왔는데, 사실 이 용어들의 명확한 정의를 위해서는 확률공간(Probability Space; 概率空间)이라는 개념을 알아야 한다. 확률공간은 확률론(Probability Theory; 概率论)을 기술하는데 있어서 가장 기초적인 내용이다. 확률론을 제대로 공부하려면 반드시 알아두어야 하기에 시간을 내서 정리했다.
그런데 확률공간은 여러 측도공간(Measure Space; 测度空间) 중 한 종류이다. 그러므로 확률공간의 이해를 위해서 먼저 측도공간이 무엇인지 감을 잡아야한다. 측도공간은 전체집합, 시그마대수, 그리고 측도를 모아놓은 것으로 측도론(Measure Theory; 测度论)의 핵심이다.
내용이 난해하고 추상적이지만 차근차근 정리해보자.
#1. 측도
측정가능한 대상의 모임 Σ를 생각하자. 이제 Σ의 원소인 측정가능한 대상을 측정한 결과가 필요할 것이다. 일상생활에서의 각종 측정결과들을 떠올려보면 측정결과는 숫자로 나타내는 편이 좋다. 그러므로 다음과 같은 함수를 생각하자.
μ:Σ→R
즉, ‘측정결과’를 수학적으로 이야기한다면, ‘측정가능한 대상을 숫자로 바꿔주는 함수’라고 할 수 있다. 이 ‘측정결과’는 어떤 성질을 가져야할까? 우리의 일상생활의 경험에 의거하여 ‘측정결과’에 알맞은 성질을 부여해주자.
(1) 비음수(non-Negative; 非负性): 온도 같은 측정결과는 음수도 가능하지만, 키, 몸무게, 길이, 부피, 면적 등 많은 경우에서 측정결과는 양수 또는 0이었다. 그러므로 다음과 같은 성질을 부여하자.
∀M∈Σ:μ(M)≥0
(2) 공집합의 측도(Measure of Empty Set; 空集的测度): 우리는 흔히 ‘없다’는 것에 0이라는 숫자를 부여한다. 예를 들어 텅빈 물병을 두고 “물병에 물이 얼마만큼 남았는가?”라는 질문에 “물이 없다.”라고 답하기도 하지만 “물이 0 ml 남았다.”라고 답할 수도 있다. 좀 특이한 화법이지만 아무튼 의미전달상 문제가 없다. 수학적으로 표현하면 ‘공집합의 측정결과는 0이다’라고 할 수 있다. 즉, 다음과 같은 성질을 부여하자.
μ(∅)=0
(3) 가산가법성(Countable Additivity; 可数可加性): 이번에는 30 cm 자로 책장의 높이를 잰다고 해보자. 책장의 높이는 보통 30 cm가 넘으므로, 사다리를 타고 올라가서 책장의 최상단부터 아래로 30 cm를 재고, 그 부분을 표시한 후 다시 겹치지 않게 30 cm을 재는 방식을 반복한다. 책장의 높이가 300 cm라고 해보자. 이 방식을 10번 반복하면 책장의 높이의 측정결과를 얻을 수 있다. 그런데 300 cm 줄자를 가져와서 한꺼번에 책장의 높이를 재도 같은 결과를 얻는다. 즉, 측정결과는 합칠 수 있어야 하고, 겹치지 않게 측정한 값을 합친 것이 올바른 측정결과가 되어야한다. 수학적으로는 다음과 같이 나타낸다.
μ(∞⋃i=1Mi)=∞∑i=1μ(Mi), Mi∩Mj=∅,i≠j
note: 겹치지 않는다는 것을 Mi∩Mj=∅,i≠j대신에 여러 집합 중 임의의 두 집합이 서로소(Pairwise Disjoint; 两两不相交)라고 표현하기도 한다. 상호배제적(Mutually Exclusive; 互斥)도 같은 말이다.
이상의 3가지 성질은 ‘측정결과’라면 마땅히 가져야할 성질이다. 이제 표현을 고급스럽게 다듬어서, 다음과 같이 측도라는 것을 정의한다.
Σ를 측정가능한 대상의 모임이라고 생각하자. 함수 μ:Σ→R이 다음 조건을 만족하면, μ를 Σ 위의 측도(Measurement; 测度)라고 한다.
(1) 비음수: ∀M∈Σ:μ(M)≥0
(2) 공집합의 측도: μ(∅)=0
(3) 가산가법성: μ(⋃∞i=1Mi)=∑∞i=1μ(Mi), Mi∩Mj=∅,i≠j
note: 조건 (1)을 μ:Σ→[0,∞)로 정의하여 생략할 수도 있다. 조건 (3)의 가산가법성을 시그마 가법성(σ-Additivity)이라고도 한다.
#2. 시그마대수
측도를 정의할 때, Σ를 측정가능한 대상의 모임이라고 생각했다. 측도를 엄밀히 정의했으니 이제 ‘측정가능한 대상의 모임’도 엄밀히 정의해보자. 정의할 때, 앞서 정의한 측도의 정의와 잘 맞도록 해야하는 것을 염두에 두자.
집합 X와 그것의 멱집합(Power Set; 幂集) P(X)을 생각하자. 집합 Σ⊆P(X)에 대해, 다음이 성립하면 Σ를 X 위의 시그마대수(σ-Algebra; σ代数)라고 한다.
(1) X∈Σ
(2) M∈Σ이면 Mc:=X−M∈Σ이다.
(3) Mi∈Σ,i=1,2,⋯이면 ⋃∞i=1Mi∈Σ이다.
note1: 조건 (2)와 (3)을 각각 여집합에 대해 닫혀있다, 가산무한개의 합집합(Countably Infinite Unions; 可数无限个并集)에 대해 닫혀있다(Closed; 封闭)라고 한다.
note2: 조건 (3)을 약화시켜서 유한개의 합집합(Finite Unions; 有限个并集)으로 바꾼 것을 대수(Algebra; 代数)라고 한다. 즉, 시그마 대수에서 시그마는 가산무한개를 뜻한다.
시그마대수 Σ를 ‘측정가능한 대상을 모아놓은 것’이라고 했다. 이렇게 생각하면 위에서 열거한 조건들은 다음과 같이 쓸 수 있다.
(1) X는 측정가능하다.
(2) M이 측정가능하면 그것의 여집합 Mc:=X−M도 측정가능하다.
(3) 가산무한개의 Mi,i=1,2,⋯가 측정가능하면 합집합 ⋃∞i=1Mi도 측정가능하다.
시그마대수의 이 3가지 조건으로부터 다른 성질을 유도할 수도 있다. 먼저 조건 (1)과 (2)로 부터, ∅∈Σ를 얻을 수 있다. 즉, 공집합은 측정가능하다. 측도의 성질에서, 공집합의 측도는 0이다라고 정했음을 상기하자. 그리고 드 모르간 법칙(De Morgan’s Laws; 德·摩根律)에 의해
∞⋂i=1Mi=∞⋂i=1((Mi)c)c=(∞⋃i=1(Mi)c)c
이 성립하므로, 여기에 조건 (2)와 (3)을 이용하면 가산무한개의 교집합도 측정가능하다는 것을 보일 수 있다. 어떤 사람은 이렇게 얻은 2가지 조건도 시그마대수의 조건에 포함시키기도 한다. 하지만 꼭 필요한 조건을 꼽자면 저 3가지이고, 나머지 2개는 자동으로 얻어지는 성질이다.
이제 각 조건을 분석해보자. 조건 (2)와 (3)은 이해하기 쉽다. 조건 (2)는 다음과 같이 생각할 수 있다: 벽에 페인트칠을 할 때, 페인트칠을 한 부분의 면적이 측정가능하면 페인트칠을 하지 않은 부분의 면적도 측정이 가능해야 한다. 조건 (3)은 측도를 정의할 때 이미 생각한 바 있다.
그런데 조건 (1)은 이해하기 어렵다. 갑자기 X는 왜 나오고 그것의 멱집합인 P(X)는 왜 또 튀어나온 것인가? X의 정체를 측정대상(위 예시의 책장의 높이)이라고 이해하면 쉽다. X는 측정대상이므로 X는 측정가능해야한다. 그리고 300 cm의 책장을 30 cm자로 여러번 나눠 측정하듯이 X를 여러 조각으로 나눈 것들도 모두 측정가능해야 한다.
note: 조건 (2)를 보면 X는 전체집합(Universal Set; 全集)처럼 취급하는 것을 알 수 있다. 여집합 Mc의 범위를 설정하기 위해 전체집합 X를 정했다고 생각해도 된다.
X를 여러 조각으로 나눠 측정하는 방법을 모아놓은 것이 바로 X의 멱집합이다. 예를 들어 X={1,2,3}이라고 할 때, 멱집합 P(X)는 다음과 같다.
P(X)={∅,{1},{2},{3},{1,2},{1,3},{2,3},X}
다시 말해 책장의 높이를 상, 중, 하의 3부분으로 나누고, 각 부분을 측정한 것, 각 부분을 합쳐놓은 것 모두 측정의 대상이 될 수 있다. 전체 책장의 높이(X)도 측정 대상이다. 측도의 성질 (1)에 의해 ∅도 하나의 측정대상이고, 그 측정결과는 0이다.
시그마대수의 정의에 의해 Σ⊆P(X)이므로 Σ의 원소는 집합이다. 이제 쇼핑을 하듯이 자유롭게 원소를 담아보자. 시그마대수를 쇼핑카트라고 생각하는 것이다. 이때, ∅이나 X를 제외할 수 있을까? 다시말해, Σ={{1},{2},{1,2},{1,3}}처럼 정해도 될까?
이렇게 정하면 조건 (1)에서 벌써 막힌다. X는 제외할 수 없다. 그런데 조건 (2)에 의해 ∅도 제외할 수 없다. 즉, 전체집합과 공집합은 필수적으로 담아야 한다.
그렇다면 필수적인 이 둘만 담는 것도 가능할까? 가능하다. Σ={∅,X}는 조건 (1)(2)(3)모두 막힘 없이 만족시킬 수 있다. 즉, X의 가장 작은 시그마대수는 {∅,X}이다. 여기에 다른 원소들을 추가해서 점점 늘려나가는 것이다. 그 한계, 즉 가장 큰 시그마대수는 무엇일까? Σ⊆P(X)이므로 가장 큰 시그마대수는 P(X)이다.
그런데 원소를 추가적으로 담을 때, 아무렇게나 담을 수 없다. 예를 들어 {1}을 추가하면 조건 (2)에 의해 그것의 여집합인 {2,3}도 담아야한다.
만약 {1}, {2}를 담았으면 조건(2)에 의해 여집합 {2,3}, {1,3}도 담아야 한다. 그리고 합집합인 {1,2}도 담아야 한다. 합집합의 합집합인 {1,2,3}은 이미 X라는 이름으로 담겨있다. 그리고 {1,2,3}c는 ∅라는 이름으로 담겨있다. 결국 ‘자유롭게’라는 말이 무색하게 {3}빼고 다 담아야 한다.
여기서 알 수 있는 것은, 시그마대수는 측정하려는 전체적인 대상 X={1,2,3}을 쪼개는 방법을 모아놓는 특별한 규칙 내지는 제약이라는 것이다. 멱집합 P(X)는 X={1,2,3}를 쪼개는 모든 방법이고 항상 X 그 자신을 포함한다. 시그마대수는 이 방법들중 필요한 것만 골라서 취하는 것인데, 까다로운 골라담기 규칙 (1), (2), (3)으로 인해, X자신은 반드시 시그마대수에 포함됨을 알 수 있다. 집합 X를 측정하려면 X가 측정가능해야함을 고려하면 당연한 사실이다. 결국 P(X)의 핵심적인 역할은 X자신이 시그마대수에 포함되도록 돕는것이다.
note: 측도와 시그마대수에 대해 뭔가 추상적인 얘기들을 잔뜩 늘어놓았지만, 시그마대수의 조건은 ‘측정가능한 대상이 마땅히 만족해야할 조건’들이고, 측도의 조건은 ‘측정가능한 대상을 측정했을 때 측정결과가 마땅히 만족해야할 조건’이라고 이해하면 충분할 것이다. 이 글에서 두 개념을 정의할 때는 측도를 먼저 함수로서 정의하고, 그것의 정의역인 시그마대수를 끼워 맞추었다.
#3. 측도공간
전체집합 X와 X 위의 시그마대수 Σ를 묶어서 (X,Σ)라고 쓰고, 이것을 가측공간(Measurable Space; 可测空间)이라고 한다. 수학에서 공간(Space; 空间)은 수학적 구조(Mathematical Structure; 数学结构), 즉 일종의 규칙이 가미된 집합이라고 보면 된다. 가측공간은 전체집합 X에 시그마대수 Σ라는 규칙을 추가한 것이다. 그리고 시그마대수 Σ의 원소 M은 가측집합(Measurable Set; 可测集)이라고 한다.
전체집합 X에 시그마대수 Σ, 그리고 측도 μ까지 추가해서 (X,Σ,μ)를 측도공간(Measure Space; 测度空间)이라고 한다. 즉, 측도공간이란 시그마대수와 측도를 갖춘 집합이다.
note1: 수학적 구조를 이해하기 위한 예시. 실수의 집합 R에 대해, 다음과 같은 구조들을 생각해보자: (1) 연산(Operation; 运算)-덧셈, 뺄셈, 곱셈, 나눗셈 등; (2) 관계(Relation; 关系): 크다, 작다, 같다, 나누어 떨어진다 등. 그리고 이번 글에서는 새로운 구조인 (3) 시그마대수-측정가능성과 (4) 측도-측정결과를 설명했다.
note2: 굳이 이렇게 묶어서 측도공간이라고 표현하는 이유에 대해서, 나는 필통을 떠올렸다. 필통에는 내가 쓸 샤프, 샤프심, 지우개, 자 등 각종 준비물들이 들어있다. ‘시험’이라는 것을 본다면, 이 필통을 들고 시험장에 들어가면 된다. 마찬가지로 ‘측도론’이라는 것을 연구한다면 거기에서 사용될 준비물을 모아놓은 측도공간을 들고가면 되겠다. 측도공간에는 측도론을 기술할 때 유용한 도구인 전체집합, 시그마대수, 측도가 다 들어있다.