수학연구소/연구소2019. 12. 26. 08:00
반응형

조건부기댓값의 건설



확률론에서 조건부기댓값은 어떤 조건 하에서 특정한 확률변수에 대한 기댓값이다. 


\((\Omega,\,\mathcal{F},\,P)\)를 확률공간이라 하고, \(X\)와 \(Z\)를 다음과 같은 확률변수라 하자.$$\begin{align*}X&=x_{1},\,x_{2},\,...,\,x_{m}\\Z&=z_{1},\,z_{2},\,...,\,z_{n}\end{align*}$$\(Z=z_{j}\)일 때 \(X=x_{i}\)일 확률은 다음과 같고$$P(X=x_{i}|Z=z_{j})=\frac{\{P(X=x_{i}\}\cap\{Z=z_{j}\})}{P(Z=z_{j})}$$또한 \(Z=z_{j}\)일 때의 조건부기댓값은 다음과 같다. $$E(X|Z=z_{i})=\sum_{i=1}^{m}{x_{i}P(X=x_{i}|Z=z_{j})}$$*\(\{Z=z_{j}\}\)는 \(\{\omega\in\Omega\,|\,Z(\omega)=z_{j}\}\)이다.

\(Y=E(X|Z)\)인 확률변수 \(Y\)는 다음과 같이 정의할 수 있다.

\(Z(\omega)=z_{j}\)이면, \(Y(\omega)=E(X|Z=z_{j})=y_{j}\)이다. 


\(Z\)에 의해 생성된 \(\sigma-\)체 \(\mathcal{G}=\sigma(Z)\)는 집합 \(\{Z\in B\}\)(\(B\)는 보렐집합)들로 구성되어 있고, 따라서 \(n\)개의 \(\{Z=z_{j}\}\)들의 \(2^{n}\)가지의 합집합들로 구성되어있다. \(Z=z_{j}\,(1\leq j\leq n)\)일 때, \(Y\)는 상수함수이고 더 나아가서 \(\mathcal{G}-\)가측이다. 

다음으로 \(Y\)는 \(Z=z_{j}\)일 때 상수값 \(y_{j}\)를 가지므로 다음 등식이 성립한다.$$\begin{align*}\int_{\{Z=z_{j}\}}{YdP}&=y_{j}P(Z=z_{j})=\sum_{j}{x_{i}P(X=x_{i}|Z=z_{j})P(Z=z_{j})}\\&=\sum_{i}{x_{i}P(\{X=x_{i}\}\cap\{Z=z_{j}\})}\\&=\int_{\{Z=z_{j}\}}{XdP}\end{align*}$$\(G_{j}=\{Z=z_{j}\}\)로 나타내면 위의 식으로부터 \(E(Y\mathbb{1}_{G_{j}})=E(X\mathbb{1}_{G_{j}})\)가 된다. 모든 \(G\in\mathcal{G}\)에 대하여 \(\displaystyle\mathbb{1}_{G}=\sum_{j=1}^{m}{\mathbb{1}_{G_{j}}}\)이므로 \(E(Y\mathbb{1}_{G})=E(X\mathbb{1}_{G})\)이고 다음이 성립한다.$$\int_{G}{YdP}=\int_{G}{XdP}$$조건부기댓값은 다른 관점에서 보면 직교사영이라고 할 수 있다.(아래 그림참고) 

  

\(L^{2}\)확률공간 \((\Omega,\,\mathcal{F},\,P)\)의 확률변수 \(X\)를 부분공간 \(L^{2}(\mathcal{G})\)(\(\mathcal{G}\)는 \(\mathcal{F}\)의 부분 \(\sigma-\)체, \(L^{2}(\mathcal{G})\)는 \(\mathcal{G}-\)가측 \(L^{2}\)함수들의 공간)으로 직교사영한 확률변수 \(Y\)가 조건부기댓값이고, 이때 \(Y\)는 \(E((X-Y)^{2})\)를 최소가 되게 하고, \(Y\)를 \(\mathcal{G}-\)가측 함수 중에서 \(X\)의 '최선의 예측'이라고 할 수 있다. \(X-Y\)는 \(L^{2}(\mathcal{G})\)에 수직이므로 \(L^{2}\)상의 내적의 정의에 의해 모든 \(Z\in L^{2}(\mathcal{G})\)에 대하여$$\langle X-Y,\,Z\rangle=\int_{\Omega}{(X-Y)ZdP}=0$$이고 특히 모든 \(G\in\mathcal{G}\)에 대하여 \(\mathbb{1}_{G}\in L^{2}(\mathcal{G})\)이므로 다음 식이 성립한다.$$\int_{G}{YdP}=\int_{G}{XdP}$$다음과 같이 조건부기댓값을 정의할 수 있다.    


\((\Omega,\,\mathcal{F},\,P)\)를 확률공간이라 하고, \(\mathcal{G}\)를 \(\mathcal{F}\)의 부분 \(\sigma-\)체라고 하자. \(\mathcal{F}-\)가측 확률변수 \(X\)에 대하여 유일한 \(\mathcal{G}-\)가측 확률변수 \(Y\)가 존재해서 모든 \(G\in\mathcal{G}\)에 대하여 다음 등식이 성립한다고 하자.$$\int_{G}{XdP}=\int_{G}{YdP}$$이러한 확률변수 \(Y\)를 \(Y=E(X|\mathcal{G})\)로 나타내고 \(X\)의 \(\mathcal{G}\)에 대한 조건부기댓값(conditional expectation)이라고 한다. 


조건부기댓값의 직관적인 의미는 어떤 실행이 이루어졌을때 표본 \(\omega\)가 선택된 정보는 모든 \(\mathcal{G}-\)가측 확률변수 \(Z\)에 대하여 \(Z(\omega)\)를 값으로 갖는 집합들에 있을 때 주어진 정보에서 \(X(\omega)\)의 기댓값이 \(Y(\omega)=E(X|\mathcal{G})(\omega)\)라는 것이다. 이 상황에서 \(\mathcal{G}=\{\Omega,\,\phi\}\)이면(정보가 없음), 모든 \(\omega\)에 대하여 \(E(X|\mathcal{G})(\omega)=E(X)\)이다. 


앞에서의 정의에 의해 \(X\in L^{2}\)에 대하여 조건부기댓값은 잘 정의되고 다음 조건에 의해 \(X,\,Y\in L^{1}\)이라고 해도 문제없다.$$\int_{G}{YdP}=\int_{G}{XdP}\,(G\in\mathcal{G})$$임의의 \(X\in L^{1}(\mathcal{F})\)에 대하여 \(E(X|\mathcal{G})\in L^{1}(\mathcal{G})\)를 다음과 같이 건설할 것이다. 


다음의 정리들은 건설에 필요한 정리들이다. 


정리 1. \(\{f_{n}\}\)이 가측공간 \((X,\,\mathcal{M})\)상의 가측함수열이면, 다음의 함수들도 가측이다.$$\max_{k\geq n}{f_{n}},\,\min_{k\geq n}{f_{n}},\,\sup_{n\in\mathbb{N}}{f_{n}},\,\inf_{n\in\mathbb{N}}{f_{n}},\,\lim_{n\,\rightarrow\,\infty}{\sup f_{n}},\,\lim_{n\,\rightarrow\,\infty}{\inf f_{n}}$$


정리 2. 단조수렴정리(Monotone Convergence Theorem)

\(\{f_{n}\}\)이 음이 아닌 측도공간 \((X,\,\mathcal{M},\,\mu)\)상의 가측 함수열이고 \(f\)로 단조증가하며 수렴하면, 다음 등식이 성립한다.$$\lim_{n\,\rightarrow\,\infty}{\int_{X}{f_{n}d\mu}}=\int_{X}{fd\mu}$$ 


정리 3. \(E\)가 유한측도를 갖는 집합이고 \(1\leq p\leq q\leq\infty\)이면, \(L^{q}(E)\subset L^{p}(E)\)이다.


* \(a.s.\)는 거의 확실히(almost surely)를 뜻하며, 측도론에서의 거의 어디서나(almost everywhere)와 같은 의미를 갖는다.      


1단계: \(X\)는 음이 아닌 유계 확률변수

\(X\)가 유계이면, \(P(\Omega)=1\)이므로 정리 3에 의해 \(X\in L^{2}(\mathcal{F})\)이고 따라서 조건부기댓값 \(Y\)를 갖는다. 

\(Y\geq0\,P-a.s.\)임을 보일 것이다. 이를 보이기 위해 \(Y\)가 음의 값을 가질 확률이 0보다 크다고 하자. 그러면 \(n\geq1\)이 존재해서 \(\displaystyle G=\left\{Y<-\frac{1}{n}\right\}\in\mathcal{G}\)에 대해 \(P(G)>0\)이고 따라서 다음의 부등식이 성립한다.$$\int_{G}{YdP}<-\frac{1}{n}P(G)<0$$그러나 \(\displaystyle\int_{G}{YdP}=\int_{G}{XdP}\geq0\)이어야 하므로 모순이다.   


2단계: 음이 아닌 \(X\in L^{1}\)로 근사 

\(X\in L^{1}(\mathcal{F})\,(X\geq0)\)를 선택하고 \(n\geq1\)에 대해 \(X_{n}=\min\{X,\,n\}\)이라 하자. 그러면 \(X_{n}\)은 유계이고 음이 아니므로 \(X_{n}\)을 1단계에 적용해 \(Y_{n}\in L^{2}(\mathcal{G})\)를 얻어내는데, 이때 식 \(\displaystyle\int_{G}{Y_{n}dP}=\int_{G}{X_{n}dP}\)가 성립한다. 

\(\{X_{n}\}\)은 증가하므로 모든 \(G\in\mathcal{G}\)에 대하여 \(\displaystyle\left\{\int_{G}{X_{n}dP}\right\}\)도 증가하고 따라서 모든 \(G\in\mathcal{G}\)에 대해 \(\displaystyle\int_{G}{Y_{n}dP}\leq\int_{G}{Y_{n+1}dP}\)이므로 \(Y_{n+1}-Y_{n}\geq0-a.s.\)이고 이것은 \(\{Y_{n}\}\)이 \(a.s.\)증가함을 뜻한다.   


3단계: 극한 취하기

모든 \(\omega\in\Omega\)에 대하여 \(\displaystyle Y(\omega)=\lim_{n\,\rightarrow\,\infty}{\sup Y_{n}(\omega)}\)라고 하자. 정리 1에 의해 \(Y\)는 \(\mathcal{G}-\)가측이다. 게다가 \(G\in\mathcal{G}\)와 모든 \(n\)에 대하여 다음 부등식이 성립하고$$\int_{G}{Y_{n}dP}=\int_{G}{X_{n}dP}\leq\int_{G}{XdP}<\infty$$단조수렴정리에 의해 \(\displaystyle\left\{\int_{G}{Y_{n}dP}\right\}\)는 \(\displaystyle\int_{G}{YdP}\)로 증가하면서 수렴하고 \(\displaystyle\int_{G}{YdP}<\infty\)이므로 \(Y\in L^{1}(\mathcal{G})\)이다. 

반면에 \(\displaystyle\int_{G}{Y_{n}dP}=\int_{G}{X_{n}dP}\)이고 \(\displaystyle\left\{\int_{G}{X_{n}dP}\right\}\)도 \(\displaystyle\int_{G}{XdP}\)로 증가하면서 수렴하므로 모든 \(G\in\mathcal{G}\)에 대해 \(\displaystyle\int_{G}{YdP}=\int_{G}{XdP}\)이다.   


4단계: 일반적인 \(X\) 

일반적으로 \(X=X^{+}-X^{-}\)이고, 3단계에 의해 \(Y^{+},\,Y^{-}\in L^{1}(\mathcal{G})\)가 존재해서 모든 \(G\in\mathcal{G}\)에 대해$$\int_{G}{Y^{+}dP}=\int_{G}{X^{+}dP},\,\int_{G}{Y^{-}dP}=\int_{G}{X^{-}dP}$$이고 이 두 식들을 서로 빼서 식 \(\displaystyle\int_{G}{YdP}=\int_{G}{XdP}\)를 얻고, 이때 \(Y=Y^{+}-Y^{-}\in L^{1}(\mathcal{G})\)이다.  


5단계: 유일성  

\(Z\in L^{1}(\mathcal{G})\)도 모든 \(G\in\mathcal{G}\)에 대해 식 \(\displaystyle\int_{G}{ZdP}=\int_{G}{XdP}\)를 만족하면, \(Z=Y\,P-a.s.\)이다.  


5단계에서 \(Y\)를 \(E(X|\mathcal{G})\)의 버전(version)이라고 한다. \(L^{1}(\Omega,\,\mathcal{G},\,P)\)의 정의에 의해 유일성은 모든 버전들이 다음과 같이 정의되는 동치관계에 속함을 보여준다.$$f\equiv g\,\Leftrightarrow\,P(\{\omega\in\Omega\,|\,f(\omega)\neq g(\omega)\})=0$$

참고자료: 

Measure, Integral and Probability, Capinski, Kopp, Springer

Probability with Martingales, Williams, Cambridge University Press  

반응형

'수학연구소 > 연구소' 카테고리의 다른 글

이차곡선(타원, 포물선, 쌍곡선)의 광학적 성질  (0) 2020.09.16
르베그 적분에서의 근사  (0) 2020.03.17
최소제곱해  (0) 2020.02.27
오일러-마스케로니 상수  (0) 2019.09.16
자연대수 e  (0) 2019.09.08
Posted by skywalker222