반응형

[확률적분] 3. 조건부기댓값, 마팅게일



\((\Omega,\,\mathcal{F},\,P)\)를 고정된 확률공간이라 하자. \(1\leq p<\infty\)에 대하여 \(L^{p}(\Omega)\)를 \(E(|X|^{p})<\infty\)인 확률변수 \(X\)들의 공간이라고 하면, 이 공간은 다음의 노름을 갖는 바나흐공간이다.$$\|X\|_{p}=\left(E(|X|^{p})\right)^{\frac{1}{p}}$$특히 \(L^{2}(\Omega)\)는 힐베르트공간이고, 여기서는 노름이 \(\|X\|_{1}=E(|X|)\)인 \(L^{1}(\Omega)\)공간에 대해 다룰 것이고, 가끔 \(\sigma-\)체 \(\mathcal{F}\)를 강조하기 위해 \(L^{1}(X,\,\mathcal{F})\)로 나타낼 것이다. 

\(\mathcal{G}\)를 \(\mathcal{F}\)의 부분 \(\sigma-\)체, \(X\in L^{1}(\Omega)\)라 하고, \(\mathcal{G}\)에서의 실함수 \(\mu\)를 다음과 같이 정의하자.$$\mu(A)=\int_{A}{X(\omega)dP(\omega)},\,A\in\mathcal{G}$$이때 모든 \(A\in\mathcal{G}\)에 대하여 \(\displaystyle|\mu(A)|\leq\int_{A}{|X|dP}\leq\int_{\Omega}{|X|dP}=E(|X|)\)이고 \(\mu\)는 다음의 세 조건들을 만족한다.

(a) \(\mu(\phi)=0\) 

(b) 서로소인 \(A_{n}\in\mathcal{G}\,(n\in\mathbb{N})\)들에 대해 \(\displaystyle\mu\left(\bigcup_{n=1}^{\infty}{A_{n}}\right)=\sum_{n=1}^{\infty}{\mu(A_{n})}\) 

(c) \(P(A)=0\)이고 \(A\in\mathcal{G}\)이면, \(\mu(A)=0\)이다.  

조건 (a), (b)를 만족하는 함수 \(\mu:\mathcal{G}\,\rightarrow\,\mathbb{R}\)을 \((\Omega,\,\mathcal{G})\)에서의 부호측도(signed measure)라고 한다. 부호측도 \(\mu\)가 \(P\)에 대해 절대연속(absolutely continuous)이라는 것은 조건 (c)가 성립하는 것이다. 그러므로 앞에서 정의된 함수 \(\mu\)는 \((\Omega,\,\mathcal{G})\)에서 부호측도이고, \(P\)에 대해 절대연속이다. 

부호측도 \(\mu\)에 라돈-니코딤 정리를 적용하면 \(\mathcal{G}-\) 가측함수 \(Y\)를 얻고 \(E(|Y|)<\infty\)이며 다음이 성립한다.$$\mu(A)=\int_{A}{Y(\omega)dP(\omega)},\,\forall A\in\mathcal{G}$$\(\tilde{Y}\)를 또다른 이러한 확률변수라 하자. 즉 \(\mathcal{G}-\)가측이고 \(E(|\tilde{Y}|)<\infty\)이며 다음이 성립한다.$$\mu(A)=\int_{A}{\tilde{Y}(\omega)dP(\omega)},\,\forall A\in\mathcal{G}$$그러면 모든 \(A\in\mathcal{G}\)에 대하여 \(\displaystyle\int_{A}{(Y-\tilde{Y})dP}=0\)이고 이것은 \(Y=\tilde{Y}\,a.s.\)를 뜻한다. 

앞의 결과들은 조건부기댓값이 존재하고 유일함을 보여준다. 


\(X\in L^{1}(\Omega,\,\mathcal{F})\), \(\mathcal{G}\)를 \(\mathcal{F}\)의 부분 \(\sigma-\)체 라고 하자. \(\mathcal{G}\)에서의 \(X\)의 조건부기댓값(conditional expectation)은 다음의 조건들을 만족하는 유일한 확률변수 \(Y\)로 정의된다. 

(1) \(Y\)는 \(\mathcal{G}-\)가측이다. 

(2) 모든 \(A\in\mathcal{G}\)에 대하여 \(\displaystyle\int_{A}{XdP}=\int_{A}{YdP}\)이다. 

\(\mathcal{G}\)에서의 \(X\)의 조건부기댓값을 \(E(X|\mathcal{G})\)로 나타낸다. 주의할 점은 \(\mathcal{G}-\)가측성인 조건 (1)은 중대한 필수조건이다. 만약 조건 (1)이 없다면 조건 (2)를 만족하는 \(Y=X\)를 선택할 수 있으나 앞의 정의가 의미없게 된다(지수함수의 밑이 1인 경우와 비슷하다). 조건부기댓값 \(E(X|\mathcal{G})\)는 주어진 정보 \(\mathcal{G}\)에서 \(X\)의 최선의 추측을 나타낸다. 


\(\mathcal{G}=\{\emptyset,\,\Omega\}\), \(X\in L^{1}(\Omega)\), \(Y=E(X|\mathcal{G})\)라 하자. \(Y\)가 \(\mathcal{G}-\)가측이므로 \(Y\)는 상수이어야 한다. 즉 \(Y=c\)라 하자. 그러면 조건부기댓값의 정의의 조건 (2)에서 \(A=\Omega\)라고 하면$$\int_{\Omega}{XdP}=\int_{\Omega}{YdP}=c$$이어야 하고 따라서 \(c=E(X)\)이고 \(E(X|\mathcal{G})=E(X)\)이다. 이 결론은 직관적으로 분명한데 \(\sigma-\)체 \(\mathcal{G}=\{\phi,\,\Omega\}\)에는 정보가 없기 때문에 \(X\)의 최선의 추측은 그 기댓값이다.  


\(\displaystyle\Omega=\bigcup_{n=1}^{\infty}{A_{n}}\)을 서로소인 합집합이고 \(P(A_{n})>0\), \(\mathcal{G}=\sigma\{A_{1},\,A_{2},\,...\}\) 즉 \(A_{n}\)들로 생성되는 \(\sigma-\)체, \(X\in L^{1}(\Omega)\), \(Y=E(X|\mathcal{G})\)라 하자. \(Y\)는 \(\mathcal{G}-\)가측이므로 상수이어야 하고, 이를 \(A_{n}\)에서 \(c_{n}\)이라 하자. 조건부기댓값의 정의의 조건 (2)에서 \(A=A_{n}\)이라고 하면 \(c_{n}\)이 상수이므로 \(\displaystyle c_{n}P(A_{n})=\int_{A_{n}}{XdP}\)이고 따라서 \(E(X|\mathcal{G})\)는 다음과 같다.$$E(X|\mathcal{G})=\sum_{n=1}^{\infty}{\left(\frac{1}{P(A_{n})}\int_{A_{n}}{XdP}\right)\mathbb{1}_{A_{i}}}$$여기서 \(\mathbb{1}_{A_{i}}\)는 \(A_{n}\)의 특성함수이다.   


\(Z\)를 이산확률변수로 값 \(a_{1},\,a_{2},\,...\)를 갖는다고 하자. \(\sigma(Z)\)를 \(Z\)에 의해 생성되는 \(\sigma-\)체라고 하면$$\sigma(Z)=\sigma(A_{1},\,A_{2},\,...)\,(A_{n}=\{\omega\,|\,Z(\omega)=a_{n}\})$$이고 \(X\in L^{1}(\Omega)\)라고 하자. 그러면 앞에서처럼 다음과 같이 나타낼 수 있고,$$E(X|\sigma(z))\sum_{n=1}^{\infty}{\left(\frac{1}{P(A_{n})}\int_{A_{n}}{XdP}\right)\mathbb{1}_{A_{n}}}$$이 것을 \(E(X|\sigma(Z))=\theta(Z)\)로 나타낼 수 있으며 \(\theta\)는 다음과 같이 정의되는 함수이다.$$\theta(x)=\begin{cases}\displaystyle\frac{1}{P(Z=a_{n})}\int_{\{\omega\,|\,Z(\omega)=a_{n}\}}{XdP}&\,(x=a_{n})\\0&\,(x\notin\{a_{1},\,a_{2},\,...\})\end{cases}$$조건부기댓값 \(E(X|\mathcal{G})\)는 확률변수이고, \(E(X)\)는 실수이다.       


다음은 조건부기댓값의 성질들이다. 

(1) \(E(E(X|\mathcal{G}))=E(X)\)  

(2) \(X\)가 \(\mathcal{G}-\)가측이면, \(E(X|\mathcal{G})=X\)이다.   

(3) \(X\)와 \(\mathcal{G}\)가 독립이면, \(E(X|\mathcal{G})=E(X)\)이다.  

(4) \(Y\)가 \(\mathcal{G}-\)가측이고 \(E(|XY|)<\infty\)이면, \(E(XY|\mathcal{G})=YE(X|\mathcal{G})\)이다. 

(5) \(\mathcal{H}\)가 \(\mathcal{G}\)의 부분 \(\sigma-\)체 이면, \(E(X|\mathcal{H})=E(E(X|\mathcal{G})|\mathcal{H})\)이다.   

증명: 

(1): 정의에 의해 다음으로부터 성립한다.$$E(E(X|\mathcal{G}))=\int_{\Omega}{E(X|\mathcal{G})dP}=\int_{\Omega}{XdP}=E(X)$$(2): \(X\)를 \(\mathcal{G}-\)가측이라 하자. \(X\)와 \(E(X|\mathcal{G})\)가 \(\mathcal{G}-\)가측이고, 모든 \(G\in\mathcal{G}\)에 대해 다음이 성립하면,$$\int_{G}{E(X|\mathcal{G})dP}=\int_{G}{XdP}$$이 두 피적분함수들은 a.s 같고, 따라서 \(E(X|\mathcal{G})=X\)이다. 

(3): \(X\)를 \(\mathcal{G}\)와 독립이라고 하자. 임의의 \(G\in\mathcal{G}\)에 대하여 \(\mathbb{1}_{G}\)와 \(X\)는 서로 독립인 확률변수이고$$\int_{G}{XdP}=E(X\mathbb{1}_{G})=E(X)E(\mathbb{1}_{G})=\int_{G}{E(X)dP}$$이므로 \(E(X|\mathcal{G})=E(X)\)이고 이때 \(E(X)\)는 상수이다.   

(4): 적당한 \(E\in\mathcal{G}\)에 대해 \(Y=\mathbb{1}_{G}\)라고 하자. 그러면 임의의 \(G\in\mathcal{G}\)에 대해$$\int_{G}{\mathbb{1}_{E}E(X|\mathcal{G})dP}=\int_{E\cap G}{E(X|\mathcal{G})dP}=\int_{E\cap G}{XdP}=\int_{G}{\mathbb{1}_{E}XdP}$$이므로 \(\mathbb{1}_{E}E(X|\mathcal{G})\)는 이 조건을 만족하고 따라서 \(Y=\mathbb{1}_{E}\,(E\in\mathcal{G})\)일 때 \(E(XY|\mathcal{G})=YE(X|\mathcal{G})\)가 성립한다. 일반적인 경우, \(Y=Y^{+}-Y^{-}\,(Y^{+},\,Y^{-}\geq0)\)이고, \(Y^{+}\)와 \(Y^{-}\)를 계단함수열의 극한으로 정의할 수 있으므로 이 성질은 일반적인 경우에 대해서도 성립한다.  

(5): 모든 \(G\in\mathcal{G}\)에 대하여 \(\displaystyle\int_{G}{E(X|\mathcal{G})dP}=\int_{G}{XdP}\)이고 모든 \(H\in\mathcal{H}\subset\mathcal{G}\)에 대하여 \(\displaystyle\int_{H}{E(X|\mathcal{H})dP}=\int_{H}{XdP}\)이므로 \(H\in\mathcal{H}\)에 대해 \(\displaystyle\int_{H}{E(X|\mathcal{G})dP}=\int_{H}{E(X|\mathcal{H})dP}\)이다. 따라서 \(E(X|\mathcal{H})\)는 \(\mathcal{H}\)에서의 \(E(X|\mathcal{G})\)의 조건부기댓값이고 \(E(X|\mathcal{H})=E(E(X|\mathcal{G})|\mathcal{H})\)이다.


조건부기댓값은 적분으로 정의되고, 적분의 성질로부터 다음의 성질들이 성립한다.

(6) \(X,\,Y\in L^{1}(\Omega)\)이고 \(X\leq Y\)이면, \(E(X|\mathcal{G})\leq E(Y|\mathcal{G})\)이다.   

(7) \(|E(X|\mathcal{G})|\leq E(|X|\,|\mathcal{G})\) 

(8) 모든 \(a,\,b\in\mathbb{R}\)와 \(X,\,Y\in L^{1}(\Omega)\)이면, \(E(aX+bY|\mathcal{G})=aE(X|\mathcal{G})+bE(Y|\mathcal{G})\)이다.  

* 성질 (7)과 (8)로부터 조건부기댓값 \(E(\cdot|\mathcal{G})\)는 \(L^{1}(\Omega,\,\mathcal{F})\)에서 \(L^{1}(\Omega,\,\mathcal{G})\)로의 유계 선형연산자임을 알 수 있다. 

(9) (조건부 파투의 보조정리) \(X_{n}(\geq0)\in L^{1}(\Omega)\,(n\in\mathbb{N})\), \(\displaystyle\lim_{n\,\rightarrow\,\infty}{X_{n}}\in L^{1}(\Omega)\)라 하자. 그러면 다음의 부등식이 성립한다.$$E\left(\lim_{n\,\rightarrow\,\infty}{\inf X_{n}}\mid\,\mathcal{G}\right)\leq\lim_{n\,\rightarrow\,\infty}{\inf E(X_{n}|\mathcal{G})}$$(10) (조건부 단조수렴정리) \(0\leq X_{1}\leq X_{2}\leq\cdots\leq X_{n}\leq\cdots\), \(\displaystyle X=\lim_{n\,\rightarrow\,\infty}{X_{n}}\in L^{1}(\Omega)\)라 하자. 그러면 다음이 성립한다.$$E(X|\mathcal{G})=\lim_{n\,\rightarrow\,\infty}{E(X_{n}|\mathcal{G})}$$(11) (조건부 르베그 지배수렴정리) \(|X_{n}|\leq Y\), \(Y\in L^{1}(\Omega)\), \(\displaystyle X=\lim_{n\,\rightarrow\,\infty}{X_{n}}\)이 a.s. 존재한다고 하자. 그러면 다음이 성립한다.$$E(X|\mathcal{G})=\lim_{n\,\rightarrow\,\infty}{E(X_{n}|\mathcal{G})}$$(12) (조건부 젠센 부등식) \(X\in L^{1}(\Omega)\), \(\phi\)를 \(\mathbb{R}\)상의 볼록함수(\(x,\,y\in\mathbb{R}\)와 \(0\leq\lambda\leq1\)에 대해 \(\phi(\lambda x+(1-\lambda)y)\leq\lambda\phi(x)+(1-\lambda)\phi(y)\)), \(\phi(X)\in L^{1}(\Omega)\)라고 하자. 그러면 다음의 부등식이 성립한다.$$\phi(E(X|\mathcal{G}))\leq E(\phi(X)|\mathcal{G})$$\(f\in L^{2}([a,\,b])\)라 하고 다음의 확률과정을 고려하자.$$M_{t}=\int_{a}^{t}{f(s)dB(s)}\,a\leq t\leq b$$\(M_{t}\)는 마팅게일임을 보일 것이고, \(T\)를 실수 구간 또는 양의 정수들의 집합이라고 하겠다. 


\(T\)에서의 여과(filtration)는 \(\sigma-\)체의 증가집합족 \(\{\mathcal{F}_{t}\,|\,t\in T\}\)이다. 확률과정 \(X_{t},\,t\in T\)가 \(\{\mathcal{F}_{t}\,|\,t\in T\}\)에 적합(adapted)하다는 것은 모든 \(t\)에 대하여 \(X_{t}\)가 \(\mathcal{F}_{t}-\)가측인 것이다.


\(\sigma-\)체 \(\mathcal{F}\)가 완비(complete)라는 것은 \(A\in\mathcal{F}\)이고 \(P(A)=0\)이면, 임의의 \(B\subset A\)에 대해 \(B\in\mathcal{F}\)가 성립하는 것이다.  


\(X_{t}\)가 여과 \(\{\mathcal{F}_{t}\}\)에 적합한 확률과정이고 모든 \(t\in T\)에 대해 \(E(|X_{t}|)<\infty\)라 하자. \(X_{t}\)가 \(\{\mathcal{F}_{t}\}\)에 대해 마팅게일(martingale)이라는 것은 \(T\)에서의 임의의 \(s\leq t\)에 대해 다음이 성립하는 것이다.$$E(X_{t}|\mathcal{F}_{s})=X_{s}\,a.s.$$여기서의 여과는 구체적으로 정의되지 않았고, \(\mathcal{F}_{t}=\sigma(X_{s},\,s\leq t)\)라고 하면 된다. 

마팅게일의 개념은 평균이 0인 독립동일분포열 \(\{X_{n}\}\)들의 부분합의 열의 일반화이다. \(S_{n}=X_{1}+\cdots+X_{n}\)이라 하자. 그러면 \(\{S_{n}\}\)은 마팅게일이다. 

열마팅게일(submartingale)과 우마팅게일(supermartingale)은 마팅게일의 정의에서 각각 부등호 \(\geq\), \(\leq\)로 대체한 것이다. 즉 \(T\)상의 임의의 \(s\leq t\)에 대해$$\begin{align*}E(X_{t}|\mathcal{F}_{s})&\geq X_{s}\,a.s.\,(\text{submartingale})\\E(X_{t}|\mathcal{F}_{s})&\leq X_{s}\,a.s.\,(\text{supermartingale})\end{align*}$$\(\{X_{n}\}\)을 유한한 기댓값을 갖는 독립동일분포 확률변수들의 열이라 하고 \(S_{n}=X_{1}+\cdots+X_{n}\)이라 하자. 그러면 \(E(X_{1})\geq0\)일 때 \(\{S_{n}\}\)은 열마팅게일이고, \(E(X_{1})\leq0\)일 때 \(\{S_{n}\}\)은 우마팅게일이다. 

브라운 운동 \(B(t)\)는 마팅게일이다. \(\mathcal{F}_{t}=\sigma(B(s),\,s\leq t)\)라 하자. 그러면 임의의 \(s\leq t\)에 대하여$$E(B(t)|\mathcal{F}_{s})=E(B(t)-B(s)|\mathcal{F}_{s})+E(B(s)|\mathcal{F}_{s})$$이고 \(B(t)-B(s)\)는 \(\mathcal{F}_{s}\)와 독립이므로 \(E(B(t)-B(s)|\mathcal{F}_{s})=E(B(t)-B(s))\)이다. 그러나 임의의 \(t\)에 대하여 \(E(B(t))=0\)이므로 \(E(B(t)-B(s)|\mathcal{F}_{s})=0\)이고 반면에 \(B(s)\)는 \(\mathcal{F}_{s}-\)가측이므로 \(E(B(s)|\mathcal{F}_{s})=B(s)\)이다. 따라서 임의의 \(s\leq t\)에 대해 \(E(B(t)|\mathcal{F}_{s})=B(s)\)이고 이것은 \(B(t)\)가 마팅게일임을 입증한다. 


\(f\in L^{2}([a,\,b])\)라 하자. 그러면 확률과정$$M_{t}=\int_{a}^{t}{f(s)dB(s)}\,a\leq t\leq b$$는 \(\mathcal{F}_{t}=\sigma(B(s),\,s\leq t)\)에 대해 마팅게일이다. 

증명: \(M_{t}\)의 조건부기댓값을 정의하기 위해 모든 \(t\in[a,\,b]\)에 대해 \(E(|M_{t}|)<\infty\)임을 보여야 한다.$$E(|M_{t}|^{2})=\int_{a}^{t}{|f(s)|^{2}ds}\leq\int_{a}^{b}{|f(s)|^{2}ds}$$이므로 \(E(|M_{t}|)\leq\sqrt{E(|M_{t}|^{2})}<\infty\)이다. 다음으로 모든 \(s\leq t\)에 대하여 \(E(M_{t}|\mathcal{F}_{s})=M_{s}\)가 성립함을 보여야 한다.$$M_{t}=M_{s}+\int_{s}^{t}{f(u)dB(u)}$$이고 \(M_{s}\)는 \(\mathcal{F}_{s}-\)마팅게일이다. 따라서$$E(M_{t}|\mathcal{F}_{s})=M_{s}+E\left(\int_{s}^{t}{f(u)dB(u)}|\,\mathcal{F}_{s}\right)$$이고 따라서 임의의 \(s\leq t\)에 대해 다음이 성립함을 보이면 된다.$$E\left(\int_{s}^{t}{f(u)dB(u)}|\mathcal{F}_{s}\right)=0$$\(f\)를 계단함수 \(\displaystyle f=\sum_{i=1}^{n}{a_{i}\mathbb{1}_{[t_{i-1},\,t_{i})}}\,(t_{0}=s,\,t_{n}=t)\)라 하자. 이 경우$$\int_{s}^{t}{f(u)dB(u)}=\sum_{i=1}^{n}{a_{i}\{B(t_{i})-B(t_{i-1})\}}$$\(B(t_{i})-B(t_{i-1})\,(i=1,\,...,\,n)\)들은 모두 \(\sigma-\)체 \(\mathcal{F}_{s}\)와 독립이고 따라서 모든 \(i\)에 대해 \(E(B(t_{i})-B(t_{i-1})|\mathcal{F}_{s})=0\)이므로 \(f\)가 계단함수일 때 성립한다.

다음으로 \(f\in L^{2}([a,\,b])\)라 하자. \(L^{2}([a,\,b])\)에서 \(f\)로 수렴하는 계단함수열 \(\{f_{n}\}\)을 고르자. 그러면 조건부 젠센 부등식에서 \(\phi(x)=x^{2}\)라 하면 다음의 부등식을 얻고$$|E(X|\mathcal{F})|\leq E(X^{2}|\mathcal{F})$$이 부등식은 다음을 뜻한다.$$\left|E\left(\int_{s}^{t}{\{f_{n}(u)-f(u)\}dB(u)}\right)|\mathcal{F}_{s}\right|\leq E\left(\left(\int_{s}^{t}{\{f_{n}(u)-f(u)\}dB(u)}\right)^{2}|\mathcal{F}_{s}\right)$$다음으로 조건부기댓값의 성질 \(E(E(X|\mathcal{F}))=E(X)\)을 이용하면 \(n\,\rightarrow\,\infty\)일 때 다음이 성립한다.$$\begin{align*}E\left(\left|E\left(\int_{s}^{t}{\{f_{n}(u)-f(u)\}dB(u)}|\mathcal{F}_{s}\right)\right|^{2}\right)&\leq\int_{s}^{t}{\{f_{n}(u)-f(u)\}^{2}du}\\&\leq\int_{a}^{b}{\{f_{n}(u)-f(u)\}^{2}du}\\&\,\rightarrow\,0\end{align*}$$따라서 확률변수열 \(\displaystyle E\left(\int_{s}^{t}{f_{n}(u)dB(u)}|\mathcal{F}_{s}\right)\)은 \(L^{2}(\Omega)\)에서 \(\displaystyle E\left(\int_{s}^{t}{f(u)dB(u)}|\mathcal{F}_{s}\right)\)로 수렴한다. \(L^{2}(\Omega)\)에서 수렴하면 확률수렴하고, 거의 확실히 수렴하는 부분수열이 존재함을 뜻한다. 따라서 부분수열을 선택함으로써 확률 1로 다음이 성립한다고 할 수 있다.$$\lim_{n\,\rightarrow\,\infty}{E\left(\int_{s}^{t}{f_{n}(u)dB(u)}|\mathcal{F}_{s}\right)}=E\left(\int_{s}^{t}{f(u)dB(u)}|\mathcal{F}_{s}\right)$$\(f_{n}\)이 계단함수이므로 \(\displaystyle E\left(\int_{s}^{t}{f_{n}(u)dB(u)}|\mathcal{F}_{s}\right)=0\)이고 따라서 모든 \(f\in L^{2}([a,\,b])\)에 대해 다음이 성립한다.$$E\left(\int_{s}^{t}{f(u)dB(u)}|\mathcal{F}_{s}\right)=0$$

참고자료:

Introduction to Stochastic Integration, Hui-Hsiung Kuo, Springer 

Measure, Integral and Probability, Capinski, Kopp, Springer              

반응형
Posted by skywalker222