[측도론] 9-1 확률의 기본개념
해석학 |
확률론 |
-측도공간 (X,M,μ)(μ(X)=1) -(σ-)대수 -가측집합 -가측 실함수 f -f의 적분 ∫Xfdμ -Lp -측도수렴 -거의 어디서나, a.e. -R상의 보렐 확률측도 -측도의 푸리에변환 -특성함수 χE |
-표본공간 (Ω,B,P) -(σ-)체 -사건 -확률변수 X -X의 평균 또는 기댓값 E(X)=∫ΩXdP -유한 p차 모멘트를 갖는 -확률수렴 -거의 확실히, a.s. -분포 -분포의 특성함수 -지시함수 1E |
{ω|X(ω)>a}와 P({ω|X(ω)>a})를 간단히 {X>a}, P(X>a)로 나타내고 "Lp 확률변수(random variable)"라는 용어 대신 "유한 p차 모멘트를 갖는 확률변수"라는 용어를 사용한다.
X가 확률변수일 때 X의 분산(variance) σ2(X)와 표준변차(standard deviation) σ(X)를 각각 다음과 같이 정의한다.σ2(X)=infa∈RE((X−a)2),σ(X)=√σ2(X)X∉L2이면 σ2(X)=∞이고 X∈L2이면 E((X−a)2)=E(X2)−2aE(X)+a2이고 a=E(X)일 때 최소이므로 따라서 분산은 다음과 같다.σ2(X)=E((X−E(X))2)=E(X2)−{E(X)}2(X∈L2)여기서 σ(X)는 X가 E(X)로부터 얼마나 흩어져 있는가를 나타내는 척도이다.
(Ω,B,P)를 확률공간(임의의 측도공간), (Ω′,B′)를 다른 가측공간, ϕ:Ω→Ω′를 (B,B′)−가측사상이라 하자. 그러면 측도(확률) P는 Ω′에서 다음과 같이 정의되는 상측도(image measure) Pϕ를 유도한다.Pϕ(E)=P(ϕ−1[E])
9.1 f:Ω′→R가 가측함수이면 ∫Ω′fdPϕ=∫Ω(f∘ϕ)dP(양 변의 적분은 정의됨)이다.
증명: f=χE(E∈B′)이면, Pϕ의 정의에 의해 분명하고(∵χE∘ϕ=χϕ−1[E]), 나머지 경우는 2.10과 단조수렴정리에 의해 성립한다.
X가 Ω상의 확률변수이면, PX는 R에서의 확률측도이고 X의 분포(distribution)라고 하고, 다음의 함수F(t)=PX((−∞,t])=P(X≤t)(1.15에 의해 PX를 결정)를 X의 분포함수(distribution function)라고 한다. {Xα}α∈A가 모든 α,β∈A에 대하여 PXα=PXβ인 확률변수들의 집합족이면, Xα들은 동일분포를 갖는다(identically distributed)라고 한다.
일반적으로 유한개의 확률변수 X1,...,Xn에 대해 (X1,...,Xn)을 Ω에서 Rn으로의 사상이라고 할 수 있고 Rn상의 측도 P(X1,...,Xn)을 X1,...,Xn의 결합분포(joint distribution)라고 한다. 9.11에 의해 다음이 성립한다.E(X)=∫RtdPX(t),σ2(X)=∫R(t−E(X))2dPX(t),E(X,Y)=∫R2(t+s)dP(X,Y)(t,s)R에서의 보렐 확률측도 λ에 대한 평균(mean) ¯λ와 분산(variance) σ2은 다음과 같다.¯λ=∫Rtdλ(t),σ2=∫R(t−¯λ)2dλ(t)확률론에서 가장 중요한 개념 중 하나는 (확률적)독립((stochastic) independence)이다. 확률공간 (Ω,F,P)와 사건 E(P(E)>0)가 있다고 하자. 그러면 다음의 집합함수PE(F)=P(E∩F)P(E)(F∈F)는 Ω에서의 확률측도이고 E에서의 조건부 확률(conditional probability)이라고 한다. PE(F)는 사건 E가 일어났을 때, 사건 F가 일어날 확률을 나타낸다. PE(F)=P(F)(사건 F가 일어날 확률이 사건 E의 영향을 받지 않음)이면, E와 F는 독립(independent)이라고 한다. 따라서 E와 F가 독립일 필요충분조건은 다음과 같고, P(E)=0이더라도 성립한다.P(E∩F)=P(E)P(F)일반적으로 Ω에서의 사건들의 집합 {Eα}α∈A가 모든 n∈N과 서로 다른 α1,...,αn∈A에 대해 다음이 성립하면, {Eα}α∈A들을 독립(independence)이라고 한다.P(n⋂i=1Eαi)=n∏i=1P(Eαi)주의할 점은 쌍별로의 독립이 독립을 의미하지 않는다.
Ω에서의 확률변수들의 집합 {Xα}α∈A가 모든 보렐집합 Bα⊂R에 대해 사건 {Xα∈Bα}=X−1α[Bα]들이 독립이면, {Xα}α∈A를 독립(independence)이라고 한다. α1,...,αn∈A이고 Xαi=Xi로 나타내면 다음이 성립한다.P(n⋂i=1X−1i[Bi])=P((X1,...,Xn)−1[B1×⋯×Bn])=P(X1,...,Xn)(B1×⋯×Bn)이다. 반면에n∏i=1P(X−1i[Bi])=n∏i=1PXi(Bi)=(n∏i=1PXi)(B1×⋯×Bn)이므로 이 등식이 모든 보렐집합 Bi⊂R에 대해 성립할 필요충분조건은P(X1,...,Xn)=n∏i=1PXi이고 이것은 {Xα}α∈A가 독립확률변수들의 집합일 필요충분조건이 유한개의 Xα들의 결합분포가 개별 분포들의 곱이라는 것을 뜻한다.
9.2 {Xni|1≤i≤J(n),1≤n≤N}을 독립확률변수들의 집합, fn:RJ(n)→R(1≤n≤N)을 보렐 가측함수라고 하자. 그러면 확률변수 Yn=fn(Xn1,...,XnJ(n))(1≤n≤N)들은 독립이다.
증명: Xn=(Xn1,...,XnJ(n))이라 하자. B1,...,BN이 R상의 보렐 부분집합이면, Y−1n[Bn]=X−1n[f−1n[Bn]]이고 따라서(Y1,...,YN)−1[B1×⋯×Bn]=N⋂n=1Y−1n[Bn]=(X1,...,XN)−1[f−11[B1]×⋯×f−1N[BN]]이다. 그러므로 Xni들이 독립이기 때문에 푸비니정리에 의해 다음의 결과를 얻는다.P(Y1,...,YN)(B1×⋯×BN)=P(X1,...,Xn)(f−11[B1]×⋯×f−1N[BB])=(N∏i=1J(n)∏j=1PXni)(f−11[B1]×⋯×f−1N[BN])=N∏n=1PXn(f−1n[Bn])=N∏n=1PYn(Bn)
λ1,...,λn∈M(R)일 때 λ1∗⋯∗λn은 다음과 같다.(λ1∗⋯∗λn)(E)=∫⋯∫RnχE(t1+⋯+tn)dλ1(t)⋯dλn(t)
9.3 {Xi}ni=1이 독립확률변수이면, PX1+⋯+Xn=PX1∗⋯∗PXn이다.
증명: A(t1,...,tn)=n∑i=1ti라 하자. 그러면 X1+⋯+Xn=A(X1,...,Xn)이고 다음의 결과를 얻는다.PX1+⋯+Xn=(P(X1,...,Xn))A=(n∏i=1PXi)A=PX1∗⋯∗PXn
9.4 {Xi}ni=1을 독립확률변수라 하자. 모든 i에 대하여 Xi∈L1이면, n∏i=1Xi∈L1이고 E(n∏i=1Xi)=n∏i=1E(Xi)이다.
증명: f(t1,...,tn)=n∏i=1|ti|라고 하면 n∏i=1|Xi|=f(X1,...,Xn)이고 따라서 다음이 성립한다.E(n∏i=1|Xi|)=∫RnfdP(X1,...,Xn)=∫Rnfd(n∏i=1PXi)=n∏i=1∫R|ti|dPXi(ti)=n∏i=1E(|Xi|)
9.5 {Xi}ni=1⊂L2들이 독립이면, σ2(X1+⋯+Xn)=n∑i=1σ2(Xi)이다.
증명: Yi=Xi−E(Xi)라 하자. 그러면 {Yi}ni=1들은 독립이고 E(Yi)=0이므로E(YiYk)=E(Yi)E(Yk)=0(i≠k)이고 다음이 성립한다.σ2(X1+⋯+Xn)=E((Y1+⋯+Yn)2)=∑i,kE(YiYk)=n∑i=1E(Y2i)=n∑i=1σ2(Xi)
X,Y가 독립이고 E(X)=0이라 하자. 그러면 조건 f∘Y∈L1을 만족하는 R상의 보렐 가측함수 f에 대하여E(X⋅(f∘Y))=E(X)E(f∘Y)=0이고 X와 Y는 수직이다.
Ω=Ω1×⋯×Ωn, B=n⨂i=1Bi, P=P1×⋯×Pn이라 하자. 그러면 i번째 좌표만을 갖는 Ω상의 확률변수 X1,...,Xn들은 독립이다. Xi=fi∘πi(πi:Ω→Ωi는 좌표사상)라고 하면(X1,...,Xn)−1[B1×⋯Bn]=n∏i=1f−1i[Bi]이고 따라서 다음이 성립한다.P(X1,...,Xn)(B1×⋯×Bn)=P(n∏i=1f−1i[Bi])=n∏i=1Pi(f−1i[Bi])=n∏i=1PXi(Bi)
9.6 f∈C([0,1])에 대하여 다음과 같이 정의된 다항식 Bn(x)는 [0,1]에서 f로 균등수렴한다.Bn(x)=n∑k=0f(kn)n!k!(n−k)!xk(1−x)n−k
증명: x∈[0,1]에 대하여 λ=xδ1+(1−x)δ0(δt는 t에서의 점질량)라 하고 Ω=Rn, P=λ×⋯×λ, Xi를 Rn에서의 i번째 좌표함수라 하자. 그러면 X1,...,Xn들은 독립이고, 분포는 λ이다. 다음의 식(λ∗⋯∗λ)=n∑k=0n!k!(n−k)!xk(1−x)n−kδk ((δ0∗δ0)(t)=∬R2χ{t}(x+y)dδ0(x)dδ0(y)=χ{t}(0)=δ0(t)(δ0∗δ1)(t)=∬R2χ{t}(x+y)dδ0(x)dδ1(y)=χ{t}(1)=δ1(t)(δ1∗δ1)(t)=∬R2χ{t}(x+y)dδ1(x)dδ2(y)=χ{t}(2)=δ2(t)λ∗λ={xδ1+(1−x)δ0}∗{xδ1+(1−x)δ0}=x2δ2+2x(1−x)δ1+(1−x)2δ0=2∑k=02!k!(2−k)!xk(1−x)2−kδk)과 9.3에 의해Bn(x)=E(f(X1+⋯+Xnn))이고 이항정리로부터 n∑k=0n!k!(n−k)!=1이므로 다음의 부등식이 성립한다.|f(x)−Bn(x)|≤n∑k=0|f(x)−f(kn)|n!k!(n−k)!xk(1−x)n−kf는 [0,1]에서 균등연속이므로 임의의 ϵ>0과 δ>0가 존재해서 모든 x,y∈[0,1]에 대해 |x−y|≤δ일 때 |f(x)−f(y)|≤ϵ이다.
|x−kn|≤δ인 x에 대해서n∑k=0|f(x)−f(kn)|n!k!(n−k)!xk(1−x)n−k≤ϵ이고 나머지는 2‖보다 작다.\sigma^{2}(X_{i})=E(X_{i}^{2})-\{E(X_{i})\}^{2}=x-x^{2}\leq1이므로 9.5에 의해E\left(\left(\frac{X_{1}+\cdots+X_{n}}{n}-x\right)^{2}\right)=\sigma^{2}\left(\frac{X_{1}+\cdots+X_{n}}{n}\right)\leq\frac{n}{n^{2}}=\frac{1}{n}이고 체비셰프 부등식에 의해 다음이 성립하고 따라서 B_{n}(x)는 [0,\,1]에서 f로 균등수렴한다.|f(x)-B_{n}(x)|\leq\epsilon+\frac{2\|f\|^{2}}{n\delta^{2}}<2\epsilon\,(\because\,\text{Archimedian property})
참고자료:
Real Analysis: Modern Techniques and Their Applications Second edition, Folland, Wiley
'실변수 함수론 > 측도론' 카테고리의 다른 글
[측도론] 9-3 중심극한정리 (0) | 2020.01.20 |
---|---|
[측도론] 9-2 큰 수의 법칙 (0) | 2020.01.19 |
[측도론] 8-4 측도의 푸리에해석 (0) | 2020.01.17 |
[측도론] 8-3 푸리에 변환 (1) | 2020.01.16 |
[측도론] 8-2 합성곱 (0) | 2020.01.15 |