Processing math: 100%

반응형

[금융통계학] 6. 가설검정



가설(hypothesis)은 실질적인 증명 이전에 세우는 모집단의 특성에 대한 진술(경험적 또는 논리적으로 검정되는 조건 또는 명제)이고, 검정(test)은 모집단에서 임의로 추출된 표본을 통해 모집단의 특성을 합리적으로 파악하고자 하는 과정이다. 

가설검정(hypothesis testing)은 두 개의 가설을 설정하고 수집된 정보를 바탕으로 두 가설 중 어떤 가설을 선택하는게 맞는 지를 확인하는 것이다. 가설검정은 먼저 연구의 목적을 정한다(검정을 위한 가설설정). 여기서의 두 가설은 귀무가설(null hypothesis) H0과 대립가설(alternative hypothesis) H1로 나뉘는데 대립가설은 주장하고자 하는 가설이고, 귀무가설은 대립가설에 반대되는 가설이다.

귀무가설은 통상적으로 비교하는 값과 차이가 없다는 가설이고, 예를 들면, 다음과 같다.H0:μ=0.05,H0:μA=μB(작은 것들 중에서 가장 큰 것이 불만족스러우면 나머지는 무시해도 된다)

대립가설은  뚜렷한 증거가 있을 때 주장하고자 하는 가설로 통상적으로 차이가 있다는 가설이다. 대립가설은 단측검정(one-sided test)가설과 양측검정(two-sided test)가설로 구분된다. 

단측검정의 예:H1:μ>0.05,H1:μ<0.05,H1:μA>μB,H1:μA<μB양측검정의 예:H1:μ0.05,H1:μAμB 

귀무가설과 대립가설 중 하나를 선택하기 이전에 확실한 근거가 있기 전까지는 귀무가설(현재의 사실)을 참이라고 가정한다. 이것은 '무죄추정의 원칙'과 같은 것이다. 


어느 자산운용사가 지난해 운용한 펀드의 평균수익률이 9.1%이고 올해 6개월간 새로 개발한 펀드의 평균수익률은 10%로 나타났다. 이때 새로 개발한 펀드의 수익률이 지난해 운용한 펀드의 수익률보다 높은지 확인하기 위한 가설을 다음과 같이 세울 수 있다.H0:p=7.5,H1:p>7.5(p7.5의 최댓값은 7.5이다)


가설검정을 하다 보면 두 가지 오류가 발생할 수 있다. 그 첫번째 오류는 귀무가설이 참인데 귀무가설을 기각하는 오류로, 제 1종 오류(type-I error)라고 하고(무죄인데 유죄판결), 두번째 오류는 첫번째 오류와 반대로 귀무가설이 거짓인데 귀무가설을 기각하지 않는 오류로, 제 2종 오류(type-II error)라고 한다(유죄인데 무죄판결).

가설검정을 할 때, 이 두 오류를 모두 줄여야 하나 하나의 오류를 줄이면 다른 오류가 늘어나게 된다. 제 1종 오류의 최대한계를 사전에 정한 다음, 제 2종 오류를 줄이는 방법으로 오류를 줄인다. 제 1종 오류가 발생할 확률의 최댓값을 유의수준(significance level)이라 하고 α로 나타낸다. 이때 α=0.05,0.01,0.1을 주로 사용한다. 제 2종 오류는 β로 나타내는데 1β는 틀린 귀무가설을 기각해서 귀무가설의 오류를 찾을 확률인 검정력(power of a test)을 나타낸다. 귀무가설이 옳다는 전제조건 하에서 주어진 관측값보다 벗어날 확률을 유의확률(significance probability)(또는 p-값(value))이라고 한다. 


가설검정은 다음의 순서대로 진행한다.

1. 귀무가설(H0)과 대립가설(H1)을 세운다.

2. 유의수준 α를 설정한다.

3. 표본을 이용하여 검정통계량(test statistic)을 구한다. 예를들어 모평균 μ를 추정할 때의 검정통계량은 모분산 σ2을 알 때와 모를 때(표본분산 S2) 각각 다음과 같다.Z=¯Xμσn,T=¯XμSn

4. 귀무가설이 옳다는 전제조건 하에서 검정통계량이 따르는 표본분포를 구한다.

5. 4의 표본분포를 바탕으로 유의수준에 해당하는 검정통계량인 기각역을 찾거나 유의확률을 구한다.

6. 가설검정을 실행해서 귀무가설을 기각하거나 기각하지 않는다.


일반적으로 모평균의 가설검정은 다음의 세 가지 중 하나이다.H0:μ=μ0,H1:μ>μ0H0:μ=μ0,H1:μ<μ0H0:μ=μ0,H1:μμ0이때 표본평균 ¯X의 표본분포를 이용하게 되는데 위의 경우에서 ¯X>c, ¯X<c, ¯Xc인 영역에서 귀무가설 H0를 기각하게 하는 c를 임계값(critical value)이라고 한다. 다시 말하면 표본분포가 임계값보다 크고, 작고, 다른 영역에서 귀무가설을 기각하게 되고, 이때 이 영역을 기각역(rejection region)이라고 하고 기각역은 유의수준에 의해 결정된다. 기각역의 여집합을 채택역(acceptance region)이라고 한다.

앞에서도 언급했듯이 모평균을 검정하기 위한 검정통계량은 모분산을 알 때,Z=¯XμσnN(0,12)이고, 모분산을 모를 때, 표본분산이 S2이면,T=¯XμSntα(n1)(α는 유의수준)이다. 그러면 모평균의 가설검정에서 대립가설에 따른 기각역은 다음과 같다.

대립가설 

기각역 

모분산을 모를 때 

모분산을 알 때 

H1:μ>μ0 

¯XμSn>tα(n1) 

¯Xμσn>zα 

H1:μ<μ0 

¯XμSn<tα(n1) 

¯Xμσn 

H1:μμ0 

|¯XμSn|>tα(n1) 

|¯Xμσn|>zα 


어떤 투자회사에서 관리하는 펀드의 연간수익률은 정규분포를 따르고 분산은 16%이다. 이 투자회사엣는 평균 연간수익률이 적어도 9.5%라고 주장하고 있다. 이 주장을 검증하기 위해 이 투자회사에서 관리하는 펀드 중 25개를 임의로 추출해 평균 연간수익률이 10%라는 사실을 알아냈다. α=0.05(5% 유의수준)로 놓고 가설검정을 실시하면H0:μ=0.95,H1:μ>0.95이고 ¯XN(μ,(45)2)이므로P(¯X>c)=P(Z>c9.545)=0.05이고 P(Z>1.645)=0.05,c0.9545=1.645이므로 임계값은 c=10.816이다. c>10이므로 기각역 바깥에 있고, 따라서 귀무가설을 기각하지 못한다(10%의 연간수익률은 이 투자회사의 주장을 뒷받침하지 못한다). p-값을 구하면P(¯X>10)=P(Z>109.51625)=P(Z>0.625)=0.2655>0.05=α이므로 10% 연간수익률은 투자자문회사의 주장을 전혀 반영하지 못한다.


어느 투자자문회사에서 운영하는 자산의 1-기간 단순수익률은 평균이 적어도 3%라고 주장하고 있다. 이 주장을 검증하기 위해 이 투자자문회사에서 운영하는 포트폴리오 중 15개를 임의로 추출해 평균이 3.2%, 분산이 2%라는 사실을 알아냈다. α=0.01(1% 유의수준)로 놓고 가설검정을 실시하면H0:μ=3.0,H1:μ>3.0이고T=¯Xμsnt0.01(14), P(T>2.624),c3.0215=2.624이므로 임계값은 c=3.96이다. ¯X=3.2이고 c>¯X=3.2이므로 귀무가설을 기각하지 못한다.


일반적으로 모분산의 가설검정은 모평균의 가설검정처럼 다음의 세 가지 중 하나이다.H0:σ2=σ20,H1:σ2>σ20H0:σ2=σ20,H1:σ2<σ20H0:σ2=σ20,H1:σ2σ20정규분포를 따르는 모집단에서 크기가 n인 표본의 분산이 S2, 유의수준이 α일 때,(n1)S2σ20χ2α(n1)이고, 모분산의 가설검정에서 대립가설에 따른 기각역은 다음과 같다.

대립가설

기각역 

H1:σ2>σ20 

(n1)S2σ20>χ2α(n1) 

H1:σ2<σ20 

(n1)S2σ20<χ21α(n1) 

H1:σ2σ20 

(n1)S2σ20>χ2α2(n1) 또는 (n1)S2σ20<χ21α2(n1) 

위의 표를 이용하여 임계값 c를 구할 수 있고, 각 대립가설에 따른 임계값은 다음과 같다.c=σ20χ2α(n1)n1(H1:σ2>σ20)c=σ20χ2(1α)(n1)n1(H1:σ2<σ20)c1=σ20χ2(1α2)(n1)n1,c2=σ20χ2α2(n1)n1(H1:σ2σ20)(c1<c2)


미국의 S&P 500지수의 수익률의 표준편차는 20%로 알려져있다. 수익률이 작다고 해도 표준편차의 75%인 15% 정도의 수익률의 표준편차를 유지할 수 있는 투자자문회사를 선택하려 한다. 어느 한 투자자문회사는 최근 19년간 수익률의 표준편차가 19%였으나 이것은 최근 2년간 잠깐 일어났었던 일이고 평소의 표준편차는 15% 이하라고 주장하고 있다. α=0.05로 놓고 가설검정을 실시하면H0:σ=15,H1:σ>15이고 n=10이므로 χ20.05(9)=16.919이고 c=15216.9199=422.975, S2=192=361이므로 c>S2이고 이것은 S2이 기각역에 있지 않음을 뜻한다. 따라서 귀무가설을 기각하지 않는다(투자자문회사의 주장이 틀렸다고 할 수 없다).


참고자료:

기초 금융통계, 박유성, 김기환, 자유아카데미

금융인을 위한 통계분석, 이긍희, 한국금융연수원

재무위험관리사(1: 금융통계학), 금융투자교육원, 한국금융투자협회   

반응형
Posted by skywalker222