[기초통계학] 1. 통계학이란 무엇인가?
통계(statistic)의 어원은 라틴어로 국가를 뜻하는 'status'에서 유래한 것이고, 그 의미는 특정 집단을 대상으로 한 조사나 실험에 의해 구한 결과에 대한 요약된 형태의 표현이다.
평균, 표준편차, 중위수, 최빈값, %등의 숫자로 표현하거나 막대그래프, 원그래프, 꺾은선그래프로 나타내는 통계를 기술통계(descriptive statistic)라고 한다.
통계학(statistics)은 불확실한 현상을 대상으로 자료를 수집하고 정리해 이 자료가 수집된 대상에 대한 적절한 모형을 설정하고 추정(estimation), 검정(testing), 예측(forecasting)을 하는 학문이다.
통계학은 크게 수리통계학과 응용통계학으로 나뉜다. 수리통계학은 확률론, 추론 등 통계학에서 논의되는 이론을 수학적으로 다루는 학문분야이고, 응용통계학의 분야로 표본론, 회귀분석, 분산분석, 범주형 자료분석, 시계열분석 등이 있다.
다음은 통계분석의 5가지 단계이다.
1. 자료의 수집단계: 통계분석의 출발은 분석하고자 하는 집단에서 분석목적에 적절한 자료를 수집하는 것이다.
2. 수집된 자료의 요약, 정리 단계: 수집된 자료를 이용한 1차정보는 수집된 자료의 요약, 정리를 통해 구하는데 그래프를 이용하는 방법과 숫자를 이용하는 방법이 있다. 그래프를 이용하는 방법으로 이산형 자료의 경우 막대그래프, 원그래프, 꺾은선그래프 등을 이용하고, 연속형 자료의 경우 히스토그램, 줄기-잎 그림, 상자그림, 산포도그림 등을 이용한다. 숫자를 이용하는 방법으로는 평균, 중위수, 최빈값, 분산, 범위 등의 값을 측정한다.
3. 모수의 추정단계: 통계분석에서 분석하고자 하는 집단을 모집단(population)이라 하고, 모집단의 특성을 나타내는 값을 모수(parameter)라고 한다. 통계분석에서 모집단의 평균을 모평균(population mean), 모분산(population variance)이라고 하고 일반적이로 이 두 값들은 알려져 있지 않기 때문에 표본조사나 실험을 통한 자료수집으로 모수들을 추정(estimation)한다. 표본조사나 실험을 통한 자료수집에서 자료의 숫자를 요약한 값을 통계량(statistic)이라 하고, 통계량 중에서 모수를 추정하는 값을 추정량(estimator), 구체적인 표본에 의해 관측된 통계량의 값을 통계치(statistic)라 하고, 추정량의 값을 추정치(estimate)라고 한다.
4. 검정단계: 모집단의 모수에 대한 추정을 한 다음 모집단에 대해 어떤 가설(hypothesis)을 설정한 다음 그 가설의 타당성 여부를 검정한다. 이것을 가설검정(testing hypothesis)이라고 한다.
5 모형분석단계: 관측된 자료가 특정 형태의 모형으로부터 관측되었다고 가정한 후 그 모형을 추정하는 단계이고 자료의 형태에 따라 회귀분석, 분산분석, 범주형 자료분석, 시계열분석 등의 방법이 있다.
*사회조사는 다음의 절차를 거쳐 진행된다.
조사목적의 설정-조사대상집단의 정의-설문지의 작성-표본설계-표본추출-조사실시(면접/전화/우편조사)-조사결과의 정리 및 발표
*사회조사 결과를 읽을 때 조사결과의 신뢰성을 측정하기 위해 다음 사항에 관심을 가져야 한다.
1. 조사기관과 조사의뢰기관이 어느 곳인가를 알아보아야 한다.(조사기관은 객관적인 입장을 가진 기관이어야 신뢰할 수 있다)
2. 표본의 구성을 분석해야 한다.(합리적으로 표본이 추출되었는가를 파악해야 한다)
3. 조사방법과 조사기간을 알아보아야 한다.(특히 어떤 사건을 전후해 국민들이 서로 다른 의견을 가질 수 있는 경우는 조사시점에 주의해야 한다)
4. 무응답/응답거부가 어떻게 처리되었는가를 알아보아야 한다.(무응답/응답거부를 무시하고 발표하면 문제의 본질을 왜곡시킬 수 있다)
5. 숨겨진 자료가 없는지 판단해야 한다.(표본의 수를 비롯한 표본의 대표성이 의심되면 발표할 때 이를 숨기는 경우가 있다)
6. 비교가 정확하게 이루어졌는가를 판단해야 한다.(A국가에서 1시간이라도 수입이 있는 일을 하면 취업으로 분류하고, 일시해고자는 실업자로 분류하지 않는다. 반면에 B국가는 안정된 직장을 가진 경우만 취업으로 분류하고, 일시해고자는 실업자로 분류한다. 이 두 나라의 실업자에 대한 기준이 다르기 때문에 이 두 나라의 실업률을 비교할 수 없다)
7. 조사항목에 대한 개념이 명확하게 정의되었는지를 확인해야 한다.(중산층에 대해 조사한다면 중산층에 대한 구체적인 기준을 제시해야 한다)
8. 조사대상집단과 발표대상집단이 동일한가를 확인해야 한다.
9. 발표된 통계가 상식적으로 받아들여질 수 있는가를 확인해야 한다.
참고자료:
통계학-엑셀을 이용한 분석, 김진경 외 5인, 자유아카데미
통계학의 이해 8판, 이용구, 김삼용, 율곡출판사
'확률및통계 > 기초통계학' 카테고리의 다른 글
[기초통계학] 6. 연속확률분포 (0) | 2020.05.16 |
---|---|
[기초통계학] 5. 이산확률분포 (0) | 2020.04.10 |
[기초통계학] 4. 확률변수, 확률분포 (0) | 2020.04.09 |
[기초통계학] 3. 확률 (0) | 2020.04.08 |
[기초통계학] 2. 기술통계 (0) | 2020.04.07 |