통계학은 크게 기술통계, 추리통계로 나뉜다.
기술통계 (descriptive statistics)
- 관찰 데이터에서 데이터의 특징을 뽑아내어 기술함
ex. 평균, 표준편차, 도수분포표, 히스토그램
❓기술통계는 무엇일까? 어떤 목적을 가지는가?
- 단순히 숫자가 나열되어 있는 데이터 자체만으로는 데이터의 정보를 쉽게 알 수 없음.
- 분포한다: 다양한 수치로 나타난다
- 분포가 생기는 이유: 수치가 결정된 이면에 불확실성의 구조가 있기 때문.
- 분포의 특성: 고유한 특징이나 반복되는 것이 있음.
- 데이터로부터 분포의 특징을 이끌어내기 위해 통계를 사용함. 통계는 축약을 통해 많은 숫자로 나타난 데이터를 어떤 기준으로 정돈해 의미 있는 정보만 추출.(물론, 이 과정에서 정보의 손실이 발생하기는 하지만 의미 있는 정보를 얻을 수 있음)
데이터 축약 방법에는 (1)그래프 (2) 통계량 이 있음.
추리통계(inferential statistics)
- 통계학 방법과 확률이론을 섞은 것
- 전체를 파악할 수 없는 큰 대상이나 미래의 일에 대해 추측
- 부분으로 전체를 추측한다!
ex. 개표가 시작되었는데 당선 확실이라는 보도 - 추리통계 덕분.
가설검증
✔️통계학에서는 표준편차 의미를 이해하는 것이 중요함.
추리통계로 가기 위해서는 기술통계에 확률 이론을 추가해야 함.
- 기술통계에서의 평균, 표준편차는 확률변수에서 기대값, 표준편차라는 이름으로 등장. 계산은 같으나 다른 것으로 취급함.
통계와 확률의 차이
- 통계: 과거에 일어난 것에 관한 기술
- 확률: 미래에 일어날 것에 관한 기술
[출처] 고지마 히로유키. (2009). 세상에서 가장 쉬운 통계학 입문, 서울: 지상사.
'대학원 > 기초통계' 카테고리의 다른 글
[기초통계] 신뢰도와 타당도 (feat. 필요조건과 충분조건 개념) (0) | 2023.05.08 |
---|---|
[기초통계] 변산성 수치 - 편차, 분산, 표준편차 개념과 의미 (1) (0) | 2023.05.07 |
통계 개념 (한/영) (last update: 23. 5. 27.) (0) | 2023.05.02 |
분포 - 정규분포, t분포, 카이제곱분포, F분포 (수정중) (0) | 2023.04.19 |
헷갈리는 기초통계 개념 #0 (0) | 2023.04.19 |
댓글