대학원/기초통계8 [기초통계] 기술통계 & 추리통계 개념 통계학은 크게 기술통계, 추리통계로 나뉜다. 기술통계 (descriptive statistics) - 관찰 데이터에서 데이터의 특징을 뽑아내어 기술함 ex. 평균, 표준편차, 도수분포표, 히스토그램 ❓기술통계는 무엇일까? 어떤 목적을 가지는가? - 단순히 숫자가 나열되어 있는 데이터 자체만으로는 데이터의 정보를 쉽게 알 수 없음. - 분포한다: 다양한 수치로 나타난다 - 분포가 생기는 이유: 수치가 결정된 이면에 불확실성의 구조가 있기 때문. - 분포의 특성: 고유한 특징이나 반복되는 것이 있음. - 데이터로부터 분포의 특징을 이끌어내기 위해 통계를 사용함. 통계는 축약을 통해 많은 숫자로 나타난 데이터를 어떤 기준으로 정돈해 의미 있는 정보만 추출.(물론, 이 과정에서 정보의 손실이 발생하기는 하지만 .. 2023. 5. 3. 통계 개념 (한/영) (last update: 23. 5. 27.) 통계를 생전 처음 접하는 사람에게 통계 개념들은 정말 낯설기만 하다. 공부하다보면, 논문을 영어로 읽을 때도 있는데 이때 특정 통계 용어들을 모르고 접하면, 사전적 의미 그대로 해석하게 되고 그럴 경우 논문을 잘못 이해하는 불상사가 발생한다. (대표적 예: bias - 통계에서는 편향, 편파 등으로 해석, imputation: 통계에서는 대체로 해석) 전공이 아니라면 어려움을 덜 겪을 수도 있을 것 같기는 한데, 연구를 하려면 연구방법론은 모든 학생이 기본적으로 배워야 하기 때문에 어느 정도 자주 사용되는 용어 정도는 기억하면 편하다. 가장 좋은 방법은 통계 용어를 한글-영어로 엑셀 파일에 정리해두는 것이다. 앞으로도 계속 업데이트를 할 예정이다. 영어 한글 time-invariant variable.. 2023. 5. 2. 분포 - 정규분포, t분포, 카이제곱분포, F분포 (수정중) 정규분포 t분포 P(X > 100) = P((X-µ)/σ > ... ) = P(Z > ...) p값을 구하기 위해 x를 z로 변환하여 계산 Z=(X-µ)/σ 에서 σ를 모를 때 s를 써야 하는데 s를 쓰게 되면 정규분포가 아니라 t분포를 따르게 됨. - t분포의 파라미터: 자유도 ν - 자유도: n 또는 ν (ν; nu라고 부름) - 기댓값: 0 - 분산: ν/(ν+2) (*자유도가 커지면 1에 가까워짐. 즉, 표준정규분포에 가까워짐) 카이제곱분포 Z들이 모두 표준정규분포를 따를 때, Z 제곱합들이 따르는 분포가 카이제곱분포 - 카이제곱분포의 파라미터: 자유도 ν - 자유도: n 또는 ν (ν; nu라고 부름) m개 제약이 가해지면 자유도는 n-m개. 어떨 때 제약이 가해지는가? Z=(X-µ)/σ 에서 .. 2023. 4. 19. 헷갈리는 기초통계 개념 #0 문과 출신이 통계를 공부하다보니 낯선 용어들이 너무나 많다. 기초통계 교재를 보더라도 뭔가 자세히 설명해주지 않는 용어들도 많고, 기초통계 책 하나를 공부했다 하더라도 뭔가 기본적인 통계 지식을 다 알게 되었다고 하기에는 불충분한 경우가 많다. 자주 등장하지만, 명쾌하게 이야기해주지 않는 통계 용어들도 너무 많다.. (통계학의 바이블이라고 불릴 정도의 기초통계 책을 누군가가 집대성해 주었으면 하는 바람이다.) 헷갈리는 통계 용어들이 있는데, 확실하게 개념을 짚고 넘어가면 좋다. 물론, 나도 책을 공부하면서, 강의를 들으면서 정리한 내용들이라 오류가 있을 수 있음을 미리 얘기한다. - 유의확률(significance probability, p-value, probability value), 유의수준(sig.. 2023. 4. 19. 이전 1 2 다음