표집방법 - 확률적 방법(probability sampling), 비확률적 방법(nonprobability sampling)으로 나뉨.
1. 확률적 표집 방법
- 표집치(statistics)를 통해 전집치(parameters)를 추정하거나 전집 특성에 대해 통계적 가설 검증을 하기 위해 시행하는 방법. 전집 특성을 가장 잘 나타낼 것이라 추정되는 요소들을 확률, 통계적으로 적절하게 표집하는 것
- 확률적 방법이 가능하기 위해서는 전집을 구성하는 각 표집단위들이 표집에 선택될 확률이 밝혀져야 하며, 각 표집단위들을 서로 구별할 수 있는 일련번호를 부여할 수 있어야 함.
ex. 전집이 100명, 그 중 10명 표집. 각 학생들에게 1~100까지 일련번호를 부여. 특정 학생이 표집에 선택될 확률은 0.1.
*표집단위(sampling unit): 전집 구성 요소 중 표집을 선발하기 위한 기본단위. 다른 것과 구별되는 나름대로 독특한 특성을 지니고 있어야 하고 다른 것과 상호중복되어서는 안 됨. 표집단위들을 모두 합하면 전집이 되어야 함.
ex. 교육연구에서 주로 학생, 교원 등 개인이 하나의 표집단위가 됨.
1) 단순무선표집(simple random sampling)
- 표집치를 통해 전집치를 추정, 전집 특성에 대한 가설검증을 할 때 통계학적으로 가장 바람직하다고 생각되는 방법
- 가장 바람직한 표집 조건인 독립성 조건, 동일기회의 조건을 모두 충족.
- 독립성 조건: 전집을 이루는 어떤 한 표집단위가 표집될 때 다른 표집단위와 관계없이 완전히 독립적으로 이루어져야 함.
- 동일기회의 조건: 전집을 이루는 표집단위 각각이 표집에 선발될 확률이 같아야 함.
ex. 만약 전국 초등학생 6학년이 10만명일 때, 1000명을 단순무선표집한다고 하면 1~10만까지 일련번호를 부여. 무선표집 가능하게 하는 컴퓨터 프로그램이나 난수표를 이용해 무작위로 1000개 번호 선택
2) 체계적표집(systematic sampling)
- 전집을 구성하고 있는 표집단위들을 무작위로 선택하는 것 대신 다소 체계적인 방법을 동원하여 선발하는 것이 서로 다름.
ex. 10만명 중 1000명을 표집할 때 일련번호를 부여하고 선발 간격을 정하여 무작위로 한 번호를 선택한 후 정해진 선택 간격으로 체계적으로 선택함. 선발 간격의 폭은 전집을 구성하는 표집단위 총수를 표집 크기로 나누어 결정. 100000명 ÷ 1000명 = 100명 → 100 간격 활용. 1~100번 중 무작위로 한 번호를 선택하고 100의 간격으로 체계적으로 선택하는 방법. 만약 처음에 20번이 선택되었다면 120, 220, 320 등의 순서로 1000명 선택. - 처음에 어떤 번호가 선택되는가에 따라 체계적으로 표집이 구성된다는 점에서 체계적표집.
- 장점: 단순무선표집보다 표집을 구성하기 쉽고, 전집의 특정 부분이 다른 부분에 비해 높은 비율로 선발될 가능성을 배제시킴. (만약 일련번호가 나이에 따라 부여될 때, 체계적 표집을 하면 더 정확하게 전집치를 추정할 수 있음)
- 단점: 표집오차 계산, 전집치 추정을 위한 적절한 통계기법이 없어 단순무선표집으로 가정하여 전집치 추정하는 경우가 많아 전집치를 편파추정 할 수 있음.
3) 군집표집(cluster sampling) 또는 집단표집
- 전집의 하위집단(sub-population or strata) 간 동질성이 높고, 하위집단 내 구성요소들 간에는 이질성이 높은 경우, 개별 표집단위를 하나씩 표집하는 것이 아니라 하위집단들 중 몇 개 집단을 선택하고 선택된 하위집단에 속한 모든 표집단위를 한꺼번에 표집하는 것. 하위집단을 선택할 때에는 무선표집법을 쓰는 경우가 많음.
- 하위집단 간 동질성을 얼마나 확보할 수 있는가에 따라 전집치 추정에 좋은 표집방법이 되기도 하고 안 되기도 함. 사전에 연구, 검토를 통해 하위집단 간 동질성을 확보할 수 있으면 다른 표집 방법보다 비용절감효과를 높일 수 있음.
- 그러나 소수의 군집을 추출할 경우 표집오차가 클 수 있기 때문에 모집단을 대표하는 표집을 얻으려면 많은 수의 군집을 표집해야 함. 이를 위해 군집 크기를 작게 하거나 유층군집표집을 하는 것이 바람직.
4) 유층표집(stratified sampling) 또는 다단계표집
- 전집을 구성하는 표집단위들을 다소 이질적이라 생각되는 하위집단들로 나눈 다음 각 하위집단 내에서 다시 무선표집(즉, 유층무선표집), 체계적표집(즉, 유층체계적표집), 군집표집(즉, 유층군집표집)을 하는 방법.
ex. 전국 교원 40만명 중 2천명을 표집할 때, 근무지역을 대도시/중소도시/읍면지역으로 나눈 뒤 각 지역에 따른 전국민 인구비례인 50%, 25%, 25% 비율로 대도시에 있는 교원 1천명, 중소도시 500명, 읍면지역 500명을 표집하는 방법. 이때 각 지역 내에서 할당된 인원수를 선택하는 방식에 따라 유층무선표집, 유층체계적표집, 유층군집표집이 됨. - 각 유층 내에서 표집 크기를 전집 구성비율과 같도록 무선표집할 경우 비율적 유층무선표집(propotional stratified random sampling)
- 전집을 하위집단으로 분류할 때는 하나의 변인(예: 지역)을 사용할 수도 있지만 여러 변인들을 사용해 여러 단계로 분류할 수 있음.
ex. 교육연구에서 위계적이면서도 여러 단계로 하위집단을 나누기 위한 변인으로 나이, 성별, 지역, 학교급, 설립자(국공립, 사립), 설립목적(인문계, 실업계, 특수목적계) 등이 사용됨. - 여러 단계로 나누어 표집할 경우, 예를 들어, 3단계 표집 방법을 사용해 지역, 학교, 교원 순으로 표집한다고 할 때, 제1차 표집대상인 지역을 제1차 표집단위(primary sampling unit=PSU), 2차 표집대상인 학교를 제2차 표집단위(secondary sampling unit = SSU), 마지막 표집 대상인 교원을 제3차 표집단위(third sampling unit=TSU)라고 함.
Q. 유층표집을 사용하는 것이 다른 방법에 비해 바람직한 경우는?
- 연구자의 관심이 전집치에 대한 것과 하위집단 통계치에도 관심을 가질 때.
ex. 교원의 의견이 전국적으로 어떻게 나타나는지에도 관심, 각 지역에 따라 같은지 다른지 여부에도 관심이 있다면 지역별 유층표집을 하는 것이 바람직. - 관심있는 변인이 각 하위집단 간에는 이질적이고 하위집단 내에서는 비교적 동질적일 때 사용.
5) 행렬표집(matrix sampling)
- 전집의 크기가 크고 전집의 여러 가지 특성에 관심을 가질 경우, 각 특성별로 서로 다르게 표집단위들을 표집하는 것.
ex. 전국 고등학교 학생의 국어 교과 학업성취도를 파악하고자 하는 연구를 수행할 때, 모든 대상자들이 국어성취도 검사를 모두 시행하는 것이 아니라, 시험문항을 3등분하고 일부 학생 표집해(표집A) 앞부분 1/3문항들에 응답, 다른 일부 학생들을 표집해(표집B) 중간 1/3 문항들에 응답하게 하고, 또 다른 일부 학생들을 표집해(표집C) 마지막 1/3 문항들에 응답하게 하는 것. - 장점: 짧은 시간에 적은 수의 문항들에 응답하게 함으로 표집된 학생들에게 많은 부담을 주지 않고 전체 학생들의 학업성취도를 추정할 수 있음.
- 이 표집방법을 사용하는 경우, 개별 학생(표집단위) 점수는 별 의미 없고 표집된 학생 전체의 전반적인 반응결과만이 의미 있는 분석 대상이 됨.
2. 비확률적 표집 방법
- 연구자의 주관적인 판단에 따라 전집의 특성을 잘 나타낼 것이라 판단되는 표집들을 임의로 표집하는 것. 전집치 추정, 가설검증하기에는 부적절.
- 경우에 따라서 전집에 대한 규정이 애매모호해 전집을 구성하는 각 표집단위에 일련번호를 제대로 부여할 수 없어서 특정 표집단위가 표집에 선택될 확률마저 모호한 경우가 있음. 전집의 총수를 확인할 수 없으면 특정 표집단위가 표집될 확률을 계산할 수 없음.
- 어떤 현상에 대해 과학적 연구보다 가치판단. 의사결정이 요구되는 평가연구, 정책연구를 수행하기 위해 자주 사용. 전문가적 판단에 근거해 전집에 대한 명확한 규명이나 어떤 표집단위가 선택될 확률 등을 고려함 없이 표집하는 것.
1) 판단적 표집(judgement sampling) 또는 유목적적 표집(purposive sampling)
- 할당표집(quota sampling): 전집 특성을 특정 변인에 따라 몇 개의 하위집단으로 나누고 그 집단 안에서 표집수를 임의로 할당하는 것.
- 전형적 사례 표집(typical case sampling): 전집을 구성하는 표집단위들 중 가장 전형적인 것을 골라 표집하는 것
- 극단적 사례 표집(extreme case sampling): 극단적, 예외적인 것을 골라 표집하는 것
- 중요한 사례 표집(important case sampling): 전집에서 가장 중요하다고 판단되는 사례들만 골라 표집하는 것
2) 임의적 표집(accidental sampling)
- 연구자가 선발할 수 있는 대상들을 자신에게 편리하도록 임의로 표집하는 것
3) 포도덩굴식 표집(grapevine sampling)
- 뚜렷한 표집계획 없이 임의로 대상을 선정하고, 그 대상자로부터 다음 대상자를 추천받아 표집에 포함시키는 방법.
- 단점: 전집치 추정에 어느 정도 오차가 있는지 알 수 없고, 확률통계 이론에 의해 전집치 추정을 할 수 없음.
[출처] 학위논문 작성을 위한 교육연구 및 통계분석(백순근 저)
'대학원 > 기초통계' 카테고리의 다른 글
헷갈리는 기초통계 개념 #1 - 변수, 변량, 분산, 공변인, 공분산(variable, variate, variance, covariate, covariance) 개념 차이 (0) | 2023.06.10 |
---|---|
[기초통계] 신뢰도와 타당도 (feat. 필요조건과 충분조건 개념) (0) | 2023.05.08 |
[기초통계] 변산성 수치 - 편차, 분산, 표준편차 개념과 의미 (1) (0) | 2023.05.07 |
[기초통계] 기술통계 & 추리통계 개념 (0) | 2023.05.03 |
통계 개념 (한/영) (last update: 23. 5. 27.) (0) | 2023.05.02 |
댓글