Publications

Detailed Information

설문자료의 결측치 처리방법에 관한 연구: 다중대체법과 재조사법을 중심으로 : The Treatment of Missing Values using the Integrated Multiple Imputation and Callback Method

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

고길곤; 탁현우

Issue Date
2016-12
Publisher
서울대학교 행정대학원
Citation
행정논총, Vol. 54 No. 4, pp. 291-319
Keywords
missing valuemultiple imputationcallbacksurvey결측치설문조사재조사법다중대체법
Abstract
결측치에 대한 고민 없이 분석에서 제외하는(완전제거법) 경우, 기술통계 뿐만 아니라 상관관계나 회귀계수 같은 변수 간 관계에 대한 분석결과에도 영향을 미친다는 사실이 알려져 있다. 하지만 재조사법과 다중대체법과 같은 통계적 방법 등 결측치를 어떻게 처리할 것인가에 대한 연구에 비해 이들의 실질적인 활용방법에 관한 연구는 부족한 실정이다. 본 논문은 재조사법과 통계적 대체방법의 장점을 결합한 분석방법을 제시하였다. 단순히 재조사법과 다중대체법 간의 상대적 우월성 평가에 맞추기보다는, 이들을 적절히 조화한 비용효과적인 결측치 보정 가능성을 제시하였다. 또한, 그 성능을 평가하기 위해 가상데이터에 대한 시뮬레이션 자료와 실제 설문자료를 이용하여 분석 결과의 타당성을 교차 검증하였다. 분석 결과 시뮬레이션과 실제 데이터를 이용한 분석 모두에서 결측 메커니즘이나 변수 간 관계 등과 상관없이 결측률이 약 30% 이하인 경우 통계적 다중대체법이 통계적 편의를 유발하지 않는 것으로 나타났다. 또한, 특정 변수의 결측된 원인을 설명할 수 있는 변수인 종속변수나 분석모형에 포함되지 않더라도 결측된 변수를 설명할 수 있는 관측된 변수(보조변수)를 대체모형에 포함하는 경우, 통계적 대체방법의 성능은 더욱 향상되는 것으로 나타났다. 따라서, 결측률이 높은 자료에서도 재조사법을 통해 결측률을 일정 수준 이하로 낮추는 경우 통계적 대체방법을 통해 분석결과의 타당성을 높일 수 있음을 확인하였다. Even though many studies warn of the impact of missing values on analytical results, in practice, researchers simply rely on the listwise deletion method for their own convenience. Some argue that the multiple imputation method is inferior to the callback method even if they want to utilize it. This paper tries to integrate the multiple imputation method with the callback method. As the callback method is costly, the appropriate ratio is a practically and theoretically important question. This survey tries to suggest a ratio using survey and simulation data. According to the results of the analysis, the multiple imputation method does not cause significant statistical bias regardless of missing mechanisms or correlation among variables if the missing rate is less than 30%. In particular, including more auxiliary variables related to the missing structural mechanism can increase the performance of the multiple imputation. Hence, the callback approach can be used to reduce the missing rate below 30% and the multiple imputation to improve the validity of the results of analysis.
ISSN
1229-6694
Language
Korean
URI
https://hdl.handle.net/10371/100253
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share