Publications

Detailed Information

복합 표본자료 기반 인과효과 추정을 위한 역확률 가중치 방법 : Inverse Probability Weighting Methods for Estimating Causal Effects using Complex Survey Design Data
국민건강영양조사 자료를 중심으로

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

하나영

Advisor
이우주
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
복합 표본조사 자료역확률 가중치 방법국민건강영양조사모집단 평균처치효과
Description
학위논문(석사) -- 서울대학교대학원 : 보건대학원 보건학과(보건학전공), 2023. 2. 이우주.
Abstract
보건 분야에서는 국민의 건강 증진을 위한 정책 설립의 근거자료로 활용하기 위해서 복합 표본조사 설계를 기반으로 한 대규모 표본조사가 널리 시행되고 있다. 본 연구는 이러한 복합 표본조사 자료를 활용하여 역확률 가중치(Inverse Probability Weighting) 방법에 표본 가중치를 적절하게 적용하는 방법을 검토하는 것을 목적으로 한다. 역확률 가중치 방법은 두 단계로 이루어진다. 첫번째는 성향점수를 추정하는 단계이고, 두번째는 추정한 성향점수를 이용하여 모집단에 대한 인과효과를 추정하는 단계이다. 첫번째 단계에서 선행연구들의 접근 방식에 따른 차이를 파악하고, 국민건강영양조사 자료 분석 시 고려사항과 가이드라인을 제공하고자 한다. 각 단계에서 표본 가중치 고려여부에 따라 4가지 조합의 시나리오를 구성할 수 있다. 이러한 시나리오 하에서 모집단 평균 처치효과(Population Average Treatment Effect)의 추정치를 비교하기 위해 모의시험과 국민건강영양조사 자료분석을 수행하였다. 모의실험 결과에 따르면 성향점수를 추정하는 첫번째 단계에서 표본 가중치를 고려하는 여부와 관계없이 두번째 단계에서 이를 고려할 때 좋은 성능을 보였다. 더 나아가, 두 단계 모두 표본 가중치를 고려하는 방법이 표본에 선택될 확률과 처치가 의존하는 정도와 관계없이 가장 강건함을 확인하였다. 국민건강영양조사 자료의 표본 가중치는 무응답 보정이 포함되어 있으므로 처치와 표본 선택이 항상 독립이라고 보기는 어렵다. 따라서 가능하면 역확률 가중치 방법의 두 단계 모두 표본 가중치를 고려하는 방법으로 분석하는 것을 권장한다. 만약 이들이 독립이라면, 성향점수 추정 모델에 표본 가중치를 고려한 것과 하지 않은 결과가 비슷하므로 이를 통해 민감도 분석을 진행해보는 것도 추천한다.
In the field of public health, large-scale surveys based on complex survey designs are widely conducted to be used as fundamental data to formulate health policies. This study aims to investigate how sample weights might be incorporated into Inverse Probability Weighting (IPW) methods using data from complex survey design. IPW method consists of two stages. The first stage involves to estimate the propensity score (Stage 1) and the second stage uses the propensity score to estimate the causal effect on the population (Stage 2). We attempt to identify the differences between the various approaches of precious studies in the first stage. We also try to propose considerations and recommendations when analyzing data from Korean National Health and Nutrition Examination Survey (KNHANES). There are four possible scenarios depending on whether sample weights are considered at each stage. To compare the Population Average Treatment Effect (PATE) estimates under such scenarios, simulation studies and data analysis using KNHANES data were conducted. According to the simulation studies under the scenarios, sample weights included in Stage 2 performed well regardless of whether they were considered in Stage 1. Furthermore, it is robust to consider sample weights in both Stages 1 and 2 regardless of how much the probability of selection for the sample depends on the treatment. Treatment and sample selection are not necessarily independent since non-response corrections are considered when generating sample weights from the KNHANES data. As a result, it is recommended to use a method that incorporates the sample weights in both stages. If the treatment and selection are independent, results are similar whether or not the sample weights are considered in Stage 1. For that reason, it is suggested to conduct a sensitivity analysis.
Language
kor
URI
https://hdl.handle.net/10371/193728

https://dcollection.snu.ac.kr/common/orgView/000000176208
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share