Publications

Detailed Information

Cardiovascular risk assessment and machine learning prediction model of metabolic comorbidity : 대사 질환 동시 이환의 심혈관계 질환 위험 평가 및 기계학습 예측 모형 개발

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

안서경

Advisor
박수경
Issue Date
2022
Publisher
서울대학교 대학원
Keywords
metaboliccomorbiditylifestylepreventioncardiovasculardiseasebiologicalagepredictionmodel
Description
학위논문(박사) -- 서울대학교대학원 : 의과대학 의과학과, 2022. 8. 박수경.
Abstract
연구 배경: 인구의 고령화와 서구형 생활양식으로 인해 대사 질환 동시 이환 (고혈압, 당뇨병, 및 고지혈증 등을 포함한 두가지 이상의 대사 질환을 가진 것으로 정의)의 유병률이 증가하고 있다. 이러한 대사성 질환은 심혈관계 질환의 위험 증가와 연관된다. 2016년 Global Burden of Disease에 따르면, 심혈관계 질환에 의한 사망은 21세기 주요 사망 원인이며, 우리나라에서는 암에 이어 두번째로 높은 사망원인을 차지한다. 세계보건기구 (The World Health Organization)에서는 음주, 흡연, 비만, 신체 활동, 건강한 식습관을 심혈관계 질환의 예방 가능한 요인으로 지정한 바 있다. 이에 대사 질환 동시 이환에 대한 연구가 필요하다. 따라서, 이 연구의 목적은 1) 한국에서의 대사성 질환과 동시 이환의 유병률을 추정하고; 2) 대사 동시 이환 심혈관계 가족력과 심혈관계 발생 위험을 평가하고, 3)대사 동시 이환에 따른 심혈관계 사망에 대해 생활습관 요인 미치는 영향을 평가하고; 4) 생활 습관 변화와 대사 증후군의 연관성을 확인하고; 5) 대사 동시 이환에 대한 기계학습을 기반으로 한 건강 연령 및 질병 위험 예측 모형을 개발하는 것이다.
연구 방법: 본 연구는 한국인유전체역학조사사업 (KoGES)의 도시기반 (Health examinee-Gem Study, HEXA), 농촌기반 (Cardiovascular disease association study, CAVAS), 지역사회기반 (Ansan and Ansung Study, 2001-2014)를 주로 사용하였고, 추가로 미국 국민건강영양조사 (US National Health and Nutrition Examination Survey, NHANES 2003-2014), 한국국민건강영양조사 (Korea NHANES, KNHANES 2007-2014), 아시아 코호트 연구 (Asia Cohort Consortium)를 사용하였다. 통계방법으로는, 세계보건기구의 세계표준인구를 이용한 직접 표준화 방법을 이용해 대사성 질환의 연령표준화 유병률을 산출하였다. 연구 대상자의 일반적인 특성은 연속형 변수의 경우 Students t-test, 범주형 변수의 경우 Chi-squared test를 시행하여 비교하였다. 콕스 비례 위험 회귀 분석과 로지스틱 회귀 분석을 수행하여 hazard ratios (HRs), odds ratio (ORs), 95% confidence interval을 추정하였다. 위험 예측 모형의 경우, training set (전체 대상자의 70%)에서 콕스 비례 회귀 분석, random survival forest 기반 모형을 각각 구축하고, test set (전체 대상자의 30%)에서 concordance index (c-index)를 이용해 각 모형의 성능을 평가하였다. 건강 연령 예측 모형의 경우, 10-fold validation을 사용한 elastic net 방법을 이용해 모형을 구축하였다.
연구 결과: 한국과 미국의 대사성 질환과 동시 이환을 비교한 결과, 한국이 미국보다 대사 동시 이환의 유병률이 낮았다. 한국과 미국에서 가장 흔한 대사 질환 조합은 고혈압과 비만이었다. 한국 인구 중 농촌 지역에 거주하는 인구는 도시 지역에 거주하는 인구보다 대사 동시 이환 유병률이 더 높은 것으로 나타났다.
대사 동시 이환, 심혈관계 질환 가족력, 그리고 심근경색과 뇌졸중을 포함한 심혈관계 질환의 위험 연구 결과는 다음과 같다. 고혈압, 당뇨병, 고지혈증이 있고, 심혈관계 가족력이 있는 대상자는 심혈관계 질환 가족력과 질병이 없는 대상자에 비해 유의하게 심혈관계 질환 (HR 2.88, 95% CI: 1.96-4.24), 심근경색 (HR 3.30, 95% CI: 2.06-5.29), 뇌졸중 (HR 2.52, 95% CI: 1.33-4.79) 위험이 증가하는 것을 확인했다
심혈관대사 질환 동시 이환을 가진 대상자에서 생활 습관 요인이 심혈관계 질환 관련 사망에 미치는 영향 연구에서는, 비흡연, 금주, 체질량 지수 18.5–27.4kg/m2를 건강 상태로 정의하여 건강한 생활 습관 점수를 산출했다. 생활 습관 요인 중 금연은 심혈관계 질환 사망 위험 감소와 가장 강한 연관성을 보였다. 고혈압, 당뇨병, 관상동맥질환이 있는 대상자에서는 건강한 생활 습관 점수가 1씩 증가할 때마다 심혈관계 사망위험이 24% (HR 0.76, 95% CI: 0.63-0.93)씩 감소했다. 2개 이상의 심혈관계 대사질환이 있는 대상의 경우, 건강한 생활 습관 요인은 3가지 모두 있는 경우 심혈관계 질환 사망 (HR 0.51, 95% CI: 0.42-0.61)과 심혈관계 질환으로 인한 조기 사망위험(HR 0.38, 95% CI: 0.27-0.54)의 감소에 유의한 영향이 있었다.
지역사회기반 연구자료를 이용한 반복 측정된 생활 습관 요인의 변화에 따른 대사 증후군 위험 연구에서는, 하루 흡연 개피수의 증가 (HR 1.49, 95% CI: 1.09-2.03), 음주량의 light/moderate에서 heavy로 증가는 (HR 1.42, 95% CI: 1.10-1.84) 대사 증후군의 발생 위험의 증가와 유의한 연관성을 보였다. 새롭게 비만 된 대상자는 꾸준히 적정 체중을 유지하는 대상자에 비해 대사성 증후군 (HR 1.88, 95% CI: 1.44-2.45)의 발생 위험의 증가와 유의한 관계를 보였다.
보다 정밀한 개인 맞춤 건강 상태 예측 및 개선을 위해 기계 학습 기반 질병 예측 모형을 개발과 대사 동시 이환에 대한 예측 변수로서의 건강연령을 개발한 연구에 따르면, 실제 연령에 비해 젊은 건강 연령을 가진 경우, 당뇨병 (HR = 0.63, 95% CI: 0.55–0.72), 고혈압 (HR = 0.74, 95% CI: 0.68–0.81), 당뇨병과 고혈압 동시 이환 (HR = 0.65, 95% CI: 0.47–0.91) 위험도가 낮은 것으로 나타났다. 기계학습기반 예측 모형 연구 결과, 기계 학습 기반의 고혈압과 당뇨병 동시 이환 모형은 높은 통계적 질병 예측력을 보이는 것으로 나타났다.
연구 결론: 본 연구는 한국 인구집단에서 심혈관계 질환 발생 및 사망의 위험을 줄이기 위해 대사 동시 이환에 대한 연구에 대한 필요성을 강조한다. 본 연구에서는 동시 이환을 가진 대상자 중 특히 심혈관계 질환 가족력이 있는 경우에 심혈관계 질환의 발생 위험이 증가하는 것을 확인하였다. 또한 심혈관계 대사 질환 동시 이환을 가진 대상자라도, 금연, 금주, 표준 체질량 지수 유지와 같은 건강한 생활 습관은 심혈관계 질환으로 인한 사망과 조기 사망 위험 감소와 연관성이 있었다. 또한, 건강한 생활습관으로의 변화를 통해 대사 증후군의 위험을 줄이는 데 도움이 되는 것을 확인하였다. 이러한 요인들을 기반으로 기계학습을 이용하여 구축된 질병 예측 모형과 건강연령은 우리나라에서의 대사 질환 동시 이환에 대한 고위험군을 파악하고 이를 미리 예방함으로써, 건강증진을 통해 질병 부담을 줄이는 효과적인 도구로 활용될 수 있을 것으로 기대된다.
Introduction: The growing aging population and westernized lifestyle have increased the prevalence of disease comorbidity, which is defined as having more than two metabolic diseases including hypertension (HTN), diabetes mellitus (DM), dyslipidemia (LIP), obesity, and metabolic syndrome (MetS). The combination of these diseases is related to an increased risk of cardiovascular disease (CVD) outcomes. The Global Burden of Disease 2016 Study reported that CVD are by far the leading cause of death globally and one of the major health challenges of the 21st century. In Korea, CVD is the second largest cause of death following cancer.
As those diseases share risk factors, the World Health Organization (WHO) designated healthy lifestyle, including alcohol reduction, weight loss, smoking cessation, physical activity, and healthy diet, as modifiable factors of CVDs. Thus, it is necessary to estimate the amount of comorbidity prevalence, identify the combined association of metabolic comorbidity and other risk factors (family history of CVD and lifestyle factors) with CVD outcomes, and develop predictive model for comorbidity for detecting the high-risk of metabolic comorbidity and preventing the future risk of CVD through intervention strategies.
Methods: This study mainly used population-based cohort study from the Korea Genome and Epidemiology Study (KoGES) including Health Examinee-Gem study (HEXA), cardiovascular disease association study (CAVAS), and Ansan and Ansung Study from 2001-2014, in addition to United States (US) National Health and Nutrition Examination Survey 2003-2014 (NHANES), Korea NHANES (KNHAENS) 2007-2014, and Asia Cohort Consortium (ACC) study.
For the statistical analyses, direct standardization methods using the WHO world standard population was performed to estimate the age-standardized prevalence of metabolic diseases. The baseline characteristics were compared using Chi-squared test for categorical variables and Students t-test for continuous variables. Cox proportional hazards regression analysis was performed to estimate hazard ratios (HRs) with 95% confidence intervals (CIs) of CVD outcomes. To calculate the odds ratios (ORs) of metabolic diseases, logistic regression models were used. For prediction model, cox proportional hazard regression, and random survival forest (RSF) models were developed in the training set (70% of the total population) and performance evaluations of each model were performed in the test set (30% of the total population) with concordance statistics (c-index). For self-assessed biological age (BA) prediction model, elastic net regression analysis with 10-fold cross validation was performed.
Results: According to the comparison of the prevalence of metabolic disease and comorbidity in Korea and the US, Korea had a lower prevalence of metabolic comorbidity than the US. In both Korean and the US population, the most common combination was HTN and obesity. Among the Korean population, individuals living in rural areas had the higher comorbidity prevalence than those who lived in urban areas.
In the association between metabolic comorbidity, family history of CVD, and the risk of CVD study, we found that individuals with DM, HTN, LIP, and a positive family history of CVD had a 2.88-fold increased risk of CVD, a 3.30-fold increased risk of MI, and a 2.52-fold increased risk of stroke compared to the individuals with a negative family history of CVD and none of metabolic diseases.
In the impact of lifestyle factors with cardiometabolic disease (CMDs) such as HTN, DM, coronary heart disease (CHD), and stroke on CVD death study, the healthy lifestyle status was defined as never smoker, never drinker, and body mass index (BMI) 18.5–27.4kg/m2in Asian population. Among the lifestyle factors, non-smoking had the strongest association with decreasing risk of all cause and CVD death among the healthy lifestyle factors. A significant association of healthy lifestyle score with lower CVD death was observed among individuals with HTN, DM, and CHD (HR 0.76, 95% CI: 0.63-0.93). For individuals with cardiometabolic comorbidity, having three of healthy lifestyle factors was significantly associated with decrease in CVD (HR 0.51, 95% CI: 0.42-0.61) and premature CVD death (HR 0.38, 95% CI: 0.27-0.54).
Based on the repeated measurements for assessing change in lifestyle factors study, unhealthy lifestyle modification including increased dose of cigarette smoking (HR 1.49, 95% CI: 1.09-2.03) and increased their intensity of consumption from light/moderate to heavy had a significantly increased risk for MetS (HR 1.42, 95% CI: 1.10-1.84). For obesity, individuals who newly became obesity had a significant increase in risk for MetS (HR 1.88, 95% CI: 1.44-2.45).
For improving the individualized health status, we developed machine learning-based disease prediction model and self-assessed BA as a predictor for metabolic comorbidity. We found that compared to the individuals in same BA as chronological age (CA) group, those in younger BA than CA group were associated with a decreased risk of DM (HR = 0.63, 95% CI: 0.55–0.72), HTN (HR = 0.74, 95% CI: 0.68–0.81), and combination of HTN and DM (HR = 0.65, 95% CI: 0.47–0.91). For machine learning-based disease prediction model study, predictive models achieved a high discriminatory ability for comorbidity of HTN and DM.
Conclusions: This study highlights the necessity of accounting to metabolic comorbidity to reduce the future risk of CVD outcomes in Korean population. Although individuals already have had cardiometabolic comorbidity, healthy lifestyles (smoking cessation, abstaining from alcohol, and maintaining BMI) are effective to reduce the further risk of CVD death. Moreover, lifestyle changes help to decrease the risk of a cluster of metabolic conditions. At last, machine learning-based self-assessed BA and disease prediction model may be an effective indicator for identifying the high-risk group and decreasing burden of metabolic comorbidities in Korea through prevention.
Language
eng
URI
https://hdl.handle.net/10371/188323

https://dcollection.snu.ac.kr/common/orgView/000000172163
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share