Publications

Detailed Information

Self-management Strategies Clustering and Prediction of Health-Related Quality of Life in Cancer Survivors and Survival in Advanced Cancer Patients Using Machine Learning Techniques : 자가건강전략의 클러스터링과 머신러닝 기법을 사용한 암생존자의 삶의 질 및 진행성 암환자의 생존 예측

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

정주연

Advisor
윤영호
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
암생존자진행성암환자삶의 질생존머신러닝클러스터링예측
Description
학위논문(박사) -- 서울대학교대학원 : 의과대학 의과학과, 2023. 2. 윤영호.
Abstract
Background: In cancer-care, self-management strategies can help cancer patients improve their health-related quality of life (HRQoL) or survival, irrespective of the cancer stage or their treatment plan. However, there is insufficient research on the clustering of self-management strategies considering cancer stages in natural clinical settings; the prediction model of HRQoL or survival in cancer patients also lacks research. In addition, research that has comprehensively identified the relationship between self-management strategies, HRQoL, and survival still needs to be completed. Hence, we investigated their relationship using clustering methods, machine learning techniques (MLT), and path analysis of structural equation modeling (SEM).

Methods: In cancer survivors, cluster analyses using principal component analyses in varimax rotation and clustering of the k-means method were conducted to examine the interrelationship among self-management strategies in smart management strategies for health assessment tool (SAT). Multivariate-adjusted analyses were performed to identify the association of self-management strategies with HRQoL after 6 months. We constructed the HRQoL prediction model and compared the performance of the model with ensemble algorithms including decision tree, random forest, gradient boosting, eXtreme Gradient Boost (XGBoost), and LightGBM. Next, we selected the XGBoost model for further analysis. We demonstrated critical features of HRQoL and extracted the individual prediction result in the XGBoost model using SHAP. In advanced cancer patients, self-management clustering and multivariate-adjusted analyses for examining the association of the strategies with the HRQoL were conducted the same way as in cancer survivors. We performed dimensional multiple Cox proportional hazard regression analyses to determine critical predictors for 1-year survival. We established a survival prediction model with the XGBoost method using MLT with the critical predictors in the Cox regression model. To examine the causal relationship among SAT strategies, HRQoL, and survival, we used a subgroup analysis and a path analysis of structural equation modeling.

Results: All cancer survivors and advanced cancer patients experienced two clusters in the self-management strategies concurrently. However, the strategy clusters differed by cancer stage. Advanced-stage cancer patients used core strategies along with preparation and implementation strategies to overcome their crisis. Among all cancer patients, the self-management strategies had a positive association with improved HRQoL, even in advanced cancer patients. In the prediction model development, the XGBoost model for HRQoL showed high performance in cancer survivors. The important variables for each HRQoL factor were different. Moreover, there was a specific method to provide customized healthcare services by employing the individual prediction method with SHAP with a web-based survey study for cancer survivors. In advanced cancer patients, the univariate dimensional Cox model showed that ECOG performance status, marital status, sex, global QoL, dyspnea, pain, appetite loss, constipation, depression at baseline, and clinically meaningful change of emotional functioning were predictive factors with worse survival. In the prediction model using MLT, the XGBoost model of survival showed high performance. The performance was optimum when the model was constructed by combining variables selected by the Cox model and MLT methods: depression, pain, appetite loss, constipation, sex, ECOG performance status, and clinically meaningful change in emotional functioning. We also revealed a causal relationship among SAT strategies, depression, and survival in advanced cancer patients using path analysis.

Conclusions: This study is the first to examine the self-management strategy clusters considering cancer stages and different groups of cancer patients, such as cancer survivors and advanced cancer patients. To our knowledge, this is first study to have developed and validated HRQoL prediction models, interpreted the models, and suggested utilization of these results in a clinical setting for cancer survivors. Additionally, we revealed an association of self-management strategies with HRQoL and survival in advanced cancer patients using MLT methods and path analysis. These study results can increase the understanding of self-management strategies and help healthcare providers with healthcare services for cancer patients in the cancer-care continuum.
연구 배경: 암 케어 연속선상에서 자가관리전략은 암 병기 또는 치료 계획과 관계없이 암환자의 건강관련 삶의 질 또는 생존을 개선하는데 도움이 될 수 있다. 그러나 실제 임상 현장에서 암 병기를 고려한 자가관리전략이 어떻게 클러스터링 되는지에 대한 연구와 암환자의 건강관련 삶의 질 또는 생존 예측 모델은 부족한 실정이다. 또한 암환자의 자가관리전략과 건강관련 삶의 질, 생존 간의 관계를 종합적으로 살펴본 연구는 아직까지 없는 실정이다. 따라서 본 연구는 클러스터링 통계 방법, 머신러닝 기술 및 구조방정식 모델의 경로분석을 활용하여 암환자의 자가관리전략, 건강관련 삶의 질 및 생존 간의 관계를 규명하고자 하였다.

연구 방법: 암생존자의 경우, 새롭게 개발한 건강경영전략(Smart Management Strategies for Health Assessment Tool, SAT)으로 자가관리전략을 측정하여 SAT 전략들 간의 상호관계를 조사하기 위해 주성분 분석과 K-mean 클러스터링 방법을 사용한 군집 분석을 수행하였다. 또한 SAT 전략과 6개월 후의 HRQoL 간의 연관성을 확인하기 위해 다변량 분석을 수행하였다. 암생존자의 HRQoL 예측 모델 개발 및 검증을 위해서는 예측 모델을 구성하고, 결정 트리, 랜덤 포레스트, 경사 부스팅 (Gradient boosting), XGBoost, and LightGBM의 앙상블 알고리즘을 사용하여 모델의 성능을 비교하였다. 모델 비교 후, 추가 분석을 위해 최종적으로 XGBoost 모델이 선택되었고, XGBoost의 HRQoL 예측 모델의 중요한 변수를 찾고자 SHAP을 사용하여 특성 중요도 (Feature importance) 및 개별 예측 (Individual prediction) 분석을 수행하였다. 진행성 암환자에서 HRQoL과 SAT 전략의 연관성을 조사하기 위한 클러스터링 및 다변량 분석 방법은 암생존자에서 수행했던 방법과 동일하였다. 생존 예측 모델 개발을 위해 기존의 통계분석을 사용하여 차원 다중 Cox 비례 위험 회귀 분석을 수행하였고, 머신러닝 기법의 XGBoost방법으로 생존 예측 모델을 개발하였다. 본 연구에서는 전통적 통계 방법에 의해 선택된 변수와 머신러닝 기법에 의해 선택된 변수 및 두 방법에 의해 선택된 변수를 결합하여 예측모델을 개별적으로 구성하였고, 성능을 비교하였다. 또한 구조방정식 모델을 활용한 경로분석을 통해 SAT 전략과 HRQoL, 생존 간의 인과관계를 규명하고자 하였다.

연구 결과: 암생존자 및 진행성 암환자의 SAT 전략 클러스터링은 암병기에 따라 다르게 나타났다. 중기-말기 단계 암 환자들은 초기 단계 암환자들에 비해 위기를 극복하기 위해 자가관리전략에서 치료 시기 및 암병기에 관계없이 모든 단계에서 중요한 핵심 전략을 준비 및 실행전략과 함께 사용하는 것으로 나타났다. 또한 이러한 SAT 전략은 진행성 암환자를 포함하여 모든 암환자에게서 개선된 HRQoL과 긍정적인 연관성을 보여주었다. 머신러닝을 활용한 HRQoL의 예측 모델은 암생존자에서 높은 예측 성능을 보여주었다. 그러나, 각 HRQoL 요인에 대한 중요 변수는 서로 다르게 나타났다. 또한 본 연구는 암생존자를 대상으로 한 웹 기반 설문 조사 연구와 새롭게 찾아낸 SHAP을 통한 개인 예측 방법을 접목함으로써 암생존자를 대상으로 한 개인 맞춤형 의료 서비스 제공 방안을 구체적으로 제시하였다. 진행성 암환자에서 차원별 단변량 Cox 모델에서는 ECOG 수행 상태, 성별, 결혼상태, 진단시점에서의 일반적 삶의 질 저하, 호흡곤란, 통증, 식욕감퇴, 변비, 우울, 12주 동안의 임상적으로 의미 있는 정서적 기능 및 사회적 지지의 변화가 최종적으로 더 저하된 생존과 관련이 있는 요인으로 나타났다. 머신러닝방법을 활용한 예측 모형에서도 높은 생존 예측 성능이 나타났고, BorutaSHAP을 통해서는 우울, 통증, 식욕감퇴, 변비, 성별이 생존과 연관된 중요한 요인으로 선별되었다. 기존의 전통적 통계방법과 머신러닝 기법으로 선정된 변수를 결합하여 모델을 구성하였을 때, 생존 예측 모형에서 가장 높은 성능이 발견되었다. 경로분석에서는 SAT전략, 우울, 생존 간의 인과관계를 밝혔으며, 우울 변수를 완전 매개로 SAT 전략의 생존에 대한 간접효과가 있는 것이 발견되었다.

연구 결론: 본 연구는 처음으로 암생존자 및 진행성 암환자를 모두 포함하여 암병기를 고려한 자가관리전략 사용 군집 분석을 시도하였다. 또한 본 연구는 처음으로 암생존자에게 중요한 건강관련 삶의 질을 예측하는 단순한 모델을 개발 및 검증하였고, 설명 가능한 인공지능 알고리즘을 활용하여 모델을 해석하고, 암생존자를 위해 임상환경에서 본 연구의 결과 활용할 수 있는 방안을 제안하였다. 또한 본 연구에서는 머신러닝 기법과 경로분석을 사용하여 진행성 암환자의 자가관리전략과 건강관련 삶의 질 및 생존 간에 직·간접적으로 긍정적인 연관성이 있음을 발견하였다. 이러한 연구결과는 새롭게 개발한 SAT 자가관리전략이 임상장면에서 암환자에게 유용한 개입 도구로 사용될 수 있음을 보여준다. 종합적으로 본 연구는 암환자의 자가관리전략 사용 및 그 효과성에 대한 이해의 폭을 넓혔고, 의료제공자가 암 케어 연속선상에서 암환자에게 도움이 되는 의료 서비스를 제공하는데 자가관리전략을 어떻게 활용할 수 있을지 종합적인 결과 및 임상적 활용방안을 제시하였다는데 의의가 있다.
Language
eng
URI
https://hdl.handle.net/10371/194133

https://dcollection.snu.ac.kr/common/orgView/000000174817
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share