Publications

Detailed Information

전자의무기록 데이터를 활용한 항암화학요법 부작용 예측모델의 개발 및 평가 : Development and evaluation of prediction models for chemotherapy-induced adverse drug reactions based on electronic health records

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

온정아

Advisor
박현애
Issue Date
2022
Publisher
서울대학교 대학원
Keywords
종양학항암화학요법약물이상반응기계학습전자의무기록
Description
학위논문(박사) -- 서울대학교대학원 : 간호대학 간호학과, 2022. 8. 박현애.
Abstract
항암화학요법으로 인해 부작용은 매우 흔하게 발생하며 그 증상 또한 다양하다. 항암화학요법 부작용은 치료 일정을 변경시키거나 중단시킬 수 있을 뿐 아니라, 환자의 삶의 질에도 부정적인 영향을 줄 수 있다. 본 연구에서는 전자의무기록 데이터로부터 기계학습 알고리즘을 이용하여 흔히 발생하는 여덟 개의 항암화학요법 부작용을 사이클 기준으로 예측하는 예측모델을 개발하고 그 성능을 평가하였다.
모델 개발에 이용된 데이터는 일개 종합병원에서 2015년 1월부터 2016년 6월까지 4가지의 항암화학요법(FOLFOX, 5-fluorouracil + oxaliplatin + leucovorin; FOLFIRI, 5-fluorouracil + irinotecan + leucovorin; paclitaxel; GP, gemcitabine + cisplatin)을 받은 935명의 환자의 6812건의 항암화학요법 사이클에 대한 전자의무기록 데이터이다. 예측된 항암화학요법 부작용에는 오심 및 구토, 피로 및 식욕부진, 설사, 말초신경병증, 과민반응, 구내염, 손발증후군, 변비가 포함되었다. 부작용 예측에 이용된 위험요인은 항암제 약물허가문건과 부작용 관련 선행연구들을 고찰하여, 성별, 나이, 항암화학요법 관련 정보(항암화학요법 종류, 항암화학요법 사이클 횟수 등), 암 종류, 동반질환(당뇨, 심질환, 영양 상태 불량, 골수 기능 저하 등)으로 선정하였다. 선정된 위험요인 중, 부작용 별 단변량 분석을 통해 p≤0.05의 유의수준을 만족하는 요인들이 예측모델 개발에 이용되었다. 예측모델은 세 가지의 기계학습 알고리즘(로지스틱 회귀, 의사결정나무, 인공신경망)을 이용하여 개발되었다. 개발된 모델의 성능은 AUROC(Area of under the receiver operating characteristic curve), AUPRC(Area of under the precision-recall curve), 정확도를 이용하여 평가하였다.
개발된 부작용 예측모델의 AUROC는 로지스틱 회귀, 의사결정나무, 인공신경망 모델 각각 0.62–0.83, 0.61–0.83, 0.62–0.83이었고, AUPRC는 각각 0.04~0.45, 0.03~0.44, 0.04~0.48이었으며, 정확도는 각각 0.59–0.84, 0.55–0.88, 0.57–0.88이었다. 세 알고리즘 중 로지스틱 회귀 알고리즘이 여덟 개의 부작용 중 여섯 개에서 가장 높은 AUROC(0.67–0.83)를 나타내며, 가장 좋은 성능을 보였다. 부작용 중에서는 오심 및 구토 모델이 세 알고리즘을 이용한 모델 모두에서 0.83의 AUROC를 나타내며 가장 좋은 성능을 보였다.
본 연구에서 개발한 항암화학요법 부작용 예측모델은 여덟 개의 부작용의 발생위험을 항암화학요법 사이클 기준으로 예측하여, 사이클마다 달라지는 위험요인을 반영하고 있다. 또한 예측모델은 전자의무기록에서 추출한 환자의 위험요인을 활용하여 개발되어 임상실무에서 부작용을 예측하는 데 활용 가능하다. 예측모델에 의해 예측된 부작용 발생위험은 간호사가 환자의 부작용 발생위험에 따라 부작용 증상을 주의 깊게 관찰할 수 있도록 함으로써, 부작용의 조기 발견 및 빠른 관리에 도움을 줄 수 있다. 나아가 예측모델과 부작용 관리 지침을 연결하면, 발생한 부작용을 관리하기 위한 간호중재를 간호사에게 제공할 수 있을 것이다.
앞으로 본 연구에서 개발한 예측모델을 새로운 데이터로 검증하고 시범 사용하여 임상적 효과를 확인하는 연구가 필요하며, 부작용의 발생위험이 높은 환자들의 증상 조기발견 및 관리를 위한 권고안을 함께 제공해주는 의사결정지원시스템을 개발하는 연구를 제안한다.
Chemotherapy-induced adverse drug reactions (ADRs) are common and diverse, and not only affect changes or interruptions to treatment schedules, but also negatively affect the patients quality of life. This study aimed to develop and evaluate prediction models for eight common chemotherapy-induced ADRs by cycle based on electronic health records (EHR) data using machine-learning algorithms.
We used EHR data of 6812 chemotherapy cycles for 935 adult patients receiving four different chemotherapy regimens (FOLFOX, 5-fluorouracil + oxaliplatin + leucovorin; FOLFIRI, 5-fluorouracil + irinotecan + leucovorin; paclitaxel; and GP, gemcitabine + cisplatin) at a tertiary teaching hospital between January 2015 and June 2016. The predicted ADRs included nausea-vomiting, fatigue-anorexia, diarrhea, peripheral neuropathy, hypersensitivity, stomatitis, hand-foot syndrome, and constipation. Risk factors were selected by reviewing articles related to chemotherapy-induced ADRs and drug approval documents, and included sex, age, chemotherapy-related information (e.g, type of chemotherapy, number of cycles), type of cancer, comorbidity (e.g., diabetes, heart disease, malnutrition status, bone marrow depression). Risk factors satisfying the significance level of p≤0.05 in the univariate analysis for each ADR were used to develop the prediction model. Three machine learning algorithms were used to developed prediction models: logistic regression, decision tree, and artificial neural network. We compared the performance of the models with AUROC (area of under the receiver operating characteristic curve), AUPRC (area of under the precision-recall curve), and accuracy.
The AUROCs of the logistic regression, decision tree, and artificial neural network models were 0.62–0.83, 0.61–0.83, and 0.62–0.83, respectively, the AUPRCs were 0.04~0.45, 0.03~0.44, 0.04~0.48, respectively, and the accuracies were 0.59–0.84, 0.55–0.88, and 0.57–0.88, respectively. Among the algorithms, the logistic regression models performed best and had the highest AUROC for six ADRs (range 0.67–0.83). Among the ADRs, the nausea-vomiting prediction models performed best with an AUROC of 0.83 for the three algorithms.
The prediction models developed in this study predicted the risk of eight ADRs based on the chemotherapy cycle, so it reflects risk factors that can change with each cycle. In addition, the models used EHR data, so it can be implemented in healthcare systems to be used in clinical setting. The risk of ADRs predicted by the models can help the early detection and rapid management of ADRs by allowing nurses to carefully observe ADRs according to the patient's risk of ADRs. In addition, if the prediction models and the symptom management guidelines for ADRs are combined, it will be possible to provide nurses with nursing intervention recommendations to manage the ADRs that have occurred.
Future research is needed to validate the prediction model developed in this study with new data and to identify the clinical effectiveness of the prediction models. We propose a study to develop a clinical decision support system that provides recommendations for early detection and management of ADRs based on ADRs risk from the prediction models.
Language
kor
URI
https://hdl.handle.net/10371/187537

https://dcollection.snu.ac.kr/common/orgView/000000173015
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share