Publications

Detailed Information

전자의무기록자료 기반 심장수술 후 섬망 예측모델 개발 및 평가 : Development and Evaluation of a Prediction Model for Delirium after Cardiac Surgery Using Electronic Medical Records

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

이지연

Advisor
김현의
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
전자의무기록예측모델섬망기계학습중환자CDW
Description
학위논문(석사) -- 서울대학교대학원 : 간호대학 간호학과, 2023. 8. 김현의.
Abstract
본 연구의 목적은 전자의무기록자료를 활용하여 심장수술 후 중환자 섬망 예측모델을 개발하고 평가하는 것이다. 서울대학교병원 Clinical Data Warehouse (CDW) 연구 검색 시스템인 Seoul National University Hospital Patient Research Environment (SUPREME)을 통해 2017년부터 2021년까지의 5년간 병원 심폐기계중환자실에 입실한 성인 2,083명의 원시자료를 추출한 뒤, R 프로그램을 이용하여 분석하였다.
최대한 누락 없이 선별하기 위해 임상관찰기록의 The Confusion Assessment Method for the ICU (CAM-ICU) 평가 결과, 간호일지 표준 진술문, 진단명, 정신건강의학과 타과의뢰 및 haloperidol 처방내역의 5 가지 자료 중 한 가지 이상에서 섬망 여부가 확인될 경우 섬망 환자로 정의했다. 섬망 발생 건의 수는 전체 2,083건 중 417건(20.0%)이었고, CAM-ICU, 타과의뢰 및 haloperidol만으로 정의된 수와 큰 차이가 없었다(410건).
문헌고찰을 바탕으로 중환자실 입실 직후 시점에 결정되는 46개의 위험요인을 선정한 후, 카이제곱 검정 및 T 검정으로 단변량 분석을 시행하여 p-value가 0.05보다 작았던 최종 35개의 위험요인으로 섬망 예측모델을 개발하였다. 모델 개발에 사용된 최종 위험요인 변수 중 수술 전 변수로 대상자의 성별, 연령, 체질량지수, 수술 전 재실 여부 및 수술 전 입원 기간 등이 포함되었고, 수술 자체 관련 변수로는 대동맥 수술 여부, 관상동맥 수술 여부, 판막 수술 여부, 예상 실혈량, 수술 시간, 심폐기 사용 여부 및 시간이 포함되었으며 수술 후 변수로는 산소포화도 이상 여부, 체온, 심박수, 평균 동맥 혈압, 동맥혈 산도(pH), 동맥혈 산소 분압(pO2), 동맥혈 이산화탄소 분압(pCO2), 혈당, 젖산, 헤모글로빈, 혈소판, 섬유소원(Fibrinogen), 활성화 부분 트롬보플라스틴 시간(activated Partial Thromboplastin Time, aPTT), 프로트롬빈 시간(Prothrombin Time, PT), 나트륨, 칼슘, 마그네슘, 혈중요소질소(Blood Urea Nitrogen, BUN), 크레아티닌, 총 빌리루빈(Total Bilirubin), 알부민, 그리고 C-반응성 단백질(C-Reactive Protein, CRP)이 사용 되었다.
예측모델은 로지스틱 회귀(Logistic Regression), 의사결정 나무(Decision Tree), 랜덤포레스트(Random Forest), 그리고 eXtreme Gradient Boosting (XGBoost)의 기계학습 방법을 이용하여 개발하였고 각각의 성능을 비교 평가했다. 섬망군이 추출된 전체 환자군의 약 20%로 비섬망군 대비 균형이 맞지 않아 Synthetic Minority Oversampling Technique (SMOTE) 기법을 사용하여 섬망군과 비섬망군의 비를 1:1로 맞춘 뒤에 모델을 학습시켰다.
예측모델 성능 비교는 반복적 K-겹 교차검증(Repeated K-fold cross-validation) 방법으로 5-겹 교차검증을 10회 반복하였으며 각각의 검증에서 산출된 민감도(Sensitivity), 특이도(Specificity), 양성 예측도 (Positive Predictive Value), 음성 예측도(Negative Predictive Value) 및 AUROC (Area Under Receiver Operating Characteristic Curve)의 평균치를 최종 성능 지표로 사용하였다. 네 개의 기계학습 방법 중에서 SMOTE를 적용 후 랜덤포레스트 기법으로 개발한 예측모델의 성능이 민감도 0.9050, 특이도 0.8650, 양성 예측도 0.8702, 음성 예측도 0.9011, AUROC 0.9575로 가장 뛰어났지만, 일반화 가능성에 대한 후속 연구가 필요하다.
본 연구는 섬망의 세부 유형 및 발생 시각을 고려하지 못했다는 제한점을 가진다. 추후 전자의무기록의 data quality를 보완함과 동시에 전자의무기록의 자유형식 기록을 활용할 수 있는 연구도 계속 되어야 할 것이다.
The purpose of the study is to develop and evaluate a prediction model for delirium after cardiac surgery using electronic medical records. A retrospective analysis of 2,083 patients who were admitted to Cardiopulmonary Intensive Care Unit (CPICU) in Seoul National University Hospital between 2017 and 2021 was performed. Raw data was retrieved from Clinical Data Warehouse (CDW) using 'Seoul National University Hospital Patient Research Environment (SUPREME)', and analyzed with R programming.
Five operational definitions of delirium were used in order to include as many delirious patients as possible. The Confusion Assessment Method for the ICU (CAM-ICU) results of clinical observation sheets, structured statements of narrative nursing records, diagnoses, neuropsychiatry consultations, and prescriptions of haloperidol were used. 417 (20.0%) out of 2,083 patients were identified as delirious patients and no significant difference was found when only used two operational definitions, which were based on consultation and prescription data (410).
46 risk factors were selected after literature review, and univariate analysis with either chi-square test or T-test was performed. The 35 risk factors with p-value less than 0.05 were filtered and included in prediction models. Preoperative variables include sex, age, body mass index, pre ICU admission, and length of hospitalization before the surgery. Intraoperative variables include types of surgery (aorta, coronary, heart valve), estimated blood loss (EBL), operation time, use of cardiopulmonary bypass (CPB), and CPB time. Postoperative variables include abnormality in pulse oximetry (SpO2), body temperature, heart rate, mean Arterial Blood Pressure (mABP), arterial blood gas (pH, pO2, pCO2), glucose, lactate, hemoglobin, platelet, fibrinogen, activated Partial Thromboplastin Time (aPTT), Prothrombin Time (PT), sodium, calcium, magnesium, Blood Urea Nitrogen (BUN), creatinine, total bilirubin, albumin, and C-reactive protein (CRP).
Delirium prediction models were developed using 4 different algorithms, which were logistic regression, decision tree, random forest, and eXtreme Gradient Boosting (XGBoost). When developing prediction models, balanced dataset with 50% delirium rate was used after applying Synthetic Minority Oversampling Technique (SMOTE).
Performance of each model was evaluated using repeated K-fold cross-validation method. 5-fold cross-validation was repeated 10 times and the mean values of each sensitivity, specificity, positive predictive value (PPV), negative predictive value (NPV), and AUROC (Area Under Receiver Operating Characteristic Curve) were compared. The prediction model based on random forest using balanced dataset performed best and its sensitivity, specificity, PPV, NPV, and AUROC were 0.9050, 0.8650, 0.8702, 0.9011, and 0.9575 respectively. Further research is needed to prove its generalizability.
One of the limitations of this study is that the study does not consider any subtype of delirium or time of delirium onset. More researches should be conducted on data quality of electronic medical records and utilizing unstructured data with natural language processing.
Language
kor
URI
https://hdl.handle.net/10371/196203

https://dcollection.snu.ac.kr/common/orgView/000000178403
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share