Publications

Detailed Information

Development of Multiple Reaction Monitoring-Mass Spectrometry based Proteome Multimarker Panel and Panel Development Software for the Detection of Hepatocellular Carcinoma : 간암 진단을 위한 MRM-MS 기반의 단백체 다중 마커 패널 및 패널 개발 프로그램의 개발

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김재년

Advisor
김영수
Issue Date
2022
Publisher
서울대학교 대학원
Keywords
hepatocellularcarcinomabiomarkerproteomeserumsoftware
Description
학위논문(박사) -- 서울대학교대학원 : 공과대학 협동과정 의용생체공학전공, 2022. 8. 김영수.
Abstract
서론: 전통적인 간세포암의 감시진단은 이미징 기법과 혈청 종양 마커의 정량으로 진단하나, 충분치 못한 정확성의 한계가 있다. 간세포암 조기진단에 대한 수요는 존재하며, 본 실험에서는 이를 프로테오믹 기술 기반 혈청 분석 바이오마커 패널의 제작 및 검증을 통해 정확성이 향상된 기법을 제시한다. 또 한 이러한 바이오마커 패널의 임상적용을 위한 바이오마커 개발과 분석법 검증의 전산작업을 직관적으로 진행 할 수 있는 두개의 웹 어플리케이션을 개발 및 제시한다.

방법: 1장에서는 다기관 환자 대조군 시료는 간세포암 환자군과 간경화증, 만성 B형 간염, 만성 C형 간염등을 보유 하나 간세포암이 아닌 집단군이다. 본 실험은 질량분석기 다중반응검지법기반의 17 단백질 바이오마커를 398명의 환자 대조군으로 개발하였다. 알파태아닌 단백질, 비타민 K 길항제-II를 개발된 패널의 마커에 더 했을때의 성능을 곡선 아래 면적으로 확인하였으며, 이를 398명의 학습데이터와 170명의 평가데이터, 시간적으로 단절된 159명의 검증 데이터로 검증하였다. 2장에서 바이오마커 개발 웹 어플리케이션은 파이썬 언어와 Scikit-Learn 모듈로 개발하였으며, Django Framework로 웹 어플리케이션의 틀을 구성하였다. 배치 효과 정규화와 데이터 치우침 기반 정규화 기능을 제공하며, 전진선택법, 후진선택법 및 Recursive Feature Elimination 기법을 바이오마커 선정 기능으로 개발하였다. 머신러닝 평가 기능은 로지스틱 회귀 기법과 서포트 벡터 머신 기법을 채용하였다. 분석법 평가 포탈은 Spring boot로 웹 어플리케이션 기반을 확립했으며, JSP, HTML, JavaScript를 프론트단을 개발하였다. 아파치 톰캣, MySQL로 서버의 개발과 데이터베이스를 개발하였다

결과: 1장에서는 알파태아닌 단백질, 비타민 K 길항제-II를 추가한 패널에서 곡선 아래 면적의 수치가 패널 단일일 떄보다 높은 것을 학습데이터 (0.989 vs 0.937, P<0.05)와 검증데이터 (0.958 vs 0.940, P<0.05)에서 확인하였으나 평가데이터 (0.898 vs 0.891, P=0.28)에서 하락함을 확인하였다. 조합 및 단일 패널에서 모두 현행 알파태아닌단백질 단독 마커에 비해 2센치 이하의 단일 간세포암 환자군 구별에 있어 높은 곡선 아래 면적 수치을 학습데이터 (0.940 & 0.929 vs 0.775, 모두 P<0.05), 평가 데이터 (0.894 & 0.893 vs 0.593, 모두 P<0.05), 검증데이터 (0.961 & 0.937 vs 0.806, 모두 P<0.05)에서 확인 할 수 있었다. 조합 및 단일 패널에서 모두 GALAD score 보다 높은 곡선 아래 면적 수치를 확인 할수 있었다(0.945 and 0.931 vs 0.829, 모두 P<0.05). 제 2장에서는 WMD는 데이터 전처리, 바이오마커 선정 및 개발된 모델에 대한 평가를 섹션별로 기능제공을 하는 웹 어플리케이션을 개발하였다. WMD로 개별 샘플의 타겟 정량데이터가 들어있는 2차원 데이터를 최종적으로 모델까지 개발 할 수 있음을 확인하였다. MVP 포탈은 Skyline 프로그램에서 추출된 아래 각 분석법 검증 항목의 실험 결과 데이터를 계산하고 검증 할 수 있다: 검량선, 특이성, 선택성, 캐리오버, 정확성, 생체시료 효과, 회수율, 희석의 타당성, 안정성 및 품질관리시료 항목등이 있다. 계산이 끝난 항목들의 계산 결과 및 기준 통과 여부는 관 페이지에서 확인 할 수 있다.

결론: 본 실험에서 개발한 17 단백 다중 마커 패널은 간세포암 환자를 고위험군 대조군에서 구분 할 수 있었으며 조기 발견에 높은 정확성을 보였다. 또 한 바이오마커 개발에 요구되는 전산 작업을 할 수 있는 웹 어플리케이션으로 모델 개발 과정과 분석 검증 과정을 간소화 할 수 있었다.
Introduction: Conventional methods for the surveillance of hepatocellular carcinoma (HCC) by imaging, with and without serum tumor markers, are suboptimal with regard to accuracy. We aimed to develop and validate a reliable serum biomarker panel for the early detection of HCC using a proteomic technique. To simplify the computational process during the biomarker study aiming for clinical application, we developed two web application, one for marker panel development and the other for method validation.

Method: In Chapter 1, This multicenter case-control study comprised 727 patients with HCC (case group, n=393) and patients with risk factors (ie, cirrhosis, chronic hepatitis B, or chronic hepatitis C) but no HCC (control group, n=334). We developed a multiple reaction monitoring-mass spectrometry (MRM-MS) multimarker panel using 17 proteins from the sera of 398 patients (training set: 199 cases and 199 controls). Area under the receiver operating characteristics curve (AUROC) values of this MRM-MS panel with and without alpha-fetoprotein (AFP) and protein induced by vitamin K absence or antagonist-II (PIVKA-II) were compared in the training set and the independent test (n=170: 85 cases and 85 controls) and validation sets (n=159: 109 cases and 50 controls). In Chapter 2, web application for model development, Web Model Developer (WMD), were programed with Python and Scikit Learn Module where web application was built with Django framework. Sample process methods regarding batch correction and transformation are provided. Forward, Backward and Recursive Feature Elimination options are available for feature selection with Logistic Regression or Support Vector Machine. Method Validation Portal (MVP), are designed with Spring boot, which was used as a framework for webpage development, which follows MVC Pattern. JSP, HTML, XML, and Java Script were used to develop the webpage. A server was composed of Apache Tomcat, MySQL. Input files were skyline-derived output files (csv file), and each files were organized by specific columns in order. SQL, JAVA were interworked to evaluate all the categories and show the results.

Results: In Chapter 1, The AUROC value of the MRM-MS panel that was combined with AFP and PIVKA-II was significantly higher than the standalone MRM-MS panel in the training (0.989 vs 0.937, P<0.05) and validation sets (0.958 vs 0.940, P<0.05) but not the test set (0.898 vs 0.891, P=0.28). The combination and standalone MRM-MS panels had higher AUROC values than AFP in the training (0.940 and 0.929 vs 0.775, both P<0.05), test (0.894 and 0.893 vs 0.593, both P<0.05), and validation sets (0.961 and 0.937 vs 0.806, both P<0.05) in detecting small (<2 cm) single HCC. The combination and standalone MRM-MS panels had significantly higher AUROC values than the GALAD score (0.945 and 0.931 vs 0.829, both P<0.05). In Chapter 2, WMD are provided as single webpage with Data process, Feature Selection and Model evaluation sections. WMD were able to process raw MRM data and suggest best set of features. The MVP portal reads a Skyline-output file and produces the following results: calibration curve, specificity, sensitivity, carryover, precision, recovery, matrix effect, dilution integrity, stability and QC according to the standards of each independent agency. The final tables and figures pertaining to the 11 evaluation categories are displayed in an individual page.

Conclusion: Our proteome 17-protein multimarker panel distinguished HCC patients from high-risk controls and had high accuracy in the early detection of HCC. Our web applications could have simplified the model development process and method evaluation process.
Language
eng
URI
https://hdl.handle.net/10371/187803

https://dcollection.snu.ac.kr/common/orgView/000000172634
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share