Publications

Detailed Information

Studies on Lung Cancer Biomarkers
 by Proteogenomic Analysis : 프로테오지노믹스 기법을 이용한 폐암 바이오마커 연구

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김용인

Advisor
조제열
Major
수의과대학 수의학과
Issue Date
2019-02
Publisher
서울대학교 대학원
Description
학위논문 (박사)-- 서울대학교 대학원 : 수의과대학 수의학과, 2019. 2. 조제열.
Abstract
정밀의료 패러다임의 등장 이후, 질환의 진단 및 치료를 위해서 바이오마커에 대한 수요는 높아지고있다. 가설기반연구는 전통적으로 당연하게 사용되오던 연구수행체계이지만, 바이오마커 발굴에서 필연적으로 마주치게되는 광범위한 스크리닝 작업에서는 효율성의 한계를 드러낸다. 오믹스기술의 등장과 함께 질환연구의 패러다임은 증거기반 대규모 타겟발굴방식으로 변화하고 있다. 단백질은 생체 기능조절에 직접적으로 관여하는 물질이기 때문에 바이오마커로 활용할 수 있는 가장 이상적인 물질로 여겨진다. 질량분석기를 이용한 단백체분석은 단백질을 직접 정성 및 정량할 수 있을 뿐만 아니라 매우 생산성이 높아 질환 바이오마커 발굴에 유용하다. 이 논문에서는 질량분석기를 이용하여 폐암 바이오마커의 발굴을 위한 고도화된 분석기법인 프로테오지노믹스 기법의 적용과, 스크리닝된 바이오마커후보 단백질의 정량검증 및 폐암 감별진단 조합마커의 생성연구에 대하여 알아본다.



CHAPTER I에서는 인간염색체기반 단백체프로젝트 (C-HPP)의 일환으로 수행된 염색체9번에 대한 단백체연구가 포함되어있다. 미확인 단백질과 유전단백체에서 발견되지 않았던 시그니처를 밝혀내기 위해 LC-MS/MS분석과 RNA-seq 차세대염기분석기법을 적용하여 샘암종 폐암환자 5명의 정상-종양조직을 분석하였다. 염색체중심-인간단백체프로젝트의 2013년 리포트에서는 neXtProt 인간단백체 데이터베이스를 기준으로 염색체 9번에서 170개의 미확인 단백질이 있는 것으로 알려졌으며, 본 논문의 연구가 진행된 2015년에는 133개가 계속 미확인상태로 남아있었다. 본 논문의 단백체분석에서는 19개의 미확인 단백질을 동정할 수 있었으며, 그 중에서 염색체9번에 해당하는 단백질은 SPATA31A4 한 개 였다. RNA-seq분석으로는 샘종폐암조직 5개에서 공통적으로 검출되면서 정상조직에서는 검출되지 않는nonsynonymous SNP 5개 (CDH17, HIST1H1T, SAPCD2, ZNF695) 그리고 synonymous SNP 3개를 발굴할 수 있었다.

프로테오지노믹 분석을 위해서 각 시료별 RNA-seq데이터를 가공하여 맞춤형 데이터베이스를 구축하였다. 이렇게 생성된 시료맞춤형 데이터베이스를 단백체 질량분석데이터 검색에 활용하여 5개 유전자(LTF, HDLBP, TF, HBD, HLA-DRB5)에 해당하는 7개의 돌연변이를 검출하였다. 두 개의 돌연변이는 정상조직에서는 검출되지 않고 암조직에서만 검출되었다. 또한, 이 결과에서는 정상-암조직 모두에서 위유전자 (EEF1A1P5) 펩티드를 검출할 수 있었다.



CHAPTER II에서는 다중반응검지법 (MRM) 을 이용한 단백질 바이오마커 검증과 조합마커 구성에 대한 연구를 서술하였다. 폐암과 다른 폐질환은 감별이 어렵기 때문에 폐암은 오진단 위험이 큰 질병이다. 따라서 혈청기반의 폐암감별진단 바이오마커개발의 필요성은 널리 인정되고있다. 이 단원에서는 폐암환자와 대조군폐질환 환자 198명의 혈청시료를 활용하여 일곱개의 폐암바이오마커 후보단백질을 나노유속 액체크로마토그래피-다중반응검지법으로 정량하였다.

후보단백질을 개별로 분석하였을 때에는 SERPINA4만이 통계적으로 유의성있게 혈중농도가 감소하는 것으로 나타났다. 다중반응검지법 전체데이터를 임상정보와 함께 로지스틱회귀모델에 적용하여 하나의 조합마커로 만들 수 있었다. 이 과정에서 개별마커로는 통계적인 유의성이 두드러지지 않지만 간섭효과를 만들어낼 수 있는 변수를 고려하여 모델링을 진행하였다. 최종적으로 SERPINA4, PON1, 나이를 조합하였을 때 가장 최적의 조합마커가 생성되었다. 이 조합마커는 AUC 0.915 의 감별진단 성능을 보여주었으며, 모델을 만드는데 사용되었던 시료와는 별개의 검증군에서도 성능은 유지되었다. 이와 같이 통계모델을 이용하여 생성한 조합마커는 개별 분자마커를 이용했을 경우보다 개선된 폐암 감별진단능력을 보여줄 수 있음을 제시한다.
Biomarkers have been in high demand for disease diagnosis and therapeutics. Traditional hypothesis-based research has been challenging due to massive screening studies. Together with the emergence of omics technologies, currently, the paradigm for disease research has been moving toward evidence-based large-scale discovery studies. Proteins, as key effector molecules, can serve as ideal biomarkers for various diseases because they catalyze every biological function. Proteomics, which is represented by mass spectrometry (MS) technologies, stands as a solution for disease diagnosis and drug target discovery.



CHAPTER I includes a portion of a report from of the human proteome project (HPP) related to chromosome 9 (Chr 9). To identify missing proteins (MPs) and their potential features in regard to proteogenomic view, both LC-MS/MS analysis and next-generation RNA sequencing (RNA-seq)-based tools were used for the clinical samples including adjacent non-tumor tissues. When the Chr 9 working group of the Chromosome-Centric Human Proteome Project (C-HPP) began this project, there were 170 remaining MPs encoded by Chr 9 (neXtProt 2013.09.26 rel.)
currently, 133 MPs remain unidentified at present (neXtProt 2015.04.28 rel.). Proteome analysis in this study identified 19 missing proteins across all chromosomes and one MP (SPATA31A4) from Chr 9. RNA-seq analysis enable detection of RNA expression of 4 nonsynonymous (NS) SNPs (in CDH17, HIST1H1T, SAPCD2, and ZNF695) and 3 synonymous SNPs (in CDH17, CST1, and HNF1A) in all 5 tumor tissues but not in any of the adjacent normal tissues. By constructing a cancer patient sample-specific protein database based on individual RNA-seq data, and by searching the proteomics data from the same sample, 7 missense mutations in 5 genes (LTF, HDLBP, TF, HBD, and HLA-DRB5) were identified. Two of these mutations were found in tumor tissues but not in the paired normal tissues. Additionally, this study discovered peptides that were derived from the expression of a pseudogene (EEF1A1P5) in both tumor and normal tissues. In summary, this proteogenomic study of human primary lung tumor tissues enabled detection of additional missing proteins and revealed novel missense mutations and synonymous SNP signatures, some of which are predicted to be specific to lung cancer.



CHAPTER II describes a study of the combination marker model using multiple reaction monitoring (MRM) quantitative data. Misdiagnosis of lung cancer remains a serious problem due to the difficulty of distinguishing lung cancer from other respiratory lung diseases. As a result, the development of serum-based differential diagnostic biomarkers is in high demand. In this study, 198 serum samples from non-cancer lung disease and lung cancer patients were analyzed using nLC-QqQ-MS to examine the diagnostic efficacy of seven lung cancer biomarker candidates. When the candidates were assessed individually, only SERPINEA4 showed statistically significant changes in the sera of cancer patient compared to those of control samples. The MRM results and clinical information were analyzed using logistic regression analysis to a select model for the best meta-marker, or combination of biomarkers for the differential diagnosis. Additionally, under consideration of statistical interaction, variables having a low significance as a single factor but statistically influencing the meta-marker model were selected. Using this probabilistic classification, the best meta-marker was determined to comprise two proteins SERPINA4 and PON1, with an age factor. This meta-marker showed an enhanced differential diagnostic capability (AUC=0.915) to distinguish the lung cancer from lung disease patient groups. These results suggest that a statistical model can determine optimal meta-markers, which may have better specificity and sensitivity than a single biomarker and may thus improve the differential diagnosis of lung cancer and lung disease patients.
Language
eng
URI
https://hdl.handle.net/10371/152490
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share