Publications

Detailed Information

Bioinformatic studies for pre-mortem diagnosis, treatment, and genomic characteristics of prion diseases : 프리온 질환의 사전진단, 치료, 유전체 특성분석을 위한 생물정보학 연구

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

이솔뫼

Advisor
김희발
Issue Date
2020
Publisher
서울대학교 대학원
Description
학위논문(박사)--서울대학교 대학원 :농업생명과학대학 농생명공학부,2020. 2. 김희발.
Abstract
프리온 질환은 사람을 포함한 여러 포유동물에서 발생하는 질환으로 체내의 정상적인 프리온 단백질이 비정상적인 프리온 단백질 형태로 변형되어 세포내에서 분해되지 않고 축적되면서 병원성을 갖게 되는 것으로 알려져 있다. 프리온 질환의 주요 원인물질은 프리온 단백질이지만 발병 메커니즘은 정확히 알려져 있지 않으며 아직까지 알려지지 않은 여러 인자들이 질병 발병에 관련되어 있을것이라 예측하고 있다. 현재 프리온 질환 관련 저해 및 치료 물질들이 활발히 개발 중에 있으며, 일부는 질환 모델 세포 및 동물 실험을 통해 치료 효능이 확인되었다. 하지만 인간 프리온 질환의 경우 환자 판정 시기가 늦고 발병 후 1 – 2 년 내 사망하여 실제 프리온 환자 임상 적용 시 이 물질들의 효능확인이 어려운 실정이다. 그렇기 때문에 치료후보물질들의 효과적인 적용을 위한 질환 대체진단법 개발이 필요하다. 본 졸업논문에서는 생명정보학 연구 방법을 이용한 질환관련 유전자 및 변이에 대한 연구, 저해제 및 치료제로 연구되어 왔던 물질들에 대한 데이터베이스, 조기 치료제 적용을 위한 질환 대체진단방식 연구에 대해 기술하였다. 제 2장에서는 현재까지 프리온 질환 저해 및 치료를 위해 연구되어 왔던 물질들에 대한 데이터베이스에 대해 기술하였다. 현재까지 100여개 이상의 물질들이 프리온 질환 치료를 위해 연구되어왔지만 아직까지 프리온 질환 치료제는 없다. 프리온 질환 메커니즘을 이해하고 질환 치료제 개발을 위해서는 기존에 연구되어 왔던 물질들을 제대로 정확히 이해하는 것이 필요하다. 하지만 아직까지 이들에 대한 정보를 한곳에 모아놓은 데이터베이스가 없어 효율적인 분석이 이루어지지 않고 있다. 이에 본 연구에서 각각의 논문에 흩어져있는 정보를 모아 인자들에 대한 정보를 파악하고, 프리온 질환에 대한 치료물질 개발에 활용할 수 있도록 현재까지 질환 저해 및 치료 연구에 사용되었던 인자들 및 이들의 정보에 대한 데이터베이스(THERPA)를 제작하였다. 프리온 질환 관련, 프리온 단백 관련하여 연구되어온 인자들 및 관련 정보를 직접 논문들에서 수집하였다. 수집한 정보들은 연구에 사용된 재료, 실험 대상, 처리 농도, 프리온 단백에의 결합 위치 등 총 13개로 분류된 정보이다. 모든 수집 정보들은 SQLite를 이용하여 저장하였고 데이터베이스는 장고 프로그램과 파이썬, 자바스크립트, 하이퍼 텍스트 기술 언어를 사용하였다. 총 119개 인자들과 이들의 283개 역할정보를 데이터베이스 내 기록하였다. THERPA는 지속적인 업데이트를 통해 인자정보를 추가하고 있고, 현재는 144개 인자들과 이들의 353개 역할 정보를 포함하고 있다. THERPA는 실제 연구자들이 시각적으로 보기 용이하도록 자료를 표, 원형 도표, 계층구조 형태로 구성하였다. 또한 사용자들이 빠르고 쉽게 관련 데이터를 효율적으로 검색할 수 있도록 검색 기능과 자료 필터링 기능을 포함하였다. THERPA는 기존 정보에 대한 빠른 이해와 관련 연구에 대한 새로운 접근을 유도하여 프리온 질환 저해제 및 치료제 개발을 하는데 유용하게 사용될 것이다. 제 3장에서는 가족성 CJD 돌연변이를 갖는 정상인에서 나타나는 특이 변이와 이를 통한 프리온 질환 방어기작 관련 유전자 변이 및 메커니즘을 추론하였다. 유전성 프리온 질환은 프리온 유전자 내의 돌연변이와 관련 있다. 특히 이 중 프리온 단백질 코돈 200번의 돌연변이(글루타메이트에서 라이신으로 바뀌는 돌연변이, E200K)는 유전성 프리온 질환 중 가장 많이 나타나는 유형이다. 한국에서도 관련 돌연변이를 가진 환자가 보고되었고, 환자의 가족들의 가계도를 조사하던 중 E200K 돌연변이를 가지는 정상인(만 85세)을 확인하였다. 이를 통해 E200K 돌연변이를 가지더라도 평생 정상인으로 살아갈 수 있음을 확인하였다. 3장에서는 이 정상인이 어떠한 질환 관련 변이들을 가지고 있는지, 혹은 환자들은 또 어떠한 돌연변이들을 공통으로 가지는지에 유전체 수준에서 알아보았다. 총 세명의 E200K 환자와, 11명의 환자가족, 한국인 24명의 엑솜 염기서열을 비교·분석하였다. E200K 환자들에서는 나오지 않은 19개의 변이들이 E200K 정상인에서 발견되었다. 이 변이들을 가지는 유전자들 중 4개 (KARS, LAMA3, NRXN2, KLKB1)은 프리온 질환과 직접적인, 간접적인 상호작용이 있는 것이 있음을 확인할 수 있었다. 본 연구로부터 프리온 질환관련 pathogenic mutation을 가지고 있더라도 평생 정상인으로 살아갈 수 있다는 것을 확인하였다. 본 연구에서 예측한 프리온 질환 방어관련 메커니즘과 유전자 변이 등은 유전성 프리온 질환의 진단과 치료에 기초자료로 활용 될 수 있을 것이다. 제 4장에서는 3장에서와는 다른 유전성 프리온 질환관련 돌연변이인 V180I(프리온 단백의 180번째 아미노산이 valine 에서 isolucine으로의 변이)를 가지는 환자들에 대한 유전체 데이터 분석연구를 진행하였다. 이를 통해 유전성 CJD 환자에서만 발견되는 변이 동정과 타 퇴행성뇌질환들과의 관련성 및 질환 메커니즘을 예측하였다. 총 V180I CJD 환자 5명과 145명의 전장 유전체 데이터를 비교 분석하였다. 환자군에서 총 18,648,850개의 후보 변이가 동정되었고 이 중 29개가 정상군에서 나타나지 않으면서 환자군에서만 나타나는 변이였다. 이 중에서 4개는 nonsense mutation을 일으키는 변이었고, 6개는 퇴행성 뇌질환과 관련된 것들이었다. 이들은 LPA, LRRK2, FGF20 등의 유전자에서 발견되었다. 또한 V180I 환자이면서 특이하게도 10년 이상 생존해오고 있는 환자에게서도 이러한 유전자에서 변이가 발견되었다. 이렇게 환자군에서만 발견된 변이들과 이들의 질환 관련 상호작용 분석은 퇴행성 뇌질환들의 서로간의 관련성을 이해하고 이들의 치료방안을 마련하게 하는 데 활용할 수 있을 것이다. 제 5장에서는 딥러닝 기술 및 다중 단백 마커를 이용한 산발성 프리온 질환의 대체진단 방식에 대해 기술하였다. 총 49명의 산발성 프리온 환자와 256명의 유사질환환자군의 14-3-3 단백 발현양 및 인산화 타우단백, 총 타우 단백, 알파시뉴클레인, 아밀로이드베타의 단백농도 측정 결과를 이용하여 산발성 프리온 환자와 타질환환자를 구분하는 딥러닝 모델을 구축하였다. 이에 사용된 딥러닝 모델의 구조는 한 개의 입력층과 다섯 개의 은닉층 그리고 한 개의 출력층으로 구성되었다. 다섯 개의 은닉층은 각각 20, 40, 30, 20, 12개의 은닉 유닛으로 구성되었다. 두 집단을 나누는 가장 최적의 모델은 90.38%의 정확도, 83.33%의 민감도, 92.5%의 특이도를 보였다. 또한 가장 최적의 단백 조합은 총 타우단백, 인산화타우단백, 알파시뉴클레인이었다. 또한 이 모델을 이용하여 타 퇴행성 뇌질환으로 판정받은 환자 15건을 판정했을 때 15건 모두 정확하게 프리온 질환이 아닌 것으로 판정하였다. 본 졸업 논문에서는 프리온 질환 관련 유전체 데이터 분석과 현재까지 연구되어 왔던 프리온 질환 치료 후보물질들의 연구 데이터를 한 곳으로 모은 데이터베이스 제작, 프리온 질환 환자 사후 부검 대체 진단방식에 대해 기술하였다. 이러한 결과들을 바탕으로 본 논문이 프리온 질환 관련 유전자들 및 질환 메커니즘을 파악하고, 환자 발생 초기에 정확한 질환 진단을 통해 적절한 치료제를 제시하는데 도움을 줄 것이라 기대한다.
Prion diseases (PrDs) are a group of rare, fatal neurodegenerative disorders that affect animals and humans. These diseases are characterized, at the pathological level, by the abnormal accumulation of misfolded prion proteins (scrapie prion protein, PrPSc), which affect the central nervous system (CNS). Although misfolded prion proteins have been considered to be the causative agent of PrDs, some studies have suggested the need for other genes or co-factors, such as proteins and nucleic acids, to explain the disease pathology and incubation time. Various small molecules have been shown to prevent PrPSc accumulation, or alleviate PrDs, in in vitro and in vivo experiments. Unfortunately, appropriate therapies for PrDs have not yet been developed. Developing therapies for PrDs is challenging owing to the scarcity of cases, difficulty in early diagnosis, the array of symptoms manifested, and the possible interactions between the multiple genes involved in PrDs. In this thesis, a database of therapeutic molecules for PrDs has been constructed. Moreover, the genomic characteristics of PrD patients was focused on to identify the genes and genetic variations associated with PrDs. Additionally, pre-mortem diagnostic methods for the early diagnosis of PrDs have also been studied. In chapter 2, the THERPA database, which consists of therapeutic molecules for PrD treatment, has been described. The THERPA database allows PrD researchers to easily explore and analyze small molecules associated with prion protein regulation and PrDs. Various small molecules have been used to inhibit PrPSc accumulation, and to cure PrDs. However, to date, no effective therapy has been realized for the cure or attenuation of PrD progression. Literature survey coupled with interpretation of the function of these small molecules is essential in understanding the complicated mechanisms of PrDs, and identifying new treatments. Therefore, I have built a database of small molecules associated with prion protein regulation and PrD progression. Literature survey of full text articles was performed to study the roles and properties of the small molecules associated with PrD progression, and the materials required for the study. A total of 119 small molecules, along with their 283 relationships, have been curated. This open access database is being updated regularly. Currently, it includes 144 small molecules, and their 353 relationships. THERPA is a visually-interactive database, which aids in improving the search efficiency, thereby helping researchers identify intrinsic small molecules useful for the development of therapies for PrDs. In chapter 3, the genotype patterns and differences in the exome sequences of Creutzfeldt-Jakob disease (CJD) patients, their families, and healthy individuals, have been dealt with. In CJD patients, Glutamate (E) to Lysine (K) substitution was seen at codon 200 (E200K) of the PRNP gene. Exome sequencing was performed on 3 CJD patients with E200K substitution, and 11 family members of one patient, using the Illumina HiSeq 2000 sequencer. The exome sequences of 24 healthy Koreans were used as the control. Nineteen Single Nucleotide Variants (SNVs) were identified in a healthy, 86-year-old individual, as well as in CJD patients with E200K substitution. As these 19 SNVs have been identified only in healthy individuals, each of them is a candidate protective factor against the E200K mutation associated with CJD. However, follow-up studies of the families are required to strongly conclude that these 19 SNVs are CJD-protective factors. I have also discussed the biological network analysis undertaken to infer the relationship between the genotypes and PrD onset. The biological network analysis may also explain the reason behind the prevention of CJD symptoms in a patients mother who had the E200K pathogenic mutation. Four proteins (NRXN2, KLKB1, KARS, and LAMA3), that rarely harbor SNVs, showed biological interactions associated with PrDs and/or prion proteins. Through this study, we have confirmed the possibility of an individual carrying the pathogenic E200K mutation, to be CJD-free. Our research throws light on a candidate protective factor, which could be exploited to prevent familial CJD (fCJD) onset in individuals carrying the E200K mutation. In Chapter 4, genetic differences between five genetic CJD (gCJD) patients, and 145 healthy individuals, were identified using whole genome sequencing. In gCJD patients, Valine (V) to Isoleucine (I) substitution was seen at codon 180 (V180I) of the PRNP gene. In this study, 29 of 18,648,850 candidate variants were seen only in the patient group. Four of these variants resulted in nonsense mutations, while six of them were observed in genes (LPA, LRRK2, and FGF20) directly or indirectly associated with neurodegenerative disorders (NDs). More than half of the validated variants were categorized using Gene Ontology (GO) terms such as binding activity and/or catalytic activity. Moreover, I found different genome variants in gCJD patients with the V180I mutation, including one which has survived for 10 years post disease diagnosis. Elucidation of the relationship between gCJD and Alzheimers or Parkinsons diseases, at the genomic level, will facilitate further understanding of the specific mechanisms mediating the pathogenesis of NDs, and the gold standard therapies available for NDs. In Chapter 5, deep learning-aided pre-mortem diagnosis of PrDs using multiple cerebrospinal fluid (CSF) biomarkers, have been described. Enzyme-linked immunosorbent assays (ELISA) were performed on the phospho-tau (p-tau), total-tau (t-tau), α-syn, and β-amyloid (1-42) proteins, and western blot (WB) analysis was performed on the 14-3-3 proteins from the CSF samples of 49 sporadic CJD (sCJD) and 256 healthy Korean individuals, respectively. I performed machine learning (ML) and deep learning (DL) analysis on the ELISA and WB data of the CSF biomarkers. The deep neural network structure, which showed the best DL performance, comprised of one input, five hidden, and one output layers, with 20, 40, 30, 20, and 12 hidden unit numbers per hidden layer, respectively. The DL model demonstrated 90.38% accuracy, 83.33% sensitivity, and 92.5% specificity for the three-protein combination of t-tau, p-tau, and α-syn. Additionally, all patients in a separate CSF set (n = 15), having other neurological diseases, were rightly predicted to be CJD-free. Thus, DL-aided pre-mortem diagnosis might be an appropriate tool for discriminating CJD patients from healthy individuals. In conclusion, several genes like KARS, LAMA3 and LRRK2 were found to be linked with NDs like PrD. This research provides fundamental insight into the mechanisms underlying the onset of PrDs, and suggests therapeutic strategies for disease cure. THERPA database for small molecules, which are therapeutic agents, was designed to allow researchers to easily explore and analyze the data of interest. It will be useful in understanding the disease mechanisms and developing therapeutic strategies for PrDs. Early diagnosis of PrDs is necessary for providing timely medical treatment. Deep learning-aided pre-mortem diagnostic methods established in this study, might be apt for the early distinction of PrD patients from other ND patients. Further research of other biomarkers, and/or larger sample sizes from various countries worldwide, is essential to improve the performance and reliability of pre-mortem diagnosis.
Language
eng
URI
https://hdl.handle.net/10371/167592

http://dcollection.snu.ac.kr/common/orgView/000000158866
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share