Publications

Detailed Information

Integrated Analysis of Genome and Transcriptome to Enhance Understanding of Rare Neuromuscular Disorders : 희귀 신경근 질환의 유전체, 전사체 통합 분석 연구

DC Field Value Language
dc.contributor.advisor최무림-
dc.contributor.authorJana Kneissl-
dc.date.accessioned2019-10-18T17:47:27Z-
dc.date.available2019-10-18T17:47:27Z-
dc.date.issued2019-08-
dc.identifier.other000000157454-
dc.identifier.urihttps://hdl.handle.net/10371/161542-
dc.identifier.urihttp://dcollection.snu.ac.kr/common/orgView/000000157454ko_KR
dc.description학위논문(석사)--서울대학교 대학원 :의과대학 의과학과,2019. 8. 최무림.-
dc.description.abstractWhole exome sequencing (WES)은 비용 및 데이터 처리의 용이성으로 인하여 희귀질환 진단등에 매우 효과적인 방법이 되었다. 그러나 variant of unknown significances (VUS)를 해석하는 어려움과non-coding 변이형을 확인할 수 없다는 점 등의 이유로 WES 기반의 희귀질환 진단률은 대부분 50%를 넘지 못한다. 따라서, 본 연구에서는 희귀질환 진단의 보완적인 접근법으로 새로이 전사체 분석법을 도입할 것을 제시하고자 한다. 이를 위하여 서울대학교 어린이병원 소아신경과에서 임상적으로 진단되지 못한 근신경질환 환자 94 명을 대상으로 WES 분석을 실시하고, 이미 알려진 근신경질환의 원인 유전자 변이들을 분석하였다. 추가적으로, 기존에 WES 분석이 수행된 63명의 환자군과 이 외의 10명의 환자군을 추가하여 전사체 분석을 수행하였다. 전사체 데이터를 이용하여 damaging 변이 분석, allele-specific expression 분석, 환자군과 정상군에서 다르게 발현하는 유전자 (DEG) 및 비정상적인 splicing 양상을 탐색하는 분석을 수행하였다. 또한, non-negative matrix factorization 분석 기법을 통해 유전자 발현 프로파일을 기반으로 한 군집화를 수행하고, 각 군집을 특징 짓는 유전자 그룹을 도출하였다. 그 결과, WES 분석을 통하여 49%의 환자에서 후보 원인 변이를 확인하였으며, 그 중 83%의 환자에서는 알려진 근신경질환 원인 유전자의 변이를 확인하였다. 12명의 환자에서는 그 기능성이 확실하지 않은 구조 변이를 확인하였다. 전사체 데이터 기반의 변이 분석을 통하여, WES 을 수행하지 않은 5 명의 환자를 포함한 총 9 명의 환자에서 heterozygous 변이를 추가로 발견하였다. Allele-specific expression 분석을 통하여 2개의 후보 원인유전자를 발견하였고, DEG 분석 결과, 4명의 환자에서 잠재적인 원인 유전자 그룹을 선별할 수 있었다. 또한, 4 명의 환자에게서 DMD, TTN, MICU1 유전자들의 비정상적인 splicing이 확인되었다. non-negative matrix factorization 기반 군집화 분석 결과, 유전자 발현 양상을 기반으로 한 6개의 군집을 확인할 수 있었다. 본 연구를 통하여 전사체 분석법이 기존의 WES 기법 기반 분석의 효과적인 보완 기법이 될지의 여부를 확인하고자 하였다. 전사체 분석 결과, WES 기법을 통해 원인 유전자 변이가 확인된 환자들 중 9명에게서 같은 맥락의 전사체 이상을 확인할 수 있었으며, WES을 수행하지 않은 환자들 중 18명에게서도 잠재적인 원인 유전자 변이를 확인하였다. 따라서 전사체 분석법은 기존의 분석기법으로 원인 유전자 변이를 발견할 수 없는 증례의 진단에 유용한 도구로 사용될 수 있음을 시사한다.-
dc.description.abstractIntroduction. Whole exome sequencing has become a robust and standard tool for rare diseases diagnosis thanks to advantages in cost and data handling. However, whole exome sequencing-based diagnosis rates typically do not exceed 50%, which can be attributed to the difficulty of interpreting variants of uncertain significance, as well as to the disregard of non-coding variants, including variants in intronic and regulatory regions in the genome. Therefore, I explored the utility of transcriptome sequencing as a compensatory approach in rare neuromuscular disorders diagnosis.
Methods. Whole exome sequencing of 94 patients with undiagnosed neuromuscular disorders was collected from Seoul National University Childrens Hospital and analyzed for variants in known neuromuscular disease genes. Additional transcriptome sequencing was performed for 63 of the whole exome sequenced patients and for ten patients without genome data. Transcriptome data were utilized for cryptic damaging variants, differentially expression, aberrant splicing and allele specific expression analysis. Furthermore, non-negative matrix factorization was applied to identify expression-based clustering and cluster-specific gene ontology was derived.
Results. Whole exome sequencing analysis identified candidate variants in 49% of patients, with 83% of them located within known disease genes. Structural variants with questionable pathogenicity were discovered in twelve cases. RNA-Sequencing based variant calling lead to further discovery of heterozygous candidate variants in nine samples, five of which did not undergo whole exome sequencing. Allele specific expression identified two likely candidate genes and differential gene expression analysis lead to the prioritization of sets of genes in an additional four samples. Lastly, aberrant splicing of DMD, TTN and MICU1 was detected in each of four samples. Non-negative matrix factorization-based clustering resulted in the identification of six clusters with distinct gene expression profiles.
Discussion. Firstly, I aimed to evaluate whether transcriptome sequencing can provide additional evidence for the interpretation of whole exome sequencing variants. Overall, transcriptome sequencing was able to detect abnormalities associated with the previously identified mutation in less than 30% of positive whole exome sequencing cases. For samples without whole exome sequencing result, I successfully used transcriptome sequencing to identify potential pathogenic causes in 18 cases. In conclusion, transcriptome sequencing proved to be a useful tool for the diagnosis of whole exome sequencing negative samples, but did not prove to have great utility for the interpretation of pathogenic whole exome sequencing variants.
-
dc.description.tableofcontents1. INTRODUCTION.....................................................................................1
1.1. Advancement through next generation sequencing...................1
1.2. Genetics of neuromuscular disorders (NMD)..............................3
1.3. Transcriptome sequencing-based NMD diagnosis.......................8
2. METHODS............................................................................................12
2.1. Data collection.........................................................................12
2.2. Whole exome sequencing data analysis....................................13
2.3. Transcriptome sequencing analysis...........................................15
2.4. Non-negative matrix factorization based clustering...................19
3. RESULTS...............................................................................................22
3.1. Data collection.........................................................................22
3.2. Phenotype information.............................................................23
3.3. Whole exome sequencing results..............................................25
3.4. Transcriptome sequencing quality control..................................28
3.5. Transcriptome-based clustering.................................................31
3.6. Exome variants in transcriptome sequencing.............................35
3.7. Transcriptome-sequencing based diagnosis...............................39
4. DISCUSSION..........................................................................................48
5. REFERENCES.........................................................................................57
6. APPENDIX.............................................................................................63
6.1. Supplementary Figures..............................................................63
6.2. Supplementary Tables................................................................67
7. 국문초록.................................................................................................71
-
dc.language.isoeng-
dc.publisher서울대학교 대학원-
dc.subjectwhole exome sequencing-
dc.subjecttranscriptome sequencing-
dc.subjectneuromuscular disorders-
dc.subjectmultiomics-
dc.subjectdiagnosis-
dc.subjectMendelian disorder-
dc.subjectvariant discovery-
dc.subjectexpression-based clustering-
dc.subject.ddc610.72-
dc.titleIntegrated Analysis of Genome and Transcriptome to Enhance Understanding of Rare Neuromuscular Disorders-
dc.title.alternative희귀 신경근 질환의 유전체, 전사체 통합 분석 연구-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthor자나-
dc.contributor.department의과대학 의과학과-
dc.description.degreeMaster-
dc.date.awarded2019-08-
dc.contributor.majorNext generation sequencing-
dc.identifier.uciI804:11032-000000157454-
dc.identifier.holdings000000000040▲000000000041▲000000157454▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share