Publications

Detailed Information

Identification of Novel Biomarkers and Drug Candidates via Web-based Bioinformatic Analysis in Fusion-Positive Cancer : 융합 유전자 양성 암에서의 생물정보학 분석 웹 어플리케이션 기반 신규 바이오마커 및 약물후보물질 발굴

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

정재헌

Advisor
허찬영
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
BioinformaticsDrug repurposingTCGAGene fusionCancerWeb ResourceBio PlatformComputational GenomicsTranscriptomicsDifferentially Expressed Genes Analysis
Description
학위논문(박사) -- 서울대학교대학원 : 공과대학 협동과정 바이오엔지니어링전공, 2023. 2. 허찬영.
Abstract
현재까지도 암은 전세계적으로 높은 발병률과 치사율을 보이고 있다. 차세대 염기서열 시퀀싱 기술의 개발을 비롯한 암 생물학 분야의 획기적인 발전은 새로운 진단 및 치료 방법들의 개발을 가능하도록 하였다. 최근에는, 융합 유전자 (gene fusion)들이 각종 암종에서 빈번하게 발견되면서 주요 치료 타겟 및 암의 예후 마커로써 활용되고 있다. 딥 시퀀싱 기술의 발전을 통해 약 1만개의 융합 유전자가 최근 5년 동안 발견되었지만, 이들 중 90% 이상은 분자병리학적인 메커니즘 연구 및 치료제 개발이 제대로 진행되지 못한 상황이다.
분자 메커니즘 연구 및 잠재적인 치료 마커의 탐색은 모두 The Cancer Genome Atlas(TCGA) 데이터베이스에 의해 구성된 암 유전체 빅데이터에 의해 빠른 속도로 발전할 수 있었다. 이에, 임상의 및 암 연구자들에게 소프트웨어 능력과 관계없이 복잡한 암 유전체 데이터에 쉽게 접근, 분석, 시각화 그리고 해석까지 도와주는 다양한 웹 리소스들이 개발되었다. cBioPortal, miRGator v 3.0, TANRIC 및 ISO express는 연구자들이 TCGA 데이터베이스를 분석하는데 다양한 기능을 제공하는 대표적인 웹 포탈들이다. 따라서, 이번 연구에서는 새로운 생물정보학 분석기법을 기반으로 약 1만개의 융합 유전자들의 분자병리학적인 특징들을 분석하고, 잠재적인 치료 타겟까지 탐색하는 웹 포탈인, DRPORTAL을 개발하였다. DRPORTAL은 TCGA로부터 33개 암종에 대한 유전체 및 임상 빅데이터, Jackson laboratory의 유전자 융합 빅데이터, CIViC과 OncoKB의 항암제 빅데이터, 그리고 ConsensuPathDataBase로부터의 세포신호경로 빅데이터를 활용하였다. DRPORTAL은 4단계에 걸쳐 융합 유전자 양성암의 잠재적 약물 후보들을 분석한다. 1) 먼저 융합 유전자 양성 환자군과 음성 환자군에서 연령, 성별, 생존 상태, TNM 암 단계, 유전자 변이 정보 등의 임상병리학적인 특징들을 분석하고, DEG (Differentially Expressed Genes) 분석을 통해 융합 유전자와 상관관계가 높은 유전자군들을 추출한다. 이후, 2) 높은 관계성을 가지는 유전자들을 기반으로 Pathway 분석을 진행하여 주요 암 관련 신호 경로들을 식별한다. 그리고 3) CIViC 및 OncoKB 약물 데이터베이스를 활용하여 약물 표적 네트워크를 구축하고, 4) 마지막으로 선별된 항암제 후보물질들의 우선 순위를 지정해준다.
DRPORTAL에 사용된 생물정보학 분석기법의 신뢰성을 검증하기 위해 ESR1-CCDC170 (E:C) 융합 유전자 양성 유방암 연구와 PTRPRK-RSPO3 (P:R) 융합 유전자 양성 대장암 연구를 진행하였다.
E:C 융합 유전자 양성 유방암 연구를 진행하기 위해 유방암 환자의 mRNA 발현량 데이터에서 11명의 E:C 융합 유전자 양성 환자 샘플과 48명의 음성 환자 샘플을 분석하였다. 그 결과, E:C 융합 유전자 양성 유방암의 임상병리학적인 특징이 triple-positive 유방암과 비슷했으며, basal-type 유방암과는 상호 배타적인 관계인 것으로 확인되었다. 또한 6개 주요 암세포 신호 경로들이 타겟 경로들로 식별되었다 (p53, ATR/ATM, FOXM1, Hedgehog, Cell cycle, Aurora B 관련 세포 신호 경로). 타겟 유전자 들중 8개 유전자 (AURKB, HDAC2, PLK1, CENPA, CHEK1, CHEK2, RB1, MDM2)들이 E:C 융합 유전자의 RNA 발현량과 상관관계가 높았고, 3개 이상의 암 세포 신호 경로들에서 공통적으로 발견되었다. 마지막으로, 약물 데이터베이스로부터 21개의 후보 물질들을 타겟 유전자들과 재배치시켰으며, 그 중 palbociclib, alpelisib, ribociclib, dexamethasone, checkpoint kinase inhibitor AZD7762, irinotecan, milademtan tosylate, R05045337, cisplatin, prexasertib, olaparib 약물들은 2개 이상의 암세포 신호 경로에 포함된 유전자들을 타겟하고 있었다.
P:R 융합 유전자 양성 대장암 연구를 진행하기 위해 mRNA 발현량 데이터에서 7명의 P:R 융합 유전자 양성 환자 샘플과 50개의 음성 환자 샘플을 분석하였다. 그 결과, 앞선 유방암 연구와 같은 DEG 분석을 통해, 2,505개의 유전자가 P:R 융합 유전자와 상관관계가 높은 유전자군으로 식별되었다. 이 유전자군을 기반으로 Pathway 분석을 진행하였고, 10가지 주요 암 세포 신호 경로들(Apoptosis, Direct p53, EGFR, ErbB, JAK-STAT, tyrosine kinases, Pathways in Cancer, SCF-KIT, VEGFR 및 WNT 관련 세포 신호 경로)이 확인되었다. 선별된 세포 신호 경로들 중에서 P:R 융합 유전자에 특이적이고 여러 암 경로에 동시에 관여하는 주요 타겟 유전자 (ALK, ACSL3, AXIN, MYC, TP53, GNAQ, ACVR2A, FAS)들은 P:R 융합 유전자 양성 대장암에서 핵심적인 역할을 하는 것으로 예상한다. 마지막으로, 약물 데이터베이스로부터 crizotinib, alectinib, lorlatinib, brigatinib, ceritinib, erdafitinib, infigratinib 그리고 pemigatinib 약물들이 타겟 유전자들과 연결되었으며, 해당 약물들은 이미 다른 암종에서 상용화되고 있기 때문에 이번 연구에서 최종 약물 후보 물질들로 선정되었다.
결과적으로, 이번 연구를 통해 임상의와 여러 연구자들이 생물정보학 분석능력에 관계없이 약 1만개 융합 유전자들에 대한 유전체 데이터를 쉽게 분석, 해석 그리고 시각화까지 할 수 있을 것으로 예상하며, 더 나아가 아직 분자병리학적인 메커니즘이 밝혀지지 않은 융합 유전자 양성 암종들에 대해 잠재적인 약물후보물질들을 제공해줄 수 있다는 점에서 정밀 의료의 발전과 암 치료 개선에 기여했다고 예상한다.
At present, cancer continues to be a major health problem around the world. The breakthroughs in cancer biology via development of high-throughput sequencing technologies have enabled the development of novel diagnostic and therapeutic approaches. Recently, due to the specificity of fusion genes in cancer, a large number of them have been identified as cancer biomarkers. Since, about 10,000 fusion genes have been discovered via development of sequencing technologies, over 90% of them lack functional mechanisms and therapeutic agents.
Insight into the molecular mechanisms and the identification of potential therapeutic and diagnostic biomarkers in cancer are both greatly aided by the molecular profiling data organized by The Cancer Genome Atlas (TCGA) database. It is significant to offer online platform that make it easy for cancer researchers and clinicians (regardless of their level of computational expertise) to access, analyze, visualize, and interpret cancer transcriptomic data. cBioPortal, miRGator v 3.0, TANRIC, and ISOexpresso are well known public resources that aid researchers to analyze TCGA data. Here, we report DRPORTAL, an easy to use, interactive web-portal to investigate potential therapies targeting 9,950 fusion genes based on new bioinformatical strategy. DRPORTAL uses TCGA level 3 RNA-seq and clinical data from 33 cancer types. DRPORTAL systematically infer potential drug candidates in fusion positive cancer in four steps: 1) we first extract fusion expression correlated genes as well as age, sex, alive status, TNM cancer stages or other clinical features across fusion positive and negative tumor samples, and 2) select oncogenic signaling pathways containing those genes; and 3) construct a drug-target network using the CIViC and OncoKB database, and 4) finally, prioritize suitable cancer drugs.
I have exploited two different fusion positive cancer (ESR1-CCDC170 fusion positive breast cancer, PTRPRK-RSPO3 fusion positive colorectal cancer) to validate the reliability of novel therapeutic strategy.
In ESR1-CCDC170 fusion positive breast cancer, six major cancer-related signaling pathways (p53, ATR/ATM, FOXM1, hedgehog, cell cycle, and Aurora B) were significantly altered. Further investigation revealed that nine genes (AURKB, HDAC2, PLK1, CENPA, CHEK1, CHEK2, RB1, CCNA2, and MDM2) in coordination with E:C fusion were found to be common denominators in three or more of these pathways, thereby making them promising gene biomarkers for target therapy. Among the 21 putative actionable drugs inferred by drug-target network analysis, palbociclib, alpelisib, ribociclib, dexamethasone, checkpoint kinase inhibitor AXD 7762, irinotecan, milademetan tosylate, R05045337, cisplatin, prexasertib, and olaparib were considered promising drug candidates targeting genes involved in at least two E:C fusion-related pathways.
In PTRPRK-RSPO3 fusion positive colorectal cancer, 2505 genes were altered in RNA expression specific. By pathway analysis based on the altered genes, ten major cancer-related signaling pathways (Apoptosis, Direct p53, EGFR, ErbB, JAK-STAT, tyrosine kinases, Pathways in Cancer, SCF-KIT, VEGFR, and WNT-related Pathway) were significantly altered in P:R fusion-positive CRC. Among these pathways, the most altered cancer genes (ALK, ACSL3, AXIN, MYC, TP53, GNAQ, ACVR2A, and FAS) specific for P:R fusion and involved in multiple cancer pathways were considered to have a key role in P:R fusion-positive CRC. Based on the drug-target network analysis, crizotinib, alectinib, lorlatinib, brigatinib, ceritinib, erdafitinib, infigratinib and pemigatinib were selected as putative therapeutic candidates.
Based on the two experiments, we confirmed that DRPORTAL can greatly help cancer biologists and clinicians to identify trustable therapeutic targets and applicable drug candidates for fusion positive cancer.
Language
eng
URI
https://hdl.handle.net/10371/193417

https://dcollection.snu.ac.kr/common/orgView/000000175106
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share