Publications

Detailed Information

A Study on the Development of an Epigenomic Analysis Method for Biomarkers Identification and Gene Status Definition through Chromatin Openness : 염색질 개방성을 활용한 바이오 마커 발굴과 유전자 상태 정의를 위한 후성유전학적 분석법 개발에 관한 연구

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김광훈

Advisor
김항래; 신현무
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
ATAC-SeqChromatin opennessNormalizationBiomarkerGene statusMultiomic analysis
Description
학위논문(박사) -- 서울대학교대학원 : 의과대학 의과학과, 2023. 8. 김항래
신현무.
Abstract
염색질은 DNA와 상호작용하는 히스톤 단백질로 구성되어 있으며, 여러 전사 조절자들의 상호작용에 따라 열리거나 닫히는 상태를 취할 수 있다. 이 상태는 유전자의 전사 조절에 영향을 미치며, promoter, enhancer, insulator와 같은 cis-regulatory element의 조절에 중요한 역할을 한다. 염색질 상태는 permissive, repressive, poised 상태로 제안 되었으며, 이는 히스톤 변형, DNA 메틸화, 염색질 리모델링에 의해 결정된다. 지난 10년 동안, transposase-accessible chromatin with sequencing (ATAC-Seq) 분석법의 도입은 염색질 개방성을 통한 유전자 조절의 분자 메커니즘에 대한 통찰력을 제공하였고, cis-regulatory elements의 개방성과 유전자 표현 간의 상관관계를 강조하였다. 그러나 ATAC-Seq 기술의 높은 감도 및 신뢰성, 다양한 적용 대상이라는 장점에도 불구하고, 고품질의 ATAC-Seq 라이브러리를 선별하는 지침만 제공된 채, 다양한 샘플에 대한 적절한 비교를 위한 정규화 컨트롤은 아직까지 제안되지 않았다. 또한, 염색질 개방성과 유전자 전사 수준을 통합하여 유전자 조절을 해석하는 다중 오믹스 접근법은 주로 샘플 종류에 따른 비교 분석에만 사용되었으며, 개별 세포 집단의 고유한 특성을 밝혀내는 데는 한계가 있었다. 이에 따라 염색질 개방성에 대한 이해와 그 응용을 향상시키기 위해 두 가지 방안을 제시하였다.
첫째, 염색질 개방성을 이용하여 anti-PD-1 면역항암치료 반응을 예측하는 바이오마커를 개발하는 새로운 접근법을 제시하였다. 이 접근법은 특정 유전체 영역에서 측정된 염색질 개방성을 이용하여 인간 샘플에서 232개의 컨트롤 ATAC-peak를 확보했다. 이를 통해 세포 타입에 상관없이 분석이 가능하게 되었으며, 비교적 짧은 시간 내에 간단히 정규화를 수행할 수 있게 되었다. 그 다음으로, 전이성 위암 환자들의 말초혈액에서 분리한 CD8+ T세포를 대상으로 ATAC-Seq을 활용하여 anti-PD-1 면역항암치료의 초기 또는 사전 치료 단계에서의 치료 반응군을 예측하는 지표들을 발굴했다. 이 과정에서 67개의 치료반응성 예측을 위한 마커를 발굴했고, 9개의 대표적인 마커들을 결합하여 조합 점수를 계산했다. 그 결과, 이 접근법은 85.5%의 민감도를 보여주는 치료 반응 예측 모델을 제공하였고, 간단한 액체 생검을 통해 전이성 위암 환자들의 면역 체크포인트 억제제 반응을 예측할 수 있는 잠재력을 보여줌으로써, anti-PD-1 면역항암치료에 대한 효과적인 치료 판단 기준을 제공할 수 있게 되었다.
둘째, bulk-ATAC-Seq과 bulk-RNA-Seq 데이터를 통합하여 유전자의 염색질 상태를 추정하는 방법을 제시했다. ATAC-Seq에서 얻은 염색질 개방성은 전체적으로 transcription start site (TSS) 주변에 풍부하므로, 유전자의 염색질 개방성을 TSS area로 정량화하여 얻은 분포와 RNA-Seq에서의 얻은 TPM의 분포를 가우시안 혼합 모델 (GMM)을 활용하여 각각의 분포를 두 개의 클러스터로 분류했다. 이후, 각 유전자에 대해 TSS area와 TPM 분포에서 정의된 상태를 결합함으로써 총 네 가지 그룹으로 분류했다. 각 그룹마다 히스톤 변형 결과와 비교를 통해 유전자들을 permissive, repressed, poised 상태의 프로모터로 해석될 수 있는 접근법을 마련함으로써, 개별 세포 집단의 특징을 관여하는 유전자의 염색질 상태 대한 해석 방향을 제공하였다.
이러한 연구 결과는 염색질 개방성을 통한 다양한 질병과 세포 타입의 특성 파악 및 다중 오믹스 접근법을 통한 연구에 도움이 될 것이라고 기대한다. 더 나아가, 이 연구는 더 많은 종류의 암과 염증성 질병을 포함시키는 연구를 확장함으로써 병리학적 상태의 스펙트럼에서 예후 및 상태를 평가할 수 있는 가능성을 보여줄 수 있을 것이라고 기대한다.
Chromatin, composed of DNA and histone proteins, can adopt open or closed states through the cooperation of transcriptional regulators, influencing gene transcription. Gene regulation includes cis-regulatory elements such as promoters, enhancers, insulators, and silencers, which modulate gene expression. Chromatin states of these regulatory elements, encompassing permissive, repressive, and poised, are distinguished by histone modifications, DNA methylation, and chromatin remodeling. Over the past decade, the introduction of the assay for transposase-accessible chromatin with sequencing (ATAC-Seq) has provided insights into the molecular mechanisms of gene regulation through chromatin openness, highlighting the correlation between cis-regulatory elements' openness and gene expression. So far, despite the improved sensitivity, reliability, and wide dynamic range of these ATAC technologies, there have been no appropriate normalization controls proposed for a wide variety of samples, except for the need for high-quality ATAC libraries and deep sequencing instructions. These normalization controls are undoubtedly necessary when comparing multiple sample sets. Additionally, the majority of multi-omic approaches, which integrate chromatin openness and gene expression to interpret gene regulation, have solely focus on comparative analytics rather than elucidating the unique properties of individual cells. Therefore, I present two advancements to improve our understanding of chromatin openness and its applications.
First, I present a novel approach to develop biomarkers to use chromatin openness to distinguish responders and non-responders to anti-PD-1 therapy. This approach involves selection and utilization of control ATAC-peaks. Chromatin openness, quantified as the area derived by summing heights within specific genomic regions in genome browser track, allowed identifying 232 common ATAC peaks in human samples. This enables efficient interpretation of a wide variety of cell types and species, effectively conserving computational resources. This method was subsequently applied to elucidate ATAC-Seq biomarkers in circulating CD8+ T cells from patients with metastatic gastric cancer in early- or pre-treatment phase in anti-PD-1 therapy. This process identified 67 targets, and through the combination of 9 representative markers, a weighted sum score of openness was calculated. This approach provided a predictive model for treatment response, demonstrating 85.5% sensitivity. This innovative approach has the potential to predict the immune checkpoint inhibitor (ICI) response through a simple liquid biopsy in patients with metastatic gastric cancer, which could enhance the efficacy of anti-PD-1 therapy for these patients.
Second, I estimate the chromatin status of protein-coding genes by integrating bulk-ATAC-Seq and bulk-RNA-Seq data. This approach allows for the classification of chromatin states, revealing unique distributions and regulatory mechanisms. Since overall chromatin openness in genome acquired from ATAC-Seq is enriched around the transcription start site (TSS), the TSS area was measured to represent the chromatin openness of a gene. Subsequently, the Gaussian Mixture Model (GMM) is employed to classify the global distribution of the TSS area and TPM from RNA-Seq into two clusters. By combining annotations from ATAC-Seq and RNA-Seq data, genes are classified into four groups. Examination of histone modifications enables the interpretation of these groups as promoters in permissive, repressed, and poised states. This offers insights into genes involved in functional activation or cell differentiation.
These findings encourage further exploration into the characterization of various diseases and cell types through the lens of chromatin openness or through an integrated multi-omics approach. Extending the study to include a wider variety of cancers and inflammatory diseases will allow us to evaluate the applicability and generalizability of these findings across the spectrum of pathological conditions.
Language
eng
URI
https://hdl.handle.net/10371/197090

https://dcollection.snu.ac.kr/common/orgView/000000178288
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share