Publications

Detailed Information

정보학을 활용한 화합물의 효능 및 독성 예측 연구 : Research on informatics-based pharmacological outcome prediction of chemicals

DC Field Value Language
dc.contributor.advisor노민수-
dc.contributor.author안승찬-
dc.date.accessioned2024-05-31T18:01:25Z-
dc.date.available2024-05-31T18:01:25Z-
dc.date.issued2023-
dc.identifier.other000000175790-
dc.identifier.urihttps://hdl.handle.net/10371/204021-
dc.identifier.urihttps://dcollection.snu.ac.kr/common/orgView/000000175790ko_KR
dc.description학위논문(박사) -- 서울대학교대학원 : 약학대학 약학과, 2023. 2. 노민수.-
dc.description.abstractRecently, the artificial intelligence technology has been applied to diverse fields in a new drug development process to improve the overall efficiency of drug development programs. In particular, the machine learning/artificial intelligence models for predicting the pharmacological outcomes of chemicals significantly contribute to the discovery of drug candidates at the early stage of drug discovery. For the successful prediction of biological and/or toxicological activities, chembioinformatics-based machine learning approaches should elucidate a causal relationship between the biological activity of a chemical and its structural information. Currently, there are publicly available chembio-big data, which can be used in artificial intelligence-based predictive models. Biological activities in public chembio-big databases can be classified into two categories, molecular target-directed data and phenotypic ones. Phenotype-based screening evaluates chemical-induced phenotypic changes at the cellular level in the disease-relevant contexts. Importantly, phenotype-based approaches have served as a major source of first-in-class new drugs. As one of the phenotype-based screening systems for the new drug discovery against human metabolic diseases, the adipogenesis model of human bone marrow-derived mesenchymal stem cells (hBM-MSCs) has been used. In this model, the effect of compounds on adipogenesis is evaluated by measuring changes in adiponectin biosynthesis or cellular lipid accumulation. Hypoadiponectinemia is a common feature of diverse metabolic diseases, including obesity, type 2 diabetes, and non-alcoholic steatohepatitis and therefore, the adipogenesis model can be used to discover therapeutic candidates for these metabolic diseases. Alternatively, the model can also be used to evaluate potential metabolic adverse outcomes in human such as obesogens and endocrine disrupting chemicals. In this thesis research, the adipogenesis model of hBM-MSCs was used in the evaludation of potential obesogens and applied to validate a chembioinformatics- based machine learning model of human obesogens. Additionally, the elucidation of the read-across structure-activity relationship (RASAR) between phytochemicals and adiponectin biosynthesis-associated nuclear hormone receptors was performed to overcome the limitation of deficient dataset in chembioinformatics-based predictive machine learning models.
To investigate the transcriptome-level effect of sunscreen ingredient avobenzone (3-(4-tert-butylphenyl)-1-(4-methoxyphenyl) propane-1,3-dione) in normal human epidermal keratinocytes (NHEKs), the transcriptomic profiling of avobenzone-treated NHEKs was performed using microarray. Functional module analysis using Gene Ontology biological process enrichment analysis (GOBPEA) on the identified differentially expressed genes revealed that avobenzone significantly increased the lipid metabolism-associated genes in NHEKs, suggesting that avobenzone is one of metabolic disrupting obesogens. Avobenzone significantly promoted adipogenesis in hBM-MSCs as the other obesogenic chemicals, validating its obesogenic phenotype. Read-across approach predicts adverse outcomes of chemicals based on the quantitatively determined chemical similarities to other toxic substances. In the chemical similarity analysis against previously reported obesogens and ultraviolet filters, cinoxate (2-ethoxyethyl (2E)-3-(4-methoxyphenyl) prop-2-enoate) was a compound most structurally similar to avobenzone. The obesogenic phenotype of cinoxate was also validated in the adipogenesis model of hBM-MSCs. In the subsequent target identification study, cinoxate was found to function as a full agonist of PPARγ, a central nuclear receptor that regulates adipogenesis. Finally, the first chembioinformactics-based machine learning model to predict obesogenic potential from chemical structure was constructed. Chembio-big database was extracted to prepare the training dataset, which includes chemical structures, physicochemical properties, and biological activities against nuclear receptors of obesogen-associated chemicals. This model can be used for early detection of potential environmental obesogens, providing information on the obesogenic possibility of the compound as well as its nuclear receptor target.
Next, the phenotype-based screening system was constructed in silico by applying a chembioinformatic approach to machine learning model for adiponectin secretion-inducing natural products. The amount of data that directly describe the adipogenic phenotype is insufficient and complicated, thus the two models were sequentially implemented to predict adiponectin secretion-inducing activity. First, the random forest-based nuclear receptor activity classifier was constructed with molecular target-directed data. To supplement missing values in the training dataset, the RASAR approach, where the missing values were replaced with the chemical similarity to the most similar biologically active chemical, was introduced. The RASAR approach significantly improved the prediction performance of the nuclear receptor activity classifier. Second, a relative adiponectin score (RAS) model that can predict the adiponectin secretion-inducing activity from the model-predicted nuclear receptor activity was designed. The relative contributions of each nuclear receptor that modulates adiponectin biosynthesis were determined from single-cell transcriptomic profiles of the differentiated adipocytes. In the model, nuclear receptor activity level and the adiponectin gene expression was correlated using multiple linear regression. The RAS model provided adiponectin secretion-inducing activity from the chemical structure, and its performance was experimentally validated using flavonoids isolated from Scutellaria baicalensis.
In conclusion, this thesis study provides the proof of scientific concept that chembioinformatics-based machine learning models successfully predict beneficial or adverse outcomes of chemicals in human metabolism at the phenotypic level rather than the molecular target level. Notably, RASAR approaches improved predictive power of biological outcomes for chemicals lacking their biological activity information. Future studies will be directed to construct a general machine learning model to predict biological phenotypes of more complex chemicals, regardless of their chemotype, by improving the chembioinformatics-based model.
-
dc.description.abstract최근 인공지능 기술은 개발 과정의 효율성을 높이기 위해 신약개발 과정의 다양한 분야에 적용되고 있다. 특히, 화합물의 약물학적 활성을 예측하는 기계학습/인공지능 모델은 신약개발 초기 단계의 신약 후보물질 발굴에 크게 기여하고 있다. 효능 및/또는 독성의 성공적인 예측을 위해서 화학생물정보학 기반의 기계학습 접근법은 화합물의 구조정보와 활성정보 사이의 인과관계를 밝혀야 한다. 현재, 다수의 공공 화학생물정보 빅데이터가 인공지능 기반의 예측 모델에 이용가능하다. 화학생물정보 빅데이터의 생리활성 정보는 크게 두 범주, 직접적인 분자 타겟에 대한 정보와 표현형에 대한 정보로 나눌 수 있다. 표현형 기반 스크리닝은 화합물에 의해 유도된 표현형 변화를 세포 수준에서 질병과 유사한 환경에서 평가한다. 중요하게도, 다수의 퍼스트인클래스 신약이 타겟 기반 보다는 표현형 기반 접근법을 통해 발굴되었다. 대사성질환에 대한 신약개발을 위해 사용되는 표현형 기반 스크리닝 방법 중 하나로 사람 골수유래 중간엽줄기세포(human bone marrow-derived mesenchymal stem cell, hBM-MSC)의 지방분화 모델이 있다. 이 모델에서는 화합물의 지방분화에 대한 영향을 지방세포 유래 사이토카인인 아디포넥틴 생합성 또는 세포내 지질 축적 등 표현형 변화를 측정하여 평가한다. 저아디포넥틴혈증은 비만, 제2형 당뇨병, 비알콜성 지방간염 등 다양한 대사성질환의 공통적인 특징이기 때문에 지방분화 모델을 이러한 대사성질환의 치료 후보물질 발굴에 활용할 수 있다. 한편, 이 모델은 오비소젠이나 내분비교란물질 등 사람 체내에서 대사 독성을 유발하는 물질의 평가에도 활용할 수 있다. 본 학위논문에서는 hBM-MSC의 지방분화 모델을 잠재적인 오비소젠 평가와 오비소젠 예측을 위한 화학생물정보학 기반의 기계학습 모델 검증에 사용하였다. 그리고 천연물과 아디포넥틴 생합성 사이의 상관관계를 화학정보학 기반의 연관형 구조활성상관관계(read-across structure-activity relationship, RASAR)와 생물정보학 기반의 가중치가 반영된 기계학습 모델을 이용하여 규명하였다.
자외선자단제 성분 아보벤존(3-(4-tert-butylphenyl)-1-(4-methoxyphenyl)propane-1,3-dione)의 사람 정상 각질형성세포(normal human epidermal keratinocyte, NHEK)에 대한 전사체 수준의 영향을 평가하기 위해 아보벤존을 처리한 NHEK의 마이크로어레이 분석을 수행하였다. 이 분석으로부터 얻은 차등발현유전자의 목록으로부터 유전자 온톨로지 생물학적경로를 이용한 기능적 모듈 분석을 수행하였다. 아보벤존은 NHEK에서 지질 대사와 관련된 유전자의 발현을 유의하게 증가시켰으며, 따라서 아보벤존을 대사교란 오비소젠으로 제안하였다. 아보벤존은 hBM-MSC의 지방분화 모델에서도 다른 오비소젠과 마찬가지로 지방분화를 촉진시킬 수 있음을 통해 아보벤존의 오비소젠 표현형을 검증하였다. 화학정보학 기반의 연관형 접근법은 다른 활성 물질과 비교하여 정량적으로 결정된 화학적유사도를 이용하여 특정 화합물의 효능 및/또는 독성을 예측하는 방법이다. 여러 자외선차단제 성분과 기존에 보고된 오비소젠 사이의 화학적유사도 분석에서 시녹세이트(2-ethoxyethyl (2E)-3-(4-methoxyphenyl) prop-2-enoate)가 아보벤존과 가장 구조적으로 유사한 물질로 나타났다. 따라서 시녹세이트의 오비소젠 표현형을 hBM-MSC의 지방분화 모델에서 검증하였다. 이어진 타겟 검증 시험에서 시녹세이트는 지방분화의 핵심적인 조절자인 핵수용체 PPARγ의 완전효능약으로 나타났다. 이어서 화합물의 구조로부터 오비소젠 가능성을 예측할 수 있는 화학생물정보학 기반의 기계학습 모델을 구축하였다. 화학생물정보 빅데이터에서 오비소젠 연관 화합물의 구조, 물리화학적 특성, 핵수용체에 대한 활성 정보를 수집하였다. 이 모델은 입력 화합물의 핵수용체 타겟에 대한 활성과 함께 오비소젠 가능성을 확률로 제공함으로써 잠재적 환경 오비소젠의 조기 발견에 기여할 수 있다.
다음으로, 화학생물정보 기반의 기계학습 모델을 사용함으로써 아디포넥틴 분비 촉진 천연물을 예측하기 위한 in silico 표현형 스크리닝 시스템을 구축하였다. 지방분화 등 표현형에 대한 데이터는 부족하고 복잡하기 때문에, 이러한 모델은 2개의 모델을 연속적으로 사용함으로써 구현할 수 있다. 첫 번째 모델로, 랜덤포레스트 기반의 핵수용체 활성 예측모델을 화합물의 핵수용체 타겟에 대한 활성 정보를 이용하여 만들 수 있다. 다만, 공공 데이터베이스로부터 얻은 훈련 데이터셋은 다수의 결측치를 포함하고 있어 이를 보완하기 위해 RASAR를 접근법을 도입하였다. RASAR 접근법은 특정 화합물의 특정 타겟에 대한 결측치를 구조적으로 가장 유사한 화합물에 대한 화학적유사도로 대체하는 방법이다. 이 접근법을 적용함으로써 핵수용체 활성 예측모델의 예측 성능을 크게 개선할 수 있었다. 두 번째 모델로, 위 모델에서 예측된 핵수용체 활성으로부터 상대적 아디포넥틴 점수(relative adiponectin score, RAS)를 계산하는 모델을 만들었다. 예측된 핵수용체 활성에 아디포넥틴 생합성에 대한 각 핵수용체의 정량화된 상대적 기여도를 반영하여 구현할 수 있었는데, 이를 위해 분화된 지방세포의 단일세포 전사체 분석 결과를 이용하였다. 이 모델에서는 각 세포의 핵수용체 활성 수준과 아디포넥틴 유전자 발현의 상관관계를 다중선형회귀 방법을 이용하여 해석하였다. RAS 모델은 화합물의 구조로부터 아디포넥틴 분비 촉진 활성 정보를 제공할 수 있었으며, 그 예측 성능은 황금(Scutellaria baicalensis)에서 분리된 쳔연 플라보노이드 화합물에 대하여 실험적으로 검증하였다.
결론적으로, 본 학위논문은 화학생물정보학 기반의 기계학습 모델이 화합물의 사람 지질대사에 대한 표현형 수준의 효능 및/또는 독성을 성공적으로 예측할 수 있다는 개념을 제시하였다. 더욱이 기존 공공 화학생물정보 빅데이터에서 생리활성 정보가 부족하다는 한계점을 극복하기 위해 RASAR 접근법을 적용하였고, 그 결과, 모델의 활성 예측 성능을 크게 개선시킬 수 있었다. 추후에는 더욱 복잡한 화합물에 대해서도 그 화학형에 관계없이 생리활성 표현형을 예측할 수 있는 기계학습 모델을 만들기 위해 화학생물정보학 기반의 모델을 개선하는 연구를 진행하고자 한다.
-
dc.description.tableofcontents제 1 장 서론 1
제 1 절 신약개발을 위한 화학생물정보학의 응용 1
제 2 절 표현형 기반 스크리닝을 이용한 신약개발 6
제 3 절 지방분화 모델을 이용한 활성 평가 10

제 2 장 결과 및 고찰 20
제 1 절 화학생물정보학을 활용한 오비소젠의 동정 20
2.1.1. 전사체 분석을 통한 아보벤존 유도 대사교란 표현형 탐색 20
2.1.2. 화학정보학 분석을 통해 제시된 시녹세이트의 오비소젠 특성 규명 30
2.1.3. 오비소젠 예측을 위한 기계학습 모델 구축 40
제 2 절 화합물의 효능 예측을 위한 인공지능 43
2.2.1. 천연물의 대사 표현형 예측 기계학습 모델 개발 43

제 3 장 결론 62
제 1 절 화학생물정보학을 활용한 오비소젠의 동정 62
제 2 절 화합물의 효능 예측을 위한 인공지능 64

제 4 장 연구방법 65

참 고 문 헌 74
Abstract 84
-
dc.format.extentviii, 96-
dc.language.isokor-
dc.publisher서울대학교 대학원-
dc.subject화학생물정보학-
dc.subject기계학습-
dc.subject지방세포 분화-
dc.subject오비소젠-
dc.subject아디포넥틴 생합성-
dc.subject구조활성 상관관계-
dc.subject.ddc615-
dc.title정보학을 활용한 화합물의 효능 및 독성 예측 연구-
dc.title.alternativeResearch on informatics-based pharmacological outcome prediction of chemicals-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthorSeungchan An-
dc.contributor.department약학대학 약학과-
dc.description.degree박사-
dc.date.awarded2023-02-
dc.contributor.major천연물과학 전공-
dc.identifier.uciI804:11032-000000175790-
dc.identifier.holdings000000000049▲000000000056▲000000175790▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share