Publications

Detailed Information

Pathway-based Approach using Hierarchical Structural Component Models to Analyze Multinomial Phenotypes : 다항 표현형 자료를 이용한 패스웨이 분석 계층적 구조 모형

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

캄루자만

Advisor
Taesung Park
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
Pathway analysishierarchical structurelongitudinal datamultinomial phenotypeparametric testing
Description
학위논문(박사) -- 서울대학교대학원 : 자연과학대학 통계학과, 2023. 2. Taesung Park.
Abstract
To identify novel pathways from markers associated with a particular disease, several statistical methods of pathway analysis have been applied. However, most of the available methods are based on single pathway analyses and do not consider multiple pathways simultaneously. Since pathways are highly correlated, multiple pathway analyses suffer from this correlation. To address this issue, a hierarchical structural component model (HisCoM) was developed, which considered all pathways at the same time, as well as the correlations among them. HisCoM has been successfully applied to the analysis of continuous, counts, and binary phenotypes but it is not readily applicable for analyzing multinomial phenotypes.
In this thesis, we propose novel statistical methods, the hierarchical structural component analysis for multinomial phenotypes (HisCoM-Categ), and hierarchical structural component analysis for longitudinal data with multinomial phenotypes (HisCoM-RCateg). In addition, we also propose a parametric testing approach rather than a permutation approach for HisCoM to find the association between pathways and phenotypes.
As the existing HisCoM, HisCoM-Categ considers the biomarker and pathway hierarchies while accounting for the correlations of all pathways by using the ridge penalty. For identifying the association between pathways and phenotype, HisCoM-Categ uses the baseline category logit model for nominal phenotypes and the proportional odds model for ordinal phenotypes. HisCoM-RCateg is an extended version of HisCoM-Categ for longitudinal multinomial phenotypes. Like HisCoM-Categ, HisCoM-RCateg can also identify the significant pathways associated with the desired phenotype by analyzing all pathways at a same time. Both HisCoM-Categ and HisCoM-RCateg are flexible enough to be used for various types of omics data. For example, we used our HisCoM-Categ and HisCoM-RCateg methods on a real metabolomic dataset from the Korean Association Resource (KARE) to identify the association between metabolite pathways and type 2 diabetics (T2D). It is noted that T2D is a metabolic disease affected by multiple genetic factors, which is a major public health concern. Application to the KARE metabolite dataset demonstrates that HisCoM-Categ and HisCoM-RCateg are able to identify the pathways that are associated with T2D. Through simulation study, we also show that HisCoM-Categ and HisCoM-RCateg perform better than other methods.
그동안 특정 질병과 관련된 마커로부터 새로운 경로를 식별하기 위해 경로 분석의 여러 통계적 방법이 적용되어 왔습니다. 하지만 사용 가능한 대부분의 방법은 단일 경로 분석을 기반으로 하며 여러 경로를 동시에 고려하지 않습니다. 경로는 높은 상관 관계가 있기 때문에 다중 경로 분석은 이러한 상관 관계의 문제를 겪습니다. 이 문제를 해결하기 위해 HisCoM(계층적 구조 구성 요소 모델)이 개발되었습니다. 이 모델은 모든 경로와 경로 간의 상관 관계를 동시에 고려했습니다. HisCoM은 연속형, 이산형 및 이진형 데이터 분석에 성공적으로 적용되었지만 다항 표현형 분석에는 쉽게 적용할 수 없습니다.
본 논문에서는 다항 표현형에 대한 계층적 구조 성분 분석(HisCoM-Categ)과 다항 표현형 종단 데이터에 대한 계층적 구조 성분 분석(HisCoM-RCateg)이라는 새로운 통계 방법을 제안한다. 또한 HisCoM이 경로와 표현형 간의 연관성을 찾기 위해 순열 접근 방식이 아닌 모수적 가설검정 접근 방식을 제안한다.
HisCoM-Categ는 기존 HisCoM과 마찬가지로 바이오마커와 경로 계층을 고려하면서 릿지 페널티를 사용하여 모든 경로의 상관관계를 고려합니다. 경로와 표현형 사이의 연관성을 확인하기 위해 HisCoM-Categ는 명목상 표현형에 대한 기본 범주 로짓 모델과 서수 표현형에 대한 비례 확률 모델을 사용합니다. HisCoM-RCateg는 세로 다항 표현형을 위한 HisCoM-Categ의 확장 버전입니다. HisCoM-Categ와 마찬가지로 HisCoM-RCateg도 동시에 모든 경로를 분석하여 원하는 표현형과 관련된 중요한 경로를 식별할 수 있습니다. HisCoM-Categ 및 HisCoM-RCateg는 모두 다양한 유형의 오믹스 데이터에 사용할 수 있을 만큼 유연합니다. 예를 들어, 우리는 Korean Association Resource (KARE)의 실제 대사체 데이터 세트에서 HisCoM-Categ 및 HisCoM-RCateg 방법을 사용하여 대사 경로와 제2형 당뇨병(T2D) 사이의 연관성을 확인했습니다. T2D는 여러 유전적 요인에 의해 영향을 받는 대사성 질환이며, 이는 주요 공중 보건 문제입니다. KARE 대사산물 데이터 세트에 대한 적용은 HisCoM-Categ 및 HisCoM-RCateg가 T2D와 관련된 경로를 식별할 수 있음을 보여줍니다. 또한 시뮬레이션 연구를 통해 HisCoM-Categ 및 HisCoM-RCateg가 다른 방법보다 더 나은 성능을 보인다는 것을 보여줍니다.
Language
eng
URI
https://hdl.handle.net/10371/194389

https://dcollection.snu.ac.kr/common/orgView/000000176409
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share