Publications

Detailed Information

Robust Sparse Bayesian Infinite Factor Models : 강건 희소 베이즈 무한 인자 모형

DC Field Value Language
dc.contributor.advisor이재용-
dc.contributor.author이재준-
dc.date.accessioned2021-11-30T04:55:14Z-
dc.date.available2021-11-30T04:55:14Z-
dc.date.issued2021-02-
dc.identifier.other000000163884-
dc.identifier.urihttps://hdl.handle.net/10371/176100-
dc.identifier.urihttps://dcollection.snu.ac.kr/common/orgView/000000163884ko_KR
dc.description학위논문 (석사) -- 서울대학교 대학원 : 자연과학대학 통계학과, 2021. 2. 이재용.-
dc.description.abstractMost of previous works and applications of Bayesian factor model have assumed the normal likelihood regardless of its validity. We propose a Bayesian factor model for heavy-tailed high-dimensional data based on multivariate Student-t likelihood to obtain better covariance estimation. We use multiplicative gamma process shrinkage prior and factor number adaptation scheme proposed in Bhattacharya and Dunson [Biometrika (2011) 291-306]. Since a naive Gibbs sampler for the proposed model suffers from slow mixing, we propose a Markov Chain Monte Carlo algorithm where fast mixing of Hamiltonian Monte Carlo is exploited for some parameters in proposed model. Simulation results illustrate the gain in performance of covariance estimation for heavy-tailed high-dimensional data. We also provide a theoretical result that the posterior of the proposed model is weakly consistent under reasonable conditions. We conclude the paper with the application of proposed factor model on breast cancer metastasis prediction given DNA signature data of cancer cell.-
dc.description.abstract베이즈 인자 모형에 대한 대부분의 선행 연구는 자료가 따르는 분포가 정규분포임을 가정한다. 이 연구는 다변수 t 가능도를 사용함으로써, 이상치가 존재하는 고차원 자료에 대해 더 개선된 공분산 추정 성능을 갖는 베이즈 인자 모형을 제시한다. 잠재인자의 수를 결정하기 위해서 본 모형은, 무한히 많은 잠재인자에 대해 수축사전분포를 부여하고 이를 동적으로 절단해나가는 Bhattacharya와 Dunson [Biometrika (2011) 291-306]의 방법을 적용했다. 일반적인 깁스 샘플러는 느린 믹싱으로 인해 본 연구에서 제안한 모형의 사후분포를 계산하는 데 한계가 있기 때문에, 본 연구는 모형 내 일부 모수에 대해 해밀토니안 몬테 카를로 방법을 사용한 사후분포 계산 알고리즘을 제시한다. 본 연구는 제안된 모형으로부터 유도된 사후분포가 특정 조건 하에서 사후일치성을 만족한다는 이론적 성질을 증명하였다. 모의실험을 통해 본 연구에서 제안된 모형이 이상치가 존재하는 고차원 자료 하에서 개선된 공분산 추정 성능을 보인다는 것을 확인할 수 있다. 또한 암 조직의 DNA 시그니처 자료에 본 연구에서 제안한 공분산 추정 모형을 적용하여 유방암 전이 여부를 예측하는 분석 사례를 소개한다.-
dc.description.tableofcontentsAbstract
Contents
List of Tables
List of Figures

1 Introduction 1

2 Factor Models 4
2.1 Settings 4
2.2 Bayesian Factor Models 5
2.2.1 Unidentifiability of Factor Loading 6
2.2.2 Unknown Latent Factor Dimension 7

3 Robust Sparse Bayesian Infinite Factor Models 9
3.1 Sparse Bayesian Infinite Factor Models 9
3.2 Robust Sparse Bayesian Infinite Factor Models 11
3.3 Inference 13

4 Theoretical Properties 16

5 Simulation Study 18

6 Real Data Analysis : T1T2 Node-Negative Breast Cancer Application 23
6.1 Background and Previous Researches 23
6.2 Model and Results 25

7 Discussion 27

8 Appendix 29
8.1 Proof of Theorem 1 29
8.2 Proof of Theorem 2 30

Abstract (In Korean) 39
-
dc.format.extentv, 39-
dc.language.isoeng-
dc.publisher서울대학교 대학원-
dc.subjectBayesian modeling-
dc.subjectFactor model-
dc.subjectMultiplicative gamma process prior-
dc.subjectMultivariate t-distribution-
dc.subjectHamiltonian Monte Carlo-
dc.subject베이즈 모델링-
dc.subject인자 모형-
dc.subject곱 감마 과정 사전분포-
dc.subject다변수 t 분포-
dc.subject해밀토니 안 몬테 카를로-
dc.subject.ddc519.5-
dc.titleRobust Sparse Bayesian Infinite Factor Models-
dc.title.alternative강건 희소 베이즈 무한 인자 모형-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthorLee, Jae-joon-
dc.contributor.department자연과학대학 통계학과-
dc.description.degreeMaster-
dc.date.awarded2021-02-
dc.identifier.uciI804:11032-000000163884-
dc.identifier.holdings000000000044▲000000000050▲000000163884▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share