Publications

Detailed Information

Elliptical k-means Algorithm and Hyperparameter Selection Strategy for Prediction and Clustering on the Torus by Conformal Prediction : 토러스 공간 상에서의 적합예측 기반 예측 및 클러스터링을 위한 타원형 k-평균 알고리즘과 초모수 선택 전략

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

홍승기

Advisor
정성규
Issue Date
2022
Publisher
서울대학교 대학원
Keywords
Toroidalspaceconformalpredictioninductiveconformalpredictionclusteringellipticalk-meansalgorithmhyperparameterselection
Description
학위논문(석사) -- 서울대학교대학원 : 자연과학대학 통계학과, 2022. 8. 정성규.
Abstract
Protein structure data consist of several dihedral angles, lying on a multidimensional torus. Analyzing such data has been and continues to be key in
understanding functional properties of proteins. However, most of the existing
statistical methods assume that data are on Euclidean spaces, and thus they
are improper to deal with angular data. In this paper, we introduce a novel
approach specialized to analyzing multivariate angular data, based on elliptical
k-means algorithm. Our approach enables the construction of conformal prediction sets and predictive clustering based on mixture model estimates. Moreover,
we also introduce a novel hyperparameter selection strategy for predictive clustering, with improved stability and computational efficiency. We demonstrate
our achievements with the package ClusTorus, one of our implementations, in
clustering protein dihedral angles from two real data sets.
단백질 구조 데이터는 다차원 토러스 상의 각도들로 구성되어 있다. 이러한
특성을 가진 데이터에 대한 연구는 단백질의 기능적 특성을 파악하는 데에 중요한
열쇠가 되어왔다. 그러나 대부분의 통계적 방법론들은 유클리드 공간을 가정하기
때문에 다차원 각도 데이터에 부적합하다. 본 논문에서는 타원형 k-평균 알고리즘
을 활용하여 다차원 각도 데이터를 분석하는 법을 소개한다. 특히 본 논문에서는
적합예측집합을 구성하고 혼합 모형 추정을 통한 예측 클러스터링 방법론을 소개
한다. 또한 안정성과 계산 효율성을 확보한 새로운 초모수 선택 전략을 제시한다.
마지막으로, 본 논문의 방법론을 구현한 R 패키지 ClusTorus를 활용하여 실제
데이터셋에 적용한 예시를 소개한다.
Language
eng
URI
https://hdl.handle.net/10371/188602

https://dcollection.snu.ac.kr/common/orgView/000000172105
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share