Publications

Detailed Information

Classification for Functional Data using Functional Principal Component Analysis : 함수형 주성분분석을 활용한 함수형 데이터 분류 문제 해결

DC Field Value Language
dc.contributor.advisorPARK JUN YONG-
dc.contributor.author현승엽-
dc.date.accessioned2023-11-20T04:50:37Z-
dc.date.available2023-11-20T04:50:37Z-
dc.date.issued2023-
dc.identifier.other000000178367-
dc.identifier.urihttps://hdl.handle.net/10371/197337-
dc.identifier.urihttps://dcollection.snu.ac.kr/common/orgView/000000178367ko_KR
dc.description학위논문(석사) -- 서울대학교대학원 : 자연과학대학 통계학과, 2023. 8. PARK JUN YONG.-
dc.description.abstractFunctional data refers to multivariate data with an ordering on the dimensions.
In dealing with such data, it is more effective to apply methods that consider the high dimensionality and inter-variable correlations characteristic of functional data, rather than conventional multivariate analysis approaches.
FPCA, as a method of Functional Data Analysis (FDA), is a principal component analysis technique specifically tailored for functional data.
It considers the order of variables and the continuity of data, making it an effective approach for analyzing functional datasets.
In this thesis, we will compare the performance of several machine learning models for solving the binary classification problem on three different functional datasets.
This comparison will shed light on the effectiveness of machine learning models and the application of FPCA when addressing binary classification problems with functional data.
-
dc.description.abstract함수형 데이터는 각 차원의 순서가 있는 다변량 데이터를 말한다.
함수형 데이터를 다룰 때는 기존의 다변량 분석 접근 방식보다 함수형 데이터의 고차원성과 변수 간 상관관계를 고려하는 방법을 적용하면 효과적이다.
함수형 주성분 분석은 함수형 데이터 분석의 한 방법으로서, 변수의 순서와 데이터의 연속성을 고려하여 함수형 데이터에 적용할 수 있게 고안된 주성분 분석 방법이다.
이 논문에서는 여러 가지 머신러닝 모델을 이용하여 세 가지의 함수형 데이터셋에 대한 이진 분류 문제를 해결하고 각 모형의 성능을 비교한다.
이를 통해 함수형 데이터에 대한 머신러닝 모델의 성능과 함수형 주성분 분석의 효과를 확인한다.
-
dc.description.tableofcontentsAbstract i

Chapter1. Introduction 1

Chapter2. Methodology 3
2.1 Logistic Regression 3
2.2 Random Forest 4
2.3 Fused Lasso 6
2.4 XGBoost 7
2.5 Functional Principal Component Analysis 9

Chapter3. Application 12
3.1 SEE dataset 12
3.2 Earthquake dataset 15
3.3 Strawberry dataset 16

Chapter4. Conclusion 19

Appendix A Codes 21
A.1 Python Code for Random Forest 21
A.2 Python Code for XGBoost 24
A.3 R Code for Classification based on Fused Lasso 26

초록 30
-
dc.format.extentv, 30-
dc.language.isoeng-
dc.publisher서울대학교 대학원-
dc.subjectClassification-
dc.subjectFunctional Data Analysis-
dc.subjectFunctional Principal Component Analysis-
dc.subject.ddc519.5-
dc.titleClassification for Functional Data using Functional Principal Component Analysis-
dc.title.alternative함수형 주성분분석을 활용한 함수형 데이터 분류 문제 해결-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthorSeungyeop Hyun-
dc.contributor.department자연과학대학 통계학과-
dc.description.degree석사-
dc.date.awarded2023-08-
dc.identifier.uciI804:11032-000000178367-
dc.identifier.holdings000000000050▲000000000058▲000000178367▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share