Publications

Detailed Information

Semiconductor Data Analysis via Multi-stage Stacked Generalization : 다층 모델 쌓기를 통한 반도체 공정 데이터 분석

DC Field Value Language
dc.contributor.advisor오희석-
dc.contributor.author박민준-
dc.date.accessioned2020-10-13T04:04:20Z-
dc.date.available2020-10-13T04:04:20Z-
dc.date.issued2020-
dc.identifier.other000000161355-
dc.identifier.urihttps://hdl.handle.net/10371/170744-
dc.identifier.urihttp://dcollection.snu.ac.kr/common/orgView/000000161355ko_KR
dc.description학위논문 (석사) -- 서울대학교 대학원 : 자연과학대학 통계학과, 2020. 8. 오희석.-
dc.description.abstractThis study examines the effect of multi-stage stacked generalization via semiconductor data analysis. Stacked generalization (or stacking) has been popular in the scene of machine learning, especially for data competition such as Kaggle. Stacking is an ensemble method that combines different machine learning algorithms to produce best result. It stacks the predictions from base learners and use them as input for high-level learner. For constructing ensemble models with multi-stage stacking, gradient boosting libraries such as XGBoost and LightGBM play important roles as higher-level learners. Gradient boosting libraries are widely used due to its efficiency, accuracy and interpretability and achieves better performance in stacking model than other algorithms. Through semiconductor data, we verify that multi-stage stacking model with gradient boosting libraries as high-level learners shows relatively good performance compared to single models or other stacking models.-
dc.description.abstract본 학위논문은 반도체 공정 데이터 분석을 통해 다층 모형 쌓기(multi-stage stacked generalization)의 효과를 살펴보는 것을 주 목적으로 한다. 모형 쌓기는 기계학습 분야, 특히 Kaggle과 같은 데이터 분석 경진대회에서 널리 사용되고 연구되었다. 서로 다른 알고리즘들을 결합하여 최적의 결과를 도출하는 앙상블 방법 중 하나이다. 다수의 학습기들을 훈련시켜 얻은 결과물을 다시 인풋으로 활용하여 더 높은 계층의 학습기로 훈련시켜 최종 결과를 도출하는 방법이다. 이런 모형 쌓기를 활용한 앙상블 모형의 구성에 있어 그라디언트 부스팅 계열의 XGBoost와 LightGBM이 높은 계층의 학습기로서 중요한 역할을 수행하였다. 그라디언트 부스팅 라이브러리들을 높은 계층의 학습기로서 활용한 다층 모형 쌓기의 효과를 단일 모형 혹은 다른 앙상블 모형들과 비교함으로써 확인하였다.-
dc.description.tableofcontents1 Introduction 1
2 Overview 3
2.1 GradientBoosting 3
2.1.1 Boosting 3
2.1.2 Gradienttreeboosting 4
2.2 XGBoostandLightGBM 9
2.2.1 XGBoost 9
2.2.2 LightGBM 10
2.3 StackedGeneralization 12
3 Application 14
3.1 DatasetandSetup 14
3.2 Comparison 15
4 Conclusion 18
-
dc.language.isoeng-
dc.publisher서울대학교 대학원-
dc.subjectStacked generalization-
dc.subjectGradient boosting-
dc.subjectXGBoost-
dc.subjectLightGBM-
dc.subject다층 모형 쌓기-
dc.subject반도체 공정 데이터 분석-
dc.subject.ddc519.5-
dc.titleSemiconductor Data Analysis via Multi-stage Stacked Generalization-
dc.title.alternative다층 모델 쌓기를 통한 반도체 공정 데이터 분석-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.department자연과학대학 통계학과-
dc.description.degreeMaster-
dc.date.awarded2020-08-
dc.identifier.uciI804:11032-000000161355-
dc.identifier.holdings000000000043▲000000000048▲000000161355▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share