Anomaly Handling of Observational Data Based on Machine Learning

이민기

서울대학교 중앙도서관

S-Space 소개

My S-Space

로그인이 필요합니다.

S-Space

Publications

Detailed Information

Anomaly Handling of Observational Data Based on Machine Learning : 기계 학습에 기반한 관측 자료의 이상 처리

Cited 0 time in Web of Science Cited 0 time in Scopus

Export

Authors: 이민기

Advisor: 문병로

Major: 공과대학 전기·컴퓨터공학부

Issue Date: 2018-08

Publisher: 서울대학교 대학원

Description: 학위논문 (박사)-- 서울대학교 대학원 : 공과대학 전기·컴퓨터공학부, 2018. 8. 문병로.

Abstract: 관측시스템에서 수집되는 관측 자료는 여러 현상을 예측하고 분석하는데 중요한 역할을 한다. 그러나 관측 자료에는 여러가지 이유로 상당한 양의 비정상 값이 존재한다. 이런 비정상 값을 찾아내고 처리하는 일은 매우 중요하다. 가장 대표적이고 중요한 관측 자료 중 하나는 기상 관측 자료이다. 본 논문에서는 비정상 값을 탐지하고 보정하기 위해서 기계 학습을 기반으로 한 새로운 방법을 제시하고, 다양한 종류의 실제 기상 관측 자료에 테스트했다.

기상학에서는 비정상 값을 찾는 과정을 품질 관리라고 부른다. 품질 관리 과정에서 발견된 비정상 값을 보정하기 위해서 기계 학습 기법을 이용한 세 가지 추정 모델을 제시했다. 우리는 제시된 모델을 기존의 추정 모델, 보간법과 비교했다. 목표가 되는 기상 요소만 사용하는 보간법과는 달리, 제안한 모델은 관련된 다른 기상 요소들과 주변의 기상 관측 지점의 자료도 사용한다. 신뢰할만한 기관에서 수집된 실제 자료에 대해서 실험해본 결과, 제안한 방법은 보간법에 비해서 RMSE를 8.35% 감소시켜, 더 정확하게 목표값을 추정할 수 있음을 보였다. 다시 말해, 우리가 제시한 방법은 예전 방법들보다 더 적절하게 비정상값들을 대체할 수 있다.

또한 우리는 공간적인 관점에서 관측 자료 중에 비정상 값을 찾아내기 위한, 향상된 품질 관리 기법을 제시한다. 관측값을 예측하기 위해서 지지 벡터 회귀가 사용되었다. 예측된 값과 실제 관측값의 차이를 통해서 관측값이 정상인지 비정상인지를 판별한다. 또한 지지 벡터 회귀의 성능을 향상시키고 수행 시간을 줄이기 위해서, 지지 벡터 회귀의 입력 변수를 선별한다. 선별 과정에서 유사도와 공간성 다양성이라는 두 가지 목적 함수를 동시에 최적화하기 위해, 다목적함수 유전 알고리즘이 사용되었다. 실제 자료를 사용한 실험에서 지지 벡터 회귀를 이용한 추정은 기준이 되는 방법들에 비해서, 경쟁력 있는 수행 시간을 유지하면서 RMSE를 45.44%만큼 감소시켰다.

Language: English

URI: https://hdl.handle.net/10371/142994

Files in This Item:

Anomaly Handling of Observational Data Based on Machine Learning.pdf 6.17 MB

Appears in Collections:

College of Engineering/Engineering Practice School (공과대학/대학원)
- Dept. of Computer Science and Engineering (컴퓨터공학부)
  - Theses (Ph.D. / Sc.D._컴퓨터공학부)

Altmetrics

Item View & Download Count

Show Full Item Record

Find it @ SNU

트윗하기

SNS Share