시계열 데이터 분석을 위한 분산 표상 학습

조현창

서울대학교 중앙도서관

S-Space 소개

My S-Space

로그인이 필요합니다.

S-Space

Publications

Detailed Information

시계열 데이터 분석을 위한 분산 표상 학습 : Interval-wise Embedding for Time Series Data

Cited 0 time in Web of Science Cited 0 time in Scopus

Export

Authors: 조현창

Advisor: 조성준

Major: 공과대학 산업공학과

Issue Date: 2017-02

Publisher: 서울대학교 대학원

Keywords: 시계열 데이터 ; 차원 축소 ; 분산 표상 ; Manifold learning ; Recurrent neural network ; Long shot term memory network ; Electroencephalography data

Description: 학위논문 (석사)-- 서울대학교 대학원 : 산업공학과, 2017. 2. 조성준.

Abstract: 본 연구에서는 distributed representation의 장점을 고려하여, 시계열 데이터를 neural network를 이용해 작은 distributed representation으로 표현하는 방법을제안한다. 이때 사용하는 neural network의 크기를 작게 만들기 위해 전체 시계열데이터를 작은 단위로 쪼갠 후, 각 부분을 하나의 데이터로 인식해 embedding공간상에 위치시킨다. 각 부분간의 시간적 연관관계를 이용해 neural network를학습시킨다. 이를 통해 전체 시계열 데이터에서는 중요하지만 시간상 작은 부분을차지하는 feature들이 무시되는 현상을 줄이며 동시에 전체 embedding space가데이터 간의 semantic한 관계를 보존하게 하는 효과를 얻을 수 있다.
방법론의 효과를 검증하기 위해 본 연구에서는 2개의 인공 데이터와 1개의실제 데이터를 사용하여 검증하였다. 먼저 sine 함수 모양의 인공데이터를 2가지energy based loss 함수에 적용하여 각각의 함수가 embedding space에 시계열데이터의 구간들을 투사하는지 시각화 하였다. 두 번째로 2개의 클래스로 전체시계열을 분리할 수 있는 데이터를 사용하여 encoding neural network의 구조와loss 함수가 실제 embedding의 성능에 어떤 영향을 주는지 정량적으로 살펴보았다. 사용한 loss 함수의 경우 성능에 큰 영향을 주지 못했다. 실험한 3가지 구조는각 2 layer fully connected neural network와 1층짜리 long short term memory network, 2층짜리 long short term memory network로, 그 중 2층 long short term memory 구조가 가장 성능이 좋은 것을 확인할 수 있었다. 마지막으로 실제 뇌전도실험 데이터를 위 방법론에 적용한 결과, 해당 실험에 대해 실제 알려져 있는 6가지phase 중 1개를 검출할 수 있었다.

Language: Korean

URI: https://hdl.handle.net/10371/123618

Files in This Item:

000000141334.pdf 7.67 MB

Appears in Collections:

College of Engineering/Engineering Practice School (공과대학/대학원)
- Dept. of Industrial Engineering (산업공학과)
  - Theses (Master's Degree_산업공학과)

Altmetrics

Item View & Download Count

Show Full Item Record

Find it @ SNU

트윗하기

SNS Share