Publications

Detailed Information

시계열 데이터 분석을 위한 분산 표상 학습 : Interval-wise Embedding for Time Series Data

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

조현창

Advisor
조성준
Major
공과대학 산업공학과
Issue Date
2017-02
Publisher
서울대학교 대학원
Keywords
시계열 데이터차원 축소분산 표상Manifold learningRecurrent neural networkLong shot term memory networkElectroencephalography data
Description
학위논문 (석사)-- 서울대학교 대학원 : 산업공학과, 2017. 2. 조성준.
Abstract
본 연구에서는 distributed representation의 장점을 고려하여, 시계열 데이터를 neural network를 이용해 작은 distributed representation으로 표현하는 방법을제안한다. 이때 사용하는 neural network의 크기를 작게 만들기 위해 전체 시계열데이터를 작은 단위로 쪼갠 후, 각 부분을 하나의 데이터로 인식해 embedding공간상에 위치시킨다. 각 부분간의 시간적 연관관계를 이용해 neural network를학습시킨다. 이를 통해 전체 시계열 데이터에서는 중요하지만 시간상 작은 부분을차지하는 feature들이 무시되는 현상을 줄이며 동시에 전체 embedding space가데이터 간의 semantic한 관계를 보존하게 하는 효과를 얻을 수 있다.
방법론의 효과를 검증하기 위해 본 연구에서는 2개의 인공 데이터와 1개의실제 데이터를 사용하여 검증하였다. 먼저 sine 함수 모양의 인공데이터를 2가지energy based loss 함수에 적용하여 각각의 함수가 embedding space에 시계열데이터의 구간들을 투사하는지 시각화 하였다. 두 번째로 2개의 클래스로 전체시계열을 분리할 수 있는 데이터를 사용하여 encoding neural network의 구조와loss 함수가 실제 embedding의 성능에 어떤 영향을 주는지 정량적으로 살펴보았다. 사용한 loss 함수의 경우 성능에 큰 영향을 주지 못했다. 실험한 3가지 구조는각 2 layer fully connected neural network와 1층짜리 long short term memory network, 2층짜리 long short term memory network로, 그 중 2층 long short term memory 구조가 가장 성능이 좋은 것을 확인할 수 있었다. 마지막으로 실제 뇌전도실험 데이터를 위 방법론에 적용한 결과, 해당 실험에 대해 실제 알려져 있는 6가지phase 중 1개를 검출할 수 있었다.
Language
Korean
URI
https://hdl.handle.net/10371/123618
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share