Publications

Detailed Information

시계열 데이터 분석을 위한 분산 표상 학습 : Interval-wise Embedding for Time Series Data

DC Field Value Language
dc.contributor.advisor조성준-
dc.contributor.author조현창-
dc.date.accessioned2017-07-14T03:25:42Z-
dc.date.available2017-07-14T03:25:42Z-
dc.date.issued2017-02-
dc.identifier.other000000141334-
dc.identifier.urihttps://hdl.handle.net/10371/123618-
dc.description학위논문 (석사)-- 서울대학교 대학원 : 산업공학과, 2017. 2. 조성준.-
dc.description.abstract본 연구에서는 distributed representation의 장점을 고려하여, 시계열 데이터를 neural network를 이용해 작은 distributed representation으로 표현하는 방법을제안한다. 이때 사용하는 neural network의 크기를 작게 만들기 위해 전체 시계열데이터를 작은 단위로 쪼갠 후, 각 부분을 하나의 데이터로 인식해 embedding공간상에 위치시킨다. 각 부분간의 시간적 연관관계를 이용해 neural network를학습시킨다. 이를 통해 전체 시계열 데이터에서는 중요하지만 시간상 작은 부분을차지하는 feature들이 무시되는 현상을 줄이며 동시에 전체 embedding space가데이터 간의 semantic한 관계를 보존하게 하는 효과를 얻을 수 있다.
방법론의 효과를 검증하기 위해 본 연구에서는 2개의 인공 데이터와 1개의실제 데이터를 사용하여 검증하였다. 먼저 sine 함수 모양의 인공데이터를 2가지energy based loss 함수에 적용하여 각각의 함수가 embedding space에 시계열데이터의 구간들을 투사하는지 시각화 하였다. 두 번째로 2개의 클래스로 전체시계열을 분리할 수 있는 데이터를 사용하여 encoding neural network의 구조와loss 함수가 실제 embedding의 성능에 어떤 영향을 주는지 정량적으로 살펴보았다. 사용한 loss 함수의 경우 성능에 큰 영향을 주지 못했다. 실험한 3가지 구조는각 2 layer fully connected neural network와 1층짜리 long short term memory network, 2층짜리 long short term memory network로, 그 중 2층 long short term memory 구조가 가장 성능이 좋은 것을 확인할 수 있었다. 마지막으로 실제 뇌전도실험 데이터를 위 방법론에 적용한 결과, 해당 실험에 대해 실제 알려져 있는 6가지phase 중 1개를 검출할 수 있었다.
-
dc.description.tableofcontents제 1 장 서 론 1
제 2 장 관련 연구 4
제 1 절 Distributed representation 학습구조 및 방법 4
제 2 절 Encoder 6
제 3 절 Loss 함수 8
제 3 장 제안 기법 12
제 4 장 실험 및 결과 15
제 1 절 단변량 Sine 함수 15
제 2 절 다변량 무작위 Gaussian stream 19
제 3 절 물체 들어올리기 실험 간 뇌전도 데이터 20
제 5 장 결 론 24
참고문헌 26
Abstract 28
-
dc.formatapplication/pdf-
dc.format.extent8039007 bytes-
dc.format.mediumapplication/pdf-
dc.language.isoko-
dc.publisher서울대학교 대학원-
dc.subject시계열 데이터-
dc.subject차원 축소-
dc.subject분산 표상-
dc.subjectManifold learning-
dc.subjectRecurrent neural network-
dc.subjectLong shot term memory network-
dc.subjectElectroencephalography data-
dc.subject.ddc670-
dc.title시계열 데이터 분석을 위한 분산 표상 학습-
dc.title.alternativeInterval-wise Embedding for Time Series Data-
dc.typeThesis-
dc.description.degreeMaster-
dc.citation.pages29-
dc.contributor.affiliation공과대학 산업공학과-
dc.date.awarded2017-02-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share