Publications
Detailed Information
시계열 데이터 분석을 위한 분산 표상 학습 : Interval-wise Embedding for Time Series Data
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | 조성준 | - |
dc.contributor.author | 조현창 | - |
dc.date.accessioned | 2017-07-14T03:25:42Z | - |
dc.date.available | 2017-07-14T03:25:42Z | - |
dc.date.issued | 2017-02 | - |
dc.identifier.other | 000000141334 | - |
dc.identifier.uri | https://hdl.handle.net/10371/123618 | - |
dc.description | 학위논문 (석사)-- 서울대학교 대학원 : 산업공학과, 2017. 2. 조성준. | - |
dc.description.abstract | 본 연구에서는 distributed representation의 장점을 고려하여, 시계열 데이터를 neural network를 이용해 작은 distributed representation으로 표현하는 방법을제안한다. 이때 사용하는 neural network의 크기를 작게 만들기 위해 전체 시계열데이터를 작은 단위로 쪼갠 후, 각 부분을 하나의 데이터로 인식해 embedding공간상에 위치시킨다. 각 부분간의 시간적 연관관계를 이용해 neural network를학습시킨다. 이를 통해 전체 시계열 데이터에서는 중요하지만 시간상 작은 부분을차지하는 feature들이 무시되는 현상을 줄이며 동시에 전체 embedding space가데이터 간의 semantic한 관계를 보존하게 하는 효과를 얻을 수 있다.
방법론의 효과를 검증하기 위해 본 연구에서는 2개의 인공 데이터와 1개의실제 데이터를 사용하여 검증하였다. 먼저 sine 함수 모양의 인공데이터를 2가지energy based loss 함수에 적용하여 각각의 함수가 embedding space에 시계열데이터의 구간들을 투사하는지 시각화 하였다. 두 번째로 2개의 클래스로 전체시계열을 분리할 수 있는 데이터를 사용하여 encoding neural network의 구조와loss 함수가 실제 embedding의 성능에 어떤 영향을 주는지 정량적으로 살펴보았다. 사용한 loss 함수의 경우 성능에 큰 영향을 주지 못했다. 실험한 3가지 구조는각 2 layer fully connected neural network와 1층짜리 long short term memory network, 2층짜리 long short term memory network로, 그 중 2층 long short term memory 구조가 가장 성능이 좋은 것을 확인할 수 있었다. 마지막으로 실제 뇌전도실험 데이터를 위 방법론에 적용한 결과, 해당 실험에 대해 실제 알려져 있는 6가지phase 중 1개를 검출할 수 있었다. | - |
dc.description.tableofcontents | 제 1 장 서 론 1
제 2 장 관련 연구 4 제 1 절 Distributed representation 학습구조 및 방법 4 제 2 절 Encoder 6 제 3 절 Loss 함수 8 제 3 장 제안 기법 12 제 4 장 실험 및 결과 15 제 1 절 단변량 Sine 함수 15 제 2 절 다변량 무작위 Gaussian stream 19 제 3 절 물체 들어올리기 실험 간 뇌전도 데이터 20 제 5 장 결 론 24 참고문헌 26 Abstract 28 | - |
dc.format | application/pdf | - |
dc.format.extent | 8039007 bytes | - |
dc.format.medium | application/pdf | - |
dc.language.iso | ko | - |
dc.publisher | 서울대학교 대학원 | - |
dc.subject | 시계열 데이터 | - |
dc.subject | 차원 축소 | - |
dc.subject | 분산 표상 | - |
dc.subject | Manifold learning | - |
dc.subject | Recurrent neural network | - |
dc.subject | Long shot term memory network | - |
dc.subject | Electroencephalography data | - |
dc.subject.ddc | 670 | - |
dc.title | 시계열 데이터 분석을 위한 분산 표상 학습 | - |
dc.title.alternative | Interval-wise Embedding for Time Series Data | - |
dc.type | Thesis | - |
dc.description.degree | Master | - |
dc.citation.pages | 29 | - |
dc.contributor.affiliation | 공과대학 산업공학과 | - |
dc.date.awarded | 2017-02 | - |
- Appears in Collections:
- Files in This Item:
Item View & Download Count
Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.