시계열 데이터 분석을 위한 분산 표상 학습

조현창

서울대학교 중앙도서관

S-Space 소개

My S-Space

로그인이 필요합니다.

S-Space

Publications

Detailed Information

시계열 데이터 분석을 위한 분산 표상 학습 : Interval-wise Embedding for Time Series Data

DC Field	Value	Language
dc.contributor.advisor	조성준	-
dc.contributor.author	조현창	-
dc.date.accessioned	2017-07-14T03:25:42Z	-
dc.date.available	2017-07-14T03:25:42Z	-
dc.date.issued	2017-02	-
dc.identifier.other	000000141334	-
dc.identifier.uri	https://hdl.handle.net/10371/123618	-
dc.description	학위논문 (석사)-- 서울대학교 대학원 : 산업공학과, 2017. 2. 조성준.	-
dc.description.abstract	본 연구에서는 distributed representation의 장점을 고려하여, 시계열 데이터를 neural network를 이용해 작은 distributed representation으로 표현하는 방법을제안한다. 이때 사용하는 neural network의 크기를 작게 만들기 위해 전체 시계열데이터를 작은 단위로 쪼갠 후, 각 부분을 하나의 데이터로 인식해 embedding공간상에 위치시킨다. 각 부분간의 시간적 연관관계를 이용해 neural network를학습시킨다. 이를 통해 전체 시계열 데이터에서는 중요하지만 시간상 작은 부분을차지하는 feature들이 무시되는 현상을 줄이며 동시에 전체 embedding space가데이터 간의 semantic한 관계를 보존하게 하는 효과를 얻을 수 있다. 방법론의 효과를 검증하기 위해 본 연구에서는 2개의 인공 데이터와 1개의실제 데이터를 사용하여 검증하였다. 먼저 sine 함수 모양의 인공데이터를 2가지energy based loss 함수에 적용하여 각각의 함수가 embedding space에 시계열데이터의 구간들을 투사하는지 시각화 하였다. 두 번째로 2개의 클래스로 전체시계열을 분리할 수 있는 데이터를 사용하여 encoding neural network의 구조와loss 함수가 실제 embedding의 성능에 어떤 영향을 주는지 정량적으로 살펴보았다. 사용한 loss 함수의 경우 성능에 큰 영향을 주지 못했다. 실험한 3가지 구조는각 2 layer fully connected neural network와 1층짜리 long short term memory network, 2층짜리 long short term memory network로, 그 중 2층 long short term memory 구조가 가장 성능이 좋은 것을 확인할 수 있었다. 마지막으로 실제 뇌전도실험 데이터를 위 방법론에 적용한 결과, 해당 실험에 대해 실제 알려져 있는 6가지phase 중 1개를 검출할 수 있었다.	-
dc.description.tableofcontents	제 1 장 서 론 1 제 2 장 관련 연구 4 제 1 절 Distributed representation 학습구조 및 방법 4 제 2 절 Encoder 6 제 3 절 Loss 함수 8 제 3 장 제안 기법 12 제 4 장 실험 및 결과 15 제 1 절 단변량 Sine 함수 15 제 2 절 다변량 무작위 Gaussian stream 19 제 3 절 물체 들어올리기 실험 간 뇌전도 데이터 20 제 5 장 결 론 24 참고문헌 26 Abstract 28	-
dc.format	application/pdf	-
dc.format.extent	8039007 bytes	-
dc.format.medium	application/pdf	-
dc.language.iso	ko	-
dc.publisher	서울대학교 대학원	-
dc.subject	시계열 데이터	-
dc.subject	차원 축소	-
dc.subject	분산 표상	-
dc.subject	Manifold learning	-
dc.subject	Recurrent neural network	-
dc.subject	Long shot term memory network	-
dc.subject	Electroencephalography data	-
dc.subject.ddc	670	-
dc.title	시계열 데이터 분석을 위한 분산 표상 학습	-
dc.title.alternative	Interval-wise Embedding for Time Series Data	-
dc.type	Thesis	-
dc.description.degree	Master	-
dc.citation.pages	29	-
dc.contributor.affiliation	공과대학 산업공학과	-
dc.date.awarded	2017-02	-

Appears in Collections:

College of Engineering/Engineering Practice School (공과대학/대학원)
- Dept. of Industrial Engineering (산업공학과)
  - Theses (Master's Degree_산업공학과)

Files in This Item:

000000141334.pdf 7.67 MB

Altmetrics

Item View & Download Count

Show Simple Item Record

Find it @ SNU

트윗하기

SNS Share