Publications

Detailed Information

마르코프 체인 몬테 카를로 기반 파티클 필터를 이용한 제한된 형태의 볼츠만 머신 학습 : Training Restricted Boltzmann Machines using MCMC-based Particle filter

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

박민규

Advisor
최종호
Major
공과대학 전기·컴퓨터공학부
Issue Date
2013-02
Publisher
서울대학교 대학원
Description
학위논문 (석사)-- 서울대학교 대학원 : 전기·컴퓨터공학부, 2013. 2. 최종호.
Abstract
본 논문에서는 제한된 형태의 볼츠만 머신 (Restricted Boltzmann Machine
RBM) 을 효과적으로 학습 (training) 하는 알고리즘 (algorithm) 을 제안한다. 이 방식을 0 또는 1로 구성된 이진 데이터 (binary data) 와 잡음이 많은 실제적인 실수 자료 (real valued data) 에 대한 분류 (classification) 문제에 활용하여 그 실용성을 검증한다. 학습을 진행하기 위해서는 RBM에 의해 정의된 모델 (model) 입력 분포 (distribution) 의 기댓값을 계산해야 하는데, 변수 (variable) 의 공간 (space) 이 너무 커 적절한 샘플 (sample) 들을 구하는 것이 어렵고 시간이 많이 걸린다. 이런 문제의 해결 방법으로 Markov Chain Monte Carlo (MCMC) 를 활용해 모델 입력 분포를 대표하는 비교적 작은 수의 샘플을 얻어 기댓값을 추정하는 방식이 많이 사용되고 있다. 하지만 이 방식은 모델 입력 분포의 모든 영역 (range) 에서 샘플을 추출하지 못하고, 분포에 따르지 않는 샘플도 추출하는 경향이 있어 정확한 기댓값을 계산하지 못한다.
본 논문에서 제안한 학습 알고리즘은 모델 입력 분포에서 낮은 중요도 (importance) 를 갖는 샘플을 걸러내기 위해 파티클 필터 (Particle filter) 를 사용한다. 이는 Sampling importance resampling (SIR) 방식을 변형한 것으로 MCMC에서 추출된 샘플 중 모델 입력 분포에 적합한 샘플을 importance sampling하는 방식이다. 구체적으로는 학습이 진행되는 매 반복과정 (iteration) 마다 정규화 되지 않은 확률 (unnormalized probability) 을 통해 각 샘플의 중요도를 계산하고, 이를 이용해 누적 분포함수 (cumulative distribution function) 를 구성한다. 그리고 0과 1사이에서 균등하게 분포 (uniformly distributed) 된 숫자 중에서 추출된 값들을 누적 분포함수에 사상하여, 해당하는 샘플을 추출한다.
또한 Gibbs sampling의 특성 상 새롭게 추출된 샘플은 이전 샘플의 영향을 많이 받기에 샘플 형태의 변화가 작다. 따라서 이전 샘플이 있었던 영역에서 빠르게 벗어나지 못해, 어떤 영역에서는 샘플이 추출되지 않는 경향이 있다. 이를 극복하기 위해 MCMC에 병렬 템퍼링 (Parallel tempering
PT) 기법을 적용하여 서로 다른 온도를 MCMC에 적용해 Gibbs sampling을 수행한다. 온도가 낮은 MCMC에서 추출된 샘플은 이전 샘플에 근접한 영역에 머물게 하고, 온도가 높은 MCMC에서 추출된 샘플은 다른 영역을 넘나들게 한다. PT 기법을 통해 더 넓은 영역에서 샘플을 추출한 뒤, importance sampling을 수행함으로써 모델 입력 분포를 대표하는 샘플을 얻어 더 정확하게 학습을 진행하여 RBM의 목적함수 값을 보다 크게하며 분류 성능을 향상시킨다.
마지막으로 Sparse Deep Bilief Network (SDBN) 을 활용하여 잡음이 많은 실수 자료를 분류하는데 적합한 학습 방법을 제안한다. SDBN은 아래층의 출력에 1이 나타날 기댓값을 작은 상수로 제한하여, 위층을 학습할 때는 분류에 도움이 되는 특징 (feature) 만으로 학습을 진행하여 만들어진다. 중요한 특징만 활용함으로써, 위층의 RBM은 관련성이 높은 뉴런 사이의 가중치 (weight) 만 특정 값을 갖게 된다. 본 논문에서는 SDBN의 학습 방식을 활용하여 Gaussian-Bernoulli Restricted Boltzmann Machine (GBRBM) 에서 분류에 도움이 되는 특징을 출력할 수 있도록 학습한다. 이 출력값을 통해 Classification Restricted Boltzmann Machine (CRBM) 을 다양한 학습 알고리즘으로 학습하여 Deep Boltzmann Machine (DBM) 을 구성하고, 실수 데이터에 대한 분류 성능을 비교한다.
Language
Korean
URI
https://hdl.handle.net/10371/122911
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share