Publications

Detailed Information

Neural networks for compressing and classifying speaker-independent paralinguistic signals : 준언어적 신호 압축 및 분류를 위한 심층 신경망

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

변석현

Advisor
정교민
Major
공과대학 전기·정보공학부
Issue Date
2019-02
Publisher
서울대학교 대학원
Description
학위논문 (석사)-- 서울대학교 대학원 : 공과대학 전기·정보공학부, 2019. 2. 정교민.
Abstract
Recognizing and classifying paralinguistic signals, with its various applications, is an important problem. In general, this task is considered challenging because the sound information from the signals is difficult to distinguish even by humans. Thus, analyzing signals with machine learning techniques is a reasonable approach to understanding signals. Audio features extracted from paralinguistic signals usually consist of highdimensional vectors such as prosody, energy, cepstrum, and other speech-related information. Therefore, when the size of a training corpus is not sufficiently large, it is extremely difficult to apply machine learning methods to analyze these signals due to their high feature dimensions. This paper addresses these limitations by using neural networks' feature learning abilities. First, we use a neural network-based autoencoder to compress the signal to eliminate redundancy within the signal feature, and we show than the compressed signal features are competitive in distinguishing the signal compared to the original methods such as logistic regression, support vector machine, decision trees, and boosted trees.
준언어적 신호를 분류를 인식하고 분류하는 일은 그의 다양한 응용성 측면에서 매우 중요한 문제이다. 일반적으로 이 문제가 어려운 이유는 소리 정보가 인간에게도 구별되기 힘들다는 애매모호한 특성 때문이다. 이에 신호를 더 잘 이해하기 위해 기계학습 기법이 고안되는데, 이 때 분석에 사용되는 신호 특징 벡터는 운율, 에너지, 주파수 등 신호에 관련된 정보로 이루어진 고차원 벡터이다. 즉 훈련에 사용되는 데이터의 크기가 작은 경우에는, 특징 벡터의 높은 차원 때문에 적절히 기계학습 모델을 잘 훈련시키기가 어렵게 된다. 이 논문에서는 심층 신경망 모델을 이용하여 이와 같은 문제를 해결하고자 한다. 우선 다양한 압축 기법을 이용하여 특징 벡터 내의 불필요한 정보를 제거하고, 이 압축된 특징들이 전통적 기계학습 분류방법들보다 심층 신경망에 의해 더 잘 분류됨을 실험적으로 보인다.
Language
eng
URI
https://hdl.handle.net/10371/150757
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share