SHERP

기계 학습 기반의 연령 분류
Age Classification based on Machine Learning

Cited 0 time in webofscience Cited 0 time in scopus
Authors
이주영
Advisor
정민화
Major
인문대학 언어학과
Issue Date
2018
Publisher
서울대학교 대학원
Description
학위논문 (석사)-- 서울대학교 대학원 : 인문대학 언어학과, 2018. 8. 정민화.
Abstract
본 연구는 대검찰청에서 수집한 한국인 대규모 음성 코퍼스를 사용하여 기계 학습 모델을 통해 연령을 분류하는 것을 목적으로 한다. 학습 모델은 20대, 30~40대, 50대 이상으로 3분류를 한다.

실험을 위해 묵음(silence)을 기준으로 음성 코퍼스를 378,684개의 데이터로 분절하였으며, 발화 유형과 성별로 데이터를 구분하였다. 음성으로부터 Mel Frequency Cepstral Coefficients(MFCCs), fundamental frequency(F0), i-vector, jitter, shimmer, 발화속도를 추출하여 기계 학습 모델인 Long Short Term Memory(LSTM) 모델을 통해 연령을 분류하였다. 또한, feature selection 알고리즘을 통해 각 음성 특징의 영향을 확인하여 특징마다 가중치를 달리한 실험도 진행하였다.

실험에서는 음성 특징별 성능과 음성 특징의 조합의 성능으로 나누어 험하였다. 그 결과, 개별 음성 특징의 경우 MFCC로 학습하였을 때 76.01%로 가장 높았으며, 음성 특징의 조합의 경우 모든 음성 특징을 학습하였을 때 80.01%로 가장 높았다. 또한, Recursive Feature Elimination (RFE)나 Extra Tree Classifier (ETC)와 같은 feature selection 알고리즘을 적용하였을 때는 80.87%로 본 연구에서 가장 높은 성능을 보였다.
Language
Korean
URI
http://hdl.handle.net/10371/144356
Files in This Item:
Appears in Collections:
College of Humanities (인문대학)Linguistics (언어학과)Theses (Master's Degree_언어학과)
  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse