Publications
Detailed Information
기계 학습 기반의 연령 분류 : Age Classification based on Machine Learning
Cited 0 time in
Web of Science
Cited 0 time in Scopus
- Authors
- Advisor
- 정민화
- Major
- 인문대학 언어학과
- Issue Date
- 2018-08
- Publisher
- 서울대학교 대학원
- Description
- 학위논문 (석사)-- 서울대학교 대학원 : 인문대학 언어학과, 2018. 8. 정민화.
- Abstract
- 본 연구는 대검찰청에서 수집한 한국인 대규모 음성 코퍼스를 사용하여 기계 학습 모델을 통해 연령을 분류하는 것을 목적으로 한다. 학습 모델은 20대, 30~40대, 50대 이상으로 3분류를 한다.
실험을 위해 묵음(silence)을 기준으로 음성 코퍼스를 378,684개의 데이터로 분절하였으며, 발화 유형과 성별로 데이터를 구분하였다. 음성으로부터 Mel Frequency Cepstral Coefficients(MFCCs), fundamental frequency(F0), i-vector, jitter, shimmer, 발화속도를 추출하여 기계 학습 모델인 Long Short Term Memory(LSTM) 모델을 통해 연령을 분류하였다. 또한, feature selection 알고리즘을 통해 각 음성 특징의 영향을 확인하여 특징마다 가중치를 달리한 실험도 진행하였다.
실험에서는 음성 특징별 성능과 음성 특징의 조합의 성능으로 나누어 험하였다. 그 결과, 개별 음성 특징의 경우 MFCC로 학습하였을 때 76.01%로 가장 높았으며, 음성 특징의 조합의 경우 모든 음성 특징을 학습하였을 때 80.01%로 가장 높았다. 또한, Recursive Feature Elimination (RFE)나 Extra Tree Classifier (ETC)와 같은 feature selection 알고리즘을 적용하였을 때는 80.87%로 본 연구에서 가장 높은 성능을 보였다.
- Language
- Korean
- Files in This Item:
- Appears in Collections:
Item View & Download Count
Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.