Publications

Detailed Information

딥러닝을 이용한 음성합성 기술의 군사작전분야 적용 : Application of speech synthesis technology using deep learning to military operations

DC Field Value Language
dc.contributor.advisor장원철-
dc.contributor.author권용찬-
dc.date.accessioned2021-11-30T04:55:54Z-
dc.date.available2021-11-30T04:55:54Z-
dc.date.issued2021-02-
dc.identifier.other000000165429-
dc.identifier.urihttps://hdl.handle.net/10371/176111-
dc.identifier.urihttps://dcollection.snu.ac.kr/common/orgView/000000165429ko_KR
dc.description학위논문 (석사) -- 서울대학교 대학원 : 자연과학대학 통계학과, 2021. 2. 장원철.-
dc.description.abstract본 논문은 딥러닝을 이용한 음성 합성 기술의 군사작전 적용의 가능성을 탐
색하기 위해 음성합성 모형을 이용한 북한말 합성에 관해 연구한다. Tacotron2
를 음성합성 모형로 사용하여 멜 스펙트로그램(Mel-spectrogram)을 생성하였으
며 vocoder로 griffin-Lim 알고리즘과 WaveNet을 사용하여 멜 스펙트로그램을
오디오로 변환한다.두 알고리즘의 비교를 위해 주어진 문장 50개를 각각의 알고
리즘을 이용해 100개의 음성을 만든 후 19명의 성인남녀에게 들려주어 개인별
점수를 임의효과모형(random effect model)을 이용하여 분석하였다. GriffinLim 알고리즘으로 생성한 음성이 우위를 보였으며 추가적인 양질의 데이터를
얻고 조절모수를 최적화하면 실질적으로 군사작전에 적용 할 수 있는 수준으로
개발할 수 있을 것이다
-
dc.description.abstractIn this paper, we study North Korean speech synthesis using a speech synthesis model to explore the possibility of applying speech synthesis technology
using deep learning to military operations. Mel-spectrogram was created using
Tacotron2 as a speech synthesis model, and Mel-spectrogram was converted
to audio using Griffin-Lim algorithm and WaveNet with vocoder. For comparison of the two algorithms, 50 given sentences were converted using each
algorithm. After making 100 voices, they were played to 19 adult men and
women, and individual scores were analyzed using a random effect model. The
voice generated by the Griffin-Lim algorithm showed the superiority, and by
obtaining additional high-quality data and optimizing the adjustment parameters, it could be developed to a level that can be practically applied to military operations.
-
dc.description.tableofcontents제1장 서론 1
제2장 분석방법 5
제1절 데이터 설명 6
1.1 데이터 전처리 6
1.2 멜 스펙트로그램 7
제2절 Tacotron2 모형 8
2.1 인코더(Encoder) 8
2.2 Attention 9
2.3 디코더(Decoder) 10
제3절 Vocoder 11
3.1 WaveNet 11
3.2 Griffin-Lim 알고리즘 14
제4절 두 알고리즘의 비교 16
4.1 실험설계 16
4.2 분석방법론 : 임의효과모형 17
제3장 분석결과 19
제1절 데이터의 불완전성 20
제2절 발전방향 22
제4장 결론 24
Abstract in English 27
부록 A 분석 R코드 28
-
dc.format.extentiii, 35-
dc.language.isokor-
dc.publisher서울대학교 대학원-
dc.subjectTacotron2-
dc.subject주관적 음질 평가(MOS)-
dc.subjectGriffin-Lim-
dc.subjectWaveNet-
dc.subject음 성합성-
dc.subjectMOS(Mean opinion score)-
dc.subjectTTS(Text-to-speech)-
dc.subject.ddc519.5-
dc.title딥러닝을 이용한 음성합성 기술의 군사작전분야 적용-
dc.title.alternativeApplication of speech synthesis technology using deep learning to military operations-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthorKwon YongChan-
dc.contributor.department자연과학대학 통계학과-
dc.description.degreeMaster-
dc.date.awarded2021-02-
dc.identifier.uciI804:11032-000000165429-
dc.identifier.holdings000000000044▲000000000050▲000000165429▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share