Publications
Detailed Information
딥러닝을 이용한 음성합성 기술의 군사작전분야 적용 : Application of speech synthesis technology using deep learning to military operations
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | 장원철 | - |
dc.contributor.author | 권용찬 | - |
dc.date.accessioned | 2021-11-30T04:55:54Z | - |
dc.date.available | 2021-11-30T04:55:54Z | - |
dc.date.issued | 2021-02 | - |
dc.identifier.other | 000000165429 | - |
dc.identifier.uri | https://hdl.handle.net/10371/176111 | - |
dc.identifier.uri | https://dcollection.snu.ac.kr/common/orgView/000000165429 | ko_KR |
dc.description | 학위논문 (석사) -- 서울대학교 대학원 : 자연과학대학 통계학과, 2021. 2. 장원철. | - |
dc.description.abstract | 본 논문은 딥러닝을 이용한 음성 합성 기술의 군사작전 적용의 가능성을 탐
색하기 위해 음성합성 모형을 이용한 북한말 합성에 관해 연구한다. Tacotron2 를 음성합성 모형로 사용하여 멜 스펙트로그램(Mel-spectrogram)을 생성하였으 며 vocoder로 griffin-Lim 알고리즘과 WaveNet을 사용하여 멜 스펙트로그램을 오디오로 변환한다.두 알고리즘의 비교를 위해 주어진 문장 50개를 각각의 알고 리즘을 이용해 100개의 음성을 만든 후 19명의 성인남녀에게 들려주어 개인별 점수를 임의효과모형(random effect model)을 이용하여 분석하였다. GriffinLim 알고리즘으로 생성한 음성이 우위를 보였으며 추가적인 양질의 데이터를 얻고 조절모수를 최적화하면 실질적으로 군사작전에 적용 할 수 있는 수준으로 개발할 수 있을 것이다 | - |
dc.description.abstract | In this paper, we study North Korean speech synthesis using a speech synthesis model to explore the possibility of applying speech synthesis technology
using deep learning to military operations. Mel-spectrogram was created using Tacotron2 as a speech synthesis model, and Mel-spectrogram was converted to audio using Griffin-Lim algorithm and WaveNet with vocoder. For comparison of the two algorithms, 50 given sentences were converted using each algorithm. After making 100 voices, they were played to 19 adult men and women, and individual scores were analyzed using a random effect model. The voice generated by the Griffin-Lim algorithm showed the superiority, and by obtaining additional high-quality data and optimizing the adjustment parameters, it could be developed to a level that can be practically applied to military operations. | - |
dc.description.tableofcontents | 제1장 서론 1
제2장 분석방법 5 제1절 데이터 설명 6 1.1 데이터 전처리 6 1.2 멜 스펙트로그램 7 제2절 Tacotron2 모형 8 2.1 인코더(Encoder) 8 2.2 Attention 9 2.3 디코더(Decoder) 10 제3절 Vocoder 11 3.1 WaveNet 11 3.2 Griffin-Lim 알고리즘 14 제4절 두 알고리즘의 비교 16 4.1 실험설계 16 4.2 분석방법론 : 임의효과모형 17 제3장 분석결과 19 제1절 데이터의 불완전성 20 제2절 발전방향 22 제4장 결론 24 Abstract in English 27 부록 A 분석 R코드 28 | - |
dc.format.extent | iii, 35 | - |
dc.language.iso | kor | - |
dc.publisher | 서울대학교 대학원 | - |
dc.subject | Tacotron2 | - |
dc.subject | 주관적 음질 평가(MOS) | - |
dc.subject | Griffin-Lim | - |
dc.subject | WaveNet | - |
dc.subject | 음 성합성 | - |
dc.subject | MOS(Mean opinion score) | - |
dc.subject | TTS(Text-to-speech) | - |
dc.subject.ddc | 519.5 | - |
dc.title | 딥러닝을 이용한 음성합성 기술의 군사작전분야 적용 | - |
dc.title.alternative | Application of speech synthesis technology using deep learning to military operations | - |
dc.type | Thesis | - |
dc.type | Dissertation | - |
dc.contributor.AlternativeAuthor | Kwon YongChan | - |
dc.contributor.department | 자연과학대학 통계학과 | - |
dc.description.degree | Master | - |
dc.date.awarded | 2021-02 | - |
dc.identifier.uci | I804:11032-000000165429 | - |
dc.identifier.holdings | 000000000044▲000000000050▲000000165429▲ | - |
- Appears in Collections:
- Files in This Item:
Item View & Download Count
Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.