Publications

Detailed Information

자연어로부터 SoPIoT 스크립트 언어로의 변환 기술 : Neural Machine Translation Technique from Natural Language to SoPIoT Script Language

DC Field Value Language
dc.contributor.advisor하순회-
dc.contributor.author최종우-
dc.date.accessioned2020-05-07T03:48:44Z-
dc.date.available2020-05-07T03:48:44Z-
dc.date.issued2020-
dc.identifier.other000000160359-
dc.identifier.urihttp://dcollection.snu.ac.kr/common/orgView/000000160359ko_KR
dc.description학위논문(석사)--서울대학교 대학원 :공과대학 컴퓨터공학부,2020. 2. 하순회.-
dc.description.abstract유비쿼터스(ubiquitous) 컴퓨팅은 IoT라는 이름으로 이제 일상의 일부분이 되었다. 하지만 컴퓨터 프로그래밍에 익숙하지 않은 사람들은 수많은 IoT Device들에 노출될 뿐, 주체적으로 IoT를 사용하지 못하는 경우가 많다. 이에 본 연구실에서는 Service Oriented Platform for the Internet of Thing라는 middleware를 중심으로 한 서비스 기반의 IoT제어 시스템과 해당 시스템의 운용을 보조하기 위한 script language를 제안한 적이 있다.
본 연구에서는 해당 script language를 일반인이 더욱 쉽게 사용할 수 있도록 voice to script 시스템을 구현하였으며 그를 위해 text to script 변환 기술을 구현하였다. 이 text to script 변환 기술은 Neural Machine Translation 를 기반으로 하여 Script Language를 목표로 하는 Controlled Natural Language Programming방법을 사용했으며, 인공신경망 학습에 필요한 샘플을 구현하기 위해서 따로 sample 제작 기법을 고안하였다.
본 연구에서는 해당 sample dataset을 Transformer기반 CNLPr 시스템의 학습에 사용하여 최대 99.99 BLEU score(200,000 sample 중 113개 에러)를 기록한 결과를 얻었다.
-
dc.description.abstractUbiquitous computing has changed into IoT: programmable devices are everywhere. However, large portion of people cannot use this plethora of devices willingly due to their lack of programming skill.
To increase peoples accessibility to IoT, our lab previously developed introduced a service oriented hierarchical IoT system based on middleware (namely, Service Oriented Platform for the Internet of Thing ) and script language for the system.
In this study, we tried to expend former work and made voice to script system for the script language, and developed text to script program as part of the voice to script system. The translation technique used controlled natural language programming and Transformer model. As there was no appropriate dataset for our work, we also proposed corpus dataset building technique, too.
As a result, our experiment with Transformer based controlled natural language programming system got 99.99 BLEU score(113 errors on 200,000 sample) on randomly generated sample test.
-
dc.description.tableofcontents1. 서 론 1
2. 관련 연구 3
2.1. Neural Machine Translation 연구 3
2.1.1 Sequence to Sequence 모델 3
2.1.2 Transformer 모델 4
2.1.3 NMT를 이용한 자연어 프로그래밍 5
2.2. 제한적 자연어 프로그래밍 모델 5
2.3. middleware 기반의 SoPIoT 모델 6
3. 양측 제한적 자연어 프로그래밍 8
3.1. CNLPr을 위한 NL의 제한 8
3.2. CNLPr을 위한 PL의 제한 10
3.3. syntax의 처리 11
4. Sample dataset 12
4.1. 기존의 dataset 12
4.2. CNLPr dataset의 제작 과정 13
4.2.1 PL Tokenization 13
4.2.2 NL Extend 14
4.3 function dataset 15
4.4 trigger dataset 15
4.5 완성된 NLPL sample set 16
5. 실험 모델 18
6. 학습 전략 19
7. 실험 설계 20
7.1. 학습 모델의 선택 20
7.2. sample dataset의 제작 20
8. 실 험 21
8.1 실험 환경 21
8.2 실험 설계 및 평가 기준 21
8.2.1. 결과물의 평가 21
8.2.2. 실험 시나리오 및 샘플 생성을 위한 단어장 21
8.3. 실험 결과 23
8.3.1. Epoch에 따른 BLEU 변화 23
8.3.2. Training Set의 변화에 따른 BLEU의 변화 24
8.3.3. Voice to Script 24
9. 결론 26
감사의 말 (Acknowledgement) 28
참고 문헌 30
-
dc.language.isokor-
dc.publisher서울대학교 대학원-
dc.subject.ddc621.39-
dc.title자연어로부터 SoPIoT 스크립트 언어로의 변환 기술-
dc.title.alternativeNeural Machine Translation Technique from Natural Language to SoPIoT Script Language-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.department공과대학 컴퓨터공학부-
dc.description.degreeMaster-
dc.date.awarded2020-02-
dc.identifier.uciI804:11032-000000160359-
dc.identifier.holdings000000000042▲000000000044▲000000160359▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share