Publications

Detailed Information

부정예시를 활용한 자연어 생성모델 개선 : Using Negative Examples for Enhancing Natural Language Generation

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

손선일

Advisor
장병탁
Issue Date
2020
Publisher
서울대학교 대학원
Keywords
자연어처리자연어생성언어 모델링화용론대체 디코딩 목적함수서사연관성 목적함수Natural Language ProcessingNatural Language GenerationLanguage ModelingPragmaticsAlternative Decoding ObjectiveNarrative Relevance Loss
Description
학위논문 (석사) -- 서울대학교 대학원 : 공과대학 컴퓨터공학부, 2020. 8. 장병탁.
Abstract
본 학위논문에서는 언어모델이 입력받는 문장과 생성하는 문장의 서사적 흐름(Narrative Flow)을 고려하는 서사연관성 목적함수를 제시한다. 제시하는 목적함수는 이어질 문장으로 부적절한 문장, 즉 부정예시와 긍정예시의 표상을 기준으로 생성문의 표상을 트리플렛 함수를 통해 비교함으로서 약한 지도학습을 통해 암묵적으로 맥락문장과 이어질 문장의 문장 요약 표상을 학습하도록 유도하며 여기에 코사인 거리를 활용한다.
ROC Story Cloze Test, SWAG, VIST 와 같은 상식-추론(Commonsense Natural Language Inference) 데이터셋을 대상으로 학습하였을 때 제시하는 서사연관성 목적함수를 적용한 언어모델은 통상적인 방법으로 미세조정한 경우보다 의미상으로 더 좋은 문장을 생성하였으며 이는 합성한 부정 예시를 활용한 경우에도 효과가 있었다. 이는 사람평가와 정성적 평가를 통해 검증하였다. 언어모델에 입력과 출력간의 연관성을 암시적으로 모델링한 본 미세조정 방법은 자연어 분류문제에 풍부한 부정 예시를 활용하여 생성작업의 품질을 개선하였고 문장 요약 표상을 얻어낼 수 있는 다수의 뉴럴 언어모델에 ad-hoc 파이프라인으로 활용이 가능하다.
In this thesis, we propose Narrative Relevance objective(NR) which implicitly models the narrative flow lies within a context and the positive sentence pair. The proposed objective utilizes the negative continuation example together with positive examples to constrain the learned representation space of the generated sentences with the help of NR loss.
Language model fine-tuned on Commonsense Natural Language Inference domain tasks such as VIST, ROC Story, and SWAG results in improved sentence quality from the perspective of Gricean Maxim of Relation. The effectiveness of the method is verified with a human evaluation with the support of n-gram scores and qualitative analysis. This method would be useful for fine-tuning language models on domains where negative examples are abundant such as NLU tasks.
Language
kor
URI
https://hdl.handle.net/10371/169350

http://dcollection.snu.ac.kr/common/orgView/000000161897
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share