Publications

Detailed Information

딥러닝 기반 텍스트 질의응답을 위한 지식 추출 데이터 증강 기법 : Data Augmentation Technique with Knowledge Extraction for Text Question Answering by Deep Neural Networks

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

조휘열

Advisor
장병탁
Major
공과대학 컴퓨터공학부
Issue Date
2017-08
Publisher
서울대학교 대학원
Keywords
데이터 증강딥러닝자연어 처리질의응답
Description
학위논문 (석사)-- 서울대학교 대학원 공과대학 컴퓨터공학부, 2017. 8. 장병탁.
Abstract
사람과 언어로 의사소통하는 기계를 만드는 것은 튜링테스트를 통한 인공지능 연구자들의 오랜 꿈이다. 그러나 언어의 수많은 예외와 불확실성으로 인해 전통적인 규칙 기반 방식으로는 모델링에 한계가 있었다. 최근 급격히 발전하고 있는 딥러닝 알고리즘을 이용하여 그 한계를 극복한 언어 모델링 연구가 이어지고 있다. 그 중 TextQA는 지문(context)과 질문(question)을 보고 답(answer)을 생성하는 연구로, 언어 모델이 얼마나 언어를 잘 이해하였는가를 테스트하기에 적합하다. 그러나 많은 연구들에도 불구하고 아직 사람의 수준에는 미치지 못하고 있다.
본 논문에서는 TextQA 모델의 성능 향상을 위한 Augmented TextQA를 제안한다. Augmented TextQA는 답을 이용하여 질문을 생성할 수 있는 모델을 만들고, 지문 속에서 추출한 키워드를 입력으로 질문 생성 모델을 통해 질문을 생성한다. 마지막으로, 새로 생성한 데이터를 추가하여 기존 TextQA 모델의 성능 향상을 시도한다. SQuAD(Stanford Question Answering Dataset)와 Seq2Seq 기반 TextQA 모델을 구현하여 실험한 결과, 전반적으로 Augmented TextQA를 사용했을 경우에 성능이 향상되는 것을 확인할 수 있었다. 나아가 Augmented TextQA를 활용하면 외부 자료를 사용하지 않고 도메인 상에서 데이터를 증강시키기 때문에 특정 도메인에서 단어의 표상을 더 적절히 학습할 수 있으며, 학습 데이터에만 국한되지 않은 확장된 TextQA가 가능해지는 효과를 기대할 수 있다.
Language
Korean
URI
https://hdl.handle.net/10371/137442
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share