딥러닝 기반 텍스트 질의응답을 위한 지식 추출 데이터 증강 기법

조휘열

서울대학교 중앙도서관

S-Space 소개

My S-Space

로그인이 필요합니다.

S-Space

Publications

Detailed Information

딥러닝 기반 텍스트 질의응답을 위한 지식 추출 데이터 증강 기법 : Data Augmentation Technique with Knowledge Extraction for Text Question Answering by Deep Neural Networks

Cited 0 time in Web of Science Cited 0 time in Scopus

Export

Authors: 조휘열

Advisor: 장병탁

Major: 공과대학 컴퓨터공학부

Issue Date: 2017-08

Publisher: 서울대학교 대학원

Keywords: 데이터 증강 ; 딥러닝 ; 자연어 처리 ; 질의응답

Description: 학위논문 (석사)-- 서울대학교 대학원 공과대학 컴퓨터공학부, 2017. 8. 장병탁.

Abstract: 사람과 언어로 의사소통하는 기계를 만드는 것은 튜링테스트를 통한 인공지능 연구자들의 오랜 꿈이다. 그러나 언어의 수많은 예외와 불확실성으로 인해 전통적인 규칙 기반 방식으로는 모델링에 한계가 있었다. 최근 급격히 발전하고 있는 딥러닝 알고리즘을 이용하여 그 한계를 극복한 언어 모델링 연구가 이어지고 있다. 그 중 TextQA는 지문(context)과 질문(question)을 보고 답(answer)을 생성하는 연구로, 언어 모델이 얼마나 언어를 잘 이해하였는가를 테스트하기에 적합하다. 그러나 많은 연구들에도 불구하고 아직 사람의 수준에는 미치지 못하고 있다.
본 논문에서는 TextQA 모델의 성능 향상을 위한 Augmented TextQA를 제안한다. Augmented TextQA는 답을 이용하여 질문을 생성할 수 있는 모델을 만들고, 지문 속에서 추출한 키워드를 입력으로 질문 생성 모델을 통해 질문을 생성한다. 마지막으로, 새로 생성한 데이터를 추가하여 기존 TextQA 모델의 성능 향상을 시도한다. SQuAD(Stanford Question Answering Dataset)와 Seq2Seq 기반 TextQA 모델을 구현하여 실험한 결과, 전반적으로 Augmented TextQA를 사용했을 경우에 성능이 향상되는 것을 확인할 수 있었다. 나아가 Augmented TextQA를 활용하면 외부 자료를 사용하지 않고 도메인 상에서 데이터를 증강시키기 때문에 특정 도메인에서 단어의 표상을 더 적절히 학습할 수 있으며, 학습 데이터에만 국한되지 않은 확장된 TextQA가 가능해지는 효과를 기대할 수 있다.

Language: Korean

URI: https://hdl.handle.net/10371/137442

Files in This Item:

000000145855.pdf 1.62 MB

Appears in Collections:

College of Engineering/Engineering Practice School (공과대학/대학원)
- Dept. of Computer Science and Engineering (컴퓨터공학부)
  - Theses (Master's Degree_컴퓨터공학부)

Altmetrics

Item View & Download Count

Show Full Item Record

Find it @ SNU

트윗하기

SNS Share