Publications

Detailed Information

키워드 추출을 이용한 대화 생성 요약 성능 향상 : Improvement of Dialogue Summarization Using Keyword Extractor

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

유총재

Advisor
정교민
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
대화 요약생성 요약키워드 추출
Description
학위논문(석사) -- 서울대학교대학원 : 공학전문대학원 응용공학과, 2023. 2. 정교민.
Abstract
대화 생성 요약은 여러 화자가 말하는 대화에서 중요한 내용을 포함하는 요약문을 생성하는 것을 목표로 한다. 대화 생성 요약에서는 한번 언급된 단어에 대해서 대명사로 칭하거나, 특별히 지칭하지 않고 계속 해당 주제에 대해서 얘기하는 구어체적 특성으로 인하여 대화의 주제를 포착하기 어렵거나, 요약문을 생성하여도 핵심적인 정보를 담지 못하는 경우가 많다. 문서 요약 알고리즘은 대화 요약에서도 요약문을 생성할 수 있지만 대화의 특성을 살린 요약을 만드는 경우는 많지 않은 것이 실정이다.
따라서 본 연구에서는 키워드를 효율적으로 사용하여 의미적으로는 요약이 맞으나 실제 중요한 정보는 누락되는 문제를 개선하기 위하여 기존 알고리즘에 키워드를 추가하여 요약본만으로 대화의 주제를 쉽게 포착하는 모델을 제안한다. 이 모델은 사전 훈련된 키워드 추출기를 사용하여 대화의 키워드를 추출한다. 본 연구는 키워드를 이용하여 대화 생성 요약의 성능을 향상시킬 수 있는 시스템을 제안한다.
연구한 결과, 3개의 벤치마크 데이터셋에 대해서 수행된 다양한 실험들은 제안된 방법이 기존 대화 생성 요약 모델보다 성능이 우수함을 보여준다. 또한 제안된 모델은 훈련 데이터셋이 부족한 상황에서 성능을 더 향상시킬 수 있다. 또다른 중요한 특징 중 하나는 기존의 대화 생성 요약 모델의 변경 없이, 입력 데이터만을 수정하여 성능을 향상 시킬 수 있다.
Abstractive dialogue summarization aims to generate a short passage that contains important content for a particular dialogue spoken by multiple speakers. In abstractive dialogue summarization systems, capturing the subject in the dialogue is challenging owing to the properties of colloquial texts. Moreover, the system often generates uninformative summaries. In this paper, we propose a novel keyword-aware dialogue summarization system (KADS) that easily captures the subject in the dialogue to alleviate the problem mentioned above through the efficient usage of keywords. Specifically, we first extract the keywords from the input dialogue using a pre-trained keyword extractor. Subsequently, KADS efficiently leverages the keywords information of the dialogue to the transformer-based dialogue system by using the pre-trained keyword extractor. Extensive experiments performed on three benchmark datasets show that the proposed method outperforms the baseline system. Additionally, we demonstrate that the proposed keyword-aware dialogue summarization system exhibits a high-performance gain in low-resource conditions where the number of training examples is highly limited.
Language
kor
URI
https://hdl.handle.net/10371/193494

https://dcollection.snu.ac.kr/common/orgView/000000174061
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share