Publications

Detailed Information

추가 정보를 고려한 상품 리뷰 요약 기법 : A Product Review Summarization Considering Additional Information

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

윤재연

Advisor
이상구
Issue Date
2019-08
Publisher
서울대학교 대학원
Keywords
문서 요약시퀀스-투-시퀀스 모델주목 메커니즘기억 신경망인공 신경망
Description
학위논문(석사)--서울대학교 대학원 :공과대학 컴퓨터공학부,2019. 8. 이상구.
Abstract
문서 요약이란 주어진 문서로부터 특정 사용자나 작업에 적합하게 축약한 형태의 문서를 생성하는 과제를 의미한다. 인터넷이 발달함에 텍스트를 포함한 여러 종류의 데이터들이 폭발적으로 증가하고 있고, 이러한 상황에서 문서 요약 기술이 지니는 가치는 점점 증대되고 있다. 또한 기계가 언어를 어떻게 이해하는지에 대한 연구의 한 갈래로써 중요한 가치를 지니고 있다.
과거에는 그래프 기반 방법론이나 통계 기반 방법론을 이용한 문서 요약 기법들이 일반적이었으나, 최신의 다양한 딥러닝 기반의 방법론을 이용한 문서 요약 모델들이 주로 연구되고 있다. 이러한 다양한 모델들이 사람이 직접 생성한 요약에 비견될 정도의 좋은 요약 성능들을 보이지만, 학습 데이터들의 양과 질에 따라 성능이 좌우된다는 문제점이 있다.
문서 요약의 대상이 되는 텍스트로는 일반적으로 뉴스 기사, 웹 사이트, 상품 리뷰 등이 있다. 대다수의 연구는 학습 데이터들의 양과 질 모두 좋은 뉴스 기사를 토대로 연구하나, 본 연구에서는 상대적으로 학습 데이터의 양과 질이 열악한 상품 리뷰에 대한 요약 기법을 다루고자 한다.
따라서 본 연구에서는 이러한 데이터의 양과 질의 열악함을 해결하기 위해, 주어진 상품 리뷰들에 대한 추가적인 정보를 더해서 더 좋은 품질의 요약을 제공하는 요약 모델을 제안한다. 본 논문에서 제안한 모델과 기준 모델이 생성한 요약 결과를 비교하고, 또 사용자 평가를 포함한 다양한 실험 결과, 본 연구에서 제안한 상품 리뷰 요약의 품질이 다른 모델보다 관련성과 가독성 모두 더 좋은 품질을 보였으며 추가적인 실험을 통해 추가 정보가 문서 요약에 어떤 영향을 주는 지에 대해 확인했다.
Automatic document summarization is a task of creating a document in a form that is suitable for a particular user or task from a given document. With the development of the Internet, various kinds of data including texts are explosively increasing, and in this situation, the value of document summarization is increasing. It also has important value as a way of studying how machines understand language.
I n a previous study, document summarization using graph-based model or statistical based model were common. However document summarization models using various deep-learning models are mainly studied. Although these various models show good summarization performance comparable to a human-generated summary, there is a problem that the performance depends on the quantity and quality of the training data.
Text to be summarized in the document generally includes news articles, websites, and product reviews. Most studies are based on news articles that are both good in terms of both quantity and quality of training data. In this study, we will focus on summary techniques for product reviews that have relatively poor quality and quantity of training data.
Therefore, in this study, we propose a document summarization model that provides a better quality summary by adding additional information about given product reviews to solve the problem of the quantity and quality of such data. In this paper, we compare the results of the proposed model with the summaries generated by baseline model, and the results of various experiments including human evaluation, the quality of the product review summary proposed in this study showed better quality of both relevance and readability than the other models, Experiments have shown how additional information can affect document summaries.
Language
kor
URI
https://hdl.handle.net/10371/161084

http://dcollection.snu.ac.kr/common/orgView/000000158328
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share