Browse

텍스트 랭크 알고리즘을 이용한 사용자 타임라인 요약 기법 : A User Timeline Summarization Technique using TextRank Algorithm

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors
안인석
Advisor
김형주
Major
전기·컴퓨터공학부
Issue Date
2012-02
Publisher
서울대학교 대학원
Description
학위논문 (석사)-- 서울대학교 대학원 : 전기·컴퓨터공학부, 2012. 2. 김형주.
Abstract
디지털 기기가 광범위하게 보급되면서 Information Stream 이 정보 인지의 보편적인 수단으로 활용되고 있다. 웹 2.0 기술의 발달과 모바일 기기의 광범위한 보급으로 수 많은 컨텐츠들이 온라인 상에 쏟아져 나오고 있다. 따라서 Information Stream을 이용하여 정보를 소비하는 사용자들은 구독하는 정보원이 늘어남에 따라 구독하는 정보의 숫자가 기하급수적으로 늘어나게 될 것이다. 따라서 수 많은 데이터를 사람이 처리 할 수 있게 정리, 요약하는 기술이 필요하게 된다. 트위터는 2011년 3월 현재 1억 7천 5백만명의 사용자를 보유하고 있는 가장 유명한 마이크로블로깅 서비스이다. 다른 Information Stream과 마찬가지로 트위터 역시 다른 사용자의 정보를 구독 할 수 있으며, 정보의 과다 현상이 일어나고 있다. 본 논문에서는 이런 트위터의 정보 과다 현상을 해결하기 위해 TextRank 알고리즘이라는 자연어 처리 기법을 응용하는 기법에 대한 연구를 진행하였다. 타임라인을 이루고 있는 트윗들을 그래프로 모델링 하고, 모델링한 타임라인 그래프에 그래프 기반의 랭킹 알고리즘을 적용하여 스코어를 얻었다. 주제를 대표하는 키워드를 뽑기 위해 본 논문에서는 제안한 산봉우리 개념이 적용된 알고리즘을 제안하였다. 그리고 이런 알고리즘이 단순히 빈도수 기반으로 키워드를 뽑았을 때보다 정확도와 커버리지가 높고, 일관도 역시 크게 떨어지지 않는 것을 보여 성능이 더 좋음을 확인하였다.
digital device has come into wide use, Information Streams have recently emerged as a popular means of information awareness. Twitter is one of the most popular micro-blogging service and social media with a limit of 140 characters. As time has gone on Twitter user follows more accounts, eventually the user subscribes information more than the user can process. In this paper, we apply TextRank algorithm to resolving information overload in Twitter user timeline. After modeling user timeline as a graph, we apply graph-based rank algorithm to the timeline graph. Based on the score of each vertex, we apply concept of summit to summarizing user timeline. The experimental results show that proposed method summarizes user timeline more effectively than existing method that rely mainly on frequency based method.
Language
kor
URI
http://hdl.handle.net/10371/155582

http://dcollection.snu.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000000279
Files in This Item:
There are no files associated with this item.
Appears in Collections:
College of Engineering/Engineering Practice School (공과대학/대학원)Dept. of Computer Science and Engineering (컴퓨터공학부)Theses (Master's Degree_컴퓨터공학부)
  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse