Browse

리뷰 텍스트를 활용한 토픽별 키워드 기반 시맨틱 POI 검색 : Topical Keywords based Semantic POI Retrieval using Review Texts

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors
이영민
Advisor
유기윤
Issue Date
2021-02
Publisher
서울대학교 대학원
Keywords
시맨틱 POIPOI 검색POI 임베딩사용자 맞춤형 검색Word2vecLDAsemantic POIPOI retrievalPOI embeddingcustomized retrieval
Description
학위논문 (박사) -- 서울대학교 대학원 : 공과대학 건설환경공학부, 2021. 2. 유기윤.
Abstract
위치 기반 서비스 및 웹 지도 서비스에서 특정 장소나 위치에 대한 검색은 일상생활에서 매우 유용한 기능으로, 사용자들이 가장 많이 활용하는 서비스 중 하나이다. 장소 및 위치 검색 서비스는 최근 빅데이터 및 인공지능 기술의 발달과 함께 맞춤형 서비스로 진화 중이며, 관심지점(point of interest, 이하 POI) 데이터는 이러한 서비스 제공을 위한 핵심 요소라고 할 수 있다. 그러나 기존 국내외 POI 검색 서비스들은 주로 POI 명칭, 카테고리, 태그 위주의 검색을 제공하고 있으며, 리뷰 검색 기능을 일부 지원하고 있으나 POI의 시맨틱(semantic) 정보를 활용하지 않아 POI 검색 시 사용자들의 다양한 상황과 선호를 반영하기 어려운 한계가 있다.
본 연구는 사용자들의 다양한 요구조건을 반영할 수 있는 토픽별 키워드 기반 시맨틱 POI 검색 기술을 개발하는 것을 목표로 한다. 이를 위해 사용자들이 POI에 대해 작성한 비정형의 리뷰 텍스트 데이터를 활용해 시맨틱 POI를 생성하는 프로세스를 제안하고, 시맨틱 POI를 검색에 활용할 수 있는 세 종류의 활용 구조를 설계하였다. 이를 위한 과정으로써 먼저, 데이터 수집 및 전처리 방법을 제시하고, 리뷰 텍스트로부터 토픽과 토픽별 키워드 추출을 위한 잠재 디리클레 할당(latent Dirichlet allocation, LDA) 기반 토픽 모델링(topic modeling) 방법을 제안하였다. 그리고 Word2vec 모델을 기반으로 토픽별 키워드를 임베딩(embedding)함으로써 최종적으로 POI를 임베딩하는 방법을 제안하였다. 이를 통해 토픽에 따라 다양하게 사용되는 키워드의 특성을 반영한 시맨틱 POI를 확정하였다. 또한, 시맨틱 POI 검색에 대한 활용 구조로써 자연어 기반 검색어에 대한 결과를 제공하는 자연어 기반 POI 검색, 토픽과 토픽별 키워드를 선택해 POI를 검색하는 선택 기반 POI 검색, 그리고 특정 POI와 유사한 POI를 탐색할 수 있는 유사 POI 검색을 제안하였다. 시맨틱 POI 검색에의 활용 결과에 대한 품질을 확인하기 위하여 서울시에 거주하는 남녀 400명을 대상으로 설문 조사를 시행하였다. 그 결과 만족도 평균이 5점 만점에 3.48점으로 산출되었으며, 이는 본 연구에서 제시한 평가 기준에 따라 만족의 범위에 속하는 것으로 판단할 수 있다. 또한, 사용자 만족도를 만족 정도에 따라 구분하여 분석한 결과, 모든 문항에서 ‘만족’을 선택한 응답 비율이 가장 높았으며, ‘매우 만족’ 및 ‘만족’을 선택한 비율이 ‘매우 불만족’ 및 ‘불만족’을 선택한 비율보다 평균 약 4.1배 더 많은 것으로 산출되었다. 이에 따라 본 연구에서 개발한 시맨틱 POI 검색 기술의 품질을 확인할 수 있었다. 마지막으로, 본 연구에서 도출한 시맨틱 POI 검색 결과와 기존 POI 검색 서비스들과의 검색 결과 비교 분석을 통해 본 연구의 차별성을 확인하였다. 즉, 본 연구에서 개발한 시맨틱 POI 검색 기술을 활용하면 사용자가 검색어에 대한 가중치를 직접 지정할 수 있기에 같은 검색어라도 가중치에 따라 다른 결과가 출력됨으로써 사용자 맞춤형 검색이 가능하다. 또한, 검색어와 정확히 일치하는 키워드가 없어도 동의어 및 유의어를 기반으로 한 결과가 도출되며, 같은 키워드라도 토픽에 따라 다르게 사용되는 키워드의 다양한 의미를 검색에 활용할 수 있다. 따라서 본 연구에서 개발한 시맨틱 POI 검색 기술을 통해 사용자들의 다양한 선호와 상황을 반영한 검색이 가능하며, 이는 기존의 POI 검색 시스템과 상호 보완적으로 활용할 수 있다.
Retrieving a specific place or location in location based and web map services is beneficial in everyday life and is one of the most accessed services by users. These services evolve into customized services with the recent development of big data and artificial intelligence technologies and point of interest(POI) data are crucial for providing these retrieval services. The existing domestic and overseas POI retrieval services mainly provide a retrieval function focusing on POI name, category, tag and some support a review retrieval function. However since the semantic information of the POI is not used, it is not easy to reflect users' various situations and preferences when retrieving for a POI.
This study aims to develop a semantic POI retrieval technology based on keywords by topics that reflect users' various requirements. To this end we proposed a process of generating semantic POIs using unstructured review text data written by users about POIs and designed three types of structures that can utilize semantic POIs for retrieval. First, we present a data collection and pre-processing method and then propose a topic modeling method based on latent Dirichlet allocation(LDA) for extracting topics and keywords for each topic from the review text. We finally propose a method of embedding POI by embedding keywords for each topic based on the Word2vec model. This process makes it possible to determine a semantic POI that reflects the characteristics of various keywords used based on the topic. In addition we propose a utilization structure for natural language based POI retrieval of natural language based terms for selection based POI retrieval by selecting topics and keywords for each topic to retrieve POI, and for similar POI retrieval that can retrieve POIs similar to a specific POI.
We surveyed 400 men and women residing in Seoul to verify the semantic POI retrieval results. The average satisfaction was calculated as 3.48 out of 5, which was within the range of satisfaction based on the study's evaluation criteria. In terms of user satisfaction, 'satisfied' was the most frequent response. On average, 'very satisfied' and 'satisfied' were selected about 4.1 times more than 'very unsatisfied' and 'unsatisfied', confirming the practicality of the semantic POI retrieval technology developed in this study. Lastly, a comparison of the semantic POI retrieval results of this study and those of existing POI retrieval services confirmed this study's differences. Specifically, with the semantic POI retrieval technology developed in this study, a user can directly designate a weight for a retrieval word. Any retrieval word can be customized by displaying different results according to the weight. In addition, results based on synonyms can be derived, even when no keyword exactly matches the retrieval word. Even various meanings of keywords that differ depending on the topic can be used for retrieval. Therefore, through the semantic POI retrieval technology developed in this study, users' various preferences and situations can complement the existing retrieval system.
Language
kor
URI
https://hdl.handle.net/10371/175101

https://dcollection.snu.ac.kr/common/orgView/000000165019
Files in This Item:
Appears in Collections:
College of Engineering/Engineering Practice School (공과대학/대학원)Dept. of Civil & Environmental Engineering (건설환경공학부)Theses (Ph.D. / Sc.D._건설환경공학부)
  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse