Browse

시간 정보와 인기도 샘플링을 이용한 세션 기반 추천 모델

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors
이희원
Advisor
심규석
Major
공과대학 전기·정보공학부
Issue Date
2019-02
Publisher
서울대학교 대학원
Description
학위논문 (석사)-- 서울대학교 대학원 : 공과대학 전기·정보공학부, 2019. 2. 심규석.
Abstract
세션 기반 추천모델은 작은 규모의 인터넷 쇼핑 사이트에서 옷을 추천하거나 뉴스 사이트에서 관심 뉴스를, 동영상 제공 사이트에서 영상을 추천하는 경우에 주로 사용된다. 즉, 세션 기반 추천 모델은 처음 접속해보는 사이트 혹은 로그인을 하지 않아 과거 접속 정보가 없는 경우에 추천을 하는 모델이다. 익명의 사용자와 상품 간의 상호작용에 대한 현재의 짧은 세션 정보만을 바탕으로 추천을 하기 때문에 상품 간의 유사도를 바탕으로 추천하는 모델이 과거에는 많이 사용되었다. 하지만 이와 같은 상품 기반 유사도 추천 모델은 마지막에 선택한 상품만을 바탕으로 추천을 한다는 단점이 있었다. 이러한 문제를 해결하기 위해 최근에 순환 신경망 기반의 모델이 제안되었고 좋은 성능을 보여주고 있다. 그렇지만 순환 신경망을 기반으로 한 기존 연구도 상품을 선택한 순서만을 이용해 추천을 하기 때문에 시간 정보를 활용하지 못하는 단점이 있다.
본 논문에서는 순환 신경망 기반 모델에 월, 요일, 시간, 분, 초의 시간 정보를 추가로 반영하여, 계절, 요일 등의 변화에 따른 사용자의 선호도 변화를 반영한 모델을 제안한다. 그리고 로그 기반의 인기도 샘플링 방법과 모델을 학습시키는 손실 함수에 가중치 로직을 반영하여 모델의 성능을 높일 수 있는 방법을 제안한다. 또한 제안하는 모델의 성능을 검증하기 위해 실생활 데이터를 이용하여 실험을 진행하였다.
Session-based recommendation models are used to recommend items on various platforms, such as clothes on a small Internet shopping site, news on a news site, and videos on a video streaming site. Session-based recommendation models are useful when there is no past access information of an user. Such cases occur when an user first visits a site or does not log in. Traditional approaches utilize similarity-based models for recommendation since there is only the current short session information about the interaction between anonymous users and the products. However, such a similarity-based recommendation model has a drawback in that the recommendation is based on only the last selected product. To alleviate the problem, recurrent neural network based models have recently been proposed and show good performances. Still, the existing works based on recurrent neural networks cannot utilize time feature information because they consider only the order of item selections.
   In this paper, we propose a model that reflects users’ preference changes over time, such as the seasonal changes or day of the week, by additionally reflecting the time information in the granularities of month, day, hour, minute and second to the neural network based model. In addition, we propose methods to increase the performance of the model by introducing a new loss function and a log based popularity sampling method. Furthermore, we show the effectiveness of our proposed model by conducting experiments with real-life data.
Language
kor
URI
http://hdl.handle.net/10371/150772
Files in This Item:
Appears in Collections:
College of Engineering/Engineering Practice School (공과대학/대학원)Dept. of Electrical and Computer Engineering (전기·정보공학부)Theses (Master's Degree_전기·정보공학부)
  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse