Publications

Detailed Information

캐주얼 게임 유저 이탈 예측

DC Field Value Language
dc.contributor.advisor이원종-
dc.contributor.author김승욱-
dc.date.accessioned2017-07-19T10:59:51Z-
dc.date.available2017-07-19T10:59:51Z-
dc.date.issued2016-08-
dc.identifier.other000000136274-
dc.identifier.urihttps://hdl.handle.net/10371/133262-
dc.description학위논문 (석사)-- 서울대학교 융합과학기술대학원 : 융합과학부(디지털정보융합전공), 2016. 8. Wonjong Rhee.-
dc.description.abstract최근 게임 시장의 규모가 커짐에 따라, 게임 시장 중 가장 큰 비중을 차지하고 있는 캐주얼 게임은 점차 각광 받는 산업 분야로 자리 잡고 있다. 이에 많은 게임이 시장에 출시되고 있으며, 모든 게임 업계에서는 수익을 극대화하기 위한 유저 획득에 대해서 신경을 쓰고 있다. 그러나 최근 들어 게임 산업계에서는 추가 유저의 획득에 한계가 있다는 것을 깨닮고, 신규 유저의 유입보다 기존 유저 유지(Retention)의 중요성을 점차 부각시키고 있다.
본 연구에서는 이러한 상황을 연구자가 직접 개발한 모바일 캐주얼 게임을 포함하여, 총 3개의 캐주얼 게임의 데이터를 통해서 살펴본다. 유저의 유입과 이탈의 흔적이 그대로 남아 있는 데이터를 통해서 유저 이탈에 대해서 정량적 연구를 수행하여 게임 산업에서 관심을 두고 있는 유저 유지 분야에 기여하고자 한다. 본 연구에서 하고자 하는 유저 이탈 예측 연구는 매출 상승에 직결될 뿐만 아니라 객관적인 데이터 기반의 insight를 제공하는 데에 중요성이 있다.
본 연구에서는 총 3종의 캐주얼 게임 데이터를 통해서 유저 이탈 예측 모델을 제안하고, 기존 유저 이탈 예측 연구에 대한 한계점을 개선하고자하며, 이탈 예측 연구의 일련의 과정을 통해 insight를 찾는데 연구의 목적이 있다.
이를 위해 본 연구에서는 유저들의 데이터를 가지고 유저 이탈 예측 모델을 설계하고, 예측 모델에 사용되는 Feature들의 특성을 분석하고 이탈 예측 모델 성능에 끼치는 영향을 살펴보도록 한다. 또한, 이탈 예측에 있어서 관찰 기간 및 이탈예측 기간이 예측 성능에 끼치는 영향을 살펴보도록 하고, 알고리즘 별 예측 성능을 비교 및 분석하기로 한다.
본 연구에서는 유저 이탈에 대해 정의 하고 데이터 전처리(data preprocess) 단계를 거쳐 연구에 사용할 원본 데이터를 생성한 후, 데이터 분석을 위한 알고리즘에 적용하기 적합하도록 가공한다. 이후 게임별 공통 Feature 10개와 특정 게임만 적용 가능한 전용 Feature 4개를 활용하여, Gradient boosting, Logistic regression, Random forest 알고리즘 별 예측 모델을 설계한다. 이후 10-fold cross validation을 통해 ROC(Receiver operating characteristic) curve의 AUC(Area under the curve) 로 유저 이탈 예측 모델의 성능을 평가한다.
실험 결과 activeDuration, playCount feature가 세개의 게임 모두 예측 모델 성능에 큰 영향을 끼치고, 그 밖에 bestScore, consecutivePlayRatio, worstScore, bestScoreIndex, purchaseCount, bestPurchase feature들이 예측 성능에 추가적인 영향을 주었다. 또한, 관찰 기간이 길어지고, 이탈예측 기간이 짧아질수록 예측 성능이 좋아지며, 관찰 기간과 이탈예측 기간이 전체 기간 중 초반 기간 이전일 경우 두 기간에 따른 예측 성능의 변화가 크기 때문에, 초반 기간 이후로 관찰 기간과 이탈예측 기간을 정의해야 안정적인 예측 결과가 나온다. 그리고 세개의 알고리즘 중 Gradient boosting 알고리즘이 가장 좋은 예측성능을 보였지만, 나머지 두개 알고리즘과의 성능차이는 미미했다.
-
dc.description.tableofcontents제 1 장 서 론 1
제 1 절 연구의 배경 1
제 2 절 연구의 필요성 7
제 3 절 연구의 목적 9

제 2 장 관련 연구 10
제 1 절 게임 데이터 분석 연구 10
제 2 절 유저 이탈 예측 연구 12
제 3 장 연구 문제 및 방법 15
제 1 절 연구 문제 15
제 2 절 연구 방법 17

제 4 장 유저 이탈 예측 모델 설계 19
제 1 절 유저 이탈에 대한 정의 19
1. 관찰 기간(Observation period) 19
2. 이탈(Churn)과 이탈예측 기간(Churn prediction period) 21
제 2 절 데이터 전처리(Data-preprocessing) 24
1. 원본 데이터 수집 24
2. 데이터 전처리 25
제 3 절 Feature 정의 33
1. 공통 Feature 34
2. 전용 Feature: Game 2 55
3. 전용 Feature: Game 3 58
제 4 절 유저 이탈 예측 모델 설계 63
1. Gradient boosting를 이용한 유저 이탈 예측 모델 63
2. Logistic regression를 이용한 유저 이탈 예측 모델 65
3. Random forest를 이용한 유저 이탈 예측 모델 66

제 5 장 실험 및 성능 평가 68
제 1 절 데이터 변환 68
제 2 절 성능 평가 72
1. 10-fold Cross Validation 72
2. ROC(Receiver operating characteristic)와 AUC(Area under the curve) 73
제 3 절 실험 결과 76
1. Single feature analysis 76
2. 이탈 예측 모델 실험 결과: 관찰 기간 및 이탈예측 기간 별 85

3. 이탈 예측 모델 실험 결과: 알고리즘 별 91
제 6 장 결 론 104
제 1 절 연구 결과의 요약 104
제 2 절 연구의 의의 108
제 3 절 연구의 한계 및 제언 109

참고문헌 111

Abstract 116
-
dc.formatapplication/pdf-
dc.format.extent4928678 bytes-
dc.format.mediumapplication/pdf-
dc.language.isoko-
dc.publisher서울대학교 융합과학기술대학원-
dc.subject캐주얼 게임-
dc.subject유저 이탈 예측-
dc.subject게임 유저 분석-
dc.subject그라디언트 부스팅-
dc.subject로지스틱 회귀-
dc.subject랜덤 포레스트-
dc.subject.ddc004-
dc.title캐주얼 게임 유저 이탈 예측-
dc.typeThesis-
dc.description.degreeMaster-
dc.citation.pagesx, 118-
dc.contributor.affiliation융합과학기술대학원 융합과학부(디지털정보융합전공)-
dc.date.awarded2016-08-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share