Browse

빅데이터 분석 시스템을 이용한 TV의 시간대별 시청률과 광고효율성 분석
A Study on the Difference between Program Ratings and Advertising Ratings using Big Data Analysis System

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors
이민섭
Advisor
김형주
Major
공과대학 전기·컴퓨터공학부
Issue Date
2014-08
Publisher
서울대학교 대학원
Keywords
빅데이터맵리듀스인피니데이터시청률광고효율성Big DataMapReduceInfiniDataTV RatingsADRATIO
Description
학위논문 (석사)-- 서울대학교 대학원 : 전기·컴퓨터공학부, 2014. 8. 김형주.
Abstract
최근 TV 채널수가 증가하고 TV시청률 조사를 위한 패널의 수도 많아지면서 TV시청률에 대한 다양한 분석이 이루어지고 있다. 그러나 데이터의 크기가 커지면서 기존 RDBMS 기반의 시청률 분석 시스템의 한계로 인해 연구에 많은 시간이 소요된다. 본 논문은 이러한 문제를 개선하기 위해 클러스터 기반에서 대용량 데이터 처리를 위한 프로그래밍 모델인 맵리듀스와 티맥스데이터社의 분산 데이터베이스 관리시스템인 인피니데이터를 사용하여 연구의 효율성을 높이고 데이터 특성 및 쿼리 종류에 따른 RDBMS, 맵리듀스, 그리고 인피니데이터의 특징에 대해 분석한다. 기존 언론정보분야 분석에서 광고시청률은 프로그램의 시청률에 대체로 비례했지만 빅데이터 시스템을 이용한 본 연구에서는 비례하지 않는 시간대도 있음을 확인했다. 일요일을 제외한 모든 요일 20∼21시는 광고시청률이 하락하고, 주중 20∼21시 광고효율성은 모든 시간대 중에서 가장 낮았다. 연구에 사용된 세 가지 시스템은 인피니데이터, 하둡 그리고 RDBMS 순서로 성능이 좋았다. 하지만 쿼리에 따라 시스템들간 상당히 다른 성능을 보였고, 그 차이를 확인했다.
There have been various analyses of TV ratings as the number of TV channels and research panels for TV ratings increase. However, the research is time consuming because the viewer rating analysis based on the previous RDBMS has many limits due to the increased size of data. To solve these problems, we raised the efficiency of the research by using MapReduce, which is a programming model for disposal of massive data based on clusters, and InfiniData, which is a distributed database management system of TmaxData. The purpose of this paper is to analyze the characteristics of RDBMS, MapReduce, and InfiniData by data quality and query types. While the previous researches have shown that advertisement ratings were proportional to the viewer ratings of the program, this research verified that the advertisement and program viewer ratings are not always proportional, and that it depends on time slots. The viewer ratings of the advertisement dropped at 8 to 9 pm everyday except for Sundays, and the efficiency of the advertisement
(ADRATIO) was the lowest at 8-9pm weekdays. The three systems used in research had higher performance in order of InfiniData, Hadoop, and RDBMS. However, we verified that those three systems had quite different performances based on queries.
Language
Korean
URI
http://hdl.handle.net/10371/123082
Files in This Item:
Appears in Collections:
College of Engineering/Engineering Practice School (공과대학/대학원)Dept. of Electrical and Computer Engineering (전기·정보공학부)Theses (Master's Degree_전기·정보공학부)
  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse