Publications

Detailed Information

분산 표상을 활용한 브랜드 시각화 및 키워드 추출 : Visualizing and Extracting Keywords from Reviews using Distributed Representation

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

양호성

Advisor
조성준
Major
공과대학 산업공학과
Issue Date
2017-02
Publisher
서울대학교 대학원
Keywords
분산표상키워드 추출소비자 리뷰
Description
학위논문 (석사)-- 서울대학교 대학원 : 산업공학과, 2017. 2. 조성준.
Abstract
소비자가 가진 브랜드에 대한 인식은 매출에 직접 영향을 주기 때문에 기업 입장에서 이를 파악하는 것은 매우 중요하다. 따라서 전통적으로 기업들은 설문조사를 통해 소비자 인식을 정량적으로 파악하려고 했으나 설문조사 방법은 주관적이고, 설문 인원 및 질문이 제한되는 등 다양한 문제점이 존재한다.
이러한 단점을 보완하기 위해 기업들은 User Generated Content(UGC)를 활용하기 시작하였다. 특히 UGC 중 가장 대표적인 소비자 리뷰는 적은 비용으로 소비자들의 살아있는 의견을 파악할 수 있지만, 대부분 텍스트 데이터이기 때문에 정량적 분석이 어렵다. 따라서 특정 단어의 빈도만 살펴보거나, 단어 빈도의 추이를 살펴보는 방법을 사용한다. 그러나 빈도 기반 방법은 전처리가 많아 분석 과정에서 주관이 많이 개입되므로 재현성과 객관성이 떨어진다. 또한, 문서와 단어 간 유사도 계산이 불가능하기 때문에 각 브랜드의 특징을 나타내는 키워드를 추출하기 어렵다.
본 연구에서는 이러한 단점을 보완하기 위해 브랜드와 단어를 같은 공간에 분산 표상(Distributed representation)으로 표현하는 Brand2Vec 방법을 제안한다. 브랜드 벡터를 활용해 소비자가 인식하는 브랜드의 계층적 관계를 Dendrogram으로 시각화하고, t-SNE를 이용하여 여러 브랜드의 포지셔닝을 시각화한다. 또한, Brand2Vec은 브랜드와 단어간 유사도 계산이 가능하기 때문에 다른 브랜드에 비해 상대적으로 자사 브랜드의 특징을 나타내는 키워드를 추출할 수 있다. 이러한 과정이 parameter에 강건하며, 최소한의 전처리를 사용하였기 때문에 객관성과 재현성을 확보하였다. 추후 UGC 데이터뿐만 아니라 뉴스 혹은 공시(Disclosure) 등 다양한 텍스트에 적용할 수 있을 것으로 기대한다.
Language
Korean
URI
https://hdl.handle.net/10371/123623
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share