Publications

Detailed Information

Word embedding for sentiment analysis considering emotional dimensions : 감정 차원을 고려한 단어 벡터 모델과 감성 분석에 관한 연구

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

구본효

Advisor
이재욱
Major
공과대학 산업공학과
Issue Date
2016-02
Publisher
서울대학교 대학원
Keywords
단어 벡터분포 가설감정 차원감성 분석준지도학습오토인코더
Description
학위논문 (석사)-- 서울대학교 대학원 : 산업공학과, 2016. 2. 이재욱.
Abstract
본 연구는 감정 차원을 고려한 단어 벡터 모델을 제시하고 감성 분석에 적용하였다. 특히, 단어의 감정 정보를 기존의 단어 벡터 모델에 종합하 기 위하여 준지도학습을 수행하는 오토인코더를 활용하였다. 감성 분석 은 문장이나 문서로부터 작성자의 감성 상태를 추론하는 것이다. 감정 차원은 감성 상태의 요소이다. 즉, 단어 벡터를 활용한 감성 분석이 효 과적으로 이루어지기 위하여는 단어 벡터가 감정 차원의 정보를 포함하 고 있어야 할 것이다. 그러나 분포 가설에 기반한 기존의 단어 벡터는 감정 정보를 온전히 포함하지 못한다. 단어 벡터를 활용한 감성 분석에 서 이를 극복하기 위하여 본 연구는 문장이나 문서가 아닌 단어 자체의 감정 차원을 고려하였다. 준지도학습을 바탕으로 기존의 단어 벡터 모 델이 감정 차원의 정보를 담을 수 있도록 모델을 제시하였다. 이를 바 탕으로 감성 분석을 수행한 결과 감정 정보가 미비한 단어 벡터에 비하 여 향상된 결과를 얻을 수 있었다.
Recent studies have shown that word embeddings based on the wordcontext co-occurrence statistics are suited to measure semantic similarities. However, word embeddings are deficient in emotional information. This thesis reviews current word embedding models and presents word embeddings enriched with emotional information. Word embeddings are learned based on the previous word embeddings using a semi-supervised autoencoder model to incorporate affective norms data. Then, the thesis evaluates word embeddings enriched with emotional data on sentiment classification datasets.
Language
English
URI
https://hdl.handle.net/10371/123587
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share