Publications

Detailed Information

Word embedding for sentiment analysis considering emotional dimensions : 감정 차원을 고려한 단어 벡터 모델과 감성 분석에 관한 연구

DC Field Value Language
dc.contributor.advisor이재욱-
dc.contributor.author구본효-
dc.date.accessioned2017-07-14T03:24:20Z-
dc.date.available2017-07-14T03:24:20Z-
dc.date.issued2016-02-
dc.identifier.other000000131821-
dc.identifier.urihttps://hdl.handle.net/10371/123587-
dc.description학위논문 (석사)-- 서울대학교 대학원 : 산업공학과, 2016. 2. 이재욱.-
dc.description.abstract본 연구는 감정 차원을 고려한 단어 벡터 모델을 제시하고 감성 분석에 적용하였다. 특히, 단어의 감정 정보를 기존의 단어 벡터 모델에 종합하 기 위하여 준지도학습을 수행하는 오토인코더를 활용하였다. 감성 분석 은 문장이나 문서로부터 작성자의 감성 상태를 추론하는 것이다. 감정 차원은 감성 상태의 요소이다. 즉, 단어 벡터를 활용한 감성 분석이 효 과적으로 이루어지기 위하여는 단어 벡터가 감정 차원의 정보를 포함하 고 있어야 할 것이다. 그러나 분포 가설에 기반한 기존의 단어 벡터는 감정 정보를 온전히 포함하지 못한다. 단어 벡터를 활용한 감성 분석에 서 이를 극복하기 위하여 본 연구는 문장이나 문서가 아닌 단어 자체의 감정 차원을 고려하였다. 준지도학습을 바탕으로 기존의 단어 벡터 모 델이 감정 차원의 정보를 담을 수 있도록 모델을 제시하였다. 이를 바 탕으로 감성 분석을 수행한 결과 감정 정보가 미비한 단어 벡터에 비하 여 향상된 결과를 얻을 수 있었다.-
dc.description.abstractRecent studies have shown that word embeddings based on the wordcontext co-occurrence statistics are suited to measure semantic similarities. However, word embeddings are deficient in emotional information. This thesis reviews current word embedding models and presents word embeddings enriched with emotional information. Word embeddings are learned based on the previous word embeddings using a semi-supervised autoencoder model to incorporate affective norms data. Then, the thesis evaluates word embeddings enriched with emotional data on sentiment classification datasets.-
dc.description.tableofcontentsCHAPTER 1 Introduction 1
1 Contribution 2
2 Related Work 3
CHAPTER 2 Word Embedding 6
1 Skip-gram with Negative Sampling 7
2 Pointwise Mutual Information 9
3 Word Embedding and Distributed Semantics 10
4 Experiment 13
CHAPTER 3 Semi-Supervised Autoencoder 16
1 Autoencoder 16
2 Semi-Supervised Autoencoder 18
3 Regularization and Sparsity 19
4 Trainng Semi-Supervised Autoencoder 20
CHAPTER 4 Sentiment Analysis 22
1 Dimensional Model of Emotion 23
2 Emotional Similarity 25
2.1 KL-Divergence 26
3 Experiment 28
3.1 Word Embeding 29
3.2 Sentiment Analysis 32
3.2.1 Dataset 33
3.2.2 Result 34
3.3 Discussion 36
CHAPTER 5 Conclusion 38
BIBLIOGRAPHY 40
APPENDIX 45
1 Pseudocode of Semi-Supervised Autoencoder 45
-
dc.formatapplication/pdf-
dc.format.extent2509943 bytes-
dc.format.mediumapplication/pdf-
dc.language.isoen-
dc.publisher서울대학교 대학원-
dc.subject단어 벡터-
dc.subject분포 가설-
dc.subject감정 차원-
dc.subject감성 분석-
dc.subject준지도학습-
dc.subject오토인코더-
dc.subject.ddc670-
dc.titleWord embedding for sentiment analysis considering emotional dimensions-
dc.title.alternative감정 차원을 고려한 단어 벡터 모델과 감성 분석에 관한 연구-
dc.typeThesis-
dc.contributor.AlternativeAuthorKoo Bonhyo-
dc.description.degreeMaster-
dc.citation.pages46-
dc.contributor.affiliation공과대학 산업공학과-
dc.date.awarded2016-02-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share