Publications

Detailed Information

변수 선택 기법을 이용한 감정 단어 사전의 영역 특수성 확장 : Expanding Domain Sentiment Lexicon via Variable Selection Method

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

모종훈

Advisor
김청택
Major
사회과학대학 심리학과
Issue Date
2015-08
Publisher
서울대학교 대학원
Keywords
분석기계 학습감정 단어 사전변수 선택 기법
Description
학위논문 (석사)-- 서울대학교 대학원 : 심리학과 계량심리전공, 2015. 8. 김청택.
Abstract
본 연구는 변수 선택 기법으로 활용할 수 있는 엘라스틱 넷 (Elastic net)과 랜덤 포레스트 포레스트 (Random Forest)를 이용하여 감정 단어 사 전의 글 맥락적 정보를 추가하는 데에 주 목적이 있다 .
연구 1에서는 엘라스틱 넷과 랜덤 포레스트가 사전의 과잉 적합을 방지하면서 동시에 글 맥락적 정보를 담은 세부 특징(Feature)를 찾아낼 수 있는지 탐구하였다. 이를 알아보기 위해 1)실제 사람이 평가한 중요 단어 목록과 모형을 통해 도출한 중요 단어 목록을 비교하였고, 2)모형을 통해 얻은 단어 중 기존 사전에 포함되어 있지 않은 단어들을 찾고 이 단어에 어떠한 특징이 있는지 알아보았다. 그 결과 변수 선택 기법이 이미 정의된 사전에서 부족한 단어들을 보충하거나 혹은 기존의 사전의 의미와 글뭉치에서 다른 방식으로 쓰이고 있는 단어를 찾아내는 데에 사용할 수 있음을 발견하였다.
연구 2에서는 감정 단어 사전 개선의 효과를 알아보기 위하여 실제 감정 분석을 수행하고 그 결과를 개선 전의 사전을 사용했을 때의 결과 및 다양한 기계학습 방법을 이용한 결과와 비교하였다. 분석 결과 기계학습을 이용하였을 때보다 사전 기반 분석에서 더 높은 정확도를 얻을 수 있었다. 또한 연구 1에서 개선한 감정 단어 사전을 이용하였을 때에 그렇지 않은 기존의 사전을 사용하였을 때보다 분류의 정확도가 증가하였다.
Language
Korean
URI
https://hdl.handle.net/10371/134389
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share