Publications

Detailed Information

강화 학습을 이용한 단어 감정 값 및 진술문 상태 값 측정법 연구

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김영삼

Advisor
신효필, 장병탁
Major
인문대학 협동과정 인지과학전공
Issue Date
2018-08
Publisher
서울대학교 대학원
Description
학위논문 (박사)-- 서울대학교 대학원 : 인문대학 협동과정 인지과학전공, 2018. 8. 신효필, 장병탁.
Abstract
본 논문에서 강화 학습(reinforcement learning)이란 기계 학습 방법의 한 종류로 환경으로부터 주어지는 보상을 최대화하는 방식의 학습 모형을 가리킨다. 이 방법론이 기계 학습 방법의 주류인 지도 학습(supervised learning)과 원리적으로 다른 점은 이 방법론이 에이전트가 무엇을 할 지에 대한 구체적인 지도(supervision)를 하지 않고, 에이전트가 처한 환경 안에서 여러 시행을 통해 그것을 발견하도록 한다는 점에 있다. 이 과정에서 에이전트가 취하는 행위, 즉 행동은 바로 주어지는 보상 외에도 계속적으로 이어지는 상황들에 따른 보상들을 최대화하는 것을 목적으로 하게 된다.



본 연구의 주요 목적은 이 강화 학습 방법론을 통해 자연어 텍스트를 점진적(incremental), 연속적(continuous)으로 처리하는 방법을 연구하는 데 있다. 자연어 처리, 혹은 전산 언어학은 다양한 과제를 가지고 있는 방대한 분야이므로 본 논문에서는 크게 두 가지 종류의 과제, 상태 값 측정 과제와 상태 유형 예측 과제를 중점적으로 다룬다. 전자의 경우에는 어휘의 감정 극성 값을 강화 학습의 핵심적 알고리즘인 시간차(temporal difference) 알고리즘을 통해 측정하는 방법을 연구하고, 후자의 경우에는 의료 텍스트 문장의 연속적 상태 측정을 강화 학습 방법론을 통해 수행하는 방법을 살펴볼 것이다.



자연어 텍스트의 점진적, 혹은 연속적 처리 과정은 인간의 언어 심리학적 처리양상을 볼 때 인지 친화적인 접근법으로 보이는데, 왜냐하면 여러 심리학적, 신경학적 연구결과들을 통해 언어 처리의 과정이 기본적으로 자동적, 점진적 처리임이 알려져 있기 때문이다. 본 논문에는 그런 측면에서 강화 학습을 보다 인지 모형에 입각하여 활용하고자 하는 노력이 들어 있다. 마지막 논의 부분에서는 인지모형 기반 강화 학습에 대해 논의하고 이 방법을 자연어 처리에 어떻게 활용할 것인지에 대한 전망을 다루었다.
Language
Korean
URI
https://hdl.handle.net/10371/143346
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share