Publications

Detailed Information

현대 한국어 부사에 대한 계량언어학적 연구 - 확률 통계 모형과 네트워크를 이용한 분석 - : the Quantitative Linguistical Study on Modern Korean adverbs: Using Probability-Statistical Model and Network Model

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

정성훈

Advisor
권재일
Major
인문대학 언어학과
Issue Date
2014-08
Publisher
서울대학교 대학원
Keywords
현대 한국어 부사말뭉치t-점수J빈도 분포지프-만델브로트 모형2원 네트워크 분석부사 네트워크
Description
학위논문 (박사)-- 서울대학교 대학원 : 언어학과, 2014. 8. 권재일.
Abstract
이 논문의 목적은 현대 한국어 부사의 개별적 속성과 관계적 속성에 대한 계량적 연구를 위해서 확률 통계 모형을 이용한 분석과 네트워크 분석을 수행하는 것이다. 이를 위해서 2011년 12월에 배포된 21세기 세종계획의 현대 한국어 구어 형태분석 말뭉치와 현대 한국어 문어 형태의미분석 말뭉치에 나타난 접속부사와 일반부사를 추출하여 기초 자료를 구축하였다. 우선 말뭉치에 나타난 부사들을 구어와 문어로 나누어 개별 현대 한국어 부사의 빈도와 분포를 계산하였으며, 이를 토대로 말뭉치에 나타난 현대 한국어 부사의 확률 통계 모형을 제시하였다. 구어에서는 1,697개 부사 유형, 121,779개의 부사를 추출하였고, 문어에서는 6,032개 부사 유형, 646,880개의 부사를 추출하였다. 구어와 문어에서 나타나는 부사의 유형과 빈도는 큰 차이를 보였으나, 두 자료에서 모두 부사의 빈도순위와 빈도가 반비례하는 것이 관찰되었고, 멱함수의 법칙을 따르는 것을 확인하였다. 또한 구어와 문어에서 관찰한 부사의 빈도를 토대로 구어성을 측정하였는데 부사 제일, 되게, 진짜, 막 등은 구어성이 높은 부사였고, 부사 제법, 무척, 더욱, 몹시 등은 문어성이 높은 부사였다. 한편 위의 결과를 바탕으로 말뭉치에 나타난 현대 한국어 부사의 빈도 스펙트럼과 어휘 성장 곡선을 계산하였고, 지프-만델브로트의 확률 통계 모형과 LNRE 모형을 적용하여 일반 말뭉치에 나타날 수 있는 부사의 빈도와 분포를 예측하는 모형도 제시하였다.
다음으로 말뭉치에 나타난 부사와 용언의 공기관계를 이용하여 부사 네트워크 분석도 수행하였다. 부사 네트워크 분석은 부사와 공기하는 용언의 의미와 공기빈도를 토대로 여러 중심성을 측정하여 부사들이 어떤 구조로 관계를 맺고 있고, 서로 어떤 영향을 주고받는지를 계량화한 분석이다. 구어와 문어로 나누고 고빈도 부사 75개를 대상으로 네트워크 분석을 수행하였는데 구어에서는 75개 부사 중 용언과 유의미한 공기관계에 있는 부사는 50개, 용언은 303개, 이들의 공기유형은 882개였다. 문어에서는 75개 부사 중 용언과 유의미한 공기관계에 있는 부사가 66개, 용언은 1,527개, 이들의 공기유형은 4,639개였다. 구어 부사 네트워크에서 여러 중심성을 측정하였는데 중심성이 높은 부사는 많이, 다, 좀, 되게, ... 등이었고, 문어 부사 네트워크에서는 더, 잘, 다시, 다, ... 등이었다. 구어와 문어 부사 네트워크는 모두 크게 2개의 군집으로 나누어졌는데 구어 부사 네트워크는 거의, 가장, 너무, 되게 등의 정도부사류 군집과 많이, 딱, 다, 잘, 덜 등의 상태/양태부사류 군집으로 분류되었다. 문어 부사 네트워크도 크게 너무, 되게, 좀, 더, 진짜 등의 정도부사류 군집과 많이, 딱, 다, 잘, 막 등의 상태/양태부사류 군집으로 분류되었다.
이 논문은 단순히 말뭉치에 나타나는 부사의 유형과 빈도만을 기술하는 것에서 더 나아가, 부사 빈도 분포를 계량적으로 분석하였으며, 확률 통계 모형을 이용하여 부사의 유형과 빈도를 추정하는 모형을 제안하였다. 이 방법은 말뭉치를 이용하여 부사를 연구하는 하나의 방법론이 될 수 있을 것이라고 생각되며, 말뭉치를 바탕으로 한 다른 품사의 유형과 빈도 분포 연구에도 적용할 수 있을 것으로 보인다. 또한 부사 네트워크 분석은 부사와 용언의 관계적 속성을 계량적으로 이해할 수 있고, 부사 연구에서 그 동안 언어 직관으로 해석하기 어려운 문제에 대한 실마리를 제공해 줄 수 있다는 점에서 그 의의를 지닌다.
Language
Korean
URI
https://hdl.handle.net/10371/121617
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share