Publications

Detailed Information

현대 한국어 부사에 대한 계량언어학적 연구 - 확률 통계 모형과 네트워크를 이용한 분석 - : the Quantitative Linguistical Study on Modern Korean adverbs: Using Probability-Statistical Model and Network Model

DC Field Value Language
dc.contributor.advisor권재일-
dc.contributor.author정성훈-
dc.date.accessioned2017-07-14T01:03:29Z-
dc.date.available2017-07-14T01:03:29Z-
dc.date.issued2014-08-
dc.identifier.other000000021388-
dc.identifier.urihttps://hdl.handle.net/10371/121617-
dc.description학위논문 (박사)-- 서울대학교 대학원 : 언어학과, 2014. 8. 권재일.-
dc.description.abstract이 논문의 목적은 현대 한국어 부사의 개별적 속성과 관계적 속성에 대한 계량적 연구를 위해서 확률 통계 모형을 이용한 분석과 네트워크 분석을 수행하는 것이다. 이를 위해서 2011년 12월에 배포된 21세기 세종계획의 현대 한국어 구어 형태분석 말뭉치와 현대 한국어 문어 형태의미분석 말뭉치에 나타난 접속부사와 일반부사를 추출하여 기초 자료를 구축하였다. 우선 말뭉치에 나타난 부사들을 구어와 문어로 나누어 개별 현대 한국어 부사의 빈도와 분포를 계산하였으며, 이를 토대로 말뭉치에 나타난 현대 한국어 부사의 확률 통계 모형을 제시하였다. 구어에서는 1,697개 부사 유형, 121,779개의 부사를 추출하였고, 문어에서는 6,032개 부사 유형, 646,880개의 부사를 추출하였다. 구어와 문어에서 나타나는 부사의 유형과 빈도는 큰 차이를 보였으나, 두 자료에서 모두 부사의 빈도순위와 빈도가 반비례하는 것이 관찰되었고, 멱함수의 법칙을 따르는 것을 확인하였다. 또한 구어와 문어에서 관찰한 부사의 빈도를 토대로 구어성을 측정하였는데 부사 제일, 되게, 진짜, 막 등은 구어성이 높은 부사였고, 부사 제법, 무척, 더욱, 몹시 등은 문어성이 높은 부사였다. 한편 위의 결과를 바탕으로 말뭉치에 나타난 현대 한국어 부사의 빈도 스펙트럼과 어휘 성장 곡선을 계산하였고, 지프-만델브로트의 확률 통계 모형과 LNRE 모형을 적용하여 일반 말뭉치에 나타날 수 있는 부사의 빈도와 분포를 예측하는 모형도 제시하였다.
다음으로 말뭉치에 나타난 부사와 용언의 공기관계를 이용하여 부사 네트워크 분석도 수행하였다. 부사 네트워크 분석은 부사와 공기하는 용언의 의미와 공기빈도를 토대로 여러 중심성을 측정하여 부사들이 어떤 구조로 관계를 맺고 있고, 서로 어떤 영향을 주고받는지를 계량화한 분석이다. 구어와 문어로 나누고 고빈도 부사 75개를 대상으로 네트워크 분석을 수행하였는데 구어에서는 75개 부사 중 용언과 유의미한 공기관계에 있는 부사는 50개, 용언은 303개, 이들의 공기유형은 882개였다. 문어에서는 75개 부사 중 용언과 유의미한 공기관계에 있는 부사가 66개, 용언은 1,527개, 이들의 공기유형은 4,639개였다. 구어 부사 네트워크에서 여러 중심성을 측정하였는데 중심성이 높은 부사는 많이, 다, 좀, 되게, ... 등이었고, 문어 부사 네트워크에서는 더, 잘, 다시, 다, ... 등이었다. 구어와 문어 부사 네트워크는 모두 크게 2개의 군집으로 나누어졌는데 구어 부사 네트워크는 거의, 가장, 너무, 되게 등의 정도부사류 군집과 많이, 딱, 다, 잘, 덜 등의 상태/양태부사류 군집으로 분류되었다. 문어 부사 네트워크도 크게 너무, 되게, 좀, 더, 진짜 등의 정도부사류 군집과 많이, 딱, 다, 잘, 막 등의 상태/양태부사류 군집으로 분류되었다.
이 논문은 단순히 말뭉치에 나타나는 부사의 유형과 빈도만을 기술하는 것에서 더 나아가, 부사 빈도 분포를 계량적으로 분석하였으며, 확률 통계 모형을 이용하여 부사의 유형과 빈도를 추정하는 모형을 제안하였다. 이 방법은 말뭉치를 이용하여 부사를 연구하는 하나의 방법론이 될 수 있을 것이라고 생각되며, 말뭉치를 바탕으로 한 다른 품사의 유형과 빈도 분포 연구에도 적용할 수 있을 것으로 보인다. 또한 부사 네트워크 분석은 부사와 용언의 관계적 속성을 계량적으로 이해할 수 있고, 부사 연구에서 그 동안 언어 직관으로 해석하기 어려운 문제에 대한 실마리를 제공해 줄 수 있다는 점에서 그 의의를 지닌다.
-
dc.description.tableofcontents제1장 서론 1
1.1. 연구 목적과 필요성 1
1.2. 연구 대상과 연구 방법 5

제2장 세종말뭉치를 이용한 한국어 부사 유형과빈도 분포 고찰 15
2.1. 부사의 유형과 빈도 17
2.2. 부사의 구어성/문어성 점수 측정 22
2.3. 부사의 빈도와 분포 특성 30
2.4. 부사의 빈도 분포 함수와 확률 통계 모형 34
2.4.1. 부사의 빈도 분포 함수 34
2.4.2. 지프-만델브로트의 법칙 39
2.4.3. 지프-만델브로트의 확률 통계 모형 41
2.4.4. LNRE 모형을 이용한 부사의 빈도 분포 분석 44
2.5. 정리 49

제3장 부사와 네트워크 51
3.1. 네트워크 분석 51
3.1.1. 네트워크의 개념과 기본 유형 52
3.1.2. 네트워크의 기본 지표 56
3.1.2.1. 밀도 56
3.1.2.2. 포괄성과 포괄성 비율 56
3.1.2.3. 지름 57
3.1.2.4. 군집화 계수 58
3.1.2.5. 구조적 공백 59
3.1.2.6. 연결정도 중심성과 연결강도 중심성 60
3.1.2.7. 근접 중심성 64
3.1.2.8. 매개 중심성 66
3.1.2.9. 위세 중심성 68
3.2. 언어와 네트워크 분석 71
3.2.1. 언어 네트워크 분석 71
3.2.2. 부사 네트워크 분석 73
3.3. 부사 네트워크의 실제 74
3.3.1. 부사-용언의 2원 네트워크 74
3.3.2. 부사 네트워크 77
3.3.3. 부사 네트워크의 군집 분석 82

제4장 세종말뭉치의 부사 전역 네트워크 90
4.1. 상호정보와 t-점수 90
4.1.1. 부사-용언의 상호정보 92
4.1.2. 부사-용언의 t-점수 96
4.2. 구어 부사 네트워크 98
4.2.1. 구어자료에서 부사-용언의 공기관계 99
4.2.2. 구어 부사 네트워크 분석 102
4.2.3. 네트워크 그림과 군집 분석 110
4.2.4. 다차원척도 분석과 군집 분석 115
4.3. 문어 부사 네트워크 119
4.3.1. 문어자료에서 부사-용언의 공기관계 119
4.3.2. 문어 부사 네트워크 분석 121

제5장 부사 지역 네트워크와 부사의 사용 양상 132
5.1. 부사 지역 네트워크 분석 132
5.1.1. 정도부사류 네트워크 분석 결과 133
5.1.2. 상태/양태부사류 네트워크 분석 결과 142
5.2. 정도부사와 상태/양태 부사 152
5.2.1. 정도부사와 상태/양태 부사의 특징 152
5.2.2. 부사 네트워크에서 정도부사류 부사와 상태/양태부사류 부사 153
5.2.3. 부사와 용언의 공기관계와 그 용례 159
5.2.3.1. 좀의 분포와 사용 양상 159
5.2.3.2. 더의 분포와 사용 양상 162
5.2.3.3. 되게의 분포와 사용 양상 165
5.2.3.4. 너무의 분포와 사용 양상 168
5.2.3.5. 아주의 분포와 사용 양상 171
5.2.3.6. 매우의 분포와 사용 양상 174
5.2.3.7. 가장의 분포와 사용 양상 177
5.2.3.8. 거의의 분포와 사용 양상 180
5.2.3.9. 은근히의 분포와 사용 양상 183
5.2.3.10. 많이의 분포와 사용 양상 186
5.2.3.11. 잘의 분포와 사용 양상 188
5.2.3.12. 다의 분포와 사용 양상 191
5.2.3.13. 막의 분포와 사용 양상 193
5.2.3.14. 그냥의 분포와 사용 양상 197
5.2.3.15. 다시의 분포와 사용 양상 199
5.2.3.16. 덜의 분포와 사용 양상 202

제6장 요약 및 결론 206
6.1. 부사의 개별적 속성 206
6.2. 부사의 관계적 속성 208
6.3. 결론 211

참 고 문 헌 214

세종말뭉치에서 부사 유형과 빈도 229
세종말뭉치에서 부사의 구어성 점수 234
세종말뭉치에서 부사-용언의 t-점수 237
부사 네트워크에서 부사의 연결강도 240

Abstract 252
-
dc.formatapplication/pdf-
dc.format.extent3021587 bytes-
dc.format.mediumapplication/pdf-
dc.language.isoko-
dc.publisher서울대학교 대학원-
dc.subject현대 한국어 부사-
dc.subject말뭉치-
dc.subjectt-점수-
dc.subjectJ-
dc.subject빈도 분포-
dc.subject지프-만델브로트 모형-
dc.subject2원 네트워크 분석-
dc.subject부사 네트워크-
dc.subject.ddc401-
dc.title현대 한국어 부사에 대한 계량언어학적 연구 - 확률 통계 모형과 네트워크를 이용한 분석 --
dc.title.alternativethe Quantitative Linguistical Study on Modern Korean adverbs: Using Probability-Statistical Model and Network Model-
dc.typeThesis-
dc.contributor.AlternativeAuthorJung Sunghoon-
dc.description.degreeDoctor-
dc.citation.pagesⅱ ⅴ ⅲ, 253-
dc.contributor.affiliation인문대학 언어학과-
dc.date.awarded2014-08-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share