Using Figurative Language and Other Co-textual Markers for the Automatic Classification of Irony : 비유언어와 문맥 표지를 이용한 반어법 자동 분류 연구

Cited 0 time in Web of Science Cited 0 time in Scopus
Andrew Cattle
Hyopil Shin
인문대학 언어학과
Issue Date
서울대학교 대학원
SarcasmIronyHyperboleUnderstatementFigurative Language
학위논문 (석사)-- 서울대학교 대학원 : 언어학과, 2014. 8. 신효필.
본 논문은 고빈도 비유언어(figurative language)를 이용한 반어법 자동 인식 방법을 제안한다. 반어법과 비유언어들(직유법, 은유법, 의인법, 과장법)을 인식하는 문제는 컴퓨터 언어학에서 매우 중요한 분야이다. 이런 비유 언어들은 표면적인 의미와 다른 의미를 내포하기 때문에 그 문장의 의미를 파악하는데 필요한 연구이다. 과장법이나 과소 법 같은 비유언어와 달리 특별히 반어법은 그 표현적 의미와 정 반대 또는 부합하지 않는 의미를 내포하기 때문에 더욱 문제가 된다.

구어에서 반어법이 사용될 때는 운율이라는 요소가 인식에 중요한 역할을 하는 반면, 문어에서 반어법은 운율 정보가 없기 때문에 더 인식이 어렵다. 또한, 반어법은 대부분의 경우 표면적으로 나타나는 명확한 단서를 포함하지 않고, 단지 준언어적, 문맥적 화용적인 단서만을 갖기 때문에 인식에 더 어려움이 크다. 반어법의 단서가 되는 예로는 청자에게 문자 그대로 이해되기를 바라지 않음을 암시하는 과장법, 과소법, 수사적 질문법, 부가 의문문 같은 것들이 존재한다.

본고는 동시에 나타나는 비유언어들을 각각 인식하여 그 결과를 반어법 검출기에 제공하는 방식의 분할-정복법을 소개한다. 짧은 길이의 트위터와 상대적으로 긴 아마존 상품평에 대해 실행한 실험은 이러한 비유언어들을 개별적으로 인식하여 반어법의 자동 인식에 사용하는 것이 비유언어들을 한번에 인식하는 방법 보다 반어법 인식에 효과적이라는 사실을 밝혔다.

또한, 지금까지 개별적으로 제한된 문맥만을 고려한 과장법, 과소법 연구와 달리 본 연구는 반어법 인식에 사용되는 기존의 연구 방법을 과장법과 과소법 인식에도 적용할 수 있는 가능성을 제시하였다는 의의가 있다.
This thesis proposes a linguistic-based irony detection method which uses these frequently co-occurring figurative languages to identify areas where irony is likely to occur. The detection and proper interpretation of irony and other figurative languages represents an important area of research for Computational Linguistics. Since figurative languages typically convey meanings which differ from their literal interpretations, interpreting such utterances at face value is likely to give incorrect results. Irony in particular represents a special challenge as, unlike some figurative languages like hyperbole or understatement which express sentiments which are more-or-less in line with their literal interpretation, differing only in intensity, ironic utterances convey intended meanings incongruent with – or even the exact opposite of – their literal interpretation. Compounding the need for effective irony detection is ironys near ubiquitous use in online writings and computer-mediated communications, both of which are commonly used in Computational Linguistics experiments.

While irony in spoken contexts tends to be denoted using prosody, irony in written contexts is much harder to detect. One of the major difficulties is that irony typically does not present with any explicit clues such as punctuation marks or verbal inflections. Instead, irony tends to be denoted using paralinguistic, contextual, or pragmatic cues. Among these are the co-occurrence of figurative languages such as hyperbole, understatement, rhetorical questions, tag questions, or other ironic utterances which alert the listener that the speaker does not expect to be interpreted literally.

This thesis introduces a divide-and-conquer approach to irony detection where co-occurring figurative languages are identified independently and then fed into an overall irony detector. Experiments on both short-form Twitter tweets and longer-form Amazon product reviews show not only that co-textual figurative languages are useful in the automatic classification of irony but that identifying these co-occurring figurative languages separately yields better overall irony detection by resolving conflicts between conflicting features, such as those for hyperbole and understatement.

This thesis also introduces detection methods for hyperbole and understatement in general contexts by adapting existing approaches to irony detection. Before this point hyperbole detection was focused only on specialized contexts while understatement detection had been largely ignored. Experiments show that these proposed automated hyperbole and understatement detection methods outperformed methods which rely on fixed vocabularies.
Files in This Item:
Appears in Collections:
College of Humanities (인문대학)Linguistics (언어학과)Theses (Master's Degree_언어학과)
  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.