Publications

Detailed Information

A Corpus-based Analysis of Collocations in Korean Middle and High School English Textbooks and Korean EFL Learner Writing : 한국 중학교 및 고등학교 영어 교과서와 한국인 학습자 영어글쓰기에서의 연어 사용에 대한 코퍼스 기반 분석

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김영신

Advisor
오선영
Issue Date
2020
Publisher
서울대학교 대학원
Description
학위논문(석사)--서울대학교 대학원 :사범대학 외국어교육과(영어전공),2020. 2. 오선영.
Abstract
둘, 혹은 그 이상의 단어가 습관적으로 연합되는 단위를 의미하는 연어는, 효율적인 언어 산출과 처리를 가능하게 하며 원어민의 유창성을 구성하는 중요한 언어적 요소인 정형화된 어구의 하위 유형에 속한다. 정형화된 어구의 반복적인 사용을 언어 생성의 기본 원리라 설명하는 Sinclair의숙어적 원리 에 따르면, 원어민 화자는 영어 문법이 허용하는 무한한 조합을 새로 생성하는 대신 미리 짜여진 제한적인 수의 정형화된 표현을 반복적으로 사용한다. 숙어적 원리에 의해 생성된 정형화된 표현은 원어민의 영어에서 큰 비율을 차지하는데, 모국어를 습득하는 원어민 화자는 이들 항목에 빈번하게 노출됨으로써, 이들을 장기기억/어휘장에 깊이 각인시키고 자동화할 수 있다. 나아가 이러한 정형화된 단어 간 결합은 제한적인 어휘만을 사용할 수 있는 초기 언어 발달 단계에서 언어 사용을 촉진하는 요인으로 알려져 있다.
한편, 연어는 완전히 고착화된 숙어적 표현과, 반대로 임의적 선택에 의해 생성된 자유 결합의 중간 정도에 해당하는 정형성을 지닌 것으로 알려져 있다. 이렇듯 정형화 표현인 동시에 유연한 선택의 폭을 허용하는 연어의 애매한 결합적 속성으로 인해, 적절한 연어 사용은 원어민과 비원어민의 어휘 사용을 구분 짓는 특성이자, 제2외국어 학습자들이 많은 어려움을 겪는 영역으로 알려져 있다. 이러한 연어의 중요성과 학습상의 어려움에도 불구하고, 현재 한국 영어 어휘 교육과정은 개별 단어 수준의 목록만을 제시하고 있으며, 검정 교과서에 대한 교육과정 지침은 어휘의 적절한 사용보다는, 어휘 목록의 일정한 수준의 포함률(coverage)를 유지하는데 초점이 맞춰져 있는 것으로 보인다. 또한 기존의 어휘 관련 연구는 개별 어휘 항목에 대해서 어휘적 다양성과 난이도를 측정할 수 있는 다양한 도구들을 개발하고 활용해 왔으나, 연어 항목에 대해서는 이들의 결합적 특성에 맞춘 측정법과 도구를 사용한 사례가 많지 않은 상황이다.
이에 본 연구에서는 한국 영어 교실상황에서의 주 언어 입력에 해당하는 중∙고등학교 영어 교과서와, 정규교육과정을 마친 한국인 학습자의 언어 산출을 대표하는 대학 신입생 영작문을 분석하여, 한국의 EFL 상황에서의 언어 입력 및 학습자의 언어 산출 내 연어의 분포적 특징을 밝히고자 한다. 보다 객관적인 분석을 위해, 대규모 원어민 코퍼스에서 각 단어의 확률적 결합강도를 추출하고, 일정 수준 이상의 결합 강도를 지닌 조합을 연어로 정의하는 양적 접근을 취하였다. 분석에는 코퍼스적 접근 방식이 사용될 것이며 분석 대상 텍스트로는, 2015 개정 중∙고등학교 8종 영어 교과서 내 읽기 지문과 연세 영어 학습자 코퍼스(YELC)가 사용되었다. 또한, 대규모 원어민 언어 자료를 사용하여 연어성을 판단하는 참조 기준으로 삼는 동시에, 원어민의 모국어 언어 습득 상황에서 주어지는 언어 입력이자 일반 영어의 연어 사용을 대표하도록 하여, 두 대상 코퍼스의 분석 결과를 해석하는 기준으로 삼았다. 연어의 사용 양상과 관련된 변인으로는, 연어의 광범위한 사용 정도와 관련된 연어 밀도, 다양성 비율과 함께, 각 연어 항목의 사용 강도와 관련된 반복률, 연합강도를 측정하여 해당 텍스트에서 연어의 분포적 특징을 분석하였으며, 언어적 변인으로는, 명사를 핵어로, 동사, 형용사, 명사 연어와 결합하는 동사 결합형 명사 연어(VNC), 형용사 결합형 명사 연어(ANC), 명사 결합형 명사 연어(NNC)의 세 가지 유형을 분석하였다.
먼저, 교과서에서 텍스트 내 연어의 양을 나타내는 상대적 비율인 연어 밀도를 측정한 결과, 교과서에서 원어민보다 VNC, ANC가 유의미하게 높은 밀도를 보이며 내 비교적 많은 수의 연어가 제시되고 있었다. 다음으로, 서로 다른 연어 항목의 유형 수를 나타내는 다양성 비율을 분석한 결과, 교과서 지문이 텍스트 크기에 비해 높은 수준의 VNC와 ANC 다양성 비율을 보이며, 비교적 많은 종류의 연어를 제시하였다. 이는 연어 유형의 개수 대비 사용된 전체 연어 개수의 비율인 반복률을 낮추는 결과로 이어졌다. 즉, 높은 강도의 반복을 통해 정형화된 언어로서의 특징을 보이는 원어민 자료에 비해, 교과서 텍스트 내에서 VNC와 ANC가 반복되는 정도가 낮았다. 마지막으로 결합 강도를 분석한 결과, 교과서에서 사용된 연어들이 보다 강한 결합력을 지니며 확률적으로 공기할 가능성이 높은 조합에 집중되어 있음을 보였다. 즉, 오히려 다소 낮은 결합력을 지닌 연어들까지 다수 분포되어 있는 원어민 참조 코퍼스에 비해, 교과서 텍스트의 연어 사용은 높은 결합력을 지닌 조합에 편향되어 다양한 수준의 연어적 결합 관계를 제시하는 데 한계를 보였다. 또한, 각 연어의 결합 강도와 사용 빈도 간 상관분석에서는, 교과서에서 연어의 사용빈도는 그 결합력에 비례하는 정도가 원어민 데이터보다 낮았다. 즉, 교과서에서 각 연어가 제시되는 빈도는 그 결합 수준에 대해 상당히 낮은 예측력을 지니며, 이는 학습자들이 목표 연어에 노출된 횟수나 친숙도로 결합력을 예측하기 어려울 수 있음을 예상할 수 있다. 또한 결합력과 빈도 수준 간의 불일치로 인해 높은 결합력을 지닌 연어들이 이에 상응하는 빈도로 충분히 반복 제시되지 못해 학습 효율이 낮을 것으로 보였다.
다음으로 한국인 대학생 학습자 코퍼스에서 사용된 연어의 분포를 분석한 결과, VNC와 ANC는 텍스트 길이에 비해 높은 빈도로, NNC는 낮은 빈도로 사용되었다. 즉, 학습자도 전반적으로 연어를 광범위하게 사용하는 경향이 있으나, 특정한 하위 유형에 대해서는 낮은 사용 빈도가 관찰되었다. 연어 다양성의 경우, VNC와 ANC는 텍스트 길이에 비해 사용된 다양한 연어 유형을 사용하고 있으나, NNC의 다양성은 낮은 것으로 나타났다. 연어 결합의 평균적인 강도는 학습자 텍스트에서 원어민 참조 코퍼스보다 높게 나타났다. 즉, 강한 결합력을 지닌 연어들은 원어민에 상응하는 수준으로 사용하는 반면에, 결합 강도가 다소 낮은 연어들은 사용하지 않는 경향을 보였다. 이는 강한 결합력을 지닌 조합에 한정된 학습자의 제한된 연어 지식을 나태내는 동시에, 중간 정도의 결합 강도를 지닌 연어는 쉽게 예측이 어렵고 평소 언어 입력을 통해 노출될 가능성이 적어 학습자가 어려워한다는 연구 결과를 뒷받침한다. 또한 사용 빈도와 결합력 간 낮은 상관은 학습자 또한 원어민보다 연합강도에 대한 인식이 부족할 수 있음을 시사하였다.
본 연구는 교과서와 학습자영어 글쓰기 코퍼스에 나타난 연어 양상에 의거하여 다음과 같은 교육적 시사점을 제공한다. 먼저, 양적으로 광범위한 연어 항목의 제시가 반드시 효과적이지 않을 수 있다. 원어민의 코퍼스 데이터에서는 연어의 반복률이 높은 것으로 드러났으며, 이는 정형화된 표현으로서의 연어의 본질적, 분포적 특성을 영어 교과서나 교수 학습자료를 통해 구현할 필요가 있음을 시사한다. 두 번째로, 학습자나 교과서 또한 강한 결합 수준을 지닌 연어에 집중된 반면, 원어민 화자는 오히려 중-저 수준의 다소 약한 결합력을 지닌 연어를 많이 사용한다는 것을 고려하여, 보다 넓은 범위의 결합강도를 지닌 연어를 골고루 지도해야 함을 알 수 있다. 마지막으로, 교과서에서 각 연어를 제시하는 빈도와 결합력의 상관을 높임으로써, 연어 결합력에 대한 감각을 높일 수 있는 방안을 제안하고자 한다.
Collocation, the habitual word association, has been thought of as a large and significant component of native speakers language production. As with its pervasiveness in natural English, the idiomaticity of collocation explains its usefulness as a readily available word sequence. Referred to as semi-preconstructed phrases that constitute single choice (Sinclair, 1991, p. 110), collocation is known to have a pivotal role in achieving native-like fluency, to which native speakers develop their sensitivity through extensive and intensive exposures to language input.
EFL learners, however, often face challenges with this lexical category, due to a lack of exposure to authentic collocations. And yet very little is known how collocations are represented in the major source of language input in the EFL classrooms. Thus, there is a need to understand various aspects of collocation use in the English learning materials, especially in the curriculum-based English textbooks used in most of the Korean EFL English classes. Moreover, much uncertainty still exists about how Korean EFL students would use collocations after years of English learning through textbooks. Therefore, the present study will explore the collocation use in the middle and high school English textbook and Korean EFL college learners writings.
Employing the Firthian notion of collocation, the present study identifies collocations based on the statistical measure and has investigated the use of collocations in the middle and high school English textbook and Korean EFL college learner writing corpora regarding four distributional patterns; collocation density, diversity, repetition rate, and association strength. Furthermore, in order to complement a single-word level wordlist based on the 2015 National English Curriculum in Korea, 1,718 words from the newly revised curriculum wordlist were used as head nouns. Also, three types of collocation were specified as a target of analysis; verb-noun collocation (VNC), noun-noun collocation (NNC), and adjective-noun collocation (ANC).
First, collocation use in the textbook corpus was examined. As for collocation density, the result shows that the textbook corpus presents a significantly larger body of VNCs and ANCs than in the reference corpus, indicating that Korean learners would be exposed to a relatively higher proportion of collocational input from the textbook materials. No significant difference was found in the use of NNCs. Second, the analysis of collocation diversity reveals that in textbook materials, more variety of collocation repertoire is presented given the text length; the diversity rate gives higher marks for VNCs and ANCs in the textbook corpus than in native baseline, while showing no significant difference for NNCs. The higher collocation density and diversity of VNCs and ANCs together can be seen as the extensive collocation use in language input. Next, all three subtypes are found to be markedly less repetitive in textbook materials than in the reference corpus. While collocations are highly recurrent phenomena in the native corpus, the textbook materials tend to introduce a larger body of diverse items without due repetition, compromising the collocational formulaicity. Lastly, while the estimated association strength of collocations in the target corpus is found to be generally higher, collocations at low-mid level association strength are relatively scarce in comparison to native reference data. Furthermore, a correlation between association measure and frequency level of individual collocations in the target corpus is weaker than in the reference corpus. This result indicates that in the textbook materials, the frequency of co-occurrence is far less predictive of the association strength, and thus learners are not likely to benefit from frequency effects that would help them to distinguish between a wide range of associative strengths or to consolidate memory traces of stronger associations.
Regarding the second major research question, the present study examines Korean EFL college learners writings. In learners production, VNCs and ANCs occur more frequently than in the reference corpus. Exceptional is the density of NNCs, which have shown a significantly lower density in the learner corpus. When it comes to collocation diversity, learner writing presents a larger number of collocation types with VNCs and ANCs, but not with NNCs. From the result, heavier reliance on VNCs and ANCs and the contrastingly underrepresented NNCs are hypothesized as a distinctive pattern of non-native-like collocation use. The third variable, the repetition, has shown that the repetition rate of VNCs and ANCs is markedly lower, and that of NNCs higher in the learner writings than those in the reference corpus. Lastly, when examining association strength, learner writings have shown significantly higher association scores than the reference corpus does. The result indicates that learners collocation repertoire may be limited to more typical and likely associations, falling short of the knowledge of the less predictable associations at low-mid level strength. Furthermore, a weaker correlation between association measure and frequency level of individual collocations in the learner corpus suggests that learners use of collocation only weakly correspond to the association strength, and the distributional patterns of collocation use in learner writings may deviate from that in the native data.
These findings provide meaningful implications for collocation learning in the Korean EFL context. First, the present study supports the view of more is less in that the intensity of collocation use, the formulaic nature of repeated co-occurrence, may have been compromised by the extensive coverage of a larger number of collocations in the current Korean textbook materials. To represent authentic collocational distribution, it is thus recommended to increase the number of repetitions given to each lexical combination. Next, the current data also suggest that learners' sensitivity to a collocational relationship could be fostered if there is more correspondence between the level of co-occurrence frequency of collocational input and the association strength. Furthermore, pedagogical attention is called for to address learners restrictive collocational repertoire which we found to be highly limited to stronger associations. Lastly, there is a definite need for differentiated instructions on specific subtypes which could be particularly challenging for learners (ie., NNCs).
Language
eng
URI
http://dcollection.snu.ac.kr/common/orgView/000000159520
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share