
Detailed Information

중학교 영어 학습 부진 학생의 읽기 유창성 향상을 위한 AI기반 영어 소리 내어 읽기(reading-aloud) 텍스트 개발 : Development of AI-Based Reading Materials for Enhancing Reading Fluency in Underachieving Middle School English Learners through Reading-Aloud Activities

Cited 0 time in Web of Science Cited 0 time in Scopus


Issue Date
서울대학교 대학원
학습 부진기초 학력 지도읽기 유창성AI 활용 교육자연어 처리
학위논문(석사) -- 서울대학교대학원 : 사범대학 AI융합교육학과, 2023. 8. 김선희.
본 연구는 AI 기술을 활용하여 학습에 어려움을 겪는 학습 부진 학생들의 영어 읽기 능력 향상을 돕기 위한 읽기 자료 제작을 목표로 한다. 2015년 개정 교육과정의 초등학교 6학년과 중학교 1학년의 영어 교과서 읽기 본문을 대상으로 하여 자연어 처리 기법과 생성형 AI 엔진을 활용하여 학습 부진 학생들의 소리 내어 글 읽기 활동에 활용할 수 있는 최소대립쌍과 문장 읽기 자료를 생성했다.
개발된 텍스트에 대한 타당성 검토를 위하여 읽기 자료 개발 과정, 기준, 결과물은 영어교육, AI융합 교육, 자연어 처리에 전문성이 있는 현장 교사 전문가 6인의 전문가 검토를 거쳤다. 총 두 차례 전문가의 검토 의견을 반영하여 최종 텍스트를 개발했다. 개발된 읽기 자료 결과물은 학교 현장에서 쉽게 사용할 수 있는 Reading Progress와 같은 AI기반 읽기 학습용 프로그램에 곧바로 활용할 수 있는 형태로 제작하였다.
구체적인 읽기 자료 개발 단계는 다음과 같다. 첫째, 코퍼스 생성을 위해 연구 대상 텍스트 전체를 하나의 문서로 통합했다. 둘째, 자연어 처리 기술을 활용해 통합된 텍스트에서 주요 어휘 1,500개를 빈도 기반으로 추출하고, 실생활 빈도와 교육과정 내의 빈도, 음절 수, 읽기 난이도 등을 수치화하여 데이터프레임을 생성했다. 셋째, 수치화된 난이도 데이터를 바탕으로 생성형 AI를 활용하여 주요 단어의 최소대립쌍과 주요 단어를 활용한 짧은 문장을 생성하고, 읽기 난이도별로 문장을 분류하였다.

최종 개발된 최소대립쌍은 전체 텍스트에서 산출한 빈도가 높은 1,500개 단어 중 난이도 분류에서 아주 낮은 난이도 59개, 낮은 난이도 99개의 단어를 기준으로 생성되었다. 최종 개발된 최소대립쌍은 20개 음소에 대하여 총 288개이며, 최종 개발된 문장은 중복을 제외하고 총 112문장으로, 하 수준 44개, 중 수준 58개, 상 수준 10개로 이루어져 있다.
본 연구는 학습 부진 학생의 읽기 학습자료를 현행 교과서 읽기 지문에 포함된 단어들의 교과서 내 출현 빈도, 단어의 음절 수, 음절 결합 형태, 음소 구성에 근거하여 개발하였다는 점에서 의의를 가진다. 또한 결과물은 AI 기반 학습 프로그램을 활용하여 중학교 학습 부진 학생을 지도할 때 유용하게 활용할 수 있다는 점, 개발된 코드에 다른 코퍼스를 활용하여 유사한 결과물을 생성할 수 있다는 점에서 현장에 도움을 줄 수 있다.
그러나 문장 난이도 산출시 활용한 음소 기반 분석 도구는 문장 단위에서의 연음이나 억양 등을 고려하지 못한다는 점, 생성형 AI 엔진의 기술적 한계로 인하여 다양한 문장을 생성하지 못했다는 한계점을 가진다. 이러한 한계점에도 불구하고, 본 연구의 자연어 처리 기법, 생성형 AI를 활용한 학습자료 개발 시도는 현장 교사들에게 AI 활용 수업 자료 개발 과정을 참고할 수 있는 사례로 기능할 것으로 기대한다.
The aim of this study is to use AI technology to develop reading materials designed to assist struggling students in enhancing their English reading proficiency. To achieve this, a corpus was developed from English reading texts of textbooks for sixth-grade elementary school and first-grade middle school students, based on the 2015 revised curriculum of Korea. Utilizing natural language processing techniques and a generative AI engine, minimal pairs and sentence reading materials were created for use in struggling students' reading aloud activities. The developed reading materials were formatted for immediate application in AI-based reading learning programs like Reading Progress, easily accessible in school settings.
The specific stages of reading material development include: First, the entire text under investigation was amalgamated into a single document to create a corpus. Natural language processing was then used to extract the top 1,500 words based on frequency from this unified text. These words were subsequently quantified according to real-life frequency, frequency within the curriculum, syllable count, and reading difficulty, resulting in a data frame. Second, using the quantified difficulty data, the generative AI created minimal pairs of the key words. Third, short sentences using the 1,500 key words were generated, duplicate sentences were eliminated, and the text was then classified by reading difficulty.
To ensure the validity of the developed text, the process, criteria, and results of reading material development underwent a review by six expert teachers specializing in English education, AI-integrated education, and natural language processing. The final text was developed by integrating expert feedback from two rounds of reviews.
The final minimal pairs were developed using 59 words classified as 'very low difficulty' and 99 words classified as 'low difficulty' from the 1,500 high-frequency words identified in the entire text.. A total of 288 minimal pairs were created for 20 phonemes, and after eliminating duplicates, 112 sentences were finalized, comprising 44 at a low level, 58 at an intermediate level, and 10 at a high level.
The significance of this study is rooted in the development of reading materials for struggling students, considering the frequency of word appearances in current textbook readings, the syllable count of words, syllable combinations, and phoneme compositions. Furthermore, the produced material can be effectively utilized for guiding underperforming middle school students using AI-based learning programs. The developed code can generate similar results using other corpora, thus providing practical assistance.
However, there are limitations. The phoneme-based analysis tool used for evaluating sentence difficulty fails to consider sentence-level phenomena such as liaison or intonation. Technical constraints of the generative AI engine also posed limitations in creating a wide variety of sentences.
Despite these limitations, this study's attempts to develop learning materials using natural language processing techniques and a generative AI can serve as a useful reference for educators in creating AI-enhanced instructional materials.
Future research is suggested to conduct field studies for confirming the effectiveness of these findings, generate longer sentences or paragraph-length texts, and develop an AI-assisted teaching model using the produced reading materials. It is anticipated that such endeavors will lead to the development of diverse materials that can assist in guiding students with various difficulties using AI.
Files in This Item:
Appears in Collections:


Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.
