텍스트마이닝을 이용한 경계선급 지적기능성 관련 국내외 보도 탐색 : Analysis of Domestic and International Online News Coverage on Borderline Intellectual Functioning Using Text Mining

Issue Date
서울대학교 대학원
경계선급 지적기능성지원정책언론보도 기사텍스트마이닝토픽 분석국내외 비교
학위논문(석사) -- 서울대학교대학원 : 사범대학 협동과정 특수교육전공, 2024. 2. 김동일.
본 연구의 목적은 국내에 관심과 인식이 높아진 경계선급 지적 기능성과 관련된 국내외 언론 기사를 분석하여 관련 정책과 사건, 사회적 인식을 살펴보고, 그 속에서 국내 경계선급 지적기능성의 지원방안을 탐색하는 것이다. 이에 텍스트마이닝의 상관분석과 토픽모델링 방법을 통해 뉴스 기사 키워드를 분석 및 비교하였다.
본 연구는 총 여섯 단계의 과정을 거쳤다. 첫째, 2003년부터 2023년 6월 30일까지 국내외 경계선급 지적기능성 키워드가 들어간 신문 기사의 본문을 수집하였다. 둘째, 중복된 기사, 기사가 아닌 자료, 주제어와 관련 없는 기사 등을 제외하는 자료 정제 과정을 거쳤다. 그 결과 국내 총 689건, 국외 총 853건의 기사가 추출되었다. 셋째, 단어를 기준으로 토큰화를 진행하고, 불용어 처리, 품사 처리, 어간 통일 등의 과정을 거친 뒤 글자 수가 2개 이상인 단어만 추출하였다. 넷째, 파이계수를 사용하여 국내외 경계선급 지적기능성과 관련된 단어와 상관이 높은 단어 쌍 10개를 추출하였다. 그 결과, 국내에서는 관련 키워드가 경계선지능과 느린학습자에서 비슷한 양상을 보이는 것으로 나타났으나, 국외의 경우, borderline intellectual functioning과 slow learner는 관련 키워드의 양상이 다르게 나타났다. 다섯째, LDA모형을 생성하고 적정 토픽 개수를 선정하여 토픽을 산출, 연도별 상위 토픽의 분포 변화와 주기별 변화를 확인하였다. 여섯째, 토픽 모델링 결과에 따른 토픽 명을 전문가 9인의 검토를 통해 선정하였다. 그 결과, 국내는 총 5개(공교육 외 기관(22.4%), 취약집단 지원(20.6%), 공교육(20.5%), 선별 및 관심(18.5%), 조례 등 정책(18.1%)), 국외는 총 6개(가해자 혹은 피해자(19%), 학교생활(17.8%), 학령기 학교 교육(16.6%), 성인기 생활(16.1%), 법적 쟁점(15.5%), 다양한 대중 매체(15%)) 토픽이 산출되었고 연도별, 주기별로 토픽 비중이 다르게 나타났다.
이상의 연구 결과를 바탕으로 국내의 경계선급 지적기능성 지원 방향에 필요한 향후 국내 정책의 방향성에 대한 시사점과 언론의 방향성을 국외와 비교하여 제안하였다. 본 연구는 지금까지 연구되지 않은 경계선급 지적기능성 관련 기사를 빅데이터 분석 방법을 활용하여 국내외 비교 분석을 시행하였고, 이를 기반으로 현존하는 지원정책의 발전 방안을 모색하였다는 의의를 지닌다.
This study aims to analyze domestic and international online news articles related to Borderline Intellectual Functioning (BIF), a topic of increasing interest and awareness in Korea. We examine relevant BIF policies, events, and societal perceptions, exploring support strategies for BIF in the Korean context. Through correlation analysis and topic modeling using text mining, news article keywords are analyzed and compared.
The study involves six main steps. First, articles containing keywords related to BIF from both domestic and international sources were collected from 2003 to June 30, 2023. Second, a data refinement process was undertaken to exclude duplicate articles, non-article sources, and irrelevant content, resulting in a total of 689 domestic and 853 international articles. Third, tokenization based on words, followed by processes such as stop-word removal, part-of-speech tagging, and lemmatization, were applied to extract words with a minimum length of 2 characters. Fourth, using the Phi coefficient, ten word pairs with high correlation to BIF were extracted for both domestic and international contexts. The analysis of Korean articles reveals that keywords associated with 'borderline intelligence' and 'slow learners' exhibit similar patterns, whereas in international articles, keywords related to 'borderline intellectual functioning' and 'slow learner' demonstrate unrelated patterns. Fifth, an LDA model was generated to produce topics, and after determining the appropriate number of topics, the distribution changes of the top topics across years were examined. Sixth, topic names based on the results of the topic modeling were selected through the review of nine experts. In Korea, a total of five topics were identified (non-educational institutions (22.4%), support for vulnerable groups (20.6%), public education (20.5%), screening and attention (18.5%), ordinances and policies (18.1%)), while in international contexts, six topics were identified (perpetrator or victim (19%) being the highest-weighted topic, followed by school life (17.8%), school education during school age (16.6%), adult life (16.1%), legal issues (15.5%), various mass media (15%)).
Based on the results mentioned above, this study proposes directions for media coverage and future domestic policies related to the BIF, drawing insights from a comparative analysis with international perspectives. Using big data analysis methods, this research conducted a comparative analysis of BIF-related articles that have not been previously analyzed, both domestically and internationally. The significance of this study lies in exploring the development directions of existing support policies based on the findings.
