빅데이터를 활용한 자유학기제 정책의 키워드 및 토픽 분석

사범대학 교육학과(교육학전공)
서울대학교 대학원
학위논문 (박사)-- 서울대학교 대학원 : 사범대학 교육학과(교육학전공), 2019. 2. 백순근.
Free Semester Policy is the educational policy aimed to provide opportunities for students to seek their dreams and potential during one semester in middle school based on student-centered teaching method in the class and various participatory activities, without the burden of examination (Ministry of Education, 2013). After initially introduced in 2013 and fully implemented in all middle schools in 2016, Free Semester Policy has a great influence not only on the middle school curriculum but also on the overall public education system in Korea.

As the free semester emphasizes the autonomy of school education and student-centered activities, it is of great importance to raise awareness and understanding of the policy among stakeholders such as teachers, parents, and community members. Since the policy was suggested as a presidential campaign promise in 2012, and has been formed step by step based on social discussion through various media, it is necessary to analyze keywords and topics from various media, according to the phases of the policy process (policy preparation, pilot operation, full implementation, policy extension), in order to diagnose and improve the policy properly.

The purpose of this study is to analyze keywords and topics of Free Semester Policy using the news articles, press releases from the Ministry of Education (MOE), and abstracts of journals regarding the free semester. Major research questions are as follows.

First, what are the keywords of free semester policy in the news articles, the Ministry of Education press releases, and the journal abstracts, and have they changed with the policy phases?

Second, what are the topics of free semester policy in the news articles, the Ministry of Education press releases, and the journal abstracts, and have they changed with the policy phases?

In order to solve these research questions, 20,189 news articles, 295 press releases from the MOE, and 301 journal abstracts published from January 2013 to June 2018 were collected. News articles were collected from NAVER and Daum website using web-scraping techniques with Python, and press releases of the MOE were downloaded from the MOE website. Journal abstracts were collected using the bibliography export tools provided by the Research Information Sharing Service and the DBPia website of Nuri Media. After conducting preprocessing and morphological analysis for each document, keyword frequency analysis, keyword network analysis, and structural topic model (STM) analysis were performed for each policy phase, as well as for all periods. The main results are as follows.

First, according to the word frequency (TF), career, practicum, and program were relatively emphasized in all media. In the case of the word frequency-inverse document frequency (TF-IDF), career was emphasized in all media. Also, keywords regarding the memorandum of understanding between related organizations were emphasized, such as the office of education in the news articles and university in the MOE press releases. In the journal abstracts, keywords related to class activities such as subject matter were emphasized.

Second, according to the result of the weighted keyword network analysis based on the TF-IDF keywords, career has the highest degree centrality and closeness centrality in the news articles as well as in the MOE press releases for all periods, forming a community with practicum, program and job in the news articles, and with practicum, university, and business agreement in the MOE press releases. In the journal abstracts, career and subject matter were emphasized with relatively higher degree centrality and closeness centrality. The career formed a community with program, practicum, and development, while subject matter formed other community with class, teacher, and activity.

Third, according to the result of STM analysis, 10 topics were extracted from the news articles: ① Career practicum (16.9%), ② Industry-Academia-Government-Research cooperation (11.9%), ③ Cultural arts program (10.9%), ④ Support from the Education Office (10.7%), ⑤ Curriculum activity (9.9%), ⑥ Teacher training (9.8%), ⑦ Expansion of infrastructure (8.2%), ⑧ Education reform (7.6%), ⑨ Election pledge (7.2%) and ⑩ Private tutoring for entrance examination (7.1%). There were positive correlations between Career practicum and Industry-Academia-Government-Research cooperation (.039), Cultural arts program and Expansion of infrastructure (.011), Election pledge and Education reform (.013), and Election pledge and Private tutoring for entrance examination (.015). In terms of policy phases, the topic prevalence of Career practicum, Industry-Academia-Government-Research cooperation, and Cultural arts program generally increased with the progress of the policy phase, whereas the prevalence of Curriculum activity decreased.

Fourth, 8 topics were extracted from the MOE press releases: ① Career practicum (17.7%), ② Industry-Academia-Government-Research cooperation (17.6%), ③ Policy promotion (15.2%), ④ Private tutoring for entrance examination (15.0%), ⑤ Expansion of infrastructure (9.7%), ⑥ Curriculum activity (9.3%), ⑦ Linkage with the national curriculum (8.2%), and ⑧ Linkage with other educational policy (7.3%). During all phases, the prevalence of Career practicum was the highest, though it decreased after the third year of pilot operation, while the prevalence of Curricular activity increased slightly after the third year of pilot operation.

Fifth, 7 topics were extracted from the journal abstracts: ① Curriculum activity (16.9%), ② Career practicum (16.7%), ③ Development of educational programs (15.8%), ④ Policy analysis (13.4%), ⑤ Expansion of infrastructure (12.8%), ⑥ Student evaluation (12.8%), ⑦ Cultural arts program (11.6%). In particular, Career practicum showed the highest prevalence in the policy preparation and the first year of the pilot operation, but it decreased continuously in the following phases. Meanwhile, the prevalence of Curriculum activity and Student evaluations increased steadily after the third year of the pilot operation.

This study is meaningful in that it analyzed the keywords and topics of Free Semester Policy by policy phases using big data analysis technique, to diagnose the policy and propose the direction of improvement. Also, this study confirmed the usefulness of big data analysis for educational policy evaluation. The big data analysis techniques used in this study can be applied in various education policy evaluation studies, and it is necessary to develop the techniques more precisely through follow-up studies. In addition, more comprehensive research needs to be carried out, including an analysis of the performance aspects on Free Semester Policy, such as the enhancement of the core competencies of students.
자유학기제는 중학교 과정 중 한 학기 동안 학생들이 시험 부담에서 벗어나 꿈과 끼를 찾을 수 있도록 토론이나 실습 등 학생 참여형으로 수업을 개선하고, 진로탐색 활동 등 다양한 체험 활동이 가능하도록 교육과정을 유연하게 운영하는 제도이다(교육부, 2013). 자유학기제는 2013년에 도입된 후 2016년부터 모든 중학교에서 전면적으로 시행되고 있으며, 중학교 한 학기를 넘어 여러 학기 혹은 다른 학교급과 연계되어 우리나라 교육 전반에 큰 영향을 미치고 있다.

학교교육 현장의 자율성과 학생중심의 체험활동을 강조하는 자유학기제가 본래의 취지대로 운영되기 위해서는 교사나 학부모 등 이해당사자들의 이해도 제고와 공감대 형성이 매우 중요하다. 자유학기제는 2012년 대통령 선거 교육공약으로 제시된 후 다양한 매체를 통한 사회적인 논의를 토대로 단계적으로 형성되고 시행되었으므로, 해당 정책을 제대로 진단하고 개선 방향을 찾기 위해서는 정책단계별(정책준비기, 시범운영기, 전면시행기, 정책확장기)로 다양한 매체에서 나타난 키워드 및 토픽을 분석하는 것이 필요하다.

이 연구는 언론기사와 교육부 보도자료, 학술지 초록을 활용하여 자유학기제 정책의 키워드 및 토픽을 분석하기 위한 것이며, 주요 연구 문제는 다음과 같다.

첫째, 자유학기제에 대한 언론기사, 교육부 보도자료, 학술지 초록의 키워드는 무엇이며, 정책단계별로 변화하였는가?

둘째, 자유학기제에 대한 언론기사, 교육부 보도자료, 학술지 초록의 토픽은 무엇이며, 정책단계별로 변화하였는가?

분석 대상은 2013년 1월부터 2018년 6월까지 발행된 언론기사 20,189건, 교육부 보도자료 295건, 학술지 초록 301건이었다. 언론기사는 네이버(NAVER)와 다음(Daum)의 뉴스 홈페이지에서 웹스크래핑 기법을 활용하여 수집하였으며, 교육부 보도자료는 교육부 홈페이지에 게재된 파일을 다운로드하였다. 학술지 초록은 학술연구정보서비스와 누리미디어 DBpia 웹사이트에서 제공하는 서지반출 기능을 활용하여 수집하였다. 각 문서들에 대하여 전처리와 형태소 분석을 실시한 이후, 정책단계별로 키워드 빈도 및 네트워크 분석과 구조적 토픽 모형(STM) 분석을 실시하였다. 주요 연구 결과는 다음과 같다.

첫째, 키워드 분석 결과 단어 빈도(TF) 기준에서는 모든 매체에서 진로, 체험, 프로그램이 상대적으로 강조되었다. 단어 빈도-역문서 빈도(TF-IDF) 기준에서도 모든 매체에서 진로가 강조되었으며, 언론기사에서는 교육청이, 교육부 보도자료에서는 대학이 상위 키워드로 나타나는 등 유관기관간의 업무협약에 대한 키워드가 강조되었다. 학술지 초록에서는 교과 등 수업활동과 관련된 키워드가 강조되었다.

둘째, TF-IDF 기준의 키워드를 중심으로 가중 키워드 네트워크를 분석한 결과, 전체 기간 동안 언론기사와 교육부 보도자료에서 진로가 연결중심성과 근접중심성이 가장 높았으며, 언론기사에서는 체험, 프로그램, 직업 등과 커뮤니티를 형성하고, 교육부 보도자료에서는 체험, 대학, 업무협약 등과 커뮤니티를 형성하는 것으로 나타났다. 학술지 초록에서는 진로와 더불어 교과가 연결중심성과 근접중심성이 높았으며, 진로는 프로그램, 체험, 개발 등과, 교과는 수업, 교원, 활동 등과 커뮤니티를 형성하였다.

셋째, STM 분석 결과, 언론기사에서는 총 10개 토픽(① 진로체험(16.9%), ② 산학관연 협력(11.9%), ③ 문화예술 프로그램(10.9%), ④ 시도교육청 지원(10.7%), ⑤ 교과활동(9.9%), ⑥ 교원연수(9.8%), ⑦ 체험처 확대(8.2%), ⑧ 교육개혁(7.6%), ⑨ 선거공약(7.2%), ⑩ 입시 사교육(7.1%))이 추출되었다. 토픽 간의 상관구조를 분석한 결과, 진로체험-산학관연 협력(.039), 문화예술 프로그램-체험처 확대(.011), 선거공약-교육개혁(.013), 선거공약-입시 사교육(.015)간에 정적 상관이 있었다. 정책단계별로는 진로체험과 산학관연 협력, 문화예술 프로그램의 출현율이 정책단계의 진척에 따라 대체로 증가한 반면, 교과활동의 출현율은 감소하였다.

넷째, 교육부 보도자료에서는 총 8개 토픽(① 진로체험(17.7%), ② 산학관연 협력(17.6%), ③ 정책홍보(15.2%), ④ 입시 사교육(15.0%), ⑤ 체험처 확대(9.7%), ⑥ 교과활동(9.3%), ⑦ 국가교육과정 연계(8.2%), ⑧ 교육정책 간 연계(7.3%))이 추출되었다. 전체 기간 동안 진로체험의 토픽 출현율이 가장 높았으나, 정책단계별로 살펴보면 시범운영 3차년도 이후부터 진로체험의 출현율은 감소하고 교과활동의 출현율은 다소 증가하였다.

다섯째, 학술지 초록에서는 총 7개 토픽(① 교과활동(16.9%), ② 진로체험(16.7%), ③ 교육프로그램 개발(15.8%), ④ 정책 분석(13.4%), ⑤ 체험처 확대(12.8%), ⑥ 학생평가(12.8%), ⑦ 문화예술 프로그램(11.6%))이 추출되었다. 특히 진로체험은 정책준비기 및 시범운영 1차년도에 토픽 출현율이 가장 높았으나 이후 지속적으로 감소하였고, 시범운영 3차년도 이후부터 교과활동과 학생평가의 출현율이 지속적으로 증가하였다.

이 연구는 빅데이터 분석 기법을 활용하여 정책단계별로 자유학기제 정책의 키워드와 토픽을 분석함으로써 해당 정책을 진단하고 개선 방향을 제안하였으며, 교육정책평가를 위한 빅데이터 분석의 유용성을 확인하였다는 데 의의가 있다. 이 연구에서 활용한 빅데이터 분석 기법은 다양한 교육정책평가 연구에서 적용될 수 있을 것이며, 후속연구를 통해 분석 기법을 더욱 정교하게 발전시킬 필요가 있다. 아울러 자유학기제에 대한 보다 종합적인 평가를 위해, 향후 학생의 핵심역량증진 등 해당 정책의 성과에 대한 분석을 포함한 종합적인 연구가 수행될 필요가 있다.
College of Education (사범대학)Dept. of Education (교육학과)
