Browse

텍스트 분석을 이용한 코로나바이러스감염증 19 관련 이슈 분석 : 토픽 모델링, 동시 출현 단어, 감성 분석 방법을 중심으로
Issue analysis using text mining on COVID-19

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors
송성희
Advisor
민경복
Issue Date
2021
Publisher
서울대학교 대학원
Keywords
코로나19보건사회텍스트마이닝토픽모델링감성분석COVID-19public healthsocietytext-miningtopic modelingsentiment analysis
Description
학위논문(석사) -- 서울대학교대학원 : 의과대학 의학과, 2021.8. 민경복.
Abstract
코로나바이러스감염증-19 (코로나19)는 2019년 12월 중국 우한에서 처음 확인된 호흡기 감염질환이다. 코로나 바이러스와 관련하여 보건 의료 및 우리 사회 전반의 이슈를 파악하고자 본 연구를 수행하였다.
2020년 1월부터 2021년 3월까지 1년 3개월 동안 지식 정보 공유 포털 사이트에서 검색어 ‘코로나’를 키워드로 하는 질문 23,463건을 수집하였다. 수집한 문서에서 최소 의미 단위인 형태소로 분해하는 전처리 과정을 거친 후, 텍스트마이닝 방법을 통해 분석을 수행하였다. 형태소 단위로 추출한 단어의 빈도를 측정하여 ‘코로나’와 관련된 키워드의 중요도를 살펴보고 Latent Dirichlet Allocation (LDA) 방법을 통해 문서 내 키워드의 집합을 분석하고 8개의 주제를 추출하였다. 동시 출현 단어 분석을 통해 한 문서에 동시에 등장한 단어의 빈도를 측정하여 단어와 단어 사이의 연관성을 살펴보았으며 감성 분석을 통해 감염병에 대한 대중의 의견 또는 감정을 시간의 흐름에 따라 분석하였다.
‘코로나’와 관련된 주요 이슈로는 사회, 보건 의료, 법률 등으로 분류되었고 사회적 측면에서는 고용과 급여를 둘러싼 회사와 관련된 주제가 문서에서 가장 많은 비중을 차지하여 중요한 문제가 될 수 있음을 암시하였다. 보건 의료 측면에서는 코로나19의 의심 증상과 통증을 통해 감염 여부를 파악하는 것이 대중의 걱정이자 주요 관심사라고 볼 수 있다. 코로나19이 장기화되고 ‘감염법예방법’이 개정됨에 따라 관련 법률에 대해 대중의 관심이 있다는 것을 확인할 수 있다. 감성 분석을 통해 코로나19에 대한 대중의 전반적인 태도는 감염병 유행 초기일수록 부정적일 수 있음을 시사한다. 본 연구는 텍스트 마이닝 방법을 통한 탐색적 연구로 코로나19 데이터에 대한 신뢰성을 높이고 감염병 대응을 위한 활용 방안을 마련하기 위해서 뉴스 보도 및 논문 초록 등을 포함하여 다양한 자료원을 추가한 연구가 필요하다.
Coronavirus disease (COVID-19) is a pandemic. This study was conducted to identify issues related to coronavirus from public health perspective and social perspective. From January 2020 to March 2021, We have collected 23463 postings with the keyword "corona" in Knowledge Sharing Platform.
In this study, the collected postings were broken down into morphemes. After the preprocessing process, it was analyzed through a text mining method. Frequency was measured through word frequency analysis and topics were classified via Topic Modeling (LDA) method. We explore the interword associations through word network analysis. And the public's opinions or emotions were analyzed through sentiment analysis.
Major issues related to Corona are largely classified as social, public health, and other administrative issues. From a social perspective, it was confirmed that topics related to companies focused on employment and wages accounted for the largest portion of the documents and could be important issues. Identifying the infection through symptoms and pain is a major concern for people from a public health perspective. In-depth research is needed on the interests of people related to COVID-19.
Language
kor
URI
https://hdl.handle.net/10371/178369

https://dcollection.snu.ac.kr/common/orgView/000000166689
Files in This Item:
Appears in Collections:
College of Medicine/School of Medicine (의과대학/대학원)Dept. of Medicine (의학과)Theses (Master's Degree_의학과)
  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse