Publications
Detailed Information
LDA를 이용한 의료정보 연구주제 트렌드분석 : 한국어
Cited 0 time in
Web of Science
Cited 0 time in Scopus
- Authors
- Advisor
- 최진욱
- Issue Date
- 2021
- Publisher
- 서울대학교 대학원
- Keywords
- 의료정보 연구주제 ; 토픽모델링 ; 토픽 트렌드분석 ; 텍스트마이닝 ; medical informatics ; topic modeling ; topic trend analysis ; LDA
- Description
- 학위논문(석사) -- 서울대학교대학원 : 의과대학 의학과, 2021.8. 이나리.
- Abstract
- 의료정보학은 생물의학 정보, 데이터, 지식의 저장과 검색 및 활용을 다루는
과학이며, 컴퓨터 응용 프로그램을 사용하여 의료와 관련된 데이터를 분석하는
학문이다. 의료정보학의 분야로는 HIS implementation, clinical outcome
research, concept, terminology, data sharing, CDSS 등이 있다. 본 연구에서는
의료정보학의 연구 주제가 각 병원의 EMR 도입 일반화, 빅데이터나 인공지능
기술의 발전 같은 시대의 변화에 따라 어떻게 바뀌는지 알고자 하였다.
실험을 위하여 의료정보학에 관련된 학술지를 선택하여, 2006년에서 2020년
까지 15년간 해당 학술지에 게재된 연구 논문들의 발간년도, 제목, 영문초록을
논문별로 수집하였다. 선택한 학술지는 Journal of the American Medical
Informatics Association(JAMIA), International Journal of Medical
Informatics(IJMI) 이었다. JAMIA에서 2,387편의 논문, IJMI에서 1,988편의 논
문을 수집하였다. 시대별 주제변화의 분석을 위해 토픽모델링 LDA 기법을 활
용하여 연구 주제 트렌드를 파악하였다. 또는 IDM 시각화를 이용하여 새롭게
나타나는 주제를 분석하였다.
우선주요 키워드 변화를 통하여 토픽트렌드를 분석하였다. 토픽트렌드는 시
간의 흐름에 따라 연구자들이 어떤 주제로 의료정보학 관련된 학술지에 논문을
게재하였는지를 분석하는 것을 의미한다. 이를 통하여 게재된 논문들의 주요 주
제들의 변화 추이와 지속성을 파악할 수 있다. 토픽의 주제를 이루는 자주 등장
하는 주요 키워드들은 health, data, system, EHR, clinical, patient, model, care,
information 또는 study 등이었다. JAMIA에서는 hospital information system,
information system 과 같은 용어의 등장이 점차 줄어들었으며 IJMI에서는
patient data, health study 과 같은 용어의 등장이 증가하였다.
다음으로는 분석한 결과를 통하여 매년 새롭게 나타나는 주제를 파악하였다.
해당하는 토픽이 존재하는 주요 키워드를 중심으로 토픽의 주제를 정하였다. 특
히 2020년도의 분석 결과에서는 JAMIA나 IJMI에서 모두 세계적 이슈가 되고
있는 COVID와 telehealth에 관련된 키워드들이 나타났다.
이처럼 의료정보학의 연구 주제는 중심 연구 주제들이 있고, 매년 새롭게 나
타나는 연구 주제는 시간의 흐름에 따라 달라지고 있는 것을 본 연구를 통해
확인할 수 있었다.
본 연구에서 제시된 분석기법 및 처리 과정은 의료정보학 학술지의 연구논문
주제 분석 외에 다른 분야에도 적용 가능하며 의료정보 관련기사 및 SNS 데이
터를 대상으로 텍스트마이닝과 토픽 모델링의 적용을 통해 의료정보학의 일반
적 관심 동향을 관찰하는 데에도 유용하게 활용될 수 있을 것이다.
Medical informatics is the field of science that deals with the storage,
retrieval, and utilization of biomedical information, data, and knowledge, and
the analysis of healthcare-related data using computer applications. The
subfields of medical informatics include the implementation of hospital
information systems (HIS), clinical outcome research, concept, terminology,
data sharing, and clinical decision support systems (CDSS). This study
attempts to understand how research topics in medical informatics have
changed as electronic medical records (EMRs) have been introduced to most
hospitals and big data/artificial intelligence technologies have developed
recently.
We selected two academic journals related to medical informatics and
collected the year of publication, title, and English abstract of research
papers published in these journals between 2006 and 2020. The selected
journals were the Journal of the American Medical Informatics Association
(JAMIA) and International Journal of Medical Informatics (IJMI). We
collected 2,387 papers from JAMIA and 1,988 papers from IJMI and used the
latent dirichlet allocation (LDA) for topic modeling to analyze the change in
research topics through the years and identify trends in study topics. We
also used the interoptic distance map (IDM) visualization to analyze newly
emerging topics.
First, we identified topic trends through changes in major keywords.
Topic trends are used to identify the topics of research papers published in
academic journals over the years. With topic trends we can examine the
shift in major topics and their consistency. The most frequently used
keywords included health, data, system, electronic health records (EHR),
clinical, patient, model, care, information, and study. In JAMIA the use of
the terms hospital information system and information system has gradually
decreased and in IJMI the use of keywords such as patient data and health
study has increased.
Next, based on the above analysis we identified topics that were newly
introduced each year. We determined the themes of topics based on the
main keywords of topics. According to our analysis keywords related to
global issues such as COVID-19 and telehealth emerged in 2020.
This paper proves the existence of major research topics in medical
informatics and the change in new topics emerging each year.
The analytical method and processing procedures can be applied to the
analysis of research topics in other fields of studies other than medical
informatics and can be utilized to observe the trends in the general interests
of medical informatics by applying text mining and topic modeling to news
reports and social media data related to health information.
- Language
- kor
- Files in This Item:
- Appears in Collections:
Item View & Download Count
Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.