Publications

Detailed Information

BERT 기반 언어 모델링을 활용한 북한 도발 징후 포착 : BERT-Based Catching Signs of Provocation of North Korea Using Language Modeling

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김동훈

Advisor
윤성로
Issue Date
2021-02
Publisher
서울대학교 대학원
Keywords
버트딥러닝텍스트 마이닝언어 모델자연어 처리북한 도발BERTDeep LearningText miningLanguage modelNLPProvocation of North Korea
Description
학위논문 (석사) -- 서울대학교 대학원 : 공학전문대학원 응용공학과, 2021. 2. 윤성로.
Abstract
북한은 6.25 전쟁 이후에도 대한민국의 안보와 국제사회를 위협하는 전략ㆍ전술적 도발을 끊임없이 자행해왔다. 이로 인해, 무수히 많은 국군 장병이 희생되었으며, 피해복구 비용과 외국 투자자본 이탈 등의 경제적 손실 또한 발생하였다. 하지만, 북한은 자신들의 이러한 도발 행위를 인정하지 않고 있음은 물론, 진정성 있는 사과 한번 제대로 하지 않고 있다. 우리 군은 언제 또 다시 기습적으로 발생할지 모르는 북한의 도발 위협으로부터 대한민국의 안보와 국민의 생명, 재산을 지키기 위해 다양한 정보감시 자산을 운용하여 북한의 특이 동향과 이상 징후를 식별하고 있으나, 모든 위협을 예측하고 대응하기에는 한계가 있는 것이 사실이다. 따라서 본 연구에서는 Digital Transformation에 발맞춰 북한의 도발을 예측하는데 있어 최신 딥러닝 기반 자연어 처리 모델인 BERT 모델을 활용하여 북한 도발과 관련된 텍스트 데이터로부터 북한의 도발 징후를 포착하는 모델을 제안하였다. 과거 북한 도발 사례 11건을 선정하고, 각 도발 발생일 이전 1개월간의 데이터와 도발이 발생하지 않았던 평시 데이터를 비교 학습한 후 학습 단계와 평가 단계의 정확도를 Fine-tuning을 통해 최적화하고, 새로운 임의의 문장을 모델에 대입해봄으로써 성능을 검증해보았다. 궁극적으로 정보감시 자산의 활용 외에 최신 과학기술을 적용하여 북한 도발 징후를 포착함으로써 우리 군의 감시능력 강화를 통해 아군의 피해를 최소화하고 전투에서 승리하는데 기여하고자 함이다.
After the Korean War, North Korea continued to perpetrate in strategic and tactical provocations that threatened the security of the Republic of Korea and international community. As a result, countless soldiers of the Korean Armed Forces were sacrificed, and economic losses such as withdrawal of foreign investment capital and damage recovery costs were also caused. Accordingly, the Republic of Korean armed forces is operating various intelligence surveillance assets to protect the security of the Republic of Korea and the lives and assets of the people from North Korean provocation threats, but it is true that there are some limitations in predicting and responding to all threats. Therefore, in this study, to predict North Korean provocation in line with Digital Transformation, we proposed a model that captures North Korean provocation symptoms from text data related to North Korean provocation by using the latest deep learning-based natural language processing model, BERT model. First, 11 cases of North Korean provocation were selected. Data for 1 month prior to each provocation occurrence date and peacetime data in which no provocation occurred were compared and learned. Through Fine tuning, the accuracy of learning and test stage was optimized, and the performance of the model was verified by substituting a new random sentence into the model. Ultimately, in addition to the use of intelligence surveillance assets, it is intended to contribute to minimizing damage to allies and contributing to victory in battles by enhancing the surveillance capability of the Republic of Korea armed forces by using the latest science and technology to detect provocation signs.
Language
kor
URI
https://hdl.handle.net/10371/176341

https://dcollection.snu.ac.kr/common/orgView/000000165119
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share