Publications

Detailed Information

데이터 마이닝 기법을 이용한 건강보험 사기 탐지 : Fraud Detection in Health Insurance Using Data Mining Techniques

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

이민아

Advisor
조신섭
Major
자연과학대학 통계학과
Issue Date
2017-08
Publisher
서울대학교 대학원
Keywords
데이터 마이닝보험사기지도학습
Description
학위논문 (석사)-- 서울대학교 대학원 자연과학대학 통계학과, 2017. 8. 조신섭.
Abstract
본 논문에서는 근래에 문제 의식이 제기되고 있는 건강보험 사기를 통계적 모형에 기반하여 예측하려 한다. 이를 위해 첫째, 보험사가 보유하고 있는 고객 정보, 보험 계약 정보, 보험금 지급 정보, 보험 설계사 정보를 기반으로 하여 보험 사기자를 적발하는 데에 중요한 변수를 선택하고 특성생성(feature engineering)을 통해 예측력을 높일 수 있는 변수를 구성한다. 둘째, 구성된 변수에 의사결정나무(decision tree), 신경망 모형(neural network), 부스팅(boosting) 등의 데이터 마이닝 기법과 로지스틱 회귀분석(logistic regression)을 적용하여 보험 사기자를 예측하는 모형을 구축하고 셋째, 적용한 기법들 간의 예측력을 비교한다. 오분류율, ROC그래프, 리프트차트(Lift Chart)을 이용하여 기법들 간의 예측력 및 성능을 비교하였고 모형 중 가장 효과적으로 보험 사기를 적발할 수 있는 모형을 찾고자 하였다. 최종적으로 모형 간의 비교를 통해 선택된 모형은 부스팅(boosting) 모형으로 전체 오분류율 12.13%의 성능을 보여준다. 4개의 모형에서 공통적으로 중요도 상위 변수로 뽑힌 5 개의 변수 중 4 개의 변수가 특성 추출을 통해 새로 구성된 변수였으며 이렇게 선택된 변수들을 통해 보험 사기 현황에 대해 이해할 수 있다.
데이터 마이닝 기법 중에 보험 사기를 가장 잘 예측하는 모형을 찾고, 새로운 변수 구성을 통해 예측력을 높이는 변수를 찾은 데에 본 논문의 의의를 찾을 수 있다.
Language
Korean
URI
https://hdl.handle.net/10371/138093
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share