Publications

Detailed Information

스마트폰으로 촬영된 알약 영상의 글자 및 형상 인식 방법 : Shape and Text Imprint Recognition of Pill Image Taken with a Smartphone

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김대욱

Advisor
이건우
Major
공과대학 기계항공공학부
Issue Date
2017-08
Publisher
서울대학교 대학원
Keywords
글자 인식딥 러닝알약 인식영상 검색영상 처리Zernike 모멘트
Description
학위논문 (석사)-- 서울대학교 대학원 공과대학 기계항공공학부, 2017. 8. 이건우.
Abstract
삶을 이롭게 하기 위해 수 많은 약들이 제조 · 판매되지만 이러한 약들은 오용되거나 남용될 경우 사람에게 치명적인 문제를 일으킬 수 있다. 인터넷과 스마트폰을 통해 알약을 검색하고 그에 대한 정보를 얻을 수 있으나, 모양과 색상, 글자를 직접 입력 해야하고 특수한 마커를 배경으로 사용해야하는 등 접근성이 낮다. 따라서 특수한 마커를 사용하지 않으면서도 알약 이미지로부터 글자 정보까지 획득할 필요가 있다.
본 논문에서는 스마트폰으로 촬영된 알약 영상에서 글자와 형상을 인식하는 방법을 제안한다. 알약이 포함된 영상에서 알약 영역을 특정 짓기 위해 Saliency Map을 이용한 뒤, 빛 효과와 그림자 효과를 제거한다. 이렇게 획득된 알약 영역에서 Zernike Moment를 통해 형상 정보를 얻는다. Gaussian Filter, Gradient Filter, Binarization을 통해 알약의 글자를 감싸는 박스를 추출하고, CNN Deep Learning을 통해 학습된 각인 글자 인식기를 사용하여 최종적인 글자 정보를 획득한다. 본 논문에서 제안하는 알고리즘을 테스트하기위해 NLM 데이터베이스의 알약 이미지 총 500개를 사용하였다. 또한, 1) Shape Matching Rate, 2) Text Box Detection Rate, 3) Character Recognition Rate, 4) Text Recognition Rate, 5) Recognition Success Rate로 총 5가지 항목에 대해 알고리즘을 평가하였다. 그 결과는 각각 75.5%, 87.5%, 0.786, 73%, 58.4%였으며, 기존의 알약 인식 알고리즘과 비교하였을 때, 상당히 개선된 결과를 얻었다.
Language
Korean
URI
https://hdl.handle.net/10371/137361
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share