Publications

Detailed Information

Language classification of natural scene text image patches : 일반적인 문자 이미지의 언어분류

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

장필훈

Advisor
강명주
Issue Date
2021-02
Publisher
서울대학교 대학원
Keywords
deep learningoptical character detectioncharacter recognitionmulti-language image patch딥러닝문자인식문자검출다국어 이미지분류기영상처리
Description
학위논문 (박사) -- 서울대학교 대학원 : 자연과학대학 협동과정 계산과학전공, 2021. 2. 강명주.
Abstract
As other machine learning fields, there has been a lot of progress in text detection and recognition to obtain text information contained in images since the deep learning era. When multiple languages are mixed in the im- age, the process of recognition typically goes through a detection, language classification and recognition. This dissertation aims to classify languages of image patches which are the results of text detection. As far as we know, there are no prior research exactly targeting language classification of images. So we started from basic backbone networks that are used commonly in many other general object detection fields. With a ResNeSt-based network which is based on Resnet and automated pre-processing of ground-truth data to improve classification performance, we can achieve state of the art record of this task with a public benchmark dataset.
다른 기계학습분야와 마찬가지로, 이미지가 담고 있는 문자정보를 얻어 내려는 문자인식 분야에서도 딥러닝 이후 많은 진전이 있었다. 인식의 과정은 통상적으로 문자검출, 문자인식의 과정을 차례로 거치는데, 다수의 언어가 혼재할 경우 검출과 인식 사이에 언어분류 단계를 한번 더 거치는 것이 보통 이다. 본연구는문자검출이후의단계에서이미지패치들을각언어에따라 분류하는 것을 목표로 한다. 분류작업만을 전문적으로 다룬 선행연구가 없으 므로, 일반적인 객체검출에서 쓰이는 네트워크 중에서 적절한 것을 선택하고 응용하였다. ResNeSt를 기반으로한 네트워크와 자동화된 전처리 과정을 통해 공개된 벤치마크 데이터셋을 기준으로 가장 좋은 기록을 달성할 수 있었다.
Language
eng
URI
https://hdl.handle.net/10371/176119

https://dcollection.snu.ac.kr/common/orgView/000000164105
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share