Publications

Detailed Information

Deep Learning Algorithms for Visual Inspection : 비전 검사를 위한 딥러닝 알고리즘

DC Field Value Language
dc.contributor.advisor윤성로-
dc.contributor.author장지용-
dc.date.accessioned2020-05-07T03:41:44Z-
dc.date.available2020-05-07T03:41:44Z-
dc.date.issued2020-
dc.identifier.other000000158758-
dc.identifier.urihttp://dcollection.snu.ac.kr/common/orgView/000000158758ko_KR
dc.description학위논문(석사)--서울대학교 대학원 :공과대학 전기·정보공학부,2020. 2. 윤성로.-
dc.description.abstractAutomated visual inspection is key to productivity in modern industry. Recently, advances of deep learning technology have brought various data-driven methods to visual inspection and outperform previous rule-based image processing approaches. However, the application of deep learning to visual inspection tasks is hampered by the scarcity of images of defective components, because defects are rare in modern manufacturing, and by a general lack of labeled images, because labeling is expensive. These limitations of data restrict the use of classifiers in visual inspection. In this paper, we propose two novel algorithms of anomaly detection and semi-supervised learning, which are highly related to handling these data limitations in deep learning.
First, we introduce a cross-reconstruction based autoencoder (CRAE) to disentangle image features for anomaly detection. An autoencoder learns the latent features of data through reconstructing new data from those features. In anomaly detection, these latent features for reconstruction can also be used for classification, but it is necessary to separate the features which represent attributes shared by a class of data from those which represent variations within that class for finding better latent representations of class determination. Given a pair of images from the normal class, CRAE encodes shared and variation features from each image, switches the variation features between the pair, and reconstructs the images. It then encodes the reconstructed images again to find their latent features, and uses the similarity of their shared features to identify anomalies. CRAE outperformed other classifiers in anomaly detection using the MVTec AD dataset of technical images. It also achieved AUROCs of 0.927 for Fashion-MNIST and 0.666 for CIFAR-10 image datasets, which are better than other state-of-the-art autoencoder based methods.
Second, we introduce feature concentration, in which features from annotated images of defective and normal components are separated in feature space by moving them towards cluster centers. We apply feature concentration to consistency regularization in semi-supervised classification, in which only a small proportion of the data is annotated. Results were compared with those from existing approaches for unbalanced and semi-supervised data, using images obtained during inspection of a smartphone component. In a supervised setting, average accuracy increased by around 5%, and in a semi-supervised setting, the improvement varied between 7% and 11%, depending on the supervision ratio. We also applied feature concentration to more general public datasets, where it again outperformed the other methods.
-
dc.description.abstract비전 검사는 산업 현장의 생산성을 높이는데 중요한 역할을 하는 공정으로 이를 자동화하고자 하는 노력이 지속적으로 이루어지고 있다. 최근 딥러닝 기술의 발전에 따라 다양한 종류의 데이터 기반 비전 검사가 연구되고 기존의 룰 기반 방법을 대체하고 있다. 하지만 비전 검사는 불량 데이터가 매우 적은 클래스 불균형 문제, 레이블된 데이터를 얻기 힘든 문제가 있다. 딥러닝 기술을 비전 검사에 성공적으로 적용하기 위해서는 이러한 데이터 제약에 대한 고려가 필수적이다. 우리는 본 논문에서 데이터 제약을 다루는 대표적인 접근인 이상치 탐지와 반지도 학습에 기반한 두가지 새로운 알고리즘을 제안한다.
첫번째로 우리는 교차복원에 기반한 오토인코더 구조 (CRAE) 를 통해 영상의 특징을 분류하는 방법을 제안한다. 오토인코더는 입력 영상을 압축하여 잠재 특징을 얻고, 이를 다시 입력 영상에 가깝게 복원하는 과정을 통해 영상을 대표하는 잠재 특징을 배운다. 이상치 탐지에서 이런한 잠재 특징을 분류를 위해 사용할 수 있지만, 클래스의 결정에 영향을 미치는 요소들을 정확하게 표현하기 위해서는 잠재 특징 내의 공유 요소와 변화 요소를 분리할 필요가 있다. CRAE는 두 개의 입력 영상으로부터 공유 특징과 변화 특징을 추출하고, 변화 특징을 서로 바꾼 후, 상대 입력 영상을 복원하는 과정으로 학습된다. 그리고 입력 영상과 출력 영상의 공유 특징의 유사도를 이용해 이상 정도를 정의한다. CRAE는 MVTec AD 데이터셋을 이용한 이상치 탐지 실험에서 다른 분류기보다 좋은 성능을 보였고, Fashion-MNIST와 CIFAR-10 데이터셋에서 각각 0.927, 0.666의 AUROC를 달성함으로써 오토인코더에 기반한 다른 방법들보다 좋은 성능을 달성했다.
두번째로, 우리는 분류기의 특징 공간 상에서 정상과 불량 영상의 특징을 각 특징 군집의 중심으로 이동시키는 feature concentration 방법을 소개한다. Feature concentration을 반지도 학습의 정규화 방법으로 적용함으로써 매우 적은 수의 레이블드 데이터 정보를 이용한 분류를 수행할 수 있다. 우리는 실제 스마트폰 검사 공정의 영상 데이터를 사용한 실험을 통해 제안 방법이 지도 학습에서 5%, 각기 다른 감독 비율을 가지는 반지도 학습에서 7에서 11%의 성능 향상이 있음을 보였으며, 이를 또한 세가지 공개된 데이터셋에 적용하여 성능 향상을 확인하였다.
-
dc.description.tableofcontents1 Introduction 1
1.1 Approach to Anomaly Detection 2
1.2 Approach to Semi-supervised Classification 5
2 Background 8
2.1 Visual Inspection 8
2.2 Anomaly Detection 9
2.3 Semi-supervised Learning 10
2.4 Corresponding Algorithms 12
3 Anomaly Detection using a Cross-Reconstruction Autoencoder with Latent Feature Disentanglement 14
3.1 Method 14
3.1.1 Disentangling Latent Features 14
3.1.2 Cross-Reconstruction Autoencoder 18
3.1.3 Refinements to CRAE 19
3.1.4 Anomaly Score from Feature Similarity 20
3.1.5 Anomaly Threshold 22
3.2 Result 22
3.2.1 Datasets 22
3.2.2 Implementation of CRAE 25
3.2.3 Results 27
3.2.4 Ablation Study 38
4 Feature Concentration for Supervised and Semi-supervised Learning with Unbalanced Dataset 39
4.1 Method 39
4.1.1 Feature Space Exploration 40
4.1.2 Feature Concentration with Labeled Data 41
4.1.3 Feature Concentration with Unlabeled Data 44
4.1.4 Training and Classification 46
4.2 Result 48
4.2.1 Setup 48
4.2.2 Performance in Supervised Settings 52
4.2.3 Performance in Semi-supervised Settings 53
4.2.4 Performance in One-abnormal Settings 55
4.2.5 Effect of Hyper-parameters 57
4.2.6 Comparison with Sampling Methods 59
4.2.7 Experiments with Public Datasets 60
5 Conclusion 63
-
dc.language.isoeng-
dc.publisher서울대학교 대학원-
dc.subject.ddc621.3-
dc.titleDeep Learning Algorithms for Visual Inspection-
dc.title.alternative비전 검사를 위한 딥러닝 알고리즘-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthorJang Jiyong-
dc.contributor.department공과대학 전기·정보공학부-
dc.description.degreeMaster-
dc.date.awarded2020-02-
dc.identifier.uciI804:11032-000000158758-
dc.identifier.holdings000000000042▲000000000044▲000000158758▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share