Publications

Detailed Information

선박 및 해양플랫폼 에너지 시스템의 이상 탐지 모델 성능 향상을 위한 다변량 시계열 데이터 합성 및 검증 : Multivariate Time Series Augmentation for Improving the Performance of Anomaly Detection in Energy System of Ships and Offshore Platforms

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

장진관

Advisor
서유택
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
선박 및 해양플랫폼에너지 시스템실시간 모니터링다변량 시계열 합성 및 증강다변량 시계열 이상 탐지성능 향상
Description
학위논문(석사) -- 서울대학교대학원 : 공과대학 조선해양공학과, 2023. 2. 서유택.
Abstract
최근 국제 해운 분야의 환경 규제와 Digital Twin 기술의 발전으로 선박 및 해양플랫폼의 실시간 모니터링이 점차 확산되고 있다. 그리고 이상 상태가 누적되어 사고가 났을 때 막대한 피해가 발생할 수 있는 선박이나 해양플랫폼에서는 실시간 모니터링 중 특히 센서 데이터를 기반으로 하는 시계열 이상 탐지가 매우 중요한 기술이다. 하지만 고차원이면서 시간 종속성이 있는 다변량 시계열 데이터의 특성상 예측 및 이상 탐지가 쉽지 않기 때문에 딥러닝 기술을 활용해야 한다. 딥러닝 연구가 활발히 진행되면서 다변량 시계열 이상 탐지의 정확성이 크게 향상되었지만 딥러닝 모델의 구조가 더욱 복잡해지면서 모델의 capacity가 증가해 학습 데이터가 충분해야만 안정적으로 최고의 성능을 보인다는 문제점이 있다.
학습 목적의 실제 데이터를 더 취득할 수 없는 상황에서 그 대안으로 데이터 합성 및 증강 기법을 활용할 수 있다. 다만 다변량 시계열인 학습 데이터를 충분히 확보하기 위해 전통적인 시계열 데이터 합성 방법론인 random transformation이나 pattern mixing을 활용한다면 시간 종속성이 제대로 반영되지 않고 실제 데이터의 분포와 확연히 다른 데이터가 합성되어 증강된 학습 데이터의 품질이 떨어지게 된다. 결과적으로 오히려 딥러닝 모델의 성능을 악화시킬 수 있다. 따라서 실제 시계열의 분포와 매우 유사하고 시간 종속성과 변수 간의 관계도 모두 반영된 좋은 품질의 합성 시계열 센서 데이터를 생성할 수 있는 방법론을 활용해 접근해야 한다.
본 연구에서는 선박 및 해양플랫폼의 대표적인 에너지 시스템 중 하나인 open loop 유형의 SOx scrubber가 탑재되어 있는 디젤 엔진 선박의 에너지 시스템을 대상으로 이상 탐지를 수행한다. 선정한 에너지 시스템은 직관적이고 사후 분석이 용이하다는 장점이 있다. 보안 등의 이유로 접근 가능한 학습 데이터가 부족하거나 새로 건조되어 다양한 상황에 대한 학습 데이터 자체가 부족하다는 점을 고려해 학습 데이터를 합성 및 증강해야 할 것이다.
우선 본 연구에서 활용하려고 하는 GAN 기반 generative model인 TimeGAN이 다변량 시계열 합성에 있어 가장 적절한 모델인지 확인한다. 차원 축소를 활용한 데이터 분포 시각화와 두 가지 정량적 지표를 통해 전통적인 시계열 합성 방법론들과 비교하여 TimeGAN이 다변량 시계열 이상 탐지를 위해 실제와 매우 유사한 데이터를 합성할 수 있는 적절한 모델임을 확인하고 좋은 품질의 다변량 시계열 데이터를 합성해 학습 데이터를 증강한다.
이후 충분히 증강된 학습 데이터를 바탕으로 현재 이상 탐지 성능이 가장 좋은 Transformer 기반 다변량 시계열 이상 탐지 모델인 TranAD에 적용하여 기존의 데이터만 활용해 학습했을 때보다 안정적인 예측과 더 정확한 이상 탐지 성능을 보여주는지 검증한다.
Recently, with the development of environmental regulations in the international shipping industry and the emergence of Digital Twin technology, real-time monitoring of ships and offshore platforms is gradually spreading. In particular, multivariate time- series anomaly detection based on sensor dataset is a very important technology for real-time monitoring of ships and offshore platforms, where large damages may occur when abnormal states accumulate and lead to accidents. However, due to the characteristics of high-dimensional and time-dependent multivariate time-series data, it is difficult to predict and detect anomalies, and therefore it is necessary to use deep learning technology. As advanced deep learning architectures have invented every year, the accuracy of multivariate time-series anomaly detection has greatly improved, but as the structure of deep learning models becomes more complex, the model's capacity increases and it requires a huge amount of training data to show stable, optimal performance.
In situations where it is not possible to obtain more real data for training purposes, data synthesis and augmentation techniques can be used as an alternative. However, if conventional time-series data synthesis methods such as random transformation or pattern mixing are used to gain sufficient multivariate time-series data for training, the time dependency may not be properly contained and also the distribution of generated data is significantly different from that of actual data, resulting in a poor quality of the augmented training data. As a result, it may actually degrade the performance of the deep learning model. Therefore, it is necessary to approach the problem by using novel method like deep generative models that can generate high-quality synthetic time-series sensor data that is very similar to the distribution of actual time-series data and contains both the time dependency and the relationship between variables.
This study is for reliable detection of anomalies with high accuracy on the energy system of a diesel engine bulk carrier with an open loop type SOx scrubber, which is one of the representative energy systems of ships and offshore platforms. The selected energy system has the advantage of being intuitive and easy to analyze. Considering the limited access to training data due to security reasons or the lack of training data itself for various situations in new-build ships, it is necessary to synthesize and augment the training data sufficiently.
High-quality synthetic data generated by TimeGAN for training applied to the TranAD, a Transformer-based multivariate time-series anomaly detection model that currently has the best anomaly detection performance, and verify that it shows more stable prediction and better anomaly detection performance than when it was trained using only existing sensor dataset.
Language
kor
URI
https://hdl.handle.net/10371/193321

https://dcollection.snu.ac.kr/common/orgView/000000175854
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share