Publications

Detailed Information

Analyzing and Classifying Factors for Desired Target Feature Utilizing Driving Data : 하이브리드 차량 주행 데이터 분류 및 분석을 통한 설정한 타겟 데이터 관련 핵심 인자 추출 방법론

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

장성현

Advisor
차석원
Issue Date
2021-02
Publisher
서울대학교 대학원
Keywords
hybrid vehicledriving datadata analysisfeature selection하이브리드 차량주행 데이터데이터 분석인자 추출
Description
학위논문 (석사) -- 서울대학교 대학원 : 공과대학 기계공학부, 2021. 2. 차석원.
Abstract
본 논문에서는 차량 데이터의 특성에 맞추어, 주행 시 얻어지는 임의의 차량 데이터을 효과적으로 분류 및 분석하는 방법론을 제안한다. 원하는 target data를 입력해주면 효율적으로 관련 feature들을 추출하는 알고리즘이 제안된다. 특별히, 이러한 알고리즘을 사용하는 경우는, target data와 차량 동역학적으로 obvious하게 연관이 있는 feature들 말고도 연구에 새로운 insight를 얻고자 하는 목적, 즉 다른 고려할만한 feature들을 추출하고자 하는 목적이 있다고 판단했고, 따라서 뻔하지 않은 feature들을 추출하는 방안을 제시하였다.

최근 빅데이터 처리 기술이 발전함에 따라 다양한 산업 데이터들을 분석하려는 시도가 증가하고 있다. 이 때, 사용하는 데이터의 산업적 특성에 맞춘 데이터 처리 기법을 활용하는 것은 효율성 측면에서 매우 중요하다. 차량에서 추출된 신호들은 다수의 모듈을 기준으로 데이터들이 발생하며, 상태를 표현하는 mode형 데이터와 continuous한 수치를 나타내는 데이터들이 다양한 time step을 기준으로 측정된다. 각각의 데이터가 어떠한 모듈에서 측정되는지에 따라 time step이나 데이터의 종류가 달라지게 되고, 이러한 다양한 종류의 데이터들을 분석에 모두 활용하기 위해, 각 데이터의 특성에 맞추어 interpolation 및 분류를 진행할 필요가 있다. 데이터 처리 및 분석 과정에 있어서 데이터명들을 고려하지 않았기 때문에, 어떠한 모듈 조합을 통해 주행 데이터가 측정되더라도, 임의의 주행 데이터를 받아서 목표하는 target data와 연관된 핵심 인자 및 뻔하지 않은 인자들을 추출할 수 있다는 장점이 있다.

본 논문에서는, 차량 주행 데이터를 활용하여 target data에 영향을 주는 feature를 파악하는 방법론을 제안하고 sedan with D-segment hybrid drivetrain의 실제 주행 데이터를 활용하여 연비 관련 feature를 target data로 설정하여 그 방법론을 검증한다. 제안된 방법론에는 크게 필터링, 분류, 분석, grouping, feature selection 과정이 포함되고, target data와의 연관도 분석에서 obvious한 인자들을 제외한 뻔하지 않은 인자들을 구분하는 과정도 포함된다. 그 과정에서 서로 다른 time step을 기준으로 한 다양한 데이터들을 필터링 및 interpolation 한 뒤, feature들을 continuous feature와 discrete feature로 분류하고, 이를 바탕으로 분석을 진행한다. target data를 설정하는 방법도 크게 두 가지로 나눌 수 있다; 전 time step에서 target data를 기준으로 분석하는 방법과, target data의 수치를 기준으로 주행데이터의 구간을 나누어 다른 점을 분석하는 방법을 제안하고 검증한다.

본 논문에서 제안한 방법론을 활용하면, 차량 주행 데이터를 활용한 분석에 있어서, 설정한 target data을 예측하는 인자 조합이 필요하거나 혹은 target data와 관련이 있는 예상하지 못한 인자들 추출을 통해 insight가 필요할 때 효율적으로 솔루션을 낼 수 있을 것으로 예상된다.
In this paper, a methodology that effectively classifies and analyzes arbitrary vehicle data obtained during driving according to the vehicle data characteristics is proposed. An algorithm that efficiently extracts related features is proposed by inputting the desired target data. In particular, in the case of using such an algorithm, it was judged that the purpose of obtaining new insights for research is to extract other considerable features, in addition to the features that are obviously related to the target data with vehicle dynamics knowledge. Therefore, a method to extract non-obvious features was proposed.
With the recent development of big data processing technology, attempts to analyze various industrial data are increasing. In this case, it is very important in terms of efficiency to use a data processing technique tailored to the industrial characteristics of the data used. Signals extracted from the vehicle generate data based on a number of modules, and mode-type data representing a state and data representing a continuous number are measured based on various time steps. Depending on which module each data is measured in, the time step and the type of data change, and in order to use all of these various types of data for analysis, interpolation and classification need to be performed according to the characteristics of each data. Since data names are not considered in the data processing and analysis process, there is the advantage of being able to extract key factors and non-obvious factors related to target data with arbitrary driving data that is measured through any combination of modules.
In this paper, a methodology to identify features that affect target data using vehicle driving data is proposed, and the methodology is verified by utilizing real road driving data of sedan with a D-segment hybrid drivetrain. The proposed methodology includes filtering, classification, analysis, grouping, and feature selection processes, and also includes the process of classifying non-obvious factors, excluding obvious factors in the correlation analysis with target data. In the process, after filtering and interpolating various data based on different time steps, features are classified into continuous features and discrete features, and analysis is conducted based on them. There are two main ways to set target data; a method of analyzing based on target data in all time steps and a method of analyzing differences by dividing the section of driving data based on the number of target data are proposed and verified.
By utilizing the methodology proposed, it is expected to provide an efficient solution for selecting features that predict desired target data during vehicle driving data analysis or suggesting insights through extracting unexpected features.
Language
eng
URI
https://hdl.handle.net/10371/175132

https://dcollection.snu.ac.kr/common/orgView/000000166092
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share