Publications

Detailed Information

A Deep Generative Modeling Framework for Synthesizing Individual-specific Activity Schedule : 개인별 활동 일정 생성을 위한 심층 생성 모형 프레임 워크

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김의진

Advisor
김동규
Issue Date
2021-02
Publisher
서울대학교 대학원
Keywords
Activity-based ModelPopulation SynthesisActivity SchedulingDeep Generative ModelingData Fusion Approach활동기반모형인구 재현활동 계획딥생성모형데이터 퓨전
Description
학위논문 (박사) -- 서울대학교 대학원 : 공과대학 건설환경공학부, 2021. 2. 김동규.
Abstract
Emerging technologies that provide large-scale high-dimensional travel data have led to the increased use of data-driven approaches for travel demand analysis. Emerging data such as smart card data and locational data from mobile device continuously records mobility trip-chain. However, those data are incomplete due to missing attributes of travel behavior such as trip purpose and individual-specific attributes (i.e., age, gender, and income). Therefore, missing attributes of emerging data need to be estimated for applying them to further analysis, such as travel demand analysis and travel behavior analysis.
Modern advanced activity-based models (ABMs) have adopted the microsimulation approaches whose key inputs are realistic synthetic population (i.e., agent) and activity schedules within a day. Therefore, the data-driven approaches that produce activity schedules of the agent with their individual-specific attributes are necessary to utilize the valuable data collected by emerging technologies. Traditionally, population synthesis and activity scheduling are independently conducted by different approaches. Population synthesis has been performed by estimating the joint probability distribution of individual-specific attributes of populations. Activity scheduling has been conducted by a set of machine learning models for discrete choice, based on numerous expert-designed components. Therefore, a great effort of human experts is required to fit the emerging data by modifying the existing activity scheduling framework. This study develops a deep generative modeling framework for synthesizing individual-specific activity schedules using mobility data recording trip-chain. The proposed data-driven framework simultaneously estimates the joint probability distribution of activity schedules and individual-specific attributes to generate synthetic activity schedules. The framework can also utilize the incomplete sample data by estimating missing attributes of those data using the estimated joint probability distribution of complete sample data.
To verify my framework, it applied to national household travel survey (NHTS) data (i.e., complete sample data) and transit smart card (SC) data (i.e., incomplete sample data). The estimated joint probability distribution of NHTS data is used to generate realistic synthetic NHTS data (i.e., individual-specific activity schedules) and impute the missing individual-specific attributes of SC data based on a data fusion approach. The synthetic NHTS data and individual-specific SC (ISC) data are evaluated with benchmark models in terms of the probability distribution, the applicability to ABM, and the applicability to behavior analysis. Evaluation results show that the synthetic NHTS well estimate the joint probability distribution of individual-specific activity schedules, and such performances are reasonable for applying to ABM. The results also show that the estimated ISC data represent realistic attributes compared to Census and NHTS data, and it can provide new insights into travel behavior by replacing costly travel survey. These findings indicate that this study can significantly contribute to travel demand and behavior analysis in terms of data utility, data quality, data privacy, and cost-efficiency.
대규모 고차원 통행 자료를 제공하는 새로운 기술들은 교통수요 분석을 위한 데이터 기반 접근방식의 활용을 증대시켜 왔다. 스마트 카드나 모바일 기기의 위치 자료는 개인의 통행 사슬을 연속적으로 기록한다. 하지만 이러한 자료는 통행목적이나 나이, 성별, 소득과 같은 개인 속성이 누락된 불완전 자료이다. 따라서, 신규 기술을 통해 수집되는 자료의 누락된 정보를 추정하는 것은 교통수요 분석, 통행행태 분석 등의 추가분석으로 자료의 활용을 확장하기 위해 필요하다.
현대의 활동기반모형은 현실적인 재현 인구와 그들의 하루 내 활동계획을 핵심 입력 자료로 활용하는 미시시뮬레이션 접근법을 채택하고 있다. 그러므로, 개인 속성과 활동계획을 생성하는 데이터 기반의 접근법은 새로운 기술들로부터 수집되는 귀중한 자료를 활용하기 위해 반드시 필요하다. 전통적으로, 인구 재현과 활동 계획은 서로 다른 접근법을 통해 독립적으로 수행된다. 인구 재현은 인구의 개인속성들의 결합확률분포를 추정함으로써 수행되는 반면, 활동 계획은 전문가가 설계한 여러 개의 연속된 기계학습 기반 이산 선택모형들의 집합으로 수행된다. 따라서, 기존 활동 계획 모형을 새롭게 수집되는 자료에 맞춰 개선하기 위해선 많은 전문가의 노력이 필요하다. 본 연구는 개인 속성이 명시된 활동 계획을 통행 사슬을 기록하는 통행 자료를 활용하여 재현하는 딥생성모형 프레임워크를 개발한다. 제안된 데이터 기반의 프레임워크는 개인 속성과 활동 계획의 결합확률분포를 동시에 추정하여 개인 속성이 명시된 활동계획을 생성한다. 또한, 이 프레임워크는 불완전한 표본 자료의 누락 정보를 추정하여, 완전한 표본 자료와 함께 활용이 가능하다.
제안된 프레임워크를 검증하기 위해, 완전 표본 자료인 가구통행실태조사(NHTS) 자료와 대중교통 스마트카드 (SC) 자료에 적용하였다. NHTS 자료의 추정된 결합확률분포는 현실적인 재현 NHTS 자료를 생성하고, SC 자료의 누락된 개인속성정보를 추정하는데 활용되었다. 이러한 재현 NHTS 자료와 개인 속성이 추가된 SC 자료는 확률분포, ABM으로 활용가능성, 행태분석으로 활용가능성의 3가지 관점에서 벤치마크 모형들과 함께 평가되었다. 평가 결과는 재현된 NHTS 자료가 개인의 활동계획에 대한 결합 확률 분포를 잘 추정함을 보였고, 그러한 성능은 ABM과 행태 분석에 활용되기에 충분하였다. 결과는 또한 데이터 퓨전 기법으로 추정된 개인 속성이 추가된 SC자료가 센서스나 NHTS 자료와 비교했을 때 매우 현실적인 개인 속성을 나타냄으로써, 비용이 많이 소모되는 기존의 통행설문조사를 대체할 수 있음을 시사하였다. 이러한 발견들은 본 연구가 자료의 유용성, 퀄리티, 안전성, 비용 효율성 등을 높여 통행 수요 및 행태 분석 분야에 상당히 기여할 수 있음을 시사한다.
Language
eng
URI
https://hdl.handle.net/10371/175071

https://dcollection.snu.ac.kr/common/orgView/000000164403
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share