Publications

Detailed Information

다중 에이전트 시스템을 이용한 실시간 도시철도 스케줄링 : Real-time Train Rescheduling with Multi-agent System

DC Field Value Language
dc.contributor.advisor홍성필-
dc.contributor.author김성엽-
dc.date.accessioned2019-05-07T03:11:40Z-
dc.date.available2019-05-07T03:11:40Z-
dc.date.issued2019-02-
dc.identifier.other000000154270-
dc.identifier.urihttps://hdl.handle.net/10371/150698-
dc.description학위논문 (석사)-- 서울대학교 대학원 : 공과대학 산업공학과, 2019. 2. 홍성필.-
dc.description.abstract열차 운행 중 예상치 못한 상황이 발생하여 더 이상 기존의 운행 계획대로 운영하 지 못할 때, 열차들은 경합이 없는 새로운 운행 계획을 필요로 한다. 열차 재스케줄링 문제는 이와 같은 상황에서 조정된 운행 계획과 기존 운행 계획의 오차가 최소화 되는 스케줄을 찾는 것을 말한다. 한편 열차 재스케줄링에 관한 많은 기존 연구들은 일반 철도의 상황에서 고려되었으며 일반 철도와는 다른 도시 철도의 특징 때문에 이를 도시 철도에 그대로 적용하는 것은 어렵다.
본 연구에서는 열차 재스케줄링 문제를 마르코프 게임(Markov game)으로 모형화 하여 확률적이면서도 동적인 도시 철도의 특성을 반영한다. 또한, 모형화된 마르코프 게임의 균형을 찾기위해 리그렛 매칭(regret matching) 알고리즘을 심층 학습(deep learning)으로 근사하여 적용하는 방법을 제안한다. 더 나아가 리그렛 매칭 알고리즘과 동일하게 균형을 찾음을 보장하면서 실제 적용 상황에서 더 빠른 수렴 속도를 가질 수 있는 멱리그렛 매칭(power-regret matching) 알고리즘을 제안한다. 심층 학습으로 근 사한 멱리그렛 매칭 알고리즘은 기존의 리그렛 매칭이 적용 불가능한 대규모 마르코프 게임에서도 적용할 수 있으며 리그렛 매칭 알고리즘보다 더 빠른 학습 속도를 가질 수 있음을 실험적으로 보였다.
-
dc.description.abstractWhen an unexpected situation arises during the train operation and the train can no longer operate according to the existing schedule, train system needs a new operation plan with no confliction. The problem of train rescheduling refers to finding a schedule that minimizes the error of the adjusted operation plan and the existing operation plan in such a situation. On the other hand, many previous studies on train rescheduling have been considered in the context of general railway and it is difficult to apply it to urban railway because feature of urban railway is different from general railway.
In this study, urban train rescheduling problem is modeled as a Markov game, which reflects the features of urban railway which is both stochastic and dynamic. Also, we propose a method to approximate the regret matching algorithm with deep learning to find the equilibria of the modeled Markov game. In addition, we pro- pose a power-regret matching algorithm that guarantees the same equilibria as the regret-matching algorithm, but may have faster convergence speed in actual appli- cations. It has been experimentally shown that the power-regret matching algorithm approximated by deep learning can be applied to a large-scale Markov game in which conventional regret matching is not applicable and can have a learning speed faster than the regret matching algorithm.
-
dc.description.tableofcontents목차
초록 i 목차 iii 표 목차 iv 그림 목차 v
제 1 장 서론 1
1.1 연구 배경 및 연구 목적 . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 논문의 구성 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
제 2 장 기존 연구 4
2.1 열차재스케줄링문제........................... 4 2.1.1 일반철도재스케줄링....................... 4 2.1.2 도시철도재스케줄링....................... 5
2.2 다중에이전트심층강화학습....................... 6 2.2.1 다중에이전트강화학습 ..................... 6 2.2.2 심층강화학습........................... 7
제 3 장 모형 9
3.1 도시철도의특성 ............................. 9
3.2 마르코프게임모형화........................... 13
ii
3.2.1 상태의정의............................ 15 3.2.2 행동의정의............................ 17 3.2.3 보상함수의정의 ......................... 18
제 4 장 해법 20
4.1 리그렛매칭알고리즘........................... 20
4.1.1 불완전정보순차게임으로의환원................ 20
4.1.2 균형의종류와no-regretlearning알고리즘 . . . . . . . . . . . 23
4.1.3 리그렛매칭알고리즘적용의어려움 .............. 30
4.2 심층학습을이용한함수의근사 ..................... 32
4.3 멱리그렛매칭알고리즘.......................... 34
제 5 장 실험 39 5.1 실험환경 ................................. 39 5.2 실험의구성................................ 40 5.3 실험결과 ................................. 40
제 6 장 결론및추후연구 42 6.1 결론.................................... 42 6.2 추후연구 ................................. 42
참고문헌 Abstract 감사의 글
44 50 52
-
dc.language.isokor-
dc.publisher서울대학교 대학원-
dc.subject.ddc670.42-
dc.title다중 에이전트 시스템을 이용한 실시간 도시철도 스케줄링-
dc.title.alternativeReal-time Train Rescheduling with Multi-agent System-
dc.typeThesis-
dc.typeDissertation-
dc.description.degreeMaster-
dc.contributor.affiliation공과대학 산업공학과-
dc.date.awarded2019-02-
dc.identifier.uciI804:11032-000000154270-
dc.identifier.holdings000000000026▲000000000039▲000000154270▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share