Publications

Detailed Information

심층강화학습을 이용한 무인수상선의 충돌회피 : Collision Avoidance for an Unmanned Surface Vehicle Using Deep Reinforcement Learning

DC Field Value Language
dc.contributor.advisor김용환-
dc.contributor.author우주현-
dc.date.accessioned2018-05-28T16:26:51Z-
dc.date.available2018-05-28T16:26:51Z-
dc.date.issued2018-02-
dc.identifier.other000000150662-
dc.identifier.urihttps://hdl.handle.net/10371/140721-
dc.description학위논문 (박사)-- 서울대학교 대학원 : 공과대학 조선해양공학과, 2018. 2. 김용환.-
dc.description.abstract무인수상선이 할당된 임무를 성공적으로 수행하기위해서는 선박 및 장애물에 대한 충돌회피 성능이 필수적으로 확보 되어야한다. 이는 무인수상선 자선의 안전성을 확보하기 위함과 동시에 무인수상선 근처에서 운항하는 일반 선박의 인명 및 재산상의 손실을 방지하기 위함이다. 이와 같은 사회적 요구에 따라 무인수상선의 충돌회피 능력을 향상시키기 위한 연구가 활발히 이루어져 왔다.
본 논문에서는 기존에 수행되었던 선박의 충돌회피와 관련된 선행연구들의 한계점을 분석하고 이들을 극복하는 방향으로 연구목표를 설정하였다. 본 연구에서 설정한 네 가지의 목표는 다음과 같다. 첫째, 충돌위험도를 추론할 때, 자선과 장애물 간의 조우상황을 단순화 하지 않고, 직접 고려할 수 있어야한다. 둘째, 다수의 선박에 대한 충돌위험성을 인식할 수 있어야 한다. 셋째, 자선의 조종성능이나 환경하중의 영향을 고려할 수 있어야 한다. 넷째, 조우 상황별로 상이한 기준을 이용하여 충돌회피를 수행할 수 있어야 한다.
무인수상선의 충돌회피는 일반적으로 탐지- 의사결정 - 경로계획 - 제어의 단계를 거친다. 각종 장애물 탐지센서를 이용해 얻은 장애물의 위치 및 운동정보를 바탕으로 현재 조우상황을 판단하고, 이를 통해 회피여부에 대한 의사결정을 진행한다. 장애물회피 여부가 결정되면 충돌을 방지하기 위한 경로계획을 수립하고, 수립된 명령에 따라 선박을 제어하여 충돌을 회피한다. 본 연구에서는 이들 단계 중 충돌회피 여부 및 시점을 판단하는 의사결정 단계에 대한 연구를 심층강화학습이라는 기법을 이용하여 진행하였다. 강화학습은 학습자가 스스로 주변환경과 상호작용을 통해 최적의 행동을 찾아 나가는 기계학습의 한 종류이다. 본 연구에서는 학습자를 무인수상선으로 선정하고, 반복적인 충돌회피 시뮬레이션을 통해서 무인수상선 스스로 최적의 충돌회피 시점을 찾아나가는 접근방법을 사용하였다. 시뮬레이션을 통해 강화학습을 수행하기 위해서는 무인수상선의 동역학 정보가 필요한데, 이를 위해 본 연구에서는 무인수상선 실선에 대한 시스템 식별을 수행하였다. 본 연구에서 제안하는 심층강화학습 기반 충돌회피 알고리즘은 국제 해상충돌 예방규칙을 준수하도록 구성하였고, 각 조우상황별로 상이한 요구조건을 만족할 수 있도록 구성하였다. 또한, 무인수상선이 반복적으로 충돌회피 시뮬레이션을 통해 주변환경과 행동에 대한 반응을 학습하므로, 경험적으로 자선의 조종성능과 환경하중에 대한 영향을 반영 할 수 있다.
구성된 충돌회피 알고리즘을 검증하기 위하여 다양한 시나리오에 대한 충돌회피 시뮬레이션을 수행하였다. 이로부터 얻어진 자선과 타선의 궤적, 침로각 정보, 상대거리 정보, 충돌 회피 시점 등을 통해 본 연구에서 제안하는 기법의 효과성을 확인하였다. 학습된 충돌회피 알고리즘은 무인수상선 실선에 탑재되어 실해역 충돌회피 실험을 통해 실제 환경에서의 충돌회피 능력을 확인하였다.
-
dc.description.tableofcontents1.서론 1
1.1 연구 배경 1
1.2 문헌 조사 및 기존 연구사례 4
1.2.1 장애물 탐지 4
1.2.2 충돌회피 시점 추론 5
1.2.3 충돌회피 경로 계획 6
1.3 연구 목표 6
1.4 연구 내용 및 한계 8
2 심층강화학습 11
2.1 강화학습 11
2.1.1 강화학습 문제 11
2.1.2 마코프 의사결정 과정 13
2.1.3 강화학습 알고리즘 16
2.2 심층강화학습 22
2.2.1 Deep Q Network 22
2.2.2 심층강화학습 기법 24
2.2.3 심층강화학습 기반 연구 24
3 무인수상선의 충돌회피 26
3.1 선박의 충돌 회피 26
3.1.1 국제 해상충돌 예방규칙 26
3.1.2 조우상황의 분류 28
3.1.3 회피 행동의 결정 32
3.2 충돌회피 알고리즘 35
3.2.1 충돌회피 시점 추론 알고리즘 35
3.2.2 속도 장애물 기법 41
4 심층강화학습 기반 충돌 회피 45
4.1 심층강화학습 신경망 47
4.1.1 SMDP의 구성 47
4.1.2 심층강화학습 알고리즘의 동작과정 59
4.1.3 심층강화학습 신경망 학습 60
5 성능 검증 66
5.1 대상 무인수상선 66
5.1.1 Wave Adaptive Modular Vessel 16 66
5.1.2 무인수상선의 동역학 시뮬레이터 69
5.2 시뮬레이션 결과 87
5.2.1 충돌회피 알고리즘 분석 87
5.2.2 충돌회피 성능에 대한 분석 94
5.2.3 조종성능의 영향에 대한 분석 109
5.2.4 다수 선박에 대한 충돌회피 116
5.3 자유 항주 실험 결과 126
5.3.1 실험 환경 126
5.3.2 충돌 회피 실험 결과 127
6 결론 142
A 무인수상정의 시스템 식별 145
A.1 무인수상선 동역학의 시스템 식별 145
Abstract 163
-
dc.formatapplication/pdf-
dc.format.extent23168411 bytes-
dc.format.mediumapplication/pdf-
dc.language.isoko-
dc.publisher서울대학교 대학원-
dc.subject무인수상선-
dc.subject충돌 회피-
dc.subject강화 학습-
dc.subject인공 지능-
dc.subject.ddc623.8-
dc.title심층강화학습을 이용한 무인수상선의 충돌회피-
dc.title.alternativeCollision Avoidance for an Unmanned Surface Vehicle Using Deep Reinforcement Learning-
dc.typeThesis-
dc.contributor.AlternativeAuthorJoohyun Woo-
dc.description.degreeDoctor-
dc.contributor.affiliation공과대학 조선해양공학과-
dc.date.awarded2018-02-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share