Publications

Detailed Information

Multi-Contact Simulator and Reinforcement Learning for Screw Tightening Tasks : 나사 조립 작업을 위한 다중접촉 시뮬레 이터와 강화학습

DC Field Value Language
dc.contributor.advisor이동준-
dc.contributor.author손동원-
dc.date.accessioned2020-05-07T03:32:05Z-
dc.date.available2020-05-07T03:32:05Z-
dc.date.issued2020-
dc.identifier.other000000160762-
dc.identifier.urihttp://dcollection.snu.ac.kr/common/orgView/000000160762ko_KR
dc.description학위논문(석사)--서울대학교 대학원 :공과대학 기계항공공학부,2020. 2. 이동준.-
dc.description.abstract본 논문에서는 나사체결을 위한 다중접촉 시뮬레이터와 그를 활용한 강화학습 적용에 대해 기술한다. 강화학습을 통한 정책은 반력 정보를 사용할 수 있고 물리 변수들의 불확실성에 강건할 수 있다는 장점이 있지만, 지역 최적에 빠지기 쉽고 데이터 효율이 나쁘다는 단점이 있다. 특히 나사조립과 같은 조립작업의 경우 복잡한 형상의 다중접촉을 효율적으로 계산하는 시뮬레이터가 부재하고 목적지까지 경로가 복잡하기에 강화학습 적용에 어려움이 있다. 이를 해결하기 위해 먼저 C-space에서 다중접촉 모델을 개발하여 나사체결 시뮬레이터의 효율을 향상시켰다. 또한 다중 홀로노믹 제한을 위한 C-space 에서의 체적 모델을 개발함으로써 복잡한 형상간 접촉에서도 시뮬레이션의 강건성을 향상시켰다. 이와 함께 나사체결 자동화를 위한 계층 구조의 제어기를 개발하였다. 특히 표본기반 경로계획을 도입하여 반응적인 하층 제어기를 개발하였고 이를 통해 지역 최적 문제를 해결하였다. 하층 제어기의 변수들을 새로운 행동 영역으로 정의한 상층 제어기를 강화학습으로 학습하였고, 이 때 빠르고 강건한 시뮬레이터를 통한 영역 무작위화 기법을 사용하여 기하학적 불확실성에도 강건한 제어기를 개발하였다.-
dc.description.abstractThe policy through RL has the advantage of utilizing haptic information and being robust against the uncertainty of physical parameters, but it has the disadvantage of being prone to local minima. Especially in the case of nut tightening, it is difficult to apply RL because there is no simulator to efficiently calculate the multi-contact of complex shape and the route to the destination is complicated. To solve this problem, we first developed a multi-contact model in C-space to improve the efficiency of the simulator. Also, we develop a volumetric contact representation in C-space for multi-holonomic constraint, which improves the robustness. In addition, we develop a hierarchical controller whose low-level controller is based on SPP, which makes it avoid the local minima. The high-level controller, which defines the parameter of the low-level controller as actions, was trained by RL. During training, we use the developed simulator with domain randomization technique which makes the controller robust to geometric uncertainty.-
dc.description.tableofcontents1 Introduction 1
1.1 Motivation 1
1.2 Related Work 3
1.3 Contribution 5
2 Preliminary 6
2.1 Modeling of System 6
2.2 Model-Free Reinforcement Learning 8
2.3 Multi-Contact Simulation 9
2.4 Sampling-based Path Planning 10
3 Multi-Contact Simulation in C-space 12
3.1 Learning Pfaan Constraint 12
3.2 Calculation of interaction force 15
3.3 Sphere Approximation 17
4 Hierarchical Control 19
4.1 Low-Level Controller 20
4.1.1 Path library from sampling-based path planning 20
4.1.2 LQT formulation 21
4.1.3 Properties and limitations 24
4.2 High-Level Controller 25
5 Experiments 27
5.1 Experiments of Simulation 27
5.1.1 Implementation of Nut Tightening Simulation 27
5.1.2 Comparison between a point and sphere representation 30
5.2 Implementation of Controller 32
5.2.1 Low-level controller 32
5.2.2 High-level controller 35
6 Conclusion and Future Work 40
6.1 Conclusion 40
6.2 Future Work 41
-
dc.language.isoeng-
dc.publisher서울대학교 대학원-
dc.subject.ddc621-
dc.titleMulti-Contact Simulator and Reinforcement Learning for Screw Tightening Tasks-
dc.title.alternative나사 조립 작업을 위한 다중접촉 시뮬레 이터와 강화학습-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthorDongwon Son-
dc.contributor.department공과대학 기계항공공학부-
dc.description.degreeMaster-
dc.date.awarded2020-02-
dc.contributor.major동역학/제어-
dc.identifier.uciI804:11032-000000160762-
dc.identifier.holdings000000000042▲000000000044▲000000160762▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share