Publications

Detailed Information

공유된 GPU 클러스터의 효율적인 자원 배분에 관한 연구 : A Methodology for Efficient Scheduling on GPU-enabled Clusters

DC Field Value Language
dc.contributor.advisor전병곤-
dc.contributor.author서장호-
dc.date.accessioned2020-10-13T02:59:12Z-
dc.date.available2020-10-13T02:59:12Z-
dc.date.issued2020-
dc.identifier.other000000161589-
dc.identifier.urihttps://hdl.handle.net/10371/169367-
dc.identifier.urihttp://dcollection.snu.ac.kr/common/orgView/000000161589ko_KR
dc.description학위논문 (석사) -- 서울대학교 대학원 : 공과대학 컴퓨터공학부, 2020. 8. 전병곤.-
dc.description.abstract딥 러닝 학습 작업은 상대적으로 비싼 계산 자원인 GPU를 적극적으로 활용하며, 이 때 여러 학습 작업이 공유하는 GPU 클러스터를 관리하는 자원 관리자를 도입하는 것이 일반적이다. 이 논문은 자원 관리자가 어느 작업에 주어진 자원을 재배정하거나, 그 양을 탄력적으로 줄이거나 늘릴 수 있는 역량을 갖추는 방법에 대해 탐구한다. 또한 이러한 방식을 시험하기 위해 제작한 시험적 구현체가, GPU들을 정적으로 분할하는 스케줄러에 비해 GPU 활용률과 전체 워크로드 처리에 걸린 시간 측면에서 우수한 성능을 보인 사례를 제시한다.-
dc.description.abstractDeep learning training jobs utilize GPUs, which are relatively expensive resources on todays computing clusters. It is common to introduce a resource manager which governs multi-tenant GPU cluster shared among multiple jobs. This paper presents a protocol in which a resource manager can dynamically relocate a job to another set of resources, or elastically shrink or grow its resource usage. This paper also presents a case where the prototype implementation of the protocol outperforms a statically-partitioning scheduler in terms of GPU utilization and overall workload completion time.-
dc.description.tableofcontents1. 개요 1
2. 배경 5
2.1. 딥 러닝의 과정과 성능 5
2.2. 자원 관리자 7
2.3. 딥 러닝을 위한 자원 관리자 11
3. F-스케줄링 14
3.1. 감속률과 공평성 16
4. 시험적 구현체 18
4.1. 자원 모델링 18
4.2. 스케줄링 알고리즘 19
4.3. 시스템 아키텍처 21
4.4. 스케줄러 구현 22
5. 성능 평가 25
5.1. 실험 설정 25
5.2. 실험 결과 27
6. 결론 30
참고문헌 31
Abstract 34
-
dc.language.isokor-
dc.publisher서울대학교 대학원-
dc.subject자원 관리자-
dc.subject스케줄러-
dc.subject탄력적 자원 사용-
dc.subject딥 러닝-
dc.subject분산 학습-
dc.subject자원 활용률-
dc.subject응답 시간-
dc.subject동적 자원 재배정-
dc.subjectResource manager-
dc.subjectScheduler-
dc.subjectResource elasticity-
dc.subjectDeep learning-
dc.subjectDistributed training-
dc.subjectResource utilization-
dc.subjectJob completion time-
dc.subjectDynamic resource replacement-
dc.subject.ddc621.39-
dc.title공유된 GPU 클러스터의 효율적인 자원 배분에 관한 연구-
dc.title.alternativeA Methodology for Efficient Scheduling on GPU-enabled Clusters-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthorJangho Seo-
dc.contributor.department공과대학 컴퓨터공학부-
dc.description.degreeMaster-
dc.date.awarded2020-08-
dc.identifier.uciI804:11032-000000161589-
dc.identifier.holdings000000000043▲000000000048▲000000161589▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share