Publications

Detailed Information

대규모 컴퓨터 시스템의 미세 단위 성능 모델링 : Fine-Grained Performance Modeling for Large-Scale Computer System

DC Field Value Language
dc.contributor.advisor김장우-
dc.contributor.author강태헌-
dc.date.accessioned2023-06-29T01:58:01Z-
dc.date.available2023-06-29T01:58:01Z-
dc.date.issued2023-
dc.identifier.other000000174765-
dc.identifier.urihttps://hdl.handle.net/10371/193291-
dc.identifier.urihttps://dcollection.snu.ac.kr/common/orgView/000000174765ko_KR
dc.description학위논문(석사) -- 서울대학교대학원 : 공과대학 전기·정보공학부, 2023. 2. 김장우.-
dc.description.abstract병렬성이 높은 대규모 워크로드가 등장함에 따라 수퍼컴퓨터와 같은 대규모 컴퓨터 시스템에 대한 수요가 급증하고 있다. 전통적으로 시스템 디자이너들은 주어진 워크로드가 목표 성능에 도달할 수 있는 시스템을 최소한의 비용으로 구축하기 위해 실제 구축 이전 설계 단계에서 시스템에 대한 성능을 모델링을 통해 평가한다. 하지만, 적은 시간과 적은 하드웨어 리소스만으로 성능 모델링을 수행하는 것은 매우 어렵다. 이를 위한 선행 연구들이 발표되었으나, 이전 연구가 제안하는 방법론은 큰 모델링 단위로 인해 다양한 하드웨어 이벤트가 동시에 일어나는 워크로드 및 해당 워크로드를 실행할 수 있는 시스템에 대해 정확한 모델링을 하는 데에 한계를 가지고 있다.
본 논문에서는 대규모 컴퓨터 시스템의 성능 평가를 위한 저비용 미세 단위 성능 모델링 프레임워크를 제안하여 기존 연구의 한계를 해결한다. 제안하는 프레임워크는 주어진 워크로드를 워크로드 내에서 호출되는 함수를 최소 모델링 단위로 하여 기존 연구보다 정밀하게 모델링하는 동시에, 그 모델링 대상이 되는 함수의 범위를 최소한으로 설정하여 추가로 발생하는 모델링 오버헤드를 최소화한다. 원하는 시스템 및 워크로드 규모 대신, 소규모로 실행하여 추출한 함수 호출 트레이스들과 그 실행 데이터를 기반으로 대규모 실행 시 트레이스를 합성하고, 해당 트레이스 내 함수 호출 별 실행 시간을 예측하는 방식으로 대규모 실행에서의 그 작동 방식을 예측한다. HPC 및 AI 학습과 같은 실제 대규모 워크로드들을 벤치마크로 하여 실제 대규모 컴퓨터 시스템 상에서 제안한 프레임워크의 정확도를 검증했다.
-
dc.description.abstractAs large-scale workloads with massive parallelism emerge, the demand for large-scale computer systems such as datacenters and supercomputers is rising sharply. Traditionally, architects have modeled performance to accurately design a large-scale system where a given large-scale workload can reach its target performance. However, modeling a large-scale system for a large-scale workload without the system is a highly challenging problem. Unfortunately, previous approaches suffer from inaccurate modeling of simultaneous hardware events due to their coarse-grained modeling granularity.
In this paper, we propose a fine-grained performance modeling framework for large scale system performance prediction to resolve the previous limitation. The framework works with a small-scale data to predict how the application runs on a large scale. It accurately models the applications by regarding a function as a minimum modeling granularity. Additionally, it lowers the modeling and profiling overhead by limiting the range of functions to model. We validate the accuracy of the framework with real-world benchmark workloads and systems.
-
dc.description.tableofcontents제 1 장 서 론 - 1
제 1 절 연구의 배경 - 1
제 2 절 연구의 내용 - 2
제 2 장 대규모 컴퓨터 시스템 성능 모델링 - 4
제 1 절 대규모 컴퓨터 시스템 설계 - 4
제 2 절 사이클 레벨 시뮬레이션 - 5
제 3 절 스켈레톤 기반 모델링 - 8
제 4 절 엔드-투-엔드 머신러닝 기반 모델링 - 11
제 5 절 통신 트레이스 기반 모델링 - 12
제 6 절 문제 정의 - 14
제 3 장 대규모 워크로드 특징 및 설계 목표 - 17
제 1 절 대규모 워크로드 - 17
제 2 절 프로세스 간 발견되는 유사성 - 19
제 3 절 프로세스 내 발견되는 반복성 - 22
제 4 절 함수 별 전체 실행 시간의 불균형 - 24
제 5 절 설계 목표 - 25
제 4 장 학습 기반 성능 모델링 - 27
제 1 절 프레임워크 개요 - 27
제 2 절 소규모 프로파일링 - 28
제 3 절 함수 트레이스 모델링 - 31
제 4 절 함수 실행 시간 모델링 - 34
제 5 절 오프라인 단계 - 36
제 5 장 평가 - 37
제 1 절 평가 환경 - 37
제 2 절 실험 결과 - 39
제 6 장 결론 및 제언 - 42
-
dc.format.extentvi, 48-
dc.language.isokor-
dc.publisher서울대학교 대학원-
dc.subject시뮬레이션-
dc.subject성능 평가-
dc.subject트레이스 합성-
dc.subject고성능 컴퓨팅-
dc.subject.ddc621.3-
dc.title대규모 컴퓨터 시스템의 미세 단위 성능 모델링-
dc.title.alternativeFine-Grained Performance Modeling for Large-Scale Computer System-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthorTaehun Kang-
dc.contributor.department공과대학 전기·정보공학부-
dc.description.degree석사-
dc.date.awarded2023-02-
dc.identifier.uciI804:11032-000000174765-
dc.identifier.holdings000000000049▲000000000056▲000000174765▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share