Publications

Detailed Information

대규모 컴퓨터 시스템의 미세 단위 성능 모델링 : Fine-Grained Performance Modeling for Large-Scale Computer System

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

강태헌

Advisor
김장우
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
시뮬레이션성능 평가트레이스 합성고성능 컴퓨팅
Description
학위논문(석사) -- 서울대학교대학원 : 공과대학 전기·정보공학부, 2023. 2. 김장우.
Abstract
병렬성이 높은 대규모 워크로드가 등장함에 따라 수퍼컴퓨터와 같은 대규모 컴퓨터 시스템에 대한 수요가 급증하고 있다. 전통적으로 시스템 디자이너들은 주어진 워크로드가 목표 성능에 도달할 수 있는 시스템을 최소한의 비용으로 구축하기 위해 실제 구축 이전 설계 단계에서 시스템에 대한 성능을 모델링을 통해 평가한다. 하지만, 적은 시간과 적은 하드웨어 리소스만으로 성능 모델링을 수행하는 것은 매우 어렵다. 이를 위한 선행 연구들이 발표되었으나, 이전 연구가 제안하는 방법론은 큰 모델링 단위로 인해 다양한 하드웨어 이벤트가 동시에 일어나는 워크로드 및 해당 워크로드를 실행할 수 있는 시스템에 대해 정확한 모델링을 하는 데에 한계를 가지고 있다.
본 논문에서는 대규모 컴퓨터 시스템의 성능 평가를 위한 저비용 미세 단위 성능 모델링 프레임워크를 제안하여 기존 연구의 한계를 해결한다. 제안하는 프레임워크는 주어진 워크로드를 워크로드 내에서 호출되는 함수를 최소 모델링 단위로 하여 기존 연구보다 정밀하게 모델링하는 동시에, 그 모델링 대상이 되는 함수의 범위를 최소한으로 설정하여 추가로 발생하는 모델링 오버헤드를 최소화한다. 원하는 시스템 및 워크로드 규모 대신, 소규모로 실행하여 추출한 함수 호출 트레이스들과 그 실행 데이터를 기반으로 대규모 실행 시 트레이스를 합성하고, 해당 트레이스 내 함수 호출 별 실행 시간을 예측하는 방식으로 대규모 실행에서의 그 작동 방식을 예측한다. HPC 및 AI 학습과 같은 실제 대규모 워크로드들을 벤치마크로 하여 실제 대규모 컴퓨터 시스템 상에서 제안한 프레임워크의 정확도를 검증했다.
As large-scale workloads with massive parallelism emerge, the demand for large-scale computer systems such as datacenters and supercomputers is rising sharply. Traditionally, architects have modeled performance to accurately design a large-scale system where a given large-scale workload can reach its target performance. However, modeling a large-scale system for a large-scale workload without the system is a highly challenging problem. Unfortunately, previous approaches suffer from inaccurate modeling of simultaneous hardware events due to their coarse-grained modeling granularity.
In this paper, we propose a fine-grained performance modeling framework for large scale system performance prediction to resolve the previous limitation. The framework works with a small-scale data to predict how the application runs on a large scale. It accurately models the applications by regarding a function as a minimum modeling granularity. Additionally, it lowers the modeling and profiling overhead by limiting the range of functions to model. We validate the accuracy of the framework with real-world benchmark workloads and systems.
Language
kor
URI
https://hdl.handle.net/10371/193291

https://dcollection.snu.ac.kr/common/orgView/000000174765
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share