Publications

Detailed Information

NUMA 시스템상의 ELF 바이너리 최적화 : Optimizing ELF binaries on NUMA systems

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김정욱

Advisor
이재진
Issue Date
2020
Publisher
서울대학교 대학원
Keywords
NUMA architectureELF binaryDynamic linker/loaderNUMA 구조ELF 바이너리
Description
학위논문 (석사) -- 서울대학교 대학원 : 공과대학 컴퓨터공학부, 2020. 8. 이재진.
Abstract
프로세서 안에 집적되는 코어의 개수가 꾸준히 증가함에 따라 제
조사들은 확장성이 좋은 NUMA 구조로 칩을 디자인하고 있다.
NUMA 구조는 구조 상 불가피하게 리모트 메모리의 대역폭이 로컬
메모리에 비해 떨어진다. 칩 안의 코어 수가 더 증가됨에 따라 이
단점은 성능에 더 큰 영향을 미칠 것이다.
본 논문은 ELF 바이너리와 dynamic loader를 수정하여 프로그램
이 실행 중 로컬 메모리 접근으로만 명령어를 읽어 올 수 있도록
하는 최적화 방법을 제시한다. 본 논문에서 제시하는 최적화 방법은
아키텍처와 무관하게 적용 될 수 있으며, 컴파일 된 바이너리의 원
본 소스코드가 필요없고, 재컴파일 할 필요없이 적용 가능하다.
이 논문이 기여하는 바는 다음과 같다.
- 일반적인 서버용 시스템에서 NUMA 구조의 로컬 메모리, 리모
트 메모리로 인한 성능 차이를 보인다.
- 프로그램이 실행 중 로컬 메모리 접근만으로 명령어를 읽어 올
수 있도록 하는 최적화 방법을 제시한다.
- 총 15개의 벤치마크 프로그램에 제시한 최적화 방법을 적용하여
실제로 성능이 개선됨을 확인하였다.
제시한 최적화 방법은 주기적으로 리모트 메모리 접근을 하는 벤
치마크 실험에서 NPB의 경우, 최대 11.6%, 평균 7.0%의 성능 향상
을 보였으며, PARSEC의 경우 최대 18.7%, 평균 10.1%의 성능 향상
을 보였다.
As the number of cores integrated into a single processor
continues to increase, manufacturers are designing chips using
NUMA architectures. In NUMA architecture, the bandwidth of
remote memory is inevitably lower than that of local memory. As
the number of cores in a single chip increases, this drawback
will have a bigger impact on performance.
This paper proposes an optimization technique that modifies
ELF binaries and dynamic loader. It makes programs to read
instructions only by accessing local memory during execution.
The proposed optimization technique can be applied to all
architecture, does not need the original source code of the
compiled binary and can be applied without recompilation.
This paper makes the following contributions:
- Evaluate the impact of local and remote memory in NUMA
structure in NPB and PARSEC benchmark suite.
- Proposes the optimization technique that makes programs to
execute only by accessing local memory for instructions.
- Optimization technique applied to a total of 15 benchmark
programs, confirmed performance improvement.
The proposed technique shows the performance improvement of
up to 11.6% and an average 7.0% for NPB, and up to 18.7% and
an average 10.1% for PARSEC.
Language
kor
URI
https://hdl.handle.net/10371/169343

http://dcollection.snu.ac.kr/common/orgView/000000162330
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share