Publications

Detailed Information

정적 프로파일링을 통한 GPU 워크로드의 데이터 지역성 및 L1 캐시 분석 연구 : A Study on Data Locality and L1 Cache Analysis of GPU Workload Using Static Profiling

DC Field Value Language
dc.contributor.advisor엄현상-
dc.contributor.author김지은-
dc.date.accessioned2023-06-29T02:00:42Z-
dc.date.available2023-06-29T02:00:42Z-
dc.date.issued2023-
dc.identifier.other000000174457-
dc.identifier.urihttps://hdl.handle.net/10371/193365-
dc.identifier.urihttps://dcollection.snu.ac.kr/common/orgView/000000174457ko_KR
dc.description학위논문(석사) -- 서울대학교대학원 : 공과대학 컴퓨터공학부, 2023. 2. 엄현상.-
dc.description.abstractGPU는 계산적 효율성이 알려짐에 따라 컴퓨터 그래픽스에만 활용되고 있는 것뿐만 아니라 고성능 컴퓨팅, 머신러닝 등 다양한 워크로드에서도 사용되고 있다. 이에 따라 GPU의 한정된 메모리 자원을 효율적으로 이용하려는 연구가 활발히 진행되고 있다. 특히 GPU 메모리 계층 구조에서 크기가 작지만 접근 속도가 빠른 L1 데이터 캐시를 효율적으로 활용하기 위해선 워크로드의 데이터 지역성을 알고 활용하는 것이 매우 중요하다.
따라서 본 논문은 워크로드의 데이터 지역성을 분석하고 객관화하기위한 척도를 제안한다. 이를 위해 PTX 코드를 기반으로 한 정적 프로파일링을 수행하여 지역성을 나타내는 지표를 정의하고 실제 다양한 GPU 워크로드들을 분석한다. 이러한 분석을 통해 본 연구가 제시하는 지역성 척도가 실제 실행 시 캐시 활용도와 유의미한 연관성이 있음을 확인하였다.
-
dc.description.abstractAs computational efficiency is known, GPUs are not only used for computer graphics, but also for various workloads such as high-performance computing and machine learning. Accordingly, research to efficiently use limited memory resources of GPUs is being actively conducted. In particular, it is very important to know and utilize the data locality of the workload in order to efficiently use the small but fast-access L1 data cache to handle memory bottleneck problems.
Therefore, this paper proposes a scale for analyzing and objectifying workload-specific data locality. To this end, various workloads used by actual GPUs were analyzed through static profiling based on PTX code. As a result of the static analysis, it was confirmed that there was a relationship between the degree of coalescing, coalescing graph, and cache utilization at the actual execution.
-
dc.description.tableofcontents제 1 장 서 론 1
1.1 GPU에서의 coalesced memory 접근 3
1.2 구성 7

제 2 장 관 련 연 구 8
2.1 데이터 지역성 정적 분석 9

제 3 장 본 론 11
3.1 연구의 내용 11
3.1.1 PTX 코드를 통한 데이터 지역성 분석 12
3.1.2 Load global 기반 syntax tree 생성 방법 13
3.1.3 Syntax tree 기반 지역성 그래프 생성 방법 15
3.1.4 PTX 코드를 통한 워프 수준 coalescing 접근 분석 16

제 4 장 실 험 19
4.1 실험 환경 19
4.2 L1 캐시와 coalescing의 관계 20
4.3 Degree of coalescing 그래프를 통한 분석 24

제 5 장 결 론 29
5.1 결과 분석 29

Abstract 34
-
dc.format.extentv, 34-
dc.language.isokor-
dc.publisher서울대학교 대학원-
dc.subjectGPU-
dc.subject정적 프로파일링-
dc.subjectData locality-
dc.subjectL1 cache-
dc.subjectMemory hierarchy-
dc.subject.ddc621.39-
dc.title정적 프로파일링을 통한 GPU 워크로드의 데이터 지역성 및 L1 캐시 분석 연구-
dc.title.alternativeA Study on Data Locality and L1 Cache Analysis of GPU Workload Using Static Profiling-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthorJieun KIM-
dc.contributor.department공과대학 컴퓨터공학부-
dc.description.degree석사-
dc.date.awarded2023-02-
dc.identifier.uciI804:11032-000000174457-
dc.identifier.holdings000000000049▲000000000056▲000000174457▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share