Publications

Detailed Information

Efficient Data Management Schemes for High-Performance Storage Devices : 고성능 저장장치를 위한 효율적인 데이터 관리 기법

DC Field Value Language
dc.contributor.advisor염헌영-
dc.contributor.author송내영-
dc.date.accessioned2018-11-12T00:56:16Z-
dc.date.available2018-11-12T00:56:16Z-
dc.date.issued2018-08-
dc.identifier.other000000152577-
dc.identifier.urihttps://hdl.handle.net/10371/143099-
dc.description학위논문 (박사)-- 서울대학교 대학원 : 공과대학 컴퓨터공학부, 2018. 8. 염헌영.-
dc.description.abstract최근 하드웨어 기술의 발전으로 저장 장치가 발전함에 따라 Solid State Drive (SSD) 와 같은

고성능 저장 장치가 등장하였다.

고성능 저장 장치들은 높은 대역폭, 낮은 지연시간, 높은 입출력 및 병렬성을 제공하며, 기존 Hard Disk Drive (HDD) 의

기계적 오버헤드를 없앴기 때문에 데이터 접근을 수 십에서 수 백 배 빠르게 한다.

하지만, 이러한 고성능 저장 장치들을 기존의 소프트웨어 계층에서 그대로 사용하게 된다면

소프트웨어 계층의 오버헤드 때문에 고성능 저장 장치의 성능을 최대로 사용할 수없다.



본 논문에서는 고성능 저장 장치의 특성에 맞게 데이터 관리 기법들을 최적화한다.

고성능 저장 장치는 지연시간이 낮기 때문에 기존 소프트웨어 계층에서의 오버헤드가 더 많이 드러난다.

본 논문에서 지적한 첫 번째 소프트웨어 오버헤드는 페이지 회수 오버헤드이다.

고성능 저장 장치 기반의 시스템에서 매핑된 페이지를 회수 할 때 소프트웨어 계층의 unmap 오버헤드가 부각된다.

이를 줄이기 위해서 본 논문에서는 page recycling 기법을 제안하여 unmap overhead를 해당 응용 프로그램으로 국한시킴으로써 전체 시스템의 성능을 높일 수 있었다.



두 번째는 metadata lookup operation이다. 기존 리눅스 시스템에서는 파일들을 path 기반으로 관리하고 있다.

이러한 path 기반 파일들을 접근 하기 전에 반드시 수행되어야 하는 metadata operation은 hash table lookup이 중복됨으로써

파일 접근 시에 오버헤드를 유발한다.

이러한 오버헤드는 고성능 저장 장치에서 더 크게부각 되는데 상대적으로 데이터 접근의 오버헤드가 적어지기 때문이다.

따라서 효율적인 metadata lookup operation을 위해 본 논문에서는 hash table 을 접근할 때 검색 방향을 거꾸로 하는 backward finding 을 제안한다.

이와 같은 방법으로 metadata lookup operation의 횟수를 줄이고 전체 파일 접근 시간을 줄일 수 있었다.

기존의 Log-Structured Merge (LSM) 알고리즘은 기존 저장 장치의 지연 시간이 길다는 것을 고려하여서

알고리즘 자체를 복잡한 data structure를 사용 하여 구현하였다. 하지만 이러한 복잡한 data structure 때문에 오히려 부작용으로써

read/write amplification 이늘어난다.

고성능 저장 장치를 활용한다면 굳이 복잡한 data structure 를 사용하지 않아도 data 의 접근을 빠르게 할 수있다.

따라서 본 논문에서는 간단한 data structure 를 사용하여서 기존LSM 알고리즘을 수정하고 또한 write amplification 을

유발하는 compaction 과정도 data의 범위에 맞춰서 파일에 append만 사용하여서 효율적으로바꾸었다.

이러한 알고리즘을 HBase에 구현하여서 실험한 결과 write throughput 은 향상되었고 read/write amplification은 줄어들었다.
-
dc.description.tableofcontentsChapter 1 Introduction 1

1.1 ApproachesandContributions . 3

1.2 DissertationStructure 5

Chapter 2 Background and Motivation 6

2.1 Largescalesystems 6

2.2 High-performancestoragedevices 7

2.3 Exposedsoftwareoverheads. 8

2.3.1 Overhead of un-mapping in memory-mapped I/O . . . . . 8

2.3.2 Overhead of redundant metadata operations . . . . . . . . 12

2.3.3 Overhead of LSM algorithm in key-value store . . . . . . 15

Chapter 3 Design and Implementation 20

3.1 Memory-mapped I/O optimization . 20

3.1.1 Design. 20

3.1.2 Implementation 24

3.2 Metadataoperationoptimization 25

3.2.1 Design. 26

3.2.2 Implementation 32

3.3 LSMalgorithmoptimization. 33

3.3.1 Design. 33

3.3.2 Implementation 39

Chapter 4 Evaluation 42

4.1 Memory-mappedI/Operformance . 43

4.1.1 Syntheticbenchmarkresults. 43

4.1.2 Macrobenchmarkresults 46

4.2 Metadataoperationperformance 48

4.2.1 Microbenchmarks. 48

4.2.2 Real-worldworkload. 51

4.3 RLSMperformance 53

4.3.1 Writeperformance 54

4.3.2 Performance under the mixed workload . . . . . . . . . . 55

Chapter 5 Related Work 58

5.1 Efforttoadoptthechanges . 58

Chapter 6 Conclusion 68

요약 81
-
dc.language.isoen-
dc.publisher서울대학교 대학원-
dc.subject.ddc621.39-
dc.titleEfficient Data Management Schemes for High-Performance Storage Devices-
dc.title.alternative고성능 저장장치를 위한 효율적인 데이터 관리 기법-
dc.typeThesis-
dc.description.degreeDoctor-
dc.contributor.affiliation공과대학 컴퓨터공학부-
dc.date.awarded2018-08-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share