플래시 메모리 기반 SSD의 수명 향상을 위한 데이터 Deduplication 기법의 설계 및 구현

Cited 0 time in Web of Science Cited 0 time in Scopus


Issue Date
서울대학교 대학원
학위논문 (석사)-- 서울대학교 대학원 : 전기·컴퓨터공학부, 2012. 2. 김지홍.
SSD는 기계적인 요소가 존재하지 않기 때문에 하드디스크에 비해 임의 읽기/쓰기에 대한 성능이 우수하고 전력 소모량이 낮으며 충격에 강하다는 장점이 있다. 하지만 플래시 메모리의 블록 당 삭제 횟수가 제한된다는 특성으로 인해 SSD의 수명이 결정되어 버리는 문제가 대두되고 이러한 현상은 기술이 발전하는 추세에 따라 점차 심화되고 있다.
이러한 SSD의 수명 문제를 다루기 위한 기법중 하나인 de-duplication 즉, 중복되는 데이터를 찾아 제거하는 기법이 연구 되고 있다. 하지만 기존 기법에서는 소프트웨어적인 해시 값의 계산이 큰 부하를 발생시켜, 일부 데이터만을 처리하는 sampling 기법 등의 사용이 불가피 하다. 이러한 기법들은 해시 값 계산의 부하를 감소시키지만 SSD의 수명 향상의 효과 역시 경감시킨다.
본 논문에서는 중복 확인의 단위를 미세화 함으로써 기존 기법 대비 중복되는 데이터의 제거량을 향상시키는 기법을 제안한다. 이와 동시에 해시 값 계산의 비용을 하드웨어 가속기를 도입함으로써 효과적으로 줄이는 De-duplication 기법을 설계하였고, 이를 SSD 프로토타입에 구현함으로써 기법의 효과를 검증한 결과 기존 기법 대비 약 41%의 수명 향상 효과를 보였고 이에 따라 증가한 부하 역시 최대 65% 감소시켰다.
Recently, SSDs have gained wide popularity in comparison with hard disk drives due to its distinctive own merits such as high random access performance and low power consumptions. However, flash memories which have a limited number of erase operation per block, limit the lifespan of SSDs. In order to deal with this lifespan problem, a technique called de-duplication have been introduced which removes duplicated data from workload. The existing de-duplication scheme computes a hash value of incoming data with the software which incurs a huge time overhead. The scheme needs to exploit pre-hashing or sampling techniques to avoid the hash computation. The sampling technique, however, can miss potentially duplicated data, and thus the amount of the increased lifespan of the SSD cannot be maximized.
In this paper, we propose a fine-grained chunking module for fingerprinting so that the amount of duplicated data can be larger than the existing scheme. At the same time, we introduce a hardware accelerator for hashing which can reduce the time overhead
effectively. Eventually, we design a new de-duplication technique by combining these two modules and implement this technique on the SSD prototype to evaluate its benefit. The proposed technique reduces the amount of written data to the SSD by 41% compared to the existing scheme whose chunk size is a flash page. The write buffer and the read cache also reduce additional page reads incurred by this technique by 27% and 65%, respectively.
Files in This Item:
There are no files associated with this item.
Appears in Collections:
College of Engineering/Engineering Practice School (공과대학/대학원)Dept. of Computer Science and Engineering (컴퓨터공학부)Theses (Master's Degree_컴퓨터공학부)
  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.