Publications

Detailed Information

대용량 과학데이터에 대한 저용량 필터링 기법 : Space Efficient Filtering Methods for Large-Scale Scientific Data

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김태훈

Advisor
문봉기
Major
공과대학 컴퓨터공학부
Issue Date
2017-02
Publisher
서울대학교 대학원
Keywords
인덱싱
Description
학위논문 (석사)-- 서울대학교 대학원 : 컴퓨터공학부, 2017. 2. 문봉기.
Abstract
대용량 배열기반 과학데이터의 차원에 대한 필터 연산과 달리 속성에 대한 필터 연산은 전체적 스캔을 통해 실시되므로 많은 시간이 소요된다. 그러나 필터 연산을 효율적으로 처리하기 위한 인덱싱 기법은 별도의 많은 저장공간을 필요로 한다. 본 논문에서는 대용량 배열기반 과학데이터의 속성에 대한 필터 연산을 신속하게 함과 동시에 인덱스의 저장공간을 매우 효율적으로 감소시키는 새로운 인덱싱 기법인 CRRF를 소개한다. CRRF는 비트의 배열을 통해 데이터 집단 내의 값들의 분포를 효과적으로 반영할 수 있는 자료구조인 ARF의 활용 범위를 인덱싱까지 넓힌 것이다. CRRF는 실수 형식의 값들로 구성된 데이터 집단의 요약을 가능케 하며, 정수 배열에 비트 배열을 압축 저장함으로써 공간 활용의 효율을 극대화한다. 또한 인덱싱의 정확성과 안정성을 추구하기 위해 질의 처리 시 별도의 인덱스 변형 과정을 제거하고 인덱스 생성 단계에서 데이터 집단을 가능한 한 정밀하게 반영하여 위양성(false-positive)을 최소화한다. 본 연구의 실험에서 CRRF의 저장공간이 B+-tree에 비해 매우 작다는 것을 보였다. 또한 CRRF를 사용하는 인덱싱의 성능이 B+-tree 인덱싱과 비슷하다는 것을 확인하였다.
Language
Korean
URI
https://hdl.handle.net/10371/122690
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share