Publications

Detailed Information

Cartesian Tree Matching and Indexing : Cartesian 트리에 기반한 문자열 매칭 및 인덱싱

DC Field Value Language
dc.contributor.advisor박근수-
dc.contributor.author박성관-
dc.date.accessioned2020-10-13T02:58:54Z-
dc.date.available2020-10-13T02:58:54Z-
dc.date.issued2020-
dc.identifier.other000000162731-
dc.identifier.urihttps://hdl.handle.net/10371/169363-
dc.identifier.urihttp://dcollection.snu.ac.kr/common/orgView/000000162731ko_KR
dc.description학위논문 (석사) -- 서울대학교 대학원 : 공과대학 컴퓨터공학부, 2020. 8. 박근수.-
dc.description.abstractWe introduce a new metric of match, called Cartesian tree matching, which means that two strings match if they have the same Cartesian trees.
Based on Cartesian tree matching, we define single pattern matching for a text of length n and a pattern of length m, and multiple pattern matching for a text of length n and k patterns of total length m.
We present an O(n+m) time algorithm for single pattern matching, and an O((n+m) log k) deterministic time or O(n+m) randomized time algorithm for multiple pattern matching.
We also define an index data structure called Cartesian suffix tree, and present an O(n) randomized time algorithm to build the Cartesian suffix tree.
Our efficient algorithms for Cartesian tree matching use a representation of the Cartesian tree, called the parent-distance representation.
-
dc.description.abstract본 논문에서는 Cartesian 트리에 기반한 새로운 매칭 기준인 Cartesian 트리 매칭을 제안한다. 이는 두 문자열의 Cartesian 트리가 서로 같을 때, 두 문자열을 매칭된 것으로 정의하는 문제이다.

Cartesian 트리 매칭의 기준 하에서, 본 연구에서는 길이 n인 텍스트와 길이 m인 패턴 사이의 단일패턴매칭 문제와 길이 n인 텍스트와 길이의 합이 m인 여러 개의 패턴 사이의 다중패턴매칭 문제를 정의하고, 단일패턴매칭 문제를 해결하는 O(n+m) 시간 알고리즘과 다중패턴매칭 문제를 해결하는 O((n+m) log k) 시간 결정론적 알고리즘 및 O(n+m) 시간 무작위 알고리즘을 제시한다. 또한, Cartesian 트리 매칭에 대한 인덱스 자료구조인 Cartesian 접미사트리를 정의하고,
이를 구축하는 O(n) 시간 무작위 알고리즘을 제시한다.

본 논문에서는 Cartesian tree를 표현하는 방식인 부모거리표현 (parent-distance representation)을 정의하고, 이를 이용하여 위 문제들을 해결하는 효율적인 알고리즘들을 제시한다.
-
dc.description.tableofcontentsChapter 1 Introduction 1
Chapter 2 Problem Definition 4
2.1 Basic notations 4
2.2 Cartesian tree matching 4
Chapter 3 Single Pattern Matching in O(n + m) Time 7
3.1 Parent-distance representation 7
3.2 Computing parent-distance representation 9
3.3 Failure function 11
3.4 Text search 13
3.5 Computing failure function 13
3.6 Correctness and time complexity 14
3.7 Cartesian tree signature 15
Chapter 4 Multiple Pattern Matching in O((n + m) log k) Time 17
4.1 Constructing the Aho-Corasick automaton 17
4.2 Multiple pattern matching 21
Chapter 5 Cartesian Suffix Tree in Randomized O(n) Time 22
5.1 Defining Cartesian suffix tree 22
5.2 Constructing Cartesian suffix tree 23
Chapter 6 Conclusion 26
Bibliography 27
요약 31
-
dc.language.isoeng-
dc.publisher서울대학교 대학원-
dc.subjectCartesian tree matching-
dc.subjectPattern matching-
dc.subjectIndexing-
dc.subjectParent-distance representation-
dc.subjectCartesian 트리 매칭-
dc.subject패턴매칭-
dc.subject인덱싱-
dc.subject부모거리표현-
dc.subject.ddc621.39-
dc.titleCartesian Tree Matching and Indexing-
dc.title.alternativeCartesian 트리에 기반한 문자열 매칭 및 인덱싱-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthorSung Gwan Park-
dc.contributor.department공과대학 컴퓨터공학부-
dc.description.degreeMaster-
dc.date.awarded2020-08-
dc.identifier.uciI804:11032-000000162731-
dc.identifier.holdings000000000043▲000000000048▲000000162731▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share