Browse

A Keyword-Based Exploratory Search Framework Exploiting User Tagging
사용자 태깅을 활용한 키워드 기반의 탐험적 검색 프레임워크

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors
이강표
Advisor
김형주
Major
공과대학 컴퓨터공학과
Issue Date
2012-08
Publisher
서울대학교 대학원
Keywords
user taggingsocial taggingweb searchexploratory search frameworkinverted index
Description
학위논문 (박사)-- 서울대학교 대학원 : 컴퓨터공학과, 2012. 8. 김형주.
Abstract
키워드는 웹 상의 유용한 자원들을 발견하고 또 관리하고자 하는 사용자들에게 있어서뿐만 아니라, 그 자원들의 위치를 찾아 인덱싱을 하는 기계들에게 있어서도 매우 중요한 역할을 수행한다. 최근 사용자 태그라 불리는 사용자가 직접 부여한 키워드가 정보검색의 품질을 향상시키는 데 있어서 각광을 받고 있는데, 이는 태그가 사람과 기계 사이에 다리를 놓아줄 수 있는 의미 있는 키워드로서의 역할을 하기 때문이다. 사용자 태깅이 개인적 차원에서 각각의 사용자로 하여금 웹 상의 자원들을 관리하고 후에 이에 대한 접근을 용이하게 할 수 있도록 한다면, 여러 사용자들의 참여로 이루어지는 소셜 태깅은 자신의 컨텐트(책갈피, 블로그, 음악, 사진, 동영상 등)를 소셜 태그를 통해 다른 사용자들과 공유함으로써 가치 있는 소셜 시맨틱스를 생성할 수 있도록 한다. 본 박사학위 논문에서는 웹 검색의 품질을 향상시키기 위해 사용자 태깅으로 생성된 개인적 차원의 시맨틱스와 소셜 시맨틱스를 모두 활용하는 키워드 기반의 탐험적 검색 프레임워크를 제안하였다. 이 프레임워크에서 사용자는 태그 기반의 검색 엔진과 상호작용을 주고 받으며 탐험적 검색을 수행하게 되는데, 이 태그 기반의 검색 엔진을 통해 유용한 웹 상의 자원에 대해 자신만의 키워드를 부여할 수 있고, 그 키워드들은 다시 동적인 질의 처리를 위한 인덱스 텀으로 활용된다. 뿐만 아니라, 이 프레임워크는 사용자로 하여금 탐험적 검색 과정에서 산출되는 검색 질의어, 태그, 자원, 심지어는 이해체계까지도 관리할 수 있도록 도와준다.
인덱싱의 관점에서 볼 때, 태깅의 중요한 요소들 중 태그와 자원 이외에도 사용자라는 요소가 있는데, 그 동안 전통적인 인버티드 인덱스 구조에서는 이 사용자에 대해서는 고려해 오지 않았다. 이러한 사용자 요소를 반영하고 조건부 질의에 유연하게 반응하기 위해 소셜 인버티드 인덱스를 제안하였다. 소셜 인버티드 인덱스는 사용자의 다양한 특징들을 가중치로 담기 위해 별도의 사용자 서브리스트를 유지하고 있는 확장된 인버티드 인덱스라 할 수 있다.
탐험적 검색을 수행하는 사용자들을 위해 사용자 태깅을 기반으로 메타인지를 고려한 검색 관리 시스템을 제안하였다. 이 시스템은 탐험적 검색 과제를 수행하는 동안 사용자의 메타인지적인 활동들을 돕고, Tagging & Querying History, Query Flow Map, Conceptual Tag Cloud, Session Manager 등과 같은 메타인지적인 시스템 지원을 제공하고자 고안되었다.
한편, 태그의 평평함(태그 사이의 계층구조나 관계가 없음)이나 애매모호함(여러 의미를 가지는 것) 등과 같은 사용자 태그의 본질적인 특징들은 자신의 태그를 부여하고 다른 사람의 태그를 이해하고자 하는 사용자들에게 혼란을 줄 수 있다. 태그의 이러한 한계를 극복하기 위해, 두 태그 사이의 상하위 관계를 뽑아내기 위한 통계적 모델링에 기반하여 FolksoViz라는 소셜 태그 시각화 기법을 제안하였고, 각각에 태그에 상응하는 위키피디아 문서를 찾아 매핑해주는 TSD라는 태그 의미를 명확하게 하는 방법을 제안하였다.
또한, 정량적인 분석과 정성적인 분석으로 이어진 실험들을 통해 본 논문에서 제안한 기법, 자료 구조, 알고리즘, 시스템 설계 등이 효과적으로 웹 검색 품질을 개선하였음을 증명하였다.
Keywords have played critical roles not only for users who seek to find and organize useful web resources, but also for machines that locate and index those resources. Recently, user-assigned keywords, called user tags, are gaining significance for the improvement of Information Retrieval (IR) performances, in that those tags can act as meaningful keywords bridging the gap between humans and machines. While user tagging enables each user to manage her web resources for later retrieval at a personal level, social tagging driven by the participation of numerous users creates valuable social semantics by sharing their own content (e.g., bookmarks, blogs, music, photos, and videos) with others through social tags. In this doctoral dissertation, we propose a keyword-based exploratory search framework that exploits both the personal semantics and the social semantics created from user tagging in order to improve the web search performances. In this framework, a user can perform the exploratory search interacting with the tag-based search engine that allows her to tag useful web resources with her own keywords and uses the keywords as index terms for dynamic query evaluation. Furthermore, the framework helps the user manage her search outcomes such as search queries, tags, resources, and even the understanding she acquires during the exploratory search process.
In terms of indexing, one critical aspect of tagging besides the tag and the resource is the user, which has not been considered in traditional inverted indexes. In order to contain this user aspect and facilitate a flexible response to conditional queries, we propose a social inverted index – an extended inverted index that maintains separate user sublists to contain each user’s various features as weights.
Based on user tagging, we build a metacognition-aware search management system for exploratory searchers. This system is designed to support the metacognitive activities of users performing their exploratory search tasks, and to provide metacognitive system support such as Tagging & Querying History, Query Flow Map, Conceptual Tag Cloud, and Session Manger.
The intrinsic natures of user tags including the flatness (no hierarchy and relationship among tags) and the ambiguity (multiple senses) often confuse users who try to assign their own tags or to comprehend other users’ tags. In order to overcome these limitations, we propose a social tag visualization method, FolksoViz, based on the statistical modeling to extract the subsumption relationship between two tags, and a tag sense disambiguation method, TSD, based on the mappings from tags to their corresponding Wikipedia documents.
The experiments followed by both quantitative and qualitative analyses show that our proposed methods, data structures, algorithms, and system designs to improve the web search performances were effective.
Language
English
URI
http://hdl.handle.net/10371/119990
Files in This Item:
Appears in Collections:
College of Engineering/Engineering Practice School (공과대학/대학원)Dept. of Computer Science and Engineering (컴퓨터공학부)Theses (Ph.D. / Sc.D._컴퓨터공학부)
  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse