Publications

Detailed Information

Supporting Scalable Interaction and Analysis in Data Visualization using Colors : 색상을 활용한 확장성 높은 상호작용 및 분석을 지원하는 데이터 시각화

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

복진욱

Advisor
서진욱
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
Information VisualizationMultivariate DataUser InteractionColors
Description
학위논문(박사) -- 서울대학교대학원 : 공과대학 컴퓨터공학부, 2023. 8. 서진욱.
Abstract
Information visualization harnesses the capabilities of human vision by representing data through visual graphics, facilitating effective data exploration through visual graphics. However, with the ever-increasing size of data surpassing the limitations of human perception, providing scalability in visualizations has become a significant topic of research. Various methods and workflows have been developed to address the issue of scalability in information visualization, with combining multiple extracted information from the data in a coherent manner to enhance interaction with data. However, despite the efforts to effectively manage scalability, there are situations where dealing with the information of multiple values across multiple items becomes inevitable, particularly when resources are limited. In such cases, previous approaches may become inadequate, and users may need to resort to interacting with individual items, thereby encountering the scalability problem once again.

Reflecting the limitations, we introduce approaches in resolving the scalability issue of interacting with large sized multivariate data, utilizing colors as an important channel for resolving scalability. We leverage the critical advantage of colors in visualizing multiple values in limited space, allowing users to expand their understanding by interpreting the color patterns associated with different values. Tackling scalability issues in visualizing multiple items, we present Parallel Histogram Plot (PHP), a technique that overcomes the innate limitations of parallel coordinates plot (PCP) by attaching stacked-bar histograms with discrete color schemes to PCP. The color-coded histograms enable users to see an overview of the whole data without cluttering or scalability issues. Each rectangle in the PHP histograms is color coded according to the data ranking by a selected attribute. The color-coding scheme allows users to visually examine relationships between attributes, even between those that are displayed far apart, without repositioning or reordering axes. Addressing the complexity of multiple attributes in items, we introduce IssueML, a visualization system for monitoring and analyzing multiple issues that occur during the development of large softwares. Based on expert interviews, IssueML is equipped with specialized visualization techniques for monitoring issues and their progress over time. With the help of multiple, coordinated views, IssueML enables scalable observation and analysis of multiple issues, following the Visual Information Seeking Mantra. Finally, to support the users interaction with multiple items, we propose TRaVis, a novel visualization approach in visualizing temporal rank data. In TRaVis each of the ranking changes are ex- pressed as a single row of color patches, which are stacked according to order without overlapping. Such heatmap-like visualization enables the observation of trends of multiple items in a non-cluttering manner. By altering how items are stacked in the visualization, TRaVis enables the examination of temporal rank data in conjunction with the sorting criterion, which supports curious individuals in their visual information seeking process. We wrap up the dissertation by discussing the learned lessons and suggesting future research agendas based on the three researches.
정보시각화에서는 인간의 시각적 인지 능력의 활용을 극대화하기 위해 데이터 를 그래픽의 형태로 표현하여 시용자가 그래픽을 통해 데이터를 탐색할 수 있도록 돕는다. 그러나, 증가하는 데이터의 크기와 복잡도로 인하여 시각화에 확장성 (scalability)을 제공하는 문제는 정보시각화의 주요 연구 주제로 발전하였다. 이를 해결하기 위하여 데이터의 정보를 다양한 측면에서 추출하고 그들을 효과적으로 조합하여 전체적인 데이터와 상호작용 할 수 있도록 돕는 다양한 방법론들이 제시되었다. 그러나 이러한 노력에도 불구하고, 사용자가 필수적으로 여러 개별 데이터의 여러 값들과 직접 직면하는 상황은 불가피할게 발생하며, 이는 특히 사용자가 활용할 수 있는 자원이 부족할 경우 더욱 빈번하게 발생한다. 이러한 경우 사용자는 다시 개별적인 아이템과의 상호작용으로 인한 확장성 문제에 직면할 수 밖에 없게 된다.

이러한 한계점들에서 착안하여, 본 논문에서는 색상을 주요 시각화 방법론으로 활용하여 큰 사이즈의 다변량 데이터 (multivariate data) 에서의 확장성 문제를 해결하는 방법들을 제시한다. 연구에서는 한정된 공간 안에 많은 값들을 표현하고 사용자가 여러 값의 패턴을 통해 데이터를 이해하고 상호작용할 수 있도록 돕는 색상의 장점을 활용한다. 많은 아이템을 시각화하는데 있어서의 확장성을 위해 서, parallel coordinates plot (PCP)에서 발생하는 확장성과 관련된 한계점들을 이산적인 색상 체계 (discrete color scheme)가 부여된 히스토그램으로 극복하는 Parallal Histogram Plot (PHP)를 고안하였다. 색상이 적용된 히스토그램을 통해 사용자는 겹침 문제나 확장성 문제 없이 전체 데이터의 개요를 확인 할 수 있다. PHP에서 각 히스토그램의 사각형은 선택한 속성의 순위를 기준으로 색상이 부여 된다. 이러한 색상 부여 방식을 통해 사용자는 축의 재배치나 재정렬 없이도 멀리 떨어진 속성들간의 관계 또한 관찰 할 수 있다. 데이터의 복잡하고 많은 속성을 시각화하는데 있어서의 확장성을 위해, 본 연구에서는 거대 소프트웨어 개발 중 발생하는 여러 이슈들을 분석하고 모니터링 하는것을 지원하는 시각적 시스템인 IssueML을 개발하였다. 전문가와의 인터뷰를 기반으로, IssueML은 시간 경과에 따른 여러 이슈와 그들의 진행 상황을 모니터링 하기 위한 각종 시각화 기법으로 구성되어 있다. Visual Information Seeking Mantra를 따르는 여러 협응하는 시각화들의 활용을 통해 사용자는 확장성 높은 방법으로 여러 이슈의 경과를 모니터링 및 분석 할 수 있다. 끝으로, 사용자의 여러 아이템과의 상호작용을 지원하기 위해, 시간적 순위 데이터 시각화의 새로운 접근 방식인 TRaVis를 제안하였다. TRaVis 에서는 각각의 순위 변화를 색상이 부여 된 단일 행 (column) 으로 표현하며, 이 들은 공간상에서 서로 겹치지 않게 쌓은 방식으로 표현된다. 이러한 히트맵과 유사한 방식의 시각화는 여러 아이템의 순위 변화를 서로 겹치지 않게 관찰 할 수 있도록 한다. 시각화에서 항목이 쌓이는 순서를 변경함으로써 사용자는 TRaVis 를 통해 시간에 따른 순위 변화가 정렬 기준에 따라 어떤 특징이 있는 지를 관찰할 수 있으며, 이는 사용자의 다양한 호기심 있는 탐색 과정을 지원한다. 끝맺음으로, 세 가지 연구를 기반으로 배운 교훈을 논의하고 향후 연구 방향을 제안한다.
Language
eng
URI
https://hdl.handle.net/10371/196508

https://dcollection.snu.ac.kr/common/orgView/000000178820
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share