Publications

Detailed Information

암 유전자 발현을 중심으로 한 유전자 발현 옴니버스 데이터베이스 통합 도구 개발

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김필종

Advisor
김홍기
Major
치의학대학원 치의과학과
Issue Date
2016-08
Publisher
서울대학교 대학원
Keywords
GEO데이터 통합유전자 발현형TCGA임상 병리 데이터데이터 분석
Description
학위논문 (박사)-- 서울대학교 대학원 : 치의과학과, 2016. 8. 김홍기.
Abstract
GEO(Gene Expression Omnibus) 데이터베이스에 저장된 마이크로어레이, 차세대 염기서열분석 데이터와 같은 생물학 데이터의 활용은 실험의 재검증 및 데이터의 재해석을 통한 새로운 가설의 검증과 같은 중요한 역할을 한다. 현재 GEO 데이터를 활용하기 위해서는 직접적으로 GEO 데이터를 처리하거나 수동으로 저장되어 분석할 수 있게 만들어 놓은 정적 데이터에 기반한 서비스를 사용해야 한다. 본 연구에서는 연구자에게 필요한 GEO 리스트를 입력으로 받아들여 GEO의 암 연구 데이터를 통합 분석할 수 있는 프로그램을 목표로 하였다.
암유전체 아틀라스(TCGA
The Cancer Genome Atlas)는 많은 암종에 대한 다양한 생물학적 데이터를 저장하고 있는 데이터베이스이다. 본 연구에서는 연구자들이 최신의 TCGA 데이터를 쉽게 저장할 수 있도록 하며 TCGA 데이터를 GEO에 통합할 수 있는 모듈을 개발하고 GEO와 TCGA 데이터 통합 분석 도구를 개발하였다.
GEO 내의 암 연구와 관련된 데이터 세트의 표현형 데이터를 결합하여 하나의 큰 표현형 테이블로 통합해 낼 수 있는 GEO 표현형 통합 모듈을 개발하였다. GEO 유전자 발현 데이터의 통합을 위해서 각 GEO의 유전자 발현 데이터 세트에서 서로 다른 탐지자 이름을 유전자 이름으로 변환할 수 있는 모듈을 개발하였다. 통합된 데이터에서 연구자가 관심있는 특성을 나누는 각 기준점을 종속 변수로 가장 통계적으로 유의미하게 나눌 수 있도록 종속변수의 특성을 고려한 독립변수의 기준점 제시 모듈을 개발하였다. 집단에 따른 표현형 데이터 테이블 및 분석 도표와 유전 정보와 관련된 분석 결과를 제공하기 위한 문서화 모듈을 개발함으로써 연구자들이 분석 정보에 쉽게 활용할 수 있도록 하였다. 위 모듈로 생성한 데이터에 다른 GEO 데이터를 추가로 통합하는 경우에 대응하기 위해서 표현형과 유전자 발현 데이터를 통합하는 GEO 데이터 추가 프로그램을 개발하였다. 본 연구는 기존 GEO2R과 다르게 90% 이상에서 테이블 변환이 가능하였으며 정적 데이터에 기반한 기존 연구와 다르게 동적으로 데이터를 추가하여 표현형 데이터의 양을 늘리거나 유전자 발현 데이터를 동적으로 결합하는 데이터의 확장성을 보여주었다. 그리고 통합 GEO 프로그램에 그래픽 유저 인터페이스를 적용하여 연구자들의 접근성을 높였다.
본 연구에서는 GEO 데이터베이스의 자료를 통합, 분석할 수 있는 방법을 제시함으로써 생명정보학의 데이터의 이차적 사용에 기여할 것이며 본 연구결과는 생물학 분야의 연구자에게 더 많은 연구 아이디어를 제시할 수 있을 것이다.
Language
Korean
URI
https://hdl.handle.net/10371/125119
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share