Publications

Detailed Information

암 유전자 발현을 중심으로 한 유전자 발현 옴니버스 데이터베이스 통합 도구 개발

DC Field Value Language
dc.contributor.advisor김홍기-
dc.contributor.author김필종-
dc.date.accessioned2017-07-14T05:45:02Z-
dc.date.available2017-07-14T05:45:02Z-
dc.date.issued2016-08-
dc.identifier.other000000136493-
dc.identifier.urihttps://hdl.handle.net/10371/125119-
dc.description학위논문 (박사)-- 서울대학교 대학원 : 치의과학과, 2016. 8. 김홍기.-
dc.description.abstractGEO(Gene Expression Omnibus) 데이터베이스에 저장된 마이크로어레이, 차세대 염기서열분석 데이터와 같은 생물학 데이터의 활용은 실험의 재검증 및 데이터의 재해석을 통한 새로운 가설의 검증과 같은 중요한 역할을 한다. 현재 GEO 데이터를 활용하기 위해서는 직접적으로 GEO 데이터를 처리하거나 수동으로 저장되어 분석할 수 있게 만들어 놓은 정적 데이터에 기반한 서비스를 사용해야 한다. 본 연구에서는 연구자에게 필요한 GEO 리스트를 입력으로 받아들여 GEO의 암 연구 데이터를 통합 분석할 수 있는 프로그램을 목표로 하였다.
암유전체 아틀라스(TCGA
-
dc.description.abstractThe Cancer Genome Atlas)는 많은 암종에 대한 다양한 생물학적 데이터를 저장하고 있는 데이터베이스이다. 본 연구에서는 연구자들이 최신의 TCGA 데이터를 쉽게 저장할 수 있도록 하며 TCGA 데이터를 GEO에 통합할 수 있는 모듈을 개발하고 GEO와 TCGA 데이터 통합 분석 도구를 개발하였다.
GEO 내의 암 연구와 관련된 데이터 세트의 표현형 데이터를 결합하여 하나의 큰 표현형 테이블로 통합해 낼 수 있는 GEO 표현형 통합 모듈을 개발하였다. GEO 유전자 발현 데이터의 통합을 위해서 각 GEO의 유전자 발현 데이터 세트에서 서로 다른 탐지자 이름을 유전자 이름으로 변환할 수 있는 모듈을 개발하였다. 통합된 데이터에서 연구자가 관심있는 특성을 나누는 각 기준점을 종속 변수로 가장 통계적으로 유의미하게 나눌 수 있도록 종속변수의 특성을 고려한 독립변수의 기준점 제시 모듈을 개발하였다. 집단에 따른 표현형 데이터 테이블 및 분석 도표와 유전 정보와 관련된 분석 결과를 제공하기 위한 문서화 모듈을 개발함으로써 연구자들이 분석 정보에 쉽게 활용할 수 있도록 하였다. 위 모듈로 생성한 데이터에 다른 GEO 데이터를 추가로 통합하는 경우에 대응하기 위해서 표현형과 유전자 발현 데이터를 통합하는 GEO 데이터 추가 프로그램을 개발하였다. 본 연구는 기존 GEO2R과 다르게 90% 이상에서 테이블 변환이 가능하였으며 정적 데이터에 기반한 기존 연구와 다르게 동적으로 데이터를 추가하여 표현형 데이터의 양을 늘리거나 유전자 발현 데이터를 동적으로 결합하는 데이터의 확장성을 보여주었다. 그리고 통합 GEO 프로그램에 그래픽 유저 인터페이스를 적용하여 연구자들의 접근성을 높였다.
본 연구에서는 GEO 데이터베이스의 자료를 통합, 분석할 수 있는 방법을 제시함으로써 생명정보학의 데이터의 이차적 사용에 기여할 것이며 본 연구결과는 생물학 분야의 연구자에게 더 많은 연구 아이디어를 제시할 수 있을 것이다.
-
dc.description.tableofcontents1. 서 론 1

2. 연구 목적 8

3. 관련 연구 9
3.1 GEO 데이터베이스 9
3.2 GEO2R 15
3.3 SurvExpress 17
3.4 Kaplan Meier-plotter 17
3.5 TCGA 데이터베이스 18
3.6 TCGA Data Download Service 20
3.7 정리 23

4. 연구 방법 25
4.1 GSE 데이터 형태 분석 25
4.2 GEO 표현형 데이터 통합 모듈 개발 25
4.3 GEO 유전자 발현 정보 통합 모듈 개발 26
4.4 신규 GEO 데이터 통합 도구 개발 27
4.5 TCGA 데이터 획득 모듈 및 통합 모듈 개발 27
4.6 데이터 분석 모듈 개발 28
4.7 R 프로그래밍 언어 기반 모듈 개발 29

5. 연구 결과 31
5.1 GSE 데이터 형식 분석 31
5.2 GEO 표현형 데이터 자료 표준화 모듈 개발 35
5.3 GEO 유전자 발현 정보 통합 모듈 개발 41
5.4 GEO 데이터 분석 모듈 개발 48
5.5 신규 GEO 데이터 통합 도구 개발 56
5.6 TCGA 데이터 획득 모듈 및 통합 모듈 개발 58
5.7 GEO 데이터 통합 GUI 도구 개발 69

6. 고 찰 78

참고 문헌 83

부록 87
Appendix 1. SQLite 관련 함수에 대한 테스트 Script 87
Appendix 2. TCGA-Assembler-Renewal 설정 Script 89

Abstract 93
-
dc.formatapplication/pdf-
dc.format.extent3602681 bytes-
dc.format.mediumapplication/pdf-
dc.language.isoko-
dc.publisher서울대학교 대학원-
dc.subjectGEO-
dc.subject데이터 통합-
dc.subject유전자 발현형-
dc.subjectTCGA-
dc.subject임상 병리 데이터-
dc.subject데이터 분석-
dc.subject.ddc617-
dc.title암 유전자 발현을 중심으로 한 유전자 발현 옴니버스 데이터베이스 통합 도구 개발-
dc.typeThesis-
dc.description.degreeDoctor-
dc.citation.pagesvii, 94-
dc.contributor.affiliation치의학대학원 치의과학과-
dc.date.awarded2016-08-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share