Publications

Detailed Information

Computational methods for sequence clustering and gene selection for metagenomic data generated by next generation sequencing

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

이재학

Advisor
천종식
Major
협동과정 생물정보학전공
Issue Date
2012-02
Publisher
서울대학교 대학원
Abstract
환경시료로부터 추출한 유전체 또는 유전자를 포함하는 clone을 총칭하여 metagenome이라고 부르고 있으며 이러한 metagenome에 관련된 일련의 연구를 metagenomics라 한다. 대부분의 환경시료는 미생물 군집이 상당히 복잡하여 수백에서 수천 종에 이르는 종의 분포를 나타냄에도 불구하고 지금까지 그 일부만 배양되었지만 최근 metagenomics의 급속한 성장을 통해 실제 미생물의 다양성에 대한 분석이 가능하게 되었다. 이는 미생물 군집분석에 있어 혁신적인 모습을 보여주고 있으며 이를 통해 지금까지 알지 못한 미생물 군집의 다양성을 알 수 있게 되었다.
따라서 Metagenomics는 난배양성 또는 배양 불가능 미생물을 분석하기 위한 목적에 잘 부합하는 것으로 배양에 의한 순수분리가 불가능하다면 특정 환경내의 모든 DNA를 추출함으로써 분자생물학적으로 접근할 수 있는 현대적인 유전 정보 분석을 위한 방법이다. 이 방법은 미생물 군집을 구성하는 미생물의 유전과 기능적 다양성에 대한 지식을 급속도로 높이고 있다.
최근 차세대 염기서열 분석 기술(next generation sequencer, NGS)이 metagenomic 연구에 많이 사용되고 있으며 이를 통해 광범위한 양의 염기서열 자료를 얻을 수 있게 되었고, 미지의 환경시료로부터 유전체 구성을 결정할 수 있게 되었다. 이처럼 차세대 염기서열 분석 기술이 환경 시료의 미생물 군집 구조 분석에 획기적인 방법이 되고 있다. 본 학위 논문은 이러한 차세대 염기 서열 분석 기술로부터 생성된 metagenomic 정보들의 분석 방법을 기술한다.
현존하는 서열 군집 방법은 다양한 미생물 군집 분석에 이용되었지만 분석의 정확성은 환경 샘플에 대한 정확한 정보가 없기 때문에 비교할 수가 없다. 이러한 문제해결을 위해 Taxonomy-based Clustering(TBC)라는 새로운 서열 군집 알고리즘을 제안한다. 차세대 염기 서열 분석으로 통해 생성되는 수백만의 서열들을 분석하고 해석하는 방법은 광범위한 전산 전략이 필요하기 때문에, TBC는 기존의 다중 서열 정렬과 distance matrix의 생성을 생략하고 종(species) 구분에 쓰이는 type strain의 직접적인 비교를 통한 분류학의 기본적인 개념을 포함한다.
군집 분석의 정확성은 기존의 미생물 군집 연구에 사용되는 MOTHUR BLASTCLUST CD-HIT UCLUST와 같은 알고리즘들과 비교하였다. 세가지 양적 평가 기준에 의해 비교 하였으며 3가지 서로 다른 dataset을 통해 나열한 5가지 분석방법 중 군집의 정확성과 전산과정의 효율성에 있어서 최고의 알고리즘이라는 것을 시연하였다.
metagenomics 연구에 있어 생물정보학적 분석의 가장 기본적인 단계는 rRNA 유전자와 같은 phylogenetic marker를 예측하는 것을 수반한다. 다음으로 소개한 rRNASelector는 광범위한 metagenomic 혹은 metatranscriptomic 서열들을 은닉 마코프 모델(Hidden Markov model)을 사용하여 원하는 rRNA를 추출하는 프로그램이다. 이를 통해 얻어진 rRNA를 추출한 나머지 서열들은 단백질 기반의 연구에 사용된다. 본 프로그램은 Roche 454 FLX Titanium을 기반으로 서열 분석된metagenomics와 metatranscriptomics library로부터 진핵생물의 5S, 26S 23S rRNA 유전자의 정확한 추출을 성공적으로 확인하였다.
Language
eng
URI
https://hdl.handle.net/10371/156745

http://dcollection.snu.ac.kr:80/jsp/common/DcLoOrgPer.jsp?sItemId=000000001122
Files in This Item:
There are no files associated with this item.
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share