Publications

Detailed Information

Application of comparative genomics for reference genome quality improvement evaluation and evolutionary analysis : 참조유전체 품질 개선 평가 및 진화 분석을 위한 비교유전체학의 적용

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김주완

Advisor
김희발
Issue Date
2021
Publisher
서울대학교 대학원
Keywords
comparative genomicsfalse gene lossvertebrate genomes projectgenome assembly quality evaluationevolutionary genomicsmacroevolution비교유전체학허위 유전자 소실척추동물 유전체 프로젝트유전체 품질 평가진화유전체학대진화
Description
학위논문(석사) -- 서울대학교대학원 : 자연과학대학 협동과정 생물정보학전공, 2021.8. 김희발.
Abstract
With the maturation of sequencing technologies, it has become possible to compare genomes of diverse vertebrates. The aim of this thesis is to assess improvements of reference genome assemblies of vertebrates in terms of gene contents and identify signatures of evolutionary selection based on comparative genomics approaches.
In chapter 1, I introduced the background knowledges for this thesis and reviewed recent studies. To review recent trends in the field of sequencing animal genomes, I analyzed assembly statistics and sequencing platforms of animal genomes in National Center for Biotechnology Information (NCBI) assembly database.
In chapter 2, I evaluated the quality improvement of reference genome assemblies of four vertebrates produced with long reads, long-range scaffolding data, and new assembly algorithms within the Vertebrate Genomes Project (VGP) compared to the previously used references for the same species. I performed genome alignment and annotation projection to compare different genome assemblies and estimate improvement in their annotation. I found that up to 11% of genome sequences were entirely missing in the prior assemblies, which included several microchromosomes with high GC-content and gene density. In genome-wide level, up to 60% of the genes had false gene losses in the prior assemblies, and this was largely due to a bias in missing GC-rich 5'-proximal promoter and 5 exons regions, which indicates that significant proportion of regulatory and protein coding sequences has been heavily underestimated in prior assemblies.
In chapter 3, I performed a comparative genomics analysis with terrestrial tetrapods, coelacanth, mudskipper, and fully aquatic fishes to detect evolutionary signatures associated with land adaptation, which has been independently evolved in multiple vertebrate lineages including mudskipper and the most recent common ancestor of tetrapod. I collected 4118 singleton orthologues to detect signatures of positive selection. The positively selected genes identified in both mudskipper and tetrapod lineages were involved in the biological processes including immune responses, mitochondrial oxidative phosphorylation, and kidney development. On the other hand, tetrapod-specific and mudskipper-specific positively selected genes were functionally enriched for DNA repair processes. Finally, I performed a gene family evolution analysis and discovered the rapid contraction of βγ-crystallin coding genes in both tetrapod and mudskipper lineages. I suggested the possibility of similar genetic adaptation of mudskippers to ancient tetrapod for overcoming environmental constraints during the land adaption.
The findings in this thesis can provide a novel way of diagnosing genome assemblies and help to understand the evolution of land adaptation based on comparative genomics approaches.
시퀀싱 기술이 발전함에 따라, 다양한 척추동물의 유전체 서열 비교가 가능해졌다. 본 논문의 목적은 비교유전체학적 접근법에 기초하여 유전자 함량 측면에서 척추동물 참조 유전체 어셈블리의 품질 개선을 평가하고 진화적 선택 신호를 밝히는 것이다.
본 논문의 제 1장에서는 이 논문에 대한 배경 지식을 소개하고 최근 연구 들을 검토했다. 동물들의 참조유전체 시퀀싱 분야의 최근 동향을 확인하기 위해 미국 국립생물공학정보센터 (NCBI) 게놈 데이터베이스에 있는 동물 유전체 서열의 통계치 및 염기서열화 플랫폼 변화를 분석했다.
본 논문의 제 2장에서는, 긴 해독 길이, 장거리 스캐폴딩 데이터, 새로운 어셈블리 알고리즘을 활용하여 생산된 4개의 척추동물 유전체 프로젝트 (VGP) 참조 유전체 어셈블리의 품질 개선을 동일 종의 이전 참조유전체와 비교하여 평가했다. 서로 다른 유전체 어셈블리를 비교하고 유전자 주석의 개선을 측정하기 위해 유전체 정렬 및 유전자 주석의 투영을 수행했다. 그 결과, GC가 풍부하고 유전자 밀도가 높은 소형염색체를 포함하여 전체 유전체 염기서열의 최대 11%가 이전 참조유전체에서 완전히 누락되었다는 것을 발견했다. 유전체 수준에서 이전 어셈블리 중 최대 60%의 유전자가 잘못 소실되었으며, 이는 GC가 풍부한 5' 프로모터 및 5' 엑손 부위에 편향된 서열 누락이 큰 원인이었으며, 이는 이전 어셈블리에서 조절 및 번역 서열의 상당한 비율이 크게 과소평가되었음을 의미한다.
본 논문의 제 3장에서는, 육상 사지 척추동물의 공통 조상과 망둥어를 포함한 여러 척추동물 계통에서 독립적으로 진화된 육상 적응과 관련된 진화적 신호의 감지를 위해 육상 사지 척추동물, 실러캔스, 망둥어 및 완전 수생 어류와 비교 유전체 분석을 수행했다. 양성선택의 신호 감지를 위해, 4118개의 상동 유전자를 수집했다. 망둥어와 사지 척추동물 계통에서 양성선택을 받은 것으로 검출된 유전자들은 미토콘드리아 산화적 인산화, 신장 발달 등에 관여하는 유전자를 포함했다. 반면에, 사지 척추동물 특이적 및 망둥어 특이적으로 양성선택의 대상이 된 유전자들은 모두 DNA 수리 과정에 기능적으로 집중되어 있었다. 마지막으로, 유전자군 분석을 수행하여 사지 척추동물 계통과 망둥어 계통 모두에서 βγ-크리스탈린 유전자군이 급격하게 수축되었다는 것을 발견했다. 이를 통해, 육상으로의 적응 과정 중 환경적인 제약을 극복하기 위해 망둥어와 고대 사지 척추동물 사이 유사한 유전적 적응의 가능성을 제안했다.
본 논문의 연구 결과는 비교 유전체 접근법에 기초하여 참조유전체를 진단하는 새로운 방법을 제시하고 육상 환경 적응의 진화를 이해하는 데 도움이 될 수 있다.
Language
eng
URI
https://hdl.handle.net/10371/177431

https://dcollection.snu.ac.kr/common/orgView/000000167028
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share