Publications
Detailed Information
Fitness Landscape and Evolution of the Genetic Code : 유전 코드의 적합도 지형과 변화
Cited 0 time in
Web of Science
Cited 0 time in Scopus
- Authors
- Advisor
- 조정효
- Issue Date
- 2024
- Publisher
- 서울대학교 대학원
- Keywords
- codon ; error load ; amino acid frequency ; Kullback-Leibler divergence ; simulated annealing ; optimal code
- Description
- 학위논문(석사) -- 서울대학교대학원 : 사범대학 과학교육과(물리전공), 2024. 2. 조정효.
- Abstract
- Numerous statistical and biochemical studies have been conducted to elucidate nonrandom patterns in codon assignment. For example, a representative study employed simulations to statistically illustrate the exceptional rarity of the standard genetic code.
In this study, we define a new code fitness based on the error load contribution and the compositional similarity of amino acids, which is measured using Kullback-Leibler divergence (KLD). Here the error load indicates the accumulated error value within the code during the transmission process of genetic information, and the amino acid KLD is a term that reflects the external pressure to fit the amino acid distribution in the code to the natural frequencies of amino acids. We extend the probability of transition mutations occurring at the third base of codons to be variable, and define the error caused by mutations as the absolute error in polar requirements between amino acids. Then we derive the complete definition of code fitness by introducing the amino acid KLD term. Based on this definition, we discuss how the fitness landscape changes with the variation of design temperature, introduced as a coefficient in linear combination of both terms. Finally, we devise the cooling simulate annealing where the design temperature decreases exponentially with each iteration and apply this in a code optimization experiment to propose a hypothesis about the environmental fluctuations under which the genetic code evolved.
현재까지 코돈 할당(codon assignment)의 비임의적 패턴을 설명하기 위한 많은 통계적·생화학적 연구가 수행되었다. 예를 들어, 아미노산의 극성 요구(polar requirement)를 기반으로 유전 코드에서 발생하는 점 돌연변이와 오역의 영향을 측정하는 시뮬레이션을 수행하여 표준 유전 코드(Standard Genetic Code)의 통계적 희귀성을 보여준 연구가 대표적이다.
본 연구에서는 기존의 시뮬레이션 모델로부터 몇 가지 요소를 수정 및 추가하여 새로운 코드 적합도 함수를 정의한다. 첫째, 코돈의 세 번째 염기에서 발생하는 전이 돌연변이(transition mutation)의 확률을 가중치로 설정한다. 둘째, 돌연변이로 인해 발생하는 오류를 극성 요구에 대한 제곱 오차에서 절대 오차로 수정한다. 셋째, 여러 아미노산의 상대적인 빈도를 고려하여 쿨백-라이블러 발산(Kullback–Leibler divergence)으로 정의되는 아미노산 KLD 항을 도입한다. 마지막으로, 설계온도(design temperature)를 선형결합의 계수로 도입하여 그 변화에 따라 적합도 지형(fitness landscape)이 달라지는 양상에 대해 논의한다. 우리는 진화 과정에서 냉각 담금질 기법(cooling SA)을 도입하여 그것이 유전 코드의 최적화에 미치는 효과를 조사한다. 이러한 접근법은 누적 오류(error load)와 아미노산 KLD의 두 가지 측면을 모두 최소화함으로써 표준 유전 코드와 더욱 가까운 최적 코드를 얻을 수 있다는 점에서 그 의의가 있다.
- Language
- eng
- Files in This Item:
- Appears in Collections:
Item View & Download Count
Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.