Publications

Detailed Information

Synergetic bridge of simulations, observations, and theory using machine learning : 우주론적 모의 실험, 관측, 이론간의 상승 작용을 위한 기계 학습 활용

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

조용석

Advisor
김지훈
Issue Date
2022
Publisher
서울대학교 대학원
Keywords
CosmologicalsimulationSimulation-basedinferenceGalaxyformationandevolutionLarge-scalestructureformation
Description
학위논문(박사) -- 서울대학교대학원 : 자연과학대학 물리·천문학부(물리학전공), 2022. 8. 김지훈.
Abstract
수십 년 동안의 우주론적 모의 실험과 관측의 눈부신 발전은 우주 거대 구조의 형성과 진화와 같은 다양한 천체 물리학 및 천문 현상에 대한 이해를 눈부시게 확장시켰고, 우주론적 모의 실험은 천체 물리학을 연구하는 데에 없어서는 안될 필수불가결한 요소가 되었습니다.
그러나 관측과 모의 실험의 다양한 불확실성, 관측과 모의 실험의 물리적 모델의 한계, 모의 실험의 계산 비용, 수학적으로 정교한 비교의 방법론적 부재와 같은 여러 요인으로 인해 모의 실험과 관측은 융합되어 연구되지 못하였습니다.
한편, 컴퓨터의 발전과 함께 부상한 기계 학습은 위에서 제기된 대부분의 문제를 해결할 수 있을 만큼의 잠재력을 보여주었습니다.
이 논문에서는 기계 학습을 활용하여 크게 두 가지 문제를 해결하는 것을 목표로 합니다.
(1) 계산적으로 매우 효율적인 방식으로 우주론적 유체역학 모의 실험을 지원할 수 있는 모델을 수립하고, (2) 수학적으로 보다 정교한 방법으로 관측에 대해 우주론적 모의 실험을 보정하는 골조를 구축하였습니다.


첫 번째 부분에서는 기계 학습을 사용하여 고해상도 유체 역학 모의 실험으로 암흑 물질으로만 이루어진 암흑 물질 전용 모의 실험에서 암흑 물질 헤일로의 중입자적 특성(즉, 항성이나 기체 등의 특성)을 추정하는 모델을 제시합니다.
모델을 훈련 및 개선시키기 위해 무작위 숲 알고리즘과 함께 두단계 학습, 개선된 오차 함수, 헤일로의 주변 환경과 성정 과정 등을 추가적인 입력값으로 사용하였습니다.
이러한 개선 사항들을 통해 저희 모델의 중입자적 특성을 예측하는 정확도가 크게 향상되었음을 보여줍니다.
이런 모델을 아주 큰 암흑 물질 전용 모의 실험에 적용하여 암흑 물질의 정보로만 이루어진 암흑 물질 헤일로 목록에서 중입자적 특성까지 포함할 수 있는 은하 목록을 기존 모의 실험에 비해 비약적으로 짧은 시간 안에 생성할 수 있는 골조을 구축하였습니다.
저희 모델은 은하 규모의 유체역학 모의 실험의 중입자 물리학을 큰 규모의 암흑 물질 전용 모의 실험에 효율적으로 이식할 수 있는 획기적인 방법이 될 수 있습니다.
또한, 기계 학습의 장점과 이러한 접근 방식을 이용하여 우주론적 현상들에 대한 물리학적 이해를 증대하기 위한 방법들에 대해 논의하였습니다.


두 번째 부분에서는 우도함수를 사용하지 않는 추론이라고도 하는 모의 실험 기반 추론을 사용하여, 기존에는 모의 실험의 높은 계산 비용으로 실현할 수 없었던, 관측에 대한 우주론적 모의 실험의 보정을 수행하였습니다.
계산 효율성을 위해 우리는 약 천여개의 우주론적 모의 실험을 사용하여 에뮬레이터를 훈련하여 우주론 및 천체 물리학 매개변수를 입력으로 받아 모의 실험의 관측량을 추정하고, 이러한 에뮬레이터를 우주론적 모의 실험의 대체제로 사용합니다.
우주 항성 형성 속도 밀도 및 항성 질량 함수를 사용하여 선택된 우주 및 천체 물리학 매개변수에 대해 시뮬레이션 기반 추론을 수행하여 6차원 사후 확률 분포를 얻습니다.
저희는 우주 항성 형성 속도 밀도에서 추론된 매개변수 사이에 축퇴가 존재한다는 것을 발견했으며, 이는 새로운 우주론적 모의 실험으로도 확인되었습니다.
또한, 항성 질량 함수가 우주 항상 형성 속도 밀도의 축퇴를 깨뜨릴 수 있음을 발견했습니다. 이는 항성 질량 함수가 매개변수에 대해 더 강력한 제약을 제공할 수 있음을 나타냅니다.
저희는 관측에서 추론된 항성 형성 속도 밀도에서 추론된 매개변수 집합이 관측된 항성 형성 속도 밀도를 매우 잘 재현하는 반면, 항성 질량 함수의 경우, 추론 및 관찰된 항성 질량 함수의 상당한 불일치로부터 은하 형성 모델링의 한계가 있다는 것을 발견했습니다.
Over the decades, the remarkable progress of cosmological simulations and observations has greatly extended our understanding of a wide variety of astrophysical and cosmological phenomena, such as the formation and evolution of large-scale structures, and cosmological simulations have become indispensable for studying astrophysics.
However, simulations and observations have not been reconciled due to several factors, such as various uncertainties in both observation and simulation, limitations of physical models for both observation and simulation, the computational cost of simulations, and the absence of delicate and sophisticated comparisons.
Meanwhile, the emerging power of machine learning has shown the full potential to solve most of the problems above.
Harnessing the power of machine learning, we aim to mainly address two issues:
(1) we establish a model that can assist cosmological hydrodynamic simulation in a computationally-highly efficient way, and (2) we also build a pipeline that calibrates cosmological simulations against observations.

In the first part, we present a pipeline to estimate the baryonic properties of a galaxy inside a dark matter (DM) halo in DM-only simulations using a machine trained on high-resolution hydrodynamic simulations.
An extremely randomized tree (ERT) algorithm is used together with multiple novel improvements we introduce here such as a refined error function in machine training and two-stage learning.
Aided by these improvements, our model demonstrates a significantly increased accuracy in predicting baryonic properties.
By applying our machine to the DM-only simulation of a large volume, we then validate the pipeline that rapidly generates a galaxy catalogue from a DM halo catalogue.
Our machine may become a promising method to transplant the baryon physics of galaxy-scale hydrodynamic calculations onto a larger-volume DM-only run.
We discuss the benefits that machine-based approaches like this entail, as well as suggestions to raise the scientific potential of such approaches.


In the second part, employing simulation-based inference (SBI), also known as likelihood-free inference, we calibrate the
parameters of cosmological simulations against observations, which has previously been unfeasible due to the high computational cost of these simulations.
Using the cosmic star formation rate density (SFRD) and, separately, stellar mass functions (SMFs) at different redshifts, we perform SBI on select cosmological and astrophysical parameters and obtain full 6-dimensional posterior distributions.
We find that there exist degeneracies between the parameters inferred from the SFRD, which is confirmed with new full cosmological simulations.
We also find that the SMFs can break the degeneracy in the SFRD, which indicates that the SMFs provide stronger constraints for the parameters.
Further, we find that the parameter set inferred from an observationally-inferred SFRD reproduces the target observed SFRD very well, whereas, in the case of the SMFs, the inferred and observed SMFs show significant discrepancies, pointing to limitations of the galaxy formation modeling framework.
Language
eng
URI
https://hdl.handle.net/10371/188502

https://dcollection.snu.ac.kr/common/orgView/000000173458
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share