Publications

Detailed Information

Deep Learning-Aided Autonomous Materials Discovery : 딥러닝을 활용한 자율적 물질 발굴: 목표지향적 분자 역설계
Goal-Directed Inverse Molecular Design

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김현승

Advisor
이원보
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
materials discoverygoal-directed inverse molecular designchemical languagefragment-based RLAI-driven combinatorial chemistry
Description
학위논문(박사) -- 서울대학교대학원 : 공과대학 화학생물공학부, 2023. 2. 이원보.
Abstract
As the discovery of bronze marked the end of the Stone Age, the advancement of human civilization is closely related to the discovery of better materials. Modern materials discovery spans various fields ranging from electrical and electronic materials, energetic materials, ceramics, catalysts, nanomaterials, and biomaterials. In these kinds of materials development, it is challenging to search for the desired materials efficiently and quickly. In the past, searching for the desired materials relied on expert knowledge or intuition. However, this is not effective to search the vast chemical space efficiently and quickly. Therefore, attempts have been made to integrate the materials development process as a closed-loop system and drive it with AI/ML. The closed-loop materials discovery system driven by AI/ML consists of inter-module interactions such as inverse materials design, materials scoring, reaction pathway synthesis, and process design. Among the modules listed above, this study covers the module on inverse materials design. In this thesis, two kinds of models have been addressed. One is a model for a goal-directed inverse molecular design using chemical language, which discovers realistic and chemically feasible molecular structure that hits a set of target properties. It is a model that embeds Transformer—a state-of-the-art natural language processing model—in a conditional variational autoencoder. It designs realistic and chemically feasible molecules by recognizing the patterns of linguistic sequence representing molecular structure. The other is a goal-directed inverse molecular design based on AI-driven combinatorial chemistry, which enables materials discovery with extreme properties; note that existing probability-distribution learning models such as neural machine translator, generative adversarial network, and variational autoencoder-based inverse molecular design models cannot generate molecules with such rare and extreme properties out of known materials (training data) distribution. The original combinatorial chemistry is a method that generates molecules from the combination of randomly selected molecular fragments. Hence, this method can generate materials with all possible properties that can be obtained from the combination of molecular fragments, even materials with extreme properties. However, it lacks the policy of selecting molecular fragments to hit the target properties. For this reason, the proposed method uses reinforcement learning to learn the policy of selecting molecular fragments to guide it to the desired target. Considering the models work their tasks accurately in sub-seconds, it is believed that deep learning-aided models will contribute to accelerating the materials development process.
청동의 발견이 석기 시대의 종지부를 찍었듯이, 인간 문명의 진보는 더 나은 물질을 발굴하는 것과 밀접한 연관이 있다. 현대의 물질 발굴은 전기 전자 소재, 에너지 물질, 세라믹, 촉매, 나노 물질, 바이오 물질, 그리고 바이오 물질에 이르기까지 여러 분야에 걸쳐 있다. 이러한 물질 개발 연구들에 있어, 화학물질이 존재하는 공간은 매우 방대하기에 효율적인 탐색을 통해 원하는 물질을 찾아내는 것은 매우 도전적인 일이다. 과거에는 전문가의 지식이나 직관에 의존해 원하는 물질을 탐색했으나 이는 방대한 공간을 효율적으로 빠르게 탐색하기에는 효과적이지 못하다. 때문에 물질 개발 프로세스 자체를 하나의 closed-loop system으로 구성하고 이를 AI/ML이 운전함으로써 보다 빠르고 효율적으로 원하는 물질을 개발하려는 시도가 이어지고 있다. AI/ML에 의해 운전되는 closed-loop 물질 발굴 system은 물질 역설계, 물질 scoring, 반응경로 합성, and process construction 등의 모듈간 상호작용으로 이루어진다.
본 연구에서는 위에서 열거한 모듈들 중 분자 역설계 모듈에 대해서 두 가지 모델을 다룬다. 하나는 화학 언어를 사용하는 목표 지향 역분자 설계 모델로, 목표하는 물성들을 동시에 만족하는 자연스러운 분자 역설계가 가능하다. 이 모델은 조건부 생성모델에 Transformer라는 자연어 처리 모델을 내장한 구조를 갖는데, 분자 구조를 나타내는 언어적 순서의 패턴을 인식하여 화학 규칙을 만족하면서도 실제 분자와 유사한 가상의 분자를 설계한다. 다른 하나는 극단적인 물성을 만족하는 분자 설계를 위해 combinatorial chemistry와 강화학습을 활용한 모델이다. Neural machine translator, variational autoencoder, 그리고 generative adversarial network에 기반한 기존의 확률 분포 학습 모델에 근거한 분자 역설계 모델들은 알려진 물질 (훈련 데이터) 분포를 근사하는 학습 모델을 도출하기에 알려진 물질의 분포를 벗어난 (극단적인 물성을 가진) 물질을 생성하지 못한다. 그러나 제안된 모델은 combinatorial chemistry가 분자 조각 조합에서 나타날 수 있는 모든 물성을 가진 분자를 생성할 수 있다는 점과 강화학습 기법이 목표 물성을 만족하는 분자 조각 선택 정책을 학습시킬 수 있다는 점을 결합하여 극단적인 물성을 만족하는 분자 역설계가 가능하다.
제안된 모델들은 sub-second 안에 목표하는 분자 구조를 역설계가 가능하다. 이런 점을 고려할 때 AI/ML을 활용한 물질 발굴 기법들이 물질 개발 프로세스를 가속화하는 데 크게 기여할 수 있을 것으로 기대한다.
Language
eng
URI
https://hdl.handle.net/10371/193439

https://dcollection.snu.ac.kr/common/orgView/000000174974
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share