Publications

Detailed Information

직접주입-질량분석법 기반의 대사체학 및 기계학습을 통한 원산지 판별분석법 : Direct Infusion-Mass Spectrometry based Metabolomics and Machine Learning for the Discrimination of Geographical Origin

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

임동규

Advisor
권성원
Major
약학대학 약학과
Issue Date
2018-02
Publisher
서울대학교 대학원
Keywords
판별 분석Direct infusion-mass spectrometry기계 학습
Description
학위논문 (박사)-- 서울대학교 대학원 : 약학대학 약학과, 2018. 2. 권성원.
Abstract
본 연구는 Direct Infusion-Mass Spectrometry (DI-MS)와 기계 학습을 대사체학 연구에 도입하여 컬럼 크로마토그래피 및 다변량 통계분석을 주로 이용하는 기존의 방식보다 분석 시간, 판별의 정확도 측면에서 대폭 개선된 판별 분석 전략을 제시한다. 제시한 방법의 포괄적인 적용 가능성을 증명하기 위해 원산지가 다른 2종의 쌀(한국산 쌀, 중국산 쌀 및 임의의 비율로 이를 혼합한 쌀, 총 430점) 및 품종이 다른 4종의 인삼(P. ginseng, P. notoginseng, P. quinquefolius, P. Vietnamensis, 총 40점)을 대상으로 각각 서로 다른 분석 장비(쌀: Agilent triple quadrupole 6460 system, 인삼: WatersMirco triple quadrupole mass spectrometer)를 이용하여 판별 분석을 진행하였다. Liquid chromatography-mass spectrometry(LC-MS) 결과를 통해 확인된 판별 대사체들은 쌀의 lysophospholipid와 인삼의 ginsenoside로 확인되었으며, 확인된 판별 대사체를 대상으로 시료 당 30초 내외의 분석시간 및 우수한 감도를 제공하는 DI-MS기반의 분석법을 이용해 동시 분석하였다. 이후 해당 확보한 데이터를 토대로 판별 모델을 제작하기 위해 다변량 통계분석인 principal component analysis, partial least squares discriminant analysis와 기계 학습 방법인 random forest, support vector machine, C5.0 decision tree, neural network 및 k-nearest neighbor classifiers를 적용하였으며 판별 모델을 서로 비교, 평가하였다. 판별 분석 결과, 특히 기계 학습을 이용하였을 때 2종의 쌀 및 4종의 인삼이 훨씬 정확하게 판별되었으며 특히 기계학습 방법 중 하나인 random forest는 다변량 통계분석으로 판별해내지 못하는 5% 내외로 혼입된 혼합 쌀 시료도 판별해 낼 만큼 매우 정밀한 판별 결과를 보여주었다. 결론적으로 대사체학 연구, 특히 판별 연구에 있어 DI-MS와 기계 학습을 도입한 판별 분석 전략은 대량의 시료, 신속한 속도, 뛰어난 정확도를 요구하는 연구를 위한 매우 적합한 방법이다.
Language
Korean
URI
https://hdl.handle.net/10371/140965
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share