Publications

Detailed Information

Estimation of Potential for Mineral Water Using Tree Ensemble Machine Learnings on National Scale : 트리 앙상블 기계학습을 이용한 전국 규모의 광천수 부존위치 추정

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

이혜림

Advisor
이강근
Issue Date
2021-02
Publisher
서울대학교 대학원
Keywords
groundwater potential mapmineral waterboosted regression treesrandom forestextremely randomized treesvariable influence지하수 부존가능성 지도광천수부스팅 회귀 나무랜덤 포레스트익스트림 랜덤 트리변수 영향도
Description
학위논문 (석사) -- 서울대학교 대학원 : 자연과학대학 지구환경과학부, 2021. 2. 이강근.
Abstract
Identifying groundwater potential zone in consideration of water quality is important to fulfill the increasing demand for drinking groundwater. Especially, reasonable and accurate detection of the potential zone is essential for efficient management of the groundwater resources and successful development of the groundwater for its drinking usage. This study covered mineral water among various drinks and estimated the spatial distribution of groundwater potential in the South Korea, using tree ensemble methods such as Boosted Regression Trees, Random Forest, and Extremely Randomized Trees. Total 6,135 groundwater quality data were collected on a nationwide scale to determine response variable. Environmental factors such as altitude, slope, drainage grade, effective soil depth, soil texture, land use, and hydrogeology were served as predictor variables. In precision recall curve analysis, all curves of the three methods were clearly distinguished from a baseline, which confirmed the applicability of the three classifiers to potential mapping. In addition, relative influence and partial dependence plot identified that factors related to contamination highly affected the modeling and potential mapping. Finally, the three validated models generated the spatial distribution of mineral water potential. The maps well reflected the distribution of imbalanced data and the results of variable influence for some predictors. Moreover, proper location for mineral water development could be determined by comparing the three maps. Consequently, the tree ensemble methods are promising in delineation of the groundwater potential zone for mineral water in national scale, and the analysis of the variable influence enable the extraction of the environmental conditions affecting the mineral water production.
음용 지하수에 대해 점차 증가하고 있는 수요를 충족시키기 위해 수질을 고려하여 지하수 부존가능 지역을 파악하는 것이 중요하다. 특히, 지하수 자원의 효율적인 관리와 음용 지하수의 성공적인 개발을 위해서는 지하수 부존가능 지역에 대한 합리적이고 정확한 탐지가 필수적이다. 본 연구에서는 여러 음용도 중 광천수를 대상으로 하여, 부스팅 회귀 나무, 랜덤 포레스트, 익스트림 랜덤 트리를 사용하여 남한 전역의 광천수에 대한 지하수 부존가능성의 공간적 분포를 추정하였다. 반응 변수를 결정하기 위해 총 6,135개의 지하수질 데이터를 전국규모로 수집하였으며, 고도, 경사, 배수등급, 유효토심, 표토토성, 토지이용, 수문지질의 환경적 요인들이 예측변수로 작용했다. 정밀 리콜 곡선 분석 결과, 적용된 세 가지 방법의 모든 곡선들이 기준선과는 명확하게 구분되었으며, 지하수 부존지역 매핑에 대한 세 분류기의 적용가능성을 확인해주었다. 또한, 상대 영향도와 부분 의존도 플롯으로 오염 관련 요인들이 모델링과 부존가능성 매핑에 영향을 크게 끼쳤음을 파악하였다. 마지막으로, 세 가지의 검증된 모델로 광천수 부존가능성에 대한 공간적 분포를 생성하였다. 생성된 지도들은 불균형한 데이터의 분포와 몇몇 예측 변수들의 영향도 결과를 잘 반영하였다. 또한, 세 지도를 비교함으로써 광천수 개발에 적절한 위치를 결정할 수 있었다. 결과적으로, 나무 앙상블 방법은 전국 규모의 광천수에 대한 지하수 부존가능성을 기술하는 데 있어 그 활용이 기대되며, 변수 영향도 분석을 통해서는 광천수 산출에 영향을 미치는 환경 조건을 파악할 수 있을 것이다.
Language
eng
URI
https://hdl.handle.net/10371/176055

https://dcollection.snu.ac.kr/common/orgView/000000164828
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share