Publications

Detailed Information

고유함수 기반의 공간 변수가 생물 종 분포 모형의 예측에 미치는 영향 : Effects of eigenfunction-based spatial variables on the prediction of species distribution model

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

전청옥

Advisor
김대현
Issue Date
2021
Publisher
서울대학교 대학원
Keywords
공간 변수공간 필터링PCNM최대 엔트로피 종 분포 모형공간 교차 검증Boyce index
Description
학위논문(석사) -- 서울대학교대학원 : 사회과학대학 지리학과, 2021.8. 김대현.
Abstract
Species distribution on geographical space shows relationship between species and its environment. Species distribution model is the attempt to predict, explain the species geographical distribution from this relationship. Although it is required to account for geographical information such as distance between occurrence data, which could represent mobile and biotic influence, it is not common to use geographical information on species distribution modelling. In this research, the effect of eigenfunction based spatial variables on species distribution model is reviewed and analyzed from two 126 different cross validation methods. Most of species distribution model that is applied with eigenfunction based spaitial variables show higher model prediction performace from discriminative indices such as AUC, TSS. On the other hand, their high predictive performance was highly based on extremely lower prediction on backgrounds points due to different distance matrix structure. They showed much lower model prediction performance from Boyce index which is most suitable index to presence-background model algorithm such as MaxEnt. Also their lower prediction performances were not related to sptail model transferability as well.
공간 상에 나타나는 생물 종의 분포는 해당 종이 접하는 환경과 밀접하게 연관되어 있다. 종 분포 모형은 이 점에 착안하여 환경 변수를 사용해 생물 종의 분포를 예측하고 설명하고자 한다. 일반적인 종 분포 모형은 환경 변수와 종의 출현 여부 간의 상관관계 분석을 환경 공간 상에서 진행하며 일체의 지리적 공간에 대한 정보는 사용되지 않는다. 만약 생물 종의 분포가 온전히 환경 공간 상의 거리로 결정될 수 있다면, 해당 모형에서 산출되는 잔차는 공간적 자기상관성을 보이지 않을 것이다. 하지만 만약, 잔차에서 공간적 자기상관성이 나타난다면 해당 모형은 중요한 환경 변수를 놓치고 있거나, 지리적 변수가 더 중요한 상태일 수도 있음을 암시하는 것이다. 최근 종 분포 모형에서 주로 사용되는 최대 엔트로피 모형은 비출현 자료의 부재로 인해 모형의 잔차를 측정하기 어렵다는 한계를 가지고 있다. 즉, 비출현 자료가 부재하는 최대 엔트로피 모형은 잔차의 공간적 자기상관성을 측정하기 곤란하며, 생물 종의 분포가 오로지 환경 공간 상의 거리로 정의될 수 있는지를 명확히 할 수 없다. 지리 공간 상의 거리가 더 중요할 수 있음에도 이를 확인할 수 없기 때문에, 본 연구에서는 모형의 예측의 잔차가 아닌, 예측 성능 향상의 측면에서 공간 변수가 얼마나 중요할 수 있는지를 살펴보고자 한다. 이를 위해 모형에 투입되는 자료들 간의 거리 의존성을 스케일마다 포착하는 공간 변수(PCNM)를 사용했을 때 종 분포 모형의 예측과 설명이 어떻게 달라질 수 있는지 분석하였다. 연구의 대상은 생물 종 분포 연구에 주로 쓰이는 척추동물 분류군 97종, 1,504,446건의 출현자료로 선정하여 정량적, 정성적 대표성을 확보하였다. 모형 알고리즘은 변수 규제로 많은 변수 투입이 가능하면서도 출현, 배경 자료만을 필요로 하는 최대 엔트로피 기반 모형을 사용했다. 해당 알고리즘은 자료 수집에 상당한 자원이 소모되는 비출현 자료를 필요로 하지 않으면서도 높은 예측 정확도를 보여 많은 연구가 채택하는 알고리즘이다. 모형의 독립 변수로 생물 기후 변수 19종과 공간 변수(출현, 배경 자료의 PCNM)를 사용하였다. 이후 모형의 정확도 평가를 AUC, TSS, Boyce index로 평가하였다. 분석 결과, 공간 변수가 종 분포 모형에 투입될 경우 그 예측 정확도는 혼돈 행렬 기반 지수에서는 증가한 것으로 보여지나 신뢰성 지수의 측면에서는 증가하지 않았다. 공간 변수가 생물 종 분포에 유의미한 영향 요인임은 분명하나, 최대 엔트로피 기반 종 분포 모형에 설명 변수로 투입될 경우, 배경 자료에서 왜곡이 발생함을 확인할 수 있었다. 왜곡된 배경 자료로 인하여 Boyce 지수의 감소와 비정상적인 모형 적합이 관찰되었으며 분류군 간의 차이는 발견할 수 없었다. 감소된 모형의 예측력이 모형의 공간적 전이 가능성(transferability)과 관계가 있는지 확인하기 위하여 공간 교차검증과 하이퍼 파라미터 조절을 실시하였으며 분석 결과, 공간 변수가 포함된 종 분포 모형에서 외삽 시 더 높은 예측력의 변동이 발견되었다. 종 분포 모형의 예측 결과를 신뢰하고 해석하기 위해서는 실제 생물 종의 분포에 영향을 미치는 것으로 알려진 생물학적 요인과 분산 요인을 고려하여야 한다. 본 연구는 자료의 공간 상의 구조를 다중 스케일에서 고려해 줄 수 있는 공간 변수를 사용할 경우 예측력의 증가를 확인한 선행 연구를 보완하여 차별성 지수가 아닌, 신뢰성 지수의 면에서 확인하였다. 또한 공간 교차검증을 통하여 공간 변수에 의한 예측력 감소는 모형의 공간적 전이가능성과 일반화와 관계를 찾기 어려움을 제시하였다. 따라서, 최대 엔트로피 알고리즘을 사용하는 종 분포 모형에서 거리 기반 아이겐벡터 매핑 혹은 PCNM은 좋은 선택이 되기 어려우며 보다 나은 공간 구조를 고려해줄 수 있는 설명 변수를 찾는 노력이 필요하다고 제시한다.
Language
kor
URI
https://hdl.handle.net/10371/178772

https://dcollection.snu.ac.kr/common/orgView/000000168468
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share