Publications

Detailed Information

비모수 공간모형과 앙상블 학습에 기초한 단독주택가격 추정

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

이창로

Advisor
박기호
Major
사회과학대학 지리학과
Issue Date
2015-08
Publisher
서울대학교 대학원
Keywords
기계학습비모수 모형공간적 종속성앙상블 학습공시가격
Description
학위논문 (박사)-- 서울대학교 대학원 : 지리학과, 2015. 8. 박기호.
Abstract
부동산 가격추정 모형은 최근 부동산 자료의 공개 및 구득 가능성 증가로 과거 그 어느 때보다 다양한 분야에서 활용되고 있다. 즉 자산 포트폴리오의 구성, 금융기관의 담보물 가치 추정, 부동산 개발의 타당성 판단 등 여러 업무에서 활용되고 있으며, 특히 과세평가는 파급효과가 전 국민에게 미치는 등 중요성이 매우 큰 분야의 하나이다.
그러나 우리나라의 대표적 과세가치에 해당되는 공시가격의 경우 현실화율이 낮고 가격 균형성이 미흡하다는 지적은 과거부터 꾸준히 제기된 문제점이다. 이는 조세저항 등 정치적 요인에서도 그 원인을 찾을 수 있지만 세금 부과의 기본이 되는 과세평가 과정, 보다 구체적으로 가격추정 모형이 잘못된 것에 기인한다. 본 연구는 보다 정확한 부동산 가격추정 방법론의 탐색으로부터 시작되었다.
또한 수리 또는 계량적 모형을 사용하는 사회과학연구에서 지금까지 설명 중심의 모형(Explanatory Modeling)이 주류를 이루었으며, 설명력이 좋은 모형은 예측력 또한 좋을 것으로 암묵적 가정을 하여 왔다. 그러나 이러한 두 가지 성능이 항상 일치하는 것은 아니며, 본 연구에서는 모형의 해석 가능성 등을 희생하더라도 신균 관찰치의 예측력 향상을 강조하는, 예측 중심의 모형(Predictive Modeling)을 구축하였다.
부동산 가격을 추정하기 위해 전통적으로 사용된 모형은 대부분 모수 모형(Parametric Model)으로서 설명변수의 독립성, 자료의 정규성, 모형 설계(Model Specification) 오류의 부재 등 엄격한 가정이 많았다. 뿐만 아니라 가격함수를 모수 및 설명변수와의 선형결합 형태로 전제하는 등 자료 특성을 지나치게 단순화하는 단점이 있었다. 이러한 비현실적 통계적 가정과 사전에 설정된 가격함수 형태를 강제하지 않는 예측 중심의 모형들이 기계학습(Machine Learning) 분야에서 다양하게 제시되었으며, 이러한 모형들은 그 특징상 대부분 비모수 모형(Non-parametric Model)에 해당된다.
본 연구에서는 그간 모수 모형에 집중되었던 부동산 가격추정 방법론을 예측 중심의 비모수 모형으로 확대하고자 한다. 아울러 다양한 비모수 모형 중 가장 우수한 것으로 판명된 모형 하나를 선택하는 것이 아니라, 개별 모형들의 추정값을 적정하게 결합하는 앙상블 학습(Ensemble Learning) 개념을 가격결정 과정에 도입하고자 한다. 마지막으로 이와 같은 모형의 정교화 외에 사례지역에 대해 주택가격을 직접 추정함으로써 모형을 통해 산정된 가격과 실제 거래가격 및 현행 주택공시가격과의 차이점을 파악하고자 한다.
2011년부터 2014년 사이에 신고된 실거래가 자료를 투입자료로 사용하였으며 사례지역은 대도시, 중소도시 및 군 지역을 대표할 수 있도록 서울시 강남구, 전주시 덕진구, 전라남도 해남군을 선정하였으며 주요 결과는 다음과 같다.
기계학습 분야에서 제시된 여러 비모수 모형 중 SVM(Support Vector Machine)이나 MARS(Multivariate Adaptive Regression Splines) 등 최근에 개발된 모형들의 성능이 비교적 우수한 것으로 나타나 이러한 모형들의 확대 적용이 필요한 것으로 보인다. 또한 지역 측면에서 강남구보다는 덕진구가, 덕진구보다는 해남군이 가격추정의 정확성이 떨어졌는데, 이는 농촌지역으로 갈수록 주택집단의 이질성이 높아지기 때문인 것으로 풀이된다.
가격추정 모형이 특히 어떠한 부분에서 취약한지 효율적으로 파악하기 위해 회귀트리 알고리즘(Regression Tree Algorithm)에 기반한 국지적 모형성능 진단을 수행한 결과, 토지 면적(또는 주택 규모)에 따른 자료 층화가 선행된 후 본격적인 모형 구축이 이루어질 경우 가격추정의 정확성이 높아질 것으로 파악되었다.
한편 기계학습 분야에서 제시된 이러한 비모수 모형들은 기본적으로 속성정보만 고려할 뿐, 공간사상의 특징인 공간적 종속성(Spatial Dependence)을 반영하는데 관심이 적다. 본 연구에서는 비모수 모형에 공간적 종속성을 추가로 반영하기 위해 SVM의 scale parameter를 공간적 종속성이 미치는 지리적 범위로 해석하여 모형을 정교화하였다. 또한 여러 비모수 모형에 모두 적용할 수 있도록 주변 주택가격의 평균적인 가격수준을 나타내는 공간차 변수(Spatially Lagged Variable) WY를 구성하여 공간적 종속성을 모형의 한 요소로 반영하였다.
주택에 대한 최종 예측가격은 개별 모형들 중 가장 성능이 우수하게 나타난 모형의 예측치로 결정하는 대신, 개별 모형들에서 산출된 예측치를 가중평균하는 앙상블 평균(Ensemble Averaging)을 적용하여 결정하였다. 앙상블 평균은 해남군과 같이 개별 모형들에서 산출된 예측치 간의 상관성이 낮은 경우 탁월한 성과를 보였다.
마지막으로 본 연구에서 제시한 앙상블 예측가격과 실제 거래가격, 그리고 현행 공시가격을 비교하였으며 여러 측면에서 공시가격보다는 앙상블 예측가격이 실제 거래가격을 보다 가깝게 반영하였다. 그러나 공시가격의 특징 내지 품질은 표준주택의 선정 등 자료수집 단계, 이해관계자 의견청취 단계 등 여러 절차에서 발생한 오류가 집적된 것임을 감안하여 해석할 필요가 있다.
Language
Korean
URI
https://hdl.handle.net/10371/120377
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share