Publications

Detailed Information

건물에너지 모델의 베이지안 추론과 파라미터 식별 가능성 분석 : Bayesian Inference and Parameter Identifiability Analysis for Building Energy Model

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

이동혁

Advisor
박철수
Issue Date
2021
Publisher
서울대학교 대학원
Keywords
베이지안 추론파라미터 식별 가능성우도 신뢰 구간모델 증거Nested sampling학습 기반 사전분포 선정디리클레 프로세스Bayesian inferenceParameter identifiabilityLikelihood confidence intervalModel evidenceLearning-based prior selectionDirichlet process
Description
학위논문(박사) -- 서울대학교대학원 : 공과대학 건축학과, 2021.8. 박철수.
Abstract
Recently, Bayesian inference has been in the spotlight for the stochastic parameter estimation technique in the building energy sector, and discussions on the issues with regard to the Bayesian inference of the building energy models have been actively conducted. The representative issues currently under discussion are as follows: (1) the results of the Bayesian inference may vary depending on prior selections, (2) the accuracy of the Bayesian inference may vary depending on the quantity and quality of the building energy data, (3) the efficiency of Bayesian inference relies on both the computational time of the simulation model and the parameter space capability of the Markov chain Monte Carlo method, (4) the accuracy of the Bayesian inference is affected by the parameter identifiability. Among the issues addressed above, the first three items have been already discussed in-depth in the building energy sector, and various analysis methods for these problems have been introduced with multiple case studies. However, the parameter identifiability problem has been relatively recently mentioned (since 2017) compared to the previous issues, and information sharing within the building energy sector has been made only in that over-parameterization can adversely affect the Bayesian inference.

The parameter identifiability is a concept that deals with the correspondence between the parameter information contained in the observed data (implicit information) and the parameters to be estimated in the parameter estimation problem, and the parameter identifiability analysis is a procedure to diagnose whether the meaningful estimation results can be obtained. In other words, despite the importance of pre-examining the associations between the observed data and the parameters to be inferred in order to obtain the proper inference results, the process of the parameter identifiability analysis including the following sub-processes has not been yet suggested: (a) how to quantitatively evaluate the identifiabilities of the parameters, (b) how to analyze the cause of the parameter identifiability problems, (c) how to deal with the unidentifiable parameters. In this context, this study aims to present the process to cope with the parameter identifiability problem in Bayesian inference of the building energy model. The proposal process consists of three procedures as follows.

First, the procedure of quantitatively assessing the parameter identifiability is discussed. To quantify the identifiability of individual parameter, the likelihood confidence interval, the confidence interval of the maximum likelihood estimation, is utilized, and diagnosing the interaction effect between parameters, which is the main cause of the identifiability problem, is introduced by conducting the biplot analysis for the likelihood confidence region. Through the case study, the following result will be shown: the less likely the parameter is to be identified, the greater the uncertainty of the Bayesian inference.

Second, the procedure of selecting the optimal hypothesis for the unidentifiability parameter based on the model evidence is discussed. The model evidence is the component of Bayes theorem and corresponds to the observation probability of the observed data for the model reflected individual hypotheses. Since the model evidence indicates the explanatory power of the hypothesis on the observed data, it can be utilized as the goodness-of-fit in the Bayesian framework. In this work, the model evidence for the individual hypotheses is estimated using nested sampling. Through the case study containing the unidentifiable parameter, the following result will be shown: the higher the model evidence, the greater the accuracy for both the hypothesis and Bayesian inference.

Third, the procedure of learning-based prior selection based on the parameter identifiability analysis and nonparametric Bayesian clustering is discussed. The likelihood confidence region is the parameter subspace associated with the observed data, and this region can be understood as the effective range of the parameter space search during the parameter estimation. And among the distributions that make up the likelihood confidence region, the one has the highest importance can be used as the prior learned from the observed data in the Bayesian inference. However, since the number of distributions that make up the likelihood confidence region corresponds to unknown information, this work introduces the nonparametric Bayesian clustering (all clusters correspond to the distributions, and the number of clusters is considered as the optimization target) to cope with this technical issue. And among the distributions obtained through the clustering work, the highest likelihood in the mean vector is applied as the prior of Bayesian inference. The case study deals with comparative analysis of the inference accuracy between existing prior selection methods and the proposed method, and through the comparison results, the usefulness of the learning-based prior selection method in the Bayesian inference will be shown.

In the conclusion section, the author summarizes the results of the three procedures and leaves the opinion that the parameter identifiability analysis is need to be considered as the pre-analysis in Bayesian inference of the building energy model.
건물에너지 시뮬레이션 도구의 지속적인 발전에도 불구하고, 시뮬레이션 모델 예측과 건물에너지 데이터 간 간극 (이하, performance gap)은 여전히 상당하고, 건물 시스템의 확률적 거동 (stochastic nature)이 모델 performance gap의 주요 원인으로 작용한다고 알려져 있다. 이는 다시 말하면, 건물에너지 시뮬레이션의 신뢰성 확보를 위해서는 건물 시스템의 불확실성을 고려한 모델 파라미터 추정이 필요함을 뜻한다. 2011년, 건물에너지 학계에서는 상술한 이슈의 대응방안으로 베이지안 추론의 활용이 제안되었다.

베이지안 추론은 조건부 확률 이론인 베이즈 정리에 기반한 파라미터 추정 기법으로, 사전분포 (분포로 정의된 파라미터 초기가정) 도입을 통해 분포 형태의 파라미터 추정 결과 (사후분포)를 도출할 수 있는 부분이 결정적 접근의 추정방법 (예: 최적화 이론, 최대 우도 추정)과의 차별점으로 작용한다. 즉, 베이지안 추론을 활용함으로써 모델 performance gap을 줄일 수 있으면서 (건물에너지 데이터 활용) 모델 파라미터의 불확실성 정량화를 수행할 수 있다. 그리고, 이러한 베이지안 추론의 특징이 건물에너지 시뮬레이션 분야에서의 수요에 부합하여 현재까지 건물에너지 시뮬레이션 부문에서 널리 활용되고 있다.

한편, 건물에너지 학계에서는 베이지안 추론의 활용 사례보고와 더불어 베이지안 추론을 활용하는 과정에서 발생 가능한 리스크에 관한 논의 역시 이루어지고 있다. 현재까지 논의된 논의사항을 요약하면 다음과 같다: (1) 사전분포 가정에 따라 베이지안 추론결과가 달라질 수 있는 문제, (2) 베이지안 추론이 건물에너지 데이터의 양 또는 질에 의존적인 문제, (3) 베이지안 추론 효율이 건물에너지 시뮬레이션의 연산 시간에 의존적인 문제, (4) 베이지안 추론 정확성이 파라미터 식별 가능성에 의존적인 문제. (1)∼(3)에 대해서는 다수의 분석사례, 분석 방법 및 대처 방법에 대해 충분한 정보 공유가 이루어졌고, 이미 심층적인 논의가 이루어진 바가 있다. 하지만, 파라미터 식별 가능성에 대해서는 최근에 발의되었고 (2017년∼), 추론 파라미터의 수가 과다하게 설정되었을 경우 부적절한 베이지안 추론결과가 도출될 수 있다는 수준에서 논의가 이루어진 바 있다. 파라미터 식별 가능성은 건물에너지 데이터에 포함된 파라미터 정보와 추정 파라미터 간 대응을 다루는 개념으로, 이에 대한 분석은 파라미터 추정을 통해 건물에너지 데이터로부터 추정 파라미터 정보를 얻을 수 있는지를 파악하는 과업에 해당한다. 즉, 유의미한 파라미터 추정의 가능 여부를 사전에 진단하기 위해서는 파라미터 식별 가능성을 분석하는 것이 중요하나, 식별 가능성의 정량적 평가, 식별 가능성 문제의 원인 분석, 식별 불가능 파라미터에 대한 사후 대처 등에 대한 구체적인 논의는 이루어지지 않았다.

이런 맥락에 따라, 본 논문에서는 건물에너지 모델의 베이지안 추론에서 파라미터 식별 가능성 문제에 대응하기 위한 프로세스에 관한 내용을 다루고자 한다. 제안 프로세스는 다음의 3개 서브 프로세스로 구성된다: [1] 우도 신뢰 구간 (영역) 추정에 기반한 식별 가능성 분석, [2] 모델 증거 추정에 기반한 식별 불가능 파라미터의 최적 가설 선정, [3] 우도 신뢰 영역 추정과 비모수 베이지안 클러스터링을 결합한 사전분포 학습.

[1]은 추정 파라미터의 식별 가능성을 진단하는 과업으로, 전체 프로세스의 기반에 해당한다. 개별 파라미터의 식별 가능성을 정량화하기 위해 우도 신뢰 구간 (최대 우도 추정치의 신뢰 구간)을 활용하고, 우도 신뢰 영역 (최대 우도 추정치의 신뢰 영역)에 대한 biplot 해석을 수행하여 식별 가능성 문제의 원인을 파악하는 과정을 소개한다. 사례 연구에서는 식별 가능성과 베이지안 추론 간 비교를 다루고, 파라미터의 식별 가능성이 작아질수록 베이지안 추론의 불확실성은 커짐을 보인다.

[2]는 [1]의 결과로 도출된 식별 불가능 파라미터 (건물에너지 데이터를 이용하여 추정 불가능한 파라미터)에 대한 최적 가설 (가정)을 선정하는 과업에 해당하고, 가설 적합도로써 모델 증거를 활용한다. 모델 증거는 베이즈 정리의 구성 요소로써 개별 가설이 반영된 모델에 대한 건물에너지 데이터의 관측확률과 같다. 그리고, 모델 증거 추정 알고리즘으로 nested sampling을 도입한다. 사례 연구를 통해, 가설의 모델 증거가 높을수록 이에 대응되는 베이지안 추론의 정확성이 높아짐을 보이고, 이를 통해 식별 불가능 파라미터에 대한 사후 대처에서 모델 증거의 활용성을 논한다.

[3]은 [1]의 식별 가능성 분석을 베이지안 추론의 다른 문제 (사전분포 선정 문제)에 응용한 과업으로, 우도 신뢰 영역 추정과 비모수 베이지안 클러스터링을 결합하여 건물에너지 데이터로부터 사전분포를 학습하는 방법을 제시한다. 우도 신뢰 영역은 건물에너지 데이터와 연관된 파라미터 부분 공간으로, 파라미터 추정에서 파라미터 탐색 유효 범위로 간주할 수 있다. 그리고 우도 신뢰 영역을 구성하는 구성 분포 중 중요도가 가장 높은 것을 건물에너지 데이터로부터 학습된 사전분포로 고려한다. 단, 우도 신뢰 영역의 구성 분포 수는 미지정보에 해당하기 때문에, 이에 대응하기 위해 비모수 베이지안 클러스터링 (클러스터는 확률분포에 해당하고, 클러스터 수는 최적화 대상으로 설정)을 도입한다. 사례 연구에서는 기존의 사전분포 선정방법 (정보 사전분포, 무정보 사전분포)와 제안 방법 간 베이지안 추론 정확성의 비교 결과를 보이고, 이를 통해 사전분포 학습 접근의 베이지안 추론의 유용성을 논한다.

마지막으로 [1]∼[3]의 결과를 정리하여 파라미터 식별 가능성 분석이 건물에너지 모델의 베이지안 추론에서 pre-analysis로써 고려될 필요가 있음을 논한다.
Language
kor
URI
https://hdl.handle.net/10371/178762

https://dcollection.snu.ac.kr/common/orgView/000000166645
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share