Publications

Detailed Information

Stochastic Contextual Linear Bandit Models and Applications to Mobile Health Problems : 확률 맥락적 선형 밴딧 모형과 모바일 건강 문제에의 응용

DC Field Value Language
dc.contributor.advisor장원철-
dc.contributor.author예성주-
dc.date.accessioned2021-11-30T04:55:38Z-
dc.date.available2021-11-30T04:55:38Z-
dc.date.issued2021-02-
dc.identifier.other000000164028-
dc.identifier.urihttps://hdl.handle.net/10371/176106-
dc.identifier.urihttps://dcollection.snu.ac.kr/common/orgView/000000164028ko_KR
dc.description학위논문 (석사) -- 서울대학교 대학원 : 자연과학대학 통계학과, 2021. 2. 장원철.-
dc.description.abstractContextual Bandit models utilize information of a Bandit game player to optimize the players benefit. From the perspective of applications, it is preferred to adopt stochastic linear models in contextual Bandit problems for simple implementations. Hence, stochastic contextual linear Bandit models are widely used in real-world problems such as news article recommendations. Recently, mobile health problems are suggested as another applicable area of contextual Bandit models. However, for real-world applications, we must consider various aspects of the implementation of algorithms that are run on mobile devices. In this thesis, we will briefly review stochastic contextual linear Bandit algorithms, and discuss their applications to mobile health problems. Especially, we will inspect thoroughly the aspects that must be considered when we develop a mobile health application for real-world users.-
dc.description.abstract맥락적 밴딧 모형은 밴딧 게임에서 참여자의 정보를 이용하여 효용을 최적화하려 한다. 응용의 관점에서 본다면, 확률적 선형 모형을 맥락적 밴딧 문제에 적용하는 것이 선호된다. 때문에 확률 맥락적 선형 밴딧 모형은 뉴스 기사 추천 알고리즘과 같은 실생활의 문제에서 널리 활용되고 있다. 최근, 모바일 건강 문제가 맥락적 밴딧 모형의 또다른 활용 분야로 제시되고 있다. 하지만 현실 세계에서의 응용을 위해서는, 모바일 기기에서 작동하는 알고리즘의 구현에 필요한 것들을 여러 관점에서 고려하는 것이 필수적이다. 본 논문에서는 확률 맥락적 선형 밴딧 알고리즘을 간단히 복습하고, 이후에 모바일 건강 문제에의 적용에 대하여 논의한다. 특히 모바일 건강 어플리케이션을 개발할 때 고려해야할 측면들에 대하여 상세히 고찰한다.-
dc.description.tableofcontents1 Introduction 1

2 Overview of Stochastic Contextual Bandit Problems 2
2.1 Bandit Problems 2
2.2 Stochastic versus Adversarial Bandit Problems 5
2.3 Contextual Bandit Problems 7

3 Algorithms: Linear UCB and Linear Thompson Sampling 9
3.1 From Applications Perspective: Linear Models 9
3.2 Linear UCB 10
3.3 Linear Thompson Sampling 13

4 Applications: Mobile Health Problems 15
4.1 Mobile Health Problems 16
4.2 Stochastic Linear Bandit Model with Contexts for Mobile Health Problems 17
4.3 Problem Settings and Implementations in the Real-World 18
4.4 Further Considerations 21

5 Conclusion 22
-
dc.format.extentii, 24-
dc.language.isoeng-
dc.publisher서울대학교 대학원-
dc.subjectContextual Multi-Armed Bandit-
dc.subjectReinforcement Learning-
dc.subjectMobile Health Problems-
dc.subject맥락적 다중선택 밴딧 모형-
dc.subject강화학습-
dc.subject모바일 건강 문제-
dc.subject.ddc519.5-
dc.titleStochastic Contextual Linear Bandit Models and Applications to Mobile Health Problems-
dc.title.alternative확률 맥락적 선형 밴딧 모형과 모바일 건강 문제에의 응용-
dc.typeThesis-
dc.typeDissertation-
dc.contributor.AlternativeAuthorYea, Sung Ju-
dc.contributor.department자연과학대학 통계학과-
dc.description.degreeMaster-
dc.date.awarded2021-02-
dc.identifier.uciI804:11032-000000164028-
dc.identifier.holdings000000000044▲000000000050▲000000164028▲-
Appears in Collections:
Files in This Item:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share