Publications

Detailed Information

암호 화폐 시장의 횡적 수익 분석에 서 비선형적인 데이터 스케일링 방 법의 영향에 대한 실험적 연구 : Empirical study on the effect of Nonlinear Data scaling methods in Cross sectional return analysis of Cryptocurrency Markets

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

김형수

Advisor
문병로
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
암호 화폐 횡적 수익 분석데이터 스케일링 방법최적화
Description
학위논문(석사) -- 서울대학교대학원 : 공과대학 컴퓨터공학부, 2023. 2. 문병로.
Abstract
자산가격을 예측하는 다양한 방법이 연구되어 왔다 . 초기에는 선형적인 예측 모델들이 사용되었고 자산 가격 데이터의 복잡성 때문에 비선형적인 알고리즘들이 적용되었다 그 후 기계학습 알고리즘이 데이터들의 노이즈를 줄이고 상대적으로 자산 가격의 예측 정확도를 높여 많은 관심을 받게 되었다 . 최근에는 , 컴퓨테이션 파워의 증가로 인하여 Deep learning model 을 사용하는 방법들의 연구들이 활발하게 진행되고 있다 . 자산가격을 예측하는 문제들 중 , 여러 종목들의 상대적인 수익률 분석을 cross section al analysis 라고 한다 . 이런 연구에서는 자산가격이 특정 요인에 의해 결정된다고 가정한다. 상대적으로 많이 상승하는 종목과 하락하는 종목들을 잘 구분하면 좋은 팩터라고 볼 수 있다 Fama French 의 3 factor 모델로 시작을 하여, 여러 factor 들 로 종목의 수익률을 설명하고자 시도돼 왔다. 최근에는 머신러닝과 딥러닝 등을 이 용한 모델들이 이를 설명하고자 한다 . 그러나, 자산 시장을 구성하는 종목군 및 국가들이 다양하고, 기간의 영향을 크게 받는다 . 이런 요인들로 인하여 조건이 바뀌면 모델의 성과도 크게 바뀌게 된다. 금융데이터들은 노이즈가 많고 여러 outlier 들이 존재하는데, 그를 고려한 데이터 전처리 단계에서 Data scaling 방법에 대한 연구가 부족하다. 본 연구에서는 일반적인 자산시장보다 변동성이 큰 암호화폐 시장의 cross sectional return 분석에서 데이터 스케일링 방법의 영향에 대하여 연구를 하고 이들의 중요성을 보였다. 그리고, 여러 모델에서 공통적으로 좋은 데이터 스케일링 방법을 볼 수 있었다. 또한, 기존 연구들에서는 제한된 데이터 스케일방법만 적용을 하였는데 data scaling method 들의 최적화 방법을 통하여 feature 와 class 에 다양한 data scaling 방법들을 적용하여 성과의 증가를 보였다. 또한 feature selection 을 통하여 이들 최적화 방법의 타당성을 보였다 그리고 특정 기간에 집중된 실험이 될 수도 있으므로, 이를 방지하기 위하여 rolling back testing method 로 여러 기간에 대하여서 실험을 진행하였다. 이를 통해서 연구에서 제시한 최적화 방법들로 다양한 기간에서 모두 좋은 성과를 얻을 수 있었고, 기간에 민감한 금융 데이터에서 안정적인 성과를 얻을 수 있는 방법을 제안하였다.
Various methods of predicting asset prices have been studied. Initially, linear predictive models were used. Due to the complexity of asset data, nonlinear algorithms were applied. After that, machine learning algorithms have received a lot of attention by reducing the noise of the data and relatively increasing the prediction accuracy of asset prices. Recently, due to the increase in computational power, studies on methods using deep learning models are being actively conducted. Among the problems of predicting asset prices, the analysis of the relative returns of various stocks is called cross sectional return analysis. In these studies, it is assumed that asset prices are determined by a specific factor It can be seen as a good factor if the factor distinguishes between st ocks that are relatively rising and stocks that are falling. In cross section al return analysis, several factors are claimed to be significant after Fama French's 3 factor model. Recently, machine learning and deep learning are trying to explain this. Howe ver, the group of stocks and countries that make up the asset market are diverse and are greatly affected by the period. When the conditions change due to these factors, the
performance of the model also changes significantly. Financial data is noisy and has many outliers, but there is a lack of research on data scaling methods in the data pre processing stage considering them. In this study, we studied the influence of data scaling methods in the cross sectional return analysis of the cryptocurrency market , which has higher volatility than the general asset market, and showed their importance. And, good data scaling method s were seen in common in many models. In addition, in previous studies, only limited data scaling methods were applied,but through the optimization of data scaling methods, various data scaling methods were applied to features and classes to show an increase in performance. In addition, the validity of these optimization methods was shown through feature selection. In addition, since the experiment may be focused on a specific period, in order to prevent this, the experiment was conducted for several periods using the rolling back testing method. Through this, it was possible to obtain good performance in various periods with the optimization methods suggested in the study, and a method to obtain stable performance in financial data sensitive to period was proposed.
Language
kor
URI
https://hdl.handle.net/10371/193362

https://dcollection.snu.ac.kr/common/orgView/000000174483
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share