Browse

소셜미디어 데이터와 기계학습을 활용한 주식투자 전략
Stock Investment Strategy Using Social Media Data and Machine Learning

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors
최민
Advisor
조성준
Issue Date
2020
Publisher
서울대학교 대학원
Description
학위논문(석사)--서울대학교 대학원 :공과대학 산업공학과,2020. 2. 조성준.
Abstract
최근 증권, 자산운용계는 수익률 알파 창출을 위한 대체 데이터 활용이 화두다. 대체 데이터는 가격, 재무 데이터 및 경제지표 등 전통적 데이터 범주에 속하지 않는 데이터를 통칭한다. 물류 데이터, 소셜 네트워크 데이터, 위성사진 등이 해당된다. 본 논문에서는 대체 데이터와 머신러닝 기법을 활용한 주식 투자 전략을 제안한다. Social Media에 녹아있는 주식에 대한 투자자의 수요(관심)를 머신러닝 모델의 input으로 투입했다. 선행연구에서 사용한 기술적 지표 외에 포탈 사이트 주식 게시판의 게시물 로그, 텍스트 데이터에 주목했다. 수집한 텍스트 데이터에는 word2vec기법을 적용해 상폐라는 급락 시그널을 주는 단어 score를 계산해 모델에 넣었다.
이 데이터에 Tree계열의 앙상블 모델을 적용해 일주일간 10% 이상 급등하는 지를 예측하도록 했다. 주식 게시판이라는 대체 데이터를 넣은 경우 그렇지 않은 경우에 비해 평균 수익률이 개선됐다. Random Forest Classifier를 기준으로 hyperparameter tunning을 한 결과, 약 10.5%의 평균 수익률을 기록했다. 5번의 train-test 백테스트 과정을 통해 본 전략의 수익률이 꾸준하게 유지됨을 보였다.
Alternative data for ‘alpha’ is the most important issue in finance industry. Alternative data does not belong to traditional data categories such as price, financial data and economic indicators. Examples of alternative data include logistics data, social network data, satellite images. In this paper, We propose a stock investment strategy using alternative data and machine learning techniques. Investors' demand for stocks extracted from social media was put into the machine learning model. In addition to the technical indicators used in the previous study, attention was paid to posts on the stock bulletin board. The word2vec technique was applied to the collected text data, and a ‘delisting’ word score that gave a sharp drop signal was calculated and put into the model.
The tree-based ensemble model was applied to this data to predict whether it would jump more than 10% over the week. If you put in alternative data, the stock bulletin board, the average return improved. After hyperparameter tunning, the Random Forest Classifier yielded an average return of about 10.5%. Five train-test backtests showed that the yield of this strategy remained steady.
Language
kor
URI
http://dcollection.snu.ac.kr/common/orgView/000000159962
Files in This Item:
Appears in Collections:
College of Engineering/Engineering Practice School (공과대학/대학원)Dept. of Industrial Engineering (산업공학과)Theses (Master's Degree_산업공학과)
  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse