기계학습(Machine Learning)과 투자전략 빅 데이터 기법: Naive Bayes Classifier의 활용 빅 데이터 그리고 기계학습 빅 데이터는 최근 산업계의 가장 큰 화두다. 빅 데이터란 기존의 데이터 차원을 넘어 서는 대량의 정형/비정형 데이터 집합 및 이런 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다. 빅 데이터를 분석하는 작업은 인간의 처리 능력을 벗어나 는 것이므로 기계의 도움이 필요하게 된다. 이 때 사용하는 도구가 바로 기계학습 (Machine Learning) 알고리즘이다. 기계학습이란 컴퓨터가 데이터로부터 학습을 한 다음, 이를 바탕으로 데이터 분석 및 예측을 하는 알고리즘이다. 얼굴 자동인식 프로 그램 혹은 스팸메일 자동분류 기능 등이 실생활에서 사용되는 기계학습의 사례에 해 당한다. 미국 등의 선진국에서는 기계학습 기술을 활용하여 빅 데이터를 분석하는 'Data Scientist'의 수요가 폭발적으로 늘고 있는 상황이다. 기계학습(Machine Learning)은 주식투자 분야에서도 활용될 수 있다. 주식시장에는 수많은 데이터들이 존재한다. 매일매일 주식시장에 대한 뉴스 기사가 나오며, DART(전자공시시스템)에도 매순간 주식들의 공시정보가 올라온다. 각 주식의 여러 가지 펀더멘털 수치 데이터도 항상 조회할 수 있다. 이런 다양한 데이터들을 Machine Learning을 통해 자동 학습하여 패턴 인식 및 예측에 활용한다면, 자동화된 주식투자 모델을 만들 수 있다. 최근 증권업계에서 이야기되는 로보어드바이저 서비스에서도 기 계학습 알고리즘이 일정부분의 역할을 하고 있다. Naive Bayes Classifier 소개 및 모델 제시 나이브 베이즈 분류기는, 기계학습의 한 분야로서, 특정 자료가 여러 가지 속성을 가 지고 있을 때 해당 자료를 어느 분류(Class)에 넣어야 할지를 베이즈 정리를 활용하여 판단해주는 알고리즘이다. 본고에서는 나이브 베이즈 분류기를 활용하는 W/L 모델과 BoW 모델을 제시한다. W/L 모델은 기존의 팩터분석 방법론과 유사하게 종목별 다양한 펀더멘털 지표를 기 반으로 주가상승예상/주가하락예상 종목을 구분하는 모델이다. BoW 모델은 ‘Bag of Words’ 방법을 사용하여 텍스트 마이닝을 할 수 있는 모델이다.
'Infomation' 카테고리의 다른 글
주식 투자자의 의사결정 지원을 위한 데이터 마이닝 도구 (0) | 2016.03.27 |
---|---|
각광받는 딥러닝의 근원, 인공신경망 (Artificial Neural Network) (1) | 2016.03.27 |
CEP (0) | 2016.03.24 |
homepage 추천 (0) | 2016.02.20 |
[펌]서버/클라이언트 소켓(Socket) 통신하기 (1) | 2016.02.15 |