본 논문에서 저자들은 머신러닝의 패턴분석기법 중 하나인 K-nearest neighbors(K-NN) 알고리즘을 KOSPI200 선물지수에 적용, 동 알고리즘을 이용한 기술적 분석의 예측력을 검증했다. 기술적 분석의 예측력 검증은 효율적 시장가설과 밀접한 연결고리가 있다. 효율적 시장가설에서 강형의 성립은 사적 내부정보(Private Information Set)를 이용해야만 시장에서 초과수익률 창출이 가능하다는 것으로써, 과거 가격 시계열의 움직임을 고려해서 투자하는 기술적 분석 혹은 차트 분석의 경우 현재 시장가격에 반영이 되어 있기 때문에 초과수익률 창출이 불가능하다는 것을 의미한다. K-NN 알고리즘은 머신 러닝의 대표적인 비모수 및 비선형 알고리즘으로 금융 시계열 데이터를 이용한 기술적 분석에 이 알고리즘을 선택한 이유는 다음과 같다. K-NN 알고리즘은 기계 학습의 방법 중 가장 간단한 방법으로 분류되며 모형 위험(Modeling Risk)을 최소화할 수 있다는 장점이 있다. 또한 정상성(Stationary)의 제약조건을 벗어나 비정상성의 동학을 갖는 가격 레벨에서 분석을 진행할 수 있기 때문에 실제 시장참여자들의 투자패턴을 그대로 적용하는데 용이한 점이 있다. 단변량 분석의 결과 K-NN의 두 가지 방법론 중 절대거리(Absolute) 방법론은 선물지수 하락기에 실현된 값보다 지속적으로 과대 예측하는 경향을 보였고, 반면 지수 횡보기에는 예측에 변동을 보이는 상관계수(Correlation) 방법론보다 안정적인 예측력을 보였다. 미결제약정과 프로그램 순매수 변화를 독립변수로 고려해 분석한 다 변량 분석의 결과 두 독립변수들의 추가적인 예측 기여도는 제한적인 것으로 나타났으며, 미결제약정 변수의 예측력 감소는 기존 논문의 결과와 배치되고 있어 추가 연구가 필요한 것으로 보인다. 또한 기존의 중요 기술적 지표들에 K-NN 알고리즘을 결합할 경우, 기술적 지표 자체를 이용한 투자전략보다 뛰어난 거래결과를 보임을 확인하였다. 본 논문은 약형 효율적 시장가설 관점에서 머신러닝 알고리즘을 적용해 기술적 분석의 유효성을 검증했다는 점에서 의미가 있다. 또한 K-NN 방법론의 KOSPI200 선물 적용은 본 논문에서 최초로 시도하는 것으로 국내 선물시장의 효율성 검증에 새로운 의미를 가져다줄 것으로 기대된다.
In this paper, we apply K-nearest neighbors (K-NN) Algorithm being one of the pattern analysis techniques of machine learning to the KOSPI 200 futures index, and test the forecasting power of the technical analysis of the algorithm. The test of predictive accuracy for technical analysis has close links with the efficient market hypothesis. The strong form of the efficient market hypothesis implies that primitive information must be used to generate excess returns in the market. Therefore, a technical analysis or chart analysis of the investment taking into account the past price movement time series is impossible to generate the excess return because all informations for pricing are reflected in current market prices. As K-NN algorithm is the representative non-parametric and non-linear algorithm on machine learning, the reason to take this algorithm for the technical analysis of financial time-series data is following. First, K-NN algorithm is the simplest method among machine learning methods, so we minimize the modeling risk from the analysis of this algorithm. Second, it allows analyzing on price levels whose dynamics can be non-stationary. Hence, it is easy to apply the actual investment pattern of market participants. K-NN algorithms for analyzing the univariate time series can be separated by two sub category methods, an absolute distance method and the correlation method, depending on how to measure the neighborhood. As the reason, we compared the predictive powers of the two ways. As the result of the univariate analysis, the absolute method, as the one of two K-NN algorithm methods, tended to consistently over-predicted than the realized value on the downturn of the future index. While the index walked sideways, the absolute method showed more reliable predictive power than the correlation method showing volatile prediction. Since K-NN algorithm analyzing a univariate sime series predict with using only past data set, there is a disadvantage that no additional information set is available. Therefore, it is available to study the effectiveness of aditional analysis containing more than one information set which help to increase predictive power. Candidates of the independent variables were selected for the two variables closely associated with connecting KOSPI200. As the first independent variable, we considered open interest to see the effect of an increase of the net quantity to prices of futures and options in a new contract. As the second independent variable, we considered the program net buying because the derivative market is freakishly large comparing with the underlying market in Korea. As the results of the multivariate analysis considering open interest and net buying in program trading, the additional contributions of two variables for the forecasting was limited, and the reduction of the prediction power of the open interest is contrary to the results of the existing papers, so it seems to need further studies. Also, a combination of K-NN algorithm of the existing main technical indicators confirmed to show superior trading results than the investment strategies dealing with the main indicators. This paper is meaningful in that it verifies the validity of technical analysis to apply machine learning algorithms in terms of a weak-form of efficient market. In addition, as the first attempt in domestic market, the application of K-NN algorithm to the KOSPI 200 futures market is expected to bring new meaning to verify an efficiency of the domestic futures market. Recently, a number of studies of various subjects have coming out such as effects of algorithmic trading on recent markets, contentions against the efficient market hypothesis, and verifying the validity of such trading strategies. Adjusting this trend, this study applying machine learning method to KOSPI200 contributes to have led to new finding that the predictive power using the univariate time series is not worse than multivariate time series.