추천시스템은 사용자에게 개인화 맞춤형 추천을 하여 방대한 양의 정보 속에서 사용자에게 정보 탐색에 드는 비용을 줄여주는 역할을 한다. 또한 추천시스템을 기용하는 기업에게는 사용자의 구매 및 선택을 유도해 실질적 이윤 창출이라는 긍정적인 효과를 가져다준다. 본 연구는 다양한 추천 알고리즘 중에서도 대표적인 협업필터링(Collaborative filtering) 알고리즘에 초점을 맞추었다. 협업필터링은 대상 사용자 또는 아이템에 대해 가장 유사한 이웃을 찾고, 이 이웃의 정보를 활용하여 대상 사용자 또는 아이템에게 추천을 하는 알고리즘이다. 대상 객체의 유사한 이웃 정보를 직접 활용하는 협업필터링을 Memory-based Collaborative Filtering(CF) 라고 하는데, 이는 객체 간의 유사도를 잘 계산하는 것이 중요하다. 그리하여 유사도 지표를 새롭게 제안하거나 전통적인 유사도 지표를 개선하여 성능을 향상하려는 연구가 활발히 진행되고 있다. 기존 유사도를 개선하기 위한 여러 방법 중 하나는 추천 도메인의 카테고리 정보를 활용하는 방법이다. 본 연구에서는 영화 도메인에 초점을 맞추기 때문에 영화의 카테고리 정보인 장르 정보를 활용하였다. 본 논문에서는 사용자가 평가한 아이템들이 포함하고 있는 장르의 비율을 고려할 뿐만 사용자의 성향을 담기 위해 사용자 평점 정보를 추가로 활용하였다. 그리고 유사도 행렬을 비대칭하게 형성하도록 함으로써 모든 사용자에게 주체적인 유사도를 가질 수 있도록 하였다. 주로 장르 정보를 활용하는 제안 방범들은 추천시스템의 희소성 문제에 조금 더 강건한 item-based CF에 집중된 경향이 있지만 본 논문에서는 user-based CF로 구현하여 개선된 성능을 다른 방법들과 비교하여 그 성능을 입증하고자 한다. 결과적으로 기존의 장르 정보를 활용한 유사도 지표를 개선하고 본 논문이 제안한 방법을 활용한 추천시스템의 성능향상을 실험을 통해 입증하였다.
The recommendation system provides personalized recommendations to users, thereby reducing the cost of searching information to users in a vast amount of information. In addition, companies that use the recommendation system induce users to purchase and select, resulting in a positive effect of creating substantial profits. This study focuses on famous Collaborative filtering algorithm among various recommendation algorithms. Collaborative filtering is an algorithm that finds the most similar neighbors for the target user or item, and recommends the target user or item by utilizing the information of the neighbor. Collaborative filtering (CF) is a collaborative filtering that directly utilizes similar neighbor information of the target object. It is important to calculate the similarity between objects well. Therefore, studies are actively being conducted to propose new similarity indicators or to improve performance by improving traditional similarity indicators. One of the many methods to improve existing similarity is to utilize category information of recommended domain. In this study, genre information, which is the category information of movies, was used because it focuses on the movie domain. In this paper, we consider the proportion of genres that the items evaluated by the user are included, and further use the user rating information to include the user''s tendency. And by forming the similarity matrix asymmetrically, it is possible to have independent similarity to all users. Although the proposed crime prevention using genre information tends to focus on the redundancy problem of the recommendation system, this paper tries to prove the performance of the proposed crime prevention system by comparing the improved performance with other methods by implementing it as a user based CF.As a result, the similarity index using the existing genre information was improved and the performance improvement of the recommendation system using the method proposed in this paper was proved through experiments.