메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

강소이 (이화여자대학교, 이화여자대학교 대학원)

지도교수
신경식
발행연도
2021
저작권
이화여자대학교 논문은 저작권에 의해 보호받습니다.

이용수5

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
정보기술의 발달로 정보의 양이 나날이 축적되어 다양한 아이템에 대한 선택의 폭이 넓어졌다. 그러나 정보 과부하로 인해 사용자가 원하는 정보를 쉽게 찾기 어렵다는 문제점이 있다. 인터넷이 대중화되면서 사용자들은 가용한 여러 정보를 읽어보고 종합적으로 판단하는 대신 정보 검색 및 학습 시간을 절약해줄 수 있는 가시화된 시스템에 의존하고자 한다. 이에 따라 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다.
추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 한계점도 존재한다. 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성 문제는 협업 필터링의 가장 주요한 한계점이다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다.
이러한 문제를 해결하기 위해 다양한 방법이 협업 필터링 분야에서 연구 되어 왔다. 그러나 희소성 문제를 해결하기 위한 대부분의 연구는 사용자들의 소셜 네트워크 등 개인정보나 아이템에 대한 특성 등의 추가적인 외부 데이터가 확보되어야만 적용할 수 있어 유용성이 떨어진다. 또한 기존의 전통적인 오버샘플링 기법들은 동일한 데이터를 반복 학습하기 때문에 과적합(overfitting)이 일어날 가능성이 높으며, 학습에 노이즈로 작용해 추천 성능을 떨어뜨린다. 이에 더하여 다중 클래스 불균형 문제에 대한 대부분의 기존 연구는 이진 클래스 불균형 기법을 사용하지만 일부 방법들은 고차원 데이터에 직접 적용될 수 없으며 덜 효과적이거나 부정적인 영향을 미치기도 한다.
본 연구에서는 Conditional Generative Adversarial Network(CGAN)을 활용한 협업 필터링 모형을 제안하고자 한다. CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 모형의 정확도를 높이는 것을 목표로 한다. 먼저 CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하였다. 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 해당 모형을 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 랜덤 Latent vector을 받아 데이터를 생성하는 GAN을 사용하였다.
결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터 뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다. 본 연구에서 제안한 모형은 실제 데이터를 사용한 추천 시스템의 예측 한계를 해소시켰다는 것에 의의가 있으며, 해당 모형을 영화산업 데이터 뿐만 아니라 다양한 도메인에 활용할 경우 효과적인 추천 시스템을 구축하는데 기여할 수 있을 것으로 기대한다.

목차

Ⅰ. 서론 1
A. 연구의 배경 및 목적 1
B. 연구의 구성 5
Ⅱ. 선행연구 6
A. 협업 필터링 7
B. GAN 기반 생성모델 9
Ⅲ. 연구기법 11
A. 추천 시스템 12
B. CGAN(Conditional Generative Aversarial Network) 18
C. Sampling method 23
Ⅳ. 연구 문제 및 실험 설계 27
A. 실험 데이터 28
B. 평가 방법 29
C. 실험 설계 개요 31
Ⅴ. 연구결과 및 분석 36
A. 연구 결과 37
B. 논의 42
Ⅵ. 결론 44
참고문헌 46
ABSTRACT 54

최근 본 자료

전체보기

댓글(0)

0