메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

신유경 (아주대학교, 아주대학교 대학원)

지도교수
신현준, 신현정
발행연도
2019
저작권
아주대학교 논문은 저작권에 의해 보호받습니다.

이용수9

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
데이터의 레코드 중에 하나 이상의 속성값이 없는 경우는 비일비재하다. 의외로 많은 경우에 있어서 데이터의 수 대비 결측치가 없는 완전레코드의 수의 비율이 적다. 이에 대하여 평균값, 최빈값, 그리고 중앙값 등으로 대체하는 통계적 방법이 가장 보편적으로 쓰이고 있다. 또한, 기계학습에서도 K-최근접이웃 탐색이나 의사결정나무 등을 활용한 결측치 추정방법들이 자주 활용된다. 전자는 각 속성의 대표값으로 대체하는 전역적인 방법인데 반해 후자는 해당 레코드의 유사한 레코드들의 속성값으로 대체하는 지역적인 방법이라 할 수 있다. 그러나 한 속성의 값이 대부분 결측된 경우라면 두 방법 모두 한계가 있어 활용하기에 적절치 않다. 이러한 한계를 극복하기 위하여 본 연구에서는 결측치의 속성과 상관성이 큰 이웃 속성들로부터 값을 추정하는 방법을 제안한다. 제안 방법은 속성 간 상관성을 기반으로 하기 때문에 한 속성의 대부분의 값이 결측이 되더라도 활용할 수 있다. 방법론으로는 속성들 간의 상관계수로 이루어진 상관 그래프를 만들고 그래프 기반 준지도학습을 적용한다. 결측치는 다른 속성들로부터 상관계수에 비례하여 전파되어 추정된다. 비교 실험 결과, 제안 방법이 기존 방법들보다 우수함을 보였다.

목차

제 1장 서론 1
제 2장 정의 및 연구 배경 4
2.1 결측에 따른 데이터 구조 4
2.2 결측치 종류 및 처리 방법 8
2.3 결측치 대체 10
제 3장 선행 연구 11
제 4장 제안 방법론 16
4.1 그래프 이론 및 준지도학습 16
4.2 상관 속성 네트워크 구성 19
4.3 혼합 그래프 기반 준지도학습 32
4.4 결측치 대체 모델 35
제 5장 실험 36
5.1 토이 실험 36
5.2 실험 설정 39
5.3 실험 결과 42
제 6장 결론 47
참고문헌 50

최근 본 자료

전체보기

댓글(0)

0