메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

송창헌 (서울대학교, 서울대학교 대학원)

지도교수
김형주
발행연도
2021
저작권
서울대학교 논문은 저작권에 의해 보호받습니다.

이용수0

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
매주 새로운 음악이 발표되고 사용자는 검색을 통해 일부 음악에 노출되고 선택하게 된다. 따라서 음악 검색은 음악 소비에 있어 중요한 역할을 한다. 메타데이터나 태그를 활용하는 기존 음악 라이브러리에서의 검색은 사람이 개입하여 태그를 삽입해야 하는 문제가 있다. 이를 위한 방법으로 오디오 컨텐츠를 활용하여 자동으로 태그를 생성하거나, 검색에 이용하는 방식이 사용되었다. 오디오 컨텐츠를 이용한 음악 검색의 분야 중 하나인 오디오 매칭에서는 신경망을 이용하여 음악 또는 가수의 잠재적 표현을 학습하는 연구가 진행되었다. 이때, 어쿠스틱 피처를 신경망의 입력으로 이용하게 되면, 어쿠스틱 피처 구성을 위해 사용한 시간 해상도에 따라 시간 차원의 변화 폭이 커지는 문제가 발생한다. 본 논문에서는 이를 해결하기 위해 어쿠스틱 피처를 기반으로 그래프를 구성하고, 그래프 임베딩 기법을 활용한 오디오 컨텐츠 기반 임베딩 방법을 제안한다. 제안하는 모델은 Siamese 네트워크의 구조를 가지며, 두 음악 잠재 벡터의 차이를 이용하여 두 음악 사이의 유사도를 학습하도록 한다. 이를 통해 새로운 음악에 관한 유사도 결과도 추가 학습 없이 도출할 수 있도록 한다. 마지막으로 실험을 통해 기존 연구 대비 제안하는 방식의 효용성을 입증하였다.

목차

제 1 장 서론 1
제 2 장 관련 연구 7
2.1 신경망 활용 연구 7
1. Hamel et al. 7
2. Deep Music 8
3. Hybrid HLDBN 8
4. IMINET 9
2.2 그래프 임베딩 9
1. 그래프 콘볼루션 10
2. 그래프 어텐션 네트워크 10
3. SimGNN 11
2.3 One-shot 12
제 3 장 음악 유사도 점수 계산 모델 13
3.1 기존 방법의 한계 13
3.2 모델 구조 16
1. 그래프 추출 18
2. 그래프 임베딩 및 유사도 점수 계산 모델 19
3.3 실험 22
1. 데이터 셋 22
2. 구현 23
3. 실험 결과 24
3.4 모델 확장 및 활용 방안 25
제 4 장 제안 모델 27
4.1 배경 지식 27
1. 오디오 식별 27
2. 오디오 매칭 28
4.2 기존 모델의 한계 30
4.3 모델 구조 32
4.4 실험 35
1. 실험환경 36
2. 데이터 셋 36
3. 구현 37
4. 실험 결과 39
제 5 장 결론 및 향후 연구 44
참고문헌 46
부록 50
Abstract 55

최근 본 자료

전체보기

댓글(0)

0