메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
김형용 (서울대학교) 우범준 (서울대학교) 김남수 (서울대학교)
저널정보
한국통신학회 한국통신학회논문지 한국통신학회논문지 제46권 제10호
발행연도
2021.10
수록면
1,596 - 1,603 (8page)
DOI
10.7840/kics.2021.46.10.1596

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
본 논문에서는 점진적 병렬 웨이브넷(progressive parallel waveNet)을 제안하고 이를 음성 합성 보코더인 병렬 웨이브겐(parallel waveGAN) 생성기(generator)에 적용하여 성능을 확인 하였다. 음성 합성 보코더에서 높은 성능을 보이는 병렬 웨이브겐의 생성기인 병렬 웨이브넷(parallel waveNet)은 학습 시 많은 GPU(graphical processing unit)를 필요로 한다. 이를 해결하기 위해서, 병렬 웨이브넷의 구조를 음성의 업샘플링(up-sampling) 과정을 활용하여 점진적인 구조로 변형 하였다. 이는 병렬 웨이브넷에서 연산하는 특징 벡터들의 타임 축 크기 문제를 효과적으로 해결한 구조이다. 또한 음성을 넓은 주파수대역을 점진적으로 처리함으로써 학습의 안정성 및 성능을 높일 수 있는 구조이다. 실험 결과 기존 병렬 웨이브겐과 비교하여 학습 시 적은 GPU 사용량을 보였으며, 음성 생성 시 생성 속도 역시 빠른 것을 확인 할 수 있었다. 최종적으로 음성의 품질을 객관적인 지표로 측정 하였을 때, 소폭 향상된 결과 역시 확인 할 수 있었다.

목차

요약
ABSTRACT
Ⅰ. 서론
Ⅱ. 본론
Ⅲ. 실험
Ⅳ. 결론
References

참고문헌 (17)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0