메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
손형섭 (한밭대학교) 임준묵 (한밭대학교)
저널정보
대한산업공학회 대한산업공학회 춘계공동학술대회 논문집 2022년 대한산업공학회 춘계공동학술대회 논문집 [2개 학회 공동주최]
발행연도
2022.6
수록면
808 - 811 (4page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
AI시대에서 텍스트를 음성으로 변환 해 주는 음성합성 기술은 많이 발전하고 쓰이고 있다. 일상생활 중에서도 음성합성 기술을 많이 접할 수 있는데 음성안내 서비스, ARS서비스, 보행신호, 인터넷 방송, E-BOOK 등을 접할 수 있다. 정보 습득을 보조해주거나 시각장애인같이 시각 정보를 획득하기 어려운 사람들에게는 정보 습득 수단이 될 수 있다. 이런 음성합성 기술은 학습시키고자 하는 음성 소스, Mel spectrogram을 생성해 주는 음성합성모델(Voice Synthesis Model) 그리고 Mel spectrogram을 음성으로 변환 해 주는 보코더(Vocoder)로 구성되어 있다. 딥러닝 기술과 그래픽 카드의 성능 발전으로 인해 음성합성 기술도 많은 발전을 하고 있다. 이런 딥러닝을 이용한 대표적인 음성합성 모델로는 Tacotron2, FastSpeech, Glow-TTS와 같은 모델이 있다.
연구에서는 이런 음성합성 모델의 속도와 품질을 비교분석하였다. 본 연구의 결과는 일상생활에서의 다양한 분야에서 음성합성기술의 효과적인 활용의 방안을 마련하는데 기여할 수 있을 것이다.

목차

초록
1. 서론
2. 음성합성 시스템
3. 음성합성모델과 보코더 선택
4. 결론
참고문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2022-530-001523096