메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
Guang Jin (부산대학교) Yohwan Noh (부산대학교) DoHoon Lee (부산대학교)
저널정보
Korean Institute of Information Scientists and Engineers Journal of KIISE Journal of KIISE Vol.47 No.6
발행연도
2020.6
수록면
547 - 552 (6page)
DOI
10.5626/JOK.2020.47.6.547

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
강화학습은 여러 가지 어려운 문제들을 해결하는 데 좋은 결과를 보여주고 있다. 그러나 이를 실제 문제에 적용하기에는 샘플 효율성이 큰 문제이다. 이 논문에서는 차별 손실함수를 이용한 모델기반 강화학습 프레임워크를 제안한다. 이 방법은 모델이 서로 다른 동작을 구별할 수 있도록 훈련한다. 이 프레임워크로 사전 학습된 인코더가 추출한 특징은 정책 그라디언트 방법이 추출한 특징과 일치한다는 것을 발견했다. 제안한 방법은 아타리(Atari) 게임 환경에서 기존의 모델기반 강화학습 방법보다 높은 샘플 효율성을 보였으며 특히 학습의 초기 단계에서는 기준선보다도 높은 효율성을 보였다.

목차

요약
Abstract
1. Introduction
2. Related Work
3. Discriminative Model-based Reinforcement Learning
4. Experiment Result
5. Conclusion
References

참고문헌 (11)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0