커리큘럼
질문답변
탄탄한 강화학습 개념잡기
강화학습 개요
레슨 3개
강화학습의 배경과 특성
강화학습 인터페이스
Exploitation과 Exploration
강화학습 문제 정의
레슨 3개
MDP와 Policy
가치함수
최적 가치함수
강화학습 솔루션
레슨 5개
Dynamic Programming
실습 - Grid World
Monte Carlo 방법
Temporal Difference 방법
실습 - Cliff Walking
강화학습 솔루션 2
레슨 7개
n-step Bootstrapping
가치함수 근사화
가치함수 근사화 솔루션
Eligibility Traces
실습 - Random Walk
Policy Gradient 방법
REINFORCE와 Actor-Critic 방법
질문답변
질문하기
내 질문
강화학습의 배경과 특성
강의자료(1)
강의이동
에디터
레슨 완료!
수강을 완료했어요👏
닫기
다음 레슨 보기
축하합니다🎉
모두 다 수강했어요!
닫기
수강증 받기
C
C++
Java
Python
실행 결과가 표시됩니다.