📚 学习资源站
首页
视频课程
学习专栏
电子书库
← 返回专栏列表
01-第1章 强化学习基础
共 29 篇文章
#1
01-第1章 强化学习基础
阅读
#2
02-第1章 练习题
阅读
#3
03-第 2 章 马尔可夫决策过程
阅读
#4
04-第 2 章 练习题
阅读
#5
05-第 3 章 表格型方法
阅读
#6
06-使用Q-learning解决悬崖寻路问题
阅读
#7
07-第 4 章 策略梯度
阅读
#8
08-第4章 练习题
阅读
#9
09-第5章 PPO 算法
阅读
#10
10-第5章 练习题
阅读
#11
11-第6章 深度Q网络
阅读
#12
12-第6章 练习题
阅读
#13
13-第7章 深度Q网络进阶技巧
阅读
#14
14-第7章 练习题
阅读
#15
15-使用DQN实现CartPole-v0
阅读
#16
16-第8章 针对连续动作的深度Q网络
阅读
#17
17-第8章 练习题
阅读
#18
18-第9章演员-评论员算法
阅读
#19
19-第9章练习题
阅读
#20
20-第10章 稀疏奖励
阅读
#21
21-第10章 练习题
阅读
#22
22-第11章 模仿学习
阅读
#23
23-第11章 练习题
阅读
#24
24-第12章 深度确定性策略梯度
阅读
#25
25-第12章 练习题
阅读
#26
26-使用Policy-Based方法实现Pendulum-v0
阅读
#27
27-第13章 AlphaStar 论文解读
阅读
#28
28-第14章LS-Imagine
阅读
#29
29-世界模型的本质
阅读