【深度强化学习#2】Deep Mind× UCL 2021年强化学习课程第13讲
由qxiao创建,最终由qxiao 被浏览 200 用户
第13讲:深度强化学习#2 研究工程师Matteo Hessel介绍了作为辅助任务的一般值函数和GVFs,并解释了如何处理算法中的缩放问题。
https://www.youtube.com/watch?v=siDtNqlPoLk
/wiki/static/upload/68/681cbfe6-bae1-4386-94e7-1577ecb20380.pdf
\