avatar
文章
43
标签
29
分类
5
首页
时间轴
标签
分类
Logo雯欂の修仙笔记第五章近端策略优化
搜索
首页
时间轴
标签
分类

第五章近端策略优化

发表于2025-07-13|更新于2025-08-12|动手学强化学习
文章作者: 沉迷修仙の雯欂
文章链接: https://wblv66.top/2025/07/13/强化学习教程/第五章近端策略优化/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 雯欂の修仙笔记!
cover of previous post
上一篇
第九章策略梯度算法
理论讲解部分过于简单,可参考强化学习教程相关章节
cover of next post
下一篇
第十章Actor-Critic算法
虽然采用时序差分法来指导网络学习,但是此算法仍是在一个episode结束后才进行网络更新
avatar
沉迷修仙の雯欂
文章
43
标签
29
分类
5
公告
This is my Blog
©2025 By 沉迷修仙の雯欂框架 Hexo 7.3.0|主题 Butterfly 5.4.0-b2
冀ICP备2025114707号-1 京公网安备11010802045820号
搜索
数据加载中