avatar
文章
43
标签
29
分类
5
首页
时间轴
标签
分类
Logo雯欂の修仙笔记第九章策略梯度算法
搜索
首页
时间轴
标签
分类

第九章策略梯度算法

发表于2025-07-13|更新于2025-08-12|动手学强化学习

理论讲解部分过于简单,可参考强化学习教程相关章节

文章作者: 沉迷修仙の雯欂
文章链接: https://wblv66.top/2025/07/13/动手学强化学习/第九章策略梯度算法/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 雯欂の修仙笔记!
cover of previous post
上一篇
terrain_analysis参数解读
1. terrain_analysis scanVoxelSize 点云下采样的分辨率 decayTime 点云衰减时间阈值,即点云数据在多长时间后会被视为过时并从地图中移除 noDecayDis ​豁免点云衰减的距离阈值参数,保护车辆周围一定范围内的点云数据,即使这些数据的时间戳超过了 阈值也不会被移除 clearingDis 手动触发点云清除的距离阈值,​允许用户或外部指令清除车辆周围指定范围内的所有点云数据 useSorting 决定是否使用​排序分位数法来估计每个平面体素的地面高度。启用后抗噪声能力强,但计算量略大 quantileZ 地形高程估计的保守程度,决定了从排序后的点云高度数据中选择哪个分位数的值作为地面高度的估计。需要useSorting设为True才会发挥作用 considerDrop 它决定是否将点云相对于地面的高度差的 ​绝对值用于障碍物判断,设为True同时考虑​高于地面​ 的障碍物和​低于地面的凹陷,否则只关注​高于地面的障碍物 limitGroundLift 是否限制地面高程估计的最大抬升幅度(相对于该体素内的最低点),避免因噪声或离群点导致的地...
cover of next post
下一篇
第五章近端策略优化
avatar
沉迷修仙の雯欂
文章
43
标签
29
分类
5
公告
This is my Blog
©2025 By 沉迷修仙の雯欂框架 Hexo 7.3.0|主题 Butterfly 5.4.0-b2
冀ICP备2025114707号-1 京公网安备11010802045820号
搜索
数据加载中