复杂动态环境下基于深度强化学习的AGV避障方法

复杂动态环境下基于深度强化学习的AGV避障方法

文章目录
  • 0 引言
  • 1 AGV避障问题描述与数学表征
  •     1.1 问题描述与假设
  •     1.2 避障过程数学表征
  • 2 部分观测马尔可夫决策过程构建
  •     2.1 观测空间
  •     2.2 动作空间
  •     2.3 奖励函数
  • 3 基于深度强化学习的避障策略求解
  •     3.1 网络结构
  •     3.2 算法流程
  •     3.3 避障策略训练
  • 4 仿真实验与分析
  •     4.1 评价指标
  •         (1)成功率α
  •         (2)额外时间比te
  •         (3)额外距离比de
  •     4.2 单次避障测试
  •         (1)交替场景
  •         (2)交叉场景
  •         (3)十字形场景
  •     4.3 长距离多次避障测试
  •     4.4 实验结果分析
  • 5 结束语
复杂动态环境下基于深度强化学习的AGV避障方法-AGV吧
复杂动态环境下基于深度强化学习的AGV避障方法
此内容为免费资源,请登录后查看
积分
免费资源
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容