基于集成的多深度确定性策略梯度的无人驾驶策略研究

论文目录

摘要
Abstract
第1章 绪论
1.1 选题背景
1.2 研究的目的及意义
1.3 国内外研究现状分析
1.3.1 无人驾驶的国内外研究现状
1.3.2 深度强化学习的国内外研究现状
1.4 论文主要研究内容与创新点
1.4.1 论文主要研究内容
1.4.2 论文创新点
1.5 论文章节安排
第2章 深度强化学习理论基础
2.1 深度学习理论基础
2.1.1 神经网络的结构
2.1.2 神经网络的训练
2.1.3 深度学习模型
2.2 强化学习方法
2.2.1 强化学习框架与基本概念
2.2.2 基于值函数的强化学习方法
2.2.3 基于策略梯度的强化学习方法
2.3 基于深度学习的强化学习
2.3.1 深度Q网络算法(DQN)
2.3.2 深度确定性策略梯度算法(DDPG)
2.4 本章小结
第3章 集成的多深度确定策略梯度算法设计
3.1 集成的多深度确定性策略梯度(AMDDPG)算法
3.1.1 多个深度确定性策略梯度的集成学习结构
3.1.2 策略集成分析
3.1.3 中央经验回放池技术
3.1.4 训练模式与算法描述
3.2 本章小结
第4章 无人驾驶仿真系统架构设计
4.1 TORCS仿真平台简介
4.2 仿真环境的接口设计
4.3 仿真环境状态信息
4.4 仿真车辆的控制指令
4.5 无人驾驶仿真系统架构
4.6 本章小结
第5章 实验与结果分析
5.1 实验的软硬件环境
5.2 网络结构层次设计
5.3 回报函数设计
5.4 网络权重预训练
5.5 实验结果分析
5.5.1 学习曲线
5.5.2 训练时间
5.5.3 子策略集成的效果
5.5.4 集成策略的泛化性能
5.5.5 子策略数量对集成策略的影响
5.6 本章小结
第6章 总结与展望
6.1 研究总结
6.2 研究展望
参考文献
致谢
作者简历及攻读学位期间发表的学术论文与研究成果

基于集成的多深度确定性策略梯度的无人驾驶策略研究-AGV吧
基于集成的多深度确定性策略梯度的无人驾驶策略研究
此内容为付费资源,请付费后查看
20积分
付费资源
© 版权声明
THE END
喜欢就支持一下吧
点赞5赞赏 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容