面向智能避障场景的深度强化学习研究

在线阅读 下载PDF 导出详情
摘要 研究基于深度强化学习技术的避障场景的算法模型设计,采用改进岛深度Q网络(DeepQ-lesrningNet-work,DQN)算法克服了Q-learning表名式算法在连续状态下导致内存不足的局限性。鉴于学习过程中奖励稀疏导致很艰难获得较好结果的情况,改进奖利机制,增知实时奖惩作为补充,解决学习耗时长和练不稳定的问题:采用相对角度、位置金和距离等信息,相比绝对坐标信息可以更有效的躲障碍物。不同于基于栅格法/可视图法等传统人为策略避障算法,深度强化学习算法DQN能够在缺乏先验知识的条件下具备自主决策能力,因此适用性更强。该技术可应用在仓储无人车、巡佥机器人、无人机等现实场景。
机构地区 不详
出处 《智能物联技术》 2018年2期
出版日期 2018年02月12日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献