基于未知环境状态新定义及知识启发的机器人导航Q学习算法

AIPUB归智期刊联盟

微信公众号

网站二维码

2025年7月30日 17:40 星期三

首页 > 过刊浏览>2014年第23卷第1期 >149-153

PDF HTML阅读 XML下载导出引用引用提醒

基于未知环境状态新定义及知识启发的机器人导航Q学习算法
DOI:
                        
                    
CSTR:
                        
                    
作者:
                        童小龙童小龙
浙江工业大学 信息工程学院, 杭州 310023
在期刊界中查找
在百度中查找
在本站中查找
姚明海姚明海
浙江工业大学 信息工程学院, 杭州 310023
在期刊界中查找
在百度中查找
在本站中查找
张灿淋张灿淋
浙江工业大学 信息工程学院, 杭州 310023
在期刊界中查找
在百度中查找
在本站中查找

                    
作者单位:
作者简介:
通讯作者:
中图分类号:
基金项目:国家自然科学基金（61070113）

A Q-Learning Algorithm for Robot Navigation Based on a New Definition of an Unknown Environment States and Knowledge Heuristic

Author:

TONG Xiao-Long
TONG Xiao-Long
College of Information Engineering, Zhejiang University of Technology, Hangzhou 310023, China
在期刊界中查找
在百度中查找
在本站中查找
YAO Ming-Hai
YAO Ming-Hai
College of Information Engineering, Zhejiang University of Technology, Hangzhou 310023, China
在期刊界中查找
在百度中查找
在本站中查找
ZHANG Can-Lin
ZHANG Can-Lin
College of Information Engineering, Zhejiang University of Technology, Hangzhou 310023, China
在期刊界中查找
在百度中查找
在本站中查找

Affiliation:

Fund Project:

摘要

图/表

访问统计

参考文献

相似文献

引证文献

资源附件

文章评论

摘要:

由于强大的自主学习能力, 强化学习方法逐渐成为机器人导航问题的研究热点, 但是复杂的未知环境对算法的运行效率和收敛速度提出了考验。提出一种新的机器人导航Q学习算法, 首先用三个离散的变量来定义环境状态空间, 然后分别设计了两部分奖赏函数, 结合对导航达到目标有利的知识来启发引导机器人的学习过程。实验在Simbad仿真平台上进行, 结果表明本文提出的算法很好地完成了机器人在未知环境中的导航任务, 收敛性能也有其优越性。

关键词:强化学习;状态定义;知识启发;Simbad平台

Abstract:

Due to powerful self-learning ability, reinforcement learning has become a research hot spot about robot navigation problems, but the operating efficiency and convergence speed of the algorithm are tried by the the complex unknown environment. A new Q-learning algorithm for robot navigation was proposed in this paper. First, three discrete variables were used to define the space states of the environment, and then two parts of the reward functions were designed, combining the beneficial knowledge for reaching the target to inspire and guide the robot's learning process. The experiment was executed on Simbad simulation platform. The results show that the proposed algorithm is well done in an unknown environment robot navigation task, and has a better convergence speed.

Key words:reinforcement learning;states definition;knowledge heuristic;Simbad platform

引用本文

童小龙,姚明海,张灿淋.基于未知环境状态新定义及知识启发的机器人导航Q学习算法.计算机系统应用,2014,23(1):149-153

复制

文章指标

点击次数:
下载次数:
HTML阅读次数:
引用次数:

历史

收稿日期:2013-06-08
最后修改日期:2013-07-09
录用日期:
在线发布日期: 2014-01-26
出版日期:

微信公众号

网站二维码

引用本文

相关视频

分享

文章指标

历史

文章二维码

微信公众号

网站二维码

引用本文

相关视频

分享

微信扫一扫：分享

文章指标

历史

文章二维码