基于深度强化学习的分层自适应PID控制算法
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Hierarchical Adaptive PID Control Algorithm Based on Deep Reinforcement Learning
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    比例积分微分(PID)控制在工业控制和机器人控制领域应用非常广泛. 然而, 其在实际应用中存在参数整定复杂、系统无法精准建模以及对被控对象变化敏感的问题. 为了解决这些问题, 本文提出了一种基于深度强化学习算法的分层自适应PID控制算法, 即TD3-PID, 用于移动机器人的自动控制. 其中, 上层控制器通过实时观测当前环境状态和系统状态实现对下层PID控制器参数和输出补偿量进行调整, 以实时补偿误差从而优化系统性能. 本文将所提出的TD3-PID控制器应用于4轮移动机器人轨迹跟踪任务并和其他控制方法进行了真实场景实验对比. 结果显示 TD3-PID控制器表现出更优越的动态响应性能和抗干扰能力, 整体响应误差显著减小, 在提高控制系统性能方面具有显著的优势.

    Abstract:

    Proportional integral derivative (PID) control is widely used in the fields of industrial and robot control. However, it faces challenges such as complex parameter setting, difficulty in accurately modeling the system, and sensitivity to changes in the controlled object. To address these challenges, this study proposes a hierarchical adaptive PID control algorithm based on a deep reinforcement learning algorithm, named TD3-PID, for the automatic control of mobile robots. In this algorithm, the upper-layer controller adjusts the parameters and output compensation of the lower-layer PID controller by observing the current environmental and system status in real time to compensate for errors in real time and optimize system performance. This study applies the proposed TD3-PID controller to a trajectory tracking task of a four-wheel mobile robot and conducts real-scenario experimental comparisons with other control methods. The results show that the TD3-PID controller exhibits superior dynamic response performance and anti-interference ability. The overall response error is significantly reduced and significant advantages are seen in improving the performance of the control system.

    参考文献
    相似文献
    引证文献
引用本文

余文浩,齐立哲,梁瀚文,孙云权.基于深度强化学习的分层自适应PID控制算法.计算机系统应用,2024,33(9):245-252

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-02-04
  • 最后修改日期:2024-02-23
  • 录用日期:
  • 在线发布日期: 2024-07-30
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号