摘要:比例积分微分(PID)控制在工业控制和机器人控制领域应用非常广泛. 然而, 其在实际应用中存在参数整定复杂、系统无法精准建模以及对被控对象变化敏感的问题. 为了解决这些问题, 本文提出了一种基于深度强化学习算法的分层自适应PID控制算法, 即TD3-PID, 用于移动机器人的自动控制. 其中, 上层控制器通过实时观测当前环境状态和系统状态实现对下层PID控制器参数和输出补偿量进行调整, 以实时补偿误差从而优化系统性能. 本文将所提出的TD3-PID控制器应用于4轮移动机器人轨迹跟踪任务并和其他控制方法进行了真实场景实验对比. 结果显示 TD3-PID控制器表现出更优越的动态响应性能和抗干扰能力, 整体响应误差显著减小, 在提高控制系统性能方面具有显著的优势.