摘要:在无人机自主避障任务中, 传统强化学习算法往往面临状态空间高维、信息稀疏以及探索效率低下等挑战. 现有的SAC算法虽然具备较强的稳定性和样本效率, 但在复杂环境下的表现仍显不足. 为此, 本文提出了一种基于注意力机制SE和随机网络蒸馏RND模块改进的SAC算法, 旨在提升无人机在三维地形环境中的自主避障能力. 注意力机制SE通过自适应调整特征图的通道权重, 增强了模型对重要信息的关注能力, 从而提升了特征表达的有效性; 而改进的RND网络则通过生成对抗目标, 鼓励探索新环境, 丰富了样本的多样性和改善了收集效率. 基于上述的SE和RND, 我们构建了一个增强特征表达和探索的SAC (EFRE-SAC) 框架, 使得无人机能够更有效地从深度图像中学习环境特征, 并在三维环境中快速适应. 在AirSim+UE4仿真平台的实验结果表明, 所提出的改进方法显著提高了无人机的避障成功率和训练效率, 验证了改进的SE和RND模块在强化学习任务中的有效性.