摘要:在多用户多任务场景下, 使用传统的决策算法去对短时间内接踵而来的任务进行计算卸载决策, 已经不能满足用户对决策效率和资源利用率的要求. 因此有研究提出使用深度强化学习算法来进行卸载决策以满足各种场景下的需求, 但是这些算法大多只考虑卸载优先的策略, 这种策略使用户设备(UE)被大量闲置. 我们提高了移动边缘计算(MEC)服务器和用户设备(UE)的资源利用率, 降低计算卸载的错误率, 提出了一种本地优先和改进TD3(twin delayed deep deterministic policy gradient)算法相结合的决策卸载模型, 并设计了仿真实验, 通过实验证明该模型确实可以提高MEC服务器和UE的资源利用率并降低错误率.