摘要:移动边缘计算(mobile edge computing, MEC)使移动设备(mobile device, MD)能够将任务或应用程序卸载到MEC服务器上进行处理. 由于MEC服务器在处理外部任务时消耗本地资源, 因此建立一个向 MD 收费以奖励MEC服务器的多资源定价机制非常重要. 现有的定价机制依赖于中介机构的静态定价, 任务的高度动态特性使得实现边缘云计算资源的有效利用极为困难. 为了解决这个问题, 我们提出了一个基于Stackelberg博弈的框架, 其中MEC服务器和一个聚合平台(aggregation platform, AP)充当跟随者和领导者. 我们将多重资源分配和定价问题分解为一组子问题, 其中每个子问题只考虑一种资源类型. 首先, 通过MEC服务器宣布的单价, AP通过解决一个凸优化问题来计算MD从MEC服务器购买的资源数量. 然后, MEC服务器计算其交易记录, 并根据多智能体近端策略优化(multi-agent proximal policy optimization, MAPPO)算法迭代调整其定价策略. 仿真结果表明, MAPPO在收益和福利方面优于许多先进的深度强化学习算法.