摘要:基于深度学习的人群密度检测算法取得了巨大进步, 但该算法在实际复杂场景中的检测准确性和鲁棒性还有很大的提升空间. 复杂场景下目标尺度不一致和背景信息干扰等因素使得人群密度检测成为一项具有挑战性的任务. 针对该问题, 提出了一种基于多尺度特征融合的人群密度检测网络. 该网络首先利用不同分辨率图像并行交互提取人群粗细粒度特征, 并引入多层次特征融合机制, 以充分利用多层尺度信息. 其次采用空间和通道注意力机制突出人群特征权重, 聚焦感兴趣的人群, 降低背景信息干扰, 生成高质量密度图. 实验结果表明, 在多个典型的公共数据集上与具有代表性的人群密度检测方法相比, 多尺度特征融合的人群密度检测网络具有良好的准确性和鲁棒性.