摘要:YOLOx-Darknet53是以YOLOv3为基准增加各种技巧(trick)升级改进的检测网络, 但其仍然是以Darknet53为特征提取骨干网络(backbone), 因此网络的特征提取能力仍有欠缺. 本文依据CoTNet中的注意力机制改进得到CoA (contextual attention)模块, 并将其替代YOLOx骨干网络残差块里的3×3卷积, 得到融合注意力后的新残差块, 加强了骨干网络的特征提取能力, 并在Pascal VOC2007数据集上进行对比实验, 融合CoA模块的网络比原网络的平均精度均值AP@[.5:.95]高1.4, AP@0.5高1.4; 在改进骨干网络后的YOLOx检测头前加入无参3D注意力模块, 得到最终改进的检测网络, 进行上述对比实验, 结果表明比原网络的AP@[.5:.95]高1.6, AP@0.5高1.5. 因此, 改进后的网络比原网络检测更加精准, 在工业应用中能达到更好的检测效果.