基于双分支卷积网络的水下目标检测
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

科技创新特区计划 (20-163-14-LZ-001-004-01)


Underwater Target Detection Based on Dual-branch Convolutional Network
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    水下目标检测是水下作业中不可或缺的重要技术. 针对水下图像中背景复杂、待检测目标大小形状不同及存在重叠与遮挡等问题, 本文提出了一种基于双分支卷积网络的水下目标检测算法. 首先, 采用两个并行卷积神经网络作为骨干网络, 其中一个分支引入ECA注意力机制, 另一个分支采用可形变卷积, 以提高模型的特征提取能力. 其次, 使用AFF模块有效融合两个分支提取到的特征. 最后, 采用PANet金字塔结构作为颈部网络, 实现多尺度特征融合, 同时增加高分辨率检测头, 以进一步提高对小目标的敏感性. 本文在公开水下数据集RUOD上进行对比实验, 结果表明, 本文的改进算法在RUOD数据集上的mAP50达到了86.8%, 相较于基准YOLOv8n模型提升了2.7%, 并且相比于同规模的其他常见目标检测模型表现更优.

    Abstract:

    Underwater target detection is an essential technology in underwater operations. To address the challenges posed by complex backgrounds, varying target scales, and the presence of overlapping and occluded objects in underwater images, this study proposes an underwater target detection algorithm based on a dual-branch convolutional network. First, this study employs two parallel convolutional neural networks as the backbone, with one branch integrating the ECA attention mechanism and the other utilizing deformable convolutions to enhance the model’s feature extraction capability. Next, it utilizes the AFF module to effectively fuse the features extracted from both branches. Finally, the study adopts the PANet pyramid structure as the neck network to achieve multi-scale feature fusion while incorporating a high-resolution detection head to further improve sensitivity to small targets. Comparative experiments conducted on the publicly available underwater dataset RUOD show that the improved algorithm achieves an mAP50 of 86.8% on the RUOD dataset, which is an enhancement of 2.7% over the baseline YOLOv8n model. Moreover, this model outperforms other common target detection models of similar scale.

    参考文献
    相似文献
    引证文献
引用本文

王信诚,朱明.基于双分支卷积网络的水下目标检测.计算机系统应用,,():1-8

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-11-01
  • 最后修改日期:2024-12-03
  • 录用日期:
  • 在线发布日期: 2025-04-28
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号