双金字塔式编码的人像语义感知自动抠图网络
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金 (62167006); 国家社会科学基金重点(20AXW009); 江西省科技创新基地计划(2024SSY03131); 江西省主要学科学术和技术带头人培养计划-领军人才项目(20213BCJL22047); 江西省自然科学基金(20212BAB202017)


Dual-pyramid Encoded Portrait Semantic-aware Automatic Matting Network
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    人像抠图是图像处理领域重要任务之一, 针对现有图像数据中人像前景尺度多样造成的人像抠取粗糙问题, 提出一种双金字塔式编码的人像语义感知自动抠图网络. 双金字塔式编码器包含输入金字塔和特征金字塔, 输入金字塔中输入图像等比例下采样后送入网络以保留原始图像细节, 特征金字塔结合带状卷积组和5个层级的编码块充分捕获不同层次的图像特征. 同时, 在双分支解码结构中, 全局分割解码分支上设计了视域扩张模块扩大网络感受范围, 进一步增强全局上下文信息的捕获; 局部细节分支上提出细节感知模块融合编码特征与解码输出, 引导网络关注人像轮廓. 在3个数据集上与6种人像自动抠图方法进行了对比实验, 所提方法的抠图性能均优于对比方法. 验证了所提方法能改善人像抠取的精细度, 提高了复杂图像数据下人像抠取的鲁棒性.

    Abstract:

    Portrait matting is a significant task in the field of image processing. To address the issue of rough portrait extraction caused by the diverse scales of human figures in existing image data, this study proposes a dual-pyramid encoded portrait semantic-aware automatic matting network. The dual-pyramid encoder consists of an input pyramid and a feature pyramid. In the input pyramid, the input image is proportionally downsampled and fed into the network to preserve the original image details. The feature pyramid combines banded convolution groups and five levels of encoding blocks to fully capture image features at different levels. Meanwhile, in the dual-branch decoder structure, a field expansion module is designed in the global segmentation decoding branch to expand the network’s receptive field, further enhancing its ability to capture global contextual information. In the local detail branch, a detail-aware module is proposed to fuse encoded features with decoder output, guiding the network to focus on portrait contours. A comparative analysis is conducted to evaluate the performance of six automatic portrait matting methods on three datasets. The results demonstrate that the proposed method exhibits superior matting performance compared to the other methods. This validates the effectiveness of the proposed method in enhancing the precision and robustness of portrait extraction in complex image data.

    参考文献
    相似文献
    引证文献
引用本文

程艳,严志航.双金字塔式编码的人像语义感知自动抠图网络.计算机系统应用,,():1-11

复制
相关视频

分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-09-09
  • 最后修改日期:2024-09-30
  • 录用日期:
  • 在线发布日期: 2025-05-29
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号