基于改进StyleGAN乡村道路图像数据增强方法
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Data Augmentation Method of Rural Road Images Based on Improved StyleGAN
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对现有乡村道路图像数据集数据样本少且类别不均衡的问题, 提出了一种基于改进StyleGAN的数据增强方法. 在原有StyleGAN框架基础上引入了解耦映射网络, 以降低W空间隐编码的耦合度; 综合卷积与Transformer的优点, 设计了一个卷积耦合迁移模块(CCTB), 该模块中的核心十字形窗口自注意力机制增强了网络对复杂上下文和空间布局的捕捉能力. 这两项改进使网络性能大幅提升. 通过消融实验对比改进前后的StyleGAN网络, IS指标从42.38提高到了77.31, FID值从25.09降至12.42, 表明了数据生成质量和真实性得到了显著提升. 为了验证数据增强对模型性能的影响, 采用了2种经典且主流的目标检测算法进行测试, 比较了原数据集与增强后数据集的性能差异, 进一步证实了改进措施的有效性.

    Abstract:

    To address the issues of limited sample size and imbalanced categories in existing rural road image datasets, a data augmentation method based on an improved StyleGAN is proposed. This approach introduces a decoupled mapping network into the original StyleGAN framework to reduce the coupling degree of the W-space latent code. By integrating the advantages of convolution and Transformer, this study designs a convolution-coupled transfer block (CCTB). The core cross-window self-attention mechanism within this module enhances the network’s ability to capture complex context and spatial layouts. These two improvements significantly boost network performance. Ablation experiments comparing the original and improved StyleGAN networks show that the IS index increases from 42.38 to 77.31, and the FID value decreases from 25.09 to 12.42, demonstrating a substantial improvement in data generation quality and authenticity. To verify the impact of data augmentation on model performance, two classic and mainstream object detection algorithms are used for testing. Performance differences between the original and augmented datasets are compared, further confirming the effectiveness of the improved methods.

    参考文献
    相似文献
    引证文献
引用本文

希仁娜,张太红,姚芷馨.基于改进StyleGAN乡村道路图像数据增强方法.计算机系统应用,,():1-10

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-10-09
  • 最后修改日期:2024-10-21
  • 录用日期:
  • 在线发布日期: 2025-03-04
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号