融合内容引导与多尺度注意力的摘要生成模型
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Summary Generation Model Integrating Content-guided and Multi-scale Attention
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    长文本中的信息压缩和语义连贯性一直是摘要生成模型的难点. 为此本文提出了一种融合内容引导与多尺度注意力的摘要生成模型. 该模型通过双分支结构实现对多粒度语义的联合建模, 并利用内容引导机制聚焦于摘要相关的关键信息区域. 模型在传统BERT-Transformer架构基础上引入双分支结构增强语义表达能力, 并通过MSAA-SAM融合机制设计, 进一步实现跨分支信息对齐与表达统一. 同时, 本文对指针生成网络进行了改进, 结合全局句向量引导机制提升生成控制能力, 从而增强对长文本中关键信息的提取与冗余内容的抑制. 在NLPCC 2017数据集和LCSTS数据集上的实验结果表明, 该模型在生成式摘要任务上均优于主流基线模型, 验证了其在语义建模、生成质量与控制能力方面的综合优势.

    Abstract:

    Information compression and semantic coherence in long texts are persistent challenges in summary generation models. To address this issue, this study proposes a summary generation model integrating content-guided and multi-scale attention. The model adopts a dual-branch architecture to jointly model multi-granularity semantics and utilizes a content-guided mechanism to focus on key information relevant to the summary. Based on the conventional BERT-Transformer framework, a dual-branch structure is introduced to enhance semantic representation, and a cross-branch fusion mechanism (MSAA-SAM) is designed to achieve semantic alignment and unified representation. In addition, the pointer-generator network is improved by incorporating a global sentence vector guidance mechanism to enhance generation control, thereby improving key information extraction and reducing redundancy in long-text summarization. Experimental results on the NLPCC 2017 and LCSTS datasets demonstrate that the proposed model outperforms mainstream baseline models in generative summarization tasks, verifying its comprehensive advantages in semantic modeling, generation quality, and control capability.

    参考文献
    相似文献
    引证文献
引用本文

岳帅,王业.融合内容引导与多尺度注意力的摘要生成模型.计算机系统应用,2026,35(1):276-287

复制
分享
相关视频

文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2025-05-26
  • 最后修改日期:2025-06-24
  • 录用日期:
  • 在线发布日期: 2025-10-29
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62661041 传真: Email:csa@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号