融合BERT与图卷积网络的软件需求自动分类
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

辽宁省2021年度教育科学研究经费项目(LJKZ0434)


Integration of BERT and GCN for Automatic Software Requirement Classification
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    考虑到软件需求文本区别于其他普通文本的独特领域信息外, 还包含一些重要的上下文关系以及固有的二义性问题, 本文提出了一个图卷积与BERT融合的软件需求自动分类模型——BERT-FGCN (BERT-FusionGCN), 将图卷积网络(GCN)用于软件需求分类领域, 利用GCN对邻居节点信息进行信息传播和特征聚合的优势, 捕捉需求语句中单词或句子之间的上下文关系, 以进一步提高需求分类的结果. 首先构建需求文本的文本共现图和依存句法图, 将两种图进行融合来捕获句子的结构信息, 利用GCN对建模后的需求语句的图结构进行卷积得到图向量, 最后将图向量与BERT特征提取后得到的向量进行融合, 以此来对软件需求文本自动分类. 在PROMISE数据集上进行实验, BERT-FGCN在二分类上的F1分数达到95%, 多分类任务的F1分数提高2%.

    Abstract:

    Considering the unique domain-specific information inherent in software requirement texts, as well as the important contextual relationships and inherent ambiguities they contain, this study proposes a model that integrates graph convolutional network (GCN) with BERT for automatic software requirements classification, named BERT-FGCN (BERT-FusionGCN). This model leverages the advantages of GCN in propagating information and aggregating features from neighboring nodes to capture the contextual relationships between words or sentences in requirement statements, thereby improving the classification results. Initially, a text co-occurrence graph and a dependency syntax graph of requirement texts are constructed. These graphs are then fused to capture the structural information of the sentences. The GCN is then employed to perform convolution on the graph structure of the modeled requirement statements to obtain graph vectors. Finally, these graph vectors are fused with the vectors obtained from BERT feature extraction to achieve automatic classification of software requirement texts. Experiments conducted on the PROMISE dataset demonstrate that BERT-FGCN achieves an F1-score of 95% in binary classification, and increases the F1-score by 2% in multi-class classification tasks.

    参考文献
    相似文献
    引证文献
引用本文

关慧,高琦,韩志远.融合BERT与图卷积网络的软件需求自动分类.计算机系统应用,,():1-8

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-06-05
  • 最后修改日期:2024-07-10
  • 录用日期:
  • 在线发布日期: 2024-11-28
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号