改进DPCNN分类模型在金融领域长文本的应用
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

四川省科技厅重点研发项目(2022YFG0375,2023YFG0099,2023YFG0261,23ZDYF0473,23ZDYF0181);南充生物医药产业技术研究院项目(22YYJCYJ0086);四川省科技服务业示范项目(2021GFW130)


Improved DPCNN Classification Model for Long Texts in Finance
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    为了解决金融领域文本分类算法稀缺, 以及现有算法无法充分提取文本中词与词的关系、长距离依赖关系和深层次特征信息的问题, 提出了一种改进卷积自注意力模型的文本深度关系抽取算法. 该算法在改进的深度金字塔卷积神经网络(DPCNN)中引入自注意力, 并联合双向门控神经网络(BiGRU)模块建立文本分类模型, 解决了针对金融领域长文本的长距离依赖特征信息和词与词之间关系特征信息的提取问题, 实现文本中深层次特征信息和上下文语义信息联合抽取功能. 在THUCNews短文本与长文本数据集上分别进行实验, 实验结果表明, 所提方法与BERT等方法相比, 在评价指标上有显著提高. 在自制金融长文本数据集上的对比实验表明, 与其他模型相比, 该算法模型的准确率和F1值更高. 通过一系列实验可以证明, 该算法模型能够更准确地完成针对金融长文本的分类任务.

    Abstract:

    To solve the scarcity of text classification algorithms in finance and the inability of existing algorithms to adequately extract word-to-word relations, long-distance dependency, and deep feature information in texts, this study proposes a text depth relationship extraction algorithm based on improved convolutional self-attention model. The algorithm introduces self-attention in a modified deep pyramidal convolutional neural network (DPCNN) and builds a text classification model jointly with bi-directional gated neural network (BiGRU) module to solve the problem of extracting long-distance dependency feature information and word-to-word relationship feature information for long texts in finance. Then the joint extraction function of deep feature information and contextual semantic information in texts is realized. Experiments on THUCNews short text and long text datasets show that the proposed method has significant improvement in evaluation indexes compared with BERT and other methods. The comparison experiments on the dataset of homemade financial long texts show that the accuracy and F1 value of the algorithm model are higher compared with other models. A series of experiments demonstrate that the algorithmic model can perform the classification task against financial long texts more accurately.

    参考文献
    相似文献
    引证文献
引用本文

王婷,梁佳莹,杨川,何松泽,向东,马洪江.改进DPCNN分类模型在金融领域长文本的应用.计算机系统应用,2023,32(12):74-83

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-05-24
  • 最后修改日期:2023-06-28
  • 录用日期:
  • 在线发布日期: 2023-10-19
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号