结合Roberta和Bi-FLASH-SRU的中文事件因果关系抽取
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金(6203366); 全军军事类研究生资助课题(JY2022C251)


Combining Roberta and Bi-FLASH-SRU for Chinese Event Causality Extraction
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对现有基于填表的事件关系抽取方法填表数目过多、表格特征获取不充分的问题, 本文提出了结合Roberta和Bi-FLASH-SRU的中文事件因果关系抽取方法TF-ChineseERE. 该方法通过制定填表策略, 利用文本中已标记关系, 将其转化为带有标签的表格; 借助Roberta预训练模型和本文提出的双向内置闪电注意力简单循环单元(bidirectional built-in flash attention simple recurrent unit, Bi-FLASH-SRU)获取主客体事件特征, 再利用表格特征循环学习模块挖掘全局特征, 最后进行表格解码获得事件因果关系三元组. 实验采用金融领域两个公开数据集进行验证, 结果表明, 本文提出的方法F1值分别达到59.2%和62.5%, 且Bi-FLASH-SRU模型训练速度更快, 填表数目更少, 证明了该方法的有效性.

    Abstract:

    Aiming at the problems of too many forms and insufficient acquisition of form features in the existing form-based event relationship extraction methods, this study proposes TF-ChineseERE, a Chinese event causality extraction method that combines Roberta and Bi-FLASH-SRU. The method transforms the text into labeled forms by formulating a form-filling strategy that takes advantage of the labeled relationships in the text. The study proposes the Roberta pre-training model and the bidirectional built-in flash attention simple recurrent unit (Bi-FLASH-SRU) to obtain the subject-object event features. It then uses the table feature recurrent learning module to mine the global features and finally performs table decoding to obtain event causality triples. The experiments are validated with two public datasets in the financial domain. The results show that the F1 values of the proposed method reach 59.2% and 62.5%, respectively, with a faster training speed of the Bi-FLASH-SRU model and less number of filled forms, which proves the effectiveness of the method.

    参考文献
    相似文献
    引证文献
引用本文

陈泉林,贾珺,樊硕.结合Roberta和Bi-FLASH-SRU的中文事件因果关系抽取.计算机系统应用,2024,33(6):259-267

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-01-05
  • 最后修改日期:2024-02-04
  • 录用日期:
  • 在线发布日期: 2024-04-30
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号