基于关键词生成的网格事件相似度并行计算
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

2021年安徽省重点研究与开发计划(202104a05020071); 2021年安徽省科技创新战略与软科学研究(202106f01050056)


Parallel Calculation of Grid Event Similarity Based on Keyword Generation
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    为实现在海量网格事件库中快速、准确地检索事件, 本文提出一种基于关键词生成的网格事件相似度并行计算方法. 该方法通过双向LSTM网络的编码器和单向LSTM网络的解码器构建指针生成网络生成事件关键词, 使用记忆网络作为指针生成网络的序列信息存储单元, 并将注意力机制用在输入序列上以将更重要的信息输入至解码器, 同时引入覆盖机制来解决生成重复文本问题. 在生成事件关键词后, 基于结构相似度和情境相似度计算事件总体相似度, 并利用GPU对LSTM网络和相似度计算进行加速. 实验结果表明: 相比基于机器学习的计算方法, 该方法在事件相似度计算性能上更好, 最高获得了4.04倍的加速比.

    Abstract:

    For quick and accurate retrieval in massive grid events, this study proposes the parallel similarity calculation of grid events based on keyword generation. The method generates grid event keywords through the pointer-generator network based on the encoder of a bidirectional LSTM network and the decoder of a unidirectional LSTM network. It uses a memory network to store sequence information and applies the attention mechanism to the input sequence, enabling more important information into the decoder. It also introduces the overwriting mechanism to avoid duplicate texts. After the keywords are generated, the overall similarity is calculated based on the structural similarity and situational similarity of events. GPU is utilized to accelerate the LSTM network and similarity calculation. Experimental results show that the method has better performance in similarity calculation than methods based on machine learning, with a speedup ratio reaching 4.04 times.

    参考文献
    相似文献
    引证文献
引用本文

陈钢,陈健鹏,佘祥荣,秦加奇,陈剑.基于关键词生成的网格事件相似度并行计算.计算机系统应用,2022,31(6):48-55

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2021-09-07
  • 最后修改日期:2021-10-11
  • 录用日期:
  • 在线发布日期: 2022-05-26
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号