面向配电网数据的命名实体识别
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

辽宁省“兴辽英才计划” (XLYC2019019)


Named Entity Recognition for Power Distribution Network Data
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    在电力系统中, 配电调度是一个复杂且统筹性较强的工作, 大多依赖于工作人员的经验和主观判断, 极易出现纰漏. 所以急需利用智能化手段来帮助检修计划的分析与生成. 命名实体识别是构建配电网知识图谱以及问答系统等任务的关键技术, 它能够将非结构化数据中的命名实体识别出来. 针对配电检修数据的复杂性及强关联性等特点, 本文采用BERT-IDCNN-BiLSTM-CRF深度学习模型. 该模型相较于传统的BERT-BiLSTM-CRF模型, 融入IDCNN神经网络模型, 更好地利用GPU的性能, 在保证识别准确率的前提下, 提高效率. 通过对标注好的检修计划数据进行训练, 并与其他常用模型对比, 在召回率、精确率以及F1值3个指标上, 本文提出的模型均达到最优的效果, F1值可以达到83.1%, 该模型在配电网数据识别任务上取得了很好的效果.

    Abstract:

    In the power system, distribution scheduling is complex and well-coordinated, which mostly depends on the experience and subjective judgment of staff and is prone to mistakes. Therefore, it is urgent to use intelligent means to help analyze and generate maintenance plans. Named entity recognition is a key technology in the construction of the knowledge graph of power distribution networks and the question answering system, which can recognize named entities in unstructured data. In view of the complexity and strong correlation of distribution maintenance data, this study adopts the deep learning model BERT-IDCNN-BiLSM-CRF. Compared with the traditional model BERT-BiLSTM-CRF, this model integrates the neural network model IDCNN, makes better use of the performance of GPU, and improves the efficiency on the premise of ensuring recognition accuracy. The labeled maintenance plan data are trained, and the proposed model is compared with other commonly used models. The results reveal that the proposed model achieves the best effect in terms of the recall rate, accuracy rate, and F1 value, and its F1 value can reach 83.1%. The model has achieved good results in the recognition of distribution network data.

    参考文献
    相似文献
    引证文献
引用本文

孙宏云,李喜旺.面向配电网数据的命名实体识别.计算机系统应用,2023,32(2):387-393

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-07-12
  • 最后修改日期:2022-08-15
  • 录用日期:
  • 在线发布日期: 2022-12-16
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号