融合多特征的骨签释文实体识别
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家社科基金冷门绝学研究专项(20VJXT001)


Entity Recognition for Interpretation of Bone-sign Integrated with Multiple Features
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    构建适用于汉长安城骨签释文的命名实体识别模型, 用来解决由于汉长安城骨签释文关键内容缺失, 而导致无法对部分骨签释文进行分类的问题. 本文将汉长安城骨签释文原始文本作为数据集, 采用BIOE (begin, inside, outside, end)标注方法对释文实体进行数据标注, 并提出融合字结构特征、字词结构特征的多特征融合网络模型(multi-feature fusion network, MFFN). 该模型不仅考虑了单个字符的结构特征, 还融合了字与词的结构特征, 以增强模型对骨签释文的理解能力. 实验结果表明, MFFN模型能够更好地识别汉长安城骨签释文的命名实体, 实现骨签释文分类, 优于现有NER模型, 为历史学家和研究人员提供更加丰富和准确的数据支持.

    Abstract:

    This study constructs a named entity recognition (NER) model suitable for the bone-sign interpretations of Han Chang’an City to solve the problem of the inability to classify some bone-sign interpretations due to the lack of key content. The original text of the bone-sign interpretations of Han Chang’an City is used as the dataset, and the begin, inside, outside, end (BIOE) annotation method is utilized to annotate the bone-sign interpretation entities. A multi-feature fusion network (MFFN) model is proposed, which not only considers the structural features of individual characters but also integrates the structural features of character-word combinations to enhance the model’s comprehension of the bone-sign interpretations. The experimental results demonstrate that the MFFN model can better identify the named entities of the bone-sign interpretations of Han Chang’an City and classify the bone-sign interpretations, outperforming existing NER models. This model provides historians and researchers with richer and more precise data support.

    参考文献
    相似文献
    引证文献
引用本文

石雨梦,王慧琴,王展,刘瑞,王可.融合多特征的骨签释文实体识别.计算机系统应用,2024,33(9):38-47

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-03-05
  • 最后修改日期:2024-04-03
  • 录用日期:
  • 在线发布日期: 2024-07-26
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号