融合实体头尾关键特征的命名实体识别
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Named Entity Recognition with Integrated Key Feature of Entity Start and End
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对传统基于阅读理解框架的命名实体识别 (NER)方法存在的单条样本实体数量稀释以及在预测实体头尾时缺乏对实体完整位置信息的利用这两方面问题, 本文基于阅读理解框架提出一种融合实体头尾关键特征的医学文本命名实体识别模型 (integrate key feature of entity start and end position, IKFSE). 首先, 设计一种实体头尾关键特征提取模块, 提取出针对医学实体起始位置和结束位置的关键特征, 减少冗余信息对模型的影响; 其次, 设计一种实体头尾特征交叉融合模块, 在对实体起始位置和结束位置进行预测时分别引入二者对彼此的影响, 从而引入实体完整的位置信息, 提高模型的语义表征能力. 在cEHRNER和CCKS2017两个公开数据集上将IKFSE与多个主流序列标注模型和阅读理解模型相比, 结果表明本文所提方法在中文医学NER任务中有着更好的性能.

    Abstract:

    To address the challenges of entity dilution in single samples and the underutilization of complete entity location information in traditional named entity recognition (NER) methods based on reading comprehension frameworks, this study proposes a medical named entity recognition model that integrates key features of entity start and end positions (IKFSE). First, a key feature extraction module is designed to capture important features of the start and end positions of medical entities, thus reducing the impact of redundant information on the model. Second, an entity head-tail feature fusion module is introduced, which incorporates the mutual influence between the start and end positions during entity prediction. This integration enhances the model’s ability to represent semantics by utilizing full positional information. Experimental results on two public datasets, cEHRNER and CCKS2017, demonstrate that the proposed method outperforms several mainstream sequence labeling models and reading comprehension models in Chinese medical NER tasks.

    参考文献
    相似文献
    引证文献
引用本文

雷海卫,宋朝帅.融合实体头尾关键特征的命名实体识别.计算机系统应用,,():1-9

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-11-06
  • 最后修改日期:2024-12-09
  • 录用日期:
  • 在线发布日期: 2025-04-28
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号