显式融合词法和句法特征的抽取式机器阅读理解模型

doi:10.15888/j.cnki.csa.008717

AIPUB归智期刊联盟

微信公众号

网站二维码

2025年4月24日 6:24 星期四

首页 > 过刊浏览>2022年第31卷第9期 >352-359. DOI:10.15888/j.cnki.csa.008717

PDF HTML阅读 XML下载导出引用引用提醒

显式融合词法和句法特征的抽取式机器阅读理解模型
DOI:
                        10.15888/j.cnki.csa.008717
                    
CSTR:
                        
                    
作者:
                        闫维宏闫维宏
人民网 传播内容认知国家重点实验室, 北京 100733;哈尔滨工业大学 计算学部, 哈尔滨 150006
在期刊界中查找
在百度中查找
在本站中查找
李少博李少博
哈尔滨工业大学 计算学部, 哈尔滨 150006
在期刊界中查找
在百度中查找
在本站中查找
单丽莉单丽莉
哈尔滨工业大学 计算学部, 哈尔滨 150006
在期刊界中查找
在百度中查找
在本站中查找
孙承杰孙承杰
哈尔滨工业大学 计算学部, 哈尔滨 150006
在期刊界中查找
在百度中查找
在本站中查找
刘秉权刘秉权
哈尔滨工业大学 计算学部, 哈尔滨 150006
在期刊界中查找
在百度中查找
在本站中查找

                    
作者单位:
作者简介:
通讯作者:
中图分类号:
基金项目:国家自然科学基金(62176074)

Extractive Machine Reading Comprehension Model with Explicitly Fused Lexical and Syntactic Features

Author:

YAN Wei-Hong
YAN Wei-Hong
State Key Laboratory of Communication Content Cognition, People’s Daily Online, Beijing 100733, China;Faculty of Computing, Harbin Institute of Technology, Harbin 150006, China
在期刊界中查找
在百度中查找
在本站中查找
LI Shao-Bo
LI Shao-Bo
Faculty of Computing, Harbin Institute of Technology, Harbin 150006, China
在期刊界中查找
在百度中查找
在本站中查找
SHAN Li-Li
SHAN Li-Li
Faculty of Computing, Harbin Institute of Technology, Harbin 150006, China
在期刊界中查找
在百度中查找
在本站中查找
SUN Cheng-Jie
SUN Cheng-Jie
Faculty of Computing, Harbin Institute of Technology, Harbin 150006, China
在期刊界中查找
在百度中查找
在本站中查找
LIU Bing-Quan
LIU Bing-Quan
Faculty of Computing, Harbin Institute of Technology, Harbin 150006, China
在期刊界中查找
在百度中查找
在本站中查找

Affiliation:

Fund Project:

摘要

图/表

访问统计

参考文献

相似文献

引证文献

资源附件

文章评论

摘要:

预训练语言模型虽然能够为每个词提供优良的上下文表示特征, 但却无法显式地给出词法和句法特征, 而这些特征往往是理解整体语义的基础. 鉴于此, 本文通过显式地引入词法和句法特征, 探究其对于预训练模型阅读理解能力的影响. 首先, 本文选用了词性标注和命名实体识别来提供词法特征, 使用依存分析来提供句法特征, 将二者与预训练模型输出的上下文表示相融合. 随后, 我们设计了基于注意力机制的自适应特征融合方法来融合不同类型特征. 在抽取式机器阅读理解数据集CMRC2018上的实验表明, 本文方法以极低的算力成本, 利用显式引入的词法和句法等语言特征帮助模型在F1和EM指标上分别取得0.37%和1.56%的提升.

关键词:机器阅读理解;词法特征;句法特征;深度学习;预训练模型;特征融合;注意力机制

Abstract:

Language models obtained by pre-training unstructured text alone can provide excellent contextual representation features for each word, but cannot explicitly provide lexical and syntactic features, which are often the basis for understanding overall semantics. In this study, we investigate the impact of lexical and syntactic features on the reading comprehension ability of pre-trained models by introducing them explicitly. First, we utilize part of speech tagging and named entity recognition to provide lexical features and dependency parsing to provide syntactic features. These features are integrated with the contextual representation from the pre-trained model output. Then, we design an adaptive feature fusion method based on the attention mechanism to fuse different types of features. Experiments on the extractive machine reading comprehension dataset CMRC2018 show that our approach helps the model achieve 0.37% and 1.56% improvement in F1 and EM scores, respectively, by using explicitly introduced lexical and syntactic features at a very low computational cost.

Key words:machine reading comprehension;lexical features;syntactic features;deep learning;pre-trained models;feature fusion;attention mechanism

引用本文

闫维宏,李少博,单丽莉,孙承杰,刘秉权.显式融合词法和句法特征的抽取式机器阅读理解模型.计算机系统应用,2022,31(9):352-359

复制

文章指标

点击次数:
下载次数:
HTML阅读次数:
引用次数:

历史

收稿日期:2021-12-23
最后修改日期:2022-01-24
录用日期:
在线发布日期: 2022-06-16
出版日期:

微信公众号

网站二维码

引用本文

分享

文章指标

历史

文章二维码

微信公众号

网站二维码

引用本文

分享

微信扫一扫：分享

文章指标

历史

文章二维码