摘要:篇章要素识别(discourse element identification)的主要任务是识别篇章要素单元并进行分类. 针对篇章要素识别对上下文依赖性理解不足的问题, 提出一种基于BiLSTM-Attention的识别篇章要素模型, 提高议论文篇章要素识别的准确率. 该模型利用句子结构和位置编码来识别句子的成分关系, 通过双向长短期记忆网络(bidirectional long short-term memory, BiLSTM)进一步获得深层次上下文相关联的信息; 引入注意力机制(attention mechanism)优化模型特征向量, 提高文本分类的准确度; 最终用句间多头自注意力(multi-head self-attention)获取句子在内容和结构上的关系, 弥补距离较远的句子依赖问题. 相比于HBiLSTM、BERT等基线模型, 在相同参数、相同实验条件下, 在中文数据集和英文数据集上准确率分别提升1.3%、3.6%, 验证了该模型在篇章要素识别任务中的有效性.