摘要:陕西省西安市汉长安城遗址出土的骨签为西汉历史的研究工作提供了丰富资料, 受长期埋藏和人为开采影响, 大量骨签存在断裂现象, 造成语义信息缺失, 影响骨签分类归置效率. 为提高骨签分类归置效率, 本文提出了一种面向语义缺失的EWRCA骨签释文分类模型. 该模型利用ERNIE的8层编码器捕获文本的深层语义信息, 学习断裂和不完整的骨签释文信息; 通过融合ERNIE多层编码器的输出与Word2Vec生成的词向量, 提高对骨签释文独有词汇的理解能力; 将文本向量融合模块与TextRCNN-MHAtt模型结合, 有效捕获文本的上下文依赖, 增强文本的语义表示能力, 提升分类准确性; 引入融合注意力机制提高模型在处理骨签释文时的准确性. 实验结果表明, 该模型对汉长安城骨签释文的分类精度和准确率达到95.62%、95.2%, 能够有效提高骨签释文的分类精度.