摘要:近年来, 深度学习显著推动了文本分类算法的发展, 但传统文本分类算法在长距离依赖建模和捕获细粒度语义特征方面依然面临挑战. 胶囊网络(capsule network)通过动态路由机制有效建模特征层次关系, 为解决这一问题提供了新的思路. 然而, 基于胶囊网络的文本分类方法存在以下几个问题: (1) 动态路由计算复杂, 难以处理长文本; (2) 对局部语义特征和全局上下文信息的协同利用不足; (3) 路由过程的不稳定性导致训练困难. 为了解决这些问题, 本文提出了一种混合注意力动态稀疏路由胶囊网络(HADSR-Caps)模型. 该模型首先采用混合注意力机制, 融合局部窗口注意力和全局注意力, 捕获多尺度语义特征; 然后设计了动态稀疏路由算法, 引入K-Sparse剪枝和自适应路由终止策略, 有效降低计算量并提升模型鲁棒性. 通过在多个公开数据集上的实验, 结果表明, HADSR-Caps在分类准确率和鲁棒性方面相较于传统胶囊网络及其他基准模型, 均表现出显著的提升.