摘要:电商数据所属类别对于分析电商数据有重要意义, 基于人力的分类无法适应如今海量的电商数据, 基于传统算法模型的分类难以提取有价值的人工特征. 本文采用BiLSTM模型并且引入注意力机制, 将其应用于电商数据分类中. 该模型包括Embedding层、BiLSTM层、注意力机制层和输出层. Embedding层加载Word2Vec开源工具训练得到的词向量, BiLSTM层捕捉每个词语的上下文信息, 注意力机制层为每个词语分配权重, 合成新的样本特征. 实验表明, 基于逆类别率的注意力机制在电商数据的分类准确率达到91.93%, 与不加注意力机制的BiLSTM模型和其他引入的注意力机制相比, 均有不同程度的提高. 此模型电商数据分类中有良好的效果, 为注意力机制的引入提供了新的思考方向.