基于卷积神经网络的短文本情感分类
作者:
基金项目:

浙江省基础公益研究计划(LGN20E050006); 中国博士后科学基金


Short Text Sentiment Classification Based on Convolutional Neural Network
Author:
  • 摘要
  • | |
  • 访问统计
  • |
  • 参考文献 [20]
  • |
  • 相似文献 [20]
  • | | |
  • 文章评论
    摘要:

    近年来, 卷积神经网络模型常常被用于文本情感分类的研究中, 但多数研究都会忽略文本特征词本身所携带的情感信息和中文文本分词时被错分的情况. 针对此问题, 提出一种融合情感特征的双通道卷积神经网络情感分类模型(Dual-channel Convolutional Neural Network sentiment classification model fused with Sentiment Feature, SFD-CNN). 该模型在构造输入时以一条通道构造融合情感特征的语义向量矩阵以获取到更多的情感类型信息, 以另一条通道构造文本字向量矩阵以降低分词错误的影响. 实验结果表明, SFD-CNN模型准确率高达92.94%, 要优于未改进的模型.

    Abstract:

    In recent years, the convolutional neural network model is often used in the research of text emotion classification. However, most of researches ignore the emotional information carried by the text feature words themselves and the wrong segmentation of Chinese text. Aiming at this problem, a Dual-channel Convolutional Neural Network sentiment classification model fused with Sentiment Feature (SFD-CNN) is proposed. In the model, one channel is used to construct the semantic vector matrix of emotional features to get more emotional type information, and another channel is used to construct the text word vector matrix to reduce the impact of segmentation errors. The experimental results show that the accuracy of SFD-CNN model is as high as 92.94%, which is better than that of the unmodified model.

    参考文献
    [1] 马力, 宫玉龙. 文本情感分析研究综述. 电子科技, 2014, 27(11): 180–184. [doi: 10.3969/j.issn.1007-7820.2014.11.052
    [2] 首欢容, 邓淑卿, 徐健. 基于情感分析的网络谣言识别方法. 数据分析与知识发现, 2017, (7): 44–51
    [3] 王根生, 黄学坚, 闵潞. 多元特征融合的GRU神经网络文本情感分类模型. 小型微型计算机系统, 2019, 40(10): 2130–2138. [doi: 10.3969/j.issn.1000-1220.2019.10.020
    [4] 申昌, 冀俊忠. 基于双通道卷积神经网络的文本情感分类算法. 模式识别与人工智能, 2018, 31(2): 158–166
    [5] 黄贤英, 刘广峰, 刘小洋, 等. 基于word2vec和双向LSTM的情感分类深度模型. 计算机应用研究, 2019, 36(12): 3583–3587, 3596
    [6] 金宸, 李维华, 姬晨, 等. 基于双向LSTM神经网络模型的中文分词. 中文信息学报, 2018, 32(2): 29–37. [doi: 10.3969/j.issn.1003-0077.2018.02.004
    [7] 熊德意, 李军辉, 王星, 等. 基于约束的神经机器翻译. 中国科学: 信息科学, 2018, 48(5): 574–588
    [8] Kim Y. Convolutional neural networks for sentence classification. Proceedings of 2014 Conference on Empirical Methods in Natural Language Processing. Doha, Qatar. 2014. 1746–1751.
    [9] Kalchbrenner N, Grefenstette E, Blunsom P. A convolutional neural network for modelling sentences. Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics. Baltimore, MD, USA. 2014. 655–665.
    [10] 王盛玉, 曾碧卿, 商齐, 等. 基于词注意力卷积神经网络模型的情感分析研究. 中文信息学报, 2018, 32(9): 123–131. [doi: 10.3969/j.issn.1003-0077.2018.09.017
    [11] 杨艳, 徐冰, 杨沐昀, 等. 一种基于联合深度学习模型的情感分类方法. 山东大学学报(理学版), 2017, 52(9): 19–25
    [12] Zhao X, Zhao JB, LeCun Y. Character-level convolutional networks for text classification. Proceedings of the 28th International Conference on Neural Information Processing Systems. Montreal, QC, Canada. 2015. 649–657.
    [13] 骆梅柳. 文本表示模型在文本挖掘中的应用. 现代信息科技, 2019, 3(7): 24–25. [doi: 10.3969/j.issn.2096-4706.2019.07.009
    [14] Hu BT, Tang BZ, Chen QC, et al. A novel word embedding learning model using the dissociation between nouns and verbs. Neurocomputing, 2016, 171: 1108–1117. [doi: 10.1016/j.neucom.2015.07.046
    [15] Mikolov T, Chen K, Corrado G, et al. Efficient estimation of word representations in vector space. arXiv: 1301.3781, 2013.
    [16] 吴佳昌, 吴观茂. 基于依存关系和双通道卷积神经网络关系抽取方法. 计算机应用与软件, 2019, 36(4): 241–246, 267. [doi: 10.3969/j.issn.1000-386x.2019.04.038
    [17] 涂海丽, 唐晓波. 基于在线评论的游客情感分析模型构建. 现代情报, 2016, 36(4): 70–77. [doi: 10.3969/j.issn.1008-0821.2016.04.013
    [18] 邸鹏, 李爱萍, 段利国. 基于转折句式的文本情感倾向性分析. 计算机工程与设计, 2014, 35(12): 4289–4295. [doi: 10.3969/j.issn.1000-7024.2014.12.045
    [19] 李平, 戴月明, 吴定会. 双通道卷积神经网络在文本情感分析中的应用. 计算机应用, 2018, 38(6): 1542–1546
    [20] Socher R, Chen DQ, Manning CD, et al. Reasoning with neural tensor networks for knowledge base completion. Proceedings of the 26th International Conference on Neural Information Processing Systems. Lake Tahoe, CA, USA. 2013. 926–934.
    引证文献
    网友评论
    网友评论
    分享到微博
    发 布
引用本文

代丽,樊粤湘,陈思.基于卷积神经网络的短文本情感分类.计算机系统应用,2021,30(1):214-220

复制
分享
文章指标
  • 点击次数:1209
  • 下载次数: 2382
  • HTML阅读次数: 1657
  • 引用次数: 0
历史
  • 收稿日期:2020-05-18
  • 最后修改日期:2020-06-16
  • 在线发布日期: 2020-12-31
文章二维码
您是第11419087位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号