基于口罩评论数据的用户情感趋势与关注分析
作者:
基金项目:

2019大学生创新创业训练计划项目A(X201911415126)


Analysis of User Sentiment Trend and Concern Based on Mask Review Data
Author:
  • 摘要
  • | |
  • 访问统计
  • |
  • 参考文献 [12]
  • |
  • 相似文献 [20]
  • | | |
  • 文章评论
    摘要:

    为了对疫情期间口罩的用户评论数据进行情感关注分析, 本文用谷歌浏览器的插件Web Scraper爬取了2020年3月1日到4月11日中淘宝网的口罩的共计143 330条用户购买评论数据. 为了提高情感预测的精度, 在此数据集上经过人工标注情感为积极和消极的共计14 400条数据后, 用SnowNLP情感分析模型进行了训练, 最后用训练后的语料库进行了情感预测. 从整体上可见用户评论的情感是积极的. 在用户评论的每日情感变化趋势上, 本土新增病例(不含海外输入)的趋势在一定程度上影响着用户每日情感趋势的整体变化, 而国内新增病例(含海外输入)的局部波动变化趋势也影响着每日情感局部的相应波动变化趋势. 在对预测后的评论进行分类后, 发现用户的积极评论中对口罩的关注主要集中在口罩的质量、包装、价格、厚实, 而在消极的评论中对口罩的关注主要集中在质量、包装、味道和是否为医用.

    Abstract:

    In order to analyze the sentimental focus of the comment data from users of masks during the outbreak of virus, we extracted 143 330 comments about the purchase from Taobao users from March 1st to April 11th, 2020 by means of the Web Scraper of Google browser. To improve the accuracy of the sentimental estimation, each comment of the total 14 400 pieces was manually marked as positive or negative emotion on this data set. And then we used SnowNLP, the sentimental analysis model to train them. At last, the trained corpus was used for sentimental estimation. The overall sentiment of the comments was proved positive. On the basis of the daily emotional variation trend of users’ comments, the trend of local new cases (excluding overseas input) to some extent affects the overall change of their daily emotional trend. And the local fluctuation trend of domestic new cases (including overseas input) also affects that of the everyday emotional performance. After classifying the predicted comments, we found that users’ positive comments focused on the quality, packaging, price, and thickness of masks, while negative comments focused on the quality, packaging, smell, and whether the masks were for medical use.

    参考文献
    [1] 丁森华, 邵佳慧, 李春艳, 等. 文本情感分析方法对比研究. 广播电视信息, 2020, (4): 92–96
    [2] 陈晓东. 基于情感词典的中文微博情感倾向分析研究[硕士学位论文]. 武汉: 华中科技大学, 2012.
    [3] Maks I, Vossen P. A lexicon model for deep sentiment analysis and opinion mining applications. Decision Support Systems, 2012, 53(4): 680–688. [doi: 10.1016/j.dss.2012.05.025
    [4] 李慧, 柴亚青. 基于属性特征的评论文本情感极性量化分析. 数据分析与知识发现, 2017, (10): 1–11
    [5] 刘玉娇, 琚生根, 伍少梅, 等. 基于情感字典与连词结合的中文文本情感分类. 四川大学学报(自然科学版), 2015, 52(1): 57–62
    [6] 郝媛媛, 叶强, 李一军. 基于影评数据的在线评论有用性影响因素研究. 管理科学学报, 2010, 13(8): 78–88, 96
    [7] 陈兴蜀, 常天祐, 王海舟, 等. 基于微博数据的“新冠肺炎疫情”舆情演化时空分析. 四川大学学报(自然科学版), 2020, 57(2): 409–416
    [8] 闻彬, 何婷婷, 罗乐, 等. 基于语义理解的文本情感分类方法研究. 计算机科学, 2010, 37(6): 261–264
    [9] 张启宇, 朱玲, 张雅萍. 中文分词算法研究综述. 情报探索, 2008, (11): 53–56
    [10] 崔连超. 互联网评论文本情感分析研究[硕士学位论文]. 济南: 山东大学, 2015.
    [11] Chen CX, Chen J, Shi C. Research on credit evaluation model of online store based on SnowNLP. Proceedings of 2018 3rd International Conference on Advances in Energy and Environment Research. Guilin, China. 2018. 03039.
    [12] Wang K, Zong CQ, Su KY. Integrating generative and discriminative character-based models for Chinese word segmentation. ACM Transactions on Asian Language Information Processing, 2012, 11(2): 7
    引证文献
    网友评论
    网友评论
    分享到微博
    发 布
引用本文

曾志伟,刁明光,王欣鹏,何炳辉.基于口罩评论数据的用户情感趋势与关注分析.计算机系统应用,2020,29(12):263-267

复制
分享
文章指标
  • 点击次数:927
  • 下载次数: 2114
  • HTML阅读次数: 1769
  • 引用次数: 0
历史
  • 收稿日期:2020-05-11
  • 最后修改日期:2020-06-10
  • 在线发布日期: 2020-12-02
文章二维码
您是第12795079位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号