基于口罩评论数据的用户情感趋势与关注分析
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

2019大学生创新创业训练计划项目A(X201911415126)


Analysis of User Sentiment Trend and Concern Based on Mask Review Data
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 增强出版
  • |
  • 文章评论
    摘要:

    为了对疫情期间口罩的用户评论数据进行情感关注分析, 本文用谷歌浏览器的插件Web Scraper爬取了2020年3月1日到4月11日中淘宝网的口罩的共计143 330条用户购买评论数据. 为了提高情感预测的精度, 在此数据集上经过人工标注情感为积极和消极的共计14 400条数据后, 用SnowNLP情感分析模型进行了训练, 最后用训练后的语料库进行了情感预测. 从整体上可见用户评论的情感是积极的. 在用户评论的每日情感变化趋势上, 本土新增病例(不含海外输入)的趋势在一定程度上影响着用户每日情感趋势的整体变化, 而国内新增病例(含海外输入)的局部波动变化趋势也影响着每日情感局部的相应波动变化趋势. 在对预测后的评论进行分类后, 发现用户的积极评论中对口罩的关注主要集中在口罩的质量、包装、价格、厚实, 而在消极的评论中对口罩的关注主要集中在质量、包装、味道和是否为医用.

    Abstract:

    In order to analyze the sentimental focus of the comment data from users of masks during the outbreak of virus, we extracted 143 330 comments about the purchase from Taobao users from March 1st to April 11th, 2020 by means of the Web Scraper of Google browser. To improve the accuracy of the sentimental estimation, each comment of the total 14 400 pieces was manually marked as positive or negative emotion on this data set. And then we used SnowNLP, the sentimental analysis model to train them. At last, the trained corpus was used for sentimental estimation. The overall sentiment of the comments was proved positive. On the basis of the daily emotional variation trend of users’ comments, the trend of local new cases (excluding overseas input) to some extent affects the overall change of their daily emotional trend. And the local fluctuation trend of domestic new cases (including overseas input) also affects that of the everyday emotional performance. After classifying the predicted comments, we found that users’ positive comments focused on the quality, packaging, price, and thickness of masks, while negative comments focused on the quality, packaging, smell, and whether the masks were for medical use.

    参考文献
    相似文献
    引证文献
引用本文

曾志伟,刁明光,王欣鹏,何炳辉.基于口罩评论数据的用户情感趋势与关注分析.计算机系统应用,2020,29(12):263-267

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-05-11
  • 最后修改日期:2020-06-10
  • 录用日期:
  • 在线发布日期: 2020-12-02
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号