基于概念的中文博客情感极性聚类分析
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Clustering Analysis of Sentiment Polarity for Chinese Blogs Based on Concept
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    通过基于概念的聚类方法,对博客作者的情感极性进行分析.在知网情感词汇库的基础上,将概念引入向量空间模型.首先,提取博客文本情感词,利用基于情感词概念的向量空间模型完成对博客文本的表示.然后,使用k-means算法对博客文本进行聚类,完成对博客情感极性的分析.在向量空间模型中使用概念作为特征项,提高了对博客作者情感极性分析的精度.实验证明基于概念的向量空间模型比传统基于词语的向量空间模型在博客文本情感聚类上具有更好的性能.

    Abstract:

    A clustering method based on concept was provided to analyse the sentiment polarity for Chinese Bloggers. The concept is introduced into Vector Space Model (VSM) on the basis of HowNet. Firstly, sentiment words are extracted from blog texts which would be expressed by VSM with the concept of sentiment words. Secondly, blog texts are clustered with k-means algorithm to finish the analysis of sentiment polarity for Chinese Blogs. The precision of sentiment polarity analysis of Chinese Blogs is improved with concept as feature in VSM. The experiment proves the concept based VSM to be of better performance than traditional term based VSM in clustering analysis of Chinese Blogs on sentiment polarity.

    参考文献
    相似文献
    引证文献
引用本文

申莹,徐东平,庞俊.基于概念的中文博客情感极性聚类分析.计算机系统应用,2011,20(8):72-75,121

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2010-11-15
  • 最后修改日期:2010-12-24
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号