一种基于特征选择的主观性文本分析方法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Approach to Analyzing Subjective Text Based on Feature Selection Algorithm
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    提出了一种主观性文本分析方法.方法采用多种不同策略表示文本,使用特征选择算法消除不相关特征及冗余特征后,训练SVM对文本按主观性和客观性进行分类.采用的特征选择算法以Simba为基础,通过实验对其迭代和相似度计算方法进行了改进,克服了在实际应用中出现的不稳定性问题.分别在中英文语料上进行了实验,结果表明该方法在实验语料上的性能优于已有方法.

    Abstract:

    This paper proposed a method to analyzing subjective text. The method uses various strategies to stand for text with feature vectors, and uses SVM to classify text according to the property of subjectivity and objectivity after eliminating the rundant and irrelevant features using feature selection algorithm. The feature selection algorithm in the paper bases on SIMBA. We improve the original SIMBA on the way of iteration and the measure of similarity through experiment, and overcome the instability when putting into application. In the experiment done on English and Chinese corpus respectively, the accuracy overperforms that by SVM algorithm alone and the F-MEASURE is better than that by the baseline method on same corpus.

    参考文献
    相似文献
    引证文献
引用本文

田卫新,郑胜.一种基于特征选择的主观性文本分析方法.计算机系统应用,2011,20(8):199-203

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2010-12-13
  • 最后修改日期:2011-03-03
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号