结合加权特征向量空间模型和RBPNN 的文本分类方法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金(60863011;61175068)


Combination of Weighted Feature Vector Space Model and the RBPNN Text Classification Method
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    提出了一种结合加权特征向量空间模型和径向基概率神经网络(RBPNN)的文本分类方法. 该方法针对传统的文本特征提取方法的不足, 根据文本中特征项的位置信息和所属类别信息定义特征权重, 然后, 依据特征项的权值计算文档特征项的频数, 通过 TFIDF 函数计算特征值并得到文本的特征向量, 最后, 采用RBPNN 网络分类, 通过最小二乘算法求解神经网络的第二隐层和输出层之间的权值, 最终训练获得文本分类模型. 文本分类实验结果表明, 该方法在文本分类中表现出较好的效果, 具有较好查全率和查准率.

    Abstract:

    In this paper, a text classification method combined weighted feature vector space model and the RBPNN are presented. According to the insufficient of traditional text feature extraction method. In the method, the weigthing about text feature is given by the text feature location information and category information, and then the feature frequency is obtained. The characteristic value is calculated using the TFIDF function after that, and the characteristic vector of text is formed. Then the weights between the second network hidden layer and output layer are decided by the least squcre algorithm, so the classification model is built. The experimental results showed that, the good recall and precision are obtained. The performance of text classification method proposed is well.

    参考文献
    相似文献
    引证文献
引用本文

李敏,余正涛.结合加权特征向量空间模型和RBPNN 的文本分类方法.计算机系统应用,2012,21(12):85-89,71

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2012-04-21
  • 最后修改日期:2012-05-14
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号