基于不可分辨关系的文本自动聚类
DOI:
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Text Automatic Clustering Based on Indiscernibility Relation
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    研究了文本对象在不可分辨关系下的自动聚类方法. 在自动聚类过程中, 首先把文本集转化为让机器可以处理的布尔文本信息系统; 其次在信息系统上定义对象间的不可分辨关系, 提出利用不可分辨关系进行聚类的理论基础; 然后对算法进行描述, 并用实验进行验证; 最后分析该算法的时间复杂度和缺点, 并提出具体的改进措施. 基于不可分辨关系的文本自动聚类算法具有理论基础和较好的实验效果表明该方法具有较好的应用性.

    Abstract:

    This paper studied the automatic clustering method under the Indiscernibility relation of the text objects. In the clustering process, the text sets were converted to the Boolean text information system that the machine may process; secondly the Indiscernibility relation was defined in information systems, and the Indiscernibility relation clustering theory was proposed; then the algorithm was described, which was proved by experiment; Analyzing the time complexity and disadvantages of the algorithm, gives the concrete improvement measures. Based on Indiscernibility relation automatic text clustering algorithm has a theoretical foundation and good experimental results show that this method has better application.

    参考文献
    相似文献
    引证文献
引用本文

周勇.基于不可分辨关系的文本自动聚类.计算机系统应用,2012,21(12):190-192

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2012-05-11
  • 最后修改日期:2012-06-12
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号