本文已被:浏览 1626次 下载 3447次
Received:October 15, 2008
Received:October 15, 2008
中文摘要: 针对传统文本表示模型的不足以及文本向量的“高维诅咒”问题,本文提出一种基于频繁概念集的文本聚类方法(CFC)。该方法利用HowNet 将文本中的关键词映射为概念,然后使用Apriori 算法找出概念文本集中的频繁特征项,我们称之为频繁概念,最后利用CFC 算法实现文本聚类。实验表明,较传统的基于频繁特征项的同类方法,该方法能获得更好的聚类效果。
中文关键词: 文本聚类 概念映射 频繁项集 CFC 算法
Abstract:
keywords:
文章编号: 中图分类号: 文献标志码:
基金项目:
Author Name | Affiliation |
肖杰 | 中南大学 信息科学与工程学院 湖南 长沙 410083 |
黄汉永 | 中南大学 信息科学与工程学院 湖南 长沙 410083 |
张驹 | 中南大学 信息科学与工程学院 湖南 长沙 410083 |
Author Name | Affiliation |
肖杰 | 中南大学 信息科学与工程学院 湖南 长沙 410083 |
黄汉永 | 中南大学 信息科学与工程学院 湖南 长沙 410083 |
张驹 | 中南大学 信息科学与工程学院 湖南 长沙 410083 |
引用文本:
肖杰,黄汉永,张驹.一种基于频繁概念集的文本聚类方法.计算机系统应用,2009,18(5):81-84
.A Text Clustering Method Based on Frequent Concept-Sets.COMPUTER SYSTEMS APPLICATIONS,2009,18(5):81-84
肖杰,黄汉永,张驹.一种基于频繁概念集的文本聚类方法.计算机系统应用,2009,18(5):81-84
.A Text Clustering Method Based on Frequent Concept-Sets.COMPUTER SYSTEMS APPLICATIONS,2009,18(5):81-84