###

DOI:

计算机系统应用英文版:2009,18(11):56-59

View/Add Comment 过刊浏览高级检索 HTML

←前一篇 | 后一篇→

码上扫一扫！

下载全文

通过确定邻近区域改进KNN文本分类①

汪成亮^1,2, 张硕果¹

(1.重庆大学计算机学院重庆 400030;2.重庆大学电气工程学院重庆 400030)

Improving KNN for Text Classification by Adjacent Domain Determination

摘要

图/表

参考文献

相似文献

本文已被：浏览 1504次下载 3063次
Received:March 05, 2009

中文摘要: 文本分类技术已经成为处理和组织文本信息的关键技术之一。KNN算法是文本分类中一种实用的方法。它在每次分类的过程中都要计算测试集中未标记文本与训练集合中所有样本的相似度(距离)，然后通过排序来找到K个最近邻样本，耗时较长，不利于Web上实时在线分类等应用。提出了一种确定邻近区域来加快搜寻K个最近邻的方法。试验证明，改进后的KNN算法较经典KNN算法在分类过程中速度有所提升，并且当训练文本数量增加时，在分类时间上表现相对更稳定。

中文关键词: 文本分类 k-最近邻邻近区域相似度 kNN算法

Abstract:

keywords:

文章编号： 中图分类号： 文献标志码：

基金项目:重庆市自然科学基金(CSTC)(2007BB6118)

Author Name	Affiliation
汪成亮	重庆大学计算机学院重庆 400030 重庆大学电气工程学院重庆 400030
张硕果	重庆大学计算机学院重庆 400030

Author Name	Affiliation
汪成亮	重庆大学计算机学院重庆 400030 重庆大学电气工程学院重庆 400030
张硕果	重庆大学计算机学院重庆 400030

引用文本：
汪成亮,张硕果.通过确定邻近区域改进KNN文本分类①.计算机系统应用,2009,18(11):56-59
.Improving KNN for Text Classification by Adjacent Domain Determination.COMPUTER SYSTEMS APPLICATIONS,2009,18(11):56-59