本文已被:浏览 1775次 下载 2561次
中文摘要: 本文针对k-最近邻方法分类效率不高的问题,提出了一种基于密度的训练样本集约减算法.该方法通过计算训练样本集中各类别的类别密度及整个训练集的平均密度,去掉高密度类别中的部分样本,使训练样本集具有更好的代表性.实验表明,该方法不仅提高了k-最近邻方法的分类效率,而且对其分类准确率也有一定程度的提高.
中文关键词: 文本分类 k-最近邻方法 训练样本
Abstract:
keywords:
文章编号: 中图分类号: 文献标志码:
基金项目:
Author Name | Affiliation |
徐义峰 | 衢州学院信息与电子工程系 浙江衢州 324000 |
陈春明 | 桂林电子科技大学图书馆 广西桂林 541004 |
徐云青 | 衢州学院信息与电子工程系 浙江衢州 324000 |
Author Name | Affiliation |
徐义峰 | 衢州学院信息与电子工程系 浙江衢州 324000 |
陈春明 | 桂林电子科技大学图书馆 广西桂林 541004 |
徐云青 | 衢州学院信息与电子工程系 浙江衢州 324000 |
引用文本:
徐义峰,陈春明,徐云青.一种新的基于密度的k-最近邻文本分类器训练样本约减方法.计算机系统应用,2007,16(11):127-128
.A New Density - Based Method for Reducing the Amount of Training Samples in k- NN Text Classification.COMPUTER SYSTEMS APPLICATIONS,2007,16(11):127-128
徐义峰,陈春明,徐云青.一种新的基于密度的k-最近邻文本分类器训练样本约减方法.计算机系统应用,2007,16(11):127-128
.A New Density - Based Method for Reducing the Amount of Training Samples in k- NN Text Classification.COMPUTER SYSTEMS APPLICATIONS,2007,16(11):127-128