本文针对k-最近邻方法分类效率不高的问题,提出了一种基于密度的训练样本集约减算法.该方法通过计算训练样本集中各类别的类别密度及整个训练集的平均密度,去掉高密度类别中的部分样本,使训练样本集具有更好的代表性.实验表明,该方法不仅提高了k-最近邻方法的分类效率,而且对其分类准确率也有一定程度的提高.
徐义峰,陈春明,徐云青.一种新的基于密度的k-最近邻文本分类器训练样本约减方法.计算机系统应用,2007,16(11):127-128
京公网安备 11040202500063号