基于类别平均距离的加权KNN分类算法
作者:
基金项目:

福建省教育厅B类基金(JB11036)


Weighted KNN Classification Algorithm Based on Mean Distance of Category
Author:
  • 摘要
  • | |
  • 访问统计
  • |
  • 参考文献 [7]
  • |
  • 相似文献 [20]
  • | | |
  • 文章评论
    摘要:

    本文提出了一种改进的KNN分类算法,利用样本集合中同类别样本点间距离都十分接近的特点辅助KNN算法分类。将待分类样本点的K个最近邻样本点分别求出样本点所属类别的类别平均距离和样本点与待分类样本点距离的差值比,如果大于一个阈值,就将该样本点从K个最近邻的样本点中删除,再用此差值比对不同类别的样本点个数进行加权后执行多数投票,来决定待分类样本点所属的类别。改进后的KNN算法提高了分类的精度,并且时间复杂度与传统KNN算法相当。

    Abstract:

    In this paper, an improved KNN classification algorithm is proposed by using characteristics that the points distributed in the same category of sample collection are in close distance as an assistant to classify KNN algorithm. The way to deal with the k-nearest neighboring sample points is calculating the average distance between categories that the sample points belong to and the differences of unspecified sample points respectively. If the data calculated is greater than a certain threshold, delete this sample point from k-nearest neighboring samples, then determine the categories of unspecified sample points through majority voting. The improved KNN algorithm enhances the precision of classification and maintains the same time complexity as the traditional KNN algorithm.

    参考文献
    1 Cover T, Hart P. Nearest neighbor pattern classification.IEEE Trans. on Information Theory, 1967, 13: 21-27.
    2 Hart P. The condensed nearest neighbor rule. IEEE Trans. on Information Theory, 1968, 14(3): 515-516.
    3 Devijver P, Kittler J. Pattern Recognition: A Statistical Approach. Englewood Cliffs: PrenticeHall, 1982.
    4 李荣陆,胡运发.基于密度KNN文本分类器训练样本裁剪方法.计算机研究与发展,2004,41(4):539-545.
    5 Goldberger J, Roweis S, Hinton G, Salakhutdinov R. Neighborhood components analysis. Proc. of the Advances in Neural Information Processing Systems. Vancouver. Canada, MIT Press. 2004. 512-520.
    6 Torresani L, Lee K. Large margin component analysis. Proc. of the Advances in Neural Information Processing Systems. Vancouver. Canada, MIT Press. 2007. 1385-1392.
    7 崔正斌,汤光明.基于遗传算法和KNN的软件度量属性选择研究.计算机工程与应用,2010,46(30):57-60.
    引证文献
    网友评论
    网友评论
    分享到微博
    发 布
引用本文

严晓明.基于类别平均距离的加权KNN分类算法.计算机系统应用,2014,23(2):128-132

复制
分享
文章指标
  • 点击次数:1920
  • 下载次数: 5240
  • HTML阅读次数: 0
  • 引用次数: 0
历史
  • 收稿日期:2013-07-07
  • 最后修改日期:2013-08-19
  • 在线发布日期: 2014-01-27
文章二维码
您是第12852734位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号