GSwMKnn:基于类别基尼系数子空间的加权互K近邻算法
DOI:
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金(61070062);福建高校产学合作科技重大项目(2010H6007);福建省教育厅B类项目(JB12201)


GSwMKnn: Weighted MKnn Algorithm Based on the Category’s Gini Subspace
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    在高维数据空间中,存在大量冗余或无用的属性,这使得在子空间中寻找目标类更为有效。为此文章提出基于类别基尼系数子空间的加权互k近邻算法,利用类别基尼系数求出其对应的软子空间并将待分类样本和训练样本投影到各个类别子空间中,再在各软子空间中使用类别基尼系数加权距离互k近邻算法计算出待分类样本在各个子空间的投票权重并叠加,最终得出待分类样本的类标签。在公共数据集上的实验结果验证了该方法的有效性。

    Abstract:

    In high-dimensional data spaces, there exists a large number of redundant or useless attributes, and therefore it might be more effective to find target class in their subspaces. A weighted MKnn algorithm based on the Category’s Gini Coefficient subspace is proposed in this paper. Using the Category's Gini Coefficient, the algorithm firstly calculates the corresponding soft subspaces, and projects the training and testing samples onto each category subspaces. Secondly, it calculates the vote weights of unclassified samples on each subspace by the weighted MKnn algorithm and then accumulates them. Finally, it obtains the category labels of unclassified samples. The experimental results on some UCI public datasets demonstrate the effectiveness of the proposed method.

    参考文献
    相似文献
    引证文献
引用本文

陈雪云,卢伟胜. GSwMKnn:基于类别基尼系数子空间的加权互K近邻算法.计算机系统应用,2014,23(2):137-141,132

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2013-07-08
  • 最后修改日期:2013-09-09
  • 录用日期:
  • 在线发布日期: 2014-01-27
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号