GwMKnn:针对类属性数据加权的MKnn算法
DOI:
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金(61070062);福建高校产学合作科技重大项目(2010H6007);福建省教育厅B类项目(JB12201)


GwMKnn:MKnn algorithm for Nominal Data by Gini Weight
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    互k近邻MKnn算法是k-近邻算法的一种有效改进算法, 但其对类属性数据通常采用属性值相同为0, 不同为1的方法处理, 从而在类属性数据较多的数据集上分类效率受到一定程度的抑制. 针对MKnn对类属性数据处理方法的不足, 对类属性数据的处理引进类别基尼系数的概念, 对同类样本, 用基尼系数统计某一类属性中不同值分布对这个类的贡献度作为此类属性的权重, 并以此作为估算不同样本之间的相似性对MKnn进行优化, 扩宽MKnn的使用面. 实验结果验证了该方法的有效性.

    Abstract:

    MKnn is an improved version of the k-nearest neighbor method, but it uses general approach to deal with nominal data, that is, if its value is the same then to 0, different to 1, thus the classification efficiency is suppressed a certain degree on the data sets with more nominal data. The concept of Category's Gini is introduced in this paper to deal with the shortage of the processing on nominal data, which statistics the contribution of samples in same class by its data distribution for its category and takes it as the attribute weight, used to estimate the similarity for different samples. It aims to optimize the MKnn method and promotes its applications. The experimental results demonstrate the effect-tiveness of the proposed method.

    参考文献
    相似文献
    引证文献
引用本文

陈雪云,郭躬德,陈黎飞,卢伟胜. GwMKnn:针对类属性数据加权的MKnn算法.计算机系统应用,2013,22(8):103-108,158

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2013-01-10
  • 最后修改日期:2013-03-11
  • 录用日期:
  • 在线发布日期: 2013-09-06
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号