基于拆分集成的不均衡数据分类算法
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

陕西省自然科学基础研究计划(2015JM6347);陕西省教育厅科技计划(15JK1218);商洛学院科学与技术研究项目(15sky010)


Imbalanced Data Classification Algorithm Based on Split and Classifier Ensemble
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    为改进SVM对不均衡数据的分类性能,提出一种基于拆分集成的不均衡数据分类算法,该算法对多数类样本依据类别之间的比例通过聚类划分为多个子集,各子集分别与少数类合并成多个训练子集,通过对各训练子集进行学习获得多个分类器,利用WE集成分类器方法对多个分类器进行集成,获得最终分类器,以此改进在不均衡数据下的分类性能.在UCI数据集上的实验结果表明,该算法的有效性,特别是对少数类样本的分类性能.

    Abstract:

    To improve the performance of Support Vector Machine classifier for imbalanced data, an imbalanced data classification algorithm based on split and classifier ensemble is introduced. The majority class sample is divided into several sub sets by clustering, and each subset is combined with minority class sample to produce a training subset. Then the training subsets are learned and multiple classifiers are obtained. Finally the multiple classifiers are integrated and the ensemble classifier is obtained. Experimental results show the algorithm is effective for imbalanced dataset, especially for the minority class samples.

    参考文献
    相似文献
    引证文献
引用本文

杜红乐,张燕.基于拆分集成的不均衡数据分类算法.计算机系统应用,2017,26(8):223-226

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2016-12-12
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2017-10-31
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号