面向不平衡数据的分类算法
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:


Classification Algorithm for Imbalanced Data Set
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    不平衡数据在分类时往往会偏向"多数",传统过采样生成的样本不能较好的表达原始数据集分布特征.改进的变分自编码器结合数据预处理方法,通过少数类样本训练,使用变分自编码器的生成器生成样本,用于以均衡训练数据集,从而解决传统采样导致的不平衡数据引起分类过拟合问题.我们在UCI四个常用的数据集上进行了实验,结果表明该算法在保证准确率的同时提高了F_measureG_mean.

    Abstract:

    Imbalanced dataset tends to be biased towards "majority" when classifying, and samples generated by traditional over-sampling cannot well express the distribution characteristics of the original dataset. The improved variational autoencoders combine with data preprocessing method, generate samples by the generator of variational autoencoders trained by the minority class samples to balance the training data set, solve the overfitting problem caused by imbalanced dataset of traditional sampling. Experiments are carried out on four commonly used UCI datasets, the results demonstrate that the proposed method shows better classification performance in F_measure and G_mean with high accuracy.

    参考文献
    相似文献
    引证文献
引用本文

蒋宗礼,史倩月.面向不平衡数据的分类算法.计算机系统应用,2019,28(8):120-128

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2019-01-08
  • 最后修改日期:2019-02-03
  • 录用日期:
  • 在线发布日期: 2019-08-14
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号