摘要:RSKNN算法是一种基于变精度粗糙集理论的k-近邻改进算法, 该算法能够保证在一定分类精度的前提下, 有效地降低分类的计算量, 提高分类效率. 但由于RSKNN算法只是简单地将每个类中的样本划分成一个核心和边界区域, 并没有根据数据集本身的特点进行划分, 因而存在极大的局限性. 针对存在的问题, 提出一种多代表点学习算法, 运用结构风险最小化理论对影响分类模型期望风险的因素进行分析, 并使用无监督的局部聚类算法学习优化代表点集合. 在UCI公共数据集上的实验表明, 该算法比RSKNN算法具有更高的分类精度.