摘要:为快速构建大尺度、高质量中国人脸识别数据集, 本文提出一种半自动构建方法. 相较于现有的数据集构建方法, 该方法可以快速地构建大尺度中国名人人脸数据集, 将此数据集命名为CCFace (Chinese Celebrities Face). CCFace数据集包含431个人物, 506874张人脸图像, 平均每个人物包含1176张不同年龄、姿态的图像, 该构建方法在一定程度上解决了当前社区中可用的中国人人脸图像数据集短缺问题. 在实验部分中以多个模型测试该数据集的有效性, 表明其可以作为SOTA (State Of The Art)模型的训练集使用, 相信这种方法以及该数据集将引来更多的人来从事人脸识别的研究工作, 并促进国内人脸识别应用的发展.