摘要:基于深度学习的人工智能诊断模型严重依赖于高质量地详尽注释数据进行算法训练, 但受到标签噪声信息的影响. 为了增强模型的鲁棒性并防止有噪声的标签记忆, 提出了一种标签噪声样本选择 (noise label sample selection, NLSS)模型来充分挖掘噪声样本的隐藏信息, 减轻模型过拟合问题. 首先, 通过将混合增强图像作为输入, 提取图像分布式特征表示; 其次, 引入对比损失函数以及比较样本预测标签分布与其真实标签分布的相似性来评估样本, 进行样本选择; 最后, 通过标签重分配模块的伪标签提升策略在样本选择的基础上重新纠正噪声标签的监督信息. 以非小细胞肺癌 (non-small cell lung cancer, NSCLC)患者的 PET/CT 数据集为例进行实验, 结果表明提出的模型均比对比模型有一定的提升, 可降低淋巴结转移状态诊断中标签噪声的干扰.