摘要:卷积神经网络(CNN)作为医学图像分割领域中U-Net基线网络的重要组成部分, 其主要作用是处理局部特征信息之间的关系. 而Transformer是一种能够有效强化特征信息之间的远距离依赖关系的视觉模型. 目前的研究表明, 结合Transformer和CNN可以在一定程度上提高医学图像分割的准确性. 但是, 由于医学图像的标注数据较少, 而且训练Transformer模型需要大量数据, 这使得Transformer模型面临耗时长和参数量大的挑战. 基于这些考虑, 本文在UNeXt模型的基础上, 结合多尺度混合MLP和CNN, 提出了一种新型的基于混合MLP的医学图像分割模型——LM-UNet. 这种模型能够有效地增强局部与全局信息之间的联系, 并加强特征信息间的融合. 在多个数据集上的实验表明, LM-UNet模型在皮肤数据集上的分割性能明显提升, 平均Dice系数达到92.58%, 平均IoU系数达到86.52%, 分别比UNeXt模型提高了3%和3.5%. 在软骨和乳腺数据集上的分割效果也有显著提升, 平均Dice系数分别比UNeXt提高了2.5%和1.0%. 因此, LM-UNet模型不仅提高了医学图像分割的准确性, 还增强了其泛化能力.