摘要:基于Transformer方法凭借自注意力机制在图像超分辨率重建领域中展现出卓越的性能, 然而自注意力机制也带来了非常高的计算成本, 针对此问题提出一种基于混合泛化Transformer的轻量化图像超分辨率重建模型. 该模型建立在SwinIR网络架构的基础上, 首先, 采用矩形窗口自注意机制(RWSA), 利用不同头部的水平和垂直矩形窗口代替传统的正方形窗口模式, 整合跨越不同窗口的特征. 其次, 引用递归泛化自注意力机制(RGSA)将输入特征递归地聚合到具有代表性的特征映射中, 然后利用交叉注意力来提取全局信息, 同时将RWSA和RGSA交替结合, 以更有效地利用全局上下文信息. 最后, 为了激活更多的像素以获得更好的恢复, 使用通道注意力机制和自注意力机制并联地对输入图像进行特征提取. 在5种基准数据集的测试结果表明, 该模型在保持模型参数轻量化的同时取得了更好的重建性能.