世界卫生组织公布肺炎是导致儿童死亡的主要原因之一[1], 据估计每年160万5岁以下儿童因患肺炎而死亡. 肺炎病患的医学影像需要具备专业知识的医生进行评估, 但在实际诊断中医生由于缺少经验和视觉疲惫等主观因素会造成误诊, 因此准确高效地通过肺部影像进行辅助诊断对于肺炎的治疗至关重要[2, 3]. 面对医疗诊断过程决策难且不确定性高的问题, Chouhan等人[4]采用迁移学习建立肺炎检测的深度学习框架, 利用AlexNet、DenseNet121、Inception V3、GoogLeNet和ResNet18网络模型提取图像特征, 并使用集成学习方法将各网络的输出合并到一个预测向量中, 使用多数表决权进行最终预测. 潘丽艳等人[5]使用深度学习技术对肺区域病毒或细菌的病原学类型进行判断, 从而在临床上规范儿童肺炎治疗. Al-Antari等人[6]提出一种基于YOLO预测器的同步深度学习计算机辅助诊断系统, 能可靠地将新冠肺炎与其它呼吸系统疾病进行区分. 何新宇等人[7]提出基于深度卷积神经网络的肺炎图像识别模型, 采用GoogLeNet Incepion V3网络模型进行特征提取, 以及随机森林分类器进行分类预测, 最终在识别准确率和敏感度上实现明显提高.
深度学习技术在图像的分类[8]、检测[9]等方面具有高精度的优势, 能准确地提取医学图像的特征从而辅助疾病诊断. 然而在现实中仍然存在以下问题: (1)训练模型需要大量的优质数据, 而医疗数据涉及病人隐私, 容易造成数据孤岛现象. (2)传统的深度学习过程将各方数据集汇总到一起进行模型训练, 对于单机的算力需求较高且效率较低. (3)经典残差网络忽略了图像的通道特征且对批量大小具有高依赖性.
Mao等人[10]论述联邦学习具有不共享本地数据实现联合训练的优势, 能够解决深度学习过程中的医疗数据隐私泄漏问题. 利用联邦学习对医学图像进行分析, 能为临床医生提供更好的辅助诊断工具[11].
针对以上问题, 本文提出了一种由联邦学习框架(federated learning, FL)、改进残差网络(residual network-group normalization, ResNet-GN)和压缩激励网络(squeeze-and-excitation network, SE)融合形成的FL-SE-ResNet-GN方法, 将残差网络的批量归一化方式(batch normalization, BN)替换为组归一化方式(group normalization, GN), 嵌入压缩激励网络, 在提取图像深层特征的同时关注通道特征, 最终融合联邦学习框架进一步提升肺炎辅助诊断的效果和保护患者数据隐私.
1 相关理论 1.1 残差网络基于卷积神经网络的模型通过不断地增加卷积层和池化层组合的数量从而学习图像更深层的特征, 例如LeNet[12]、AlexNet[13]、VGG[14]等模型. 然而当模型的层数不断地增加, 浅层网络参数会逐渐趋于零, 导致其无法更新, 造成梯度消失现象. 为了解决上述问题, 2016年He等人[15]提出了深度残差网络(residual network, ResNet)模型. 其结构如图1所示, 通过在两个权重层外部使用跳跃连接实现恒等映射, 从而构成一个残差块. 定义该残差块的输入为
1.2 压缩激励网络
压缩激励网络[16]结构简单, 便于耦合到已有的深度学习网络模型框架中. SE模块主要关注了通道之间的相关性, 通过训练得到各个通道不同的权重信息, 含有主要特征的通道分配更高的权重, 从而提高模型的表达能力. SE模块由3部分组成: 压缩(squeeze)、激励(excitation)和重分配(reweight). 定义SE模块的输入为
首先SE模块利用全局池化对输入特征进行压缩, 将特征转化为
然后利用两次全连接操作、ReLU函数和缩放参数实现降维和升维操作. 最后实现重分配, 使用Sigmoid函数对激励操作的输出实现归一化, 从而得到对应通道的归一化权重, 并将权重与输入特征相乘, 实现了输入特征的重标定, 从而增强了有用特征的提取, 提高特征提取的准确度.
1.3 联邦学习联邦学习[10]是一种特殊的分布式机器学习框架, 与传统的机器学习的区别在于缺少了中心服务器汇总数据的过程. 联邦学习采用客户端-服务器架构如图2所示, 联邦学习的组成部分为中心服务器和若干个客户端, 其每轮的训练过程是客户端首先从中心服务器下载联邦共享模型和参数, 利用本地的数据进行迭代训练, 最后将该轮训练得到的参数或模型上传到中心服务器进行聚合, 实现联邦共享模型和参数的更新.
2 基于联邦学习与改进ResNet的肺炎辅助诊断方法
本文为了准确地提取肺部图像更深层次的特征同时保护医疗数据的隐私性. 首先, 在残差网络的基础上引入压缩激励网络. 然后, 将残差网络中的批量归一化方式转换为组归一化方式形成改进后的深度神经网络模型(SE-ResNet-GN). 最后, 将改进后的深度学习模型融合联邦学习框架, 运用联邦平均算法实现分布式模型训练以获得最终的联邦共享模型.
2.1 改进ResNet网络本文以经典的ResNet-18作为基础网络, 总共由17个卷积层和1个全连接层组成, 第一个卷积层使用64个
首先在残差块内部的输出后嵌入激励压缩网络, 本文中令缩放参数
其次, 残差块使用BN方式实现归一化, 在学习过程中, BN方式对一个批量的数据计算得到均值和方差并通过滑动平均的方式获得训练的全局均值和方差, 因此BN方式对批量大小(batch size)的依赖程度较高, 当数据批量较小时难以保证训练效果, 而较大批量的数据对于计算机的算力要求较高. 因此本文使用组归一化[17]方式替换经典残差块内部的BN. 改进后的网络如图3所示. GN通过对通道进行分组操作, 将卷积层的输出特征图的通道分为G组, G为16, 图3中表示为64//G, 并计算每组的均值和方差, 因此使用GN方式性能稳定, 对批数量的鲁棒性更强.
定义归一化运算的输入的特征图
$ {y_{BN}} = \gamma \left( {\frac{{x - \mu \left( x \right)}}{{\sigma \left( x \right)}}} \right) + \beta $ | (1) |
$ \mu \left( x \right) = \frac{1}{{NWH}}\sum\limits_{i{\text{ = 1}}}^N {\sum\limits_{j = 1}^W {\sum\limits_{k = 1}^H {{x_{ijk}}} } } $ | (2) |
$ {\sigma ^2}\left( x \right) = \frac{1}{{NWH}}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^W {\sum\limits_{k = 1}^H {{{\left( {{x_{ijk}} - \mu \left( x \right)} \right)}^2}} } } $ | (3) |
GN进行归一化首先将输入
$ {y_{GN}} = \gamma \left( {\frac{{x - {\mu _g}\left( x \right)}}{{{\sigma _g}\left( x \right)}}} \right) + \beta $ | (4) |
$ {\mu _g}\left( x \right) = \frac{1}{{\left( {C/G} \right)WH}}\sum\limits_{i = gC/G}^{(g + 1)C/G} {\sum\limits_{j = 1}^W {\sum\limits_{k = 1}^H {{x_{ijk}}} } } $ | (5) |
$ \sigma _g^2\left( x \right) = \frac{1}{{\left( {1/G} \right)WH}}\sum\limits_{i = gC/G}^{(g + 1)C/G} {\sum\limits_{j = 1}^W {\sum\limits_{k = 1}^H {{{\left( {{x_{ijk}} - {\mu _g}\left( x \right)} \right)}^2}} } } + \varepsilon $ | (6) |
基于联邦学习的肺炎辅助诊断中对于病人数据的数量和质量要求较高, 对于单一的医院或者医疗机构而言本地的数据集数量较少而且类型单一, 难以达到深度学习的要求. 与此同时, 医疗数据因涉及大量病人的隐私, 形成大量的数据孤岛. 本文联邦学习采用客户端-服务器架构, 将单个医院或者医疗机构作为一个客户端以及拥有足够算力的可信第三方作为中心服务器, 提供FL-SE-ResNet-GN框架足够的算力支持并进行数据传输, 能够让客户端在不暴露本地的数据的情况下进行深度学习的模型训练, 各个客户端将本地训练的参数上传到中心服务器应用联邦平均算法进行聚合. 联邦平均算法步骤如算法1所示.
算法1. 联邦平均算法
输入: 参与运算的客户端比例:
输出: 全局权重.
Step 1. 初始化
Step 2. 从
1)
2)
3)
4)
5)获得各
在联邦学习过程中, 各个客户端在本地进行独立的模型训练, 其采用的批处理数量与各自计算机算力相关, 同时使用小批量数据在BN中误差较大, 从而影响聚合的联邦共享模型的准确度. 因此, 为了减少对批处理数量的依赖. 本文使用联邦学习框架与改进的SE-ResNet-GN网络模型相结合实现分布式训练, 当联邦聚合的次数达到限制或者训练模型收敛后将会结束训练. 具体的实现过程如图4所示. 图中使用clienti和clientj表示不同的客户端.
改进的深度神经网络模型融合联邦学习框架后的训练算法如算法2所示.
算法2. FL-SE-ResNet-GN
输入: 本地数据集
初始化: 模型网络结构, 权重
输出: 收敛的FL-SE-ResNet-GN模型.
Step 1. 客户端从中心服务器下载初始的FL-SE-ResNet-GN模型和初始参数.
Step 2. 判断该下载访问次数是否在合法范围内, 若首次则转向Step 3, 若是合法范围内则转向Step 4, 否则转向Step 7.
Step 3. 客户端对本地的私有数据进行数据预处理, 作为网络模型的输入.
Step 4. 各个客户端利用本地处理后的数据进行训练,得到更新的模型和参数, 同时将参数进行上传.
Step 5. 中心服务器应用联邦平均算法对参数进行聚合.
Step 6. 重复Step 1–Step 5, 当模型收敛, 转向Step 7.
Step 7. 训练结束.
3 仿真实验与理论分析 3.1 实验环境
本文实验的环境为Windows 10操作系统, Intel(R) CPU E5-1620 v3@3.5 GHz 3.5 GHz处理器, 8 GB NVIDIA Quadro M4000显卡, 32 GB内存, 500 GB硬盘, 计算机语言为Python, 实验框架基于PyTorch实现.
3.2 数据集与数据增强本实验所使用的数据集是来自2018年美国加州大学圣迭戈分校公开的Chest X-Ray Images图像数据集[18]. 该数据集由两类图像组成, 分别是正常(normal)和患肺炎(pneumonia). 训练集和测试集的数量如表1所示.
3.3 实验评估指标
本次实验所使用的评估指标分别为准确率(Accuracy, ACC), 召回率(Recall), 精确率(Precision,P), F1分数(F1). 以上指标的计算公式如下.
$ ACC = \frac{{TP + TN}}{{TP + FP + TN + FN}} $ | (7) |
$ P = \frac{{TP}}{{TP + FP}} $ | (8) |
$ {{F1}} = \frac{{{\text{2}}P \times Recall}}{{P{\text{ + }}Recall}} $ | (9) |
$ Recall = \frac{{TP}}{{TP + FN}} $ | (10) |
其中,
本节使用Chest X-Ray Images图像[18]作为数据集进行实验. 首先, 为了验证批量归一化和组归一化方式受批处理数量参数的影响, 在不同的批处理数量下将SE-ResNet-GN模型与嵌入SE的原始残差网络(以下简称SE-ResNet-BN)进行比较, 并分析模型的准确率、召回率、精准率和F1等指标. 然后, 运用联邦学习框架与改进SE-ResNet-GN模型相融合, 并与经典的神经网络模型进行对比. 最后, 将本文改进的方法与其它研究者已有的研究成果进行对比.
3.4.1 Batch size对融合BN和GN网络的影响本节将改进后的SE-ResNet-GN与原始网络对比, 批数量分别设定为4、8、16和32, 其训练结果如表2.
从表2可知, batch size为4–32之间, SE-ResNet-BN模型的准确率最大差值为11.5个百分点, 准确率最小差值为2个百分点. 在上述batch size下的SE-ResNet-GN模型的准确率变化较为平稳, 上述batch size下准确率差值最大为3个百分点, 差值最小为0.2个百分点. 当batch size为32时, SE-ResNet-GN的准确率、召回率、F1分数分别比SE-ResNet-BN高1.1个百分点、5.8个百分点、1.8个百分点. 以上结果表明, 整体上, SE-ResNet-GN模型不仅具有较好的评价指标效果而且受batch size的影响较少.
3.4.2 本文方法与经典深度神经网络模型对比本节实验假定有3个客户端进行20轮联邦拟合过程, 客户端本地进行10轮迭代训练. 实验数据集将根据客户端的数量等量划分成为各自本地的数据. 本节实验选用AlexNet[13]、VGG[14]、ResNet[15]三种模型以及相关改进SE-ResNet-BN模型与本文方法在相同的实验环境和数据集下进行对比实验, 其结果如表3.
由表3可知, SE-ResNet-BN模型的指标优于ResNet, 表明引入SE模块实现注意力机制能够提升图像分类的性能. 经典深度神经网络模型中准确率最高的SE-ResNet-BN模型的准确率比本文方法低1.2个百分点. 本文方法的各项评价指标与AlexNet、ResNet、SE-ResNet-BN相比具有明显提升. 本文方法利用改进残差网络能提取更深层次的图像特征, 嵌入压缩激励模块关注通道特征, 并进行特征重标定增强有效特征的提取, 能够提高联邦共享模型的准确性, 同时本文方法具有本地数据不对外共享的优势, 能够有效保护医疗数据的隐私, 从而打破医疗数据孤岛现象. 因此与上述经典方法相比, 在诊断准确率和数据隐私保护方面具有优势. 本节实验将联邦学习训练的迭代拟合过程与传统方法迭代过程对比, 实验准确率和损失值变化如图5和图6所示, 整体上训练过程中的准确率和损失值变化结果均优于其它网络.
3.4.3 与其它方法的对比通过对Chest X-Ray Images图像数据集进行训练, 文献[18]使用迁移学习方法建立了一种基于深度学习框架的诊断工具. 文献[19]提出一种结合残差思想和膨胀卷积[20]的肺炎图像分类方法[19], 通过残差网络结构克服模型深度增加引起训练过程中的过拟合和退化问题, 并利用膨胀卷积避免肺炎图像分类过程中的损失. 文献[21]利用AlexNet和InceptionV3网络模型并结合知识蒸馏方法提高对肺炎CT图像的分类性能, 提出了AlexNet_S方法. 本文方法与上述3种方法的实验结果对比如表4所示. 实验结果表明, 本文方法的准确率和召回率最优. 在精度指标上本文方法比文献[19]方法提升4.2个百分点, 但低于迁移学习[18]和AlexNet_S[21]的方法的精度指标. 整体上本文方法在准确率、精度、召回率方面性能较好, 同时融合联邦学习框架, 在医疗数据隐私安全性方面具有较大优势, 这在现实应用中具有重要的实际意义.
4 结论与展望
为了提高医生疾病诊断的效率和准确性, 本文融合联邦学习架构和改进后的SE-ResNet-GN模型, 利用联邦学习过程中数据保存在本地且不对外共享的优势, 保证了医疗数据的隐私性并具有打破数据孤岛的优势. 为了提取更深层次的特征同时避免梯度消失, 本文以残差网络作为基础模型, 在联邦学习过程中, 各个客户端在本地进行独立训练, 为了避免批处理数量对于联邦共享模型的影响, 本文将传统的批量归一化方式转换为组归一化方式, 对输入特征的通道进行分组运算, 提高了模型的稳定性, 同时引入激励压缩网络关注通道间的相关性. 经过与其它的深度神经网络以及融合联邦学习框架后的模型对比实验后发现本文提出的模型具有更好的准确率与安全性.
[1] |
Kosasih K, Abeyratne U. Correction to: Exhaustive mathematical analysis of simple clinical measurements for childhood pneumonia diagnosis. World Journal of Pediatrics, 2019, 15(6): 626. DOI:10.1007/s12519-019-00262-2 |
[2] |
Ibrahim DM, Elshennawy NM, Sarhan AM. Deep-chest: Multi-classification deep learning model for diagnosing COVID-19, pneumonia, and lung cancer chest diseases. Computers in Biology and Medicine, 2021, 132: 104348. DOI:10.1016/j.compbiomed.2021.104348 |
[3] |
Syrjala H, Broas M, Ohtonen P, et al. Chest magnetic resonance imaging for pneumonia diagnosis in outpatients with lower respiratory tract infection. European Respiratory Journal, 2017, 49(1): 1601303. DOI:10.1183/13993003.01303-2016 |
[4] |
Chouhan V, Singh SK, Khamparia A, et al. A novel transfer learning based approach for pneumonia detection in chest X-ray images. Applied Sciences, 2020, 10(2): 559. DOI:10.3390/app10020559 |
[5] |
潘丽艳, 梁会营. 基于深度学习的儿童肺炎病原学类型判别模型. 中国数字医学, 2019, 14(3): 59-61, 110. DOI:10.3969/j.issn.1673-7571.2019.03.017 |
[6] |
Al-Antari MA, Hua CH, Bang J, et al. Fast deep learning computer-aided diagnosis of COVID-19 based on digital chest X-ray images. Applied Intelligence, 2021, 51(5): 2890-2907. DOI:10.1007/s10489-020-02076-6 |
[7] |
何新宇, 张晓龙. 基于深度神经网络的肺炎图像识别模型. 计算机应用, 2019, 39(6): 1680-1684. DOI:10.11772/j.issn.1001-9081.2018102112 |
[8] |
苏赋, 吕沁, 罗仁泽. 基于深度学习的图像分类研究综述. 电信科学, 2019, 35(11): 58-74. DOI:10.11959/j.issn.1000-0801.2019268 |
[9] |
张婷婷, 章坚武, 郭春生, 等. 基于深度学习的图像目标检测算法综述. 电信科学, 2020, 36(7): 92-106. DOI:10.11959/j.issn.1000-0801.2020199 |
[10] |
Mao J, Cao CJ, Wang LJ, et al. Research on the security technology of federated learning privacy preserving. Journal of Physics: Conference Series, 2021, 1757: 012192. DOI:10.1088/1742-6596/1757/1/012192 |
[11] |
Kaissis GA, Makowski MR, Rückert D, et al. Secure, privacy-preserving and federated machine learning in medical imaging. Nature Machine Intelligence, 2020, 2(6): 305-311. DOI:10.1038/s42256-020-0186-1 |
[12] |
Li LF, Wang YR. Improved LeNet-5 convolutional neural network traffic sign recognition. International Core Journal of Engineering, 2021, 7(4): 114-121. DOI:10.6919/ICJE.202104_7(4).0017 |
[13] |
Krizhevsky A, Sutskever I, Hinton GE. ImageNet classification with deep convolutional neural networks. Communications of the ACM, 2017, 60(6): 84-90. DOI:10.1145/3065386 |
[14] |
Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition. arXiv: 1409.1556, 2014.
|
[15] |
He KM, Zhang XY, Ren SQ, et al. Deep residual learning for image recognition. Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas: IEEE, 2016. 770–778.
|
[16] |
Hu J, Shen L, Sun G. Squeeze-and-excitation networks. arXiv: 1709.01507, 2018.
|
[17] |
Wu YX, He KM. Group normalization. arXiv: 1803.08494, 2018.
|
[18] |
Kermany DS, Goldbaum M, Cai WJ, et al. Identifying medical diagnoses and treatable diseases by image-based deep learning. Cell, 2018, 172(5): 1122-1131. DOI:10.1016/j.cell.2018.02.010 |
[19] |
Liang GB, Zheng LX. A transfer learning method with deep residual network for pediatric pneumonia diagnosis. Computer Methods and Programs in Biomedicine, 2020, 187: 104964. DOI:10.1016/j.cmpb.2019.06.023 |
[20] |
Geng L, Zhang SQ, Tong J, et al. Lung segmentation method with dilated convolution based on VGG-16 network. Computer Assisted Surgery, 2019, 24(S2): 27-33. DOI:10.1080/24699322.2019.1649071 |
[21] |
邓棋, 雷印杰, 田锋. 用于肺炎图像分类的优化卷积神经网络方法. 计算机应用, 2020, 40(1): 71-76. DOI:10.11772/j.issn.1001-9081.2019061039 |