BP神经网络是一种信号前向传递, 误差反向传播的多层前馈神经网络. 由于强大的泛化能力, BP神经网络被广泛应用于模式分类[1–3]、故障诊断[4,5]及非线性拟合预测[6]等方面. 但BP神经网络尚有以下不足: (1)初始权重与阈值随机产生, 导致网络优化不稳定, 输出结果波动较大. (2)通过梯度下降法训练修正权值阈值[7], 使得算法容易陷入局部最优, 全局搜索能力不强.
为了克服上述问题, 众多学者从各个角度对BP神经网络进行改进, 而将遗传算法、粒子群算法、蜂群算法等群智能算法用于优化BP神经网络成了研究的一大热点[8–13]. 群智能算法往往原理简单, 参数设置少, 优化结果较好, 在资源分配、调度优化、工程应用等各领域都有应用[14–16]. 但是群智能算法亦存在缺陷: 遗传算法全局搜索能力强, 但收敛速度慢; 粒子群算法参数个数少, 但后期种群多样性低, 容易陷入局部最优; 蜂群算法流程相对复杂, 局部开发能力较弱; 猴群算法搜索速度慢, 求解精度不高. 为了提高群智能算法的搜索与开发能力, 学者们从优化参数[17]、反向搜索[18]、构造混沌映射以开发搜索区域[8]、邻域内增强局部搜索[11]、引入诱导过程[14]、复制新粒子进行不同程度变异[19]等方式来提高寻优能力, 开发种群多样性, 这些方法提高了原算法的计算精度, 但是也使得算法流程变得复杂, 计算量增加.
目前大多学者利用群智能算法来优化BP神经网络的初始权值与阈值, 这亦存在如下问题: 通过群智能算法优化的初始权值阈值, 经再次训练后作分类预测, 由于训练过程中样本顺序的随机性, 导致训练的网络不稳定, 优化后预测精度提高不明显, 更好的方法是将整个优化后的训练网络保留下来, 一方面可以降低训练成本, 另一方面也能提高预测精度. 针对BP神经网络与群智能算法的以上问题, 本文首先提出了一种新的算法--竞争算法. 这种算法的优点在于参数设置少, 流程简易, 计算量小, 且具有远高于粒子群算法的全局搜索能力, 提高搜索精度. 然后将此算法用于优化BP神经网络, 可以有效提高BP神经网络优化性能, 增强网络的鲁棒性.
1 算法原理及改进 1.1 竞争(PK)算法在众多群智能算法中, 遗传算法、粒子群算法以及蜂群算法是目前运用较多的几种算法. 其中粒子群算法因其流程简明、参数少而广泛受到学者的青睐. 但粒子群算法也同其他群智能算法一样, 容易陷入局部最优. 因此, 改进已有的算法或者寻找搜索能力更强的智能算法是众多学者研究的焦点. 受粒子群算法启发, 我们给出一种新的算法, 并为其命名为竞争(PK)算法, 该算法不仅流程简洁, 参数较粒子群算法更少, 且全局搜索能力强于粒子群算法. PK算法的优化流程如下:
(1)初始化. 设定种群规模为N, 首先随机生成初始种群即N个个体, 每个个体
(2)个体评价. 根据问题计算每个个体的适应度函数
(3)对每个个体
修正主动挑战者
${v_{id}}^{t + 1} = {w_1} \cdot {v_{id}}^t + rand \cdot ({x_{jd}}^t - {x_{id}}^t)$ | (1) |
${x_{jd}}^{t + 1} = {x_{jd}}^t + {v_{jd}}^{t + 1}$ | (2) |
修正被动挑战者
${v_{jd}}^{t + 1} = {w_2} \cdot {v_{jd}}^t + rand \cdot ({x_{id}}^t - {x_{jd}}^t)$ | (3) |
${x_{id}}^{t + 1} = {x_{id}}^t + {v_{id}}^{t + 1}$ | (4) |
其中,
(4)如果达到终止条件则停止, 否则返回(2).
从上述流程可以看出, 竞争算法只有
BP神经网络一般有1个输入层、1个或多个隐含层, 以及1个输出层. 优化流程为: 给定初始权值与阈值, 在BP神经网络输入层输入向量, 输入向量经与权值、阈值及激活函数做一定运算后到达隐含层, 再经与权值、阈值及激活函数做一定运算后到达输出层, 如果输出层不能得到期望的输出, 则反向传递期望输出与实际输出的误差, 调整权值与阈值, 重复此流程, 不断减少误差. BP神经网络学习能力强, 能解决任意复杂的模式分类问题和多维函数映射问题.
BP神经网络自身存在一定的局限性, 如优化过程中容易陷入局部最优值, 且因为训练过程中训练样本的输入顺序是随机的, 同一初始权值阈值下优化出来的网络性能存在差异. 为了提升优化精度, 提高全局搜索能力, 增强BP神经网络的鲁棒性, 采用竞争算法来优化BP神经网络. 其基本流程如下:
具体实现步骤如下:
(1)设定竞争算法参数, 初始化种群, 其中每个个体均表示BP神经网络的初始权值和阈值, 个体维度的计算由式(5)计算:
$D = I \times H + H + H \times O + O$ | (5) |
其中, 神经网络的隐含层个数为1,
(2)利用竞争算法优化神经网络内部权值、阈值. 其中适应度函数即为神经网络训练指定次数之后实际输出值与期望输出值的绝对误差之和, 在分类问题里取分错类的总个数.
(3)将最优网络保存下来使之形成“虚拟”函数, 来作为高精度的预测网络模型, 进一步用于分类预测, 并评价测试集的分类正确率.
由于竞争算法收敛速度快, 高维度下全局收敛能力强, 经竞争算法优化后的BP神经网络预测性能高. 不同于以往的利用群智能算法来优化初始权值与阈值, 而是利用优化好的网络直接加以预测, 不仅能减少重新训练网络所需的时间代价, 而且利用最好的网络状态进行分类预测, 可以有效避免因重新训练时样本顺序的随机性而导致的精度稳定性不高问题.
2 算法结果与分析 2.1 竞争(PK)算法性能为了测试PK算法的性能, 我们选取了10个常用的测试函数如表1所示, 并在不同的维度与迭代次数下对PK算法做精度测试并与带惯性权重的粒子群算法运算结果相比较. 其中, PK算法中
竞争算法由于明确的目的性—提高适应度, 以及强化的学习性—在原有的基础上向强者学习, 因此收敛速度更快, 而且因为被挑战者的选择是随机的, 学习方向也多了随机性, 因此全局搜索能力能强. 从表2可以看出, PK算法对10个测试函数的平均值全部优于粒子群算法或者达到了全局最优. 在高维空间中的优越性更加明显. 尤其是40维度下的
2.2 PK-BP神经网络算法性能
为了客观地验证和分析PK-BP神经网络算法的有效性, 选取了UCI数据集上的11组测试集测试了BP神经网络、PK-BP神经网络和用遗传算法优化的BP神经网络(GA-BP)的分类准确率. 他们分别是Balance-scale, Iris, Cancer, Blood-transfusion, Banknote authentication, Mammographic messes, Seeds, User Knowledge Modeling, Wireless Indoor Localization, Wine, Zoo. 这11组测试集的基本信息如表3所示. 将数据集中有缺失的样本删除, 然后随机抽取60%的样本用于训练, 余下40%的样本作为测试集.
作为比较, 对用遗传算法优化的BP神经网络(简记为GA-BP)进行仿真. 通过MATLAB R2016a分别用BP神经网络、PK-BP神经网络以及GA-BP神经网络对这11个数据集进行30次独立试验. 其中, 神经网络的训练次数均为5次, 学习速率为0.3, 训练目标最小误差为0.0001, 隐含层神经元个数为6, 传递函数为默认的正切S型及线性传递函数. GA和PK算法的种群规模为20, 迭代代数为50代, PK算法参数同前面, GA算法交叉概率为0.3, 变异概率为0.1. 实验结果如表4所示.
从表4可以看出, 在这11个数据集上, PK-BP与GA-BP算法的平均准确率均明显高于BP神经网络. 且PK-BP在8个测试集上平均值最高, GA-BP在剩下的3个测试集上平均值最高. PK-BP算法的分类正确率优越性明显, 比BP算法的正确率约提高了0.5%–7%. 从分类准确率的最大值这一项来看, BP算法有6次最大, PK-BP算法有9次最大, GA-BP有5次最大, 说明PK-BP算法的全局寻优能力最强; 从标准差来看, BP算法标准差最大, PK-BP和GA-BP均有6次达到最小, 说明PK-BP与GA-BP的稳定性都较好, 均优于BP神经网络. 综上可知, PK-BP神经网络分类正确率高, 寻优能力强, 且算法性能稳定.
3 结论与展望本文提出了一种参数少、寻优能力强的竞争算法(PK), 通过10个测试函数验证了这种算法具有较好的全局搜索能力和稳定性. 并将该算法应入到优化BP神经网络中, 利用竞争算法的搜索能力有效提高了BP神经网络的精度及鲁棒性. 结果表明: PK-BP在11个测试集上的分类正确率更高, 稳定性更好. 尽管竞争算法已显示出其优越性, 但算法尚未完善, 可开发能力还很高, 在优化神经网络时以计算时间为代价, 下一步工作将对竞争算法的性能及应用进一步进行研究.
[1] |
Lee HKH. Model selection for neural network classification. Journal of Classification, 2001, 18(2): 227-243. |
[2] |
张兴国, 刘晓磊, 李靖, 等. BP神经网络下的限速交通标志实时检测识别. 西安电子科技大学学报, 2018, 45(5): 136-142. DOI:10.3969/j.issn.1001-2400.2018.05.022 |
[3] |
谢文兰, 石跃祥, 肖平. 应用BP神经网络对自然图像分类. 计算机工程与应用, 2010, 46(2): 163-166. DOI:10.3778/j.issn.1002-8331.2010.02.049 |
[4] |
马峻, 赵飞乐, 徐潇, 等. MRA-PCA-PSO组合优化BP神经网络模拟电路故障诊断研究. 电子测量与仪器学报, 2018, 32(3): 73-79. |
[5] |
史丽萍, 汤家升, 王攀攀, 等. 采用最优小波树和改进BP神经网络的感应电动机定子故障诊断. 电工技术学报, 2015, 30(24): 38-45. DOI:10.3969/j.issn.1000-6753.2015.24.006 |
[6] |
吴俊利, 张步涵, 王魁. 基于Adaboost的BP神经网络改进算法在短期风速预测中的应用. 电网技术, 2012, 36(9): 221-225. |
[7] |
Rumelhart DE, Hinton GE, Williams RJ. Learning representations by back-propagating errors. Nature, 1986, 323(6088): 533-536. DOI:10.1038/323533a0 |
[8] |
蒋锋, 彭紫君. 基于混沌PSO优化BP神经网络的碳价预测. 统计与信息论坛, 2018, 33(5): 93-98. DOI:10.3969/j.issn.1007-3116.2018.05.014 |
[9] |
高玉明, 张仁津. 基于遗传算法和BP神经网络的房价预测分析. 计算机工程, 2014, 40(4): 187-191. DOI:10.3969/j.issn.1000-3428.2014.04.036 |
[10] |
洪延武, 刘双宇, 徐春鹰, 等. 基于多种群遗传算法与神经网络的激光-电弧复合焊接焊缝形貌预测. 应用激光, 2015, 35(6): 677-683. |
[11] |
韦鹏宇, 潘福成, 李帅. 改进人工蜂群优化BP神经网络的分类研究. 计算机工程与应用, 2018, 54(10): 158-163. DOI:10.3778/j.issn.1002-8331.1612-0379 |
[12] |
黄亚驹, 陈福集, 游丹丹. 基于混合算法和BP神经网络的网络舆情预测研究. 情报科学, 2018, 36(2): 24-29. |
[13] |
郭彤颖, 陈露. 基于鸟群算法优化BP神经网络的热舒适度预测. 计算机系统应用, 2018, 27(4): 162-166. |
[14] |
徐小平, 师喜婷, 钱富才. 基于猴群算法求解0-1背包问题. 计算机系统应用, 2018, 27(5): 133-138. DOI:10.15888/j.cnki.csa.006340 |
[15] |
田海霖, 洪良, 王艺翔, 等. 于量子遗传算法优化粗糙-Petri网的电网故障诊断. 西安工程大学学报, 2018, 32(6): 678-684. |
[16] |
陈龙, 张春雷, 赵成龙, 等. 一种求解7自由度机器人逆运动学的混合粒子群优化算法. 机器人, 2019. DOI:10.13973/j.cnki.robot.180489 |
[17] |
Ratnaweera A, Halgamuge SK, Watson HC. Self-organizing hierarchical particle swarm optimizer with time-varying acceleration coefficients. IEEE Transactions on Evolutionary Computation, 2004, 8(3): 240-255. DOI:10.1109/TEVC.2004.826071 |
[18] |
卢滢宇, 王冰, 李学文, 等. 深层加速搜索的蜂群算法. 算机应用研究, 2012, 29(12): 4445-4447. DOI:10.3969/j.issn.1001-3695.2012.12.009 |
[19] |
赵新超, 刘国莅, 刘虎球, 等. 基于非均匀变异和多阶段扰动的粒子群优化算法. 计算机学报, 2014, 37(9): 2058-2070. |