桑黄是一种古老的中药, 具有很高的药用价值, 研究证实, 黄酮是桑黄液体发酵的二级代谢产物, 黄酮可以改善人体免疫系统, 减少抗癌药物的副作用, 缓解患者放疗或化疗的反应[1]. 如今对黄酮的生产有很大的要求, 但天然的桑黄很少见, 由于缺乏相关的技术经验以及桑黄生长周期较长, 桑黄人工培养难以实施. 2008年, NK Zeng等人通过原生质体融合引入了桑黄的育种方法[2]. 发酵通常用于产生真菌的次级代谢物, 如海藻内生真菌次生代谢产物[3]. 应注意, 不同的发酵方法可以产生具有不同生物活性的次级代谢物, 目前, 黄酮主要是通过桑黄的液体发酵培养获得.
为了提高黄酮的产量, 需要仔细考虑桑黄液体发酵培的养条件, 如发酵温度, PH值, 离心机转速, 接种量和种子年龄. 同时也应考虑培养基的组成, 发酵条件和培养基的多个变量使得生物实验的优化成为一个难题. 朱虎等人将发酵温度, 接种量, 离心机转速和装瓶能力作为自变量, 发酵产量作为因变量[4], 采用二次回归正交旋转组合设计方法获得了桑黄发酵过程的模型, 得到以下最佳发酵条件: 装瓶量为120 mL, 接种量为17 mL, 温度为26℃, 离心机转速为135 r/min. 此时发酵菌丝体生产的理论极值为24.51 mg/mL. 其他研究重点是发酵底物的数量, 如碳源和氮源的用量. 2010年, 朱虎等人使用响应面方法, 发现最佳液体发酵条件如下: 玉米淀粉浓度为0.5%, 酵母提取物浓度为2%, 维生素B1浓度为0.1%, 发酵时间为6天, 菌丝体(干重)的产量为18.43 g/L [5,6]. 应该注意的是, 这些研究是基于单因素实验, 结果依赖于一些自己确定的经验参数. 另外, 一些机器学习的策略[7,8]已被应用于解决多个变量的优化问题, 而且对生物实验的数据量要求不高[9,10].
在本文的工作中, 我们专注于发酵条件中底物浓度的优化, 其中包括葡萄糖, 麦芽糖, 甘露醇, 玉米粉, 酵母提取物, 硫酸铜, 氯化钠, 硫酸亚铁和维生素B1这九种底物的浓度. 本文通过将粒子群算法(PSO)和人工神经网络(ANN)算法相结合得到一个智能混合模型, 该模型具有智能学习能力, 可以克服大规模生物实验的局限性. 通过模拟, 获得了桑黄液体发酵的最佳培养条件, 黄酮的产量增加至1896.4 μg/mL.
1 桑黄液体发酵环境模型改进目前, 针对桑黄液体发酵底物浓度优化的方法主要有两种: 正交实验法和响应面法.
正交实验法就是利用排列整齐的表-正交表来对实验进行整体设计、综合比较、统计分析, 实现通过少数的实验次数找到较好的生产条件, 以达到最高生产工艺效果[11,12], 这种试验设计法是从大量的试验点中挑选适量的具有代表性的点, 利用已经造好的表格-正交表来安排实验并进行数据分析的方法. 正交实验法需要进行大量的单因素实验, 即只改变一种因素变量值, 其他因素的变量值保持不变, 找出每个因素中最佳的取值, 遍历所有的因素, 将每个因素最好的取值进行组合, 通过实验找出最佳的培养条件[13,14]. 正交实验法的操作步骤决定了它本身存在了局限性, 一方面, 生物实验是非常复杂和耗费时间的, 正交实验法需要进行大量的单因素实验作为支撑, 而进行的单因素实验也无法囊括所有可能的实验取值, 另一方面, 本方法缺少具体的模型, 只能通过条件的组合与真实的实验确定最优的培养方案, 这存在巨大的风险性, 因为不同的因素之间是相互影响的, 两个较好的因素值组合真实情况下可能会相互影响导致产量下降, 而正交实验法忽略了这个方面的影响.
响应面分析法, 即响应曲面设计方法(Response Surface Methodology, RSM), 是利用合理的试验设计方法并通过实验得到一定数据, 采用多元二次回归方程来拟合因素与响应值之间的函数关系, 通过对回归方程的分析来寻求最优工艺参数, 解决多变量问题的一种统计方法[15–17]. 响应面分析法相比于正交实验法, 多了一个多元二次回归方程建模的步骤, 建模最常用和最有效的方法之一就是多元线性回归方法, 对于非线性体系可作适当处理化为线性形式. 在这里, 响应面分析法将指标与因素之间的关系默认为是线性关系, 通过建立多元回归方程结合数学方法求解最大(或最小)值后默认为最优值, 这忽略了指标与因素之间的实际关系[18,19], 所建立的模型很难符合真实的关系, 这导致所求解的最优值缺乏足够的理论支撑, 因为这个求值本身就建立在一个无法符合真实状况的模型之上.
1.1 BP神经网络模型建模Rumelhart[20]提出的反向传播(BP)神经网络是一种前置的多路传播网络, 具有输入层, 中间层(隐层)和输出层三层. 该模型现在是在实践中应用最广泛的神经网络模型之一, 来自输入层的每个神经元与隐藏层中每个神经元是连接关系, 而隐藏层中的每个神经元都与输出层的神经元也是全连接关系. 同一层中每对神经元之间没有连接[21]. BP网络可用于学习和存储输入和输出之间的关系, 在学习过程中, 通过反向传播算法不断更新网络的权重和阈值, 以获得实际输出和模型输出最小的平方误差和[22]. 当一对学习样本被输入到网络中时, 神经元激活函数被从输出层调节到输入层, 以实现在输出层神经元中获得输入响应. 随着训练数据的输入, 网络模型的正确率随着反馈过程的进行不断提高, 得到一个最能反映真实关系的网络模型.
桑黄的液体发酵实验是很复杂的, 不同的实验条件可以相互影响, 整个实验过程中各种产物的化学变化过程在生物领域还没有一个清晰的认知, 现在生物实验只能实现对发酵之后发酵罐中各种底物浓度的测量, 现在可以将整个桑黄液体发酵实验过程看做是一个未知的非线性的复杂模型. BP神经网络模型的建立和训练并不需要了解桑黄液体发酵过程的本质原理, 只需要提供具体的输入和输出数据, 利用反馈调节算法得到一个最贴近训练数据的预测模型, 模型本身就是复杂的非线性模型, 所以可以确定BP网络模型可以作为黄酮产量的预测模型.
BP神经网络模型在本文中是拟合发酵条件和黄酮产量关系的的数学模型, 所建立的BP神经网络模型具体如下:
(1) 输入层有9个神经元, 用于输入发酵条件的9个相关因素的值: 葡萄糖, 麦芽糖, 甘露醇, 玉米粉, 酵母, 硫酸铜, 硫酸亚铁, 氯化钠和维生素B1.
(2) 隐藏层具有11个神经元. 隐藏层神经元的数量分别实验了3到13之间的整数, 最后决定为11, 因为当隐藏层神经元数为11时, 模型输出值和实际值之间的均方误差最小.
(3) 使用一个神经元的输出层来输出黄酮的产量.
输入和输出值的范围通过下面的公式被归一化到[–1, 1]之间:
$U{\rm{ = }}\left( {{\rm{x}} - {x_{\min }}} \right){\rm{/}}\left( {{x_{\max }} - {x_{\min }}} \right)$ | (1) |
其中, xmax是训练数据集中相同类别数据中的最大值, xmin是训练数据集中相同类别数据中的最小值, x是训练数据集中的真实值, U是归一化之后网络的实际输入或输出值, BP神经网络的前向运算公式如下:
${I_j} = \sum\limits_i {{w_{ij}}} {x_i} + {b_j}$ | (2) |
${X_j} = f\left( {{I_j}} \right)$ | (3) |
其中, xi是输入值, wij是权值, bj是偏倚, f(x)是激活函数, xj是节点输出值.
BP神经网络模型的拓扑结构如图1所示.
Levenberg-Marquardt算法和共轭梯度算法是本文中BP网络模型的训练算法. 这种训练策略将会使用目标函数的一阶导数的信息和目标函数的二阶导数的信息, 其描述如下:
${X^{k + 1}} = {X^k} + {\alpha ^k}S\left( {{X^k}} \right)$ | (4) |
其中是网络模型中所有权值和阈值组成的向量, S(Xk)是由X的每个分量构成的向量空间的搜索方向, αk是在f(Xk+1)上的最小步长.
2 粒子群算法优化发酵条件
粒子群算法可以设定多组可能的初始值, 通过在一定范围内不断迭代优化, 每一次迭代都可以得到不同的条件组合, 直到得到一个最大(或最小)的适应度函数值, 同时输出相对应的输入值. 桑黄液体发酵的环境优化需要尝试不同的条件组合, 通过实验确定最好的一组实验条件, 但是在实际操作中由于实验周期和实验代价等因素的制约, 是无法穷举所有的实验组合条件的, 粒子群算法可以有效的解决这个问题.
PSO算法属于进化算法的一种, 它从随机解出发, 通过迭代寻找最优解, 并且通过适应度来评价解的品质, 通过追随当前搜索到的最优值来寻找全局最优[23–25]. PSO算法的计算与公式如下:
$X_i^{\left( {k + 1} \right)} = X_i^{\left( k \right)} + V_i^{\left( {k + 1} \right)}$ | (5) |
$\begin{aligned} V_i^{\left( {k + 1} \right)} = & wV_i^{\left( k \right)} + {c_1}{r_1}\left( {{P_i} - X_i^{\left( k \right)}} \right) + {c_2}{r_2}\left( {{P_g} - X_i^{\left( k \right)}} \right)\end{aligned} $ | (6) |
式中, i=1,2,…,m; 学习因子c1和c2是非负常数; r1和r2是介于0–1之间的随机数; w为惯性常数; k为迭代次数; xi为第i个粒子的位置向量, vi为速度向量.
为了寻找最好的发酵条件, 我们结合粒子群算法和BP神经网络模型设计了如算法1.
算法1. BP神经网络结合粒子群算法
1) 编码初始种群中个体结构; 因为有9个变量作为优化条件, 所以确定每个变量有9个属性. 编码葡萄糖, 麦芽糖, 甘露醇, 玉米粉, 酵母, 硫酸铜, 氯化钠, 硫酸亚铁, 维生素B1为g1, g2, g3, g4, g5, g6, g7, g8, g9, 其中g1∈[0, 40], g2∈[0, 40], g3∈[0, 40], g4∈[0, 100], g5∈[0, 100], g6∈[0, 0.5], g7∈[0, 10], g8∈[0, 0.5], g9∈[0, 0.1], 使用的单位是g/L; 初始化m个粒子的位置并利用公式(1)将其归一化, 初始化速度, 设定学习因子, 惯性权重的最大及最小值, 最大迭代次数及目标误差值, 并置此时的迭代次数为1.
2) 计算目标适应度值. 对于每个粒子, 利用BP神经网络的前向计算公式, 公式(2)和公式(3)计算网络的实际输出作为其适应度值, 排序取出最大的适应度值fitness_max.
3) 粒子位置和速度更新. 利用公式(5)和公式(6)更新每一个粒子的速度和位置, 并以一定概率重新初始化粒子.
4) 检验是否符合结束条件. 若当前的迭代次数达到了预先设定的最大次数(或达到最小误差要求), 则停止迭代, 输出最优解, 否则转到2).
在迭代分析中, 迭代次数分别被设置为100, 150, 200和500, 种群规模为300, 粒子大小为9, 葡萄糖, 麦芽糖, 甘露糖醇, 玉米浆粉, 酵母, 氯化钠, 硫酸亚铁, 硫酸铜和维生素B1染色体的编码策略是浮点(实)编码. 底物的浓度范围如下: 葡萄糖: 0–40 g/L, 麦芽糖: 0–40 g/L, 甘露醇: 0–40 g/L, 玉米浆粉: 0–100 g/L, 酵母: 0–100 g/L, 硫酸铜: 0–0.5 g/L, 钠氯化物: 0–10 g/L, 硫酸亚铁: 0–0.5 g/L, 维生素B1: 0–0.1 g/L.
在本文的方法中, 第1.1节建立的BP神经网络模型将作为粒子群算法的评价函数, 用来评估个体的好坏.
3 实验分析为了建立训练集, 一共进行了5000多组实验: 将桑黄菌株接种在PDA倾斜培养基上, 在28℃的温度下培养7天; 在500 mL烧瓶中加入200 mL PDA液体培养基, 保持温度在28℃, 离心机速度为150 rpm, 接种后培养7天; 250 mL摇瓶培养, 接种后7天, 种子液接种量为10%, 培养基容量为100 mL, 温度为28℃, 速度为150 rpm. 选取了上述实验中25组桑黄最佳生产数据作为训练集, 在表1中, 我们列举了10个实验数据.
在建立和训练BP神经网络模型时, 需要确定隐藏层神经元的数量和迭代次数, 再确定隐藏层节点数目时, 分别实验了3到13之间的整数结果如表2所示; 在确定迭代次数时, 选择300、800、1000和1500, 结果如表3所示.
观察表2可知, 隐藏层节点数为11时, 预测值与真实值的均方误差最小.
观察表3可知, 迭代次数为800时, 预测值与真实值的均方误差最小.
在利用PSO进行实验条件寻优的时候需要确定迭代次数, 我们选择了迭代次数为100、150、200和500进行对比实验, 结果如表4所示.
观察表4可知, PSO算法迭代次数为200时, 黄酮的可能产量值较高。
BP网络模型作为黄酮产量的预测模型, 通过表2和表3可以确定它能够较为准确地预测黄酮产量, PSO算法生成的粒子作为BP神经网络前向计算公式的输入值, 输出值即为预测的黄酮产量, 输出值越高则证明输入值为更好的液体发酵条件.
三个参数用于描述BP网络模型的精度和速度, 具体来说, 获得的目标误差(MSE)为0.018 999, 操作时间为3 s, 迭代次数为577次. 神经网络的收敛性质如图2所示.
如图2所示, 很容易发现总体趋势是收敛的,收敛速度较快, 当均方误差接近目标值的时候, 神经网络收敛会变缓慢, 最终收敛到最佳状态值. 模型的覆盖范围如图3所示, 由于PSO从某些随机选择的个体开始, 为了验证算法的可行性, 我们做了60组实验来验正和说明, 在表5中, 列出了10个桑黄发酵条件的优化值和黄酮的产量值, 其中, 达到最高产量时葡萄糖的浓度为40 g/mL; 麦芽糖的浓度为16.23 g/mL; 甘露醇的浓度为15.9 g/mL; 玉米浆粉的浓度为9.25 g/mL; 酵母的浓度为9.63 g/mL; 硫酸铜的浓度为0.5 g/mL; 氯化钠的浓度为6.21 g/mL; 硫酸亚铁的浓度为0.5 g/mL; 维生素B1的浓度为0.1 g/mL.
桑黄的平均产量为1866.97 μg/mL, 我们的方法具有智能学习能力(BP神经网络), 可以克服生物实验无法大规模进行的限制. 通过模拟仿真, 获得了最优的培养条件, 黄酮的产量从已知的1532.83 μg/mL[6]最好增加到1896.4 μg/mL.
4 结论与展望
在本文的工作中, 我们致力于优化桑黄液体发酵的底物浓度, 包括葡萄糖, 麦芽糖, 甘露糖醇, 玉米粉, 酵母提取物, 硫酸铜, 氯化钠, 硫酸亚铁和维生素B1的浓度. 针对这个问题, 我们提出了一种结合粒子群算法和BP神经网络模型的混合算法, 其中, 由25组实验数据训练所得的BP神经网络作为混合算法的适应度函数, 用于衡量黄酮的产量. 仿真结果表明, 我们的方法有能力克服限制大规模生物实验的局限性, 通过仿真实验, 我们获得了最优的桑黄液体发酵实验环境, 黄酮的产量提高至1896.4 μg/mL.
在我们的研究中, 使用了一种经典神经网络计算模型, BP神经网络模型. 另外, 我们是否可以引入其他的智能模型, 比如支持向量机作为新的训练模型; 关于优化算法, 我们可以考虑加入并行的运算方法, 相信能够有效的提高效率和准确率.
[1] |
张敏, 纪晓光, 贝祝春, 等. 桑黄多糖抗肿瘤作用. 中药药理与临床, 2006, 22(3–4): 56-58. |
[2] |
Zeng NK, Wang QY, Su MS. The breeding of Phellinus baumii by protoplast fusion. Journal of Chinese Medicinal Materials, 2008, 31(4): 475-478. |
[3] |
张翼. 两株海藻内生真菌次生代谢产物及其生物活性研究[博士学位论文]. 青岛: 中国科学院研究生院(海洋研究所), 2007.
|
[4] |
Zhu ZP, Li N, Wang JB, et al. Establishment and analysis of the fermentation model of Phellinus igniarius. AASRI Procedia, 2012, 1: 2-7. DOI:10.1016/j.aasri.2012.06.002 |
[5] |
Gu B, Sun XM, Sheng VS. Structural minimax probability machine. IEEE Transactions on Neural Networks and Learning Systems, 2016, 28(7): 1646-1656. |
[6] |
Zhu MS, Wang YN, Zhang GL, et al. Liquid fermentation conditions for production of mycelium of Phellinus linteus. China Brewing, 2010, 29(11): 88-91. |
[7] |
Gu B, Sheng VS, Tay KY, et al. Incremental support vector learning for ordinal regression. IEEE Transactions on Neural Networks and Learning Systems, 2015, 26(7): 1403-1416. DOI:10.1109/TNNLS.2014.2342533 |
[8] |
Gu B, Sheng VS, Wang ZJ, et al. Incremental learning for v-support vector regression. Neural Networks, 2015(67): 140-150. DOI:10.1016/j.neunet.2015.03.013 |
[9] |
Wen XZ, Shao L, Xue Y, et al. A rapid learning algorithm for vehicle classification. Information Sciences, 2015(295): 395-406. DOI:10.1016/j.ins.2014.10.040 |
[10] |
Xia ZH, Wang XH, Sun XM, et al. A secure and dynamic multi-keyword ranked search scheme over encrypted cloud data. IEEE Transactions on Parallel and Distributed Systems, 2016, 27(2): 340-352. DOI:10.1109/TPDS.2015.2401003 |
[11] |
臧勉, 王秀红, 周仕东. 利用正交实验法探究铁与水蒸气反应的最佳实验条件. 化学教育, 2015, 36(5): 71-73. |
[12] |
郝静, 贾仰文, 张永祥, 等. 应用正交试验法分析地下水流模型参数灵敏度. 人民黄河, 2015, 37(9): 66-68. |
[13] |
王秋萍, 马海霞, 吴竹, 等. 正交实验法优化艾纳香提取废渣中总黄酮提取工艺. 广东农业科学, 2015, 42(18): 93-97. DOI:10.3969/j.issn.1004-874X.2015.18.017 |
[14] |
牟会荣, 陈昆, 王晓岚, 等. 正交试验法与响应面法在桑叶黄酮提取工艺优化中的应用和比较. 江苏科技大学学报(自然科学版), 2016, 30(1): 88-93. |
[15] |
金林, 赵万顺, 郭巧生, 等. 响应面法优化白芍提取工艺的研究. 中国中药杂志, 2015, 40(15): 2988-2993. |
[16] |
李莉, 张赛, 何强, 等. 响应面法在试验设计与优化中的应用. 实验室研究与探索, 2015, 34(8): 41-45. |
[17] |
胡俊峰, 徐贵阳, 郝亚洲. 基于响应面法的微操作平台多目标优化. 光学精密工程, 2015, 23(4): 1096-1104. |
[18] |
施瑛, 裴斐, 周玲玉, 等. 响应面法优化复合酶法提取紫菜藻红蛋白工艺. 食品科学, 2015, 36(6): 51-57. DOI:10.7506/spkx1002-6630-201506010 |
[19] |
张梦甜, 杨文建, 裴斐, 等. 响应面法优化酶法制备杏鲍菇蛋白及其营养评价. 食品科学, 2015, 36(13): 125-130. DOI:10.7506/spkx1002-6630-201513024 |
[20] |
Rumelhart DE, Mcclelland JL, the PDP Research Group. Parallel Distributed Processing: Explorations in the Microstructures of Cognition. Volume 1: Foundations. London, England: The MIT Press, 1986: 282–317.
|
[21] |
Zhang LY, Tao BR. Ontology mapping based on Bayesian network. Journal of Donghua University (English Edition), 2015, 32(4): 681-687. |
[22] |
Zhang YD, Wu LN. Stock market prediction of S&P 500 via combination of improved BCO approach and BP neural network. Expert Systems with Applications, 2009, 36(5): 8849-8854. DOI:10.1016/j.eswa.2008.11.028 |
[23] |
张利彪, 周春光, 马铭, 等. 基于粒子群算法求解多目标优化问题. 计算机研究与发展, 2004, 41(7): 1286-1291. |
[24] |
李宁, 邹彤, 孙德宝. 车辆路径问题的粒子群算法研究. 系统工程学报, 2004, 19(6): 596-600. |
[25] |
张长胜, 孙吉贵, 欧阳丹彤. 一种自适应离散粒子群算法及其应用研究. 电子学报, 2009, 37(2): 299-304. |