2023, 32(4):1-15. DOI: 10.15888/j.cnki.csa.009038 CSTR:
摘要:在科技发达和信息爆炸的时代, 如何从海量数据中准确地提取所需信息已成为人们研究的目标. 问答系统作为解决此问题的重要途径之一, 其主要通过对已有数据信息进行检索和分析, 并最终返回问题答案或其他相关信息. 近年来, 深度学习的革命性发展给问答系统带来了长足的进步, 序列到序列的模型, 端到端的模型以及最近流行的预训练, 都给问答系统留下无限的发展空间, 但其仍面临许多挑战. 本文首先对问答系统的发展进行简要介绍, 接着将问答系统按照3个不同角度进行分类, 并对相关数据集、评测指标和各类问答系统的主流技术进行阐述, 最后对问答系统面临的问题和未来的发展趋势进行讨论.
2023, 32(4):16-41. DOI: 10.15888/j.cnki.csa.009037 CSTR:
摘要:复杂网络作为现今科学研究中的一个热点学科, 在过去20年里得到了巨大的发展. 现实中大量的复杂的交互系统, 比如互联网、交通运输网、神经网络等都可以抽象为复杂网络, 以进行系统的分析和研究. 进化算法作为优化工具应用于复杂网络的不同领域的各个任务中, 如网络社团结构的检测任务、网络动力学中的鲁棒性优化任务、网络传播中关键节点的搜寻任务等. 本文首先对复杂网络和进化算法相关的基础知识进行了全面的概述, 重点讨论了复杂网络中目标优化的研究进展, 针对不同任务对优化目标及其具体应用展开了详细介绍, 同时, 对算法的性能评价指标进行了概述. 此外, 本文通过一系列实验展示了单/多目标优化算法在复杂网络优化问题上的性能表现, 以及部分目标之间的相关性关系. 最后对复杂网络中优化问题未来的研究动向进行了展望, 为今后研究人员开展进化计算和复杂网络相结合的相关研究提供一些思路.
2023, 32(4):42-51. DOI: 10.15888/j.cnki.csa.009050 CSTR:
摘要:现有基于深度学习的哈希图像检索方法通常使用全连接作为哈希编码层, 并行输出每一位哈希编码, 这种方法将哈希编码都视为图像的信息编码, 忽略了编码过程中哈希码各个比特位之间的关联性与整段编码的冗余性, 导致网络编码性能受限. 因此, 本文基于编码校验的原理, 提出了串行哈希编码的深度哈希方法——串行哈希编码网络 (serial hashing network, SHNet). 与传统的哈希编码方法不同, SHNet将哈希编码网络层结构设计为串行方式, 在生成哈希码过程中对串行生成的前部分哈希编码进行校验, 从而充分利用编码的关联性与冗余性生成信息量更为丰富、更加紧凑、判别力更强的哈希码. 采用mAP作为检索性能评价标准, 将本文所提方法与目前主流哈希方法进行比较, 实验结果表明本文在不同哈希编码长度下的mAP值在3个数据集CIFAR-10、ImageNet、NUS-WIDE上都优于目前主流深度哈希算法, 证明了其有效性.
2023, 32(4):52-65. DOI: 10.15888/j.cnki.csa.009030 CSTR:
摘要:精准预测商品的销量是提高商品营销效率的前提和基础. 为了更好地预测商品销量, 现有研究人员提出了基于深度神经网络(DNNs)、卷积神经网络(CNNs)、时间序列分析等方法, 但这些方法大多只单方面考虑到商品销售过程中的时间或者空间特征. 同时基于商品销售数据的建模分析发现, 商品的销量和对应的零售商户的空间位置和销售时间有较大的相关性. 为了更加准确地预测某种商品, 在特定商店, 以及在特定时间的销量, 本研究首先构建了以商家为基础的大规模知识图谱系统, 通过一张图的数据模型, 描述商品销售和对应的商圈、商户、用户的相关交互场景. 同时在图模型上增加了商家数据的空间和数据特征, 用于描述商户的时空特性. 最后基于构建的商家知识图谱, 本研究提出了基于图卷积神经网络(GCN)聚合信息获取空间特征, 然后使用长短期记忆(LSTM)提取时间特征, 并将两种特征进行加权结合, 进行商品销量预测. 初步研究结果表明: 基于图和LSTM模型的混合模型的算法预测投放量最为贴近实际销量, 相比于传统的神经网络算法, 该模型预测的平均准确率为89%. 最后通过构建流水线工作流, 将整个商品销量智能预测系统部署到生产环境中, 为实现商品精准化营销提供了智能化决策.
2023, 32(4):66-76. DOI: 10.15888/j.cnki.csa.009026 CSTR:
摘要:为研究沥青路面抗滑性能影响因素, 精确预测路面抗滑性能, 本文使用Gocator 3110三维智能传感器采集沥青混合料试件表面纹理并使用摆式摩擦仪测试试件表面摩擦系数. 针对三维纹理点云数据中的异常数据, 提出基于径向基函数(RBF)的邻域插值算法进行数据质量提升. 根据修复后的三维纹理点云数据计算出具有代表性的10类宏观纹理特征参数, 并采用Pearson系数相关性分析法去除冗余因子, 改进模型的输入特征, 并构建基于改进灰狼优化算法(IGWO)与XGBoost融合的沥青路面抗滑性能预测模型, 预测沥青路面的摩擦系数. 结果表明, 提出模型的预测精度优于多元线性回归模型、支持向量机回归模型以及基于网格化搜索的XGBoost模型.
2023, 32(4):77-85. DOI: 10.15888/j.cnki.csa.009046 CSTR:
摘要:光交换网络数据传输时根据数据性质不同, 用户对时延要求也有所不同, 如何在保证光交换调度效率的同时满足差异化时延需求, 是决定网络性能的一个重要因素. 目前针对光网络调度的研究主要基于逐个时隙或基于分组进行调度. 前者没有考虑重配置开销的问题, 无法处理大规模数据交换, 后者忽略了不同延迟以及QoS保证的需要. 为了解决数据中心光交换数据时延需求不同的问题, 本文提出两种新的调度算法SDF (stringent delay first)和m-SDF (m-order stringent delay first), 将不同数据包的差异化时延需求、配置顺序、重配置开销和加速比作为考虑因素, 在流量调度时采用贪心策略, 每次选择对时延最为敏感的数据包进行优先调度以满足时延需求. 所提算法在保证投递率的前提下, 能最大程度满足更多数据包的传输时延. 仿真实验表明两个算法具有较高的时延满足率, 证明了调度算法的有效性.
2023, 32(4):86-93. DOI: 10.15888/j.cnki.csa.009002 CSTR:
摘要:容器虚拟化技术由于轻量级的特性逐渐在云计算中崭露头角. 容器热迁移是许多云管理能力的基础, 其在最短的宕机时间内, 将运行中的容器完整地迁移到另一个物理节点上继续运行. 性能是容器热迁移研究的重点, 但通过对现有容器热迁移系统的详细分析, 本文发现其中仍然存在着一些影响性能的问题, 包括转储并行度低、预拷贝策略不收敛以及根文件系统与运行状态迁移并行度低等. 针对这些问题, 本文分别提出和设计了资源感知的并行转储机制、基于后拷贝策略的运行状态迁移和基于多优先级的传输调度并行算法等优化策略和算法, 并基于Docker实现了一个高性能容器热迁移系统Dmigrate. 实验结果表明Dmigrate相比于目前最新的研究, 平均可有效减少17.05%的宕机时间, 总迁移时间平均减少24.33%.
2023, 32(4):94-103. DOI: 10.15888/j.cnki.csa.009012 CSTR:
摘要:广播式自动相关监视(ADS-B)是民航新一代空中交通管理系统的重要组成部分, 由于协议没有数据加密和认证, 导致容易受到数据攻击. 为了准确检测ADS-B数据攻击, 基于ADS-B数据的时序性, 提出了一种基于注意力机制的卷积神经网络-长短期记忆网络(convolutional neural networks-long short-term memory, CNN-LSTM)异常数据检测模型. 首先, 利用CNN提取ADS-B数据的特征, 然后以时序形式将特征向量输入到LSTM中, 最后使用注意力机制进行网络参数优化, 实现对ADS-B数据的预测, 通过计算预测误差, 来进行异常检测. 实验表明, 该模型能够很好地检测出模拟的4种类型的异常数据, 与其他机器学习方法相比, 具有更高的准确率和F1分数.
2023, 32(4):104-111. DOI: 10.15888/j.cnki.csa.009028 CSTR:
摘要:针对传统的胸部辅助诊断系统在胸部X光片疾病分类方面图像特征提取效果差、平均准确率低等问题, 提出了一个注意力机制和标签相关性结合的多层次分类网络. 网络的训练分为两个阶段, 在阶段1为了提高网络特征提取能力, 引入注意力机制并构建一个双分支特征提取网络, 实现综合特征的提取, 在阶段2考虑到多标签分类中标签之间相关性等问题, 利用图卷积神经网络对标签相关关系进行建模, 并与阶段1的特征提取结果进行结合, 以实现对胸部X光片疾病的多标签分类任务. 实验结果表明, 本方法在ChestX-ray14数据集上各类疾病的加权平均AUC达到0.827, 有助于辅助医生进行胸部疾病的诊断, 有一定的临床应用价值.
2023, 32(4):112-119. DOI: 10.15888/j.cnki.csa.009045 CSTR:
摘要:为了将水清洗机接入工业网络并实现智能自动化控制, 本文提出了一种基于统计过程控制(SPC)可重构程序的水清洗控制系统. 该系统根据水清洗设备的参数和组件特性构建了该设备的控制协议; 根据协议指令制定了指令判断模块; 根据SPC理论设计了过程控制模块. 控制协议让该系统的清洗程序具有重构和联网的功能; 指令判断模块为重构后的指令提供了安全性保障; 过程控制模块让该系统的清洗过程具备动态调整清洗组件的功能. 这些功能使得该设备可以实现智能自动化控制. 通过测试, 该系统比原有系统的清洗次数平均减少了15%, 水清洗液的使用率提升了约5%, 并扩展了3项功能, 提高了设备的利用率和智能化水平, 最终满足节能省水、多用途和联网的需求.
2023, 32(4):120-128. DOI: 10.15888/j.cnki.csa.009049 CSTR:
摘要:分布式拒绝攻击(distributed denial of service, DDoS)作为一种传统的网络攻击方式, 依旧对网络安全存在着较大的威胁. 本文研究基于高性能网络安全芯片SoC+IP的构建模式, 针对网络层DDoS攻击, 提出了一种从硬件层面实现的DDoS攻击识别方法. 根据硬件协议栈设计原理, 利用逻辑电路门处理网络数据包进行拆解分析, 随后对拆解后的信息进行攻击判定, 将认定为攻击的数据包信息记录在攻击池中, 等待主机随时读取. 并通过硬件逻辑电路实现了基于该方法的DDoS攻击识别IP核(intellectual property core), IP核采用AHB总线配置寄存器的方式进行控制. 在基于SV/UVM的仿真验证平台进行综合和功能性测试. 实验表明, IP核满足设计要求, 可实时进行DDoS攻击识别检测, 有效提高高性能网络安全芯片的安全防护功能.
2023, 32(4):129-140. DOI: 10.15888/j.cnki.csa.009023 CSTR:
摘要:在集群环境中部署微服务已经成为微服务部署的重要方式. 由于不同种类服务对于CPU、内存、磁盘等资源的需求不同, 导致集群中的节点产生资源碎片、出现资源消耗倾斜. 如何提高集群资源利用率、降低集群能耗, 成为继保障服务级别协议(service level agreement, SLA)之后的重大挑战. 本文以阿里巴巴集团2021年发布的近两万个微服务的详细跟踪为数据样本, 从容器资源使用情况、节点部署特征和资源消耗偏好等多个维度出发, 分析其集群资源消耗特征, 发现集群中出现了资源消耗倾斜的情况. 通过进一步分析节点中容器部署情况发现容器资源分配不合理加剧了这一现象. 基于此我们提出了一种使用深度双Q网络的模型, 依据上游服务资源需求的实时变化, 对容器资源分配进行优化. 对比实验结果表明该方法可以在保证服务SLA的情况下有效提高容器资源利用率, 改善节点资源消耗倾斜的情况.
2023, 32(4):141-148. DOI: 10.15888/j.cnki.csa.009010 CSTR:
摘要:医学图像对疾病的诊断、治疗和评估均有所帮助, 准确分割医学图像中的器官对于辅助医生的诊断具有重要的实际意义. 由于医学图像中各器官部位与周围组织的图像对比度低, 不同器官的边缘和形状也会存在很大差异, 从而增加了分割的难度. 针对这些问题, 本文提出了一种基于卷积神经网络和Transformer的医学图像语义分割网络, 有效提高了医学图像语义分割的精度. 特征提取部分使用ResNet-50网络结构, 在特征提取后使用Transformer模块来扩大感受野. 在上采样过程中加入多个跳跃连接层, 充分利用各阶段的特征提取信息, 来恢复至与输入图像相近的分辨率. 在胃肠道医学图像分割数据集上的实验结果证明本文的方法可以有效分割医学图像中的器官组织, 提升分割准确率.
2023, 32(4):149-160. DOI: 10.15888/j.cnki.csa.009048 CSTR:
摘要:针对交通目标检测模型参数量大、检测精度低、检测速度慢、泛化性差等问题, 提出一种基于GhostNet与注意力机制的YOLOv5交通目标实时检测模型. 采用基于遗传算法的K-means聚类方法获取适用于车辆检测的最佳预选框; 采用轻量的Ghost卷积提取目标特征, 并构建基于CSP结构的C3Ghost模块, 大幅度压缩模型参数量, 降低计算成本, 提高计算速度; 在特征融合层添加Transformer block和CBAM注意力模块, 来探索模型特征提取潜力以及为模型在密集对象的场景中寻找注意力区域; UA-DETRAC数据集上的消融实验和综合性能评价结果表明所提模型平均精度达到98.68%, 参数量为47 M, 检测速度为65 FPS, 与YOLOv5相比, 参数量压缩了34%, 速度提升43%, 平均精度提高了1.05%.
2023, 32(4):161-169. DOI: 10.15888/j.cnki.csa.009051 CSTR:
摘要:布匹瑕疵检测是纺织业质量管理的重要环节. 在嵌入式设备上实现准确、快速的布匹瑕疵检测能有效降低成本, 因而价值巨大. 考虑到实际生产中花色布匹瑕疵具有背景复杂、数量差异大、极端长宽比和小瑕疵占比高等结构特性, 提出一种基于轻量级模型的花色布匹瑕疵检测方法并将其部署在嵌入式设备Raspberry Pi 4B上. 首先在一阶段目标检测网络YOLO的基础上用轻量级特征提取网络ShuffleNetV2提取花色布匹瑕疵的特征, 以减少网络结构复杂度及参数量, 提升检测速度; 其次是检测头的解耦合, 将分类与定位任务分离, 以提升模型收敛速度; 此外引入CIoU作为瑕疵位置回归损失函数, 提高瑕疵定位准确性. 实验结果表明, 本文算法在Raspberry Pi 4B上可达8.6 FPS的检测速度, 可满足纺织工业应用需求.
2023, 32(4):170-176. DOI: 10.15888/j.cnki.csa.009058 CSTR:
摘要:近年来, 国家越来越重视林业的发展, 而林业病害防治问题始终是林业发展过程中的一项重点工作. 针对传统林业病害识别方法存在数据需求量大、模型易过拟合、部分病害类别采样困难, 缺乏标准公开数据集等问题, 提出了一种基于小样本学习的林业病害识别模型(DML-MB模型), 实现了对于林业病害任务的识别. 首先, 利用从林业局获取的林业病害数据, 整理并建立了7类, 共210张林业病害图像数据集. 其次, 模型在训练分类器的过程中引入深度相互学习(DML)策略, 让不同网络在训练时不断分享学习经验, 提升了深度神经网络的性能. 最后, 删除分类器中的全连接层获得特征提取器并迁移到DML-MB模型的元学习网络中进行训练. 实验结果表明, DML-MB模型在林业病害数据集上的1-shot和5-shot的测试精度分别为61.38%和73.56%, 相较于主流的小样本模型, 精度最高提升了2.78%和4.52%.
2023, 32(4):177-186. DOI: 10.15888/j.cnki.csa.009033 CSTR:
摘要:近端策略优化(proximal policy optimization, PPO)是一种稳定的深度强化学习算法, 该算法的关键点之一是使用裁切后的代理目标限制更新步长. 实验发现当使用经验最优的裁切系数时, KL散度 (Kullback-Leibler divergence)无法被确立上界, 这有悖于置信域优化理论. 本文提出一种改进的双裁切近端策略优化算法(proximal policy optimization with double clipping boundaries, PPO-DC). 该算法通过基于概率的两段裁切边界调整KL散度, 将参数限制在置信域内, 以保证样本数据得到充分利用. 在多个连续控制任务中, PPO-DC算法取得了好于其他算法的性能.
2023, 32(4):187-196. DOI: 10.15888/j.cnki.csa.009034 CSTR:
摘要:Kubernetes是一个管理容器化应用的开源平台, 其默认的调度算法在优选阶段仅把CPU和内存两种资源来作为计算节点的评分指标, 同时还忽略了不同类型的Pod对节点资源的占用比例是不同的, 容易导致某一资源达到性能瓶颈, 从而造成节点对资源使用失衡. 针对上述问题, 本文在Kubernetes原有的资源指标基础上增加了带宽和磁盘容量, 考虑到CPU、内存、带宽和磁盘容量这4类资源在节点上的占用比例对节点的性能的影响, 可能造成Pod中应用的非正常运行, 甚至杀死Pod, 从而影响集群整体的高可靠性. 本文将等待创建的Pod区分为可压缩消耗型、不可压缩消耗型以及均衡型, 并为每种类型的Pod设置相应的权重, 最后通过改进的秃鹰搜索算法(TBESK)来寻找出最优节点进行调度. 实验结果表明, 随着集群中Pod的数量在不断增加, 在集群负载较大的情况下, TBESK算法的综合负载标准差和默认的调度算法相比提升了24%.
2023, 32(4):197-205. DOI: 10.15888/j.cnki.csa.009067 CSTR:
摘要:在安防领域, 疲劳是导致安防工作人员注意力下降, 诱发各类问题的重要原因. 现有的疲劳检测方法存在各种问题, 比如生理指标检测侵入性强且价格昂贵, 人脸疲劳检测结果受个体差异和头部姿态的影响以及疲劳预警时长较短等, 因此本文提出一种基于自适应阈值和面部多特征经验融合的疲劳早后期检测算法, 使用轻量级的SCRFD模型进行人脸检测, 使用MobileNetV2模型进行人脸关键点定位, 使用梯度提升树学习头部姿态信息与眼睛纵横比(EAR)阈值的映射关系, 通过眼睑闭合时间百分比(PERCLOS)、嘴巴张开时间百分比(FOM)和头部姿态6个自由度分别实现眨眼、哈欠、点头前后倾动作的识别. 在疲劳估计阶段, 为了将多种疲劳行为融合映射成与疲劳相关的KSS值, 先根据专家经验预先构建好多种人脸行为的疲劳因果图, 接着使用自定义的singleton, mutual和activate/inhibit特征算子, 结合因果图从人脸行为检测序列中计算疲劳早期和疲劳后期KSS值, 最后使用双尺度KNN实现疲劳早后期估计. 实验结果表明所提算法在YawDD数据集上哈欠检测准确率达到93.81%, 在UTA-RLDD和Drozy数据集上疲劳识别准确率分别达到67.72%, 87.88%, 仅通过CPU, 推理实时性可达到17.96每秒传输帧数(FPS).
2023, 32(4):206-213. DOI: 10.15888/j.cnki.csa.009041 CSTR:
摘要:近年, 情绪识别研究已经不再局限于面部和语音识别, 基于脑电等生理信号的情绪识别日趋火热. 但由于特征信息提取不完整或者分类模型不适应等问题, 使得情绪识别分类效果不佳. 基于此, 本文提出一种微分熵(DE)、卷积神经网络(CNN)和门控循环单元(GRU)结合的混合模型(DE-CNN-GRU)进行基于脑电的情绪识别研究. 将预处理后的脑电信号分成5个频带, 分别提取它们的DE特征作为初步特征, 输入到CNN-GRU模型中进行深度特征提取, 并结合Softmax进行分类. 在SEED数据集上进行验证, 该混合模型得到的平均准确率比单独使用CNN或GRU算法的平均准确率分别高出5.57%与13.82%.
2023, 32(4):214-222. DOI: 10.15888/j.cnki.csa.009016 CSTR:
摘要:基于图神经网络的推荐算法通过从图中获取知识生成节点的特征表示, 提高了推荐结果的可解释性. 然而, 随着推荐系统原始数据规模的不断扩大, 大量包含语义信息的文本数据没有得到有效利用. 同时图神经网络在融合图中邻居信息时没有区分关键节点, 使得模型难以学习到高质量的实体特征, 进而导致推荐质量下降. 本文将图神经网络与语义模型相结合, 提出一种融合语义信息与注意力的图神经网络推荐算法. 该算法基于SpanBERT语义模型处理实体相关的文本信息, 生成包含语义信息的特征嵌入, 并将注意力机制引入到基于用户社交关系以及用户-项目交互的影响传播融合过程中, 从而实现用户和项目两类实体特征的有效更新. 在公开数据集上的对比实验结果表明, 本文所提出的方法较现有基准方法在各项指标上均有所提升.
2023, 32(4):223-230. DOI: 10.15888/j.cnki.csa.009042 CSTR:
摘要:为了进一步提高空气质量指数预测精度, 提出一种混合遗传蚁群算法优化BP神经网络的方式对空气质量指数进行预测. 首先初始化蚁群算法的信息素分布, 对不满足适应度条件的进行遗传算法的交叉、变异操作, 进而计算蚁群的状态转移概率和信息素浓度, 当适应度值满足条件要求时, 将寻优结果作为BP神经网络的最优权值和阈值, 来改善单一BP神经网络的不足. 最后通过运用西安市的空气质量指数日历史数据进行验证, 实验表明, 本文所提模型的各个评价指标相对其他对比模型误差更小, 在预测精度方面具有更高的说服力, 因此能够有效地预测空气质量指数.
2023, 32(4):231-240. DOI: 10.15888/j.cnki.csa.009060 CSTR:
摘要:为实现垃圾分选自动化, 确保垃圾正确分类, 提出了一种基于YOLOv4的轻量级垃圾检测算法. 算法对YOLOv4中的主干网络CSPDarknet53, 使用层级调整后的MobileNetV3网络进行替换, 使得网络架构更适用于YOLOv4网络, 并提升网络的检测速度; 同时结合Ghost模块和MobileNeXt网络结构思想, 设计了一种全新的bottleneck, 用以替换主干网络中的bottleneck, 以提升模型的检测精度; 接着在主干网络中添加大残差边结构, 以提升网络的检测精度; 然后在颈部网络之前添加CA (coordinate attention)注意力机制, 进一步提升网络的检测精度; 最后为避免K-means算法在聚类过程中陷入局部极值, 使用二分K-means算法对垃圾检测数据集进行anchor box的重新聚类. 实验结果表明, 重新设计的网络与YOLOv4网络的mAP值相近, 但参数量减少了89%, 检测速度提升了51%, FPS值达到了67.5 (on NVIDIA GeForce RTX 3060), 可实现部署到算力和内存较低的嵌入式设备中.
2023, 32(4):241-247. DOI: 10.15888/j.cnki.csa.009031 CSTR:
摘要:深度学习是目前路面图像裂缝检测的主流方法, 但是需要大量人工标注的真值图进行训练, 而现实中获取人工标注的真值图既费时又费力, 本文提出一种基于改进的生成对抗网络的路面图像裂缝检测方法, 将路面图像裂缝检测问题视为一类基于图像跨域转换的异常检测问题, 采用定点生成对抗网络将裂缝图像无监督自动转换为与之一一对应的无裂缝图像, 进而将原图像与生成图像进行差分, 差分图中的显著目标对应裂缝检测结果. 在公开数据集CrackIT上的测试结果表明, 本文方法在不依赖于人工标注的真值图条件下能够实现裂缝的精准检测, 本文方法在准确率、召回率、F1分数上取得了与有监督深度学习方法相当的性能.
2023, 32(4):248-254. DOI: 10.15888/j.cnki.csa.009075 CSTR:
摘要:螺帽缺失、螺栓缺失是角钢塔建设阶段常见的结构缺陷, 但由于特征区分度低现有目标检测算法对螺栓缺陷检出率较低. 针对这个问题, 首先基于Transformer对卷积特征进行特征编码提出了全局信息提取算子, 其次通过通道注意力机制自适应组合候选检测框多尺度缩放后引入的局部背景信息, 最后基于图像分割与背景融合对螺栓缺陷样本进行数据扩增. 消融实验表明上述策略均能有效提升螺栓缺陷检测效果且相互不排斥, 与其他典型算法对比验证了本文算法的先进性.
2023, 32(4):255-261. DOI: 10.15888/j.cnki.csa.009044 CSTR:
摘要:针对污水处理过程中化学需氧量(chemical oxygen demand, COD)难以在线测量的问题, 提出了一种基于径向基函数(radial basis function, RBF)神经网络的软测量模型. 首先, 用污水处理厂实测数据挑选出与COD相关的过程变量作为输入变量; 其次, 基于RBF神经网络建立出水COD软测量模型, 利用自适应遗传算法改进的麻雀搜索算法(adaptive genetic algorithm improved sparrow search algorithm, AGAISSA)优化RBF神经网络的中心值、宽度值以及权值, 通过改进麻雀位置更新公式以及引入遗传算法中的自适应交叉和变异操作保证了软测量模型的精度; 最后, 将RBF神经网络的软测量模型应用于污水处理厂实测数据加以验证, 结果表明: AGAISSA优化RBF神经网络模型能够对出水COD进行准确的预测, 具有较高的预测精度.
2023, 32(4):262-267. DOI: 10.15888/j.cnki.csa.009013 CSTR:
摘要:随着智慧物联体系的发展, 物联网中应用程序的种类与数量不断增加. 在移动边缘计算(mobile edge computing, MEC)中, 通过允许移动用户将任务卸载至附近MEC服务器以加快移动应用程序的速度. 本文通过考虑不同任务属性、用户的移动性和时间延迟约束模拟移动边缘场景. 根据用户移动轨迹, 将目标建模为寻找满足时延约束条件且在卸载过程中产生最小能耗MEC服务器优化模型, 并提出一种最小能耗卸载算法求解该问题的最优解. 仿真结果表明, 在约束条件下, 提出的算法可以找到在用户移动轨迹中产生最小能耗的MEC服务器, 并显著降低任务卸载过程的能耗与时延, 提高应用程序服务质量.
2023, 32(4):268-273. DOI: 10.15888/j.cnki.csa.009035 CSTR:
摘要:针对行人重识别研究中的遮挡问题, 本文提出了一种姿态驱动的局部特征对齐的行人重识别方法. 网络主要包括姿态编码器和行人部件对齐模块. 其中, 姿态编码器通过重构姿态估计热力图抑制遮挡区域骨骼关键点置信度, 引导网络提取行人可见部位的特征. 行人部件对齐模块依据姿态编码器输出的关键点置信图, 提取行人局部特征进行特征对齐, 降低非行人特征的干扰. 在遮挡、半身数据集上的仿真实验表明, 该方法获得了优于其他对比网络的结果.
2023, 32(4):274-282. DOI: 10.15888/j.cnki.csa.009017 CSTR:
摘要:为解决火焰图像识别在边缘设备, 移动端设备环境下模型体积大, 准确率低, 实时性能差的问题. 首先选取ShuffleNetV2作为轻量化主干神经网络, 保证模型的实时性; 其次, 设计了一种新的注意力模块SCDAM (space and channel dual attention module)去同时考虑通道和空间的关联性, 针对不同特征的重要程度去赋予不同权重并有效提高模型精度; 然后, 设计了一种多尺度特征融合模块, 使提取到的特征在空间尺度上更加丰富, 加强网络对不同尺度的适应性; 最后将SCDAM模块以及多尺度模块引入到ShuffleNetV2中并利用迁移学习方式优化模型参数, 进一步提高模型精度. 在参数量和计算量仅有微量增加的情况下, 本算法的精度比ShuffleNetV2提升了3.2%, 且单次推理速度仅耗时8.7 ms. 实验证明, 该算法更加适合应用在计算资源有限情况下, 如火药火焰的识别与监控.
2023, 32(4):283-292. DOI: 10.15888/j.cnki.csa.009059 CSTR:
摘要:本文提出一个新的无监督图像翻译模型, 该模型结合了生成对抗网络和多角度注意力, 称为MAGAN. 多角度注意力引导翻译模型将注意力集中在不同域间最具有判别性的区域. 与现存的注意力方法不同的是, 空间激活映射一方面捕获通道间的依赖, 减少翻译图像的特征扭曲; 另一方面决定网络对最具判别性区域的空间位置的关注程度, 使翻译的图像更具有目标域风格. 在空间激活映射的基础上, 结合类激活映射, 可以获得图像的全局语义信息. 此外, 根据空间激活程度对图像特征信息的影响, 设计不同的注意力结构分别训练生成器和判别器. 实验结果表明, 本文模型在selfie2anime、cat2dog、horse2zebra和vangogh2photo这4个数据集上的KID分数分别达到9.48、6.32、6.42和4.28, 性能优于大部分主流模型, 并且与基线模型UGATIT相比, 在selfie2anime、cat2dog和horse2zebra这3个数据集上的距离值分别减少了2.13、0.75和0.64, 具有明显的性能优势.
2023, 32(4):293-299. DOI: 10.15888/j.cnki.csa.009015 CSTR:
摘要:兵棋推演与智能算法融合成为当前军事应用领域的研究热点, 利用深度强化学习技术实现仿真推演中决策过程的智能化, 可显著减少人为经验对决策过程的影响, 提高推演效率和灵活性. 现有基于DRL算法的决策模型, 其训练时间过长, 算力开销过大, 无法满足作战任务的实时性需求. 本文提出一种基于轻量级深度确定性策略梯度(BN-DDPG)算法的智能推演方法, 根据推演规则, 采用马尔可夫决策过程描述推演过程中的决策行为, 以actor-critic体系为基础, 构建智能体训练网络, 其中actor网络使用自定义混合二进制神经网络, 减少计算量; 同时根据经验样本的状态和回报值建立双缓冲池结构, 采用环境相似度优先提取的方法对样本进行采样, 提高训练效率; 最后基于自主研制的仿真推演平台进行实例验证. 结果表明, BN-DDPG算法可简化模型训练过程, 加快模型收敛速度, 显著提高推演决策的准确性.
2023, 32(4):300-307. DOI: 10.15888/j.cnki.csa.009043 CSTR:
摘要:语音文本自动对齐技术广泛应用于语音识别与合成、内容制作等领域, 其主要目的是将语音和相应的参考文本在语句、单词、音素等级别的单元进行对齐, 并获得语音与参考文本之间的时间对位信息. 最新的先进对齐方法大多基于语音识别, 一方面, 准确率受限于语音识别效果, 识别字错误率高时文语对齐精度明显下降, 识别字错误率对对齐精度影响较大; 另一方面, 这种对齐方法不能有效处理不完全匹配的长篇幅语音和文本的对齐. 该文提出一种基于锚点和韵律信息的文语对齐方法, 通过基于边界锚点加权的片段标注将语料划分为对齐段和未对齐段, 针对未对齐段使用双门限端点检测方法提取韵律信息, 并检测语句边界, 降低了基于语音识别的对齐方法对语音识别效果的依赖程度. 实验结果表明, 与目前先进的基于语音识别的文语对齐方法比较, 即使在识别字错误率为0.52时, 该文所提方法的对齐准确率仍能提升45%以上; 在音频文本不匹配程度为0.5时, 该文所提方法能提高3%.
2023, 32(4):308-316. DOI: 10.15888/j.cnki.csa.009076 CSTR:
摘要:准确的通行时间分布预测可以全面地反映高速公路路网中各个路段在未来的通行状况, 辅助实现高速公路中的路径规划, 事故事件预警等精细化管理目标. 为此, 本文提出一种面向高速公路通行时间分布预测的时空混合密度神经网络. 具体地, 本文利用自适应图卷积通过数据驱动的方式提取路网中的空间特征, 有效解决了基于预定义图难以捕获路网信息中完整空间相关性的问题. 在时间维度上, 不同时间的路网信息存在显著的相关性, 因此, 本文基于注意力机制自适应建模路网信息的时间相关性, 并通过卷积层进一步聚合相邻时间步之间的信息. 最后, 基于自适应时空相关性建模得到的路段嵌入表示, 通过混合密度网络建模通行时间的分布, 以实现高速公路中各个路段的通行时间分布预测.
2023, 32(4):317-328. DOI: 10.15888/j.cnki.csa.009027 CSTR:
摘要:视频显著性目标检测需要同时结合空间信息和时间信息, 连续地定位视频序列中与运动相关的显著性目标, 其核心问题在于如何高效地刻画运动目标的时空特征. 现有的视频显著性目标检测算法大多使用光流, ConvLSTM以及3D卷积等提取时域特征, 缺乏对时间信息的连续学习能力. 为此, 设计了一种鲁棒的时空渐进式学习网络(spatial-temporal progressive learning network, STPLNet), 以完成对视频序列中显著性目标的高效定位. 在空间域中使用一种U型结构对各视频帧进行编码解码, 在时间域中通过学习视频序列中帧间运动目标的主体部分和形变区域特征, 渐进地对运动目标特征进行编码, 能够捕捉到目标的时间相关性特征和运动趋向性. 在4个公开数据集上与13个主流的视频显著性目标检测算法进行一系列对比实验, 所提出的模型在多个指标(maxF, S-measure (S), MAE)上达到了最优结果, 同时在运行速度上具有较好的实时性.
2023, 32(4):329-338. DOI: 10.15888/j.cnki.csa.009022 CSTR:
摘要:针对可见光模态与热红外模态间的差异问题和如何充分利用多模态信息进行行人检测, 本文提出了一种基于YOLO的多模态特征差分注意融合行人检测方法. 该方法首先利用YOLOv3深度神经网络的特征提取主干分别提取多模态特征; 其次在对应多模态特征层之间嵌入模态特征差分注意模块充分挖掘模态间的差异信息, 并经过注意机制强化差异特征表示进而改善特征融合质量, 再将差异信息分别反馈到多模态特征提取主干中, 提升网络对多模态互补信息的学习融合能力; 然后对多模态特征进行分层融合得到融合后的多尺度特征; 最后在多尺度特征层上进行目标检测, 预测行人目标的概率和位置. 在KAIST和LLVIP公开多模态行人检测据集上的实验结果表明, 提出的多模态行人检测方法能有效解决模态间的差异问题, 实现多模态信息的充分利用, 具有较高的检测精度和速度, 具有实际应用价值.
2023, 32(4):339-346. DOI: 10.15888/j.cnki.csa.009039 CSTR:
摘要:综合考虑混合式学习成绩分类预测中数据存在不平衡性和稀疏性的特点, 提出了一种SMOTE-XGBoost-FM混合式学习成绩分类预测模型. 首先通过SMOTE采样均衡数据集; 针对数据稀疏性问题, 使用XGBoost对采样后的数据进行特征交叉, 然后对所生成树的叶子节点进行独热编码, 以生成高阶特征数据, 最后将其输入因子分解机(FM)进行迭代训练以获最优模型. 实验结果表明, SMOTE-XGBoost-FM模型在混合式学习成绩分类预测中准确率达到了92.7%, 相较于单一的XGBoost、FM模型分别提升了5.7%和11.7%, 能有效对学生学习情况进行分类预测, 为提高教学效果提供参考.
2023, 32(4):347-353. DOI: 10.15888/j.cnki.csa.009011 CSTR:
摘要:为了解决网络应用身份认证问题, OAuth2.0协议在实际生产环境中得到了非常广泛的应用. 但很多系统在设计时不合理使用OAuth2.0标准、产生很多安全漏洞. 分析了近年来关于OAuth2.0协议出现的安全问题, 包括中间人攻击, 授权劫持漏洞和CSRF漏洞, 针对这些安全问题提出了一种基于口令的Schnorr数字签名和OAuth2.0的强身份认证方案. 最后对该方案进行安全性分析, 结果表明该方案具有良好的安全性且易于使用.
2023, 32(4):354-360. DOI: 10.15888/j.cnki.csa.009040 CSTR:
摘要:车辆轨迹预测能够有效降低车辆轨迹突变造成的碰撞风险, 是实现安全驾驶的关键技术之一. 针对传统轨迹预测算法缺乏对驾驶员意图分析的问题, 本文提出了一种融合生成对抗网络和驾驶意图识别的车辆轨迹预测模型. 该模型基于生成对抗网络框架预测车辆轨迹, 并引入基于深度神经网络的变道意图识别模块识别驾驶员的变道意图. 通过在公开数据集NGSIM上与LSTM、S-LSTM、CS-LSTM和S-GAN模型进行对比试验, 实验结果表明与其他轨迹预测模型相比, 本文提出的CS-DNN-GAN模型具有较好的预测精确度.
2023, 32(4):361-367. DOI: 10.15888/j.cnki.csa.009047 CSTR:
摘要:针对现有色环电阻识别方法中鲁棒性差、准确率低和运行速度慢等问题, 在MobileNetV3网络的基础上提出了一种轻量级的色环电阻图像识别算法. 首先在自建的色环电阻数据集上进行数据增强以增加样本数量, 提高模型鲁棒性. 然后在瓶颈结构中使用CBAM注意力模块, 增加模型在空间和通道上对特征的细化能力以提高模型准确率. 接着优化分类层, 删掉冗余的升维操作, 在提高准确率的同时减少参数量, 提高模型运算速度. 最后分别针对特征图大小和通道数不相等时添加跳跃连接, 提高模型在深层网络中的特征提取能力, 进一步提高模型准确率. 实验结果表明, 该模型在自建数据集上的识别准确率达到了98%, 可快速准确的对色环电阻进行识别. 该模型能够为电阻自动化识别提供新的技术参考.