2023年第32卷第7期文章目次

2023, 32(7):1-10. DOI: 10.15888/j.cnki.csa.009119

摘要 (935) HTML (1451) PDF 1.29 M (2117) 评论 (0) 收藏

摘要:源代码注释生成旨在为源代码生成精确的自然语言注释, 帮助开发者更好地理解和维护源代码. 传统的研究方法利用信息检索技术来生成源代码摘要, 从初始源代码选择相应的词或者改写相似代码段的摘要; 最近的研究采用机器翻译的方法, 选择编码器-解码器的神经网络模型生成代码段的摘要. 现有的注释生成方法主要存在两个问题: 一方面, 基于神经网络的方法对于代码段中出现的高频词更加友好, 但是往往会弱化低频词的处理; 另一方面, 编程语言是高度结构化的, 所以不能简单地将源代码作为序列化文本处理, 容易造成上下文结构信息丢失. 因此, 本文为了解决低频词问题提出了基于检索的神经机器翻译方法, 使用训练集中检索到的相似代码段来增强神经网络模型; 为了学习代码段的结构化语义信息, 本文提出结构化引导的Transformer, 该模型通过注意力机制将代码结构信息进行编码. 经过实验, 结果证明该模型在低频词和结构化语义的处理上对比当下前沿的代码注释生成的深度学习模型具有显著的优势.

基于改进平衡优化器的医学2D/3D图像快速配准算法

孔方琦，徐琦，周迪斌，刘文浩，余晨，聂雨晨

2023, 32(7):11-22. DOI: 10.15888/j.cnki.csa.009153

摘要 (784) HTML (1024) PDF 2.87 M (2166) 评论 (0) 收藏

摘要:医学三维图像(如CT、MRI等)和二维图像(如X光)的配准技术已经被广泛应用于临床诊断和手术规划中. 医学图像配准的实质为使用优化算法寻找某种空间变换, 使两张图像在空间以及结构上对齐. 配准过程中往往由于优化算法寻优精度不高、易陷入局部极值的问题导致配准质量低. 针对此问题, 提出一种改进的平衡优化器算法(improved equilibrium optimizer based on Logistic-Tent chaos map and Levy flight, LTEO), 首先针对种群初始化容易分布不均匀, 且随机性太高的问题, 引入Logistic-Tent混沌映射对种群进行初始化, 提高种群多样性, 使它们尽可能地分布于搜索空间内; 对迭代函数进行更新, 使得优化算法更注重全局范围的搜索, 提高算法收敛速度并利于找到全局最优解; 引入Levy飞行策略对停滞粒子进行扰动, 防止算法陷入局部极值. 最后将改进的平衡优化器算法用于2D/3D医学图像配准任务, 并对配准过程中数据的频繁传输进行优化, 降低配准耗时. 通过基准函数测试和临床配准实验对算法进行验证, 改进后的平衡优化器可有效提高寻优精度和稳定性, 并提高医学图像配准的质量.

基于小波卷积网络的高光谱图像分类

巩传江，臧德厚，郭金，孙媛媛，宋廷强

2023, 32(7):23-34. DOI: 10.15888/j.cnki.csa.009186

摘要 (731) HTML (1998) PDF 2.85 M (2124) 评论 (0) 收藏

摘要:高光谱图像波段多、波段之间关联性强, 但其空间纹理和几何信息的表达较弱, 传统分类模型存在空间光谱特征提取不充分、计算量大的问题, 分类性能有待提高. 针对此问题, 提出一种基于小波变换的多尺度多分辨率注意力特征融合卷积网络 (wavelet transform convolutional attention network, WTCAN), 采用小波变换思想对光谱波段进行4次分解, 通过层次性提取光谱特征可减少计算量. 该网络设计了空间信息提取模块, 同时引入金字塔注意力机制, 通过设计逆向跳跃连接网络结构利用多尺度获取空间位置特征, 增强空间纹理表达能力, 可以有效改进传统2D-CNN特征提取尺度单一、忽略空间纹理细节等缺陷. 本文对所提出的WTCAN模型分别在不同空间分辨率高光谱数据集Indian Pines (IP)、WHU_Hi_HanChuan (HanChuan)、WHU_Hi_HongHu (HongHu)进行实验, 通过对比SVM、2D-CNN、DBMA、DBDA、HybridSN模型效果, WTCAN模型取得较好的分类效果, 3个数据集的分类总体精度分别达到了98.41%、99.64%、99.67%, 可为高光谱图像的分类研究提供参考依据.

基于虚拟现实和动态加权决策融合的恐高情绪识别

俞洋钊，何炳蔚，白丽英，张彧，俞广杰，钟发炘

2023, 32(7):35-46. DOI: 10.15888/j.cnki.csa.009193

摘要 (719) HTML (1373) PDF 4.02 M (1628) 评论 (0) 收藏

摘要:目前恐高情绪分类中的生理信号主要涉及脑电、心电、皮电等, 考虑到脑电在采集和处理上的局限性以及多模态信号间的融合问题, 提出一种基于6种外周生理信号的动态加权决策融合算法. 首先, 通过虚拟现实技术诱发被试不同程度的恐高情绪, 同步记录心电、脉搏、肌电、皮电、皮温和呼吸这6种外周生理信号; 其次, 提取信号的统计特征和事件相关特征构建恐高情感数据集; 再次, 根据分类性能、模态和跨模态信息提出一种动态加权决策融合算法, 从而对多模态信号进行有效整合以提高识别精度. 最后, 将实验结果与先前相关研究进行对比, 同时在开源的WESAD情感数据集进行验证. 结论表明, 多模态外周生理信号有助于恐高情绪分类性能的提升, 提出的动态加权决策融合算法显著提升了分类性能和模型鲁棒性.

基于图卷积网络的知识感知对话生成

曾碧卿，丁明浩，宋逸云

2023, 32(7):47-56. DOI: 10.15888/j.cnki.csa.009192

摘要 (690) HTML (1102) PDF 1.52 M (1664) 评论 (0) 收藏

摘要:引入结构化知识的对话系统因为能够生成流畅度更高、多样性更丰富的对话回复而受到广泛关注, 但是以往的研究只注重于结构化知识中的实体, 却忽略了实体之间的关系以及知识的完整性. 本文提出了一种基于图卷积网络的知识感知对话生成模型(KCG). 该模型通过知识编码器分别捕获实体与关系的语义信息并利用图卷积网络增强实体表征; 再利用知识选择模块获得与对话上下文相关的实体与关系的知识选择概率分布; 最后将知识选择概率分布与词表概率分布融合, 解码器以此选择知识或词表字词. 本文在中文公开数据集DuConv上进行实验, 结果表明, KCG在自动评估指标上优于目前的基线模型, 能生成更加流畅并且内容更加丰富的回复.

基于克隆检测技术的性能Bugs查找

邓子含，徐云

2023, 32(7):57-64. DOI: 10.15888/j.cnki.csa.009152

摘要 (622) HTML (1059) PDF 1.07 M (1961) 评论 (0) 收藏

摘要:性能bug是指代码中降低程序运行效率的缺陷. 现有的检测工具只能查找特定类型的性能bug并且需要复杂的程序分析过程, 因而缺乏通用性并且时空开销巨大. 同时, 有许多经典的克隆检测技术被用于一般性相似代码检测, 但是它们只能检测高度相似的代码或者需要依赖训练集, 使得它们难以用于在真实数据集中查找性能bug. 基于此, 通过构建带有标记token的代码模板, 本文提出一种使用克隆检测技术来查找多种类型的性能bug的方法. 通过对不同类型和频度的token标记不同的权重, 本文提出的方法可以区分其重要性并因此提取出代码中的关键信息. 在真实项目构成的数据集上的实验表明, 本方法可以发现更多类型的性能bug同时比现有工具耗时更少. 另一项实验也证明了本方法显著提升了基于token的克隆检测技术的检测能力, 相比于现有的克隆检测方法更适合用于性能bug查找.

眼底图像半自动标注系统

章慧丰，侯君临，邹海东，陆丽娜，冯瑞

2023, 32(7):65-74. DOI: 10.15888/j.cnki.csa.009057

摘要 (846) HTML (1373) PDF 2.77 M (1582) 评论 (0) 收藏

摘要:近年来, 由于人工智能在医疗领域的高速发展, 科研人员对医学图像的需求量与日俱增. 这些医学图像往往需要经过精细地标注之后才能够被投入使用. 与自然图像相比, 医学图像的数据标注工作更具专业性、复杂性. 因此, 医学图像面临着标注速率低、标注成本高等问题, 从而导致带标签样本稀缺的困境. 眼底图像作为一种重要的医学图像, 能够实现绝大多数的眼科疾病筛查与初诊工作, 如糖尿病视网膜病变、青光眼等, 但也同样面临着标注困难的问题. 针对这样的现状, 本文设计并开发了一种高效的眼底图像半自动标注系统, 该系统的创新点是能够对多种眼病进行半自动标注. 针对眼底图像进行多种疾病的预测, 预测结果的类型包括疾病分级和病灶分割, 标注人员只需对生成的预测结果进行审核并修改, 这一过程可以大大降低标注人员的工作量. 此外, 该系统包括用户管理、项目管理、图像管理、算法模型管理4个模块. 通过这4个模块可以实现团队标注中的任务分配, 标注进度数据可视化, 标注结果快速导出等人性化功能. 该系统极大提升了标注人员的标注效率和标注体验.

改进GL-GIN的多意图识别和槽填充联合模型

邓飞燕，陈壹华，陈禧琳，李杰鸿

2023, 32(7):75-83. DOI: 10.15888/j.cnki.csa.009157

摘要 (945) HTML (1484) PDF 2.02 M (2044) 评论 (0) 收藏

摘要:在当前自然语言处理多意图识别模型研究中, 存在建模方式均为从意图到插槽的单一方向的信息流建模, 忽视了插槽到意图的信息流交互建模研究, 意图识别任务易于混淆且错误捕获其他意图信息, 上下文语义特征提取质量不佳, 有待进一步提升等问题. 本文以当前先进的典型代表GL-GIN模型为基础, 进行优化改进, 探索了插槽到意图的交互建模方法, 运用槽到意图的单向注意力层, 计算插槽到意图的注意力得分, 纳入注意力机制, 利用插槽到意图的注意力得分作为连接权重, 使其可以传播和聚集与意图相关的插槽信息, 使意图重点关注与其相关的插槽信息, 从而实现多意图识别模型的双向信息流动; 同时, 引入BERT模型作为编码层, 以提升了语义特征提取质量. 实验表明, 该交互建模方法效果提升明显, 与原GL-GIN模型相比, 在两个公共数据集(MixATIS和MixSNIPS)上, 新模型的总准确率分别提高了5.2%和9%.

基于高分辨率图像的多尺度作物分类

郭金，宋廷强，巩传江，孙媛媛，马兴录，范海生

2023, 32(7):84-94. DOI: 10.15888/j.cnki.csa.009167

摘要 (613) HTML (1004) PDF 2.79 M (1431) 评论 (0) 收藏

摘要:基于无人机平台获取的地面影像有着较高的空间分辨率, 但提供丰富的细节信息的同时, 也为农作物分类带来很多“干扰”, 尤其是在利用深度模型进行作物识别时, 存在边缘信息提取不充分及相似纹理作物误分, 导致分类效果欠佳等问题. 因此, 通过多尺度注意力特征提取的思路构建模型, 有效提取边缘信息, 提高作物分类精度. 所提出的多尺度注意力模型 (multi-scale attention network, MSAT)通过多尺度块嵌入获取同一层级不同尺度的作物信息, 多尺度特征图被映射为多条序列独立地馈送到因子注意力模块中, 增强对农作物上下文信息的关注, 提高模型对地块边缘信息的提取, 因子注意力模块内置的卷积相对位置编码增强块内部局部信息的建模, 提高对相似纹理作物的区分能力, 最后通过融合局部特征与全局特征, 实现粗细双重信息的提取. 在水稻、甘蔗、玉米、香蕉和柑橘5种作物上的分类结果表明, MSAT模型的MIoU (mean intersection over union)和OA (overall accuracy)指标达0.816、98.10%, 验证了基于高分辨率图像的精细作物分类方法可行且设备成本低.

面向天文图像的小尺度天体检测

院守晋，蔡江辉，杨海峰，郑爱宇

2023, 32(7):95-104. DOI: 10.15888/j.cnki.csa.009178

摘要 (697) HTML (1283) PDF 2.49 M (1913) 评论 (0) 收藏

摘要:在斯隆数字巡天任务中, 受体积较大亮度较高的天体干扰, 现阶段的目标检测算法对小尺度天体的检测效果并不理想. 针对上述问题, 提出一种基于Mask-GAN和YOLOv3的小尺度天体检测方法. 方法分为两大步骤: 第1步干扰天体屏蔽. 首先设计了一个干扰天体Mask构建算法, 通过自适应阈值分割和连通域分析提取干扰目标, 并提出融合各波段区域特征和排除邻近目标方式构建Mask, 避免以往分割方法存在的光晕残留和邻近目标错误分割现象; 其次构建GAN模型, 结合干扰天体Mask完成屏蔽干扰任务. 第2步将处理过的数据输入改进的YOLOv3模型进行小尺度天体检测. 引入注意力机制, 构建C-EfficientNet作为主干特征提取网络, 加强网络的特征提取能力和对目标关注程度; 同时扩展4个有效特征层并提出一种提升浅层特征图权重的方式SAt, 让网络更好地利用分辨率高细节丰富的浅层特征来检测小尺度天体. 实验与分析表明, 在SDSS (Sloan digital sky survey)天文数据集上对小尺度恒星和星系的检测平均精度达到了81.16%和77.89%, 相比于当前经典算法检测效果更好, 有一定的实际应用意义.

基于多尺度特征提取和坐标注意力的光学遥感图像超分辨率重建

肖子安，张静，苑馨方，朱家佳，李晓辉，米琳，窦帅

2023, 32(7):105-112. DOI: 10.15888/j.cnki.csa.009168

摘要 (724) HTML (1733) PDF 1.46 M (1946) 评论 (0) 收藏

摘要:本文针对现有光学遥感图像超分辨率重建模型对感受野尺度关注不足和对特征通道信息提取不充分带来的问题, 提出了一种基于多尺度特征提取和坐标注意力的光学遥感图像超分辨率重建模型. 该重建模型基于深度残差网络结构, 在网络的高频分支中设计了多个级联的多尺度特征和坐标注意力模块 (multi-scale feature & coordinate attention block, MFCAB), 对输入的低分辨率光学遥感图像的高频特征进行充分发掘: 首先, 在MFCAB模块中引入Inception子模块, 使用不同尺度的卷积核捕捉不同感受野下的空间特征; 其次, 在Inception子模块后增加坐标注意力子模块, 同时关注通道与坐标两个维度, 以获得更好的通道注意力效果; 最后, 对各MFCAB模块提取的特征进行多路径融合, 实现多重多尺度空间信息与通道注意信息的有效融合. 本文模型在NWPU4500数据集上2倍、3倍放大中PSNR值达到34.73 dB和30.12 dB, 较EDSR分别提升0.66 dB和0.01 dB, 在AID1600数据集上2倍、3倍、4倍放大中PSNR值达到34.71 dB、30.58 dB、28.44 dB, 较EDSR分别提升0.09 dB、0.03 dB、0.04 dB. 实验结果表明, 该模型在光学遥感图像数据集上的重建效果优于主流的图像超分辨率重建模型.

基于自编码器的网络游戏流量分类

宁安安，张俊，年梅

2023, 32(7):113-120. DOI: 10.15888/j.cnki.csa.009158

摘要 (715) HTML (1091) PDF 1.51 M (1682) 评论 (0) 收藏

摘要:加密和动态端口技术使传统的流量分类技术不能满足网络游戏识别的性能需求, 本文提出了一种基于自编码器降维的端到端流量分类模型, 实现网络游戏流量的准确识别. 首先将原始流量预处理成784 B的一维会话流向量, 利用编码器进行无监督降维, 去除无效特征; 接着探索构建卷积神经网络与LSTM网络并联算法, 对降维后的样本进行空间和时序特征的提取和融合, 最后利用融合特征进行分类. 在自建的游戏流量数据集和公开数据集上测试, 本文模型在网络游戏流量识别方面达到了97.68%的准确率; 与传统端到端的网络流量分类模型相比, 本文所设计的模型更加轻量化, 具有实用性, 并且能够在资源有限的设备中方便部署.

轻量型多路特征融合人体姿态估计

张国有，高希

2023, 32(7):121-128. DOI: 10.15888/j.cnki.csa.009112

摘要 (757) HTML (1407) PDF 1.44 M (1728) 评论 (0) 收藏

摘要:基于深度学习的人体姿态估计广泛应用于姿态识别、人机交互等领域. 为了提升人体关键点的检测精度, 很多网络采用运算量、参数量和复杂度不断增加的模型架构, 导致无法直接部署到低算力设备. 为了解决上述问题, 本文提出了一种多路特征注意力融合的轻量型方法. 模型基于HigherHRNet网络进行轻量化设计和训练, 包括: 采用通道拆分和通道混洗, 解决分组卷积后特征层之间存在的信息隔离; 采用线性运算的特征生成方法, 解决不同特征层之间存在的冗余性; 采用融合注意力信息的方法, 缓解因轻量化导致的准确率下降. 在MS COCO数据集上完成了模型的训练、测试、可视化以及消融实验. 实验结果表明本文的轻量化方法在保证直观的检测精度前提下, 能够显著降低人体姿态估计的计算量.

面向拜占庭弹性的余度管理方案

左力，卿宸

2023, 32(7):129-137. DOI: 10.15888/j.cnki.csa.009176

摘要 (639) HTML (928) PDF 2.04 M (1365) 评论 (0) 收藏

摘要:综合化航空电子系统是新一代飞机的一个重要特征, 其可靠性和稳定性对整个飞机的飞行和安全起着决定性作用. 针对航电系统应当具有高可靠性的特点, 提出一种分布式集群余度架构, 并设计相应的余度管理方法, 以容忍航电系统故障后可能出现的拜占庭错误, 有效提高容错计算机的可靠性和容错能力. 采用门限签名和集群选主两种方案优化提出的余度管理方法, 降低集群中余度计算机之间的通信开销, 避免影响航电系统的实时性, 提高余度管理效率. 通过模拟实验进行测试, 结果验证了分布式集群余度管理方法可以有效提升航电系统的可靠性, 增强拜占庭弹性, 实现在n余度的航电系统中只要拜占庭节点数小于n/3, 系统仍然能够正确运行, 并且优化方案具有更低的通信开销和计算开销.

基于视觉定位的机器人智能拆垛系统

刘宝临，邹汶材

2023, 32(7):138-144. DOI: 10.15888/j.cnki.csa.009171

摘要 (646) HTML (1052) PDF 3.91 M (2073) 评论 (0) 收藏

摘要:针对传统示教再现机器人仅能进行位置确定、轨迹固定的拆垛任务, 局限于固定场景的问题, 设计了一个基于视觉定位的机器人智能拆垛系统. 该系统利用目标像素中心坐标转换求得对应世界坐标. 针对眼在手外的安装相机方式, 导致目标经图像处理算法求得的旋转角度可能由于相机自身的偏转而产生误差的问题, 提出利用相机外参系数补偿目标旋转角度. 最后设计拆垛策略, 通信引导机器人以由近及远的抓取顺序执行拆垛任务, 并无需人工干预自动完成整垛拆卸. 经过实验数据表明, 该系统可在未知工作场景中对未知位置目标进行抓取, 位置误差可达1.1 mm, 角度误差可达1.2°, 堆垛一层定位时间为1.2 s左右, 满足工业场景中对拆垛机器人的精度与效率需求.

基于改进YOLOX-s的安全帽检测

苏鹏，刘美，马思群

2023, 32(7):145-154. DOI: 10.15888/j.cnki.csa.009127

摘要 (736) HTML (1441) PDF 1.75 M (1654) 评论 (0) 收藏

摘要:在施工现场中, 发生过许多高空坠落事故, 因此在施工现场佩戴安全帽是十分有必要的. 针对安全帽佩戴状况检测中遇到的小目标样本缺检、漏检的情况, 提出一种基于YOLOX-s的改进算法. 首先, 在Neck层引入主干特征提取网络中的160×160特征层进行特征融合, 并且增加了一个针对小目标的检测头; 其次, 采用SIoU损失函数计算损失值, 使得网络在训练过程中考虑的损失项更加全面; 并且采用varifocal loss函数来计算置信度损失值, 进一步改善训练过程中存在的正样本与困难样本不均衡的问题, 最后, 采用CA (coordinate attention)注意力机制来增强模型的特征表达能力. 实验结果表明, 通过对Neck层与检测层、损失函数的优化以及引入CA注意力机制, 使得网络在训练过程中收敛与回归性能更佳. 改进后的算法的mAP值为95.57%, 相较于YOLOv3及原YOLOX-s算法在mAP值上分别提高了17.11%、3.59%. 改进后的算法检测速度为54.73帧/s, 符合实时检测速度要求.

基于改进D-S证据和融合权集的安全风险评估

姜太平，程中

2023, 32(7):155-162. DOI: 10.15888/j.cnki.csa.009132

摘要 (647) HTML (914) PDF 1.24 M (1784) 评论 (0) 收藏

摘要:针对信息化系统安全风险评估过程中安全风险因素指标的重要性难以赋权的问题, 本文以建筑工地施工现场为应用场景, 提出一种基于改进的D-S证据理论与融合权集结合的安全风险评估模型. 首先, 在充分研究建筑工地安全风险评估流程和要素的基础上, 建立建筑工地安全评价体系; 其次, 采用基于权值分配和矩阵分析的D-S合成算法改进AHP法和基于数据的熵权法计算评价体系中指标层中各指标的主、客观权重; 然后, 运用改进的D-S证据融合算法进行多源证据的合成, 获取指标权重, 避免单一赋权的片面性, 得到最优综合权重; 最后, 根据TOPSIS评价算法计算建筑工地综合评价指数. 分析表明, 基于改进D-S证据理论-融合权集的安全风险评估模型, 能有效评估建筑工地施工现场的安全性, 降低评估结果的不确定性, 提高风险评估结果可信度.

基于多支路的孪生网络目标跟踪

谢斌红，于如潮

2023, 32(7):163-170. DOI: 10.15888/j.cnki.csa.009130

摘要 (612) HTML (1270) PDF 2.30 M (1678) 评论 (0) 收藏

摘要:为有效解决目标跟踪在面对大尺度形变、完全遮挡、背景干扰等复杂场景时出现漂移或者跟踪丢失的问题, 本文提出了一种基于多支路的孪生网络目标跟踪算法(SiamMB). 首先, 通过增加邻近帧支路的网络鲁棒性增强方法以提高对搜索帧中目标特征的判别能力, 增强模型的鲁棒性. 其次, 融合空间注意力网络, 对不同空间位置的特征施加不同的权重, 并着重关注空间位置上对目标跟踪有利的特征, 提升模型的辨别力. 最后, 在OTB2015和VOT2018数据集上的进行评估, SiamMB跟踪精度和成功率分别达到了91.8%和71.8%, 相比当前主流的跟踪算法取得了良好的竞争力.

应用引导积分梯度的对抗样本生成

王正来，关胜晓

2023, 32(7):171-178. DOI: 10.15888/j.cnki.csa.009177

摘要 (608) HTML (1117) PDF 2.63 M (1392) 评论 (0) 收藏

摘要:给图片添加特定扰动可以生成对抗样本, 误导深度神经网络输出错误结果, 更加强力的攻击方法可以促进网络模型安全性和鲁棒性的研究. 攻击方法分为白盒攻击和黑盒攻击, 对抗样本的迁移性可以借已知模型生成结果来攻击其他黑盒模型. 基于直线积分梯度的攻击TAIG-S可以生成具有较强迁移性的样本, 但是在直线路径中会受噪声影响, 叠加与预测结果无关的像素梯度, 影响了攻击成功率. 所提出的Guided-TAIG方法引入引导积分梯度, 在每一段积分路径计算上采用自适应调整的方式, 纠正绝对值较低的部分像素值, 并且在一定区间内寻找下一步的起点, 规避了无意义的梯度噪声累积. 基于ImageNet数据集上的实验表明, Guided-TAIG在CNN和Transformer架构模型上的白盒攻击性能均优于FGSM、C&W、TAIG-S等方法, 并且制作的扰动更小, 黑盒模式下迁移攻击性能更强, 表明了所提方法的有效性.

改进YOLOv3遥感小目标检测算法

许成林，黄宇博，赵舵

2023, 32(7):179-187. DOI: 10.15888/j.cnki.csa.009179

摘要 (825) HTML (1459) PDF 3.33 M (1860) 评论 (0) 收藏

摘要:针对目前在遥感目标检测领域广泛使用的YOLOv3算法存在对小目标物体的特征表达能力不足, 检测效果不好的问题, 本文提出一种改进的YOLOv3小目标检测算法. 首先, 引入全局信息注意力机制并改进特征提取网络和特征金字塔结构, 提高模型小目标特征提取能力和检测能力; 其次, 对数据集进行单尺度Retinex融合特征增强, 提高模型对小目标特征的学习效果; 最后, 使用自适应锚框优化算法对anchors进行优化, 提高anchors和目标的匹配程度. 选用遥感数据集RSOD进行实验, 本文算法的全类平均精度为92.5%, 相比经典YOLOv3算法, 提高10.1%, 对遥感小目标的检测效果得到明显提升.

面向轨道分割与侵入物检测的多任务学习

张硕，杨诗茵，孙博宇，许云飞，沈昊，吕永家，贾云鹏，邢会明，赵新华

2023, 32(7):188-194. DOI: 10.15888/j.cnki.csa.009089

摘要 (594) HTML (1056) PDF 2.08 M (1549) 评论 (0) 收藏

摘要:轨道车智能防护会涉及轨道车侵入物检测与行驶区域分割任务, 在深度学习领域已有针对各任务的算法, 却无法很好满足多任务情形时的需求. 该算法使用轻量级卷积神经网络(CNN)作为编码器提取特征图, 随之将特征图送到两个基于one-stage检测网络的解码器中, 进而完成各自的任务. 不同级别和尺度的语义特征在编码器输出的特征图中被融合, 良好地完成像素级语义预测, 在检测和分割效果上有明显提升. 采用本算法的设备将掌握对新目标的识别检测判断与追踪, 为提升轨道车行驶安全做出保障.

基于深度学习的动态优先级任务调度算法

齐玉峰，贺晓

2023, 32(7):195-201. DOI: 10.15888/j.cnki.csa.009169

摘要 (770) HTML (1851) PDF 1.66 M (2274) 评论 (0) 收藏

摘要:工业互联网中设备任务的处理需要大量计算资源, 有低时延需求的任务显著增多. 边缘计算将算力等资源放置到靠近需求一侧, 为任务处理提供有效支撑. 但由于边缘计算资源有限, 无法同时满足设备任务的低时延和高完成率需求. 如何确定合理的卸载决策与任务调度, 仍然存在巨大挑战. 针对以上问题, 本文提出了一种基于深度学习的动态优先级任务调度算法DPTSA, 首先根据动态优先级选择待处理任务, 通过神经网络产生任务调度决策, 然后通过交叉变异等操作产生一组可行解, 再筛选最优解存储到经验缓冲区, 最后通过经验缓冲区样本优化神经网络参数. 基于Google的Brog任务调度数据集的实验结果表明, 相比于4种基准算法, DPTSA在任务等待时间和任务完成率方面都有出色表现.

多尺度融合注意力机制的番茄叶病识别网络

王斌，余本国

2023, 32(7):202-210. DOI: 10.15888/j.cnki.csa.009163

摘要 (638) HTML (1572) PDF 3.34 M (1593) 评论 (0) 收藏

摘要:针对普通神经卷积网络对番茄叶病的识别精准度, 先提出一种新型的多尺度融合注意力机制的网络(MIPSANet), 在该网络中采用轻量级网络作为主要框架, 减少了网络的参数, 为了增加网络的深度和宽度, 加入了Inception结构, 用于提取数据的多尺度特征信息, 同时, 在这个过程中使用更加精细的双重注意力机制, 极化自注意力(polarized self-attention, PSA), 作为一个即插即用的模块, 将其嵌入整个模型中, 提高了重要特征点的表达能力, 同时PSA模块的轻量化也符合本模型的使用. 在卷积后加入全连接层, 进行分类. 使用提出的网络在Kaggle公开数据集tomato leaves dataset 上进行实验, 对其进行30批次的训练, 取得了91.05%的准确率, 与其他方法进行对照, 取得良好的效果. 试验结果表明该网络对番茄叶病的分类有很好的效果, 为分类网络的网络结构和参数配置方面提供一些参考价值.

地铁站场景下的可行驶区域检测

王思功，朱明

2023, 32(7):211-218. DOI: 10.15888/j.cnki.csa.009173

摘要 (625) HTML (903) PDF 1.81 M (1452) 评论 (0) 收藏

摘要:在室内环境下的机器人视觉导航任务中, 可行驶区域检测是不可或缺的一部分, 这是保证自动驾驶任务实现的基础. 目前较多的解决方法是对数据集中出现过的障碍物进行识别来检测可行驶区域, 缺乏灵活性, 因此本文提出了一种针对地铁站等室内平坦地面的可行驶区域检测方法, 提高实用性. 本文采用经典的MobileNetV3网络对采集到的前方图像进行分类, 判断是否为地面区域. 由于室内地面的地标、箭头等贴纸的影响, 因此需要对非地面区域进一步判断, 与常规的立体障碍物进行区分. 本文利用连续帧之间的特征点匹配获得相机移动距离, 并利用直线拟合计算斜率的方法达到区分立体障碍物与平面地标的目的. 实验表明, 本文提出的方法能较好地检测机器人前方可行驶区域, 具有较高的实用价值.

考虑多重不确定性因素的研发任务分配优化

张西林，林兵

2023, 32(7):219-225. DOI: 10.15888/j.cnki.csa.009170

摘要 (596) HTML (863) PDF 1.28 M (1287) 评论 (0) 收藏

摘要:由于研发项目的复杂性、不确定性、动态性、参研团队差异等因素的影响, 难以合理分配研发任务. 本文综合考虑参研团队能力的不确定性、研发项目运行过程的不确定性等因素, 通过仿真估计研发项目的工期、成本等指标; 考虑决策者的心理因素, 基于前景理论计算研发工期、研发成本的前景价值; 以前景价值作为适应度评价指标, 基于NSGA-III构建研发任务分配优化算法. 算例研究表明, 基于NSGA-III、NSGA-II和MOEA-D构建的优化算法均可有效改进研发任务分配方案, 而基于NSGA-III构建的算法的优化效果最好.

容器编排工具中部署工作节点的资源优化

谢兆贤，张文静，徐娅，王若冰，倪冰雪

2023, 32(7):226-239. DOI: 10.15888/j.cnki.csa.009180

摘要 (600) HTML (1325) PDF 2.17 M (1738) 评论 (0) 收藏

摘要:随着云计算飞速发展, 以Docker为代表的容器技术逐渐被重视. 目前, 3种常见的容器编排工具有Kubernetes、Docker Swarm和Rancher. 然而, 现有的容器编排工具在所有工作节点的总容量超标时, 将会有响应时间长和资源占用较多等问题. 因此, 本文设计LSD (least space unused)算法以及LRU-SD (least recently used and space unused)算法, 并应用于3种编排工具中. 当总容量超出上限时, 则选择删除不工作的节点并且增加新的工作节点. 做法上, LSD算法是删除剩余空间最少的工作节点, LRU-SD算法先考虑删除最久未使用的节点, 当有多个符合要求的节点时, 则删除剩余空间最少的工作节点. 实验部分, 分析与比较使用不同算法对3种容器编排工具的影响, 包含响应时间、CPU和内存. 实验结果发现, LSD算法、LRU-SD算法和LRU算法不仅能够提高编排工具的响应时间, 还可以增加资源的使用率. 同时, 在提升CPU的使用率方面, LRU-SD算法的效果最好.

基于视频相位的拉索振动检测

孔瑞，陈鲸，杨学志，臧宗迪

2023, 32(7):240-250. DOI: 10.15888/j.cnki.csa.009164

摘要 (545) HTML (1161) PDF 3.60 M (1521) 评论 (0) 收藏

摘要:作为斜拉桥的重要受力构件, 斜拉索的振动检测对桥梁健康监测具有关键作用. 在实验室理想条件下, 传统的空间相位振动检测算法能够实现结构振动的高精度测量, 然而在实际场景下, 环境因素如车辆、风激励以及拉索与地面的角度等会对测量结果造成较大的误差, 因此其不适用于实际场景下的拉索振动检测. 针对此问题, 本文提出了一种基于方向自适应复可控滤波器的拉索振动频率检测算法, 用于实现在真实场景下拉索振动的精确测量. 首先, 利用拉索的直线特性检测拉索位置, 并确定拉索主振方向; 其次根据拉索的振动方向特性, 设计方向自适应复可控滤波器组, 对视频的每一帧图像进行分解处理, 得到不同尺度同一方向的相位谱和幅度谱, 并对拉索边缘区域相位进行增强; 最后将每一帧图像处理得到的不同尺度的空间相位进行平均, 按时间顺序排列生成相位序列, 对提取到的相位序列进行傅里叶变换得到拉索振动主频频率. 通过与加速度传感器测量结果比较, 证明本文算法鲁棒性较高, 能够满足真实场景下桥梁拉索振动测量的应用需求.

基于图卷积神经网络的自注意力的融合节点分类框架

姜发健，王金凤，招奕钧，郑志燊

2023, 32(7):251-260. DOI: 10.15888/j.cnki.csa.009159

摘要 (650) HTML (3414) PDF 2.20 M (2190) 评论 (0) 收藏

摘要:图神经网络因其强大的建模能力引起广泛关注, 常常被用来解决图上的节点分类任务. 现阶段常用的以图卷积神经网络 (graph convolutional network, GCN)为内核的模型解决此类问题, 但往往因为出现过拟合与过平滑而导致深层的节点嵌入表示效果并不好. 因此, 本文提出了一种基于GCN内核的结合残差连接与自注意力方法——GCNRN模型, 以提升GCN的泛化能力. 同时, 为了整合更深入的信息, 本文引入融合机制, 采用模糊积分融合多个分类器, 最终提高模型测试精度. 为了验证所提出方法的优越性, 本文采用ogbn-arxiv与常用的引文数据集进行了对比实验. GCNRN模型与多个以GCN为内核的现有模型相比, 节点分类准确率平均提高了2%, 且避免了传统的过拟合和过平滑现象. 此外, 实验结果表明, 增加了基于模糊积分的融合模块的多分类器模型比传统融合方法具有更好的分类效果.

基于优化CBAM改进YOLOv5的农作物病虫害识别

王昕，董琴，杨国宇

2023, 32(7):261-268. DOI: 10.15888/j.cnki.csa.009175

摘要 (761) HTML (1560) PDF 2.51 M (2563) 评论 (0) 收藏

摘要:针对多种农作物病虫害图像, 在自然环境下因虫害种类繁多, 小目标特征相似的技术问题, 导致检测困难难以达到令人满意的精度. 本文提出了一种自然背景下加强局部特征和全局特征信息融合的害虫检测识别模型YOLOv5-EB, 在公开的大规模害虫数据集IP102上进行实验, 结果表明该研究比YOLOv5模型精确度提高了5个百分点. 引入一维卷积替换CBAM中通道注意力的MLP操作, 优化了通道注意力经过全局处理后容易忽略通道内信息交互的问题; 其次使用6×6卷积替换Focus操作, 来增强提取害虫特征的能力. 实验结果表明, 对害虫进行检测时, YOLOv5-EB的平均精度值达到了87%, 与Faster R-CNN、EfficientDet、YOLOv3、YOLOv4、YOLOv5模型相比, 不仅有效提高了作物害虫图像的识别性能, 而且有效提高了检测速度. 研究表明, YOLOv5-EB算法满足对多种农作物病虫害目标检测的准确性和实时性要求.

基于异质图卷积注意网络的社交媒体账号分类

陈周国，丁建伟，明杨，费高雷

2023, 32(7):269-275. DOI: 10.15888/j.cnki.csa.009144

摘要 (551) HTML (965) PDF 1.17 M (1397) 评论 (0) 收藏

摘要:由于社交媒体网络的复杂性, 单一性质的同质信息网络对社交媒体账号分类会造成信息丢失, 对分类结果产生不利影响. 针对这种问题, 本文提出基于异质图卷积注意网络的社交媒体账号分类方法(HGCANA). 首先构建社交媒体的异质信息网络, 然后提取异质信息网络的社交媒体特征, 引入注意力机制, 对社交媒体账号进行分类识别. 通过实验比较HGCANA方法与现有方法, 证明了本文提出的HGCANA方法能够更好地对社交网络媒体账号进行有效分类.

基于梯度结构的图神经网络对抗攻击

李凝书，关东海，袁伟伟

2023, 32(7):276-283. DOI: 10.15888/j.cnki.csa.009166

摘要 (751) HTML (1384) PDF 1.25 M (1849) 评论 (0) 收藏

摘要:图神经网络在半监督节点分类任务中取得了显著的性能. 研究表明, 图神经网络容易受到干扰, 因此目前已有研究涉及图神经网络的对抗鲁棒性. 然而, 基于梯度的攻击不能保证最优的扰动. 提出了一种基于梯度和结构的对抗性攻击方法, 增强了基于梯度的扰动. 该方法首先利用训练损失的一阶优化生成候选扰动集, 然后对候选集进行相似性评估, 根据评估结果排序并选择固定预算的修改以实现攻击. 通过在5个数据集上进行半监督节点分类任务来评估所提出的攻击方法. 实验结果表明, 在仅执行少量扰动的情况下, 节点分类精度显著下降, 明显优于现有攻击方法.

融合坐标信息与模板更新的孪生网络目标跟踪

侯艳丽，魏义仑，王鑫涛

2023, 32(7):284-292. DOI: 10.15888/j.cnki.csa.009139

摘要 (687) HTML (1009) PDF 3.28 M (1822) 评论 (0) 收藏

摘要:应对孪生网络单目标跟踪算法在跟踪中遇到背景杂乱、相似物影响、遮挡等复杂场景的问题导致跟踪系统精度和成功率下降的问题, 提出一种融合坐标注意力机制和模板更新的跟踪算法MCUSiamRPN (MobileNet coordinate attention and updating of template SiamRPN). 在SiamRPN算法基础上, 采用改进的MobileNetV3为特征提取网络, 多层特征信息分别送入坐标注意力模块, 进行特征融合, 丰富语义信息; 设计了一种自适应模板更新模块, 结合初始模板和当前帧的模板用于估计下一帧的最佳模板更新模板信息. 在OTB100和UAV123两个数据集上进行测试, 结果显示: 相比于基准算法SiamRPN, 精度分别提升了5.3%和3.7%; 成功率分别提升了3.7%和5.2%, 验证了该算法的有效性.

基于序列挖掘的Dockerfile规则自动提取工具

詹威霖，周宇

2023, 32(7):293-298. DOI: 10.15888/j.cnki.csa.009199

摘要 (473) HTML (1013) PDF 1.31 M (1853) 评论 (0) 收藏

摘要:Dockerfile定义了一组构建容器镜像的指令, 这些指令指示了容器化的应用程序该如何构建. 最近的研究表明Dockerfile存在相当多的质量问题. 在本文中, 我们提出了一种新的工具DMiner (Dockerfile Miner)来提取高质量Dockerfile中的隐含规则, 这些规则将有助于提升Dockerfile的质量. DMiner主要分为3个模块, 分别负责Dockerfile的采集、过滤, Dockerfile的解析处理以及Dockerfile规则的挖掘提取, DMiner将Dockerfile解析成统一的序列表示并使用序列模式挖掘算法来提取规则. 本工具对现有的Dockerfile数据集进行了扩充, 同时新提取出了9条在其他工作未曾出现的规则, 在真实数据集上的大量实验证明了该工具的有效性和高效性.

特征点维度的静态场景三维重建运动目标剔除

杨永刚，宋泽，李思萌，申郑茂

2023, 32(7):299-304. DOI: 10.15888/j.cnki.csa.009172

摘要 (582) HTML (1195) PDF 3.62 M (1486) 评论 (0) 收藏

摘要:基于语义分割的图像掩膜方法常用来解决静态场景三维重建任务中运动物体的干扰问题, 然而利用掩膜成功剔除运动物体的同时会产生少量无效特征点. 针对此问题, 提出一种在特征点维度的运动目标剔除方法, 利用卷积神经网络获取运动目标信息, 并构建特征点过滤模块, 使用运动目标信息过滤更新特征点列表, 实现运动目标的完全剔除. 通过采用地面图像和航拍图像两种数据集以及DeepLabV3、YOLOv4两种图像处理算法对所提方法进行验证, 结果表明特征点维度的三维重建运动目标剔除方法可以完全剔除运动目标, 不产生额外的无效特征点, 且相较于图像掩膜方法平均缩短13.36%的点云生成时间, 减小9.93%的重投影误差.

基于注意力机制和高斯概率估计的PM_2.5浓度预测

杨柳，张镝，李建熹，康丽荥，赵思彤

2023, 32(7):305-311. DOI: 10.15888/j.cnki.csa.008808

摘要 (750) HTML (1083) PDF 6.43 M (1788) 评论 (0) 收藏

摘要:作为衡量空气污染物浓度的重要指标, 对PM_2.5浓度进行监控预测, 能够有效地保护大气环境, 进一步地减少空气污染带来的危害. 随着空气质量自动监测站的大范围建立, 由传统的机器学习搭建的空气质量预测模型已经不能满足当今的需求. 本文提出了一种基于多头注意力机制和高斯概率估计的高斯-注意力预测模型, 并对沈阳市某监测站点的数据进行了训练和测试. 该模型考虑了PM_2.5浓度受到其他空气质量数据的影响, 将空气质量数据的分层时间戳(周、日、小时)的信息对齐作为输入, 使用多头注意力机制对于不同子空间的时间序列关联特征进行提取, 能够获得更加完善有效的特征信息, 再经过高斯似然估计得到预测结果. 通过与多种基准模型进行对比, 相较于性能较优的DeepAR, 高斯-注意力预测模型的MSE、MAE分别下降了21%、15%, 有效地提高了预测准确率, 能够较准确地预测出PM_2.5浓度.

微信公众号

网站二维码

当期目录

年份

刊期