2022, 31(12):1-9. DOI: 10.15888/j.cnki.csa.008825
摘要:在研制量子芯片时对其性能进行测评, 以校准量子算法实际执行结果与理论结果的拟合程度是量子计算优于经典计算的重要一步. 然而, 目前国内外对量子芯片性能测评方面并没有统一的基准测试, 对于量子芯片局部指标的测评标准容易导致人们对芯片整体性能的误解. 鉴于此, 本文首先简述现有的量子芯片性能指标, 其次通过对测评方法进行分类, 概述现今量子芯片测评方法, 最后总结量子芯片测评技术的现存问题并对未来的测评技术进行展望. 本综述可为从事相关工作的人员进行查阅提供便利.
徐格蕾,章晓庆,肖尊杰,Risa Higashita,陈婉,袁进,刘江
2022, 31(12):10-19. DOI: 10.15888/j.cnki.csa.008867
摘要:白内障是一种主要导致视觉损伤的眼病. 早期干预和白内障手术是改善患者视力和生活质量的主要手段. 眼前节光学相干断层成像图像 (anterior segment optical coherence tomography, AS-OCT) 是一种新型眼科图像, 其具有非接触、高分辨率、检查快速等特点. 在临床上, 眼科医生已经逐渐采用AS-OCT图像进行眼科疾病如青光眼的诊断, 然而尚未有研究工作利用它进行皮质性白内障 (cortical cataract, CC) 自动分类. 为此, 提出了一个基于AS-OCT图像的自动皮质性白内障分类框架, 由图像预处理、特征提取、特征筛选和分类等4部分组成. 首先, 利用反光区域去除和对比度增强方法进行图像预处理; 紧接着使用灰度共生矩阵 (grey level co-occurrence matrix, GLCM)、灰度区域大小矩阵 (grey level size zone matrix, GLSZM) 和邻域灰度差矩阵 (neighborhood grey tone difference matrix, NGTDM) 方法从皮质区域提取了22个特征; 然后, 采用斯皮尔曼相关系数方法对提取的特征进行特征重要性分析并筛除冗余特征; 最后利用线性支持向量机方法进行分类. 在一个临床AS-OCT图像数据集上的实验结果表明, 所提出的皮质性白内障分类框架准确率、召回率、精确率和F1分别达到86.04%, 86.18%, 88.27%和86.35%, 取得与先进的深度学习算法接近的性能, 表明其具有作为辅助眼科医生进行皮质性白内障临床诊断工具的潜力.
2022, 31(12):20-28. DOI: 10.15888/j.cnki.csa.008838
摘要:近年来, 数字信号调制识别以其良好的信息保密性和抗噪声性, 逐渐成为了无线通信领域的一个重要研究方向. 星座图作为调制识别的重要特征之一, 由于在特征提取过程中不需要接收信号的先验信息, 因此在特征提取方面具有明显的优势. 根据上述原因, 本文提出了基于星座图的数字信号调制方法综述. 具体而言, 本文将首先分析星座图的基本原理; 其次通过总结现有的基于星座图的数字信号调制识别方案, 分析了星座图在各个研究方向的特点. 最后, 本文给出了基于星座图方法的数字调制识别方案的发展趋势以及未来期望.
2022, 31(12):29-40. DOI: 10.15888/j.cnki.csa.008800
摘要:针对Android恶意软件检测, 通常仅有检测结果缺乏对其检测结果的可解释性. 基于此, 从可解释性的角度分析Android恶意软件检测, 综合利用多层感知机和注意力机制提出一种可解释性的Android恶意软件检测方法(multilayer perceptron attention-method, MLP_At). 通过提取Android恶意软件的应用权限和应用程序接口(application programming interface, API)特征来进行数据预处理生成特征信息, 采用多层感知机对特征学习. 最后, 利用BP算法对学习到的数据进行分类识别. 在多层感知机中引入注意力机制, 以捕获敏感特征, 根据敏感特征生成描述来解释应用的核心恶意行为. 实验结果表明所提方法能有效检测恶意软件, 与SVM、RF、XGBoost相比准确率分别提高了3.65%、3.70%和2.93%, 并能准确地揭示软件的恶意行为. 此外, 该方法还可以解释样本被错误分类的原因.
2022, 31(12):41-50. DOI: 10.15888/j.cnki.csa.008832
摘要:在车载命名数据网络(VNDN)中, 兴趣包洪泛攻击(IFA)通过发送大量恶意兴趣包占用甚至耗尽网络资源, 导致合法用户的请求无法被满足, 严重危害了车联网的运行安全. 针对上述问题, 本文提出了一种基于流量监测的IFA检测方法. 首先构建基于RSU的分布式网络流量监测层, 每个RSU监测其通讯范围内的网络流量, RSU之间通信互联形成RSU网络流量监测层. 其次, 设定固定时间窗口, 对每个窗口内的网络流量通过信息熵、网络自相似性和奇异点3个维度进行分析. 其中, 为了利用信息熵反映兴趣包来源的分布, 在兴趣包中添加了新的字段. 最后, 综合上述3个指标, 判断兴趣包洪泛攻击的存在. 仿真实验结果表明, 本文提出的方法有效地提升了兴趣包洪泛攻击检测的准确率, 降低了误判率.
2022, 31(12):51-58. DOI: 10.15888/j.cnki.csa.008861
摘要:日常消毒工作已经成了常态化的工作, 智能消毒机器人是非常有效的一种方式. 机器人通常通过视觉来感知周围环境, 但是基于监督学习的检测算法通常需要大量的标注数据进行训练, 当标注数据量多时, 标注成本非常高, 当标注数据量少时, 模型容易陷入过拟合, 因此少样本目标检测是一种有效的解决途径. 本文以SimDet模型为基础, 提出了SimDet+模型. 第一, 针对消毒场景中的目标检测任务的特点, 增加了自监督预训练的过程, 第二, 因为存在查询图片可供参考, 对分类层进行了改进, 使用余弦相似度代替全连接层来计算置信度, 通过非参数化计算有效避免了过拟合现象. 针对消毒场景, 制作了一份22 min的视频数据集和包含8类物体的检测数据集, 分别用于两个阶段训练. 通过自监督预训练, 有效减少了数据标注成本, 同时下游任务的mAP从
2022, 31(12):59-68. DOI: 10.15888/j.cnki.csa.008877
摘要:信息时代推进盲文数字化, 关乎我国广大盲人文化素质的提高和生活水平的改善. 本文实现了一种基于国家通用盲文标调规则的汉盲转换系统, 能够快速生成海量符合国家通用盲文方案的数字化资源, 满足视障人士无障碍获取信息的需求. 此系统按通用盲文规则处理汉语文本, 将其转换为符合标调规则、简写规则的盲文结果. 测试结果表明, 此系统可以准确处理标调规则、简写规则, 可得到准确的符合国家通用盲文方案的盲文数字化结果. 声调省写覆盖率、韵母简写覆盖率和篇幅增加量均与国家通用盲文方案的理论值相当, 能够快速处理长篇语料文件, 程序执行效率高, 具有实用价值, 可以用于推广国家通用盲文, 促进我国盲文数字化无障碍建设.
2022, 31(12):69-77. DOI: 10.15888/j.cnki.csa.008854
摘要:针对医疗整容领域中客户在术前无法直观感受术后整容效果的问题, 提出了面向医疗整容领域的三维人脸重建与编辑系统. 该系统首先对用户上传的图片进行特征点标记, 然后结合三维形变模型(3D morphable model, 3DMM)对输入图像进行对齐, 接着将处理后的图像输入预先训练好的三维人脸重建网络中, 便可得到输入图像所对应的三维人脸模型. 系统对此模型进行加载渲染后, 用户可以对模型的脸颊、鼻梁和下巴进行编辑以达到模拟整容的效果, 之后可对模型进行保存并查看诊断结果. 最后, 对重建效果、整形效果和诊断结果可靠性进行测试. 实验结果表明, 该系统对中青年人脸的重建效果好, 重建模型与输入图片相似度高; 对模型整形后的部位依然保持平滑自然, 达到了模拟整容的效果; 在给定正确的人脸尺寸后, 诊断结果给出的整形建议在毫米级范围内, 说明了整形结果具有较高的可靠性.
2022, 31(12):78-86. DOI: 10.15888/j.cnki.csa.008817
摘要:训练基于深度学习的计算机辅助诊断系统可以有效地从肺部CT图像中检测出是否受到COVID-19感染, 但目前面临的主要问题是缺乏高质量带标注的CT图像用于训练. 为了有效的解决该问题, 本文提出了一种基于生成对抗网络来扩增肺部CT图像的方法. 新方法通过生成不同感染区域的标签并通过泊松融合以增加生成图像的多样性; 通过训练对抗网络模型实现图像的转换生成, 以达到扩增CT图像的目的. 为验证生成数据的有效性, 基于扩增数据进一步做了分割实验. 通过图像生成实验和分割实验, 结果都表明, 本文提出的图像生成方法取得了较好的效果.
2022, 31(12):87-94. DOI: 10.15888/j.cnki.csa.008826
摘要:为了解决Hyperledger Fabric使用固定背书节点进行背书而引发的安全问题, 提出了一种基于可验证延迟函数的Hyperledger Fabric背书策略优化方案. 利用可验证延迟函数不可并行计算以及可高效验证的特点, 设计了匿名化、随机化选取背书节点的Fabric交易模型, 增强了Fabric交易背书的安全性. 通过实验对比优化方案与原始方案, 验证了优化方案在增强安全性的同时, 在效率上也有一定的提升.
2022, 31(12):95-103. DOI: 10.15888/j.cnki.csa.008828
摘要:针对神经机器翻译和人工翻译性能的差异最小化、训练语料不足问题, 提出了一种基于生成对抗网络的神经机器翻译改进方法.首先对目标端句子序列添加微小的噪声干扰, 通过编码器还原原始句子形成新的序列; 其次将编码器的处理结果交给判别器和解码器进一步处理, 在训练过程中, 判别器和双语评估基础值(BLEU)目标函数用于评估生成的句子, 并将结果反馈给生成器, 引导生成器学习及优化.实验结果表明, 对比传统的神经机器翻译模型, 基于GAN模型的方法极大地提高了模型的泛化能力和翻译的精度.
2022, 31(12):104-111. DOI: 10.15888/j.cnki.csa.008834
摘要:为了实现对地质档案的信息化管理, 系统结合Gateway服务网关和Consul注册中心, 构建了一个基于Spring Boot微服务架构的地质档案信息系统. 研发过程使用前后端分离的开发模式, 通过Layui开发前台页面的主要部分, 并结合Spring Boot框架搭建后端微服务实例, 以关系型数据库MySQL及非关系型数据库Redis共同作为系统数据存储的载体, 建立了用户管理、档案入库、档案借阅归还、OCR图片识别等功能模块. 系统将地质档案进行电子化存储, 促进了资源共享、统一调用, 减少了人员的维护工作量, 提高了工作效率, 为地质档案信息数据融合提供了支撑.
2022, 31(12):112-119. DOI: 10.15888/j.cnki.csa.008880
摘要:针对目前编译优化领域的深度学习模型普遍采用单任务学习而难以利用多个任务间的相关性提升模型整体编译加速效果的问题, 提出了一种基于多任务深度学习的编译优化方法. 该方法使用图神经网络 (GNN) 从C程序的抽象语法树 (ASTs) 和数据控制流图 (CDFGs) 中学习得到程序特征, 然后对程序特征同步预测HXDSP软件流水启动间隔和循环展开因子. 在DSPStone数据集上的实验结果表明, 该多任务方法取得了相对于单任务方法12%的性能提升.
2022, 31(12):120-126. DOI: 10.15888/j.cnki.csa.008652
摘要:为了在发生轻微交通事故时, 快速使事故车辆驶离现场, 保证道路畅通, 提出了一种车辆碰撞检测及责任判定模型. 首先结合SSD目标检测算法(single shot multibox detector)和MobileNet轻量级深度网络模型, 对其进行改进以获取每一帧视频图像中运动目标的位置和大小信息, 实现对车辆识别与检测. 其次, 利用卡尔曼滤波器对连续图像帧之间的运动目标建立对应匹配关系, 预测目标的运动状态, 对目标的位置及运动趋势做出判断, 实现车辆轨迹跟踪. 随后通过车辆目标检测框的交并比判断是否发生碰撞. 最后针对直行道路中车辆的速度、方向信息结合道路安全条例及机动车事故快速方法对事故车辆进行责任判定. 结果分析表明, 该研究可实现直行道路场景下的追尾及变道引发的车辆碰撞检测及责任判定.
2022, 31(12):127-134. DOI: 10.15888/j.cnki.csa.008758
摘要:在自动驾驶应用场景下, 将YOLOv5应用于目标检测中, 性能较之前版本有明显的提升, 但在高运行速度情况下检测精度仍不够高, 本文提出一种基于改进YOLOv5的车辆端目标检测方法. 为解决训练不同数据集时需手动设计初始锚框大小, 引入自适应锚框计算. 在主干网络(backbone)添加压缩与激励模块(squeeze and excitation, SE), 筛选针对通道的特征信息, 提升特征表达能力. 为了提升检测不同大小物体时的精度, 将注意力机制与检测网络融合, 把卷积注意力模块 (convolutional block attention module, CBAM)与Neck部分融合, 使模型在检测不同大小的物体时能关注重要的特征, 提升特征提取能力. 在主干网络中使用空间金字塔池化SPP模块, 使得模型输入可以输入任意图像高宽比和大小. 在激活函数方面, 进行卷积操作后使用Hardswish激活函数, 应用于整个网络模型. 在损失函数方面, 使用CIoU作为检测框回归的损失函数, 改善定位精度低和训练过程中目标检测框回归速度慢的问题. 实验结果表明, 改进后的检测模型在KITTI 2D数据集上测试, 目标检测的精确率(precision)提高了2.5%, 召回率(recall)提高了5.1%, 平均精度均值(mean average precision, mAP)提高了2.3%.
2022, 31(12):135-146. DOI: 10.15888/j.cnki.csa.008824
摘要:针对传统图像分割方法分割效率低下, 遥感图像特征复杂多样, 复杂场景下分割性能受到限制等问题, 在基于U-Net网络架构的基础上, 提出一种能够较好提取遥感图像特征并兼顾效率的改进U-Net模型. 首先, 以EfficientNetV2作为U-Net的编码网络, 增强特征提取能力, 提高训练和推理效率, 然后在解码部分使用卷积结构重参数化方法并结合通道注意力机制, 几乎不增加推理时间的前提下提升网络性能, 最后结合多尺度卷积融合模块, 提高网络对不同尺度目标的特征提取能力和更好地结合上下文信息. 实验表明, 改进的网络在遥感图像分割性能提升的同时分割效率也提高.
2022, 31(12):147-158. DOI: 10.15888/j.cnki.csa.008853
摘要:针对传统数字图像水印版权保护中存在的鲁棒性差和安全性低的问题, 为提升不同图像零水印的可区分性, 提出了一种基于多特征和混沌加密的零水印算法. 首先根据整体与局部的角度提取图像的5维特征: 均值特征、方差特征、偏态特征、峰度特征和HOG特征; 然后利用新提出的基于混沌映射的块置乱方法加密水印图像; 最后基于提取的多特征与置乱后水印, 构造零水印信息. 在版权认证过程中, 首先提取多特征, 再结合零水印信息, 得到加密后水印; 最后对其进行解密; 即可实现版权认证. 实验结果表明, 所提出的方法效率高、安全性高、抗攻击能力强. 基于多特征和混沌加密零水印算法综合了数字图像的多方面性质作为特征, 稳定性高, 提高了算法鲁棒性; 同时采用新提出的基于混沌映射的块置乱方法提高了水印图像安全性, 有效地解决了图像水印鲁棒性差和安全性低的问题.
2022, 31(12):159-168. DOI: 10.15888/j.cnki.csa.008866
摘要:针对无人机航拍场景下的实时目标检测任务, 以YOLOv5为基础进行改进, 给出了一种轻量化的目标检测网络YOLOv5-tiny. 通过将原CSPDarknet53骨干网络替换为MobileNetv3, 减小了网络模型的参数量, 有效提高了检测速度, 并进一步通过引入CBAM注意力模块和SiLU激活函数, 改善了因网络简化后导致的检测精度下降问题. 结合航拍任务数据集VisDrone的特性, 优化了先验框尺寸, 使用了Mosaic, 高斯模糊等数据增强方法, 进一步提高了检测效果. 与YOLOv5-large网络相比, 以降低17.4%的mAP为代价, 换取148%的检测效率(FPS)提升, 且与YOLOv5s相比, 在检测效果略优的情况下, 网络规模仅为其60%.
2022, 31(12):169-177. DOI: 10.15888/j.cnki.csa.008852
摘要:随着日新月异的高新技术不断发展, 物联网、大数据、人工智能交叉融合, 深度关联. 物联网全面融入了我们的生活、工作、社会发展等方方面面. 而物联网目前最广泛、最主流的协议当属MQTT协议, 低开销低带宽的先天优势促成了海量物联网设备接入网络. 但在万物互联时代大背景下, “自由可控, 安全可信”是行业发展的理念和标准. 目前很多研究者提出了从MQTT出发设计安全算法的方案, 但发现“基于MQTT的数据加密传输算法”该论文的核心算法存在密钥泄露的风险, 为此指出了其核心算法的缺陷并提出3种新的MQTT-SE算法. 分别是基于对称加密的MQTT-SE算法、基于公钥的MQTT-SE算法、基于公钥证书的双向认证MQTT-SE算法. 从而达到MQTT传输在低效能环境下的基础上达到高性能安全加密传输的目的.
2022, 31(12):178-186. DOI: 10.15888/j.cnki.csa.008890
摘要:针对目前现有的新闻推荐系统未能充分考虑新闻的语义信息, 对新闻文本建模因子的单一性问题, 提出注意力与多视角融合的新闻推荐算法(Attention-BodyTitleEvent, Attention-BTE). 利用BERT模型以及注意力机制分别对新闻标题、正文、事件向量化, 将三者融合即新闻向量化表示, 再对候选新闻和用户浏览新闻数据进行处理, 分别得到对应的候选新闻向量化和用户向量化, 并将其进行点乘得到用户点击候选新闻的概率, 即新闻推荐结果. 实验数据表明, 与其他的新闻推荐算法相比, 该模型在F1指标上提高了约6%.
2022, 31(12):187-194. DOI: 10.15888/j.cnki.csa.008851
摘要:针对工业生产中布匹瑕疵自动化检测模型训练时缺少带瑕疵位置信息的瑕疵布匹图像数据集的问题, 本文提出了一种以改进的部分卷积网络作为基本框架的带瑕疵位置信息的瑕疵布匹图像生成模型EC-PConv. 该模型引入小尺寸瑕疵特征提取网络, 将提取出的瑕疵纹理特征与空白mask拼接起来形成带有位置信息和瑕疵纹理特征的mask, 然后以修复方式生成带有瑕疵位置信息的瑕疵布匹图像, 另外, 本文提出一种结合MSE损失的混合损失函数以生成更加清晰的瑕疵纹理. 实验结果表明, 与最新的GAN生成模型相比, 本文提出的生成模型的FID值降低了0.51; 生成的瑕疵布匹图像在布匹瑕疵检测模型中查准率P和MAP值分别提高了0.118和0.106. 实验结果表明, 该方法在瑕疵布匹图像生成上比其他算法更稳定, 能够生成更高质量的带瑕疵位置信息的瑕疵布匹图像, 可较好地解决布匹瑕疵自动化检测模型缺少训练数据集的问题.
2022, 31(12):195-202. DOI: 10.15888/j.cnki.csa.008806
摘要:车辆检测是智能交通系统重要的一个研究方向. 针对监控视角下的车辆检测问题, 提出了一种改进YOLOX算法的车辆检测方法. 使用网络深度更小的YOLOX_S模型, 对网络结构改进. 使用GHOST深度可分离卷积模块代替部分传统卷积, 在保证模型检测精度的同时减少模型参数; 将CBAM注意力模块融合到特征提取网络中, 并添加特征增强结构, 加强特征提取网络获得的特征图语义信息, 增强提取网络对目标的检测能力; 通过使用CIoU_loss优化损失函数, 提高模型边界框的定位精度. 测试实验结果表明, 改进后的网络识别准确率提升了2.01%, 达到95.45%, 证明了改进方法的可行性.
2022, 31(12):203-210. DOI: 10.15888/j.cnki.csa.008830
摘要:现实世界的物体图像往往存在较大的类内变化, 使用单一原型描述整个类别会导致语义模糊问题, 为此提出一种基于超像素的多原型生成模块, 利用多个原型分别表示物体的不同语义区域, 通过图神经网络在生成的多个原型间利用上下文信息执行原型校正以保证子原型的正交性. 为了获取到更准确的原型表示, 设计了一种基于Transformer的语义对齐模块, 以挖掘查询图像特征和支持图像的背景特征中蕴含的语义信息, 此外还提出了一种多尺度特征融合结构, 引导模型关注同时出现在支持图像和查询图像中的特征, 提高对物体尺度变化的鲁棒性. 所提出的模型在PASCAL-5i数据集上进行了实验, 与基线模型相比平均交并比提高了6%.
2022, 31(12):211-219. DOI: 10.15888/j.cnki.csa.008860
摘要:铁路事故的相关信息以事故概况文本的形式存在, 对于铁路安全工作有重要意义. 但由于缺乏有效的信息抽取手段, 导致分散在文本中的铁路事故知识没有得到充分的利用. 命名实体识别是信息抽取的重要子任务, 目前关于事故领域的命名实体识别问题研究较少. 针对铁路事故命名实体识别问题, 提出一种融合字位置特征的命名实体识别模型, 该模型通过全连接神经网络获取字的位置特征, 并与语义层面的字向量合并作为字的最终向量表示输入BiLSTM-CRF模型获取最优标签序列. 实验结果表明, 模型在铁路事故文本命名实体识别问题上的准确率、召回率和F1值分别为93.29%、94.77%和94.02%, 相比于传统模型, 取得了更好的效果, 为铁路事故知识图谱的构建奠定基础.
2022, 31(12):220-226. DOI: 10.15888/j.cnki.csa.008837
摘要:为解决有限训练样本下的高光谱遥感图像分类特征提取不充分的问题, 该论文提出了多尺度3D胶囊网络方法来助力高光谱图像分类. 相比传统的卷积神经网络, 所提出的网络具有等变性且输入输出形式都是向量形式的神经元而非卷积神经网络中的标量值, 有助于获取物体之间的空间关系及特征之间的相关性, 且在有限训练样本下能避免过拟合等问题. 该网络通过3种不同尺度的卷积核操作对输入图像进行特征提取来获取不同尺度的特征. 然后3个分支分别接不同的3D胶囊网络来获取空谱特征之间的关联. 最后将3个分支得到的结果融合在一起, 采用局部连接并通过间隔损失函数得到分类结果. 实验结果表明, 该方法在开源的高光谱遥感数据集上具有很好的泛化性能, 且相比其他先进的高光谱遥感图像分类方法具有较高的分类精度.
2022, 31(12):227-234. DOI: 10.15888/j.cnki.csa.008874
摘要:块对角化(block diagonalization, BD)算法是一种多输入多输出的传统线性预编码算法, 其核心思想是通过奇异值分解(singular value decomposition, SVD)找到干扰矩阵零空间的正交基, 从而完全消除多用户干扰(multiuser interference, MUI), 但是随着收发端数目的增多, BD预编码算法所需的计算复杂也大大增加, 成为了制约其发展的关键因素之一. 为此, 本文提出了一种改进的低复杂度BD算法——基于正交分解中的施密特正交化求逆与格基规约操作的组合算法, 对传统BD算法两次高复杂度操作的奇异值分解用施密特正交化和格基规约操作进行替换, 从而降低算法复杂度. 结果表明, 本文改进算法的计算复杂度上降低了46.7%, 系统和容量上得到了2–10 bits/Hz的提高, 同时误码率上得到了2个量级的优化.
2022, 31(12):235-241. DOI: 10.15888/j.cnki.csa.008816
摘要:网络舆情信息挖掘是舆情研究的重要课题. 在大量的信息面前, 为了快速发掘有用性高的舆情信息为舆情的分析、决策提供助力, 提出一种面向特定观点的舆情信息有用性排序方法, 实现快速发掘特定观点下有用舆情信息的目的. 该方法针对舆情信息的具体观点进行分析计算, 同时根据舆情信息可信度和关注度、传播者的影响力, 并且结合信息时效性等因素, 利用排序方法进行打分, 根据舆情信息的得分进行有用性排序. 实验结果表明, 该方法能很好的完成对舆情信息的推荐排序. 本研究理论上对舆情信息挖掘的研究理论进行补充, 现实意义对舆情管理者有很好的辅助作用, 能够为网络舆情引导工作提供助力.
2022, 31(12):242-250. DOI: 10.15888/j.cnki.csa.008835
摘要:本文针对图像中小目标难以检测的问题, 提出了一种基于YOLOv5的改进模型. 在主干网络中, 加入CBAM注意力模块增强网络特征提取能力; 在颈部网络部分, 使用BiFPN结构替换PANet结构, 强化底层特征利用; 在检测头部分, 增加高分辨率检测头, 改善对于微小目标的检测能力. 本文算法在人脸瑕疵数据集和无人机数据集VisDrone2019两份数据集上均进行了多次对比实验, 结果表明本文算法可以有效地检测小目标.
2022, 31(12):251-258. DOI: 10.15888/j.cnki.csa.008827
摘要:在通用的目标检测算法中, 目标多变的尺度和特征融合利用一直是限制目标检测任务的难题. 针对上述问题, 首先文中提出了多路径特征融合模块, 模块采用跨尺度跨路径特征融合的方法, 强化输入输出特征之间的联系, 缓解了特征信息在传递时的稀释问题. 同时, 文中通过改进注意力模型提出了尺度感知模块, 该模块能根据目标的尺度自行地选择感受野大小, 从而使模型易于识别多尺度目标. 将尺度感知模块嵌入到多路径特征融合模块中, 使模型的特征提取和利用能力均得到提升. 经实验验证, 文中提出的算法在数据集PASCAL VOC和MS COCO上的平均检测精度分别达到了82.2%和38.0%, 相比基线FPN Faster RCNN分别提升了1.3%和0.6%, 其中对小尺度目标的检测效果提升最为显著.
2022, 31(12):259-265. DOI: 10.15888/j.cnki.csa.008856
摘要:地图匹配是将车辆原始的GPS轨迹数据映射到实际道路网络上的过程, 其中为GPS轨迹点检索候选路段是地图匹配的首要环节, 然而不同的候选路段检索方式会直接影响地图匹配的准确性和效率. 本文针对城市路网环境下的低频采样GPS轨迹数据, 提出了一种基于浮动网格的路段检索方法. 该方法利用GeoHash网格编码, 采用浮动GeoHash网格的方式, 为轨迹点检索候选路段. 其次为了验证方法的可行性, 本文通过隐马尔可夫模型, 结合道路网络的拓扑结构以及轨迹的时空约束条件, 采用增量的方式, 利用维特比算法计算得到局部最优解. 最后使用贪心策略, 从已经得到的局部最优解中依次延伸得到全局最佳匹配路径.
2022, 31(12):266-272. DOI: 10.15888/j.cnki.csa.008857
摘要:在许多数据挖掘的实际应用中要求每一个类别的实例数量相对平衡. 而独立子空间聚类的熵加权K-means算法(EWKM)会产生不均衡的划分, 聚类质量很差. 本文定义了一种兼顾平衡划分与特征分布的多目标熵, 然后应用该熵改进了EWKM算法的目标函数, 同利用迭代方法和交替方向乘子法设计其求解流程, 并提出基于熵的平衡子空间K-means算法(EBSKM). 最后, 在UCI、UCR等公开数据集进行聚类实验, 结果表明所提算法在准确率和平衡性方面都优于同类算法.
2022, 31(12):273-279. DOI: 10.15888/j.cnki.csa.008859
摘要:为了准确且实时地检测到交通标志指示牌, 减少交通事故的发生和推动智慧交通的发展, 针对现有的道路交通标志检测模型存在的精度不足、权重文件大、检测速度慢的问题, 设计了一种基于计算机视觉技术的改进YOLOv5s检测算法YOLOv5s-GC. 首先, 使用copy-paste进行数据增强后再送入网络进行训练, 加强对小目标的检测能力; 然后, 引入Ghost来构建网络, 削减原网络的参数和计算量, 实现轻量化模型; 最后, 将坐标注意力机制(coordinate attention)融合到骨干网络里, 增强对待测目标的表示和定位能力, 提高识别精度. 实验结果表明, YOLOv5s-GC模型相比于原YOLOv5s模型, 参数数目减少了12%, 检测速度提高了22%, 平均精度达到了94.2%, 易于部署且能满足实际自动驾驶场景中对识别交通标志的速度和准确度要求.
2022, 31(12):280-286. DOI: 10.15888/j.cnki.csa.008868
摘要:针对工业制品缺陷分类存在的样本图像少、分类准确性不足和模型训练耗时长等问题, 提出了一种基于深度森林的人机协同分类模型. 该模型首先通过深度森林对样本图像进行初步识别, 经多粒度扫描模块和级联森林模块提取特征, 得到初始预测结果并分离出识别困难的样本图像; 然后采用人机协同的策略, 采用人工方式随机标注部分识别困难的样本, 再利用K近邻算法对剩余识别困难的样本进行再分类. 通过在公开数据集以及生产线实际采集的真实数据上的实验结果表明, 改进的分类模型在工业制品表面缺陷数据集上的性能优于基线算法.
2022, 31(12):287-293. DOI: 10.15888/j.cnki.csa.008873
摘要:随着城市居民绿色低碳出行思想的提高, 网约车合乘出行方式应运而生. 但由于合乘模式涉及到的行驶路线问题, 乘客与乘客、乘客与驾驶员之间容易产生分歧, 并且网约车合乘出行模式的相关成本不明确等诸多问题, 网约车合乘模式没有被大范围推广和应用. 针对网约车合乘出行模式存在的问题, 研究并构建了网约车合乘路径优化模型, 模型中考虑了车辆等待时间成本、行驶距离成本、收益、容量约束以及时间窗约束等. 针对网约车合乘模型的特点, 并基于遗传算法思想, 研究设计了满足合乘模型约束条件的求解遗传算法. 并使用Matlab软件运行算法程序对算例进行求解, 运行44.08 s得到最大利润
2022, 31(12):294-300. DOI: 10.15888/j.cnki.csa.008875
摘要:在联邦学习背景下, 由于行业竞争、隐私保护等壁垒, 用户数据保留在本地, 无法集中在一处训练. 为充分利用用户的数据和算力, 用户可通过中央服务器协同训练模型, 训练得到的公共模型为用户共享, 但公共模型对于不同用户会产生相同输出, 难以适应用户数据是异质的常见情形. 针对该问题, 提出一种基于元学习方法Reptile的新算法, 为用户学习个性化联邦学习模型. Reptile可高效学习多任务的模型初始化参数, 在新任务到来时, 仅需几步梯度下降就能收敛到良好的模型参数. 利用这一优势, 将Reptile与联邦平均(federated averaging, FedAvg)相结合, 用户终端利用Reptile处理多任务并更新参数, 之后中央服务器将用户更新的参数进行平均聚合, 迭代学习更好的模型初始化参数, 最后将其应用于各用户数据后仅需几步梯度下降即可获得个性化模型. 实验中使用模拟数据和真实数据设置了联邦学习场景, 实验表明该算法相比其他算法能够更快收敛, 具有更好的个性化学习能力.
2022, 31(12):301-308. DOI: 10.15888/j.cnki.csa.008814
摘要:Docker镜像是Docker容器运行的基础, 目前缺少完善的镜像安全检测方法, 导致容器运行时易受到容器逃逸、拒绝服务攻击等各种安全威胁. 为避免有毒镜像使用, 本文提出一种Docker可信镜像源检测模型DTDIS (detect trusted Docker image source), 该模型使用可信密码模块vTCM (virtual trusted cryptography module)构建镜像基准值数据库, 检测本地镜像文件是否被篡改; 使用父镜像漏洞数据库扩展Clair镜像扫描器避免重复扫描; 结合文件度量信息、漏洞扫描信息判别Docker镜像源是否可信. 经云环境下实验证明, 该模型能够有效对Docker镜像进行安全评估, 保证用户使用可信镜像.
2022, 31(12):309-315. DOI: 10.15888/j.cnki.csa.008850
摘要:带视觉系统的水下机器人作业离不开对水下目标准确的分割, 但水下环境复杂, 场景感知精度和识别精度不高等问题会严重影响目标分割算法的性能. 针对此问题本文提出了一种综合YOLOv5和FCN-DenseNet的多目标分割算法. 本算法以FCN-DenseNet算法为主要分割框架, YOLOv5算法为目标检测框架. 采用YOLOv5算法检测出每个种类目标所在位置; 然后输入针对不同类别的FCN-DenseNet语义分割网络, 实现多分支单目标语义分割, 最后融合分割结果实现多目标语义分割. 此外, 本文在Kaggle竞赛平台上的海底图片数据集上将所提算法与PSPNet算法和FCN-DenseNet算法两种经典的语义分割算法进行了实验对比. 结果表明本文所提的多目标图像语义分割算法与PSPNet算法相比, 在MIoU和IoU指标上分别提高了14.9%和11.6%; 与FCN-DenseNet算法在MIoU和IoU指标上分别提高了8%和7.7%, 更适合于水下图像分割.
2022, 31(12):316-321. DOI: 10.15888/j.cnki.csa.008900
摘要:针对货车利用躲避摄像头等手段在城市道路中不按规定时间、规定线路行驶, 使得车辆不能被准确识别的问题, 提出基于改进Faster RCNN的城市道路货车检测方法. 该方法以Faster RCNN为基础模型, 通过对传入主干网络的车辆图片进行卷积和池化等操作来提取特征, 其中增加特征金字塔网络(FPN)提升对多尺度目标检测的精度; 同时将K-means聚类算法应用在数据集上以获取新的锚点框; 利用RPN (region proposal network)生成建议框; 并使用CIoU (complete-IoU)损失函数代替原算法的smoothL1损失函数以提升检测车辆的精确性. 实验结果显示, 改进后的Faster RCNN相比原算法对货车检测的平均精度(AP)提高7.2%, 召回率(recall)提高6.1%, 减少了漏检的可能, 在不同场景下具有良好的检测效果.
2022, 31(12):322-328. DOI: 10.15888/j.cnki.csa.008855
摘要:针对传统SURF的图像匹配算法存在计算数据复杂、耗时长、匹配正确率不佳等问题, 提出一种基于改进SURF的图像匹配算法. 首先, 用传统SURF算法来提取待匹配图像的特征点, 再通过圆形区域代替矩形区域将SURF的64维度描述符降到20维度; 采用KNN, 来双向匹配待匹配图像的特征点, 得到双向的初始特征点匹配对集; 最后, 通过RANSAC算法对初始匹配对集进行双向剔除错误的匹配对. 实验的结果表明, 本文算法减少了特征点检测时间, 提高了匹配正确率, 还有较好的鲁棒性.
2022, 31(12):329-334. DOI: 10.15888/j.cnki.csa.008876
摘要:针对文化算法收敛速度慢、易陷入局部最优解以及种群多样性少的问题, 本文对文化算法进行优化设计, 提出一种将带有精英保留策略的遗传算法(GA)和模拟退火算法(SA)纳入文化算法(CA)框架的混合优化算法. 此算法基于协同进化的思想, 算法分为下层种群空间和上层信念空间, 两个空间采用了相同的进化机制, 但使用不同的参数. 在文化算法的基础上加入带有精英保留策略的遗传算法, 使种群中的优秀个体直接进入下一代, 以此提高收敛速度; 加入模拟退火算法, 利用其具有突变的特点, 概率性的跳出局部最优并接受劣质解, 以此增加种群多样性. 函数优化结果证明了算法的有效性, 将此算法用于求解最小化最大完工时间的流水车间调度问题, 仿真结果显示, 此算法在收敛速度和精度方面都优于其他几个具有代表性的算法.
2022, 31(12):335-341. DOI: 10.15888/j.cnki.csa.008863
摘要:工业产品的回收再制造有利于降低生产成本和保护环境, 而制定优秀的产品拆解序列规划提高拆解效率、降低回收成本为其关键. 针对回收设备在实际拆解中的因素, 建立一种基于离散鲸鱼算法(DWOA)的拆解序列规划模型. 该模型目标函数以位置改变为代价作为新的评价指标, 利用分层组合的方法快速生成初始群体. 离散鲸鱼算法具有优先保护约束交叉机制、启发式变异、优秀的全局和局部搜索能力. 以回收上橡皮板和空气围带进行对比实验, 结果表明在相同时间下, 离散鲸鱼算法的算法稳定性、寻优能力、收敛速度都要优于其他算法.
2022, 31(12):342-349. DOI: 10.15888/j.cnki.csa.008560
摘要:目前卷积神经网络已经在SAR目标识别领域得到了广泛应用, 然而, 由于SAR图像的目标样本数量过少, 以及图像相干斑噪声的存在, 使得网络不能充分的学习样本深层特征, 对网络的识别性能会造成一定的影响. 针对上述问题, 提出一种基于数据融合的目标识别方法, 算法首先对原始图像分别进行噪声抑制和边缘信息提取处理, 然后将处理后的两类特征信息进行数据融合, 将单通道灰度图像融合扩充至双通道图像来作为训练样本, 同时构建了一个高低层特征融合的卷积神经网络模型, 使用注意力机制来加强了对有用特征的学习, 实验结果显示, 该方法在MSTAR数据集上, 表现了对不同目标型号的优秀识别效果.
2022, 31(12):350-358. DOI: 10.15888/j.cnki.csa.008833
摘要:随着Android应用软件数量的急速增加, Android应用质量的重要性越来越受到人们的重视. 测试是高质量软件的重要保证, 而测试用例生成技术是自动化测试的关键. 数据显示, 在Google Play中有将近88%的Android应用程序使用了反射. 然而, 现有的Android测试用例自动生成方法通常没有考虑反射技术的使用, 无法检测出反射隐藏的恶意行为. 为了进一步提高软件质量, 本文提出一种新的Android测试用例生成方法, 结合反射特征构造Android应用程序多粒度模型, 同时对反射关系进行分析, 生成能到达反射的调用路径, 并利用自适应遗传算法生成覆盖反射路径的测试用例, 对含反射特征的Android应用进行测试. 为验证本文方法, 分别从Android应用多粒度模型有效性及测试方法效率两方面对本文方法有效性进行评估. 实验结果表明, 本文提出的基于反射特征的Android测试用例自动生成方法对于反射的检测效果更好并且效率更高.
2022, 31(12):359-367. DOI: 10.15888/j.cnki.csa.008836
摘要:网络信息体系是我军构建的新一代指挥控制作战体系, 具有动态应对任务和环境变化的优势, 通过对全网作战资源实施优选, 实现作战效能最大化. 随着人工智能等技术的发展, 当前主要依靠预案实施的优选方法无法适应智能、无人设备自进化, 且对战场态势覆盖不足. 针对上述缺陷, 本文以防空反导作战体系为例, 研究在物理节点损毁的情况下的资源集成方案求解问题, 采用down-selection模式将资源集成方案求解问题转化为组合优化问题, 通过增加扰动限制改进了演化初始策略形成机制, 提出了基于演化博弈的资源优选方法. 方法在Netlogo平台上进行了仿真, 验证了有效性, 且对比基于遗传算法的资源优选方法, 所求的方案任务完成度平均提高6.4%.
2022, 31(12):368-374. DOI: 10.15888/j.cnki.csa.008784
摘要:针对当前病人运送问题主要以燃油车为主展开研究, 本文围绕电动车运送病人问题建模, 并对燃油及电动车病人运送算例进行对比分析, 以验证电动车运送病人的可行性和优越性. 首先构建燃油车病人运送数学模型, 考虑了每位病人最长乘车时间、车辆最大平均行驶速度和病人时间窗等约束, 以燃油车的行驶消耗成本和加油成本之和最小化为目标. 其次构建电动车病人运送数学模型, 考虑了电车充电时间、剩余电量、电车最大平均行驶速度、每位病人最长乘车时间以及病人时间窗等约束, 以电动车行驶消耗成本和充电成本之和最小化为目标. 最后选取算例并利用LINGO软件进行编程求解, 验证数学模型的可行性和有效性.
2022, 31(12):375-382. DOI: 10.15888/j.cnki.csa.008871
摘要:在考虑用户隐私的保护多源域数据背景下预测疾病得分的问题中, 来自不同源域的数据分散存储无法合并, 且可能服从不同的分布, 因此传统的机器学习方法无法合理地利用源域数据的信息. 本文结合联邦学习的思想和基于样本的迁移学习方法, 提出了联邦重要性加权方法, 通过将源域的样本重用于目标域的预测任务, 而且不需要进行源域之间的数据共享, 实现了在保护源域的数据隐私的情况下利用分布不同的多源域的信息提升目标域预测的精度. 并且基于提出的方法, 本文构造了一种加权模型并提供了一个简洁通用的算法用于求解目标域的预测模型. 数值模拟以及实证结果表明, 相对于未考虑分布迁移的传统方法, 联邦重要性加权方法可以有效地利用多源域数据的信息, 在目标域的预测精度上具有优势, 以及在帕金森疾病数据中做出精准的疾病得分预测.
2022, 31(12):383-389. DOI: 10.15888/j.cnki.csa.008829
摘要:在过去半个多世纪中, 随着计算机技术的发展, 神经网络已经在图像、语音、决策等众多领域取得了广泛的应用. 不同学者为了提高神经网络的准确率设计了大量的网络结构, 神经网络也变得越来越复杂和多参数化. 这使得神经网络的训练过程具有很强的非凸性, 相同的网络不同的初始参数往往会训练出不同的模型. 为了更精准地描述两个网络的表现, 前人提出通过统计学方法—随机占优(stochastic dominance)评估不同随机种子对同一网络训练出的不同模型的表现的分布. 本文在此基础上认为, 不同模型在测试集中不同样本上的表现的分布同样值得关注, 并将随机占优方法应用到不同模型在不同样本表现分布的对比中. 通过对图像分割应用中的网络进行实验, 本文关注到不同网络训练出的两个模型其中一个尽管在表现分数上具有一定的优势, 但是其在测试集中不同样本中表现出的离散度可能更强. 实际应用需要表现分数更好同时离散度尽可能小的神经网络模型, 随机占优方法可以有效地对不同模型进行比较从而筛选出更适合的模型.
2022, 31(12):390-397. DOI: 10.15888/j.cnki.csa.008869
摘要:室内障碍物的布局会对人群时空分布、疏散安全和效率产生重要影响. 为调查其影响, 构建带有障碍物的单室单出口人群疏散模型. 同时, 通过3种不同的影响因素(即障碍物长度、障碍物与出口距离、障碍物偏离出口中心距离)来分析它们对人群疏散效率和安全的影响. 研究结果发现障碍物长度与疏散效率成正向关系, 而与疏散安全成反向关系; 障碍物与出口距离与疏散效率和安全皆成正向关系; 障碍物偏离出口中心距离与疏散效率和安全成反向关系. 此外, 本研究还使用多目标进化算法来对室内障碍物布局进行优化, 所得结果可以为决策者平衡疏散安全和效率问题提供重要参考.
2022, 31(12):398-404. DOI: 10.15888/j.cnki.csa.008956
摘要:网络攻击的手段层出不穷, 如中间人攻击, 重放攻击, DoS攻击等, 以此获取不当利益. 密钥协商协议的设立是为合法用户提供正确认证入口, 并拒绝攻击者的非法接入和攻击. 密钥协商协议是保护移动通信提高服务质量的第一道安全防线, 5G网络密钥协商协议在实际环境中仍然存在安全隐患, 其协议本身的安全特性能否满足要求仍未可知, 本文提出使用基于概率模型检测的方法, 通过对5G网络密钥协商协议的各协议方实体进行建模, 建立离散时间马尔科夫链模型, 在建模过程中考虑外界的攻击影响, 引入攻击率来描述外界的影响程度, 通过攻击率对5G网络密钥协商协议的研究进行定量分析, 使用概率计算树逻辑对待验属性规约进行编码描述, 利用概率模型检测工具PRISM进行实验. 实验结果表明: 在引入攻击率的5G网络密钥协商协议模型中, 5G网络密钥协商协议各协议方实体所受攻击的影响对该协议的时延性, 有效性, 保密性等属性规约的性能有不同程度的影响, 因此, 研究外界网络攻击对协议的安全性能的影响, 对加强协议安全性能及其改进具有一定借鉴意义, 并对5G网络密钥协商协议的安全特性的提升和保护用户的经济与信息安全具有很大的意义.
2022, 31(12):405-411. DOI: 10.15888/j.cnki.csa.008823
摘要:针对属性值为区间直觉模糊数的多属性群决策问题, 考虑到模糊性和随机性对群决策过程及结果的影响, 本研究将利用云模型理论结合区间直觉模糊数的特征, 运用灰色关联系数法和信息熵理论确定专家和属性权重, 通过信息集结构建综合评价云模型. 不同于传统的区间直觉模糊数的排序方法, 本研究利用云模型的3En规则将区间直觉模糊数进行云转换并通过云相似度确定方案的综合评价值和犹豫度, 然后对决策方案进行比较分析. 研究结果表明: 该方法能够科学有效地进行决策, 进而为决策方提供科学依据.
2022, 31(12):412-419. DOI: 10.15888/j.cnki.csa.008870
摘要:针对室内环境下智能监控视频对光照变化产生的阴影难以识别、分割困难等问题, 提出一种结合迁移学习方式和SENet通道注意力机制的UNet网络. 首先, 针对阴影特征模糊难以有效提取的问题, 在UNet模型的上采样部分, 添加SENet通道注意力机制, 在不增加网络参数的同时, 提高有效区域的特征权重; 并将预训练好的VGG16网络迁移到UNet模型中, 实现特征迁移和参数共享, 提高模型的泛化能力, 减少训练成本; 最后通过解码器得到分割结果. 实验结果表明, 改进的UNet算法相比于原UNet算法在对运动目标的分割精度上达到了96.09%, 对阴影的分割精度上达到92.24%, 平均交并比(MIOU)达到92.58%, 算法性能指标有显著提升.