• 2023年第32卷第8期文章目次
    全 选
    显示方式: |
    • >综述文章
    • 问答系统研究综述

      2023, 32(8):1-18. DOI: 10.15888/j.cnki.csa.009208

      摘要 (1141) HTML (3691) PDF 2.28 M (6970) 评论 (0) 收藏

      摘要:问答系统是人工智能和自然语言处理领域中具有广泛发展前景的研究方向之一. 早期的问答系统限定以自然语言形式进行提问和回答, 近年来, 随着多模态知识图谱、多模态预训练模型的发展, 支持文字、图片、音频、视频等多种模态间信息查询的广义问答系统逐渐成为新的研究热点, 其以多媒体方式展示结果, 更加直观、全面. 本文根据问答系统任务对象的变化, 将问答系统划分为3种类型: 专用问答系统、通用问答系统和多模态问答系统. 分析了这3种类型的问答系统发展过程中所面临的问题, 着重总结每个阶段所采用的关键技术与方法, 同时对问答系统在工业上的应用进行了举例说明, 并对未来研究方向进行了展望.

    • 以双目图像互为监督的相容解迭代优选算法

      2023, 32(8):19-30. DOI: 10.15888/j.cnki.csa.009233

      摘要 (724) HTML (852) PDF 4.78 M (2054) 评论 (0) 收藏

      摘要:在计算机视觉领域的双目立体匹配方向, 基于神经网络的深度学习算法需要场景数据集进行训练, 泛化能力差. 针对这两个问题, 根据神经网络能够模拟函数的特点, 提出一种无需在数据集上训练, 以双目图像互为监督的深度场景相容解迭代优选算法. 该算法使用场景位置猜测网络模拟关于当前双目图像的深度场景相容位置空间, 用与该网络匹配的互监督损失函数通过梯度下降法指导该网络在输入双目图像上迭代学习, 搜索深度场景相容位置空间中的可行解, 整个算法过程无需在数据集上训练. 与CREStereo、PCW-Net、CFNet等算法在Middlebury标准数据集图像上的对比实验表明, 该算法在非遮挡区域的平均误匹配率为2.52%, 在所有区域的平均误匹配率为7.26%, 比对比实验中的其他算法有更低的平均误匹配率.

    • 数字孪生: 跨界赋能于多领域智能的新应用

      2023, 32(8):31-41. DOI: 10.15888/j.cnki.csa.009191

      摘要 (757) HTML (1920) PDF 1.83 M (2411) 评论 (0) 收藏

      摘要:随着大数据、5G、人工智能、CPS、云计算、物联网技术的发展与交叉融合, 使得世界朝着数字化、智能化方向发展. 数字孪生是以物理实体为原型建立多维虚拟模型, 通过安装在物理本体上的传感器实时反馈数据, 并结合以往的历史数据和人工智能技术, 最后利用软件分析并呈现. 由于数字孪生技术能与多个先进理念, 如: 工业4.0、航空航天、智慧城市、智慧医疗等良好的融合并应用, 这使其成为多个行业的热门研究方向与主要驱动技术, 在各行各业都有很大的发展空间. 本文首先阐述了数字孪生技术的基本概念, 梳理了数字孪生技术的发展脉络, 进一步理清了数字孪生技术与CPS技术之间的关系, 并介绍了数字孪生技术的研究现状. 其次, 介绍了数字孪生的关键技术即多维多尺度建模, 孪生数据管理和虚拟呈现. 最后, 探讨了数字孪生技术在智慧工厂领域、智慧城市领域、孪生医疗领域、航空航天领域的应用发展和方向, 并从方案、特点、关键技术等角度介绍了本研究团队在智慧工厂领域对原稳加热炉设备的数字孪生应用案例.

    • 基于MIFNet的婴儿面部表情识别

      2023, 32(8):42-53. DOI: 10.15888/j.cnki.csa.009183

      摘要 (806) HTML (1282) PDF 2.98 M (1724) 评论 (0) 收藏

      摘要:婴儿面部表情智能化识别, 可辅助看护人员更好地关注婴儿的身心健康. 由于婴儿面部线条流畅且五官锐感偏弱导致面部表情类间相似性高于成人, 为了解决类间相似性高的问题, 提出多尺度信息融合网络. 该网络整体分为2个阶段: 在第1阶段使用融合模块在空间域与通道域双重维度下融合局部特征与全局特征, 增强特征的表达能力; 在第2阶段采用自适应深度中心损失, 利用注意力机制估计融合特征的权重用以指导中心损失, 促进婴儿表情特征的类内紧凑和类间分离. 实验结果表明, 多尺度信息融合网络在婴儿面部表情数据集中识别准确率达到95.46%, 在AUC、召回率和F1得分3个评价指标上分别达到99.07%、95.88%和95.89%, 与现有面部表情识别网络相比, 识别效果最优. 将多尺度信息融合网络在公开面部表情数据集上进行泛化性实验, 准确率达到89.87%.

    • 低分辨率图像的妆容迁移算法

      2023, 32(8):54-66. DOI: 10.15888/j.cnki.csa.009184

      摘要 (568) HTML (970) PDF 2.57 M (1827) 评论 (0) 收藏

      摘要:现有的妆容迁移算法效果优越, 功能丰富, 但是较少考虑到输入图像为低分辨率的场景. 当高分辨率图像难以获得时, 现有的妆容迁移算法将难以适用, 妆容无法完全迁移. 为此本文提出了一种适用于低分辨率图像的妆容迁移算法, 将包含妆容信息的特征矩阵作为先验信息, 将超分辨率网络与妆容迁移网络结合在一起产生协同效应, 即使输入的图像为低分辨率图像, 也能输出高分辨率的妆容迁移结果, 并且充分保留妆容细节的同时提升姿势和表情的鲁棒性. 由于使用端到端的模型实现妆容迁移与超分辨率, 因此设计了一组联合损失函数, 包括生成对抗损失、感知损失、循环一致性损失、妆容损失和均方误差损失函数. 所提出的模型在妆容迁移与超分辨率的定性实验和定量实验中均达到了先进水平.

    • 基于呼伦贝尔大河湾地区的智能作物生育期识别系统

      2023, 32(8):67-74. DOI: 10.15888/j.cnki.csa.009141

      摘要 (609) HTML (879) PDF 4.22 M (1667) 评论 (0) 收藏

      摘要:作物全生命周期的标准生长模型建立是指导获得最佳作物“处方” (作业精准决策、执行)的必要手段. 智能作物生育期识别技术是构建作物标准生长模型的重要技术之一. 在呼伦贝尔大河湾地区大面积规模化的作物种植形势下, 基于传统人工经验或单一传感器进行作物生育期表型数据采集、识别的方法会导致采集范围局限、识别效率低等问题. 针对上述问题, 对整体系统提出了一系列的改进. 首先, 在数据采集阶段, 提出了一套完整的“空-地-人”一体化作物表型数据采集体系. 另外, 在数据分析阶段, 根据作物不同表型数据, 提出了一种改进的智能作物生育期识别体系. 提出的生育期识别系统能够实时精准地提供当前作物生育期阶段, 为建立作物全生命周期的标准生长模型奠定了优良的基础.

    • 基于区块链的物联网设备自主管控方案

      2023, 32(8):75-85. DOI: 10.15888/j.cnki.csa.009188

      摘要 (630) HTML (1069) PDF 3.81 M (1642) 评论 (0) 收藏

      摘要:传统物联网设备管理系统可能存在隐私数据易泄露、设备运行情况难掌握、异常事件难追溯等痛点, 给个人、企业乃至社会层面都带来了不利影响. 针对以上问题, 本文设计了一种基于区块链的物联网设备自主管控及管控行为审计方案, 通过区块链存证技术将接入系统的设备信息锚定至区块链, 对设备全生命周期进行管理; 基于智能合约技术实现对物联网设备的数据采集、分析及远程管控的一体化自主管控流程; 最后, 结合区块链不可篡改和可追溯的特性对用户行为进行安全审计. 分析结果表明, 本方案具备安全性高、扩展性强等特点, 为构建物联网系统安全管理架构提供了思路.

    • 基于Kubernetes的AI调度引擎平台

      2023, 32(8):86-94. DOI: 10.15888/j.cnki.csa.009182

      摘要 (804) HTML (1969) PDF 1.52 M (2109) 评论 (0) 收藏

      摘要:文中介绍了基于Kubernetes的AI调度引擎平台的设计与实现, 针对当前人工智能调度系统中存在的服务配置复杂, 集群中各节点计算资源利用率不均衡以及系统运维成本高等问题, 本文提出了基于Kubernetes实现容器调度和服务管理的解决方案. 结合AI调度引擎平台的需求, 从功能实现和平台架构等方面设计该平台的各个模块. 同时, 针对Kubernetes无法感知GPU资源的问题, 引入device plugin收集集群中每个节点上的GPU信息并上报给调度器. 此外, 针对Kubernetes调度策略中优选算法只考虑节点本身的资源使用率和均衡度, 未考虑不同类型的应用对节点资源的需求差异, 提出了基于皮尔逊相关系数 (Pearson correlation coefficient, PCC)的优选算法, 通过计算容器资源需求量与节点资源使用率的互补度来决定Pod的调度, 从而保证调度完成后各节点的资源均衡性.

    • 基于多智能体深度强化学习的协作导航应用

      2023, 32(8):95-104. DOI: 10.15888/j.cnki.csa.009200

      摘要 (711) HTML (1166) PDF 2.50 M (1731) 评论 (0) 收藏

      摘要:多机器人协作导航目前广泛应用于搜索救援、物流等领域, 协作策略与目标导航是多机器人协作导航面临的主要挑战. 为提高多个移动机器人在未知环境下的协作导航能力, 本文提出了一种新的分层控制协作导航(hierarchical control cooperative navigation, HCCN) 策略, 利用高层目标决策层和低层目标导航层, 为每个机器人分配一个目标点, 并通过全局路径规划和局部路径规划算法, 引导智能体无碰撞地到达分配的目标点. 通过Gazebo平台进行实验验证, 结果表明, 文中所提方法能够有效解决协作导航过程中的稀疏奖励问题, 训练速度至少可提高16.6%, 在不同环境场景下具有更好的鲁棒性, 以期为进一步研究多机器人协作导航提供理论指导, 应用至更多的真实场景中.

    • 基于端到端的多任务商标分卡模型

      2023, 32(8):105-115. DOI: 10.15888/j.cnki.csa.009210

      摘要 (542) HTML (757) PDF 3.85 M (1580) 评论 (0) 收藏

      摘要:目前商标分卡处理方法是先进行文本检测再进行区域分类, 最后对不同的区域进行拆分组合形成商标分卡. 这种分步式的处理耗时长, 并且因为误差的叠加会导致最终结果准确率下降. 针对这一问题, 本文提出了多任务的网络模型TextCls, 通过设计多任务学习模型来提升商标分卡的检测和分类模块的推理速度和精确率. 该模型包含一个特征提取网络, 以及文本检测和区域分类两个任务分支. 其中, 文本检测分支采用分割网络学习像素分类图, 然后使用像素聚合获得文本框, 像素分类图主要是学习文本像素和背景像素的信息; 区域分类分支对区域特征细分为中文、英文和图形, 着重学习不同类型区域的特征. 两个分支通过共享特征提取网络, 像素信息和区域特征相互促进学习, 最终两个任务的精确率得以提升. 为了弥补商标图像的文本检测数据集的缺失以及验证TextCls的有效性, 本文还收集并标注了一个由2000张商标图像构成的文本检测数据集trademark_text (https://github.com/kongbailongtian/trademark_text), 结果表明: 与最佳的文本检测算法相比, 本文的文本检测分支将精确率由94.44%提升至95.16%, 调和平均值F1 score达92.12%; 区域分类分支的F1 score也由97.09%提升至98.18%.

    • 轻量化自监督单目深度估计

      2023, 32(8):116-125. DOI: 10.15888/j.cnki.csa.009203

      摘要 (637) HTML (753) PDF 2.71 M (1988) 评论 (0) 收藏

      摘要:目前, 大多数的增强现实和自动驾驶应用不仅会使用到深度网络估计的深度信息, 还会使用到位姿网络估计的位姿信息. 将位姿网络和深度网络同时集成到嵌入式设备上, 会极大地消耗内存. 为解决这一问题, 提出一种深度网络和位姿网络共用特征提取器的方法, 使模型保持在一个轻量级的尺寸. 此外, 通过带有线性结构的深度可分离卷积轻量化深度网络, 使网络在不丢失过多细节信息前提下还可获得更少的参数量. 最后, 通过在KITTI数据集上的实验表明, 与同类算法相比, 该位姿网络和深度网络参数量只有的 35.33 MB. 同时, 恢复深度图的平均绝对误差也保持在0.129.

    • 基于CycleGAN的灰度图像彩色化方法

      2023, 32(8):126-132. DOI: 10.15888/j.cnki.csa.009195

      摘要 (692) HTML (1162) PDF 1.47 M (2248) 评论 (0) 收藏

      摘要:当前主流的图片彩色化方法包括传统算法和深度学习方法. 随着深度学习模型的发展, 基于深度学习的灰度图像彩色化方法能带来更好的着色效果, 但仍然存在细节损失和着色枯燥问题. 针对上述问题, 本文将CycleGAN模型应用在非单一类别的灰度图像彩色化上, 使其在动物、植物、风景等图片上有逼真的着色效果. 模型结构上对CycleGAN模型的激活函数加以改进, 在生成器使用PReLU激活函数, 使模型更易于训练. 在判别器使用PatchGAN提高图片高分辨率上的颜色细节. 通过ImageNet数据集5个热门类别图像的训练后, 模型对动植物与风景图彩色化的效果十分逼真. 在图像评估指标中, 该模型在PSNR中比GAN高了0.603 dB约有2.1%的提升, 在SSIM中明显高于其他模型, 在效果上有5.1%的提升. 从视觉感受来看, 通过CycleGAN彩色化的图片饱和度更高, 在视觉真实性上高于VGG和GAN等模型, 解决了着色枯燥问题, 而且更容易还原图片中的颜色细节, 避免细节损失.

    • SDN环境下DDoS攻击检测和缓解系统

      2023, 32(8):133-139. DOI: 10.15888/j.cnki.csa.009206

      摘要 (670) HTML (1153) PDF 1.41 M (1916) 评论 (0) 收藏

      摘要:分布式拒绝服务攻击(distributed denial of service, DDoS)是网络安全领域的一大威胁. 作为新型网络架构, 软件定义网络(software defined networking, SDN)的逻辑集中和可编程性为抵御DDoS攻击提供了新的思路. 本文设计并实现了一个轻量级的SDN环境下的DDoS攻击检测和缓解系统. 该系统使用熵值检测方法, 并通过动态阈值进行异常判断. 若异常, 系统将使用更精确的决策树模型进行检测. 最后, 控制器通过计算流的包对称率确定攻击源, 并下发阻塞流表项. 实验结果表明, 该系统能够及时响应DDoS攻击, 具有较高的检测成功率, 并能够有效遏制攻击.

    • 基于风格的数据集水印算法

      2023, 32(8):140-150. DOI: 10.15888/j.cnki.csa.009207

      摘要 (529) HTML (1097) PDF 1.94 M (1226) 评论 (0) 收藏

      摘要:开源数据集加速了深度学习的发展, 但存在许多不合理使用数据集的现象. 为保护数据集的知识产权, 近期工作提出数据集水印算法, 在数据集发布前预先植入水印, 当模型在此数据集上训练时该水印会被附着在模型中, 之后通过验证可疑模型是否存在水印来追溯数据集的非法使用. 但已有数据集水印算法无法在小扰动下提供有效并且隐蔽的黑盒水印验证. 为解决这一问题, 本文首次提出利用独立于图像内容与标签的风格属性来植入水印, 并限制对原数据集的扰动不涉及标签的修改. 通过不引入图像内容与标签的不一致性和额外的代理模型保证水印隐蔽性和有效性. 在水印验证阶段仅使用可疑模型的预测结果通过假设检验给出判断. 本文在CIFAR-10数据集上与现有5种方法相比较, 实验结果验证了本文提出的基于风格的数据集水印算法的有效性与功能不变性. 此外, 本文开展的消融实验验证了本文所提的风格优化模块的必要性, 算法在不同超参设定以及不同数据集下的有效性.

    • 改进YOLOv5的瓷砖表面缺陷检测

      2023, 32(8):151-161. DOI: 10.15888/j.cnki.csa.009185

      摘要 (828) HTML (1907) PDF 3.02 M (2223) 评论 (0) 收藏

      摘要:现有瓷砖表面缺陷检测存在识别微小目标缺陷能力不足、检测速度有待提升的问题, 为此本文提出了基于改进YOLOv5的瓷砖表面缺陷检测方法. 首先, 由于瓷砖表面缺陷尺寸偏小的特性, 对比分析YOLOv5s的3个目标检测头分支的检测能力, 发现删除大目标检测头, 只保留中目标检测头和小目标检测头的模型检测效果最佳. 其次, 为了进一步实现模型轻量化, 使用ghost convolution和C3Ghost模块替换YOLOv5s在Backbone网络中的普通卷积和C3模块, 减少模型参数量和计算量. 最后, 在YOLOv5s的Backbone和Neck网络末端添加coordinate attention注意力机制模块, 解决原模型无注意力偏好的问题. 该方法在天池瓷砖瑕疵检测数据集上进行实验, 实验结果表明: 改进后的检测模型的平均精度均值达66%, 相比于原YOLOv5s模型提升了1.8%; 且模型大小只有10.14 MB, 参数量相比于原模型减少了48.7%, 计算量减少了38.7%.

    • 融合GRU和CNN的轻量级网络入侵检测模型

      2023, 32(8):162-170. DOI: 10.15888/j.cnki.csa.009194

      摘要 (699) HTML (2108) PDF 1.20 M (2429) 评论 (0) 收藏

      摘要:当前网络流量数据呈现出高维、多态、海量的特点, 这对入侵检测是一个新挑战. 针对传统入侵检测模型中检测效率低、缺乏轻量化考虑等局限性, 提出了一种融合GRU和CNN的轻量级网络入侵检测模型. 首先使用极度随机树删除数据集中的冗余特征; 其次使用GRU进行特征提取. 考虑到数据中的长短期依赖关系, 将所有隐藏层输出作为序列特征信息进行下一步处理; 再通过带有逆残差、深度可分离卷积、空洞卷积等结构的轻量化CNN模型进行空间特征提取; 为了加速模型收敛加入了通道注意力机制. 最后在CIC-IDS2017数据集上的实验表明, 该方法具有优秀的检测性能, 同时也具有模型参数量少、模型体积小、训练时间短、检测时间短等优点, 适用于网络流量的入侵检测工作.

    • 基于GRA-IWOA-ELM的航空煤油闪点值预测

      2023, 32(8):171-179. DOI: 10.15888/j.cnki.csa.009161

      摘要 (561) HTML (744) PDF 1.97 M (1354) 评论 (0) 收藏

      摘要:针对常一线航空煤油闪点值预测提出基于灰色关联分析法 (grey correlative analysis, GRA)与改进的鲸鱼优化算法(improved whale algorithm, IWOA)优化极限学习机 (extreme learning machine, ELM)的软测量方法. 利用GRA计算出各个辅助变量与待测变量的信息关联度, 通过实验法选取辅助变量作为输入, 然后利用IWOA为ELM寻找最优权阈值. 在算法迭代前期, 利用改进的Tent混沌映射进行种群初始化使种群分布更加均匀, 利用自适应权重结合随机差分变异策略来提升算法的寻优能力, 通过8个基准测试函数对改进算法的有效性进行验证. 通过某炼油厂常压塔常一线航空煤油闪点实际数据, 验证了改进模型对闪点值预测的有效性.

    • 基于目标和关键点检测的单目托盘定位

      2023, 32(8):180-188. DOI: 10.15888/j.cnki.csa.009181

      摘要 (503) HTML (782) PDF 2.44 M (1621) 评论 (0) 收藏

      摘要:托盘的识别与定位是无人叉车中关键的问题之一. 当前托盘定位多采用目标检测的方法, 然而目标检测只能识别托盘在图像中的位置, 无法得到托盘的空间信息. 针对此问题, 本文提出了一种基于目标和关键点检测的单目托盘定位方法, 用于检测托盘并计算托盘当前的倾角和距离. 首先对托盘进行目标检测, 然后将检测的结果进行裁剪后输入到关键点检测网络中. 通过对托盘关键点的检测和托盘固有的几何外形特征, 设计边缘自适应调整, 得到高精度的托盘轮廓信息. 根据几何约束提出了基于轮廓点的托盘倾角与距离计算方法, 并采用RANSAC算法提升了计算结果的精度和稳定性, 解决了托盘的定位问题. 实验表明, 本文提出的算法在倾角计算上平均误差在5°以内, 水平距离计算上平均误差在110 mm以内, 能较好地定位托盘, 具有较高的实用价值.

    • 改进蚁群与动态Q学习融合的机器人路径规划

      2023, 32(8):189-197. DOI: 10.15888/j.cnki.csa.009160

      摘要 (561) HTML (778) PDF 1.87 M (1729) 评论 (0) 收藏

      摘要:基本Q学习算法应用于路径规划时, 动作选择的随机性导致算法前期搜索效率较低, 规划耗时长, 甚至不能找到完整的可行路径, 故提出一种改进蚁群与动态Q学习融合的机器人路径规划算法. 利用精英蚂蚁模型和排序蚂蚁模型的信息素增量机制, 设计了一种新的信息素增量更新方法, 以提高机器人的探索效率; 利用改进蚁群算法的信息素矩阵为Q表赋值, 以减少机器人初期的无效探索; 设计了一种动态选择策略, 同时提高收敛速度和算法稳定性. 在不同障碍物等级的二维静态栅格地图下进行的仿真结果表明, 所提方法能够有效减少寻优过程中的迭代次数与寻优耗时.

    • 基于FMCW雷达的多人心率呼吸检测

      2023, 32(8):198-206. DOI: 10.15888/j.cnki.csa.009214

      摘要 (746) HTML (1330) PDF 2.09 M (2229) 评论 (0) 收藏

      摘要:针对目前毫米波雷达应用于多人生命体征检测效果不佳, 检测范围小等缺点, 提出了一种多人心率呼吸提取分离方法, 首先采用Capon波束成形技术对非目标区域信号形成零陷, 对目标区域进行提取相位、相位解缠绕操作; 其次利用自适应谐波跟踪算法滤除噪声; 最后使用粒子群算法和样本熵改进的变分模态分解法(PSO-SE-VMD)对信号进行分解得到模态分量, 选取合适的模态分量并通过短时自相关算法提取心率呼吸. 实验结果表明, 该方法在夹角30°和60°时心率的均方误差分别为5.55和3.15, 实现了多人检测并有效提高了检测范围.

    • 融合知识图谱和轻量图卷积网络的推荐算法

      2023, 32(8):207-213. DOI: 10.15888/j.cnki.csa.009209

      摘要 (533) HTML (1311) PDF 1.05 M (1629) 评论 (0) 收藏

      摘要:针对知识图谱推荐算法用户端和项目端建模程度不均且模型复杂度较高等问题, 提出融合知识图谱和轻量图卷积网络的推荐算法. 在用户端, 利用用户相似性生成邻居集合, 将用户及其相似用户的交互记录在知识图谱上多次迭代传播, 增强用户特征表示. 在项目端, 将知识图谱中实体嵌入传播, 挖掘与用户喜好相关的项目信息; 接着, 利用轻量图卷积网络聚合邻域特征获得用户和项目的特征表示, 同时采用注意力机制将邻域权重融入实体, 增强节点的嵌入表示; 最后, 预测用户和项目之间的评分. 实验表明, 在Book-Crossing数据集上, 相较于最优基线, AUCACC分别提高了1.8%和2.3%. 在Yelp2018数据集上, AUCACC分别提高了1.2%和1.4%. 结果证明, 该模型与其他基准模型相比有较好的推荐性能.

    • 基于IPSO-FHMM的非侵入式负荷分解

      2023, 32(8):214-220. DOI: 10.15888/j.cnki.csa.009202

      摘要 (819) HTML (968) PDF 1.33 M (1384) 评论 (0) 收藏

      摘要:非侵入式负荷分解是智能用电系统的一个重要环节, 可深入分析用户的用电信息, 对负荷预测、需求侧管理及电网安全有重要意义. 本文提出了一种基于改进粒子群优化因子隐马尔可夫模型(IPSO-FHMM)的非侵入式负荷分解方法. 利用高斯混合模型 (GMM) 对单负荷进行状态聚类, 总负载模型由因子隐马尔可夫模型表示. 针对 Baum-Welch算法容易收敛于局部极值的问题, 将线性递减权重的粒子群优化算法引入到 FHMM 的参数训练中. 使用AMPds2数据集进行仿真实验, 结果表明, 该模型可以有效地提高分解精度.

    • 面向小目标的YOLOv5s安全帽佩戴检测

      2023, 32(8):221-229. DOI: 10.15888/j.cnki.csa.009197

      摘要 (601) HTML (1701) PDF 2.40 M (1402) 评论 (0) 收藏

      摘要:本文介绍了一种新的基于YOLOv5s的目标检测方法, 旨在弥补当前主流检测方法在小目标安全帽佩戴检测方面的不足, 提高检测精度和避免漏检. 首先增加了一个小目标检测层, 增加对小目标安全帽的检测精度; 其次引入ShuffleAttention注意力机制, 本文将ShuffleAttention的分组数由原来的64组减少为16组, 更加有利于模型对深浅、大小特征的全局提取; 最后增加SA-BiFPN网络结构, 进行双向的多尺度特征融合, 提取更加有效的特征信息. 实验表明, 和原YOLOv5s算法相比, 改善后的算法平均精确率提升了1.7%, 达到了92.5%, 其中佩戴安全帽和未佩戴安全帽的平均精度分别提升了1.9%和1.4%. 本文与其他目标检测算法进行对比测试, 实验结果表明SAB-YOLOv5s算法模型仅比原始YOLOv5s算法模型增大了1.5M, 小于其他算法模型, 提高了目标检测的平均精度, 减少了小目标检测中漏检、误检的情况, 实现了准确且轻量级的安全帽佩戴检测.

    • 基于YOLOv5的交通标志识别

      2023, 32(8):230-237. DOI: 10.15888/j.cnki.csa.009204

      摘要 (923) HTML (1442) PDF 3.88 M (2489) 评论 (0) 收藏

      摘要:交通标志识别是自动驾驶技术中的关键一部分. 针对交通标志在道路场景中目标较小且识别精度较低的问题, 提出一种改进的YOLOv5算法. 首先在YOLOv5模型中引入全局注意力机制(GAM), 提高网络捕获不同尺度交通标志特征的能力; 其次将YOLOv5算法中使用的GIoU损失函数更换为更具回归特性的CIoU损失函数来优化模型, 提高对交通标志的识别精度. 最后在Tsinghua-Tencent 100K数据集上进行训练, 实验结果表明, 改进后的YOLOv5算法对交通标志识别的平均精度均值为93.00%, 相比于原算法提升了5.72%, 具有更好的识别性能.

    • 基于轻量型网络的单载波信号调制识别

      2023, 32(8):238-243. DOI: 10.15888/j.cnki.csa.009213

      摘要 (621) HTML (816) PDF 1.72 M (1234) 评论 (0) 收藏

      摘要:针对当前应用深度学习实现数字信号调制识别过程中网络复杂、计算量高、硬件平台要求高的问题, 本文提出了在改进的MobileNetV3轻量级神经网络中使用信号星座图调制识别的方法. 首先, 将接收到的MPSK和MQAM信号转换成星座图像, 将其进行灰度图像提取, 灰度图像增强, 构建星座图的图像数据集, 然后将ResNet中的跨层结构引入MobileNetV3网络, 解决了随着网络层数的增加, 权重减小而导致的梯度消失现象. 最后将星座图数据集用于训练MobileNetV3的轻量型神经网络权重, 对星座图像进行识别. MobileNetV3基于深度卷积可分离和神经架构搜索(network architecture search, NAS)技术在保证识别精度的前提下, 大大降低了参数量和训练时间, 将对于简单信号的调制识别, 轻量型神经网络可以有效简化网络结构, 降低对硬件设备的要求. 仿真结果表明, 针对的调制信号(BPSK、QPSK、8PSK、16QAM、64QAM), 能实现识别率为99.76%的调制识别, 相较于传统应用深度学习实现调制识别的网络, 网络参数量和计算量明显减小.

    • 改进NSGA-II算法的海上搜救调度方法

      2023, 32(8):244-249. DOI: 10.15888/j.cnki.csa.009187

      摘要 (424) HTML (799) PDF 1.28 M (1978) 评论 (0) 收藏

      摘要:针对海上搜救资源调度决策困难、干扰多、实时性差、难以实现全局最优问题, 本文以黄渤海海域为例, 采用改进的非支配排序遗传 (NSGA-II)算法解决海上船舶搜救资源调度问题. 首先, 根据AIS以及北斗数据, 建立了海上搜救资源的多目标优化模型; 其次, 改进的NSGA-II算法采用基于正态分布交叉 (NDX)算子, 在扩大搜索范围的基础上, 避免陷入局部最优, 得到多目标问题完整的Pareto解集; 采用综合评价法 (TOPSIS)从Pareto解集中求得折衷解, 即最终设计的搜救调度方案; 最后, 在考虑船舶数量约束以及时间约束的条件下, 采用改进的NSGA-II算法分别与NSGA-II算法和贪婪算法进行对比, 并采用黄渤海海域船舶采集数据进行仿真. 结果表明该算法能够有效解决海上搜救资源调度优化问题.

    • 基于蚁群融合D*Lite的动态改航路径规划

      2023, 32(8):250-258. DOI: 10.15888/j.cnki.csa.009196

      摘要 (513) HTML (679) PDF 3.85 M (1113) 评论 (0) 收藏

      摘要:危险天气下的改航与受限区划设和路径规划算法密切相关, 本文针对改航环境构建中Graham扫描结果存在较大无效区域, 提出分块后并行扫描. 针对危险天气的突发性, 为了适用于复杂环境, 提出在增量式的D*Lite全局规划路径基础上智能分割、蚁群算法局部搜索的复合结构动态规划方法. 通过改进信息素更新策略解决收敛速度慢、耗时长且易陷入局部最优的缺点. 实验结果表明, 分块并行Graham扫描划设的飞行受限区形状更接近实际, 面积缩至原先的48.1%. 改进蚁群融合D*Lite的复合结构动态路径规划算法D*Lite-ACO兼顾全局与局部, 将重规划范围控制到当前位置与目标点间, 在路径长度、规划时间和迭代范围上的评价指标分别提升1.2%、40.7%、66.7%.

    • 基于模函数与像素值差值的高质量双图像可逆信息隐藏

      2023, 32(8):259-268. DOI: 10.15888/j.cnki.csa.009201

      摘要 (436) HTML (704) PDF 2.70 M (1350) 评论 (0) 收藏

      摘要:为解决在一些一对二的交流场景中使用信息隐藏技术来传递信息时对载密图像的视觉质量和载体图像的精确度的高要求问题. 在本文中提出了一种基于模函数和像素值差值(pixel value difference , PVD)的双图像可逆信息隐藏方案, 通过模函数和对数函数确定了PVD范围表, 从而确定在单位面积上的信息嵌入位数以及模函数的系数. 所提出的方案可以在信息嵌入位数不断增加的情况下仍然保持像素值的修改量与信息嵌入位数之比不大于0.5, 所以与目前一些基于PVD的方案相比在像素对差值越大的图像中越占有优势. 实验结果表明与现有的一些在载密图像质量方面优质的方案相比, 具有更高的PSNRSSIM, 此外本方案在抗RS隐写分析和PDH隐写分析的静态攻击方面上具有良好的性能, 并且避免了大多数在基于像素值差值的信息隐藏方案中对溢出问题的解决方案复杂繁琐的情况.

    • 自然语言场景下增量知识构造与遮蔽回放策略

      2023, 32(8):269-277. DOI: 10.15888/j.cnki.csa.009174

      摘要 (496) HTML (666) PDF 1.37 M (1405) 评论 (0) 收藏

      摘要:在增量学习中, 随着增量任务的数量增多, 模型在新增任务上训练后, 由于数据分步偏移等一系列问题, 模型对旧任务上所学到的知识发生灾难性遗忘, 致使模型在旧任务上性能下降. 对此, 本文提出了基于知识解耦的类增量学习方法, 分层次的学习不同任务共有知识与特有知识, 并对这两种知识进行动态的结合, 应用于下游的分类任务中. 并在回放学习中运用自然语言模型的遮蔽策略, 促进模型快速回忆起先前任务的知识. 在自然语言处理数据集AGNews、Yelp、Amazon、DBPedia和Yahoo的类增量实验中, 本文所提出的方法能有效降低模型的遗忘, 提高在各个任务上的准确率等一系列指标.

    • 工业场景下高斯引导的非显著性字符抹除

      2023, 32(8):278-285. DOI: 10.15888/j.cnki.csa.009111

      摘要 (479) HTML (788) PDF 1.99 M (1172) 评论 (0) 收藏

      摘要:图像文本信息在日常生活中无处不在, 在传递信息的同时, 也带来了信息泄露的问题. 近年来文本擦除模型很好地解决了这个问题. 然而, 在工业场景下, 图像会出现高光, 对比度较大的非字符区域, 模型往往很容易其影响发生注意力偏移的现象, 从而忽略了字符区域导致不理想的文本抹除效果. 为了克服这一局限性, 基于注意力提出了一种新的文本擦除网络, 即在网络中嵌入了一层额外的特征层用以给生成图中存在字符的区域进行评分. 同时, 引入了高斯热力图并将其作为基础设计损失函数, 采用监督的方式纠正模型的注意力, 将模型注意力引导至正确的字符区域. 通过在4种不同的数据集上进行对比, 本文所提方法总体上拥有更好的抹除效果. 同时, 该方法在图像存在复杂的背景情况下, 其在图像抹除任务中仍然具有较高的灵活性.

    • 基于SENet和GBDT的改进CNN视网膜疾病多分类

      2023, 32(8):286-294. DOI: 10.15888/j.cnki.csa.009190

      摘要 (556) HTML (749) PDF 3.22 M (1234) 评论 (0) 收藏

      摘要:由于对眼底视网膜图像进行人工诊断分类时存在效率低、漏诊、误诊等情况, 为辅助医师辨别多种疾病的眼底筛查结果, 降低漏检及误检率, 提出一种基于注意力机制SENet的卷积网络模型和GBDT梯度提升的分类方法来解决视网膜疾病分类问题. 该模型在深度学习模型的基础上, 利用采样卷积网络对提取的视网膜出血、视盘水肿、黄斑区病变这3种特征进行学习, 通过GBDT梯度提升的方法进行识别和分类, 并采用大连市第三人民医院提供的真实临床数据对所提方法的性能进行评价. 结果表明, 该模型在平均准确率, 精确率和召回率分别达到99.27%, 98.35%, 0.9810, 在视网膜疾病临床诊断中具有一定的实用价值.

    • 基于改进ShuffleNetV2模型的光伏板灰尘识别

      2023, 32(8):295-302. DOI: 10.15888/j.cnki.csa.009224

      摘要 (469) HTML (741) PDF 1.90 M (1480) 评论 (0) 收藏

      摘要:鉴于灰尘积聚是光伏组件功率损失的主要因素之一, 针对灰尘颗粒的特性及克服利用扫描电子显微镜成本昂贵问题, 提出了一种利用改进的ShuffleNetV2模型来识别光伏板上的灰尘. 以ShuffleNetV2网络模型为基础模型, 采用Mish激活函数, 将更好的特征信息深入神经网络; 然后运用混合深度卷积保证特征提取的丰富性; 最后利用坐标注意力机制模块替换ShuffleNetV2模型中基本单元右分支尾部的逐点卷积, 从而在提高精度的同时也减少了计算量. 实验结果表明, 所提改进的ShuffleNetV2模型与已有的经典模型相比, 准确度更高, 模型复杂度更低, 有效地证明了所给方案是可行的.

    • 基于深度强化学习的雾计算容器整合

      2023, 32(8):303-311. DOI: 10.15888/j.cnki.csa.009189

      摘要 (509) HTML (802) PDF 2.00 M (1175) 评论 (0) 收藏

      摘要:在雾计算系统架构基础上, 针对数据中心高能耗、应用任务负载的随机动态性以及用户对应用的低时延要求, 提出一种基于A2C (advantage actor-critic)算法的以最小化能源消耗和平均响应时间为目标的容器整合方法, 利用检查点/恢复技术实时迁移容器, 实现资源整合. 构建从数据中心系统状态到容器整合的端到端决策模型, 提出自适应多目标奖励函数, 利用基于梯度的反向传播算法加快决策模型的收敛速度. 基于真实任务负载数据集的仿真实验结果表明, 该方法能够在保证服务质量的同时有效降低能耗.

当期目录


文章目录

过刊浏览

年份

刊期

联系方式
  • 《计算机系统应用》
  • 1992年创刊
  • 主办单位:中国科学院软件研究所
  • 邮编:100190
  • 电话:010-62661041
  • 电子邮箱:csa (a) iscas.ac.cn
  • 网址:https://www.c-s-a.org.cn/csa/home
  • 刊号:ISSN 1003-3254
  • CN 11-2854/TP
  • 国内定价:50元
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号