2023, 32(12):1-11. DOI: 10.15888/j.cnki.csa.009318
摘要:针对人脸剪纸手工设计难度大, 制作周期长等问题, 本文首次利用生成对抗网络生成高质量人脸剪纸. 面向人脸剪纸艺术特点, 提出了一种基于CycleGAN的改进网络: 1) 在原始CycleGAN生成器中引入CBAM注意力模块, 增强网络特征提取能力; 2) 引入针对鼻、眼、唇等关键面部区域的局部鉴别器, 提升人脸剪纸中以上区域的生成效果; 3)设计基于图像边缘信息与SSIM的损失函数, 取代CycleGAN的前向循环一致损失, 消除所得人脸剪纸中的阴影. 相较于其他人脸剪纸自动生成方法, 本文方法可快速生成与原始人脸相似度高、线条连续流畅、具有艺术美感的人脸剪纸. 此外, 本文还提出了一种人脸剪纸连通性后处理方法, 使所得结果更符合中国传统剪纸整体连通的特点.
2023, 32(12):12-20. DOI: 10.15888/j.cnki.csa.009316
摘要:为了解决图像压缩感知重建研究领域中通过有效的图像先验信息重构与原图相似性高且保留细节消除伪影的高质量图像的问题, 针对不足采样的K空间数据, 在经典的CNN算法CBDNet算法的基础上, 通过融合深度学习先验信息及传统图像恢复各自优势的方法, 研究了基于深度神经网络去噪先验和BM3D块压缩感知算法的混合式重构算法. 该算法采用交互式方法训练多尺度残差网络抑制噪声水平, 借优化选择的方式将深度学习与传统块匹配多尺度结合以提取图像不同尺度的特征数据从而实现抑制伪影、快速重建高质量MRI. 实结果表明深度学习结合BM3D在MR图像重构领域能够有效降低伪影保留细节信息, 加强重构效果. 与此同时, 通过采用GPU的加速运算, 算法的计算复杂度较使用单一算法并未增加很多. 可见基于卷积盲降噪的混合式核磁共振成像效果更佳.
2023, 32(12):21-31. DOI: 10.15888/j.cnki.csa.009342
摘要:在线评论的有用性预测任务在当前的电子商务领域中发挥着重要的作用, 该任务的目标是判断在线评论的有用性, 进而重点展示对未来消费者更有帮助的评论, 提高消费者获取信息的效率. 在本文中, 我们重点关注近年来在各大在线平台兴起的一种新的评分系统——多维评分系统, 尝试研究用户在该系统中给出的方面评分对在线评论有用性的影响. 本文提出了一个综合考虑了评论文本、用户总体评分和方面评分3种元素及其交互的多层次神经网络模型HORA来完成有用性预测任务. 通过在两个真实世界的数据集上进行的实验结果表明, 与当前的基线模型相比, HORA在MAE和RMSE两个指标上展示了更好的结果, 同时在实验中也表现出了良好的鲁棒性, 表明了方面评分对用户的在线评论有用性感知的重要意义.
2023, 32(12):32-42. DOI: 10.15888/j.cnki.csa.009356
摘要:自然语言转为SQL (NL2SQL)的研究有较高的应用价值, 随着深度学习技术的成熟, 越来越多的研究者开始将深度学习技术应用于NL2SQL任务中. 本文梳理了英文和中文领域NL2SQL的研究现状, 总结按年份发布的数据集和模型, 对比当前4大中文NL2SQL数据集的特点, 阐述了当前基于深度学习的NL2SQL任务的基本框架以及针对中文领域的单表简单问题和跨表复杂问题所适用的典型模型, 介绍了一般常用的模型评测方法, 并提出未来研究方向的展望.
2023, 32(12):43-51. DOI: 10.15888/j.cnki.csa.009315
摘要:针对多智能体强化学习中因智能体之间的复杂关系所导致的学习效率低及收敛速度慢的问题, 提出基于两级注意力机制的方法MADDPG-Attention, 在MADDPG算法的Critic网络中增加了软硬两级注意力机制, 通过注意力机制学习智能体之间的可借鉴经验, 提升智能体之间的相互学习效率. 由于单层的软注意力机制会给完全不相关的智能体也赋予学习权重, 因此采用硬注意力判断两个智能体之间学习的必要性, 裁减无关信息的智能体, 再用软注意力判断两个智能体间学习的重要性, 按重要性分布来分配学习权重, 据此向有可用经验的智能体学习. 在多智能体粒子的合作导航环境上进行测试, 实验结果表明, MADDPG-Attention算法对复杂关系的理解更为清晰, 在3种环境的导航成功率都达到了90%以上, 有效提高了学习效率, 加快了收敛速度.
2023, 32(12):52-62. DOI: 10.15888/j.cnki.csa.009351
摘要:目前乳腺癌已取代肺癌成为年发病率最高的癌症, 基于深度学习的目标检测技术可对乳腺X线、乳腺超声和乳腺核磁共振等非侵入式成像进行自动病变检测, 已成为乳腺癌辅助诊断的首选途径. YOLO (you only look once)系列算法是基于深度学习的目标检测算法, 经典YOLO算法在速度和精准度具有优势, 被广泛应用于计算机视觉各领域, 最新YOLO算法是计算机视觉领域的SOTA (state of the art)模型, 如何利用YOLO系列算法提高乳腺癌检测速度和准确率, 已经成为研究者关注的焦点之一. 基于此, 本文介绍经典YOLO系列算法的原理, 梳理经典YOLO系列算法在乳腺癌图像检测中的应用现状, 并归纳总结现存问题, 同时对YOLO系列算法在乳腺癌检测的进一步应用进行展望.
2023, 32(12):63-73. DOI: 10.15888/j.cnki.csa.009355
摘要:在传统的控制系统当中, 人们依赖于使用手柄、操纵杆等设备来与外部设备实现人机交互, 这对于具有运动障碍的患者来说是具有挑战的. 而脑机接口(BCI)技术可通过脑环将脑电信号转化为对外界设备的控制命令, 使这些患者可以由大脑“意识”直接控制外部设备. 本文提出一种基于多模态脑机接口的智能小车自动驾驶系统, 该系统融合了受试者的脑电信号、眼电信号和陀螺仪信号3种模态的信号来控制小车. 其中, 脑电信号用于控制小车的速度, 眼电信号用于控制小车的启停, 陀螺仪信号则用于控制小车的转向功能. 此外, 我们还融合了计算机视觉技术, 为智能小车增加了自动驾驶功能, 使得控制更加智能化. 经过实验表明, 10名受试者使用该系统控制小车的平均准确率达到了92.47%, 平均响应时间为1.55 s, 平均信息传递速率达到了55.94 bit/min, 从而说明该控制系统是有效且高效的. 此外, 为了验证小车的自动驾驶功能, 我们设置了多个对比实验进行验证. 实验结果表明, 与手动驾驶相比, 虽然该自动驾驶系统在操控小车的速度上存在劣势, 但是在准确率与稳定性上具有更好的性能优势. 证明该系统可以为残障人士带来更好的操控体验, 在脑控应用和自动驾驶领域具有广阔的应用前景.
2023, 32(12):74-83. DOI: 10.15888/j.cnki.csa.009320
摘要:为了解决金融领域文本分类算法稀缺, 以及现有算法无法充分提取文本中词与词的关系、长距离依赖关系和深层次特征信息的问题, 提出了一种改进卷积自注意力模型的文本深度关系抽取算法. 该算法在改进的深度金字塔卷积神经网络(DPCNN)中引入自注意力, 并联合双向门控神经网络(BiGRU)模块建立文本分类模型, 解决了针对金融领域长文本的长距离依赖特征信息和词与词之间关系特征信息的提取问题, 实现文本中深层次特征信息和上下文语义信息联合抽取功能. 在THUCNews短文本与长文本数据集上分别进行实验, 实验结果表明, 所提方法与BERT等方法相比, 在评价指标上有显著提高. 在自制金融长文本数据集上的对比实验表明, 与其他模型相比, 该算法模型的准确率和F1值更高. 通过一系列实验可以证明, 该算法模型能够更准确地完成针对金融长文本的分类任务.
2023, 32(12):84-94. DOI: 10.15888/j.cnki.csa.009328
摘要:预测进阀温度的变化趋势对阀冷系统的运行状态有重要参考价值. 针对传统方法存在数据收集时间跨度大和传感器存在误差等问题, 本文提出了一种基于对抗扰动和局部信息增强的进阀温度预测模型Robust-InTemp. 具体来说, Robust-InTemp通过对原始数据添加基于规则的高斯噪声, 并使用基于梯度的对抗训练方法(projected gradient descent, PGD), 增强了模型的泛化能力和抵抗噪声干扰的鲁棒性. 同时, 引入相对位置编码、一维卷积以及门控线性单元(gated linear unit, GLU), 以增强模型对局部特征的学习能力, 从而提高预测准确性. 实验结果表明, 与多种基准模型相比, Robust-InTemp在预测性能和抗干扰能力方面均有明显优势, 进一步的消融实验也验证了模型中各个组件的有效性.
2023, 32(12):95-103. DOI: 10.15888/j.cnki.csa.009336
摘要:在多用户多任务场景下, 使用传统的决策算法去对短时间内接踵而来的任务进行计算卸载决策, 已经不能满足用户对决策效率和资源利用率的要求. 因此有研究提出使用深度强化学习算法来进行卸载决策以满足各种场景下的需求, 但是这些算法大多只考虑卸载优先的策略, 这种策略使用户设备(UE)被大量闲置. 我们提高了移动边缘计算(MEC)服务器和用户设备(UE)的资源利用率, 降低计算卸载的错误率, 提出了一种本地优先和改进TD3(twin delayed deep deterministic policy gradient)算法相结合的决策卸载模型, 并设计了仿真实验, 通过实验证明该模型确实可以提高MEC服务器和UE的资源利用率并降低错误率.
2023, 32(12):104-111. DOI: 10.15888/j.cnki.csa.009339
摘要:标签噪声会极大地降低深度网络模型的性能. 针对这一问题, 本文提出了一种基于对比学习的标签带噪图像分类方法. 该方法包括自适应阈值、对比学习模块和基于类原型的标签去噪模块. 首先采用对比学习最大化一幅图像的两个增强视图的相似度来提取图像鲁棒特征; 接下来通过一种新颖的自适应阈值过滤训练样本, 在模型训练过程中根据各个类别的学习情况动态调整阈值; 然后创新性地引入基于类原型的标签去噪模块, 通过计算样本特征向量与原型向量的相似度更新伪标签, 从而避免标签中噪声的影响; 在公开数据集CIFAR-10、CIFAR-100和真实数据集ANIMAL10上进行对比实验, 实验结果表明, 在人工合成噪声的条件下, 本文方法实验结果均高于常规方法, 通过计算图像鲁棒的特征向量与各个原型向量的相似度更新伪标签的方式, 降低了噪声标签的负面影响, 在一定程度上提高模型的抗噪声能力, 验证了该模型的有效性.
2023, 32(12):112-119. DOI: 10.15888/j.cnki.csa.009322
摘要:针对中文电子病历中医疗嵌套实体难以处理的问题, 本文基于RoBERTa-wwm-ext-large预训练模型提出一种知识增强的中文电子病历命名实体识别模型ERBEGP. RoBERTa-wwm-ext-large采用的全词掩码策略能够获得词级别的语义表示, 更适用于中文文本. 首先结合知识图谱, 使模型学习到了大量的医疗实体名词, 进一步提高模型对电子病历实体识别的准确性. 然后通过BiLSTM对电子病历输入序列编码, 能够更好捕获病历的中上下语义信息. 最后利用全局指针网络模型EGP (efficient GlobalPointer)同时考虑实体的头部和尾部的特征信息来预测嵌套实体, 更加有效地解决中文电子病历命名实体识别任务中嵌套实体难以处理的问题. 在CBLUE中的4个数据集上本文方法均取得了更好的识别效果, 证明了ERBEGP模型的有效性.
2023, 32(12):120-128. DOI: 10.15888/j.cnki.csa.009350
摘要:许多皮肤癌疾病具有明显的初期患病征兆. 目前皮肤癌诊断主要依靠具有专业知识的医务工作者进行诊断, 其存在着耗时长、复用性低等问题. 针对上述问题, 该研究提出一种基于改进MobileNetV3-Small的轻量级皮肤肿瘤识别模型. 首先提出了一种基于坐标注意力机制模块(coordinate attention, CA)的CaCo注意力模块. 其次针对皮肤肿瘤数据集样本分布不均衡, 提出了一种联合多损失函数来增强模型对少样本病例的学习能力. 实验结果表明, 改进的MobileNetV3-CaCo模型精确率、平衡准确性和模型参数量分别为93.39%、86.35%和2.29M, 达到了理想的识别效果.
2023, 32(12):129-135. DOI: 10.15888/j.cnki.csa.009321
摘要:为解决现有航海模拟器中船浪运动分离导致的视景感受体验差的问题, 开发了一套船浪实时交互的船舶运动可视化仿真系统. 通过海浪谱建模技术构建海面波浪运动场景; 在建立船舶受力模型的基础上, 通过检测船舶与水面的碰撞实现船舶对波浪力的响应以计算船舶对波浪运动的实时响应姿态变化; 同时为增强仿真系统的真实感, 使用波动公式计算船舶与水体碰撞产生的水波及其扩散增强模拟真实感. 船浪运动耦合的航海模拟器与传统航海模拟器相比, 在大海况条件下能够为使用者提供更加真实的视景与运动体验. 研究成果视景真实感强, 船浪交互实时性好, 对于恶劣航海条件下的航海过程有良好的仿真效果.
2023, 32(12):136-142. DOI: 10.15888/j.cnki.csa.009345
摘要:为了提高螺纹油套管气密封检测的工作效率, 本文提出了一种基于全局注意力特征融合的螺纹扭矩曲线自动分类网络, 即NAFENet. 具体来说, NAFENet为了增强模型的表达力, 将EfficientNet-B0的卷积结构扩展至11层得到EfficientNet-B11. 同时, 在其每个MBConv卷积层中构建了基于non-local全局注意力和AFF特征融合模块, 以帮助模型获取曲线图像中较为全局的信息, 提高特征提取能力. 实验结果表明, NAFENet在参数量相较于EfficientNet-B0只有小幅度的增加情况下, 曲线识别精度有了较大提升, 在自制UBT_Curve数据集上, 模型准确率达到92.87%.
2023, 32(12):143-151. DOI: 10.15888/j.cnki.csa.009311
摘要:图划分算法是分布式图计算系统里的重要组成部分, 它将一个图划分为若干子图以便在分布式系统中运行, 并将子图上的点和边数据及子图上的计算任务分配到各分区. 异质图是现实世界中广泛存在的一种图, 它是指具有多种节点类型或边类型的图, 在针对异质图的计算过程中, 现有的图划分算法对于异质图的处理没有考虑到以下问题: 在图计算过程中, 不同类型的节点和边携带的数据量可能不同; 不同的节点和边类型, 可能会采用不同的处理算法, 其计算时间也会不同. 针对现有图划分方法的不足, 本文提出一种面向异质图的在线图划分算法OGP-HG算法, 并对现有的GraphX图计算引擎进行改进, 将OGP-HG算法在改进后的图计算引擎中实现. 本文提出的OGP-HG算法通过计算节点划分到不同分区上的负载均衡得分和边划分到不同分区上的数据均衡得分, 得到使异质图负载和内存占用均衡的划分结果. 实验表明, 与传统图划分算法相比, 该算法提高异质图计算效率1.05–1.4倍.
2023, 32(12):152-160. DOI: 10.15888/j.cnki.csa.009308
摘要:针对人体姿态估计算法可实施性低以及基于姿态估计的跳绳计数精度不高的问题, 提出了一种基于轻量级人体姿态估计网络的跳绳计数算法. 该算法首先输入跳绳视频, 接着利用帧间差分法提取关键帧图像并送入人体姿态估计网络进行关节点检测; 同时为了解决轻量级网络检测精度不高的问题, 提出优化的LitePose检测模型, 采用自适应感知解码方法对模型的解码部分进行优化从而减少量化误差; 然后采用卡尔曼滤波对坐标数据进行平滑降噪, 以减小坐标抖动误差; 最终通过关键点坐标变化判断跳绳计数. 实验结果表明, 在相同图像分辨率和环境配置下, 本文提出的算法使用优化的LitePose-S网络模型, 不仅未增加模型参数量和运算复杂度, 同时网络检测精度提高了0.7%, 且优于其他对比网络, 而且本算法在跳绳计数时的平均误差率最低可达1.00%, 可以利用人体姿态估计的结果有效地判断人体起跳和落地情况, 最终得出计数结果.
2023, 32(12):161-170. DOI: 10.15888/j.cnki.csa.009313
摘要:针对传统路径规划算法收敛速度慢、稳定性差、易陷入局部极值的问题, 提出一种基于梯度统计变异量子遗传算法的车辆路径规划方法. 首先在依据染色体适应度值动态调整旋转角步长的基础上, 引入梯度下降思想对量子旋转门调整策略进行改进; 根据染色体变化趋势的统计特性, 设计基于梯度统计的变异算子实现变异操作, 提出基于量子位概率密度的自适应变异策略; 以路径最短为指标建立车辆路径规划模型, 通过仿真实验验证改进算法在车辆路径规划中的有效性, 与其他优化算法相比, 本文改进算法所规划路径长度更短, 搜索稳定性更好, 能有效控制算法陷入局部最优.
2023, 32(12):171-179. DOI: 10.15888/j.cnki.csa.009326
摘要:在齿轮系设计问题中, 传统算法存在计算复杂与精度低等缺点, 海鸥优化算法(SOA)得益于其算法原理简单、通用性强、参数少等特性, 现多用于工程设计问题. 然而, 标准海鸥优化算法易出现寻优精度低、搜索速度慢等问题, 本文提出一种混合策略改进的海鸥优化算法(WLSOA). 首先, 利用非线性递减策略增强海鸥优化算法的探索开发能力, 提高寻优精度. 其次, 在海鸥攻击阶段引入自适应权重平衡全局与局部的搜索能力和加入莱维飞行步长对当前最优解进行扰动, 提高算法跳出局部最优值的能力. 然后分别使用WLSOA、黄金正弦算法、鲸鱼优化算法、粒子群优化算法、传统海鸥优化算法及最新提出的改进海鸥优化算法, 通过在9个经典的测试函数上进行仿真实验来探究WLSOA的性能. 结果表明, WLSOA比其他6种算法寻优精度更高, 收敛速度更快. 最后, 在齿轮系设计问题上, 通过与其他13种常见的群智能算法的比较表明, WLSOA的求解性能优于其他算法.
2023, 32(12):180-188. DOI: 10.15888/j.cnki.csa.009337
摘要:随着智能交通的发展, 大量的车辆轨迹数据被收集和存储, 但这些轨迹数据总是会存在异常轨迹点数据, 严重影响后续轨迹数据分析的准确性和有效性. 本文发现了一类隐性的位置异常轨迹数据, 此类异常数据用传统的基于移动特征阈值的检测方法难于发现, 但对轨迹数据分析过程同样有着重要的影响. 针对此类异常轨迹数据, 本文以部分西安市出租车轨迹数据为例, 提出了一种基于浮动网格和聚类方法的隐性异常轨迹数据检测方法, 并实现了数据的并行化方式. 实验结果展示所提方法检测隐性位置异常的数据召回率、精确率能够达到0.90, 并且F1-score在0.88–0.91范围. 检测出这种隐性异常轨迹数据, 有利于后续的时空轨迹数据分析与应用.
2023, 32(12):189-196. DOI: 10.15888/j.cnki.csa.009329
摘要:AIS数据是指通过AIS系统获取的船舶运动轨迹信息, 对其进行挖掘可以获得船舶的运动模式、航行路线、停靠地点等信息. 但其在采集过程中产生的离群点会对聚类等任务造成负面影响, 因此对AIS数据挖掘之前需要进行离群点检测. 然而, 当AIS轨迹数据中存在大量离群点时, 会导致大多数离群点检测算法的准确率显著下降. 为了解决这个问题, 本文提出了一种基于中心移动的轨迹离群点检测算法(center shift outlier detection, CSOD). 通过迫使数据点向其K近邻集合的中心移动, 使每个数据点更加接近典型数据, 从而有效地消除了离群点对聚类的影响. 为了验证本文算法的有效性, 使用浙江海域AIS渔船轨迹数据集, 将本文提出的CSOD算法与一些经典的离群点检测算法进行了对比实验. 实验结果表明, CSOD算法整体上性能更加优越.
2023, 32(12):197-204. DOI: 10.15888/j.cnki.csa.009344
摘要:渗透测试的核心是发现渗透路径, 但并不是所有的渗透路径都能够成功, 所以需要基于当前系统环境选择最优渗透路径. 在此背景下, 首先, 本文基于攻击图将环境建模为马尔可夫决策过程(Markov decision process, MDP)图, 使用价值迭代算法寻找最优渗透路径. 其次, 对于渗透测试过程中存在的渗透动作失效问题, 提出了一种新的重规划算法, 可以在MDP图中有效处理失效渗透动作, 重新寻找最优渗透路径. 最后, 基于渗透测试过程中存在多个攻击目标的情况, 本文提出了面向MDP图的多目标全局最优渗透路径算法. 实验证明, 本文提出的算法在重规划任务方面, 表现出了更高的效率和稳定性, 在多目标任务方面, 体现出了算法的有效性, 可以避免不必要的渗透动作被执行.
2023, 32(12):205-210. DOI: 10.15888/j.cnki.csa.009307
摘要:针对麻雀搜索算法(sparrow search algorithm, SSA)求解精度依赖于较优位置的群体, 易于陷入局部最优等问题, 提出改进型的麻雀搜索算法(improved sparrow search algorithm, ISSA). 该算法首先提出正态偏移策略, 以重心位置为导向进行种群偏移, 实现移动能量的正态分布衰减, 有效提升种群对局部搜索的勘探能力; 其次引入动态正弦扰动策略, 通过缩放因子实现发现者对前期搜索步长和后期快速收敛的双向需求. 然后针对麻雀种群中位置较差的预警者加入反向学习机制, 以预警者当前位置生成扰动的反向解, 有利于扩大搜索步长, 帮助算法跳出局部最优. 最后随机选取6个测试函数并与其他算法进行比较, 实验结果验证了ISSA算法的有效性.
2023, 32(12):211-217. DOI: 10.15888/j.cnki.csa.009317
摘要:近年来, 在诸如环境监测等一系列工作中, 遥感影像得到了广泛应用. 然而, 目前卫星传感器观测到的影像往往分辨率较低, 很难满足深入研究的需要. 超分辨率(SR)目的是提高图像分辨率, 同时提供更精细的空间细节, 完美地弥补了卫星图像的弱点. 因此, 本文提出了一种反投影注意力网络(back-projection attention network, BPAN)用于遥感图像的超分辨率重建, 该网络由反投影网络和初始残差注意块两部分组成. 在反投影网络中, 通过迭代误差反馈机制计算上下投影误差指导图像重建; 在初始残差注意块中, 引入初始模块融合局部多级特征为重建详细的纹理提供更丰富的信息, 以注意模块自适应地学习不同空间区域的重要性, 促进高频信息的恢复. 为了评价该方法的有效性, 在AID数据集上进行了大量的实验, 结果表明, 本文的网络模型提升了传统深度网络的重建性能, 且在视觉效果和客观指标方面有明显提升.
2023, 32(12):218-223. DOI: 10.15888/j.cnki.csa.009314
摘要:图分区质量极大程度上影响着计算机之间的通信开销和负载平衡, 这对于大规模并行图计算的性能是至关重要的. 然而, 随着图数据规模的越来越大, 图分区算法的执行时间成了一个不可避免的问题. 因此, 研究如何优化图分区算法的执行效率是有必要的. 本文提出了一个基于广度优先遍历加权图生成的启发式图分割方法, 该方法在实现较低的通信代价和较好负载平衡的同时, 只引入了少量的预处理时间开销. 实验结果表明, 本文的划分方法减少了复制因子, 降低通信开销, 并且引入的时间开销较小.
2023, 32(12):224-232. DOI: 10.15888/j.cnki.csa.009349
摘要:剩余油的形态分布情况对油田的深度开发有着重大意义. 针对剩余油数据量较少和传统的形态参数分类能力有限等问题, 提取一种基于深度学习的剩余油形态分类方法. 该方法在数据预处理部分, 利用生成对抗网络ACGAN的多类别数据生成特性对剩余油图像进行数据增强; 采用VGG19模型作为主干网络提取传统形态参数无法描述的深层特征, 同时引入SENet注意力机制, 改善模型特征表达能力, 使得最终的分类结果更加精确. 为验证本研究方法的有效性, 将本文方法与传统形态参数和其他深度学习模型的分类方法进行对比, 并通过主观视觉和客观指标进行评估, 结果表明本文方法分类更为精确.
2023, 32(12):233-242. DOI: 10.15888/j.cnki.csa.009340
摘要:交互式图像分割是像素级注释和图像编辑的重要工具. 现存方法大多采取两阶段预测, 首先预测一个粗糙的结果, 在第2个阶段细化之前预测的结果来得到更精确的预测, 为了使在硬件资源受限时, 网络模型仍可以使用, 基于此, 在两阶段共享同一个网络, 为了更好地将标记信息传播到未标记区域, 设计了一个相似度约束传播模块, 在训练时使用了一个简单的原型提取模块来使正点击向量高度内聚, 加速网络收敛, 在推理时移除. 在推理阶段通过使用意图感知模块来捕获细节, 使得预测性能进一步提升. 大量实验表明, 该方法在所有流行的基准测试上与最先进的方法最有可比性, 证明了其有效性.
2023, 32(12):243-252. DOI: 10.15888/j.cnki.csa.009319
摘要:针对交通信号灯检测中目标尺度小、检测精度低的问题, 提出一种改进YOLOv5s的交通信号灯检测算法. 首先, 构建一种特征金字塔模块RSN-BiFPN, 充分融合不同尺度的交通信号灯特征, 以减少目标漏检和误检. 其次, 引入新的特征融合层和预测头, 提高网络对小目标的感知性能, 增强检测准确性; 最后, 采用EIoU函数优化损失, 加快网络收敛速度. 通过在S2TLD公开数据集上进行的大量的实验结果表明, 本文所提方法相较于基础网络, 精确率提升4.1%, 达96.1%; 召回率提升3%, 达95.9%; 平均精确度提升1.9%, 达96.5%. 同时, 改进后的算法实现了更快的检测速度, 达每秒22.7帧, 本文方法有效实现交通信号灯快速、准确地检测, 可广泛应用于交通道路中信号灯分析相关研究.
2023, 32(12):253-260. DOI: 10.15888/j.cnki.csa.009303
摘要:神经机器翻译技术能够自动翻译多种语言的语义信息, 已被应用于跨指令集架构的二进制代码相似性检测, 并取得了较好的效果. 将汇编指令序列当作文本序列处理时, 指令顺序关系很重要. 进行二进制基本块级别相似性检测时, 神经网络使用位置嵌入来对指令位置进行建模. 然而, 这种位置嵌入未能捕获指令位置之间的邻接、优先等关系. 针对该问题, 本文使用指令位置的连续函数来建模汇编指令的全局绝对位置和顺序关系, 实现对词序嵌入的泛化. 首先使用Transformer训练源指令集架构编码器; 然后使用三元组损失训练目标指令集架构编码器, 并微调源指令集架构编码器; 最后使用嵌入向量之间欧氏距离的映射表示基本块之间的相似程度. 在公开数据集MISA上的实验表明, P@1评价指标达到69.5%, 比对比方法MIRROR提升了4.6%.
2023, 32(12):261-267. DOI: 10.15888/j.cnki.csa.009312
摘要:自动程序修复技术可实现对软件缺陷的自动修复, 并使用测试套件评估修复补丁. 然而因为测试套件不充分, 通过测试套件的补丁可能并未正确修复缺陷, 甚至引入新的缺陷并产生波及效应, 导致自动程序修复生成大量过拟合补丁. 针对这个问题, 本文提出了一种基于数据流分析的过拟合补丁识别方法, 首先将补丁对程序的修改分解为对变量的操作, 然后采用数据流分析方法识别补丁影响域, 并根据补丁影响域选择针对性覆盖准则来识别目标覆盖元素, 进而选取测试路径并生成测试用例实现对修复程序的充分测试, 避免修复副作用的影响. 本文在两个数据集上进行了评估, 实验结果表明, 基于数据流分析的过拟合补丁识别方法可有效提升自动程序修复的正确性.
2023, 32(12):268-275. DOI: 10.15888/j.cnki.csa.009324
摘要:目前已有许多工作将Transformer运用到时间序列预测相关任务. 然而, 相比其他时间序列, 运动轨迹数据存在运动学的不确定性, 没有明显的周期特性. 为了降低噪声干扰, 增强趋势建模, 本文在Transformer架构的基础上, 提出一种基于时频域信息融合和多尺度对抗训练的目标轨迹预测方法. 将小波分解嵌入网络模型, 实现时频域自适应滤波; 并与时域注意力进行融合, 能够更有效地对观测轨迹的长期趋势特性进行编码. 并设计了一个全卷积判别器, 通过对抗训练学习序列的多尺度短期微运动表示, 进一步提高预测精度. 本文建立了一个包括2维船舶轨迹和3维飞行器轨迹的轨迹预测数据集DT作为基准, 并在此与Transformer、LogTrans、Informer等模型进行对比实验. 实验结果表明本文的方法在中长期轨迹预测任务上优于其他模型.
2023, 32(12):276-283. DOI: 10.15888/j.cnki.csa.009338
摘要:基于大量历史数据的预测在环境治理、城市交通等领域已经成为必不可少的一个环节, 预测的准确性对实际生产、调度等工作有着重要影响. 受自然因素或人为因素的影响, 一些数据表现出高波动性以及不确定性, 导致无法充分发挥预测模型的最大优势. 本研究以非结冰期含沙量预测为案例, 探究了针对高波动性数据预测的优化方法, 发现通过基于SHAP方法的特征选择优化、数据平稳化以及前期聚类可以有效降低对高波动数据的预测误差, MAE从初始模型的1.502降低到0.194, 其中数据平稳化的优化效果最显著, MAE降低了76.51%, 但随着平稳化的阶数增大, 预测结果反而变差, 这是由于随着平稳化的阶数越高, 后续指数化的阶数也对应提升, 从而导致误差的指数倍增长. 此外, 将聚类结果作为特征输入可以有效“引导”多层感知机的参数学习过程.
2023, 32(12):284-291. DOI: 10.15888/j.cnki.csa.009335
摘要:在蓬勃发展的自动驾驶技术中, 行人轨迹预测的结果往往会影响到自动驾驶的安全性. 行人轨迹预测技术目前面临着在实际场景中应用时与他人的交互问题, 需要在预测轨迹的同时考虑社会交互性与逻辑自洽. 因此, 提出了一种基于时空图的行人轨迹预测方法, 该方法采用图注意力网络对场景中的行人交互进行建模, 并使用一种自动生成正负样本的方法来通过对比学习降低输出轨迹的碰撞率, 达到了提高输出轨迹的安全性以及逻辑自洽的效果. 在ETH和UCY数据集上进行模型训练与测试, 结果分析表明, 本文提出的方法有效降低了碰撞率, 且预测准确度优于主流算法.