2025, 34(2):1-10. DOI: 10.15888/j.cnki.csa.009780 CSTR: 32024.14.csa.009780
摘要:针对现有的图像去雾算法仍然存在去雾不彻底、去雾后的图像边缘模糊、细节信息丢失等问题, 本文提出了一种基于Transformer和门控融合机制的图像去雾算法. 通过改进的通道自注意力机制提取图像的全局特征, 提高模型处理图像的效率, 设计多尺度门控融合块捕获不同尺度的特征, 门控融合机制通过动态调整权重, 提高模型对不同雾化程度的适应能力, 同时更好地保留图像边缘及细节信息, 并使用残差连接增强特征的重用性, 提高模型泛化能力. 经实验验证, 所提出的去雾算法可以有效恢复真实有雾图像中的内容信息, 在合成的有雾图像数据集SOTS上的峰值信噪比达到了34.841 dB, 结构相似性达到了0.984, 去雾后的图像内容信息完整且没有出现细节信息模糊和去雾不彻底等现象.
2025, 34(2):11-18. DOI: 10.15888/j.cnki.csa.009773 CSTR: 32024.14.csa.009773
摘要:在知识蒸馏(knowledge distillation, KD)领域中, 基于特征的方法可以有效挖掘教师模型所蕴含的丰富知识. 然而, 基于Logit的方法常面临着知识传递不充分和效率低下等问题. 解耦知识蒸馏(decoupled knowledge distillation, DKD)通过将教师模型和学生模型输出的Logit划分为目标类和非目标类进行蒸馏. 这种方式虽然提升了蒸馏精度, 但其基于单实例的蒸馏方式使得批次内样本间的动态关系无法被捕捉到, 尤其是当教师模型和学生模型的输出分布存在显著差异时, 仅依靠解耦蒸馏无法有效弥合这种差异. 为了解决DKD中存在的问题, 本文提出感知重构的方法. 该方法引入一个感知矩阵, 利用模型的表征能力对Logit进行重新校准, 细致分析类内动态关系, 重建更细粒度的类间关系. 由于学生模型的目标是最小化表征差异, 因此将该方法扩展到解耦知识蒸馏中, 把教师模型和学生模型的输出映射到感知矩阵上, 从而使学生模型能够学习到教师模型中更加丰富的知识. 本文方法在CIFAR-100和ImageNet-1K数据集上进行了一系列的验证, 实验结果表明, 该方法训练的学生模型在CIFAR-100数据集上的分类准确率达到了74.98%, 相较于基准方法提升了0.87个百分点, 提升了学生模型的图像分类效果. 此外, 通过对多种方法进行对比实验, 进一步验证了该方法的优越性.
2025, 34(2):19-27. DOI: 10.15888/j.cnki.csa.009743 CSTR: 32024.14.csa.009743
摘要:矿井下光照缺失、环境复杂, 安全帽目标尺寸较小, 导致一般目标检测模型对安全帽的检测效果不佳. 针对上述问题, 提出了一种基于改进YOLOv8s的矿井下安全帽佩戴检测模型. 首先, 将effectiveSE模块和YOLOv8s Neck层中的C2f模块相结合, 设计得到新的C2f-eSE模块, 提高了网络结构的特征提取能力, 并用Wise-EIoU损失函数替代CIoU损失函数, 提高了模型的鲁棒性; 其次, 在检测头中引入空间和通道重建卷积模块SCConv, 并根据参数共享思想设计了新的轻量化SPS检测头, 降低了模型的参数量和计算复杂度; 最后在模型中增加一层P2检测层, 使模型的特征提取网络融入更多的浅层信息, 提高了对小尺寸目标的检测能力. 实验结果表明, 改进后模型的mAP50指标提升了3.2%, 参数量降低了1.6%, GFLOPs降低了5.6%.
2025, 34(2):28-36. DOI: 10.15888/j.cnki.csa.009779 CSTR: 32024.14.csa.009779
摘要:自动文本摘要是自然语言处理(NLP)领域中的一个重要分支, 其主要难点之一是在于如何快速、客观且准确地评估生成摘要的质量. 针对现有文本摘要质量评估方法中评估准确度不高、需要参考文本以及计算资源消耗大的问题, 本文提出一种基于大语言模型的文本摘要质量评估方法, 设计基于思维链原理的提示词构建方法以提高大语言模型在文本摘要质量评估任务上的性能, 同时生成思维链数据集并以模型微调的方式对小型大语言模型进行训练, 显著降低了计算需求. 本文方法首先根据文本摘要的特点确定评估维度, 并基于思维链原理(chain of thought, CoT)构建提示词; 使用提示词对大型大语言模型进行引导, 使其根据摘要样本生成思维链过程与评估结果, 同时以此为基础生成思维链数据集; 使用生成的思维链数据集对小型大语言模型进行微调训练; 最后使用微调后的小型大语言模型完成文本摘要的质量评估任务. 本文在Summeval数据集上进行了对比实验与分析, 实验结果表明, 本评估方法显著提高了小型大语言模型在文本摘要质量评估任务上的评估准确度, 实现了一种无需参考文本、评估准确度高、计算需求低、便于部署的文本摘要质量评估方法.
2025, 34(2):37-48. DOI: 10.15888/j.cnki.csa.009755 CSTR: 32024.14.csa.009755
摘要:无人机(unmanned aerial vehicle, UAV)搭载边缘服务器构成移动边缘服务器, 可以在一些基站难以部署的场景下为用户设备(user equipment, UE)提供计算服务, 借助深度强化学习对智能体进行训练, 能够在连续复杂的状态空间中制定合理的卸载决策, 将用户产生的计算密集型任务部分卸载至边缘服务器处执行, 提高系统的续航和响应时间. 但目前的深度强化学习算法所使用的全连接神经网络无法较好地处理UAV辅助移动边缘计算(mobile edge computing, MEC)场景下的时间序列数据, 算法的智能体训练效率低, 决策性能差. 针对上述问题, 本文以最小化UAV辅助MEC系统总时延为目标, 提出了一种基于长短期记忆网络的双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient algorithm based on long short term memory, LSTM-TD3). 利用LSTM改进TD3算法的Actor-Critic网络结构, 将网络划分成3部分: 包含LSTM的记忆提取单元, 当前特征提取单元, 以及感知整合单元; 并在改进了经验池中的样本数据, 定义了历史数据, 使记忆提取单元能够得到更好的训练效果. 仿真结果表明, 与AC算法、DQN算法和DDPG算法相比, LSTM-TD3算法在以系统最小总时延为目标对卸载策略进行优化时具有最好的性能.
2025, 34(2):49-60. DOI: 10.15888/j.cnki.csa.009753 CSTR: 32024.14.csa.009753
摘要:传统的知识感知传播推荐算法中存在高阶特征相关度低、信息利用不平衡以及噪声引入问题. 提出一种多层次图间知识增强对比学习的知识感知传播推荐算法(MCLK-KE), 通过构建增强视图, 并利用自监督掩码重建预训练技术, 提取关键三元组的更深层信息, 有效抑制了噪声信号. 算法实现了知识与交互信号的均衡利用, 并以图间对比强化了特征表达, 捕捉到全局范围内的有效节点属性. 多任务训练通过联合训练推荐预测、对比学习和掩码重建任务, 提升模型性能. 在3个公开数据集上, MCLK-KE与最佳基线模型对比AUC指标最大提升了3.3%, F1值最高增长了5.3%.
2025, 34(2):61-73. DOI: 10.15888/j.cnki.csa.009763 CSTR: 32024.14.csa.009763
摘要:复杂地形条件下, 基于深度强化学习的无人机编队航迹规划可以完成无人机编队的轨迹寻优, 路径长度和环境适应性均优于传统启发式算法, 但仍存在训练稳定性不足、规划实时性差等问题. 面向领航者-跟随者模式的无人机集群, 本文提出了一种基于SPER-TD3算法的无人机编队实时三维航迹规划方法. 首先, 将基于SumTree的优先经验回放机制融入TD3算法, 设计了SPER-TD3算法, 确定无人机编队的轨迹; 然后, 使用基于角度队形控制方法优化跟随者的飞行轨迹, 并应用动态轨迹平滑算法优化转向角. 为了加快SPER-TD3算法的训练收敛速度和稳定性, 解决长时间依赖性问题, 设计了结合LSTM、自注意力机制以及多重感知机的网络模型结构. 在多种障碍物环境下进行了仿真实验, 结果表明, 所提方法在轨迹安全覆盖率、飞行路径平滑度、成功率、奖励大小等方面综合表现优于8种主流的深度强化学习算法, 其重要性综合评估值比当前方法提升8.5%–72.9%不等, 且训练稳定性最佳.
2025, 34(2):74-83. DOI: 10.15888/j.cnki.csa.009765 CSTR: 32024.14.csa.009765
摘要:基于Transformer的目标检测算法往往存在着精度不足, 收敛速度慢的问题. 许多研究针对这些问题进行改进, 取得了一定的成果. 但是这些研究大都忽视了Transformer结构应用于目标检测领域时存在的两个不足之处. 首先, 自注意力运算结果缺乏多样性. 其次, 因集合预测难度大, 使得模型在匹配目标的过程中表现不稳定. 为了弥补上述缺陷, 首先设计了自适应token池化模块, 增加自注意力权重的多样性. 其次, 设计了一种基于粗预测的锚框定位模块, 并利用该模块为查询提供位置先验信息, 从而提高二分图匹配过程的稳定性. 最后, 设计了基于组的去噪任务, 通过训练模型对位于目标附近的正负查询进行区分, 从而提高模型进行集合预测的能力. 实验结果表明, 本文提出的改进算法在COCO数据集上取得了较好的训练结果. 与基线模型相比, 改进算法在检测精度与收敛速度上有较大提升.
2025, 34(2):84-91. DOI: 10.15888/j.cnki.csa.009768 CSTR: 32024.14.csa.009768
摘要:在光谱三维CT数据中, 传统卷积的全局特征捕捉能力不足, 而全尺度的自注意力机制则需要大量的计算资源. 为了解决这一问题, 本文引入一种新视觉注意力范式(wave self-attention, WSA). 相比于ViT技术, 该机制使用更少的资源获得同等的自注意力信息. 此外, 为更充分地提取器官间的相对依赖关系并提高模型的鲁棒性和执行速度, 本文为WSA机制设计了一种即插即用的模块——波随机编码器(wave random encoder, WRE). 该编码器能够生成一对互逆的非对称全局(局部)位置信息矩阵. 其中, 全局位置矩阵用来对波特征进行全局性的随机取样, 局部位置矩阵则用于补充因随机取样而丢失的局部相对依赖. 本文在标准数据集Synapse和COVID-19的肾脏和肺实质的分割任务上进行实验. 结果表明, 本文方法在精度、参数量和推理速率方面均超越了nnFormer、Swin-UNETR等现有模型, 达到了SOTA水平.
2025, 34(2):92-101. DOI: 10.15888/j.cnki.csa.009762 CSTR: 32024.14.csa.009762
摘要:对于配备多种传感器的自动驾驶车辆, 在野外扬尘环境中进行高精度三维目标检测是一项重大挑战, 野外地形的多变性导致采集目标的区域特征差异性加剧, 同时扬尘颗粒物还会模糊目标特征. 为了克服这些困难, 本文提出了多模态特征动态融合的三维目标检测方法, 构建了多级特征自适应融合模块和特征对齐增强模块, 其中, 多级特征自适应融合模块动态调整模型对全局级特征和区域级特征的关注程度, 充分利用多级感受野, 减少区域差异对识别效果的影响; 而特征对齐增强模块则在多模态特征对齐之前增强感兴趣区域的特征表达, 有效抑制扬尘等干扰因素. 实验结果表明, 提出方法在自建野外数据集中比基线的平均精度提高了2.79%, 在KITTI数据集的困难级别检测中提高了1.7%, 表现出较好的鲁棒性和准确性.
2025, 34(2):102-110. DOI: 10.15888/j.cnki.csa.009757 CSTR: 32024.14.csa.009757
摘要:Android应用异步消息执行顺序的不确定性是导致其不稳定的主要原因. 现有不稳定测试研究大多通过随机确定异步消息的执行顺序以触发不稳定测试, 其检测效果不佳且效率较低. 本文提出一种基于happens-before (HB)关系的Android应用并发不稳定测试检测方法, 通过分析Android应用测试用例执行轨迹中异步消息间的HB关系, 进而确定异步消息的可执行区间; 并设计最大差异化调度策略, 有指导性地确定异步消息执行顺序, 使调度后的测试执行轨迹上异步消息执行序与原测试执行轨迹差异最大化, 进而尝试改变测试执行结果, 检测测试的不稳定性. 为验证本文方法的有效性, 针对40个Android应用程序的50个不稳定测试用例进行实验, 实验结果表明, 本文方法可检测全部不稳定测试用例, 相比于当前主流工具检测效果提升6%, 且平均检测时间缩短31.78%.
2025, 34(2):111-121. DOI: 10.15888/j.cnki.csa.009761 CSTR: 32024.14.csa.009761
摘要:分布式存储系统采用纠删码来实现高可靠和低开销的数据存储. 为了提供不同的可靠性和多样的访问性能, 存储系统需要对纠删码数据进行冗余转换, 即改变其编码参数. 条带合并机制为存储系统的冗余转换提供了一种思路. 然而, 基于传统纠删码的条带合并会在过程中引发大量的数据块重分布和校验块重计算I/O开销, 且在多次合并中会进一步加剧I/O. 针对此问题, 本文提出了一种新的树型里德-所罗门 (TRS)码, 通过分散数据块以消除数据块重分布I/O, 并通过设计编码矩阵以节约校验块重计算I/O. 树型里德-所罗门码进一步设计了存储单元, 将参与合并的条带组织成一棵树, 使得多次合并依据树结构自底向上高效完成. 本文设计实现了分布式存储原型系统. 实验表明, 树型里德-所罗门码相较于传统纠删码, 可以大大减少条带合并的完成时间.
2025, 34(2):122-134. DOI: 10.15888/j.cnki.csa.009751 CSTR: 32024.14.csa.009751
摘要:YOLOv8n算法在面对背景繁杂、目标密集、像素点小的情况下, 表现出识别精度欠佳、目标漏检及误识别的问题. 针对上述问题, 提出一种LNCE-YOLOv8n安全装备佩戴检测算法. 包括提出线性多尺度融合注意力LMSFA (linear multi-scale fusion attention)机制, 自适应聚焦关键特征, 提升对小目标信息提取的能力且减少计算. 提出C2f_NewNet (C2f_New network)结构, 通过有效的并行化设计, 保持高性能且减少深度. 结合轻量级通用上采样算子CARAFE (content-aware reassembly of feature), 实现跨尺度的高效特征融合与传播, 在大的感受野内聚合上下文信息. 基于SIoU (symmetric intersection over union)损失函数提出ESIoU (enhanced symmetric intersection over union), 提升模型在复杂环境中的适应性和精度. 实验采用safety equipment数据集进行训练测试, 结果表明LNCE-YOLOv8n算法相比YOLOv8n算法, 精度提升了5.1%, mAP50提升了2.7%, mAP50-95提升了3.4%, 有效提高建筑工地复杂场景的工人安全装备佩戴检测精度.
2025, 34(2):135-144. DOI: 10.15888/j.cnki.csa.009764 CSTR: 32024.14.csa.009764
摘要:关键句抽取技术是指利用人工智能, 自动从一段长文本中寻找核心句. 该技术可用于信息检索的预处理, 对文本分类、抽取式摘要等下游任务有着重要意义. 传统的无监督关键句抽取技术多数基于统计学以及图模型的方法, 存在着精度不高以及需要提前建立大规模语料库等问题. 本文提出了一种中文环境下的无监督抽取关键句方法T5KSEChinese, 该方法利用编码器-解码器架构, 通过输入和输出提示词来忽略目标句与原文长度不匹配的问题, 以得到更准确的结果. 同时, 本文提出一种对比学习正样本构造方式, 并将该方式结合对比学习来对模型编码器部分进行半监督训练, 提升下游任务效果. 本研究使用轻量化的模型, 在无监督下游任务中得分优于参数量大于自身数十倍的大语言模型, 最终实验结果证明了提出方法的准确度和可靠性.
2025, 34(2):145-153. DOI: 10.15888/j.cnki.csa.009778 CSTR: 32024.14.csa.009778
摘要:针对雾霾、雨雪等恶劣天气下拍摄到的图像退化模糊, 难以进行准确识别与检测的问题, 本文提出模糊场景下行人与车辆检测算法LiteBlurVisionNet (轻模糊视觉网络). 在主干网络部分使用global context enhancer注意力改进轻量级 MobileNetV3模块, 减少了参数量, 使得模型在雾霾、雨雪等恶劣天气条件下图像处理效率更高. 颈部网络采用更为轻量化的Ghost模块和由Ghost bottleneck模块改进的spectral Ghost unit模块, 能够更有效地捕获全局上下文信息, 提高特征的区分度和表达能力, 有助于减少参数数量和计算复杂度, 从而提高网络处理速度和效率; 预测部分采用DIoU NMS基于非极大抑制方法进行最大局部搜索, 去除冗余的检测框, 提高检测算法在模糊场景下的准确性. 实验结果表明, LiteBlurVisionNet算法模型的参数量比RTDETR-ResNet50算法模型下降了96.8%, 比YOLOv8n算法模型下降了55.5%, LiteBlurVisionNet算法模型的计算量比Faster R-CNN算法模型下降了99.9%, 比YOLOv8n算法模型下降了57%, LiteBlurVisionNet算法模型的mAP0.5比IAL-YOLO算法模型提高了13.71%, 比YOLOv5s算法模型提高了2.4%, 这意味着模型在存储和计算方面更加高效, 尤其适用于资源受限的环境或移动端设备.
2025, 34(2):154-164. DOI: 10.15888/j.cnki.csa.009767 CSTR: 32024.14.csa.009767
摘要:卡通角色面部检测是一项比人脸检测更具挑战性的任务, 它涉及许多困难的场景. 针对卡通角色面部间存在巨大差异的特点, 本文提出了一种卡通角色面部检测算法, 命名为YOLO-DEL. 首先, 基于GELAN融合BDD设计了DBBNCSPELAN模块, 旨在减小模型体积的同时增强检测性能. 接下来, 引入一种称为ELA的多尺度注意机制, 用于改善SPPF结构, 增强主干模型的特征提取能力. 最后, 设计了新的共享卷积检测头, 使网络更轻便. 同时也用Shape-IoU代替原CIoU损失函数, 提升模型的收敛效率. 在iCartoonFace数据集上进行实验, 通过消融实验验证得到的模型, 并将其与YOLOv3-tiny、YOLOv5n和YOLOv6等模型进行比较. 改进模型YOLO-DEL的mAP达到90.3%, 比YOLOv8提高了1.2%, 参数量为1.69M, 与YOLOv8相比参数量降低47%, GFLOPs 降低44%. 实验表明, 本文方法能有效提高卡通角色面部的检测精度, 同时缩小网络模型的大小, 验证本文方法的有效性.
2025, 34(2):165-173. DOI: 10.15888/j.cnki.csa.009774 CSTR: 32024.14.csa.009774
摘要:在时下的无监督深度哈希研究领域中, 基于对比学习而提出的方法占主流地位. 但是对比学习所采用的随机抽取负样本方式, 会带来采样偏差问题, 从而对图像检索精度造成负面影响. 为解决以上问题, 本文提出了一种基于偏差抑制对比学习的无监督深度哈希(unsupervised deep hashing based on bias suppressing contrastive learning, BSCDH). 本文在对比学习框架的基础上提出了偏差抑制方法(bias suppression, BSS), 将错误负样本近似为极困难负样本, 并设计了偏差抑制系数来抑制极困难负样本从而缓解采样偏差的负面影响. 本文根据当前负样本与查询样本的相似度来确定其对应的抑制系数取值, 并引入当前负样本与邻近的聚类中心间的距离关系对抑制系数进行取值修正, 降低正常负样本被过度抑制的可能性. 最终BSCDH的64位哈希码mAP@5000指标在CIFAR-10、FLICKR25K、NUS-WIDE数据集上分别达到0.696、0.833、0.819, 相较baseline具有显著的性能优势. 本文开展的大量实验证明了BSCDH在无监督图像检索方法中拥有较高的检索精度, 且能有效应对采样偏差问题.
2025, 34(2):174-182. DOI: 10.15888/j.cnki.csa.009771 CSTR: 32024.14.csa.009771
摘要:针对当下层级文本分类模型尚未充分利用层级实例的标签信息以及缺乏对类别分布不平衡的处理这两方面问题, 本文提出一种面向标签共现和长尾分布的层级文本分类方法(hierarchical text classification for label co-occurrence and long-tail distribution, LC-LTD), 对基于共享标签的文本全局语义和面向长尾分布的平衡损失函数进行研究. 首先, 设计一种基于共享标签的对比学习目标, 使具有更多共享标签的文本表示在特征空间中的语义距离更近, 引导模型生成具有判别性的语义表征; 其次, 引入分布平衡损失函数替换二进制交叉熵损失, 缓解层级分类固有的长尾分布问题, 提高模型的泛化能力. 在WOS、BGC两个公开数据集上将LC-LTD与当前多个主流模型进行比较, 结果表明所提方法具有更好的分类性能, 更适合处理层级文本分类任务.
2025, 34(2):183-194. DOI: 10.15888/j.cnki.csa.009772 CSTR: 32024.14.csa.009772
摘要:图像隐写分析旨在检测图像是否经过隐写术处理从而携带了秘密信息. 基于孪生网络的隐写分析算法通过计算待检测图像左右分区的不相似性以此判断图像是否携带秘密信息, 是目前深度学习图像隐写分析算法里面准确度较高的网络. 然而, 基于孪生网络的图像隐写分析算法仍然存在一些局限性. 首先, 孪生网络在预处理层和特征提取层中叠加的卷积块, 忽略了隐写信号从浅层传递到深层过程中容易丢失的问题. 其次, 现有的孪生网络使用的SRM滤波器仍然沿用其他网络使用的高通滤波器来抑制图像内容, 忽略了生成的残差图大小单一的问题. 为了解决以上问题, 本文提出了基于增强残差特征的孪生网络图像隐写分析方法. 本文方法设计了一种基于注意力的倒残差模块, 通过在预处理层和特征提取层的卷积块后添加基于注意力的倒残差模块, 重用图像特征, 引入注意力机制, 增强网络对图像纹理复杂区域的特征图赋予更多权重. 同时为了更好地抑制图像内容, 提出多尺度滤波器, 将残差类型调整为多个尺寸不同的卷积核进行操作, 丰富残差特征. 实验结果表明, 本文提出的基于注意力的倒残差模块和多尺度滤波器相较于现有方法分类效果更佳.
2025, 34(2):195-205. DOI: 10.15888/j.cnki.csa.009770 CSTR: 32024.14.csa.009770
摘要:密度峰值聚类(density peaks clustering, DPC)算法通过考虑局部密度和相对距离来识别簇中心以实现聚类. 然而, 该算法在处理密度分布不均匀和类簇大小不平衡的数据时容易忽视低密度区域的类簇中心, 需要人为设定类簇数量, 并且其分配策略中一个数据点分配错误会导致后续点的错误分配. 为了解决上述问题, 本文提出一种自适应稀疏感知密度峰值聚类算法. 首先, 引入模糊点概念以降低对子簇合并过程的影响; 其次, 利用减法聚类方法识别低密度区域的中心; 然后, 根据新的局部密度和反向最近邻数来识别噪声并更新子簇中心; 最后, 给出改进的全局交叠度, 结合全局可分度指导子簇融合, 并在这些度量下自动确定聚类结果. 实验结果表明, 在合成数据集和UCI数据集上, 与DPC及其改进算法相比, 本文提出的算法能够更好地识别稀疏簇、减少非中心分配带来的连锁反应, 自动确定最优类簇数目并获得更加准确的聚类结果.
2025, 34(2):206-215. DOI: 10.15888/j.cnki.csa.009769 CSTR: 32024.14.csa.009769
摘要:现有的知识图谱链路预测方法在学习语义信息的过程中大多只关注单个三元组中头实体h、关系r和尾实体t之间的语义关系, 没有考虑不同三元组中相关实体和实体关系之间的联系. 针对此问题, 本文提出了DeepE_CL模型. 首先, 通过DeepE模型学习相关三元组的语义信息和具有相同实体关系对的实体或具有相同实体的实体关系对的语义信息. 其次, 利用提取的相关三元组语义信息计算相应的评分函数和交叉熵损失, 并采用对比学习模型对提取的具有相同实体关系对的实体或具有相同实体的实体关系对的语义信息进行优化, 从而实现对相关三元组缺失信息的预测. 本文在4个常见的数据集上进行验证, 运用MR、MRR、Hit@1和Hit@10这4个评价指标对所提方法和其他基线模型进行对比, 实验结果表明DeepE_CL模型在所有指标上都取得了最好的结果. 为了进一步验证模型的实用性, 本文还将模型应用到了1个真实的中成药数据集, 实验结果显示DeepE_CL模型比DeepE模型在MR指标上降低了18, 在MRR、Hit@1指标上分别提升了0.8%、1.1%, 在Hit@10指标上维持不变. 实验证明了引入对比学习模型的DeepE_CL模型在提升知识图谱链路预测性能方面的有效性.
2025, 34(2):216-224. DOI: 10.15888/j.cnki.csa.009752 CSTR: 32024.14.csa.009752
摘要:肺炎是一种常见的呼吸系统疾病, 早期诊断对于有效治疗至关重要. 本研究提出了卷积神经网络(CNN)和Transformer结合的CTFNet混合模型, 旨在实现高效而准确的肺炎辅助诊断. 该模型融合了卷积分词器和聚焦线性注意力机制. 卷积分词器通过卷积操作实现更紧凑的特征提取, 并保留图像的关键局部特征降低计算复杂度, 提高模型的表达能力. 聚焦线性注意力机制缓解了Transformer的计算需求, 优化了注意力框架, 大幅提升了模型性能. 在Chest X-ray Images数据集上, CTFNet在肺炎分类任务中表现出色, 达到了99.32%的准确率、99.55%的精确率、99.55%的召回率和99.55%的F1值. 较好的性能凸显了该模型在临床应用中的潜力. 为了评估CTFNet的泛化能力, 我们将其应用于COVID-19 Radiography Database数据集. 在该数据集中, CTFNet被用于多个二分类任务均达到98%以上的准确率. 这些结果表明, CTFNet在肺炎图像分类的各种任务中具有较好的泛化能力和可靠性.
2025, 34(2):225-236. DOI: 10.15888/j.cnki.csa.009747 CSTR: 32024.14.csa.009747
摘要:现有的基于卷积神经网络的超分辨率重建方法由于感受野限制, 难以充分利用遥感图像丰富的上下文信息和自相关性, 导致重建效果不佳. 针对该问题, 本文提出了一种基于多重蒸馏与Transformer的遥感图像超分辨率(remote sensing image super-resolution based on multi-distillation and Transformer, MDT)重建方法. 首先结合多重蒸馏和双注意力机制, 逐步提取低分辨率图像中的多尺度特征, 以减少特征丢失. 接着, 构建一种卷积调制Transformer来提取图像的全局信息, 恢复更多复杂的纹理细节, 从而提升重建图像的视觉效果. 最后, 在上采样过程中添加全局残差路径, 提高特征在网络中的传播效率, 有效减少了图像的失真与伪影问题. 在AID和UCMerced两个数据集上的进行实验, 结果表明, 本文方法在放大至4倍超分辨率任务上的峰值信噪比和结构相似度分别最高达到了29.10 dB和0.7807, 重建图像质量明显提高, 并且在细节保留方面达到了更好的视觉效果.
2025, 34(2):237-245. DOI: 10.15888/j.cnki.csa.009766 CSTR: 32024.14.csa.009766
摘要:由于虚假新闻检测任务的现有工作往往忽略了新闻文本的语义稀疏性及丰富信息之间的潜在联系, 限制了模型对虚假新闻的理解和识别能力, 本文提出了一种基于异质子图注意力网络的虚假新闻检测方法. 针对新闻样本的文本、所属党派、主题等多种信息, 构建了异质图, 以建模虚假新闻的丰富特征. 在特征层采用异质图注意力网络捕获不同类型信息之间的关系, 在样本层引入子图注意力网络挖掘新闻样本间的交互. 同时基于自监督对比学习的互信息机制关注全局图结构中的判别性子图表征, 以捕获新闻样本的特异性. 实验结果表明, 本文提出的方法在Liar数据集上相比现有方法在准确率与F1值分别取得了约9%和12%的提升, 显著提升了虚假新闻检测的性能.
2025, 34(2):246-253. DOI: 10.15888/j.cnki.csa.009758 CSTR: 32024.14.csa.009758
摘要:在自动驾驶技术的领域中, 利用鸟瞰图(bird’s eye view, BEV)进行3D目标检测任务已经引起了广泛的关注. 针对现有相机至鸟瞰视图转换方法, 实时性不足、部署复杂度较高的难题, 提出了一种简单高效、无需任何特殊工程操作即可部署的视图转换方法. 首先, 针对完整图像特征存在大量冗余信息, 引入宽度特征提取器并辅以单目3D检测任务, 提炼图像的关键特征, 确保过程中信息损失的最小化; 其次, 提出一种特征引导的极坐标位置编码方法, 增强相机视角与鸟瞰图表示之间的映射关系与模型空间理解能力; 最后, 通过单层交叉注意力机制实现可学习BEV嵌入与宽度图像特征的交互, 从而生成高质量的BEV特征. 实验结果表明: 在nuScenes验证集上该网络架构与LSS (lift, splat, shoot)相比mAP从29.5%提升到32.0%, 提升了8.5%, NDS从37.1%提升到38.0%, 提升了2.4%, 表明该模型在自动驾驶场景下的3D目标检测任务的有效性. 同时相比于LSS在延迟上降低了41.12 %.
2025, 34(2):254-263. DOI: 10.15888/j.cnki.csa.009781 CSTR: 32024.14.csa.009781
摘要:针对现有聚合物用量劈分算法, 在处理不同区块井组时自适应性不足的问题, 本文提出基于改进秃鹰搜索算法的聚合物驱油井组劈分方法, 首先通过灰色关联度分析法获得初步劈分系数, 进而计算每个采油井的累计注入量与实际产液量的差值, 并设定合理阈值范围和约束条件; 其次通过引入Sobol序列和ICMIC映射、黄金正弦莱维飞行引导机制及非线性收敛因子和自适应惯性权重策略改进秃鹰搜索算法, 增强算法的搜索能力和收敛精度; 最后利用改进秃鹰搜索算法对某油田实际区块内井组劈分系数优化模型进行求解, 结果表明计算出的劈分注入量与实际产液量吻合度较高, 具有较好的劈分精度.
2025, 34(2):264-271. DOI: 10.15888/j.cnki.csa.009748 CSTR: 32024.14.csa.009748
摘要:在任务计算密集型和延迟敏感型的场景下, 无人机辅助的移动边缘计算由于其高机动性和放置成本低的特点而被广泛研究. 然而, 无人机的能耗限制导致其无法长时间工作并且卸载任务内的不同模块往往存在着依赖关系. 针对这种情况, 以有向无环图(direct acyclic graph, DAG)为基础对任务内部模块的依赖关系进行建模, 综合考虑系统时延和能耗的影响, 以最小化系统成本为优化目标得到最优的卸载策略. 为了解决这一优化问题, 提出了一种基于亚群、高斯变异和反向学习的二进制灰狼优化算法(binary grey wolf optimization algorithm based on subpopulation, Gaussian mutation, and reverse learning, BGWOSGR). 仿真结果表明, 所提出算法计算出的系统成本比其他4种对比方法分别降低了约19%、27%、16%、13%, 并且收敛速度更快.
2025, 34(2):272-280. DOI: 10.15888/j.cnki.csa.009746 CSTR: 32024.14.csa.009746
摘要:为充分挖掘专家历史事故根原因分析经验, 提升事故根原因分析的准确性与全面性, 减少化工安全事故发生, 本文提出一种基于历史事故报告与根原因指标体系关联挖掘的分析方法. 通过构建事故报告与指标体系的关联矩阵, 采用预训练模型对事故文本和指标项文本进行表征, 基于注意力机制融合二级和三级指标项的信息, 最后运用图卷积神经网络进行事故根原因分析. 通过在1351份样本上进行验证, 实验结果表明: 该方法显著提高了根原因预测准确性, 能够有效利用专家历史分析经验辅助当前事故分析, 并揭示历史事故分析不完整的问题. 同时, 该方法也能通过不完整的事故描述准确挖掘事故根原因, 该方法的应用将提升事故预防和安全生产风险管理的水平.
2025, 34(2):281-291. DOI: 10.15888/j.cnki.csa.009739 CSTR: 32024.14.csa.009739
摘要:为求解带时间窗的车辆路径问题, 以最小化总行驶里程为目标建立混合整数规划模型, 提出了一种具有时间窗约束松弛的混合蚁群算法. 首先, 提出改进的蚁群算法与“TSP-Split编码与解码”相结合的方法, 来构建允许违反时间窗约束的解路径, 以提高算法的全局寻优能力. 然后, 利用“及时返回”原则和惩罚函数方法, 提出基于变邻域搜索的修复策略来修复不可行解. 最后, 对56个Solomon和12个Homberger基准算例进行试验计算, 结果表明该算法的求解质量优于文献中的对比算法, 且在50个测试实例上获得了已知最优解, 其余实例也能在可接受计算时间内获得准最优解, 验证了所提算法的有效性.