2025, 34(4):1-17. DOI: 10.15888/j.cnki.csa.009839 CSTR: 32024.14.csa.009839
摘要:近年来, 随着伪造人脸技术的快速发展, 通过伪造人脸技术合成的人脸已经非常逼真, 人眼很难鉴别, 部分不法分子对伪造人脸技术的非法应用已经对社会稳定、个人隐私造成了恶劣影响, 因此伪造人脸检测技术的重要性日益凸显. 本文系统地探讨了伪造人脸检测技术的现状, 主要从伪造人脸图像和伪造人脸视频的检测两个方面进行分析. 在伪造人脸图像检测方面, 重点讨论了基于图像空间域和频率域的方法、身份一致性检测以及人脸区域定位技术的应用. 在伪造人脸视频检测方面, 研究聚焦于时空特征融合、生理特征利用及视听信息的结合. 此外, 本文介绍了常用的评估指标, 系统分析了多种重要数据集, 包括其特点和适用场景. 同时还指出当前文献中的局限性, 例如对抗样本的鲁棒性不足、检测方法对新型伪造技术的适应性差等问题. 基于这些分析, 我们提出了未来可能的研究方向, 包括跨域检测技术的优化、新算法的探索及模型的可解释性研究. 本文不仅为研究者提供了对伪造人脸检测技术的全面了解, 也为后续研究指明了发展方向, 具有重要的理论价值和实际应用意义.
2025, 34(4):18-33. DOI: 10.15888/j.cnki.csa.009865 CSTR: 32024.14.csa.009865
摘要:随着神经辐射场(NeRF)的提出, 其基于神经隐式表示场景的方法在生成高保真地图方面具有显著优势, 将NeRF应用于同时定位与地图构建(SLAM)中, 即基于NeRF的SLAM方法, 能够在实现高精度的定位的同时进行连续的3D建模, 通过渲染新视角并预测未知区域, 提高场景重建的质量和细节. 为了跟踪该领域的最新研究成果, 对近年来基于NeRF的SLAM的关键算法进行了回顾和综述. 首先介绍了NeRF技术的核心原理并全面概述了基于NeRF的SLAM方法的框架, 其次重点探讨了基于NeRF的SLAM的改进和优化, 包括提高神经隐式表征效率、解决大尺度场景建图问题、增加回环和全局优化实现全局一致性和解决动态干扰问题, 最后对基于NeRF的SLAM方法进行了展望, 为相关研究人员提供有价值的参考, 以促进更多创新研究.
2025, 34(4):34-44. DOI: 10.15888/j.cnki.csa.009819 CSTR: 32024.14.csa.009819
摘要:针对单目图像中不同深度目标的尺度差异所导致的单目3D目标检测算法精度不佳的问题, 提出一种基于融合采样和深尺约束的检测算法. 首先, 为增强采样特征对不同尺度目标的表征能力, 构建多尺度特征融合模块 (multi-scale fusion module, MFM), 通过分层聚合和迭代聚合对不同层级、不同尺度的特征进行融合采样, 从而提高对目标隐式尺度特征的提取能力. 此外, 构造深度尺度相关化模块 (depth-scale correlation module, DSCM), 利用深度与尺度之间的线性投影约束将不同尺度的目标补偿式放缩至同一特征水平, 以此平衡模型对不同距离目标的关注度. 基于KITTI数据集和Waymo数据集的定量结果表明, 所提出的算法相较于同类算法在多种难度下的整体平均精度AP3D分别提升了1.56个百分点和3.07个百分点, 验证了算法的有效性及泛化性, 同时基于两类数据集的定性结果验证了该算法显著缓解了目标尺度差异对检测性能造成的影响.
2025, 34(4):45-54. DOI: 10.15888/j.cnki.csa.009838 CSTR: 32024.14.csa.009838
摘要:针对现有乡村道路图像数据集数据样本少且类别不均衡的问题, 提出了一种基于改进StyleGAN的数据增强方法. 在原有StyleGAN框架基础上引入了解耦映射网络, 以降低W空间隐编码的耦合度; 综合卷积与Transformer的优点, 设计了一个卷积耦合迁移模块(CCTB), 该模块中的核心十字形窗口自注意力机制增强了网络对复杂上下文和空间布局的捕捉能力. 这两项改进使网络性能大幅提升. 通过消融实验对比改进前后的StyleGAN网络, IS指标从42.38提高到了77.31, FID值从25.09降至12.42, 表明了数据生成质量和真实性得到了显著提升. 为了验证数据增强对模型性能的影响, 采用了2种经典且主流的目标检测算法进行测试, 比较了原数据集与增强后数据集的性能差异, 进一步证实了改进措施的有效性.
2025, 34(4):55-63. DOI: 10.15888/j.cnki.csa.009825 CSTR: 32024.14.csa.009825
摘要:目前, 有多种谎言识别方法, 包括使用测谎仪测谎. 然而这些方法执行起来效果有限, 不仅需要与被测谎对象产生接触, 而且要求相关人员具备专业知识, 不便于实行, 且效果有限. 心理学研究表明, 微表情是人脸上的一种持续时间极其短暂的细微肌肉运动, 能反映人在做出此表情时的真实内心状态. 相关研究表明, 人脸上的微表情特征可以作为谎言识别的线索. 本文研究基于微表情特征的谎言识别, 首先构建一个说谎时的微表情数据集, 命名为MED. 其次, 设计一个基于多层自注意力机制的微表情特征学习模型MEDR, 根据学习到的说谎和未说谎时的微表情特征进行谎言识别. 最后, 本文还在新构建的数据集上, 对本文设计的模型与一些现有模型进行实验对比, 实验结果显示, 本模型在自制高质量数据集上取得94.33%的准确率, 表明本模型在谎言识别方面具备出色的性能.
2025, 34(4):64-75. DOI: 10.15888/j.cnki.csa.009808 CSTR: 32024.14.csa.009808
摘要:随着网络视频平台(network video platform, NVP)应用, 网络视频在不同视频平台分享时常面临被侵权和跨平台版权检测问题, 所以本文提出了一种基于区块链跨平台网络视频版权保护方案(blockchain-based cross-platform network video copyright protection scheme, BCVCP) 旨在通过区块链和利用生成的所有权序列(ownership sequence, OS), 进行所有权序列检测, 来实现跨视频平台的网络视频版权保护. 本方案包括身份认证、提取关键帧、所有权序列的生成和检测、网络视频控制管理等部分. 具体来说, 在对网络视频上传或访问等操作之前, 需要进行身份认证, 确保身份信息的安全. 其次, 上传网络视频过程中会生成所有权序列, 存储在分布式节点中. 然后, 提取视频关键帧, 把生成的所有权序列嵌入到视频关键帧中. 最后, 调用智能合约进行跨平台所有权序列检测和对网络视频的传播控制管理, 避免侵权行为. 在实验中, 验证了跨视频平台传输网络视频时所有权编码质量和所有权识别的鲁棒性, 保护了网络视频的版权.
2025, 34(4):76-89. DOI: 10.15888/j.cnki.csa.009816 CSTR: 32024.14.csa.009816
摘要:不同时间获取的同一区域的双时相遥感图像在风格上往往具有很大差异, 大多数研究方法忽略了这个问题, 导致在风格多样的数据集上应用时, 模型的性能指标和可视化效果不尽如人意. 为此, 本文首先使用风格迁移模块针对某一时刻原始图像生成类似另一时刻风格的风格迁移图像. 其次, 提出了一种基于双向风格迁移的孪生对称差分特征金字塔网络 (symmetrical difference feature pyramid network, SDFPNet), 确定不同风格迁移方向对变化检测精度提升的影响程度. 具体来说, 将原始图像和风格迁移图像作为SDFPNet输入, 使用两个孪生的轻量化网络和差分特征金字塔网络 (difference feature pyramid network, DFPNet)同时进行参数优化, 得到两个并行分支预测的变化图. 为了减少变化像素点的误判, 融合两个预测结果提升变化检测的准确性. 在LEVIR-CD、CDD和SYSU-CD这3个数据集上通过实验证明, 本文提出的基于双向风格迁移的SDFPNet在遥感变化检测任务上的评价指标优于SOTA (state-of-the-art)方法. 尤其是在由于季节变化, 风格差异较大的CDD和SYSU-CD数据集, 在CDD数据集上检测精度达到99.37%, F2分数达到94.19%, SYSU-CD数据集上检测精度达到92.31%. 有效解决了双时相图像风格差异大导致的变化检测精度不佳问题.
2025, 34(4):90-103. DOI: 10.15888/j.cnki.csa.009804 CSTR: 32024.14.csa.009804
摘要:针对现有基于图神经网络的会话推荐方法中缺乏对高阶特征的提取和利用以及数据稀疏性的问题, 提出一种结合动态多阶门控图神经网络 (GGNN)和超图卷积的自监督会话推荐模型(SDMHC-GNN). 首先, 利用不同的图结构将会话序列建模为3个不同的视图: 会话视图、超图视图和关系视图, 会话视图使用动态多阶门控图神经网络、稀疏自注意力和稀疏全局注意力机制生成局部顺序会话表示, 超图视图使用超图卷积和软注意力机制生成高阶会话表示, 关系视图使用图卷积和稀疏交叉注意力机制生成会话关系表示; 其次, 通过自监督学习对不同的会话表示之间的互特征最大化; 最后, 通过意向邻居协作模块对当前会话表示进行过滤和增强. 在Diginetica和Tmall两个公开数据集上进行多次实验, 并与先进基线模型比较, 实验结果表明所提出模型的性能优于基线模型, 证明了该模型的有效性.
2025, 34(4):104-114. DOI: 10.15888/j.cnki.csa.009849 CSTR: 32024.14.csa.009849
摘要:针对岩石CT图像超分辨率重建中纹理和边缘细节恢复不佳, 以及传统Transformer模型资源消耗大的问题, 本文提出了一种轻量级混合架构PDCLT模型. 该模型结合了基于像素差分卷积的细节强化CNN模块和轻量级Transformer模块, 以实现对局部与全局特征的高效提取. 具体而言, 首先提出细节强化模块, 融合了像素差分卷积和残差增强注意力, 并提出了自适应路径权重缩放方法, 以动态调整特征提取路径的权重, 增强了对细微结构和关键特征的捕捉. 其次, 轻量级Transformer模块集成高效多头注意力和多尺度特征融合网络, 在降低GPU内存需求的同时提取全局和多尺度特征. 最后, 在损失函数中加入孔隙度损失以优化孔隙结构的保留. 实验结果显示, PDCLT模型在重建质量和细节还原方面表现出色, 显著提升了岩石CT图像的超分辨率重建质量.
2025, 34(4):115-124. DOI: 10.15888/j.cnki.csa.009814 CSTR: 32024.14.csa.009814
摘要:Linux等大型软件通常利用配置文件来调整系统功能, 当配置项数量较多时, 彼此间依赖关系将变得复杂和容易出错. 若配置依赖约束定义不当, 一定条件下会导致对应配置项即便被选中, 也会由于潜在依赖问题而无法真正生效, 甚至导致系统编译或运行错误. 现有研究主要聚焦于Kconfig文件且仅考虑了反向依赖可能引发的配置错误. 本文则立足于Kconfig和Makefile的全面分析, 并综合研究了前者的直接依赖和反向依赖、二者间依赖不一致以及后者配置项在前者中缺少定义等4种情形, 以期发现尽可能多的潜在问题. 在此基础上, 设计配置错误检测工具, 针对Linux 6.7版内核源码, 检出并确认存在各类配置错误共计52处, 验证了本文方法及原型系统的有效性和实用性.
2025, 34(4):125-135. DOI: 10.15888/j.cnki.csa.009818 CSTR: 32024.14.csa.009818
摘要:近年来互联网码号资源公钥基础设施 (resource public key infrastructure, RPKI)部署率逐年上升, 这对依赖方软件原有单体同步的架构在性能与效率方面提出了挑战-其架构设计需要进行重新考量, 以适应RPKI技术的演进. 本文对RPKI同步任务进行了梳理与分析, 并基于此设计了一个RPKI依赖方任务同步系统. 相比单体架构, 该系统的分布式架构有着较高的同步性能及节点容错性. 同时, 本文为该系统设计了多种调度算法, 同时, 为进一步优化该系统性能, 本文对这些调度算法及任务调度策略进行了多组对照分析实验. 从实验结果看, 该分布式系统在大作业优先 (large job first, LJF)任务调度策略下的动态调度算法表现性能最佳.
2025, 34(4):136-145. DOI: 10.15888/j.cnki.csa.009820 CSTR: 32024.14.csa.009820
摘要:在使用共识速度咨询系统 (consensus speed advisory system, CSAS)为车队推荐速度时, 常面临服务不可信以及车辆之间发送不正确数据的问题. 此外, 现有研究多集中于平坦道路的速度咨询场景, 如果使用平坦道路的速度推荐, 车辆在斜坡上可能会消耗更多的能量, 无法实现最小能耗优化目标. 为了解决上述问题, 本文提出了一种基于区块链的斜坡共识速度咨询框架. 该框架是将现有的共识速度咨询系统扩展至道路斜坡场景, 以进一步解决了自动驾驶车辆在道路斜坡上的能耗最小的优化问题. 同时, 引入了私有区块链和加密原语, 以确保服务可信以及车辆之间数据传输的隐私性. 通过以太坊私有区块链和Truffle来实现该框架, 实验结果表明, 此框架能够在斜坡场景下提供可信的共识速度推荐, 并有效地降低车辆能耗.
2025, 34(4):146-154. DOI: 10.15888/j.cnki.csa.009833 CSTR: 32024.14.csa.009833
摘要:生产中多类型、小批量的小型精密器件(直径16–40mm)主要由固定工位机器人完成主要装配工作任务, 这种装配模式成本较大, 针对这种小型器件, 市面上的AGV存在灵活性差、定位精度低的问题, 因此本文设计并开发了一种搭载工业相机与双机械臂的全向AGV自主导航完成多生产线间的动态组合工作, 实现多种类型器件有序的辅助装配. 为了提高定位精度, 通过贝叶斯法则融合2D激光雷达和RGB-D建立融合栅格地图, 提高障碍物检测率. 采用EKF融合轮式里程计与IMU的数据, 提高里程计精度, 减少运动误差. 为了提高工作效率, 在实时性做出创新, 通过RGB-D得到待抓精密器件与相机光心的距离, 融合车速与雷达、相机等部件的位姿关系等信息解算出车载双机械臂在距离待抓精密器件S距离时的最佳运动时机. 最后为了准确识别多类型、小批量的小型精密器件, 基于改进的Yolo-Fastest算法识别器件, 提高识别精度的同时降低AGV的运算成本. 通过测试, 系统对小型精密器件(如RF连接器)识别准确率不低于95%, 在70×50×100 cm3空间内能实现全向移动, 运动误差最大为10 cm, 较现有的生产模式, 此AGV柔性化程度提高, 生产成本降低, 工作效率提高了近1倍, 具有实际推广价值.
2025, 34(4):155-165. DOI: 10.15888/j.cnki.csa.009850 CSTR: 32024.14.csa.009850
摘要:在提供精准的用户兴趣推荐时, 推荐系统的数据通常存在稀疏性问题, 对于新上线的项目存在冷启动问题, 缺乏用户交互数据, 为解决上述问题, 提出基于知识图谱的用户兴趣推荐算法. 首先, 在用户潜在兴趣中, 通过多层图神经网络根据用户和项目的嵌入向量, 获取用户和项目直接、间接和更深层次的关系, 解决数据稀疏性问题. 其次, 在用户显式兴趣中, 采用图结构增强根据评分权重随机删除用户和项目之间的显式关系, 通过编码器分析新的用户和项目节点的关系, 挖掘用户与项目间的交互关系, 解决冷启动问题. 最后, 采用特征交叉压缩单元结合知识图谱嵌入与推荐任务实现特征共享, 共享的特征更加深化项目与知识图谱实体间的互动, 提高推荐的准确性. 通过在Book-Crossing和Last.FM两个数据集上进行实验, 结果证明与其他对比算法相比在AUC和ACC评价指标中有显著的提升.
2025, 34(4):166-174. DOI: 10.15888/j.cnki.csa.009832 CSTR: 32024.14.csa.009832
摘要:肺结节图像的准确分割对于肺癌的早期诊断具有重要意义, 针对肺结节图像尺度多样、边缘模糊导致特征提取不充分和细节信息丢失问题, 本文提出一种融合多尺度特征和双分支并行的肺结节图像分割网络RAVR-UNet. 首先, 针对U-Net网络在编码阶段无法充分提取肺结节特征, 采用双分支并行特征聚合网络提取肺结节图像中的特征信息, 减少特征编码时的信息损失. 其次, 通过引入Agent_ViT模块, 在保持线性计算的基础上, 增强全局信息建模能力. 然后, 为恢复下采样期间丢失的肺结节空间信息, 在解码阶段加入多尺度特征融合模块. 最后, 设计混合损失函数以缓解肺结节图像分割任务中正负样本不平衡问题. 在LIDC-IDRI公开数据集上的实验结果表明, 所提网络的相似系数、交并比分别达到93.15%、87.63%, 优于主流肺结节分割算法且分割结果更接近真实值.
2025, 34(4):175-183. DOI: 10.15888/j.cnki.csa.009799 CSTR: 32024.14.csa.009799
摘要:近年来, 随着城市化进程的加快, 城市排水系统在面对极端天气时常难以应对, 道路积水问题频繁发生. 为了解决道路积水的检测问题, 本文基于DeepLabv3+模型提出改进算法. 首先, 在解码器端设计加权双向特征金字塔网络(bidirectional feature pyramid network, BiFPN)模块, 利用主干网络获取的不同尺度低层特征映射进行融合, 充分发挥从骨干网络获取的多尺度信息的潜力. 其次, 利用Mamba改进Transformer模块设计并行分支对高级特征映射进行处理, 构建全局依赖, 弥补ASPP中空洞卷积可能造成的局部信息丢失问题. 最后, 引入极化自注意力机制(polarized self-attention, PSA)模块, 减少双分支输出直接相加对于数据可能带来不同的影响. 实验结果表明, 在道路积水数据集上, 改进算法mIoU为87.54%, PA为96.61%, 与原算法相比, mIoU提高了4.22%, PA提高了1.66%.
2025, 34(4):184-194. DOI: 10.15888/j.cnki.csa.009806 CSTR: 32024.14.csa.009806
摘要:针对当前时间序列预测任务中存在多维特征建模困难、数据非平稳、预测准确性要求高等问题, 提出结合因果卷积的非平稳学习倒置Transformer模型. 该模型首先利用倒置嵌入时间序列数据交换注意力机制和前馈神经网络原有功能, 使用注意力机制学习时间序列数据的多元相关性, 前馈神经网络学习时间序列的时间依赖性, 在多维时间序列时间及变量上建模, 增强模型在时间维度和变量间关系的泛化能力, 从而提高模型的可解释性. 然后, 利用序列平稳化模块解决数据非平稳性问题以提高模型的可预测能力. 最后使用结合因果卷积的非平稳学习注意力机制将平稳化模块中消失的关键特征与信息重新引入, 从而提高模型的预测准确性. 与PatchTST、iTransformer、Crossformer等多个主流基准模型进行比较, 所提模型在Exchange等4个数据集上的均方误差平均下降了6.2%–65.0%. 通过消融实验表明本文的倒置嵌入模块、结合因果卷积的非平稳学习注意力模块能有效提升时间序列预测的准确度.
2025, 34(4):195-206. DOI: 10.15888/j.cnki.csa.009807 CSTR: 32024.14.csa.009807
摘要:随着注意力机制在目标检测中的广泛应用, 进一步提升特征提取能力成为研究的重点. 提出了一种新的注意力机制, 旨在优化特征交互过程, 提升检测性能. 所提机制移除了传统自注意力中的查询操作, 采用深度可分离卷积高效提取局部与全局信息, 并通过键和值的加权融合实现特征聚合. 本文方法有效降低了计算复杂度, 增强了模型对重要特征的捕捉能力. 通过在5个不同类型的数据集上进行验证, 实验结果表明, 该注意力机制在处理小目标检测、遮挡处理以及复杂场景下的表现优异, 显著提高了检测精度与效率. 可视化分析进一步证实了其在特征提取中的有效性.
2025, 34(4):207-217. DOI: 10.15888/j.cnki.csa.009809 CSTR: 32024.14.csa.009809
摘要:实体对齐技术旨在识别并匹配不同知识图谱中指代同一实体的项, 对于知识图谱的融合具有至关重要的作用, 其在知识补全、社交网络分析等多个领域已经展现出广泛的应用潜力与显著的实用价值. 随着基于知识表征学习的实体对齐方法的不断演进, 研究者们开始探索利用实体之间的多种信息维度来计算相似度, 从而评估源实体与目标实体之间的相似性. 尽管如此, 实体的部分属性信息在目前已有的方法中仍未得到充分利用, 尤其是实体属性中的主题信息, 通过主题模型能够识别出实体间更为显著的语义联系. 针对这一研究, 以实体属性的主题信息为核心, 提出了一种实体对齐框架EAGT (knowledge graph entity alignment via graph convolutional network with biterm topic model), 通过实体主题结合图卷积神经网络进行实体对齐. 为了验证所提方法的有效性, 在开源的数据集上进行了实验, 结果表明, EAGT在大多数情况下均实现了性能提升.
2025, 34(4):218-227. DOI: 10.15888/j.cnki.csa.009811 CSTR: 32024.14.csa.009811
摘要:针对无人机航拍图像目标尺寸小、分布密集且被遮挡造成误检漏检等问题, 提出一种结合重参数化思想与多层次特征融合的航拍图像小目标检测算法. 首先, 利用重参数化思想设计了重参数化卷积模块 (reparameterized convolution module, RCM), 与C2f模块结合设计了C2f-RCM模块, 通过扩大感受野有效绘制上下文信息, 更好地提取图像中的细微特征. 其次, 为解决颈部网络在特征融合部分造成的信息丢失问题, 提出一种多层次特征融合模块(multi-level feature fusion module, MFFM), 该模块利用跨层次间的信息融合, 有效减少了在遮挡情况下的漏检现象, 使得网络在检测大、中、小目标时能够显著提升准确度. 最后, 提出一种Inner-Shape IoU边界框回归损失函数, 通过构建辅助边框和关注边界框的自身形状, 以增强模型的收敛速度. 实验结果表明, 与基线模型相比, 本文方法在VisDrone2019中, mAP@0.5、Precision、Recall分别提高了5.7%、5.7%、2.4%, 在AI-TOD中, mAP@0.5、Precision、Recall提升了3.7%、3.9%、5.3%, 验证了本文方法在航拍图像小目标检测方面的有效性.
2025, 34(4):228-238. DOI: 10.15888/j.cnki.csa.009812 CSTR: 32024.14.csa.009812
摘要:多域面部表情转移涉及不同图像之间的相互转换, 目的是生成具有源面部表情和目标面部身份特征的高逼真度面部图像, 解决传统方法生成图像相似度高和图像真实性低的问题. 本文提出了一种基于改进StarGAN-V2的多域面部表情转移模型, 该模型由生成器、鉴别器、映射网络和风格编码器组成, 引入了空间注意力机制, 并将循环一致性损失改进为对抗性循环一致性损失, 在生成器后增加了一个新的域反馈鉴别器. 该改进后的StarGAN-V2模型能够基于源图像和目标图像, 生成具有源面部表情和目标面部身份特征的高逼真度面部图像. 实验结果表明, 改进后的模型潜在引导合成和参考引导合成FID值为11.9 与17.4, LPIPS值为0.491与0.426, 均优于对照模型, 改进后的模型解决了图像相似度高的问题, 生成的图像也更加真实.
2025, 34(4):239-247. DOI: 10.15888/j.cnki.csa.009851 CSTR: 32024.14.csa.009851
摘要:针对麻雀搜索算法SSA求解问题时收敛较快, 容易陷入局部最优解的问题, 本文提出一种融合多策略改进的麻雀搜索算法LCSSA. 首先通过采用非线性递减权重和Levy飞行策略共同改进发现者位置更新公式以提高算法的全局搜索能力与及时跳出局部最优解的能力; 其次, 通过引入柯西变异对跟随者位置更新, 即对最优解进行更新扰动. 本文选取4个对比算法在12个标准基准函数上进行对比实验验证. 实验结果表明, 改进后的算法在收敛速度以及稳定性方面取得了有效性的提升. 将LCSSA应用于疾病预测中, 算法在4种慢性疾病数据集中表现较好, 与对比算法相比具有更高的预测精度.
2025, 34(4):248-255. DOI: 10.15888/j.cnki.csa.009817 CSTR: 32024.14.csa.009817
摘要:为提高计算流体力学的求解速度, 一般采用并行执行的方法, 然而由于计算硬件架构和编程语言的多样性, 对程序的可移植性带来了挑战. 为此本文使用Kokkos框架实现了计算流体力学求解器的异构并行计算, 并且使用规约法、原子操作和染色法来处理并行计算过程中的数据冲突问题, 提出了基于此框架下的异构并行计算的数据冲突的算法实现方案. 针对图形处理器的架构特点, 分析了不同硬件上单精度和双精度计算的加速比, 得出了不同计算硬件上的最优并行策略. 研究证明使用原子操作单精度计算对于使用图形处理器加速流体力学计算而言, 能够极大地提升求解效率.
2025, 34(4):256-265. DOI: 10.15888/j.cnki.csa.009826 CSTR: 32024.14.csa.009826
摘要:准确的综合能源负荷预测是区域综合能源系统前期规划和后期按需协调运行的关键前提. 近期基于Transformer的方法由于其优秀的全局建模能力, 在长序列预测方面显示了显著潜力. 然而, Transformer中的排列不变自注意力机制导致了时间信息丢失, 且忽视了多能源负荷预测中不同变量之间的关键依赖关系. 为解决上述挑战, 本文提出了一种补丁与变量混合模型 (patch and variable mixing model, PVMM)以实现准确多能源负荷预测. PVMM 采用补丁嵌入技术, 将输入的多能源负荷序列转换为3D向量, 从而保留补丁的时间和变量信息. 其次, 本文提出了基于深度可分离卷积的补丁混合模块 (patch mixing module, PMM)建立时间依赖关系模型. 另外, 本文还提出了变量动态投影注意力模块 (variable dynamic projection attention module, VDP-AM)将查询 (Query)和数值 (Value)变量映射到更高维空间, 并通过自注意力机制处理多变量之间的相互作用. 最后, 本方法在亚利桑那州立大学公开的在线系统数据集的预测精度和泛化能力均超越现有方法.
2025, 34(4):266-275. DOI: 10.15888/j.cnki.csa.009827 CSTR: 32024.14.csa.009827
摘要:RISC-V软件生态正在加速发展, 国际开源社区积极投入RISC-V软件生态, 针对RISC-V主动适配和优化, 积极推动RISC-V软件生态系统向前发展. PyTorch是一个开源的Python机器学习库, 其在性能、开源生态、研究领域都有非常大的优势, 其对x86、ARM、PowerPC以及CUDA等指令集架构都提供了较好的支持. 但是, 在目前的RISC-V架构上, 软件生态移植集中在对RISC-V标准指令集的适配, 尚不能充分利用RISC-V扩展指令集优化软件生态, 距离ARM、x86等成熟软件生态存在较大差距. PyTorch因缺少RISC-V V扩展(RVV)的支持, 使得RISC-V平台的推理性能与同规格ARM平台差距较大. 针对上述问题, 本文提出了一种面向PyTorch RVV 1.0的高效开发方案, 并使用RVV扩展指令集对PyTorch深度卷积算子进行针对性优化, 并在K230开发板上进行了对比分析, 实验结果表明, 相比标量实现, 利用RVV优化的深度卷积算子性能提升约1.35–3.8倍.
2025, 34(4):276-285. DOI: 10.15888/j.cnki.csa.009848 CSTR: 32024.14.csa.009848
摘要:敦煌壁画是人类世界文明史中耀眼的瑰宝. 然而, 现有对敦煌壁画的算法研究主要集中在壁画修复方面, 很少有针对敦煌壁画的色彩风格迁移研究. 因此, 提出一种基于循环生成对抗网络的融合CBAM注意力机制的敦煌壁画风格迁移方法. 通过提取输入图像的特征, 将其输入到添加CBAM注意力机制的生成器中, 应用注意力机制提升重点区域的风格迁移效果, 抑制边界伪影的产生; 为了更好地保留图像内容的结构信息, 在下采样区和上采样区之间添加了残差网络模块; 并且在损失函数中加入色彩损失, 约束模型提高生成图像的风格化效果. 通过自建的敦煌壁画数据集上进行的实验验证, 所提出的模型在敦煌壁画艺术风格迁移任务中展现出了相较于现有方法的优越性. 该模型能够生成视觉效果更为卓越、艺术韵味更为浓厚的敦煌壁画风格化图像, 为敦煌壁画的创新研究提供了新思路.
2025, 34(4):286-297. DOI: 10.15888/j.cnki.csa.009859 CSTR: 32024.14.csa.009859
摘要:在知识图谱的整合过程中, 实体对齐 (EA)任务至关重要. 最先进的研究引入了外部知识 (属性文本、时间戳、图像信息等)以及多模态方法, 取得了较高的精度, 但这些方法往往对特定结构有较强的依赖性, 这限制了它们在不同结构知识图谱实体对齐任务中的适用性. 为了解决这一问题, 本文提出了一种通用的知识图谱实体对齐方法, 该方法利用知识图谱共有的实体、关系与图结构等信息工作, 上述部分在知识图谱中可被直接观察到, 因此统称为表层信息. 本文方法包含嵌入生成模块和对齐模块, 其中嵌入模块使用Transformer模型捕捉实体的固有语义及其邻居的贡献, 对齐模块则通过匹配算法实现高性能且稳定的对齐. 实验结果表明, 我们的方法在多个主流知识图谱间的对齐场景中实现了最先进的性能, 展现出稳定和可解释性强的特点. 我们的代码可在https://github.com/zb1tree/TGEA获取.