• 2025年第34卷第12期文章目次
    全 选
    显示方式: |
    • >综述文章
    • 基于景深估计的水下图像复原方法综述

      2025, 34(12):1-15. DOI: 10.15888/j.cnki.csa.010033 CSTR: 32024.14.csa.010033

      摘要 (144) HTML (0) PDF 2.98 M (924) 评论 (0) 收藏

      摘要:水下图像受到水介质散射、吸收等因素的影响, 导致图像严重降质, 而场景深度作为图像中的重要参数, 在水下图像复原中起着关键性作用, 它既可以作为基于物理模型复原方法的中间参数, 又可以当作深度学习方法中的特征处理. 首先, 本文从水下图像复原的基本原理出发, 介绍了水下成像模型. 其次, 重点分析了物理模型方法和深度学习方法在景深估计与图像复原中的应用, 对不同方法进行分类归纳总结, 并对比不同方法的优缺点, 揭示场景深度在退化建模与复原优化中的核心作用. 然后, 通过实验从主观和客观两个方面对几种算法进行了对比, 分析了它们的优势与局限性. 最后, 提出展望, 为未来水下图像复原技术的发展提供了新的思路与方向.

    • 基于RISC-V异构平台的大语言模型推理加速

      2025, 34(12):16-25. DOI: 10.15888/j.cnki.csa.010067 CSTR: 32024.14.csa.010067

      摘要 (98) HTML (0) PDF 2.08 M (416) 评论 (0) 收藏

      摘要:随着大语言模型在各类生成任务中的广泛应用, 其高计算负载对底层硬件平台提出了更高的性能要求. RISC-V 作为一种新兴的开源指令集架构, 凭借其良好的可定制性和扩展性, 展现出巨大的发展潜力. 然而在部署主流大模型方面, RISC-V平台仍面临生态不完善、算力受限等诸多挑战. 本文提出一种基于RISC-V平台的大语言模型推理加速方法, 通过构建寒武纪MLU370加速卡的异构运行环境, 成功完成了设备驱动移植、基础库编译与PyTorch框架适配. 在此基础上, 进一步设计了一种轻量级多线程优化策略, 提升注意力机制等核心算子在多核体系结构下的执行效率. 实验结果表明, 在SG2042+MLU370-S4平台上部署多个主流大模型时, 该方法在不依赖其他优化策略下, 实现最高达52.3倍的端到端推理加速, 验证了其在RISC-V异构平台上的可行性与通用性.

    • 基于策略优化和表征搜索的改进多智能体进化强化学习

      2025, 34(12):26-38. DOI: 10.15888/j.cnki.csa.010014 CSTR: 32024.14.csa.010014

      摘要 (87) HTML (0) PDF 3.05 M (526) 评论 (0) 收藏

      摘要:多智能体进化强化学习将进化算法融入多智能体强化学习中, 缓解了多智能体强化学习固有的低质量奖励信号和非平稳性等问题. 然而, 现有工作中强化学习和进化算法之间的学习与探索通常难以平衡, 一方面强化学习中的较差策略会对种群造成潜在的破坏性影响, 另一方面种群中高质量策略的低利用率限制了整体的学习效率. 此外, 在复杂的部分可观测环境中, 智能体难以实现有效的观测表征, 降低了智能体的决策准确性. 为了解决上述问题, 本文提出了一种基于策略优化和表征搜索的改进多智能体进化强化学习方法(improved multi-agent evolutionary reinforcement learning with strategy optimization and representation search, SORS). 首先, 针对学习与探索的平衡问题, 本文设计了一个奖励驱动的策略优化模块, 使用优势策略来指导进化算法的种群变异和强化学习的梯度优化. 其次, 针对复杂环境中的部分可观测性问题, 引入了一个表征搜索方法, 通过添加扰动的表征网络种群来搜索更好的表征, 优化了智能体在复杂环境中的观测表征. 最后, 在星际争霸仿真平台上对提出的方法进行了实验验证, 实验结果表明SORS具有卓越的性能, 在不同环境的平均胜率超过了所有的基线算法.

    • 面向无人机航拍图像的多尺度目标识别

      2025, 34(12):39-54. DOI: 10.15888/j.cnki.csa.010007 CSTR: 32024.14.csa.010007

      摘要 (100) HTML (0) PDF 3.72 M (568) 评论 (0) 收藏

      摘要:针对无人机航拍图像目标尺度变化多样、小尺度目标识别困难等问题, 本文提出一种多尺度目标识别算法MON-YOLOv8n. 首先, 基于正交通道注意力网络OrthoNets设计C2f_OCA模块, 通过引入注意力机制和正交通道的设计, 改进卷积神经网络多尺度特征提取上的表现, 增强模型对复杂数据的多维度理解. 其次, 引入多尺度边缘增强模块(MEEM)和多阶门控聚合模块(MOGA), 强化物体的边缘细节, 有效减少特征中的冗余信息. 然后, 在骨干和颈部网络中分别引入SPDConv和RepViTBlock模块, 实现模型参数量的降低并提高小尺度目标的检测能力. 最后, 更改目标检测层, 使用NWDLoss损失函数, 进一步增强模型对小目标的检测能力, 提高模型鲁棒性. 实验结果表明, 在HIT-UAV、DroneVehicle和DOTAv1这3个公开数据集上, MON-YOLOv8n模型的mAP50分别达到95.2%、85.2%和84.1%, 相较于YOLOv8n基线模型分别提高了7.2%、4.8%和5.0%.

    • 图像处理模型的自适应伪装水印方法

      2025, 34(12):55-66. DOI: 10.15888/j.cnki.csa.010027 CSTR: 32024.14.csa.010027

      摘要 (82) HTML (0) PDF 5.14 M (553) 评论 (0) 收藏

      摘要:图像处理模型在各种场景中得到了广泛的应用, 为了防止模型被非法使用, 保护图像处理模型的知识产权变得越来越重要. 针对现有图像处理模型水印方法存在高频伪影、影响模型效率及隐蔽性不足的问题, 本文提出一种图像处理模型的自适应伪装的黑盒水印方案. 通过提取图像颜色特征生成与背景自然融合的伪装纹理作为触发模式, 并设计识别转换模块将触发图像转换为高质量水印图像. 该方法利用HLS直方图滤波和局部聚类算法动态提取主颜色特征, 结合高斯滤波与羽化掩膜技术优化纹理隐蔽性, 确保水印在空域和频域均无伪影干扰. 实验表明, 该方法不影响模型的保真度, 且水印验证匹配率达100%, 同时对模型微调、剪枝等一系列移除和攻击方法均表现出鲁棒性.

    • MS-SwinCE: 融合多尺度Swin Transformer与对比特征增强的遥感图像变化检测

      2025, 34(12):67-74. DOI: 10.15888/j.cnki.csa.010022 CSTR: 32024.14.csa.010022

      摘要 (95) HTML (0) PDF 2.90 M (546) 评论 (0) 收藏

      摘要:遥感图像变化检测在城市扩张与灾害监测等领域中具有重要意义, 然而, 现有方法在特征提取能力、抗伪变化干扰以及多尺度融合方面仍存在不足之处. 本文提出一种融合多尺度Swin Transformer、对比特征增强模块(contrastive feature enhancement module, CFEM)与双向特征金字塔网络(bi-directional feature pyramid network, BiFPN)的变化检测模型MS-SwinCE. 该模型利用局部窗口和移位机制增强长程依赖建模能力, CFEM精准提取变化差异并抑制噪声, BiFPN实现多尺度语义信息的高效融合. 实验结果表明, MS-SwinCE在LEVIR-CD数据集上, 相较于ChangeFormer, IoU提升了1.18%, F1分数提升了0.70%, Precision提升了0.32%, Recall提升了1.06%; 在WHU-CD数据集上, 相较于BIT, IoU提升了1.84%, F1分数提升了1.06%, Precision提升了0.47%, Recall提升了1.66%. 此外, 在保持较高精度的同时, 模型参数量为31.66M, 明显低于精度相近的ChangeFormer (41.03M), 在精度与效率间实现了良好权衡. 消融实验进一步验证了各模块的有效性与协同增益.

    • 大语言模型驱动的碳知识库构建与应用

      2025, 34(12):75-88. DOI: 10.15888/j.cnki.csa.010017 CSTR: 32024.14.csa.010017

      摘要 (77) HTML (0) PDF 2.02 M (555) 评论 (0) 收藏

      摘要:大语言模型(large language model, LLM)在自然语言理解与生成领域展现出卓越能力, 但在特定领域知识密集型任务中仍面临事实准确性不足、知识更新难以及高质量领域数据集匮乏的问题. 在应对上述难题时, 检索增强生成(retrieval-augmented generation, RAG)技术脱颖而出, 成为行之有效的解决路径. 然而, 在应对碳领域的知识密集型任务时, RAG技术还存在查询理解环节容易出现偏差、外部知识检索策略僵化单一、检索得到的结果与实际需求的相关性较差等短板, 同时缺乏特定的数据集来评估问答效果. 针对以上问题, 提出基于多管道的检索增强生成(Multi-pipeline-based RAG)方法, 使用本文提出的图谱增强递归式智能合并检索, 有效提升了检索精确率; 针对特定领域问答数据集的缺乏, 提出基于父节点文本的大模型自动生成问答数据集方法. 同时在传统评估指标, 如精确率(Precision)、召回率(Recall)等基础上, 利用LLM的文本理解能力评估: (1)响应-上下文-查询相关性评估; (2)响应-查询相关性评估; (3)上下文-查询相关性评估; (4)忠诚性评估. 通过与BM25-based RAG、Vector-based RAG、Recursive-based RAG的对比实验, 基于GLM-4-Plus模型的Multi-pipeline-based RAG精确率达到了85%, 高于其他方法.

    • 自适应融合单帧与多帧特征的视频去模糊

      2025, 34(12):89-98. DOI: 10.15888/j.cnki.csa.010016 CSTR: 32024.14.csa.010016

      摘要 (63) HTML (0) PDF 2.11 M (479) 评论 (0) 收藏

      摘要:近年来, 基于双分支结构的视频去模糊方法因其在低计算资源场景下的复原表现得到广泛关注, 但却因未充分挖掘和利用视频前后帧的互补性, 导致模型无法充分捕捉视频的中间信息, 从而限制了对长时间模糊的处理能力. 为了解决该问题, 本文提出一种自适应的双分支结构去模糊网络. 在特征提取与特征重建阶段, 使用5个堆叠的U-Net网络进行特征提取与重建. 在特征融合阶段, 首先将经过特征提取阶段的当前帧与前后帧输入多帧分支得到多帧特征; 然后将当前帧输入单帧分支得到单帧特征; 最后将多帧特征与单帧特征输入特征融合模块, 利用中间信息提取模块生成的权重引导特征融合模块生成融合特征. 该网络既能利用连续帧之间的时间信息, 又能利用当前帧的空间信息, 同时在权重引导下可以自适应地生成融合特征, 自适应的模式可以提高所恢复特征的准确性. 大量实验表明, 在公开数据集GOPRO、DVD和BSD上与目前主流视频去模糊网络结果进行对比, 从视觉上该方法能恢复出更清晰的图像与更准确的细节, 在PSNR和SSIM评价指标上该方法均为最佳.

    • 面向稀疏社交网络的图混合学习好友推荐

      2025, 34(12):99-110. DOI: 10.15888/j.cnki.csa.010035 CSTR: 32024.14.csa.010035

      摘要 (61) HTML (0) PDF 2.18 M (499) 评论 (0) 收藏

      摘要:为应对社交网络稀疏性对好友推荐的挑战, 提出了一种图混合学习好友推荐模型(graph hybrid learning-based friend recommendation model, GHLFR). 该模型综合了图对比学习和自训练的方法, 并设计了一个增强的图卷积神经网络强化用户特征的传播, 同时将特征有效融合, 缓解了社交网络稀疏性问题. 具体地, 首先通过一个包含图生成器和图去噪器的对比视图生成器, 得到不同类型的对比视图用于图对比学习, 以捕获用户社交和行为的一致性特征. 然后, 设计一个融入特征交叉的图卷积层, 优化了邻域聚合过程, 以深入挖掘用户特征. 随后, 采取有效策略, 融合用户的社交特征和兴趣特征. 最后, 经过自训练的预测, 筛选出高质量伪链接, 以迭代优化模型. 在3个真实数据集Ciao、Epinions和Last.FM上与基线模型进行实验比较与分析, 结果表明该模型在多个评价指标上优于其他模型.

    • 基于残差差分卷积的医学图像模糊边缘增强分割

      2025, 34(12):111-118. DOI: 10.15888/j.cnki.csa.010034 CSTR: 32024.14.csa.010034

      摘要 (60) HTML (0) PDF 2.39 M (540) 评论 (0) 收藏

      摘要:医学影像精准分割常因病灶与邻近组织形态与色彩高度相似而边界模糊, 降低了分割精度与诊断可靠性. 本研究提出基于残差差分卷积的模糊边缘增强网络, 设计边缘感知细节提取模块, 通过梯度特征编码强化边缘信息. 在瓶颈层引入全局边缘细节双层级路由注意力, 融合上下文实现精准建模; 构建残差边缘感知定位模块, 实现模糊边缘精细定位. 实验结果表明, 在结直肠癌、皮肤病变和乳腺超声图像公开数据集上, 该方法显著减少参数量与计算复杂度的同时, 分割性能均稳超现有先进方法. 系统消融研究进一步验证各组件在提升边缘检测效能方面的协同作用, 充分展示了该方法提升医学图像分析可靠性的潜在应用价值.

    • 基于区块链的执法全流程存证模型

      2025, 34(12):119-128. DOI: 10.15888/j.cnki.csa.010025 CSTR: 32024.14.csa.010025

      摘要 (58) HTML (0) PDF 1.94 M (519) 评论 (0) 收藏

      摘要:由于文化市场执法环境复杂且电子证据固定困难, 根据文化市场综合执法场景功能需求, 提出一种基于区块链的行政执法全流程管理模型. 针对执法过程中案件文书可能面临更新的问题, 提出一种基于随机委员会综合验证的区块链修订方法, 通过可验证随机函数选择一定数量用户组成投票委员会, 对修订内容进行审核后添加至链尾, 保证区块链的前后一致性. 同时, 为加强敏感信息的隐私保护提出一种链上数据访问控制方法, 通过双重加密和策略配置保证数据跨部门共享的安全性. 经过模型分析和对比实验, 证明所提模型能够满足安全性和可靠性需求, 为执法信息化和智能化提供可信的数据基础.

    • 基于多尺度感知与双流融合的尘肺病分期诊断

      2025, 34(12):129-138. DOI: 10.15888/j.cnki.csa.010021 CSTR: 32024.14.csa.010021

      摘要 (67) HTML (0) PDF 2.30 M (407) 评论 (0) 收藏

      摘要:针对尘肺病患者胸部X光片中病灶特征模糊与解剖关联弱可解释性的临床难题分期诊断困难问题, 本文设计了一种基于多尺度感知和Transformer的双流融合尘肺病分期诊断模型(MDC-Net). MDC-Net通过构建多尺度感知网络与细节保留型编码器的协同架构, 融合局部解剖特征与全局空间关联分析, 显著提升诊断准确性. 首先, 采用全局分组注意力卷积模块增强对微小结节特征的提取能力, 结合可逆残差编码器映射技术保留毛玻璃影等关键征象的纹理细节, 有效解决了纹理丢失问题. 同时, 设计了全局-局部双流融合机制, 通过层级化解剖Transformer建立肺门结构与胸膜线的空间关联模型堆叠栈, 打破空间关联建模的瓶颈. 实验结果表明, MDC-Net在西南医科大学附属医院的1760例临床数据上, 对于I–IV期诊断的AUC值分别达到0.9877、0.8449、0.7987、0.9912, 相较于Vision Transformer在整体准确率上提升了5.42%, F1指数提升了4.92%, 尤其在难以区分的I期和II期诊断的AUC值分别提升了0.0934和0.0426, 有效满足了临床尘肺病的特殊特征与分期诊断需求.

    • 面向多线圈核磁共振图像重建的复值注意力增强迭代网络

      2025, 34(12):139-148. DOI: 10.15888/j.cnki.csa.010013 CSTR: 32024.14.csa.010013

      摘要 (85) HTML (0) PDF 2.57 M (538) 评论 (0) 收藏

      摘要:目前, 大多数加速并行磁共振成像(PMRI)的迭代重建算法中, 先验子问题通过使用实值卷积搭建的网络重建欠采样的MR幅值图像甚至仅是实部图像, 因没有考虑到多线圈MRI本身是复数数据的事实, 从而限制了迭代重建算法对MR图像的重建精度. 从MRI本身为复数数据的事实出发, 为了能够重建出纹理细节更准确的多线圈MRI图像, 本文提出一种复值注意力增强迭代网络(CAEI-Net), 用于同时重建MRI图像和灵敏度图. 该网络通过使用复值神经网络自动学习MRI图像和灵敏度图的复杂先验. 在FastMRI数据集的实验结果表明, 本文的重建算法相比于之前的算法具有更高的重建精度, 并且能够更好地重建多线圈MRI图像.

    • 面向强化学习奖励变化率的动态调整机制优化与平衡

      2025, 34(12):149-155. DOI: 10.15888/j.cnki.csa.010039 CSTR: 32024.14.csa.010039

      摘要 (41) HTML (0) PDF 1.10 M (362) 评论 (0) 收藏

      摘要:本文主要探讨了一种基于奖励变化的动态置信上限(upper confidence bound, UCB)系数ci(t)调整方法, 旨在改进UCB算法在动态环境中的表现. 传统的UCB算法通过固定的置信上限系数平衡探索与利用, 但在环境变化时, 固定系数会导致过度探索或过度利用, 影响算法的适应性. 为解决这一问题, 我们提出了一种基于历史奖励变化率的衰减机制, 通过动态调整每个臂的置信上限系数, 使得算法能够灵活应对环境变化, 更有效地平衡探索与利用. 实验结果表明, 基于奖励衰减机制的UCB算法能够在奖励波动较大的动态环境中表现优于标准UCB算法. 通过根据每个臂的历史表现动态调整置信上限系数, 算法减少了对不确定臂的探索, 并集中资源更快地利用表现较好的臂, 从而提高累积奖励并加速收敛. 这一改进方法在处理动态和复杂环境中具有显著优势, 能够有效提升UCB算法的长期性能.

    • 联合双域优化的YOLO11多类别肺结节检测

      2025, 34(12):156-167. DOI: 10.15888/j.cnki.csa.010046 CSTR: 32024.14.csa.010046

      摘要 (51) HTML (0) PDF 3.67 M (424) 评论 (0) 收藏

      摘要:精准高效的肺结节检测模型是早期准确筛查肺癌发病情况的关键. 然而, 当前算法在面对小尺度以及结构特殊的肺结节时, 存在检测准确率低、鲁棒性不足的问题. 本文基于YOLO11算法, 融合双域特征, 提出改进的DFT-YOLO11 (dual-domain (spatial-frequency) discrete Fourier transform-enhanced YOLO11)肺结节检测模型, 实现肺结节的精准识别与定位. DFT-YOLO11模型引入频域-空域特征对齐注意力机制模块, 以及融合频域分支的FC3k2模块, 从频域角度为肺结节检测提供了更丰富的语义特征信息. 同时, 设计的自适应阈值损失函数能平衡不同尺度肺结节对网络训练的影响. 实验结果显示, DFT-YOLO11模型在LUNA16数据集中, mAP0.5指标达到94.45%, 超越了现有的肺结节检测模型, 在Lung-PET-CT-Dx数据集中, mAP0.5指标达到97.29%, 表明DFT-YOLO11具备多类别癌变检测性能. 同时, DFT-YOLO11检测结果计算的肺结节形态学结构指标均方误差最小, 这为临床应用提供了可靠支持.

    • 基于八叉树分块和顶点划分策略的加密3D网格模型可逆数据隐藏

      2025, 34(12):168-176. DOI: 10.15888/j.cnki.csa.010038 CSTR: 32024.14.csa.010038

      摘要 (55) HTML (0) PDF 1.85 M (332) 评论 (0) 收藏

      摘要:加密域可逆数据隐藏(reversible data hiding in encrypted domain, RDHED)技术可在保护载体隐私的同时嵌入秘密信息, 但当前针对3D网格模型的RDHED方法普遍面临嵌入容量低的难题. 针对这一问题, 提出了一种基于八叉树分块和顶点划分策略的加密3D网格模型可逆数据隐藏方法. 首先, 采用八叉树结构将模型自适应地划分为不重叠子块, 保留块内空间相关性; 其次, 设计基于顶点熵的划分策略, 精确选取参考顶点以提升预测精度; 最后, 采用自适应MSB (most significant bit)预测方法, 最大化每个顶点的可嵌入空间, 从而显著提升嵌入容量. 实验结果表明, 该方法在提高3D网格模型嵌入容量的同时, 确保了数据的可逆性与可分离性, 为3D模型的可逆数据隐藏提供了一种有效的解决方案.

    • 提升联邦效率的FedHNC中心模型优化方法

      2025, 34(12):177-185. DOI: 10.15888/j.cnki.csa.010026 CSTR: 32024.14.csa.010026

      摘要 (64) HTML (0) PDF 1.84 M (393) 评论 (0) 收藏

      摘要:针对联邦学习中客户端与服务器之间通信产生的通信开销以及中心模型收敛困难且训练精度低等问题, 本文设计了一种基于通信节点筛选策略的联邦通信框架FedHNC. 该框架首先在服务器端引入概率选择方法, 标记区分节点并赋予不同概率属性, 动态选择更多的优质节点参与通信; 该框架拓展设计了个性化的通信过程, 客户端采用带误差反馈的Top-K压缩器对本地更新进行压缩; 聚合阶段摒弃加权平均, 使用基于元素的聚合方法, 并结合动量法与误差修正优化全局更新; 最终将压缩后的全局参数下发客户端进入下一轮训练. 实验在2个数据集、3种模型上进行, 结果显示FedHNC在保证中心模型精度的前提下, 通信开销较FedAvg平均减少41%, 收敛速度提升约73%. 该框架解决了基线模型忽略的通信负担问题, 在提升联邦通信效率、加速模型收敛且保证模型有效方面具有良好应用价值.

    • 基于Celery的地图瓦片快速生成

      2025, 34(12):186-191. DOI: 10.15888/j.cnki.csa.010019 CSTR: 32024.14.csa.010019

      摘要 (64) HTML (0) PDF 998.13 K (485) 评论 (0) 收藏

      摘要:针对GB/TB级遥感影像数据的地图瓦片快速生成需求, 面向全国产化软硬件平台提出了一种基于Celery的地图瓦片快速生成方法. 首先, 针对不规则遥感影像提出一种自适应切片任务划分方法; 然后, 根据切片层级将切片任务划分为基础切片任务组、合成切片任务组, 基础切片任务根据原始影像范围直接切片, 合成切片任务将高层级瓦片合成低层级瓦片; 最后, 采用基于定量消费策略的内存优化方法解决节点内存溢出的问题. 实验结果表明, 该方法在7节点环境下相较于GeoServer切片速率最大提升6.45倍, 具有较高的实用性和效率.

    • 多尺度分层级联网络的可泛化人脸活体检测

      2025, 34(12):192-205. DOI: 10.15888/j.cnki.csa.010015 CSTR: 32024.14.csa.010015

      摘要 (79) HTML (0) PDF 2.46 M (587) 评论 (0) 收藏

      摘要:大多数人脸活体检测模型在面对已知欺骗人脸攻击时已经能达到很高的检测精度. 然而, 一旦面对未知欺骗人脸攻击时, 其性能会急剧下降. 此外, 真实和欺骗人脸之间的细微差异使得单尺度特征提取方法显得不足, 进而对模型的泛化能力造成了严重制约. 为了解决这些问题, 本文提出一种多尺度分层级联网络的可泛化人脸活体检测. 首先, 在应对不同域人脸数据之间的特征差异鸿沟方面, 提出一个自相似注意力模块, 通过捕捉相邻卷积层之间的特征相似性, 对人脸中关键区域进行加权融合, 从而学习到不同域人脸数据之间更紧凑的跨域特征表示. 其次, 为了引导不同欺骗人脸之间域不变特征的学习, 提出一个域权重增强模块, 通过动态调整不同特征领域的权重, 增强域鉴别器区分不同域欺骗人脸的能力, 提高了检测模型的泛化性. 最后, 为进一步增强模型提取特征的表示能力, 设计了一个多尺度特征级联模块, 通过利用多尺度特征之间的互补性, 将人脸图像中的细微局部信息和全局语义信息充分整合在一起. 在4个公开数据集上的实验结果表明, 本文方法与先前方法相比, 平均AUC和平均HTER分别为97.82%和7.10%, 在泛化性方面取得了杰出的表现.

    • 面向高速印刷的多中间色光电传感识别与套准

      2025, 34(12):206-214. DOI: 10.15888/j.cnki.csa.010047 CSTR: 32024.14.csa.010047

      摘要 (38) HTML (0) PDF 2.21 M (344) 评论 (0) 收藏

      摘要:中间色兑中间色高速套印是高端印刷行业中的主流工艺. 然而, 中间色的多样性, 如亮光、暗光、反光、哑光等, 为多滚筒的套准识别增添了难度. 针对该问题, 本文提出了一种基于光电传感检测的套准控制方法. 该方法通过分析印刷过程中光电传感检测到的时间序列, 自动推导并识别色标的波形特征, 精确计算各滚筒色标间的距离, 生成调整脉冲进行误差在线调节. 通过在装饰纸四色印刷机上进行实验验证, 本文设计的方法能适应不同的中间色色带检测和识别, 套准控制精确, 检测响应时间可达400 μs, 满足300 m/min高速印刷需求. 该研究可为高速多色印刷的套准控制提供有效技术参考.

    • 分层拓扑-蚁群融合算法在NISQ量子电路调度优化中的应用

      2025, 34(12):215-227. DOI: 10.15888/j.cnki.csa.010036 CSTR: 32024.14.csa.010036

      摘要 (56) HTML (0) PDF 2.08 M (378) 评论 (0) 收藏

      摘要:针对传统量子电路调度算法在调度质量、多样性以及对复杂量子电路结构适应性等方面存在的问题. 本文设计了层级量子电路调度-蚁群(layered quantum circuit scheduling and ant colony optimization, LQCS-ACO)融合算法. 将层级量子电路调度与蚁群算法相结合, 综合考虑量子门间的层依赖关系、SWAP门操作数、CNOT门数量以及电路层数等多种因素, 设计适合量子电路层结构的适应度函数. 同时采用基于量子电路层反馈动态信息素调整机制, 降低算法陷入局部最优的风险. 引入层间信息素传递方法, 考虑量子电路层影响, 完成调度信息的层间传递, 实现整体调度方案效率和全局优化效果提升. 实验结果表明, 在2QAN量子电路调度过程中, LQCS-ACO相较于2QAN电路、HQAA算法、ACO算法, SWAP门插入数量分别减少5.8%、8.3%和7.3%, CNOT门数量分别减少8.2%、9.2%和33.8%.

    • 基于混合注意力胶囊网络的文本分类模型

      2025, 34(12):228-239. DOI: 10.15888/j.cnki.csa.010030 CSTR: 32024.14.csa.010030

      摘要 (64) HTML (0) PDF 2.19 M (335) 评论 (0) 收藏

      摘要:近年来, 深度学习显著推动了文本分类算法的发展, 但传统文本分类算法在长距离依赖建模和捕获细粒度语义特征方面依然面临挑战. 胶囊网络(capsule network)通过动态路由机制有效建模特征层次关系, 为解决这一问题提供了新的思路. 然而, 基于胶囊网络的文本分类方法存在以下几个问题: (1) 动态路由计算复杂, 难以处理长文本; (2) 对局部语义特征和全局上下文信息的协同利用不足; (3) 路由过程的不稳定性导致训练困难. 为了解决这些问题, 本文提出了一种混合注意力动态稀疏路由胶囊网络(HADSR-Caps)模型. 该模型首先采用混合注意力机制, 融合局部窗口注意力和全局注意力, 捕获多尺度语义特征; 然后设计了动态稀疏路由算法, 引入K-Sparse剪枝和自适应路由终止策略, 有效降低计算量并提升模型鲁棒性. 通过在多个公开数据集上的实验, 结果表明, HADSR-Caps在分类准确率和鲁棒性方面相较于传统胶囊网络及其他基准模型, 均表现出显著的提升.

    • 基于梯度一致性的强化学习经验回放机制

      2025, 34(12):240-248. DOI: 10.15888/j.cnki.csa.010020 CSTR: 32024.14.csa.010020

      摘要 (67) HTML (0) PDF 1.51 M (384) 评论 (0) 收藏

      摘要:在强化学习算法中, 经验回放(experience replay)是提高策略学习效率的关键技术之一. 然而, 如何有效地选择并重用经验, 仍然是一个具有挑战性的问题. 在经验回放中, 使用高梯度一致性的经验能更好地增强策略稳定性, 减少高时序差分(temporal difference, TD)误差带来的噪声. 基于此, 本文提出基于梯度一致性的经验回放(gradient coherence optimized experience replay, GCER)机制, 该机制使得策略网络的训练不仅基于传统的TD误差, 还基于样本的梯度一致性. GCER能够筛选出对策略提升有较高价值的经验, 同时避免因高TD误差样本的噪声而导致的策略更新不稳定. 实验结果显示, 结合梯度一致性和TD误差的经验选择机制显著提升了策略的学习效率和稳定性, 为强化学习中的样本采样策略提供了新的视角和优化方向.

    • 基于改进YOLOv8的夜间辅助驾驶车辆检测

      2025, 34(12):249-259. DOI: 10.15888/j.cnki.csa.010011 CSTR: 32024.14.csa.010011

      摘要 (80) HTML (0) PDF 4.53 M (442) 评论 (0) 收藏

      摘要:夜间辅助驾驶因光线不足导致图像质量下降, 使得车辆检测面临低可见度、对比度降低以及噪声增多等问题. 针对上述问题, 提出了一种改进模型YOLOv8n-STH (you only look once version 8 nano-SPDConv-triplet attention-HS-FPN), 模型以YOLOv8n模型为基础, 针对夜间图像特征提取难、目标小等问题, 在主干网络的部分C2f (faster implementation of CSP bottleneck with 2 convolutions)前加入SPD (space to depth)模块, 并将部分卷积池化层替换为SPDConv. 同时, 在C2f结构中引入了轻量的三重注意力机制, 使其更加准确地区分目标与背景. 最后, 使用了多尺度选择特征融合模块, 使模型能够高效地筛选出更有效的特征信息. 在两个数据集上的实验结果表明, YOLOv8n-STH相比于YOLOv8n模型, 精确率提升了2.1%, 模型大小减少了24.2%, 能部署在资源有限的环境中.

    • 基于WOA-VMD-CNN-Transformer的超短期风速组合预测

      2025, 34(12):260-269. DOI: 10.15888/j.cnki.csa.010009 CSTR: 32024.14.csa.010009

      摘要 (75) HTML (0) PDF 1.95 M (543) 评论 (0) 收藏

      摘要:为了进一步提高风速预测性能, 挖掘风速的无序性和非线性特征, 提出了一种基于WOA-VMD和CNN-Transformer的超短期风速预测方法. 首先, 为了降低风速预测的复杂度, 本文使用鲸鱼优化算法优化变分模态分解算法参数, 能够将风速序列有效分解为若干个不同频率的模态分量, 实现原始风速数据去噪. 其次, 对分解的风速子序列分别构建CNN-Transformer深度学习组合预测模型, CNN用于捕捉输入风速序列的局部时序特征和变化趋势, 然后将这些特征输入Transformer模型. Transformer模型在已经提取局部特征的基础上建模长距离依赖关系, 捕捉全局序列信息和复杂的依赖关系. 最后, 将各分量的预测结果进行叠加作为最终预测结果, 使用不同地区风速数据集进行实验, 实验结果表明, 本文方法具有较好的预测性能, 能够满足风速预测的需求, 具有较好的实用性.

当期目录


文章目录

过刊浏览

年份

刊期

联系方式
  • 《计算机系统应用》
  • 1992年创刊
  • 主办单位:中国科学院软件研究所
  • 邮编:100190
  • 电话:010-62661041
  • 电子邮箱:csa (a) iscas.ac.cn
  • 网址:https://www.c-s-a.org.cn/csa/home
  • 刊号:ISSN 1003-3254
  • CN 11-2854/TP
  • 国内定价:50元
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号