• 2026年第3期文章目次
    全 选
    显示方式: |
    • >综述文章
    • 液态神经网络研究综述

      2026, 35(3):1-12. DOI: 10.15888/j.cnki.csa.010090 CSTR: 32024.14.csa.010090

      摘要 (251) HTML (0) PDF 2.54 M (163) 评论 (0) 收藏

      摘要:2018年, 麻省理工学院的研究人员从秀丽隐杆线虫的神经网络中得到启发, 提出了液态神经网络(liquid neural network, LNN), 这种神经网络更接近于人类大脑的思维模式, 可以更高效地处理时序任务. 本文对液态神经网络相关研究进行了介绍和分析, 首先总结了液态神经网络的原理模型及其与简单循环神经网络(Simple RNN)、长短时记忆(LSTM)网络和时间常数循环神经网络(TC-RNN)的区别与联系, 以及其相对于时间常数循环神经网络所具有的优势. 接着介绍了液态神经网络在汽车自动驾驶、无人机导航以及股票预测中的应用, 分析了其中采用的液态神经网络模型. 最后对其面临的问题和挑战进行了总结和展望.

    • IHRAG: 面向LLM的迭代式混合检索增强生成

      2026, 35(3):13-22. DOI: 10.15888/j.cnki.csa.010102 CSTR: 32024.14.csa.010102

      摘要 (131) HTML (0) PDF 1.25 M (111) 评论 (0) 收藏

      摘要:在医疗领域, 检索增强生成(RAG)被提出以减少大语言模型幻觉, 并提供更多的可解释性和可控性, 然而现有技术面临对低频实体的召回能力较弱、难以处理模糊冗长或多义性强的查询的问题, 本文提出一种面向大语言模型的迭代式混合检索增强生成(iterative hybrid retrieval-augmented generation, IHRAG)方法以提升对复杂问题的意图解析能力, 增强模型在知识挖掘方面的表现, 使大语言模型生成更加准确的回答. 该框架通过动态路由机制协同调度向量检索的语义泛化能力与知识图谱的结构化推理能力, 结合医疗本体驱动的查询解构算法, 将复杂临床问题分解为可检索的原子子问题, 并引入知识缺口感知的神经符号扩展模型与“检索-验证-迭代”闭环优化机制, 构建了从表层信息提取到深层知识挖掘的递进式发现流程. 实验结果表明, IHRAG在Qwen、DeepSeek等不同规模基础模型上均显著提升性能, 最高可使准确性提升11.12个百分点, 优秀回答率提升17个百分点.

    • 基于扩散模型的小样本入侵检测

      2026, 35(3):23-31. DOI: 10.15888/j.cnki.csa.010109 CSTR: 32024.14.csa.010109

      摘要 (110) HTML (0) PDF 1.14 M (116) 评论 (0) 收藏

      摘要:针对新型网络攻击初始阶段样本稀缺导致入侵检测模型泛化能力不足、检测效果差等问题, 本文提出一种基于扩散模型的小样本入侵检测方法. 该方法在数据增强层面构建噪声感知的条件扩散模型, 采用余弦噪声调度平衡生成效率与样本质量, 并通过残差连接增强特征传播稳定性, 从而提升合成流量数据的分布保真度. 在特征度量层面, 设计动态原型网络结构, 利用多头注意力优化类原型表示, 缓解小样本特征稀疏问题; 同时采用交叉熵损失与正交正则项的联合优化策略, 增强类内聚合与类间区分度. 在两个公开数据集上的实验结果表明, 该模型在小样本场景下的准确率和泛化能力均优于其他检测方法, 为小样本入侵检测提供了新的解决思路.

    • T-SeGAT: 面向不平衡数据的分子性质及CPI预测模型

      2026, 35(3):32-43. DOI: 10.15888/j.cnki.csa.010103 CSTR: 32024.14.csa.010103

      摘要 (100) HTML (0) PDF 2.11 M (94) 评论 (0) 收藏

      摘要:分子性质预测和化合物-蛋白质相互作用(CPI)预测是药物发现中的关键环节, 但传统图卷积网络(GCN)受限于局部感受野, 难以充分捕捉化学结构复杂性、分子构象动态变化以及长程电子相互作用等信息, 预测性能存在瓶颈. 为解决这一问题, 本文提出了一种深度学习模型T-SeGAT, 用于提升分子性质和 CPI 预测的准确性与泛化能力. 该模型融合了ESM-2蛋白语言模型、ChemBERTa分子语言模型以及基于图注意力网络(GAT)与Set2Set 的图神经网络, 实现从序列到结构的多层次特征提取与融合. 同时, 针对实验数据的不平衡问题, 模型在数据加载、损失计算和预测决策这3个层面引入加权随机采样、平衡/焦点/自适应损失函数以及动态阈值搜索机制, 并结合基于 AUC 差值的过拟合抑制方法、早停策略和学习率调度, 提升训练稳定性与泛化能力. 本文在 BACE、P53 和 hERG 数据集上进行分子性质预测实验, 在Human和C. elegans 数据集上进行 CPI 预测实验, 均采用分层5折交叉验证进行性能评估. 实验结果表明, T-SeGAT 在所有数据集上均优于现有基线模型, 其中在 BACE 和 hERG 数据集上, AUC和精确率分别较次优模型提升0.022、0.010 和0.004、0.022, 在 Human 数据集上的精确率提升 0.013. 综合实验结果表明, T-SeGAT在精度、稳定性和实用性方面表现出显著优势, 为药物发现过程中的分子性质预测与 CPI 预测提供了有力支持.

    • 融合知识增强与SimCLS框架的生成式文本摘要模型

      2026, 35(3):44-58. DOI: 10.15888/j.cnki.csa.010100 CSTR: 32024.14.csa.010100

      摘要 (84) HTML (0) PDF 1.93 M (145) 评论 (0) 收藏

      摘要:生成式文本摘要旨在通过理解输入的原始文本生成简洁、易读的摘要. 然而, 现有模型输出的摘要中仍存在语义冗余、事实性错误以及暴露偏差的问题. 解决这些问题对于提升模型性能和摘要质量具有重要的研究意义. 因此, 提出一种融合知识增强与SimCLS框架的生成式文本摘要模型. 首先, 设计了知识增强编码器获取源文本的结构化知识信息以维护全局上下文的结构信息, 并结合文本编码器充分编码全文语义信息. 其次, 在解码器部分利用Copy机制, 更加准确地再现原始文本中的信息. 最后, 使用SimCLS两阶段的对比学习训练框架, 对模型生成的摘要进行评分以驱动模型生成高质量摘要. 实验结果表明, 相较于表现较为优异的SeqCo模型, 所提模型在CNN/Daily Mail数据集上的ROUGE-1/2/L及BERTScore分别提升了1.84、0.65、2.04和0.21个百分点, 在XSum数据集上分别提升了1.78、2.16、2.36和0.13个百分点, 验证了模型的有效性.

    • 基于H-GEM模型的多模态情感分析

      2026, 35(3):59-68. DOI: 10.15888/j.cnki.csa.010107 CSTR: 32024.14.csa.010107

      摘要 (154) HTML (0) PDF 1.80 M (104) 评论 (0) 收藏

      摘要:传统多模态情感分析方法在特征拼接和融合中易产生信息冗余, 难以捕捉细粒度复杂情感特征, 在模态缺失和跨域迁移场景下鲁棒性不足. 同时, 现有混合专家(MoE)方法大多为单层结构, 专家分工不明确, 存在功能重叠和泛化性欠佳的问题. 本文提出一种分层自适应混合专家模型H-GEM (hierarchical gated expert mixture). 通过构建3层分级专家体系: 模态专家层提炼模态特征; 融合与抽象专家层自适应选择融合策略; 情感极性专家层进行细粒度建模. 同时引入信息论与判别性约束提升专家选择的语义区分性和稀疏性. 通过分层门控实现逐级决策, 保证专家差异化分工与跨任务建模. 在CMU-MOSI和CMU-MOSEI数据集上的实验结果表明, H-GEM在一系列指标上均优于基线模型. 与单层MoE架构相比, 显著降低的路由熵表明其能够有效缓解专家冗余问题. 该模型在低资源和模态缺失复杂任务中表现出更高的鲁棒性, 展现出良好的应用潜力.

    • 细粒度对齐与优势模态增强的多模态假新闻检测

      2026, 35(3):69-79. DOI: 10.15888/j.cnki.csa.010110 CSTR: 32024.14.csa.010110

      摘要 (95) HTML (0) PDF 13.80 M (99) 评论 (0) 收藏

      摘要:现有的多模态假新闻检测方法仍存在以下不足: 在跨模态语义对齐过程中, 仅对全局特征进行对齐, 难以建立图像局部区域与对应文本片段之间的细粒度语义对齐; 在模态融合阶段通常简单采用等权融合策略, 未能充分发挥信息更丰富的优势模态的作用, 从而限制了模型性能. 鉴于此, 提出了一种细粒度对齐与优势模态增强的多模态假新闻检测模型. 所提模型中的细粒度对齐模块利用FG-CLIP模型的细粒度对齐能力, 引导新闻的图像与文本的深层语义特征建立精确对应, 有效抑制无关区域的干扰. 提出用置信度来判定优势模态, 该置信度根据单模态特征与其类别原型之间的距离计算得出. 同时, 引入原型交叉熵损失以增强优势模态的表征能力, 使其在融合过程中发挥主导作用. 在Weibo和GossipCop数据集上的实验结果表明, 该模型在多数评估指标上优于基线模型, 验证了其在虚假新闻检测任务中的有效性与鲁棒性.

    • MTSR: Mamba-Transformer协同增强的轻量化图像超分辨率模型

      2026, 35(3):80-92. DOI: 10.15888/j.cnki.csa.010091 CSTR: 32024.14.csa.010091

      摘要 (134) HTML (0) PDF 3.30 M (222) 评论 (0) 收藏

      摘要:为解决现有轻量化图像超分辨率模型在平衡全局感受野、局部特征提取能力与计算效率方面的不足, 并针对Mamba架构在上下文建模中存在的跨token交互能力不足问题, 提出一种名为MTSR的高效Mamba-Transformer协同网络. 首先, 构建一种混合协同架构, 通过合理配比Mamba与Transformer模块, 利用Transformer卓越的跨token交互能力弥补纯Mamba模型在上下文建模方面的缺陷, 实现了长程依赖建模与计算效率的有效平衡. 其次, 设计一种深度卷积注意力前馈网络, 用以替代传统的多层感知机. 此网络能够显著增强局部细节特征的提取能力和通道间的信息交互, 从而减少重建过程中的像素级信息损失, 从而更充分地发挥Mamba模块的性能潜力. 最后, 提出一个三重深度可分离浅层细化模块. 该模块专注于高效捕获并增强图像的浅层特征, 为后续的非线性映射提供更丰富的原始纹理信息. 在5个公开基准数据集上的大量实验结果表明, 所提MTSR模型相较于当前的轻量化SOTA模型SRFormer-light和MambaIR-light, 峰值信噪比(PSNR)分别获得了高达0.31 dB和0.38 dB的性能增益, 同时保持了Mamba高效推理速度的优势. 实验结果表明, 该方法为轻量化图像超分辨率领域提供了一种兼具高性能与高效率的有效解决方案.

    • 基于移动性预测的车联网联邦学习资源调度

      2026, 35(3):93-103. DOI: 10.15888/j.cnki.csa.010084 CSTR: 32024.14.csa.010084

      摘要 (168) HTML (0) PDF 2.29 M (186) 评论 (0) 收藏

      摘要:联邦学习被广泛应用于移动网络, 采用分布式的方法进行本地和全局模型训练, 可以有效确保数据安全. 但是联邦学习在车联网中的应用又面临着3大挑战: 频繁的全局通信导致高延迟, 车辆有限的计算和电力资源以及高动态网络环境引起的带宽波动. 这些因素共同对联邦学习系统的执行造成了阻碍, 显著地降低了系统效率. 为了解决这些问题, 本文提出一种融合了移动性和带宽预测与多智能体强化学习的自适应资源调度策略. 在该策略中提出一个多维度预测模型, 将小波神经网络(WNN)和扩展的长短期记忆(xLSTM)网络结合作为预测模型, 针对车辆移动位置和带宽这两个维度进行预测, 为多智能体强化学习框架提供了准确输入. 同时采用多代理深度Q网络(MADQN)的动态资源调度算法来解决资源分配和功率控制挑战, 以此降低拖尾问题对系统效率的影响, 使边缘节点能够自主决策. 实验结果表明, 与传统方法相比, 本文方法有效地降低了系统成本和能耗, 同时模型性能也有一定提升, 并提高了传输成功率.

    • 基于相位一致性增强的相邻自相似性多模态遥感影像匹配

      2026, 35(3):104-114. DOI: 10.15888/j.cnki.csa.010112 CSTR: 32024.14.csa.010112

      摘要 (96) HTML (0) PDF 5.14 M (140) 评论 (0) 收藏

      摘要:由于多模态图像之间存在着显著的辐射差异和几何差异, 给多模态遥感图像之间的高精度配准带来了巨大挑战. 为了解决这些问题, 本文提出了一种基于相位一致性增强的相邻自相似性多源遥感影像匹配方法——PC-ASS. 首先, 利用非线性扩散滤波构建多尺度影像表示, 在抑制噪声的同时保留共有的边缘与结构, 为后续特征检测提供基础. 随后, 基于多尺度多方向Log-Gabor滤波器计算得到相位一致性幅度图, 用以衡量影像中结构显著区域. 本文将相位一致性幅度值作为加权因子引入到相邻自相似性响应计算中, 增强了影像中的结构特征: 高相位一致性区域获得更强的响应, 从而提升了边缘与角点等稳健特征的检测数量与质量. 进一步地, 在描述符构造阶段, 本文在极坐标统计直方图框架中引入相位一致性加权机制, 对每个像素的相邻自相似性值按照其相位一致性幅值进行加权, 使结构显著区域在描述符中占据更大比例, 从而增强了特征对噪声、纹理干扰及跨模态辐射差异的鲁棒性. 最后, 通过最近邻距离比匹配策略和快速抽样一致性算法(FSC)剔除错误匹配, 实现高精度配准. 在3个公开的多模态遥感影像数据集上, 本文与PSO-SIFT、OSS、HAPCG、RIFT和ASS这5种匹配方法进行对比实验. 实验结果表明, PC-ASS 在平均正确匹配点数量(NCM)、均方根误差(RMSE)和正确匹配率(CMR)指标上均优于现有方法, 具有较强的鲁棒性和适用性.

    • 基于集成自编码器和伪异常生成的前列腺癌异常检测

      2026, 35(3):115-126. DOI: 10.15888/j.cnki.csa.010089 CSTR: 32024.14.csa.010089

      摘要 (116) HTML (0) PDF 3.56 M (226) 评论 (0) 收藏

      摘要:前列腺癌是男性常见的恶性肿瘤, 其MRI图像的自动异常检测对于提升诊断效率和减轻医生负担具有重要意义. 针对现有方法依赖大量标注样本且对细微病灶检测能力有限的问题, 本文提出了一种基于集成自编码器与残差伪异常生成的无监督前列腺癌异常检测方法. 具体而言, 首先引入中心化核对齐(CKA)损失的集成自编码器, 有效抑制特征冗余并生成多样化的重建结果. 其次, 通过融合多分支自编码器残差的一致高响应区域, 在无标注情况下注入解剖约束扰动, 生成更加贴近真实病灶的伪异常样本. 再次, 提出在检测网络中引入频域对比损失, 以放大正常与异常样本在频域空间的区分能力. 最后, 采用双阶段流程, 确保训练与推理过程一致, 提升模型鲁棒性. 大量实验结果表明, 所提方法在公开前列腺MRI及脑部MRI数据集上均取得了优异的检测准确率和良好的跨域泛化能力. 其中, 在PICAI、PMU及BTM数据集上, 图像级AUC分别达到84.00%、89.20%和89.50%, AP值分别达到82.5%、87.00%和 88.80%, 优于现有主流方法.

    • 基于改进YOLO11的手腕骨折快速检测

      2026, 35(3):127-138. DOI: 10.15888/j.cnki.csa.010085 CSTR: 32024.14.csa.010085

      摘要 (147) HTML (0) PDF 2.22 M (204) 评论 (0) 收藏

      摘要:针对急救场景下医学影像分析中手腕骨折检测精度不足、模型推理效率低等问题, 本文提出一种基于改进YOLO11的轻量化手腕骨折检测算法MDM-YOLO. 首先设计多尺度特征提取模块(multi-scale feature extraction module, MSFE), 通过多个并行分支提取不同尺度的信息, 解决复杂骨折形态的多尺度表征问题; 其次, 提出混合空间局部注意力(mixed spatial and local attention, MSLA)机制, 结合局部和全局特征, 显著提升了对细微骨折的关注程度; 最后, 设计动态深度可分离卷积(dynamic depthwise separable convolution, DDSConv), 在保持检测精度的同时显著降低计算复杂度并加快推理速度, 使模型更加轻量化. 实验结果表明, MDM-YOLO在GRAZPEDWRI-DX数据集上的精确率达到92.6%, 召回率达到88.1%, mAP50达到95.1%, 较原始模型提升1.7%、2.5%和1.5%. 在相同的硬件环境下, 检测速度提升37%, 参数量仅为原模型的73.3%, 验证了轻量化设计的有效性. 为应急场景下的快速手腕骨折诊断提供了高效解决方案.

    • 融合纹理特征的输变电边坡土壤轻量化分类

      2026, 35(3):139-150. DOI: 10.15888/j.cnki.csa.010105 CSTR: 32024.14.csa.010105

      摘要 (110) HTML (0) PDF 6.23 M (198) 评论 (0) 收藏

      摘要:输变电工程中边坡土壤类型的准确识别对稳定性评估与防护设计具有重要意义. 然而, 传统的野外调查与实验室分析效率低下且主观性强, 难以满足复杂工程场景的实时识别需求. 为此, 本文提出一种基于纹理融合的轻量化深度学习模型SSR-MobileNetV2-T. 该模型采用多尺度Gabor滤波、局部二值模式(local binary pattern, LBP)的双分支网络结构, 以增强对土壤微观纹理的特征提取能力. 构建了多源土壤图像数据集, 并通过HSV阈值分割与多样化数据增强扩充样本, 模拟野外复杂环境条件, 以端到端方式训练模型. 实验结果表明, 在5类边坡土壤图像分类任务中, SSR-MobileNetV2-T模型平均准确率达到98.1%, F1-score达到97.9%, 整体性能优于SVM、CNN以及EfficientNet等典型轻量化模型, 尤其在砾石和砂类别中表现突出. 参数敏感性分析和消融实验验证了各模块设计的有效性. 研究表明, SSR-MobileNetV2-T模型兼具轻量化与高精度特性, 可为输变电工程中边坡土壤的智能识别提供高效、可靠的技术支撑.

    • 基于卫星红外通道数据的闪电高密度区域识别

      2026, 35(3):151-159. DOI: 10.15888/j.cnki.csa.010099 CSTR: 32024.14.csa.010099

      摘要 (106) HTML (0) PDF 2.84 M (148) 评论 (0) 收藏

      摘要:闪电因破坏性强、致灾风险高, 其精准监测是防灾减灾的关键环节. 静止气象卫星(如葵花-8)凭借大范围、连续观测的优势, 为闪电监测提供了理想平台, 但卫星云图与闪电活动的物理关联机制尚未明确, 制约了实际应用. 本文利用葵花卫星数据和甚低频远距离闪电探测网数据, 提出AE-UNet模型, 实现基于卫星云图的闪电高密度区识别. AE-UNet模型嵌入通道注意力机制和残差连接, 自适应深层融合卫星多通道特征; 在不同尺度特征拼接过程中嵌入通道-空间双重注意力机制, 充分挖掘空间关联关系. 实验结果表明, AE-UNet的闪电识别准确率达97.91%, 命中率(POD) 达67.47%, 虚警率(FAR) 达26.92%, 较基准模型性能提升显著. 该模型能根据卫星云图提供可靠的闪电活动信息, 有力支撑防灾减灾工作.

    • 基于类内类间距离的KL散度聚类分割算法

      2026, 35(3):160-169. DOI: 10.15888/j.cnki.csa.010095 CSTR: 32024.14.csa.010095

      摘要 (105) HTML (0) PDF 2.39 M (147) 评论 (0) 收藏

      摘要:当前基于KL散度的模糊聚类分割研究面临两个核心挑战: (1)如何有效平衡算法的抗噪性与计算效率, 以满足实时性应用需求; (2)如何避免非凸目标函数导致的局部最优问题, 提升在复杂图像上的准确性和稳定性. 针对以上问题, 本文提出了一种融合类内类间距离测度与KL散度的快速模糊聚类图像分割算法. 首先, 摒弃了仅最小化类内距离的传统思想, 通过构建类内距离最小化与类间距离最大化之差作为新目标测度, 使得类内距离尽量最小化而类间距离尽量最大化, 保证了样本点归类时能精确地找到相应的类别, 提高样本分类的准确性. 其次, 将KL散度与图像直方图相结合, 一方面利用KL散度增强对噪声和非均匀数据的鲁棒性, 另一方面借助直方图大幅减少算法迭代的计算数据量, 在提升区域一致性的同时确保了算法的高效性, 有效解决了现有方法在鲁棒性、准确性与实时性难以兼得的困境, 使得算法在医疗、智能驾驶、机器人导航等领域更适用. 通过大量不同种类图像分割测试结果证实, 本文所提出的新类内类间基于 KL 散度的模糊C均值聚类算法是有效的, 尤其分割噪声较大的大篇幅图片时分割效果较好, 既能去除噪声又能满足实时性分割要求.

    • 潜在空间下扩散模型图像生成

      2026, 35(3):170-183. DOI: 10.15888/j.cnki.csa.010098 CSTR: 32024.14.csa.010098

      摘要 (106) HTML (0) PDF 4.35 M (151) 评论 (0) 收藏

      摘要:本文旨在解决传统图像生成模型在复杂场景下潜在空间表示能力不足及高分辨率图像生成保真度低的问题, 提出一种基于改进矢量变分自编码器(improved vector quantized variational autoencoder, IVQ-VAE)和特征融合Transformer扩散(feature-fused Transformer diffusion, FFTD)模型的双阶段训练框架. IVQ-VAE通过引入注意力机制、残差块和多重损失函数, 显著提升潜在空间的语义表达能力与生成图像的保真度, 克服了传统编码器在复杂图像特征捕获上的局限性; FFTD模型基于Transformer架构, 结合多分辨率采样和自适应特征融合, 进一步增强模型对复杂图像结构的建模能力. 双阶段训练策略首先预训练IVQ-VAE以生成高质量潜在表示, 随后冻结其参数, 利用去噪扩散隐式模型(DDIM)训练FFTD模型以优化噪声预测和图像生成的过程. 该框架在CelebA-HQ和AFHQ等数据集上生成图像的细节保真度和视觉质量均有显著提升, 验证了其在高分辨率图像生成中的有效性.

    • 语义感知交互扩散图像超分辨率重建

      2026, 35(3):184-194. DOI: 10.15888/j.cnki.csa.010078 CSTR: 32024.14.csa.010078

      摘要 (146) HTML (0) PDF 2.08 M (211) 评论 (0) 收藏

      摘要:针对真实世界图像超分辨率任务中图片退化类型多样与细节恢复困难的问题, 现有方法在结构保持与语义一致性方面仍存在不足. 为此, 本文提出一种语义感知交互扩散图像超分辨率重建方法(semantic-aware interactive diffusion method for image super-resolution reconstruction, SISRM), 引入语义分割信息作为先验以增强重建过程的结构理解与语义引导. 具体而言, 该方法首先设计并训练分割感知提示提取器, 通过分割掩码编码器和标签文本生成器, 从退化低分辨率图像中高效提取分割掩码嵌入与语义标签; 其次, 引入交互式文本到图像控制器, 结合分割交叉注意力模块和可训练图像编码器, 通过多模态语义条件引导扩散过程增强局部细节与全局结构感知; 最后, 提出掩码特征融合机制缓解局部条件控制与全局潜在分布差异, 提高生成图像的一致性和视觉质量. 在 DIV2K-Val 和 RealSR 数据集上, 所提方法在无参考图像质量评估和跨模态图像质量评估最高分别达到0.6121和0.7274, 感知质量提高明显, 验证了其在细节还原、语义一致性及视觉质量方面的综合优势.

    • 基于Transformer扩散模型的高动态通信信号生成

      2026, 35(3):195-209. DOI: 10.15888/j.cnki.csa.010108 CSTR: 32024.14.csa.010108

      摘要 (112) HTML (0) PDF 2.87 M (162) 评论 (0) 收藏

      摘要:通信信号生成是小样本、少样本条件下智能通信系统设计与优化的重要支撑. 针对静态环境, 当前设计的信号生成方法具有较好效果, 但其固定生成机制难以有效捕捉动态场景中快速演变的细微时空特征, 导致生成信号的一致性与准确性下降. 针对该问题, 本文提出了一种基于Transformer扩散模型的高动态通信信号生成模型TransDiffusion, 该模型将Transformer架构融入到扩散模型, 通过嵌入多层级解码器模块, 增强对动态特征的长程依赖建模能力, 并优化噪声预测网络以适应时变环境特性. 在自主构建的高动态仿真数据集(模拟城市交通场景下的多目标运动与射频特征)上的实验结果表明, 相较于RF-Diffusion模型, 所提模型的最大均值差异、均方误差、平均绝对误差分别降低了85.13%、40.92%、30.62%, 短时傅里叶变换相似性以及功率谱相似性分别提升了154.30%和5.28%, 优于其他几种基线模型.

    • 基于强化学习的多策略HHO求解分布式混合流水车间调度

      2026, 35(3):210-218. DOI: 10.15888/j.cnki.csa.010101 CSTR: 32024.14.csa.010101

      摘要 (110) HTML (0) PDF 2.24 M (139) 评论 (0) 收藏

      摘要:针对分布式混合流水车间调度问题, 围绕最小化最大完工时间和延迟时间的优化目标, 构建了一种基于强化学习的多策略哈里斯鹰优化(RLMHHO)算法. 算法使用分组混沌初始化策略, 提升初始搜索的随机性与多样性; 引入探索、开发、均衡与精英这4组鹰群管理机制, 实现全局搜索与局部开发的协同; 基于深度Q网络的强化学习协调器, 依据14维状态空间动态选择最优搜索策略. 仿真实验验证了所提算法求解该类调度问题具有更优的解质量和更强的搜索能力.

    • 时频双域注意力机制GAN的电磁信号降噪

      2026, 35(3):219-230. DOI: 10.15888/j.cnki.csa.010097 CSTR: 32024.14.csa.010097

      摘要 (102) HTML (0) PDF 2.36 M (195) 评论 (0) 收藏

      摘要:在电磁信息安全领域, 电磁泄漏红信号的检测受电磁噪声干扰影响严重. 传统降噪方法在处理非平稳信号和复杂噪声环境时存在局限性. 提出一种基于生成对抗网络(GAN)的降噪方法, 通过生成器与判别器的对抗学习实现高效降噪. 针对电磁信号的非平稳特性设计了时频双域注意力机制(time-frequency dual-domain attention mechanism, TF-DAM), 生成器采用基于TF-DAM改进的U-Net架构, 结合残差网络和dropout层增强泛化能力, 利用编码器-解码器结构和跳跃连接保留信号细节, 训练过程中采用动态调整损失权重的策略提高训练效率和降噪效果. 实验表明, 该方法在信噪比提升和细节保留上优于传统方法, 在非平稳信号处理中表现突出. 本研究为电磁信号降噪提供了新思路, 具有较高应用价值.

    • 基于层次化特征融合的输电线路外破检测

      2026, 35(3):231-241. DOI: 10.15888/j.cnki.csa.010096 CSTR: 32024.14.csa.010096

      摘要 (123) HTML (0) PDF 2.85 M (158) 评论 (0) 收藏

      摘要:输电线路通道环境复杂, 各类外破隐患目标在拍摄角度、观测距离等因素影响下尺度差异显著, 进而导致模型在多样化风险目标识别中精度较低, 错检与漏检问题突出. 为解决上述问题, 提出一种基于层次化特征融合的输电线路外破检测方法. 该方法以RT-DETR模型为基础, 通过引入轻量化的C2f_MambaOut模块, 优化主干网络结构并有效降低模型参数量; 构建融合极性感知注意力与门控机制的PA_CGLU模块, 替代原有AIFI模块, 以提升查询向量对图像特征的方向感知与显著性建模能力, 增强自适应语义匹配效率; 并设计层次注意力融合块HAFB, 利用局部与全局注意力分支实现输入特征的多尺度层次化融合与增强, 提升对多类别、多尺度目标的综合识别能力. 同时, 构建了一个涵盖多种真实场景的外破类型且样本分布均衡的输电线路外破检测数据集. 基于该数据集的实验结果表明, 改进后的模型平均精度值(mAP)提升了1.5%, 参数量降低了20.7%. 实验结果验证所提方法能有效缓解目标尺度差异带来的识别挑战, 增强对多样化外破隐患的综合检测能力, 在模型效率与精度之间取得更优平衡.

    • 多模态融合知识蒸馏的无人机路桥检测

      2026, 35(3):242-251. DOI: 10.15888/j.cnki.csa.010086 CSTR: 32024.14.csa.010086

      摘要 (140) HTML (0) PDF 3.08 M (236) 评论 (0) 收藏

      摘要:针对传统路桥检测技术存在的效率低、成本高及安全风险问题, 以及当前无人机检测中多模态模型参数量大、难以在机载平台实时部署的挑战, 本文提出一种基于交叉蒸馏的多模态特征融合路桥检测模型. 该模型采用双分支教师网络与单分支学生网络架构, 通过教师网络间的特征交互与协同蒸馏机制, 实现多模态特异性知识的高效迁移; 同时引入基于注意力机制的动态特征融合模块, 强化对路桥缺陷关键特征的感知能力. 实验结果表明: 在保持检测精度mAP@0.5为89.6%的同时, 该模型参数量降至8.2M, 推理速度达32.6 f/s, 性能显著优于传统多模态融合及轻量化方法. 相比特征拼接、单模态蒸馏后融合等策略, 其检测精度与计算效率均具明显优势. 消融实验证实了交叉蒸馏机制与注意力融合模块的有效性. 该模型成功实现了路桥缺陷的高精度轻量化检测, 为无人机路桥检测工程应用提供了技术基础.

当期目录


文章目录

过刊浏览

年份

刊期

联系方式
  • 《计算机系统应用》
  • 1992年创刊
  • 主办单位:中国科学院软件研究所
  • 邮编:100190
  • 电话:010-62661041
  • 电子邮箱:csa@iscas.ac.cn
  • 网址:https://www.c-s-a.org.cn/csa/home
  • 刊号:ISSN 1003-3254
  • CN 11-2854/TP
  • 国内定价:50元
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62661041 传真: Email:csa@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号