快速检索
    过刊检索
    全选反选导出
    显示模式:
    2026,35(2):1-22, DOI: 10.15888/j.cnki.csa.010058, CSTR: 32024.14.csa.010058
    [摘要] (396) [HTML] (141) [PDF 2.91 M] (448)
    摘要:
    随着大语言模型(large language model, LLM)的快速发展, 其在推荐系统可解释性方面的应用成为研究热点. 本文系统地综述了LLM在推荐系统可解释性研究中的进展, 从领域研究现状、评价指标、数据集到应用场景进行了全面梳理. 从技术角度将现有研究分为基于LLM的推荐系统和LLM辅助型推荐系统, 并依据是否需要微调对此分类进一步细分. 在评价指标方面, 总结了人工评价与自动评价指标, 其中自动评价指标又包括传统指标、结合LLM指标以及拓展指标. 此外, 本文还整理了公开和私有数据集的使用情况, 强调了评论数据在可解释推荐中的重要性. 最后, 探讨了LLM在多个领域推荐系统可解释性方面的实际应用, 并分析了当前研究面临的挑战及未来可行的研究方向.
    2026,35(2):23-39, DOI: 10.15888/j.cnki.csa.010061, CSTR: 32024.14.csa.010061
    [摘要] (335) [HTML] (87) [PDF 1.81 M] (543)
    摘要:
    皮肤癌是一种常见的严重癌症, 其中黑色素瘤致死率高, 而早期发现并治疗可有效提升皮肤癌患者生存率. 皮肤癌的皮肤镜图像、宏观图像、组织病理图像都是用来进行皮肤癌诊断的重要手段, 使用人工智能技术可有效提升对这3种图像分类的效率并降低诊断成本. 而深度学习因其具有自动提取特征的特性, 更加适应于细节丰富的皮肤癌图像分类任务. 本文综述了对皮肤癌诊断中3种常用图像进行分类任务的相关研究, 详细分析了3种图像因其图像特质不同而存在的不同的技术侧重点, 并对临床落地面临的困难进行了针对性分析. 最后, 对未来的发展与挑战进行了展望, 以进一步推动人工智能在皮肤癌诊断的广泛应用.
    2026,35(2):40-52, DOI: 10.15888/j.cnki.csa.010075, CSTR: 32024.14.csa.010075
    [摘要] (263) [HTML] (75) [PDF 2.08 M] (298)
    摘要:
    针对车载边缘计算(vehicular edge computing, VEC)中路侧单元(road side unit, RSU)资源受限和高负载的难题, 以及现有的任务卸载优化方案局限于降低时延或能耗, 忽视了边缘节点所面临的安全问题, 提出一种基于信任感知和近端策略优化算法(PPO)的任务卸载方案. 首先, 构建VEC网络架构, 利用周围空闲车辆的计算资源, 将任务在本地执行或卸载至RSU、空闲服务车辆进行计算处理, 以降低系统整体时延与能耗. 其次, 构建一种基于多源赋权和奖惩机制的动态反馈信任评估模型, 实现对边缘节点可信度的量化评估. 最后, 利用基于深度强化学习的PPO算法对任务卸载策略进行优化. 实验结果表明, 相较于DQN、D3QN和TASACO算法, 所提方案具有更好的收敛性和稳定性, 而且在任务执行时延和能耗等方面优于现有方案.
    2026,35(2):53-64, DOI: 10.15888/j.cnki.csa.010045, CSTR: 32024.14.csa.010045
    [摘要] (346) [HTML] (69) [PDF 2.18 M] (669)
    摘要:
    现有基于多模态的图像异常检测方法存在以下不足: 在异常区域提取阶段易出现异常平滑现象, 同时在缺陷检测过程中面临细粒度感知能力不足与判别效率低下的问题, 最终导致整体检测性能下降. 为此, 提出多模态融合下的非对称师生网络图像异常检测模型(multimodal image anomaly detection with asymmetric teacher-student network, MATS), 包括跨模态异常放大器(CAA)、多扩张率局部注意力(MDLA)模块和FastKAN前馈网络. 首先, 跨模态放大器通过扩展与压缩辅助特征, 与目标特征融合后放大异常区域并减少噪声, 解决后续检测时的异常平滑问题. 随后, MDLA模块通过不同扩张率卷积并结合局部注意力提取多尺度特征以提高异常区域细粒度感知能力, 并结合归一化流(NF)生成正常样本的条件概率分布; FastKAN模块通过更轻量化的特征处理以实现高效判别异常, 生成与教师输出一致的特征图, 用于逐像素距离计算以评估异常程度. 在测试阶段, 教师与学生网络输出差异较大的区域被判断为异常. 在公开的工业图像数据集MVTec AD和MVTec 3D-AD上的实验结果表明, 该方法在多模态异常检测和定位方面具有先进的性能.
    2026,35(2):65-75, DOI: 10.15888/j.cnki.csa.010071, CSTR: 32024.14.csa.010071
    [摘要] (245) [HTML] (62) [PDF 2.28 M] (322)
    摘要:
    临近降水预报是一项重要的时空序列预测任务, 在农业、交通等诸多气象相关领域有广泛应用. 基于深度学习的雷达回波外推是目前常用的临近预报方法, 然而现有方法在捕捉雷达回波的复杂时空模式时存在局限. 随着时间推移这些方法的性能显著下降, 难以准确预测降水的时空演变. 本文提出一种融合全局模式和局部变化的GloCal-Net模型. 该模型基于混合Mamba-Transformer专家的U-Net架构, 旨在通过优化特征提取机制, 增强对雷达回波序列复杂模式的捕捉能力. 为验证所提出的模型, 在九江真实雷达数据集上进行了对比实验和消融实验. 与主流深度学习模型相比, 本文提出的模型在2 h外推任务中, Heidke技能得分表现相当, 关键成功指数提升了4.19%, 分别达到0.36和0.29; 学习感知图像块相似性指标降低了3.70%, 降至0.31; 结构相似性指标提高了2.07%, 达到72.37%. 这些实验结果表明, GloCal-Net在多个关键性能指标上均有所改善, 同时验证了各部分的有效性.
    2026,35(2):76-91, DOI: 10.15888/j.cnki.csa.010063, CSTR: 32024.14.csa.010063
    [摘要] (395) [HTML] (87) [PDF 2.39 M] (320)
    摘要:
    以ChatGPT、DeepSeek为代表的大语言模型(简称大模型)高速发展, 在各种任务中得到广泛使用, 如文本生成、智能助理等. 但这些大模型也面临着严峻的隐私安全风险. 特别地, 在医疗、金融等高安全需求的场景中, 模型窃取与数据隐私泄露等威胁往往是阻碍大模型应用的重要因素. 现有针对大模型推理保护的安全方案通常存在一些局限性, 或缺少对推理计算过程的运行时保护, 或因计算与通信的高昂代价而面临实用性挑战. 机密计算能够基于可信执行环境(TEE)硬件构建安全推理环境, 是实现大语言模型安全推理的一种实用且有效的安全技术. 由此, 本文提出了一种基于机密计算的大语言模型安全推理应用方案, 通过远程证明确保推理计算环境、模型权重参数和模型镜像文件的完整性, 采用基于TEE硬件的机密互联实现大模型推理流量的加密保护, 通过隔离不同用户的推理上下文等方式在多用户场景中保护提示词隐私. 该方案对大语言模型推理的全过程、全链路进行安全保护, 同时对运行环境进行完整性验证, 从而实现高效安全的机密大语言模型推理. 此外, 本文基于异构TEE服务器(SEV和CSV)平台实现了一个原型系统, 并对系统的安全性和性能进行了评估. 结果表明, 在实现预期安全目标的同时, 本文方案引入的性能损耗理论上不超过原生AI模型推理开销的1%, 实际应用中这种差异可以忽略不计.
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    优先出版日期:  2026-03-02 ,DOI: 10.15888/j.cnki.csa.010111
    摘要:
    针对现有文本去毒方法未充分考虑隐式毒性以及去毒后文本质量较差的问题, 提出一种多阶段多目标优化的文本去毒框架MSMO-Detox (multi-stage multi-objective detoxification). 本方法采用3阶段级联处理实现精准去毒: 首先运用基于标记的毒性解释技术, 通过传播分解向量以精确识别毒性贡献度超阈值的词元并进行掩码处理; 随后采用专家乘积(product of experts, PoE)框架进行词元生成, 替换掉被掩码词元; 最后实施多目标重排序策略, 从隐式毒性、文本流畅度、语义保留这3个维度综合评估候选句子, 选取评分最优的候选句作为输出. 实验结果表明, 在MAgr、SBF、DynaHate、Jigsaw数据集上, MSMO-Detox相较于不同数据集上的最优基线方法, 毒性指标分别平均下降23.1%、23.9%、17.6%、5.6%, 此外, 文本流畅度与语义保留能力也得到改善. 可见, MSMO-Detox在文本去毒任务中具有显著优势, 特别是在网络生态优化中, 该方法可以作为网络生态优化中去除网络暴力的重要工具, 用于有毒文本的风格迁移.
    优先出版日期:  2026-03-02 ,DOI: 10.15888/j.cnki.csa.010123
    摘要:
    随着不确定知识图谱(uncertain knowledge graph, UKG)在开放世界知识表示中的广泛应用, 其内部所建模的概率型关系日益复杂. 仅依赖嵌入表示或简单的模式匹配方法, 已难以满足对高质量推理结果的需求. 因此, 引入高置信、可解释的规则挖掘机制, 对于提升UKG的推理能力与知识可解释性具有重要意义. 为此本文提出了一种基于BERT语义建模与结构路径规则挖掘的不确定知识图谱补全模型UBERT-RM (uncertain knowledge graph BERT-rule mining). UBERT-RM构建了一个端到端的统一框架, 将子图建模、路径生成与置信度预测有机融合于一体. 模型利用BERT提取三元组的上下文语义表征, 路径生成模块采用Transformer解码器结构, 以自回归方式逐步生成高置信度的关系路径. 规则解析模块中引入动态置信度阈值机制, 对节点进行筛选与解析, 确保最终的推理路径在保持语义连贯的同时具备良好的可信度与可解释性. 在置信度预测部分, 模型将生成的规则与目标三元组共同编码, 通过多头自注意力机制进行深层语义交互与信息聚合, 并引入多层感知机实现对尾实体置信度的回归建模, 从而完成从路径挖掘到置信度预测的闭环推理过程. 在CN15k和NL27k数据集上的实验结果表明, UBERT-RM在链接预测任务中的效果都达到了最佳.
    优先出版日期:  2026-03-02 ,DOI: 10.15888/j.cnki.csa.010137
    摘要:
    雷达回波外推被广泛用于降水预测和气象灾害预警等任务, 近年来结合深度学习的时序预测模型有效提升了预测效果, 但是仍然存在着全局依赖建模不足、预报图像模糊等问题. 为了提升预测精度, 提出一种融合动态窗口注意力与长短期记忆网络的雷达回波外推模型DMLSTM (dynamic window attention memory-enhanced LSTM). 首先, 通过动态双缩放窗口注意力精准捕捉多尺度气象结构; 同步采用记忆增强型滑动窗口维持时空连续演化; 再由自适应残差门控单元抑制长程特征衰减并增强突变响应; 最终, 借梯度对齐型多尺度注意力损失函数保持关键气象结构的物理运动约束. 实验结果表明, 在深圳雷达回波数据集上, 相较最优基线模型(SwinLSTM-B), 本研究模型参数量小幅增加, 经结构优化后, 单轮推理耗时增加5%, 但均方误差(MSE)降低了10.3%, 结构相似性(SSIM)提升了1.4%. 在Moving MNIST数据集上, MSE降低14.9%, SSIM达0.926. 实验结果验证了该模型在雷达回波外推任务的先进性及其泛化能力.
    优先出版日期:  2026-03-02 ,DOI: 10.15888/j.cnki.csa.010138
    摘要:
    针对高吞吐网络环境下的带宽隔离需求, 本文提出一种基于FPGA的硬件化令牌桶带宽限制技术. 通过设计“时间驱动”模型, 将传统周期累积式令牌桶转化为发送时间计算机制, 避免令牌逐周期更新带来的开销; 结合整数化等效令牌注入技术, 在消除浮点运算的同时, 实现了10 Mb/s–100 Gb/s范围内的精细化速率控制. 系统采用流水线架构与双端口BRAM优化, 支持超过4k队列的并行限速调度控制. 在Xilinx Alveo U200平台上的实验结果表明, 所提方案在单队列调度场景下吞吐率提升近100%, 资源开销显著降低(LUT减少89%, 寄存器减少77%, BRAM减少≥20%), 速率控制误差低于0.1%. 本技术为高性能网络系统提供了一种具备纳秒级精度和高扩展性的带宽隔离解决方案.
    优先出版日期:  2026-03-02 ,DOI: 10.15888/j.cnki.csa.010120
    摘要:
    在复杂堆叠环境中, 引入推动动作辅助机械臂抓取可以提升抓取成功率. 然而, 现有推抓协同方法中存在网络特征提取能力不足与推动策略低效等问题. 针对上述问题, 本文提出一种改进的基于深度Q网络 (DQN)的推抓协同算法. 该方法在感知-动作策略网络中引入高效多尺度注意力(efficient multi-scale attention, EMA)机制, EMA模块通过通道分组与跨空间建模增强对物体边缘、物体表面等关键任务特征的提取能力; 同时, 设计基于图像频域能量变化与能量质心位移的推动有效性评估机制, 构建更具判别力的奖励函数, 以引导智能体学习有效的推抓协同策略. 在CoppeliaSim仿真环境平台上的实验表明, 本文方法相较于METOVPG等基线方法, 在抓取成功率和动作效率方面均有显著提升. 其中, 在仿真环境下测试抓取成功率提升21.2%, 验证了所提注意力机制与奖励设计在复杂场景下的有效性与协同优势.
    优先出版日期:  2026-03-02 ,DOI: 10.15888/j.cnki.csa.010124
    摘要:
    针对车联网(Internet of Vehicles, IoV)中大多数基于位置的路由协议存在传输时延高的问题, 提出一种基于移动贝叶斯和仿生智能算法的路由协议. 首先, 该协议在原贪心周界无状态路由(greedy perimeter stateless routing, GPSR)协议的基础上引入动态贝叶斯网络(dynamic Bayesian network, DBN), 用于预测车辆下一时刻位置, 然后确定下一时刻距离源节点最远且最可靠的节点. 基于所确定的节点确定可信通信范围, 在可信通信范围内添加移动性的概念来选择下一跳. 其次, 如果不符合贪心转发条件而转入周界转发, 该协议采用蛙跳算法(shuffled frog leaping algorithm, SFLA)、蚁群优化算法(ant colony optimization algorithm, ACO)和左右手法则确定下一跳路由路径. 实验结果表明, 该协议在高速公路场景中的数据包丢失率(packet loss rate, PLR)和吞吐量均优于经典GPSR、无线自组网按需平面距离向量路由(ad-hoc on-demand distance vector routing, AODV)协议、基于粒子群优化的GPSR (particle swarm optimization based GPSR, PSO-GPSR)协议和最大累计通信持续时间最小角度GPSR (maxduration-minangle GPSR, MM-GPSR)协议.
    优先出版日期:  2026-03-02 ,DOI: 10.15888/j.cnki.csa.010131
    摘要:
    针对深度学习模型在分布偏移场景中泛化能力不足的问题, 在Mamba状态空间模型的基础上, 提出一种融合反事实语义增强和因果注意力机制的领域泛化方法, 通过设计反事实语义增强模块, 实现前景-背景解耦与重组生成反事实特征, 显式构建“前景保持、背景干预”的因果情境, 有效削弱背景-标签的伪相关性, 强化模型对因果语义前景的挖掘能力, 引导其关注稳定可靠的语义关联; 进一步提出因果注意力机制, 将上述模块提取到的因果语义信息显式嵌入Mamba状态更新过程, 以提高特征的因果一致性. 整体模型结构实现了对前景与背景信息的动态区分与融合. 在标准领域泛化基准上的实验结果表明, 本文方法在PACS、OfficeHome、VLCS和TerraIncognita数据集上平均准确率分别达到91.9%、77.0%、81.1%和54.9%, 均优于现有SOTA方法, 证实本文方法显著提高了模型对前景语义区域的关注一致性, 展现出优越的可解释性与泛化性能.
    优先出版日期:  2026-03-02 ,DOI: 10.15888/j.cnki.csa.010132
    摘要:
    内窥镜影像为胃癌的筛查与诊断提供重要依据. 然而, 传统内窥镜检查准确率有限. 为此, 多模态融合异常检测方法被引入内窥镜影像分析, 但仍面临模态偏差与配对数据稀缺等问题. 针对这些问题, 本文提出一种基于多模态增强融合与多分支蒸馏的内窥镜异常检测模型. 首先, 设计交叉掩码注意力跨模态融合模块, 通过局部特征重建与交叉注意力机制挖掘模态间的潜在关系. 其次, 提出一种多分支跨模态蒸馏架构, 由多模态教师网络和两个独立学生分支组成. 该架构仅教师网络需配对数据训练, 学生分支则完全无需配对数据. 这一设计降低模型对配对数据的依赖并有效缓解模态偏差. 最后, 引入全局余弦相似度损失以增强多模态特征的一致性表示. 在真实公开数据集上进行的大量实验表明, 本文方法在多模态内窥镜异常检测任务中取得领先的性能. 本文的源码将公开在: https://github.com/LuoYifei-xs/CEMD.
    优先出版日期:  2026-02-06 ,DOI: 10.15888/j.cnki.csa.010115
    摘要:
    针对在遮挡和日常环境中, 盒式物体位姿计算精度差等问题, 提出采用基于RTMPose-BRNM的盒式物体2D关键点检测和点云深度信息相结合的位姿计算方法. 首先, 引入RFAConv替换普通Conv卷积, 提高遮挡2D关键点坐标识别精确度; 使用NATTEN模块, 提高模型对盒式物体边缘轮廓点抽取能力; 设计混合感受野卷积(mixed-perception convolution, MPC)结构, 增强不同尺寸盒式物体识别适应性. 实验结果表明, RTMPose-BRNM关键点识别算法平均像素距离误差为0.98, 相比原RTMPose模型, 降低1.19像素误差; 改进后平移误差和旋转误差为1.32%和0.96°左右.
    优先出版日期:  2026-02-06 ,DOI: 10.15888/j.cnki.csa.010117
    摘要:
    现有虚假新闻检测方法存在明显不足. 这些方法未能充分挖掘多模态关联, 忽视关键信息导致冗余问题, 且未考虑相似新闻的正负关联影响检测精度. 此外, 能协同利用文本、图像和社交图这3种模态的方法较为稀缺. 针对这些问题, 提出了一种基于社交图与标签优化的多模态虚假新闻检测模型. 该方法同步提取文本、图像和社交图特征, 通过全局动态加权机制强化社交图关键特征并通过图像描述增强视觉表征, 利用跨模态交叉注意力实现模态间优势互补, 并结合对比学习进行跨模态对齐. 本文模型在标签优化器中通过双向标签注意力捕捉相似新闻间的正负相关性优化预测标签. 在Weibo和PHEME数据集上的实验表明, 本文方法较基线方法准确率提升1.63%和3.01%, F1分数提升2.46%和3.67%.
    优先出版日期:  2026-02-06 ,DOI: 10.15888/j.cnki.csa.010118
    摘要:
    卷烟加工过程对生产线上混合物料状态的感知能力, 直接影响产品质量与运行效率. 但当前监测方法主要聚焦原料属性, 难以全面揭示生产线运行状态. 为此, 提出一种以烟垢为切入点的生产线异常检测新方法, 通过引入自适应特征增强模块(adaptive feature enhancement, AFE)和多尺度卷积注意力机制(multi-scale convolutional attention mechanism, MSCAM), 提升模型在复杂背景下的小目标烟垢检测精度和实时性, 构建出高效率的烟垢检测YOLO11-AM网络. 对标准取样得到的烟草混合物料, 在正交优化后的环境参数下进行消融实验, 结果表明YOLO11-AM模型的平均精度达到97.8%. 同时, 推理速度较基础模型提升了24.6%, 达到2.16 ms/张. 进一步的工业部署显示, 模型预测烟垢质量的误差控制在±5%以内, 满足卷烟厂对在线监测系统的性能要求. 本研究为烟草行业的智能化质量控制提供了高效技术支持, 具有显著的理论和实践价值.
    优先出版日期:  2026-02-06 ,DOI: 10.15888/j.cnki.csa.010119
    摘要:
    遗址类建筑物作为历史文化的重要载体, 具有重要的研究与保护价值. 然而, 由于其数量稀少且持续消亡, 传统重建方法难以实现完整复原, 现有文生图技术虽可借助文本描述重现其外观, 但仍存在细节缺失、图像质量不高等问题. 为此, 本文提出一种基于改进扩散模型的遗址类建筑物生成方法, 通过引入门控残差机制优化信息流动、缓解梯度消失, 提升生成稳定性; 结合通道与空间双重注意力机制以增强局部细节与全局结构建模能力; 并利用VGG19作为判别网络, 提取多层次语义特征并引入感知损失以提升对关键视觉特征的建模效果. 实验结果表明, 相比同样基于扩散模型的KNN-diffusion与Simple diffusion, 本文方法FID下降了30.39%, CLIP-scoreISSSIM分别提升了1.08%、9.01%和2.35%. 本研究为高质量遗址类建筑图像生成提供了可行的技术路径, 有助于推动数字文化遗产的可持续研究与智能化保护.
    优先出版日期:  2026-02-06 ,DOI: 10.15888/j.cnki.csa.010121
    摘要:
    随着计算机辅助诊断技术快速发展, 对皮肤病变筛查的效率明显提高, 但皮肤镜图像中众多干扰因素, 致使皮肤病变区域自动分割成为难题. 由于Skip-Connecting模型在小目标和模糊边界分割、Atrous-Convolution模型在大范围和多尺度病变分割的良好表现, 成为皮肤病变图像分割的两大主流方向; Transformer模型凭借其强大的全局建模能力和对长距离依赖关系的捕捉能力, 未来将与传统深度学习模型进一步耦合, 以优化分割性能. 基于此, 本文系统梳理Skip-Connecting模型与Atrous-Convolution模型在皮肤病变分割中的应用进展及其衍生网络的改进策略; 重点分析Transformer模型在该领域的应用范式及其与传统模型的耦合方法; 并对视觉状态空间模型(Mamba)、生成对抗网络、扩散模型等新兴架构的探索性研究进行分析. 最后, 针对当前临床研究中存在的局限性及分割效果不佳的问题, 提出相应的解决思路, 并对未来的研究方向进行展望.
    优先出版日期:  2026-01-19 ,DOI: 10.15888/j.cnki.csa.010110
    摘要:
    现有的多模态假新闻检测方法仍存在以下不足: 在跨模态语义对齐过程中, 仅对全局特征进行对齐, 难以建立图像局部区域与对应文本片段之间的细粒度语义对齐; 在模态融合阶段通常简单采用等权融合策略, 未能充分发挥信息更丰富的优势模态的作用, 从而限制了模型性能. 鉴于此, 提出了一种细粒度对齐与优势模态增强的多模态假新闻检测模型. 所提模型中的细粒度对齐模块利用FG-CLIP模型的细粒度对齐能力, 引导新闻的图像与文本的深层语义特征建立精确对应, 有效抑制无关区域的干扰. 提出用置信度来判定优势模态, 该置信度根据单模态特征与其类别原型之间的距离计算得出. 同时, 引入原型交叉熵损失以增强优势模态的表征能力, 使其在融合过程中发挥主导作用. 在Weibo和GossipCop数据集上的实验结果表明, 该模型在多数评估指标上优于基线模型, 验证了其在虚假新闻检测任务中的有效性与鲁棒性.
    优先出版日期:  2026-01-19 ,DOI: 10.15888/j.cnki.csa.010107
    摘要:
    传统多模态情感分析方法在特征拼接和融合中易产生信息冗余, 难以捕捉细粒度复杂情感特征, 在模态缺失和跨域迁移场景下鲁棒性不足. 同时, 现有混合专家(MoE)方法大多为单层结构, 专家分工不明确, 存在功能重叠和泛化性欠佳的问题. 本文提出一种分层自适应混合专家模型H-GEM (hierarchical gated expert mixture). 通过构建3层分级专家体系: 模态专家层提炼模态特征; 融合与抽象专家层自适应选择融合策略; 情感极性专家层进行细粒度建模. 同时引入信息论与判别性约束提升专家选择的语义区分性和稀疏性. 通过分层门控实现逐级决策, 保证专家差异化分工与跨任务建模. 在CMU-MOSI和CMU-MOSEI数据集上实验表明, H-GEM在一系列指标上均优于基线模型. 与单层MoE架构相比, 显著降低的路由熵表明其有效缓解专家冗余问题. 该模型在低资源和模态缺失复杂任务中表现出更高的鲁棒性, 展现出良好的应用潜力.
    优先出版日期:  2026-01-19 ,DOI: 10.15888/j.cnki.csa.010090
    [摘要] (234) [HTML] (0) [PDF 1.77 M] (151)
    摘要:
    2018年, 麻省理工学院的研究人员从秀丽隐杆线虫的神经网络中得到启发, 提出了液态神经网络(liquid neural network, LNN), 这种神经网络更接近于人类大脑的思维模式, 可以更高效地处理时序任务. 本文对液态神经网络相关研究进行了介绍和分析, 首先总结了液态神经网络的原理模型及其与简单循环神经网络(Simple RNN)、长短时记忆(LSTM)网络和时间常数循环神经网络(TC-RNN)的区别与联系, 以及其相对于时间常数循环神经网络所具有的优势. 接着介绍了液态神经网络在汽车自动驾驶、无人机导航以及股票预测中的应用, 分析了其中采用的液态神经网络模型. 最后对其面临的问题和挑战进行了总结和展望.
    优先出版日期:  2026-01-19 ,DOI: 10.15888/j.cnki.csa.010098
    [摘要] (101) [HTML] (0) [PDF 3.40 M] (140)
    摘要:
    本文旨在解决传统图像生成模型在复杂场景下潜在空间表示能力不足及高分辨率图像生成保真度低的问题, 提出一种基于改进矢量变分自编码器(improved vector quantized variational autoencoder, IVQ-VAE)和特征融合Transformer扩散(feature-fused Transformer diffusion, FFTD)模型的双阶段训练框架. IVQ-VAE通过引入注意力机制、残差块和多重损失函数, 显著提升潜在空间的语义表达能力与生成图像的保真度, 克服了传统编码器在复杂图像特征捕获上的局限性; FFTD模型基于Transformer架构, 结合多分辨率采样和自适应特征融合, 进一步增强模型对复杂图像结构的建模能力. 双阶段训练策略首先预训练IVQ-VAE以生成高质量潜在表示, 随后冻结其参数, 利用去噪扩散隐式模型(DDIM)训练FFTD模型以优化噪声预测和图像生成的过程, 该框架在CelebA-HQ和AFHQ等数据集上生成图像的细节保真度和视觉质量均有显著提升, 验证了其在高分辨率图像生成中的有效性.
    优先出版日期:  2026-01-19 ,DOI: 10.15888/j.cnki.csa.010102
    摘要:
    在医疗领域, 检索增强生成(RAG)被提出以减少大模型幻觉, 并提供更多的可解释性和可控性, 然而现有技术面临对低频实体的召回能力较弱、难以处理模糊冗长或多义性强的查询, 本文提出一种面向大模型的迭代式混合检索增强生成(iterative hybrid retrieval-augmented generation, IHRAG)方法以提升对复杂问题的意图解析能力, 增强模型在知识挖掘方面的表现, 使大模型生成更加准确的回答. 该框架通过动态路由机制协同调度向量检索的语义泛化能力与知识图谱的结构化推理能力, 结合医疗本体驱动的查询解构算法, 将复杂临床问题分解为可检索的原子子问题, 并引入知识缺口感知的神经符号扩展模型与“检索-验证-迭代”闭环优化机制, 构建了从表层信息提取到深层知识挖掘的递进式发现流程. 实验表明, IHRAG在Qwen、DeepSeek等不同规模基础模型上均显著提升性能, 最高可使准确率提升11.12个百分点, 优秀回答率提升17个百分点.
    优先出版日期:  2026-01-19 ,DOI: 10.15888/j.cnki.csa.010103
    摘要:
    分子性质预测和化合物-蛋白质相互作用(CPI)预测是药物发现中的关键环节, 但传统图卷积网络(GCN)受限于局部感受野, 难以充分捕捉化学结构复杂性、分子构象动态变化以及长程电子相互作用等信息, 预测性能存在瓶颈. 为解决这一问题, 本文提出了一种深度学习模型T-SeGAT, 用于提升分子性质和 CPI 预测的准确性与泛化能力. 该模型融合了ESM-2蛋白语言模型、ChemBERTa分子语言模型以及基于图注意力网络(GAT)与Set2Set 的图神经网络, 实现从序列到结构的多层次特征提取与融合. 同时, 针对实验数据的不平衡问题, 模型在数据加载、损失计算和预测决策这3个层面引入加权随机采样、平衡/焦点/自适应损失函数以及动态阈值搜索机制, 并结合基于 AUC 差值的过拟合抑制方法、早停策略和学习率调度, 提升训练稳定性与泛化能力. 本文在 BACE、P53 和 hERG 数据集上进行分子性质预测实验, 在Human和C. elegans 数据集上进行 CPI 预测实验, 均采用分层5折交叉验证进行性能评估. 实验结果表明, T-SeGAT 在所有数据集上均优于现有基线模型, 其中在 BACE 和 hERG 数据集上, AUC和精确率分别较次优模型提升0.022、0.010 和0.004、0.022, 在 Human 数据集上的精确率提升 0.013. 综合实验结果表明, T-SeGAT在精度、稳定性和实用性方面表现出显著优势, 为药物发现过程中的分子性质预测与 CPI 预测提供了有力支持.
    优先出版日期:  2026-01-16 ,DOI: 10.15888/j.cnki.csa.010109
    摘要:
    针对新型网络攻击初始阶段样本稀缺导致入侵检测模型泛化能力不足、检测效果差等问题, 本文提出一种基于扩散模型的小样本入侵检测方法. 该方法在数据增强层面构建噪声感知的条件扩散模型, 采用余弦噪声调度平衡生成效率与样本质量, 并通过残差连接增强特征传播稳定性, 从而提升合成流量数据的分布保真度. 在特征度量层面, 设计动态原型网络结构, 利用多头注意力优化类原型表示, 缓解小样本特征稀疏问题; 同时采用交叉熵损失与正交正则项的联合优化策略, 增强类内聚合与类间区分度. 在两个公开数据集上的实验结果表明, 该模型在小样本场景下的准确率和泛化能力均优于其他检测方法, 为小样本入侵检测提供了新的解决思路.
    优先出版日期:  2026-01-16 ,DOI: 10.15888/j.cnki.csa.010112
    摘要:
    由于多模态图像之间存在着显著的辐射差异和几何差异, 给多模态遥感图像之间的高精度配准带来了巨大挑战. 为了解决这些问题, 本文提出了一种基于相位一致性增强的相邻自相似性多源遥感影像匹配方法——PC-ASS. 首先, 利用非线性扩散滤波构建多尺度影像表示, 在抑制噪声的同时保留共有的边缘与结构, 为后续特征检测提供基础. 随后, 基于多尺度多方向Log-Gabor滤波器计算得到相位一致性幅度图, 用以衡量影像中结构显著区域. 本文将相位一致性幅度值作为加权因子引入到相邻自相似性响应计算中, 增强了影像中的结构特征: 高相位一致性区域获得更强的响应, 从而提升了边缘与角点等稳健特征的检测数量与质量. 进一步地, 在描述符构造阶段, 本文在极坐标统计直方图框架中引入相位一致性加权机制, 对每个像素的相邻自相似性值按照其相位一致性幅值进行加权, 使结构显著区域在描述符中占据更大比例, 从而增强了特征对噪声、纹理干扰及跨模态辐射差异的鲁棒性. 最后, 通过最近邻距离比匹配策略和快速抽样一致性算法(FSC)剔除错误匹配, 实现高精度配准. 在3个公开的多模态遥感影像数据集上, 本文与PSO-SIFT、OSS、HAPCG、RIFT和ASS这5种匹配方法进行对比实验. 实验结果表明, PC-ASS 在平均正确匹配点数量、均方根误差和正确匹配率指标上均优于现有方法, 具有较强的鲁棒性和适用性.
    优先出版日期:  2026-01-15 ,DOI: 10.15888/j.cnki.csa.010101
    [摘要] (107) [HTML] (0) [PDF 1.37 M] (132)
    摘要:
    针对分布式混合流水车间调度问题, 围绕最小化最大完工时间和延迟时间的优化目标, 构建了一种基于强化学习的多策略哈里斯鹰优化算法(RLMHHO). 算法使用分组混沌初始化策略, 提升初始搜索的随机性与多样性; 引入探索、开发、均衡与精英这4组鹰群管理机制, 实现全局搜索与局部开发的协同; 基于深度Q网络的强化学习协调器, 依据14维状态空间动态选择最优搜索策略. 仿真实验验证了所提算法求解该类调度问题具有更优的解质量和更强的搜索能力.
    优先出版日期:  2026-01-15 ,DOI: 10.15888/j.cnki.csa.010108
    [摘要] (103) [HTML] (0) [PDF 1.83 M] (156)
    摘要:
    通信信号生成是小样本、少样本条件下智能通信系统设计与优化的重要支撑. 针对静态环境, 当前设计的信号生成方法具有较好效果, 但其固定生成机制难以有效捕捉动态场景中快速演变的细微时空特征, 导致生成信号的一致性与准确性下降. 针对该问题, 本文提出了一种基于Transformer扩散模型的高动态通信信号生成模型TransDiffusion, 该模型将Transformer架构融入到扩散模型, 通过嵌入多层级解码器模块, 增强对动态特征的长程依赖建模能力, 并优化噪声预测网络以适应时变环境特性. 在自主构建的高动态仿真数据集(模拟城市交通场景下的多目标运动与射频特征)上的实验结果表明, 相较于RF-Diffusion模型, 所提模型的最大均值差异、均方误差、平均绝对误差分别降低了85.13%、40.92%、30.62%, 短时傅里叶变换相似性以及功率谱相似性分别提升了154.30%和5.28%, 优于其他几种基线模型.
    优先出版日期:  2026-01-15 ,DOI: 10.15888/j.cnki.csa.010113
    摘要:
    随着极端气候频发, 提升降水预报能力已成为气象业务中的迫切需求. 现有的大多数基于数据驱动的方法将降水的运动与强度耦合建模, 尽管能有效捕捉大尺度降水系统, 却难以准确预测中小尺度强降水的剧烈演变, 限制了其在强降水预报上的评分. 本文基于拉格朗日变换实现运动与强度的解耦, 构建了一种双分支融合网络LAFUNet, 一个分支直接分析原始雷达图像序列, 以捕捉大尺度降水的空间结构与运动特征; 另一个分支将降水场转换至拉格朗日坐标系, 专注于建模降水强度的演变, 从而更有效地表征与中小尺度强降水相关的非线性强度变化. 此外, 双分支交互模块用于自适应地融合两个分支的特征. 实验基于CIKM和SEVIR公开雷达数据集开展, 结果表明, 该模型在强降水预报上的性能突出. 尤其是在SEVIR数据集上, 针对强度阈值超过219的极端降水事件, 其未来1 h的CSI指标高达0.1368, 显著超越了VMRNN等模型.
    优先出版日期:  2026-01-15 ,DOI: 10.15888/j.cnki.csa.010104
    摘要:
    在车联网(Internet of Vehicles, IoV)与移动边缘计算(mobile edge computing, MEC)深度融合的背景下, 如何在保障低时延与高可靠服务质量的同时实现高效任务卸载成为关键问题. 哈里斯鹰优化算法(Harris hawks optimization, HHO)虽具较强的全局搜索能力, 但在种群初始化、探索-开发切换及多样性维持方面仍存在不足, 易陷入早熟收敛. 为此, 本文提出一种动态双种群哈里斯鹰优化算法(dynamic dual-population Harris hawks optimization, DDHHO). 该算法引入动态双种群协同演化机制(DDPC), 并结合L-T混沌初始化、非线性逃逸能量及非线性跳跃策略, 实现全局探索与局部开发的自适应平衡. 实验结果表明, 在车联网MEC任务卸载场景中, DDHHO在系统总代价指标上较混合策略哈里斯鹰优化算法(MSHHO)、原始HHO、MASSFOA、IPSO与PSO分别降低约2.5%、3.2%、4.9%、6.0% 和 7.9%; 在时延与能耗联合优化中亦展现出更快的收敛速度与更高的稳定性. 研究结果验证了DDHHO的有效性与优越性, 为车联网MEC资源管理提供了一种高效、稳定且可扩展的优化方案.
    优先出版日期:  2026-01-15 ,DOI: 10.15888/j.cnki.csa.010099
    [摘要] (102) [HTML] (0) [PDF 2.23 M] (136)
    摘要:
    闪电因破坏性强、致灾风险高, 其精准监测是防灾减灾的关键环节. 静止气象卫星(如葵花-8)凭借大范围、连续观测的优势, 为闪电监测提供了理想平台, 但卫星云图与闪电活动的物理关联机制尚未明确, 制约了实际应用. 本文利用葵花卫星数据和甚低频远距离闪电探测网数据, 提出AE-UNet模型, 实现基于卫星云图的闪电高密度区识别. AE-UNet模型嵌入通道注意力机制和残差连接, 自适应深层融合卫星多通道特征; 在不同尺度特征拼接过程中嵌入通道-空间双重注意力机制, 充分挖掘空间关联关系. 实验结果表明, AE-UNet的闪电识别准确率达97.91%, 命中率(POD) 达67.47%, 虚警率(FAR) 达26.92%, 较基准模型性能提升显著. 该模型能根据卫星云图提供可靠的闪电活动信息, 有力支撑防灾减灾工作.
    优先出版日期:  2026-01-15 ,DOI: 10.15888/j.cnki.csa.010100
    摘要:
    生成式文本摘要旨在通过理解输入的原始文本生成简洁、易读的摘要. 然而, 现有模型输出的摘要中仍存在语义冗余、事实性错误以及暴露偏差的问题. 解决这些问题对于提升模型性能和摘要质量具有重要的研究意义. 因此, 提出一种融合知识增强与SimCLS框架的生成式文本摘要模型. 首先, 设计了知识增强编码器获取源文本的结构化知识信息以维护全局上下文的结构信息, 并结合文本编码器充分编码全文语义信息. 其次, 在解码器部分利用Copy机制, 更加准确地再现原始文本中的信息. 最后, 使用SimCLS两阶段的对比学习训练框架, 对模型生成的摘要进行评分以驱动模型生成高质量摘要. 实验结果表明, 相较于表现较为优异的SeqCo模型, 所提模型在CNN/Daily Mail数据集上的ROUGE-1/2/L及BERTScore分别提升了1.84、0.65、2.04和0.21个百分点, 在XSum数据集上分别提升了1.78、2.16、2.36和0.13个百分点, 验证了模型的有效性.
    优先出版日期:  2026-01-15 ,DOI: 10.15888/j.cnki.csa.010096
    [摘要] (117) [HTML] (0) [PDF 2.02 M] (148)
    摘要:
    输电线路通道环境复杂, 各类外破隐患目标在拍摄角度、观测距离等因素影响下尺度差异显著, 进而导致模型在多样化风险目标识别中精度较低, 错检与漏检问题突出. 为解决上述问题, 提出一种基于层次化特征融合的输电线路外破检测方法. 该方法以RT-DETR模型为基础, 通过引入轻量化的C2f_MambaOut模块, 优化主干网络结构并有效降低模型参数量; 构建融合极性感知注意力与门控机制的PA_CGLU模块, 替代原有AIFI模块, 以提升查询向量对图像特征的方向感知与显著性建模能力, 增强自适应语义匹配效率; 并设计层次注意力融合块HAFB, 利用局部与全局注意力分支实现输入特征的多尺度层次化融合与增强, 提升对多类别、多尺度目标的综合识别能力. 同时, 构建了一个涵盖多种真实场景的外破类型且样本分布均衡的输电线路外破检测数据集. 基于该数据集的实验结果表明, 改进后的模型平均精度值(mAP)提升了1.5%, 参数量降低了20.7%. 实验结果验证所提方法能有效缓解目标尺度差异带来的识别挑战, 增强对多样化外破隐患的综合检测能力, 在模型效率与精度之间取得更优平衡.
    优先出版日期:  2026-01-08 ,DOI: 10.15888/j.cnki.csa.010097
    [摘要] (101) [HTML] (0) [PDF 1.59 M] (186)
    摘要:
    在电磁信息安全领域, 电磁泄漏红信号的检测受电磁噪声干扰影响严重. 传统降噪方法在处理非平稳信号和复杂噪声环境时存在局限性. 提出一种基于生成对抗网络(GAN)的降噪方法, 通过生成器与判别器的对抗学习实现高效降噪. 针对电磁信号的非平稳特性设计了时频双域注意力机制(time-frequency dual-domain attention mechanism, TF-DAM), 生成器采用基于TF-DAM改进的U-Net架构, 结合残差网络和dropout层增强泛化能力, 利用编码器-解码器结构和跳跃连接保留信号细节, 训练过程中采用动态调整损失权重的策略提高训练效率和降噪效果. 实验表明, 该方法在信噪比提升和细节保留上优于传统方法, 在非平稳信号处理中表现突出. 本研究为电磁信号降噪提供了新思路, 具有较高应用价值.
    优先出版日期:  2026-01-08 ,DOI: 10.15888/j.cnki.csa.010105
    [摘要] (106) [HTML] (0) [PDF 5.37 M] (190)
    摘要:
    输变电工程中边坡土壤类型的准确识别对稳定性评估与防护设计具有重要意义. 然而, 传统的野外调查与实验室分析效率低下且主观性强, 难以满足复杂工程场景的实时识别需求. 为此, 本文提出一种基于纹理融合的轻量化深度学习模型SSR-MobileNetV2-T. 该模型采用多尺度Gabor滤波、局部二值模式(local binary pattern, LBP)的双分支网络结构, 以增强对土壤微观纹理的特征提取能力. 构建了多源土壤图像数据集, 并通过HSV阈值分割与多样化数据增强扩充样本, 模拟野外复杂环境条件, 以端到端方式训练模型. 实验结果表明, 在5类边坡土壤图像分类任务中, SSR-MobileNetV2-T模型平均准确率达到98.1%, F1-score达到97.9%, 整体性能优于SVM、CNN以及EfficientNet等典型轻量化模型, 尤其在砾石和砂类别中表现突出. 参数敏感性分析和消融实验验证了各模块设计的有效性. 研究表明, SSR-MobileNetV2-T模型兼具轻量化与高精度特性, 可为输变电工程中边坡土壤的智能识别提供高效、可靠的技术支撑.
    优先出版日期:  2026-01-08 ,DOI: 10.15888/j.cnki.csa.010091
    [摘要] (127) [HTML] (0) [PDF 2.45 M] (212)
    摘要:
    为解决现有轻量化图像超分辨率模型在平衡全局感受野、局部特征提取能力与计算效率方面的不足, 并针对Mamba架构在上下文建模中存在的跨token交互能力不足问题, 提出一种名为MTSR的高效Mamba-Transformer协同网络. 首先, 构建一种混合协同架构, 通过合理配比Mamba与Transformer模块, 利用Transformer卓越的跨token交互能力弥补纯Mamba模型在上下文建模方面的缺陷, 实现了长程依赖建模与计算效率的有效平衡. 其次, 设计一种深度卷积注意力前馈网络, 用以替代传统的多层感知机. 此网络能够显著增强局部细节特征的提取能力和通道间的信息交互, 从而减少重建过程中的像素级信息损失, 从而更充分地发挥Mamba模块的性能潜力. 最后, 提出一个三重深度可分离浅层细化模块, 该模块专注于高效捕获并增强图像的浅层特征, 为后续的非线性映射提供更丰富的原始纹理信息. 在5个公开基准数据集上的大量实验结果表明, 所提MTSR模型相较于当前的轻量化SOTA模型SRFormer-light和MambaIR-light, 峰值信噪比(PSNR)分别获得了高达0.31 dB和0.38 dB的性能增益, 同时保持了Mamba高效推理速度的优势. 实验结果表明, 该方法为轻量化图像超分辨率领域提供了一种兼具高性能与高效率的有效解决方案.
    优先出版日期:  2026-01-08 ,DOI: 10.15888/j.cnki.csa.010095
    [摘要] (103) [HTML] (0) [PDF 1.72 M] (140)
    摘要:
    当前基于KL散度的模糊聚类分割研究面临两个核心挑战: (1)如何有效平衡算法的抗噪性与计算效率, 以满足实时性应用需求; (2)如何避免非凸目标函数导致的局部最优问题, 提升在复杂图像上的准确性和稳定性. 针对以上问题, 本文提出了一种融合类内类间距离测度与KL散度的快速模糊聚类图像分割算法. 首先, 摒弃了仅最小化类内距离的传统思想, 通过构建类内距离最小化与类间距离最大化之差作为新目标测度, 使得类内距离尽量最小化而类间距离尽量最大化, 保证了样本点归类时能精确地找到相应的类别, 提高样本分类的准确性. 其次, 将KL散度与图像直方图相结合, 一方面利用KL散度增强对噪声和非均匀数据的鲁棒性, 另一方面借助直方图大幅减少算法迭代的计算数据量, 在提升区域一致性的同时确保了算法的高效性, 有效解决了现有方法在鲁棒性、准确性与实时性难以兼得的困境, 使得算法在医疗、智能驾驶、机器人导航等领域更适用. 通过大量不同种类图像分割测试结果证实, 本文所提出的新类内类间基于 KL 散度的模糊C均值聚类算法是有效的, 尤其分割噪声较大的大篇幅图片时分割效果较好, 既能去除噪声又能满足实时性分割要求.
    优先出版日期:  2026-01-08 ,DOI: 10.15888/j.cnki.csa.010084
    [摘要] (158) [HTML] (0) [PDF 1.79 M] (180)
    摘要:
    联邦学习被广泛应用于移动网络, 采用分布式的方法进行本地和全局模型训练, 可以有效确保数据安全. 但是联邦学习在车联网中的应用又面临着3大挑战: 频繁的全局通信导致高延迟, 车辆有限的计算和电力资源以及高动态网络环境引起的带宽波动. 这些因素共同对联邦学习系统的执行造成了阻碍, 显著地降低了系统效率. 为了解决这些问题, 本文提出一种融合了移动性和带宽预测与多智能体强化学习的自适应资源调度策略. 在该策略中提出一个多维度预测模型, 将小波神经网络(WNN)和扩展的长短期记忆(xLSTM)网络结合作为预测模型, 针对车辆移动位置和带宽这两个维度进行预测, 为多智能体强化学习框架提供了准确输入. 同时采用多代理深度Q网络(MADQN)的动态资源调度算法来解决资源分配和功率控制挑战, 以此降低拖尾问题对系统效率的影响, 使边缘节点能够自主决策. 实验结果表明, 与传统方法相比, 本文方法有效地降低了系统成本和能耗, 同时模型性能也有一定提升, 并提高了传输成功率.
    优先出版日期:  2026-01-08 ,DOI: 10.15888/j.cnki.csa.010085
    [摘要] (142) [HTML] (0) [PDF 1.37 M] (196)
    摘要:
    针对急救场景下医学影像分析中手腕骨折检测精度不足、模型推理效率低等问题, 本文提出一种基于改进YOLO11的轻量化手腕骨折检测算法MDM-YOLO. 首先设计多尺度特征提取(multi-scale feature extraction module, MSFE)模块, 通过多个并行分支提取不同尺度的信息, 解决复杂骨折形态的多尺度表征问题; 其次, 提出混合空间局部注意力(mixed spatial and local attention, MSLA)机制, 结合局部和全局特征, 显著提升了对细微骨折的关注程度; 最后, 设计动态深度可分离卷积(dynamic depthwise separable convolution, DDSConv), 在保持检测精度的同时显著降低计算复杂度并加快推理速度, 使模型更加轻量化. 实验表明, MDM-YOLO在GRAZPEDWRI-DX数据集上的精确率达到92.6%, 召回率达到88.1%, mAP50达到95.1%, 较原始模型提升1.7%、2.5%和1.5%. 在相同的硬件环境下, 检测速度提升37%, 参数量仅为原模型的73.3%, 验证了轻量化设计的有效性. 为应急场景下的快速手腕骨折诊断提供了高效解决方案.
    优先出版日期:  2026-01-08 ,DOI: 10.15888/j.cnki.csa.010086
    [摘要] (133) [HTML] (0) [PDF 2.47 M] (227)
    摘要:
    针对传统路桥检测技术存在的效率低、成本高及安全风险问题, 以及当前无人机检测中多模态模型参数量大、难以在机载平台实时部署的挑战, 本文提出一种基于交叉蒸馏的多模态特征融合路桥检测模型. 该模型采用双分支教师网络与单分支学生网络架构, 通过教师网络间的特征交互与协同蒸馏机制, 实现多模态特异性知识的高效迁移; 同时引入基于注意力机制的动态特征融合模块, 强化对路桥缺陷关键特征的感知能力. 实验表明: 在保持检测精度mAP@0.5为89.6%的同时, 该模型参数量降至8.2M, 推理速度达32.6 f/s, 性能显著优于传统多模态融合及轻量化方法. 相比特征拼接、单模态蒸馏后融合等策略, 其检测精度与计算效率均具明显优势. 消融实验证实了交叉蒸馏机制与注意力融合模块的有效性. 该模型成功实现了路桥缺陷的高精度轻量化检测, 为无人机路桥检测工程应用提供了技术基础.
    优先出版日期:  2026-01-08 ,DOI: 10.15888/j.cnki.csa.010089
    [摘要] (111) [HTML] (0) [PDF 2.90 M] (217)
    摘要:
    前列腺癌是男性常见的恶性肿瘤, 其MRI图像的自动异常检测对于提升诊断效率和减轻医生负担具有重要意义. 针对现有方法依赖大量标注样本且对细微病灶检测能力有限的问题, 本文提出了一种基于集成自编码器与残差伪异常生成的无监督前列腺癌异常检测方法. 具体而言, 首先引入中心化核对齐(CKA)损失的集成自编码器, 有效抑制特征冗余并生成多样化的重建结果. 其次, 通过融合多分支自编码器残差的一致高响应区域, 在无标注情况下注入解剖约束扰动, 生成更加贴近真实病灶的伪异常样本. 再次, 提出在检测网络中引入频域对比损失, 以放大正常与异常样本在频域空间的区分能力. 最后, 采用双阶段流程, 确保训练与推理过程一致, 提升模型鲁棒性. 大量实验证明, 所提方法在公开前列腺MRI及脑部MRI数据集上均取得了优异的检测准确率和良好的跨域泛化能力. 其中, 在PICAI、PMU及BTM数据集上, 图像级AUC分别达到84.00%、89.20%和89.50%, AP值分别达到82.5%、87.00%和 88.80%, 优于现有主流方法.
    优先出版日期:  2025-12-26 ,DOI: 10.15888/j.cnki.csa.010078
    [摘要] (140) [HTML] (0) [PDF 1.32 M] (201)
    摘要:
    针对真实世界图像超分辨率任务中图片退化类型多样与细节恢复困难的问题, 现有方法在结构保持与语义一致性方面仍存在不足. 为此, 本文提出一种语义感知交互扩散图像超分辨率重建方法(semantic-aware interactive diffusion method for image super-resolution reconstruction, SISRM), 引入语义分割信息作为先验以增强重建过程的结构理解与语义引导. 具体而言, 该方法首先设计并训练分割感知提示提取器, 通过分割掩码编码器和标签文本生成器, 从退化低分辨率图像中高效提取分割掩码嵌入与语义标签; 其次, 引入交互式文本到图像控制器, 结合分割交叉注意力模块和可训练图像编码器, 通过多模态语义条件引导扩散过程增强局部细节与全局结构感知; 最后, 提出掩码特征融合机制缓解局部条件控制与全局潜在分布差异, 提高生成图像的一致性和视觉质量. 在 DIV2K-Val 和 RealSR 数据集上, 所提方法在无参考图像质量评估和跨模态图像质量评估最高分别达到0.6121和0.7274, 感知质量提高明显, 验证了其在细节还原、语义一致性及视觉质量方面的综合优势.
    优先出版日期:  2025-11-17 ,DOI: 10.15888/j.cnki.csa.010041
    [摘要] (182) [HTML] (0) [PDF 1.28 M] (463)
    摘要:
    多智能体强化学习是多智能体系统研究的重要组成部分, 在复杂协同任务中成效显著. 然而, 在需要长期决策的场景下, 由于长期回报的估计难度更大, 且难以对环境中的不确定性进行精准建模, 多智能体的表现往往不佳. 为解决上述问题, 本文提出了一种基于分位数回归的多智能体记忆强化学习模型. 该模型不仅选择性地利用了历史决策经验用于辅助长期决策, 还通过分位数函数对回报分布进行建模, 从而有效地捕捉了回报的不确定性. 该模型由记忆索引模块、隐式分位数决策网络和值分布分解模块这3部分组成, 其中记忆索引模块利用历史决策经验生成内在奖励, 促进智能体充分利用已有经验. 隐式分位数决策网络通过分位数回归, 对奖励分布进行建模, 为长期决策提供有力支持. 值分布分解模块将整体的回报分布分解为单个智能体的回报分布, 用于辅助单个智能体策略的学习. 本文的算法在星际争霸环境中进行了广泛的实验, 实验结果表明, 本文提出的方法提升了智能体在长期决策任务中的表现, 并具有较快的收敛速度.
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2000,9(2):38-41
    [摘要] (13383) [HTML] (0) [PDF 0.00 Byte] (26705)
    摘要:
    本文详细讨论了VRML技术与其他数据访问技术相结合 ,实现对数据库实时交互的技术实现方法 ,并简要阐述了相关技术规范的语法结构和技术要求。所用技术手段安全可靠 ,具有良好的实际应用表现 ,便于系统移植。
    ()
    [摘要] (11749) [HTML] (19) [PDF 0.00 Byte] (14)
    摘要:
    1993,2(8):41-42
    [摘要] (10588) [HTML] (0) [PDF 0.00 Byte] (36048)
    摘要:
    本文介绍了作者近年来应用工具软件NU清除磁盘引导区和硬盘主引导区病毒、修复引导区损坏磁盘的 经验,经实践检验,简便有效。
    1995,4(5):2-5
    [摘要] (10139) [HTML] (0) [PDF 0.00 Byte] (18776)
    摘要:
    本文简要介绍了海关EDI自动化通关系统的定义概况及重要意义,对该EDI应用系统下的业务运作模式所涉及的法律问题,采用EDIFACT国际标准问题、网络与软件技术问题,以及工程管理问题进行了结合实际的分析。
    2016,25(8):1-7 ,DOI: 10.15888/j.cnki.csa.005283
    [摘要] (9873) [HTML] (0) [PDF 1.11 M] (44751)
    摘要:
    从2006年开始,深度神经网络在图像/语音识别、自动驾驶等大数据处理和人工智能领域中都取得了巨大成功,其中无监督学习方法作为深度神经网络中的预训练方法为深度神经网络的成功起到了非常重要的作用. 为此,对深度学习中的无监督学习方法进行了介绍和分析,主要总结了两类常用的无监督学习方法,即确定型的自编码方法和基于概率型受限玻尔兹曼机的对比散度等学习方法,并介绍了这两类方法在深度学习系统中的应用,最后对无监督学习面临的问题和挑战进行了总结和展望.
    2008,17(5):122-126
    [摘要] (9118) [HTML] (0) [PDF 0.00 Byte] (53302)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
    2022,31(5):1-20 ,DOI: 10.15888/j.cnki.csa.008463
    [摘要] (8847) [HTML] (7566) [PDF 2.46 M] (10595)
    摘要:
    深度学习方法的提出使得机器学习研究领域得到了巨大突破, 但是却需要大量的人工标注数据来辅助完成. 在实际问题中, 受限于人力成本, 许多应用需要对从未见过的实例类别进行推理判断. 为此, 零样本学习(zero-shot learning, ZSL)应运而生. 图作为一种表示事物之间联系的自然数据结构, 目前在零样本学习中受到了越来越多的关注. 本文对零样本图学习方法进行了系统综述. 首先概述了零样本学习和图学习的定义, 并总结了零样本学习现有的解决方案思想. 然后依据图的不同利用方式对目前零样本图学习的方法体系进行了分类. 接下来讨论了零样本图学习所涉及到的评估准则和数据集. 最后指明了零样本图学习进一步研究中需要解决的问题以及未来可能的发展方向.
    2011,20(11):80-85
    [摘要] (8388) [HTML] (0) [PDF 842.93 K] (47272)
    摘要:
    在研究了目前主流的视频转码方案基础上,提出了一种分布式转码系统。系统采用HDFS(HadoopDistributed File System)进行视频存储,利用MapReduce 思想和FFMPEG 进行分布式转码。详细讨论了视频分布式存储时的分段策略,以及分段大小对存取时间的影响。同时,定义了视频存储和转换的元数据格式。提出了基于MapReduce 编程框架的分布式转码方案,即Mapper 端进行转码和Reducer 端进行视频合并。实验数据显示了转码时间随视频分段大小和转码机器数量不同而变化的趋势。结
    1999,8(7):43-46
    [摘要] (8128) [HTML] (0) [PDF 0.00 Byte] (28124)
    摘要:
    用较少的颜色来表示较大的色彩空间一直是人们研究的课题,本文详细讨论了半色调技术和抖动技术,并将它们扩展到实用的真彩色空间来讨论,并给出了实现的算法。
    2012,21(3):260-264
    [摘要] (7579) [HTML] (0) [PDF 328.42 K] (48949)
    摘要:
    开放平台的核心问题是用户验证和授权问题,OAuth 是目前国际通用的授权方式,它的特点是不需要用户在第三方应用输入用户名及密码,就可以申请访问该用户的受保护资源。OAuth 最新版本是OAuth2.0,其认证与授权的流程更简单、更安全。研究了OAuth2.0 的工作原理,分析了刷新访问令牌的工作流程,并给出了OAuth2.0 服务器端的设计方案和具体的应用实例。
    2019,28(6):1-12 ,DOI: 10.15888/j.cnki.csa.006915
    [摘要] (7467) [HTML] (23169) [PDF 656.80 K] (31275)
    摘要:
    知识图谱是以图的形式表现客观世界中的概念和实体及其之间关系的知识库,是语义搜索、智能问答、决策支持等智能服务的基础技术之一.目前,知识图谱的内涵还不够清晰;且因建档不全,已有知识图谱的使用率和重用率不高.为此,本文给出知识图谱的定义,辨析其与本体等相关概念的关系.本体是知识图谱的模式层和逻辑基础,知识图谱是本体的实例化;本体研究成果可以作为知识图谱研究的基础,促进知识图谱的更快发展和更广应用.本文罗列分析了国内外已有的主要通用知识图谱和行业知识图谱及其构建、存储及检索方法,以提高其使用率和重用率.最后指出知识图谱未来的研究方向.
    2007,16(9):22-25
    [摘要] (7224) [HTML] (0) [PDF 0.00 Byte] (12174)
    摘要:
    本文结合物流遗留系统的实际安全状态,分析了面向对象的编程思想在横切关注点和核心关注点处理上的不足,指出面向方面的编程思想解决方案对系统进行分离关注点处理的优势,并对面向方面的编程的一种具体实现AspectJ进行分析,提出了一种依据AspectJ对遗留物流系统进行IC卡安全进化的方法.
    2011,20(7):184-187,120
    [摘要] (7214) [HTML] (0) [PDF 714.75 K] (39102)
    摘要:
    针对智能家居、环境监测等的实际要求,设计了一种远距离通讯的无线传感器节点。该系统采用集射频与控制器于一体的第二代片上系统CC2530 为核心模块,外接CC2591 射频前端功放模块;软件上基于ZigBee2006 协议栈,在ZStack 通用模块基础上实现应用层各项功能。介绍了基于ZigBee 协议构建无线数据采集网络,给出了传感器节点、协调器节点的硬件设计原理图及软件流程图。实验证明节点性能良好、通讯可靠,通讯距离较TI 第一代产品有明显增大。
    2016,25(7):8-16 ,DOI: 10.15888/j.cnki.csa.005241
    [摘要] (6860) [HTML] (0) [PDF 921.13 K] (17532)
    摘要:
    软件是基于Visual C++ 6.0和Access 2003工具来完成的,在Unicode字符集模式下进行软件设计,解决当前民族文字软件开发时的系统使用兼容性以及字符的输出乱码等问题.本开发模式使用简单、操作稳定、接口灵活,在便于用户对词汇和语音数据库进行统一处理(备份、打印)的同时,也为其它民族文字翻译软件的开发提供了初期技术指导.目前面向傣族地区的翻译辅助工具还尚未推出,“傣泐文-汉文互译有声电子词典”是傣文信息化领域的一个重要“应用创新”成果,是开展少数民族语言文化信息元表示与提取研究的基础支撑,其作用主要是负责傣文的查询、翻译、朗读等工作.傣汉互译电子词典设计实现了傣汉对照互译、傣语真人朗读、傣语音标显示等常用功能,同时还支持对词库进行添加、修改、删除自定义操作,实现了良好的人机交互功能.
    2004,13(10):7-9
    [摘要] (6735) [HTML] (0) [PDF 0.00 Byte] (16817)
    摘要:
    本文介绍了车辆监控系统的组成,研究了如何应用Rockwell GPS OEM板和WISMOQUIKQ2406B模块进行移动单元的软硬件设计,以及监控中心 GIS软件的设计.重点介绍嵌入TCP/IP协议处理的Q2406B模块如何通过AT指令接入Internet以及如何和监控中心传输TCP数据.
    2008,17(1):113-116
    [摘要] (6705) [HTML] (0) [PDF 0.00 Byte] (56126)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(8):87-89
    [摘要] (6672) [HTML] (0) [PDF 0.00 Byte] (46488)
    摘要:
    随着面向对象软件开发技术的广泛应用和软件测试自动化的要求,基于模型的软件测试逐渐得到了软件开发人员和软件测试人员的认可和接受。基于模型的软件测试是软件编码阶段的主要测试方法之一,具有测试效率高、排除逻辑复杂故障测试效果好等特点。但是误报、漏报和故障机理有待进一步研究。对主要的测试模型进行了分析和分类,同时,对故障密度等参数进行了初步的分析;最后,提出了一种基于模型的软件测试流程。
    2008,17(8):2-5
    [摘要] (6531) [HTML] (0) [PDF 0.00 Byte] (37710)
    摘要:
    本文介绍了一个企业信息门户中单点登录系统的设计与实现。系统实现了一个基于Java EE架构的结合凭证加密和Web Services的单点登录系统,对门户用户进行统一认证和访问控制。论文详细阐述了该系统的总体结构、设计思想、工作原理和具体实现方案,目前系统已在部分省市的广电行业信息门户平台中得到了良好的应用。
    2004,13(8):58-59
    [摘要] (6504) [HTML] (0) [PDF 0.00 Byte] (33335)
    摘要:
    本文介绍了Visual C++6.0在对话框的多个文本框之间,通过回车键转移焦点的几种方法,并提出了一个改进方法.
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2007,16(10):48-51
    [摘要] (5603) [HTML] (0) [PDF 0.00 Byte] (94303)
    摘要:
    论文对HDF数据格式和函数库进行研究,重点以栅格图像为例,详细论述如何利用VC++.net和VC#.net对光栅数据进行读取与处理,然后根据所得到的象素矩阵用描点法显示图像.论文是以国家气象中心开发Micaps3.0(气象信息综合分析处理系统)的课题研究为背景的.
    2002,11(12):67-68
    [摘要] (5220) [HTML] (0) [PDF 0.00 Byte] (65235)
    摘要:
    本文介绍非实时操作系统Windows 2000下,利用VisualC++6.0开发实时数据采集的方法.所用到的数据采集卡是研华的PCL-818L.借助数据采集卡PCL-818L的DLLs中的API函数,提出三种实现高速实时数据采集的方法及优缺点.
    2008,17(1):113-116
    [摘要] (6705) [HTML] (0) [PDF 0.00 Byte] (56126)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(5):122-126
    [摘要] (9118) [HTML] (0) [PDF 0.00 Byte] (53302)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。

下载归智APP ,关注本刊

友情链接

您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62661041 传真: Email:csa@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号