• 当期目录
  • 优先出版
  • 过刊浏览
  • 点击排行
  • 下载排行
  • 综述文章
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    2025,34(1):1-10, DOI: 10.15888/j.cnki.csa.009782, CSTR: 32024.14.csa.009782
    [摘要] (169) [HTML] (66) [PDF 1.23 M] (367)
    摘要:
    提示词工程在解锁大语言模型潜能上具有重要作用. 该方法通过设计提示指令指导模型响应, 确保响应的相关性、连贯性和准确性. 提示工程无需微调模型参数, 可与下游任务无缝衔接. 因此, 各种提示词工程技术成为近年来研究的热点. 据此, 介绍了创建有效提示词的关键步骤, 总结了基础和高级提示词工程技术方法, 如思维链、思维树, 深入探讨了每种方法的优势和局限性. 同时, 讨论了如何从不同角度和不同方法评估提示方法的有效性. 这些技术的迅速发展使大语言模型在各种应用中取得了成功, 从教育、医疗到代码生成等. 最后, 展望了提示词工程技术的未来研究方向.
    2025,34(1):11-25, DOI: 10.15888/j.cnki.csa.009709, CSTR: 32024.14.csa.009709
    [摘要] (104) [HTML] (49) [PDF 1.79 M] (329)
    摘要:
    急性缺血性脑卒中是临床上最常见的卒中类型, 因其症状突发且治疗时间窗较短等特点, 成为全球导致残疾和死亡的重要因素之一. 随着人工智能领域的迅速发展, 深度学习技术在急性缺血性脑卒中的诊疗中展现出巨大的潜力. 深度学习模型能够快速高效地根据患者脑部图像对病灶进行分割与检测. 本文介绍深度学习模型的发展历程和用于脑卒中研究的常用公开数据集. 针对计算机断层扫描(computerized tomography, CT)和磁共振成像(magnetic resonance imaging, MRI)衍生出的多种模态和扫描序列, 详细阐述了深度学习技术在急性缺血性脑卒中病灶分割与检测领域的研究进展, 总结并分析了相关研究的改进思路. 最后, 指出了深度学习在该领域现存的挑战并提出了可能的解决方案.
    2025,34(1):26-36, DOI: 10.15888/j.cnki.csa.009733, CSTR: 32024.14.csa.009733
    [摘要] (64) [HTML] (51) [PDF 1.32 M] (337)
    摘要:
    微观剩余油赋存形态分类识别研究在剩余油开采领域发挥着至关重要的作用, 其对油田提高采收率具有重要的意义. 近年来, 该领域的大量研究通过引入深度学习方法来推动微观剩余油识别技术的发展, 但深度学习技术在微观剩余油识别领域尚未形成一个较为统一的框架, 也没有一个规范化的操作流程. 为了给今后的研究人员提供指导, 对目前的剩余油识别方法进行梳理, 从图像采集及类别划分标准、图像处理、剩余油识别方法等方面介绍了基于机器视觉的微观剩余油识别技术. 将剩余油识别方法分为基于传统和基于深度学习的识别方法, 传统识别方法分为基于人工特征提取和基于机器学习分类, 基于深度学习的识别方法划分为单阶段和两阶段方法, 并对其中数据增强、预训练、图像分割和图像分类方面进行详细归纳. 最后, 讨论了将深度学习应用于微观剩余油识别领域面临的挑战, 并对未来的发展趋势进行了展望.
    2025,34(1):37-46, DOI: 10.15888/j.cnki.csa.009742, CSTR: 32024.14.csa.009742
    [摘要] (81) [HTML] (40) [PDF 6.81 M] (511)
    摘要:
    具身智能(embodied AI)需要能够与环境进行互动和感知, 并具备自主规划、决策和行动等能力. 行为树(BT)由于其模块化和高效控制的特性, 已经成为机器人技术中广泛使用的方法. 然而, 现有的行为树生成技术在处理复杂任务时仍面临一定的挑战. 这些方法通常依赖于领域专业知识, 生成行为树的能力有限. 此外, 许多现有方法在语言理解方面存在不足, 或者在理论上无法保证行为树的成功, 从而导致在机器人上的实际部署难度较大. 本研究提出一种新的行为树自动生成方法, 该方法基于大语言模型(LLM)和场景语义感知, 生成包含任务目标的初始行为树. 本文的方法根据机器人的能力设计机器人动作原语和相关条件节点, 并以此设计提示(prompt)使LLM输出行为规划(generated plan), 然后将行为规划转化为初始行为树. 虽然本文以此为示例, 但该方法具有广泛的适用性, 可以根据不同需求应用于其他类型的机器人任务. 同时, 本文将这种方法应用于机器人任务中, 并给出具体实现方法和示例. 在机器人执行任务过程中, 行为树可以根据机器人操作失误和环境变化动态更新, 对外部环境变化具有一定的鲁棒性. 本文进行了初始行为树生成验证实验, 并在仿真机器人环境中进行了验证, 展示了本文方法的有效性.
    2025,34(1):47-57, DOI: 10.15888/j.cnki.csa.009760, CSTR: 32024.14.csa.009760
    [摘要] (84) [HTML] (44) [PDF 2.29 M] (446)
    摘要:
    由于人体器官的不规则形变, 可变形三维医学图像配准仍然是医学图像处理中的难题. 针对该问题, 本文提出了一种基于Transformer的多尺度可变形三维医学图像配准方法. 该方法首先采用多尺度策略来实现多层次的连接, 以捕捉不同层次的信息. 通过自注意力机制提取全局特征, 并利用膨胀卷积捕获更广泛的上下文信息和更细节的局部特征, 从而增强配准网络对全局和局部特征的融合能力. 其次, 本文根据图像梯度的稀疏性先验, 引入了归一化总梯度作为损失函数, 有效减少了噪声和伪影对配准过程的干扰, 更好地适应不同模态的医学图像. 在公开的脑MRI数据集(OASIS和LPBA)上评估本文所提方法的性能. 综合结果表明, 该方法不仅能保持基于学习的方法在运行时间上的优势, 还在均方误差和结构相似性等指标上表现出较高的性能. 此外, 消融实验的结果进一步证明了本文所提方法和归一化总梯度损失函数设计的有效性.
    2025,34(1):58-68, DOI: 10.15888/j.cnki.csa.009722, CSTR: 32024.14.csa.009722
    [摘要] (69) [HTML] (47) [PDF 1.92 M] (405)
    摘要:
    在当前的电力市场中, 现货日清数据量已达百万或千万级. 随着交易活动的增加和市场结构的复杂化, 确保交易数据的完整性、透明性和可追溯性是我国现阶段市场清算领域待研究的关键问题. 为此, 研究提出了一种基于PROV模型和智能合约的电力市场清算数据溯源方法, 旨在通过智能合约自动化存储及更新溯源信息, 从而提高清算过程的透明度和参与方信任. 本方法利用PROV模型中的实体、活动和代理等元素, 结合区块链技术的可层次存储及不可篡改性, 记录和追踪电力市场中的交易活动和规则变更. 本方法不仅增强了数据的透明度和市场参与方的信任度, 也优化了数据管理和存储策略, 降低了操作成本. 此外, 本方法为电力市场清算提供了合规性证明, 帮助市场参与方满足日益增长的法规要求.
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    优先出版日期:  2025-01-17 , DOI: 10.15888/j.cnki.csa.009787
    摘要:
    针对现行即插即用图像修复方法无法处理弱光图像增强等盲图像修复任务中图像退化模型难以精确建模的问题, 本文构造了一种将即插即用分裂算法与引导扩散模型相结合的求解方案. 该方案巧妙地避免了直接求解由复杂退化模型导致的复杂数据子问题, 转而使用真实退化图像来解决数据子问题, 并利用数据子问题的解作为“锚点”间接约束并优化先验子问题的求解过程. 从而确保了图像修复结果能够更紧密地贴近真实的图像恢复目标. 本方法在多个公开数据集上进行验证, 结果表明, 所提算法与现行具有代表性的方法相比, PSNR和SSIM分别平均提升4.89%和9.48%. 实验证明, 所提方法在修复指标上表现更好, 验证了本方法的有效性.
    优先出版日期:  2025-01-17 , DOI: 10.15888/j.cnki.csa.009790
    摘要:
    针对汽车涂胶图像边缘提取过程中, 由于生产工厂环境复杂、光线不均匀而产生噪声、伪边缘干扰的问题, 提出一种改进Canny算子的汽车涂胶图像边缘提取算法. 首先, 算法采用多级中值有理混合滤波和导向滤波的级联滤波器对图像进行去噪和平滑, 在降噪的同时保留目标边缘信息; 其次应用改进Sobel算子卷积模板, 从水平、垂直、45°、135°这4个方向提取梯度向量, 提高边缘定位精度; 最后在边缘连接阶段, 采用改进的最大类间方差法(Otsu)选择高低阈值, 增加算法的自适应性. 实验结果表明, 在图像降噪方面, 与传统的中值滤波相比, 该算法保证降噪后的图像的峰值信噪比高于35 dB, 结构相似度大于0.9, 整体峰值信噪比提升了6%以上, 结构相似度提高6.5%以上; 在边缘提取方面, 能够很好地减少伪边缘的干扰, 边缘连接程度较高.
    优先出版日期:  2025-01-17 , DOI: 10.15888/j.cnki.csa.009801
    摘要:
    地铁系统作为城市交通的核心组成部分, 安全性与效率的提升对于保障乘客的生命财产安全具有重要意义. 行人闯门行为不仅会导致设备损坏和交通延误, 更可能对其他乘客的安全构成威胁. 因此, 准确检测和识别地铁场景下的行人闯门行为成为智能交通管理中的一项重要任务. 本文提出一种行人闯门威胁检测算法. 该算法首先在RAFT光流法的特征提取器中使用移动网络卷积模块, 并添加ECA通道注意力机制, 同时在相关体构建块中使用3D结构并缩减领域半径, 以期降低模型参数量的同时提升检测速度. 实验结果表明, 该算法对行人检测的平均端点误差为0.79, 检测速度可达到55.98帧/s, 模型参数量降低了35.3%. 为获取乘客闯门威胁值, 本文使用改进光流法计算出相邻图片帧的运动信息, 结合本文提出的闯门威胁计算公式得到当前图片帧乘客的闯门威胁值. 该方法满足了实时性、准确度和轻量化的同时还可以有效部署, 更好地满足了站内大客流的行人威胁检测和应急管理的工程实践要求.
    优先出版日期:  2025-01-17 , DOI: 10.15888/j.cnki.csa.009821
    摘要:
    针对车联网中拒绝服务 (denial of service, DoS)攻击难以防范且现有监督学习方法无法有效检测零日攻击的问题, 提出了一种混合DoS攻击入侵检测系统. 首先, 对数据集进行预处理, 提高数据的质量; 其次, 利用特征选择滤除冗余特征, 旨在获得代表性更强的特征; 再次, 采用集成学习方法将5种基于树结构的监督分类器堆叠集成用于检测已知DoS攻击; 最后, 提出了一种无监督异常检测方法, 将卷积去噪自动编码器与注意力机制相结合来建立正常行为模型, 用于检测堆叠集成模型漏报的未知DoS攻击. 实验结果表明, 对于已知DoS攻击检测, 所提系统在Car-Hacking数据集和CICIDS2017数据集上的检测准确率分别为100%和99.967%; 对于未知DoS攻击检测, 所提系统在上述两个数据集上的检测准确率分别为100%和83.953%, 并且在两个数据集上的平均测试时间分别为0.072 ms和0.157 ms, 验证了所提系统的有效性和可行性.
    优先出版日期:  2025-01-16 , DOI: 10.15888/j.cnki.csa.009796
    摘要:
    基于点云的三维物体识别和检测是计算机视觉和自主导航领域的一个重要研究课题. 如今, 深度学习算法大大提高了三维点云分类的准确性和鲁棒性. 然而, 深度学习网络通常存在网络结构复杂、训练过程耗时等问题. 本文提出了一种三维点云分类网络Point-GBLS, 它将深度学习和宽度学习系统结合在一起. 网络结构简单, 训练时间短. 首先通过基于深度学习的特征提取网络提取点云特征, 然后用改进的宽度学习系统对其进行分类. ModelNet40和ScanObjectNN数据集上的实验表明, Point-GBLS识别准确率分别达到92%以上和78%以上, 训练时间低于同类深度学习方法的50%以上, 优于具有相同骨干的深度学习网络.
    优先出版日期:  2025-01-16 , DOI: 10.15888/j.cnki.csa.009797
    摘要:
    为解决结肠息肉图像语义分割任务中存在的边界不清晰以及分割结果不连贯、不完整甚至丢失的问题, 提出一种基于多尺度特征和上下文聚合的结肠息肉图像分割网络 (colon polyp image segmentation network based on multi-scale features and contextual aggregation, MFCA-Net). 网络选择PvTv2作为特征提取主干网络, 设计多尺度特征互补模块 (MFCM)用以提取丰富的多尺度局部信息, 减少息肉形态变化对分割结果的影响; 设计全局信息增强模块 (GIEM), 构建嵌入位置注意力的大核深度卷积实现对息肉的精确定位, 提升网络辨别复杂背景的能力; 设计高级语义引导的上下文聚合模块 (HSCAM), 以全局特征引导局部特征, 差异性互补和交叉融合浅层细节信息与深层语义信息, 提升分割的连贯性和完整性; 设计边界感知模块 (BPM), 结合传统图像处理方法与深度学习方法优化边界特征, 实现细粒度分割, 进而获取更清晰的边界. 实验表明, 在Kvasir、ClinicDB、ColonDB和ETIS等公开的结肠息肉图像数据集上, 所提出的网络均取得相较于当前主流算法更高的mDicemIoU分数, 具有更高的分割准确率和更强的鲁棒性.
    优先出版日期:  2025-01-16 , DOI: 10.15888/j.cnki.csa.009788
    摘要:
    针对传统人工势场法(artificial potential field, APF)未充分考虑车辆避碰风险分布差异性和陷入局部极值导致路径规划失败的问题, 提出一种基于梯度统计变异量子遗传算法(gradient statistical mutation quantum genetic algorithm, GSM-QGA)的自适应椭圆作用域人工势场法. 在传统斥力场圆形作用域的基础上, 通过分析车辆和障碍物的相对运动状态, 定义斥力势场动态椭圆作用域计算方法; 同时对势场函数影响因素进行分析, 引入速度因素分别完成斥力势场函数和引力势场函数的设计; 将梯度统计变异量子遗传算法作为改进人工势场局部最优修正策略, 当车辆陷入局部极值往复运动时, 基于车辆当前位置构建伪全局地图, 规划可行路径跳出局部极值范围. 仿真实验结果表明, 改进算法规划的路径不仅可以有效避免车辆陷入局部极值, 减少车辆不必要的避障操作, 而且在路径平滑性和路径长度等方面相比于传统APF算法和固定椭圆域APF算法均具有优势, 所规划路径长度分别缩短6.37%和9.14%.
    优先出版日期:  2025-01-16 , DOI: 10.15888/j.cnki.csa.009789
    摘要:
    数字水印算法因其在版权保护、内容认证、数据隐藏等领域的重要应用价值而受到广泛关注. 在实际应用中, 嵌入水印的图像往往会遭受图像扭曲、锐化模糊等可微噪声的影响, 同时也会面临JPEG压缩、传输错误等不可微噪声的干扰. 现有研究多集中于单一噪声环境下的方案设计, 或者尝试使用可导模型来近似模拟不可微噪声, 这些方法在一定程度上限制了水印算法的鲁棒性. 针对这一问题, 本文提出了一种基于可逆神经网络的端到端单阶段数字水印方案. 该方案利用可逆神经网络模拟不可微噪声, 提高了算法对于实际噪声环境的适应性和鲁棒性. 与现有算法相比, 本算法在多噪声叠加情况下峰值信噪比(PSNR)提高了3.12 dB, 平均提取精度(ACC)提高了35.36%.
    优先出版日期:  2025-01-16 , DOI: 10.15888/j.cnki.csa.009791
    摘要:
    矩阵分解模型是推荐系统中的经典模型之一, 可用来预测用户对物品的评分, 进而对用户进行推荐, 改善用户体验. 当前的矩阵分解模型无法有效提取用户之间的局部相似关系, 导致评分预测效果不佳, 且存在冷启动问题. 社交网络的发展使得用户之间的信任关系成为推荐系统的重要研究工具, 因此本文提出基于用户信任关系的局部贝叶斯概率矩阵分解模型(TLBPMF)用于评分预测, 结合用户的信任关系信息对用户的评分进行研究, 识别出具有相似偏好的用户群体并进行聚类, 根据聚类结果获取评分子矩阵, 对每个子矩阵分别建立概率矩阵分解模型, 深入挖掘用户之间的局部相似关系, 利用吉布斯抽样算法进行参数估计. 选择电影网站的评分数据集进行实验, 结果表明该模型在预测精度上优于基准模型, 并且在冷启动用户上比基准模型有更优越的表现.
    优先出版日期:  2025-01-16 , DOI: 10.15888/j.cnki.csa.009793
    摘要:
    为了解决现有反射消除算法在处理复杂场景时导致的图像质量下降问题, 本文提出了一种具有颜色感知的双通道反射消除算法. 首先, 设计了背景颜色生成器, 以准确预测图像的背景颜色信息, 为基础反射消除网络提供背景支持, 生成初步的反射消除结果. 接着, 提出了双通道反射消除网络, 对初步结果进行进一步的优化. 此外, 该算法在双通道反射消除网络中设计了稀疏Transformer模块、通道注意力模块以及特征融合模块, 从而提升了反射消除的精度和效果. 实验结果表明, 该方法在RRID和Flash数据集上表现出色, 能够有效去除反射光并显著提升图像的真实感.
    优先出版日期:  2025-01-16 , DOI: 10.15888/j.cnki.csa.009775
    摘要:
    在低光照图像增强的研究中, 虽然现有技术在提升图像亮度方面取得了进展, 但细节恢复不足和颜色失真等问题仍然存在. 为了解决这些问题, 本文提出一种基于Retinex理论具有双重注意力的Transformer增强网络——DARFormer. 该网络由光照估计网络和损坏修复网络两部分组成, 旨在提升低光照图像的亮度, 同时保留更多的细节并防止颜色失真. 光照估计网络是基于图像先验来估计亮度映射项, 用于低光照图像亮度增强; 损坏修复网络则优化亮度增强后的图像质量, 采用具有空间注意力和通道注意力的Transformer架构. 在LOL_v1、LOL_v2和SID公开数据集上进行实验表明: 与主流的增强方法相比, DARFormer在定量和定性指标上取得了更好的增强结果.
    优先出版日期:  2025-01-16 , DOI: 10.15888/j.cnki.csa.009776
    摘要:
    随着信息技术的发展, 诸如借助翻译工具的回译式抄袭行为越发复杂隐蔽, 对抄袭检测方法提出了更高的要求. 为此, 提出一种基于提示工程(prompt engineering)的抄袭检测方法. 该方法通过设计提示词, 引导大语言模型(large language model, LLM)在语义层面关注句子文本中的潜在相似性, 能够有效识别出语义高度相似的内容. 首先, 回顾了现有的抄袭检测技术和提示工程的应用, 在此基础上设计基于提示工程的回译式抄袭行为检测流程. 其次, 设计提示模版, 通过合并缩减待检测句子对的方式, 提出句子压缩比的抄袭检测指标. 最后, 通过实验证明基于提示工程的抄袭检测方法与传统方法相比, 在检测回译式抄袭行为上具有显著优势.
    优先出版日期:  2025-01-16 , DOI: 10.15888/j.cnki.csa.009783
    摘要:
    遥感高光谱图像超分辨率(remote sensing hyperspectral image single super-resolution, HSISR)任务近年来已取得可观进展, 其中使用深度卷积神经网络(convolutional neural network, CNN)技术的方法得到广泛运用. 然而, 大多数基于CNN的超分辨模型往往会忽略遥感高光谱图像的光谱结构, 同时由于卷积网络受卷积核大小限制, 长距离的特征依赖关系被忽略, 进而影响了重建的精度. 为了解决这些问题, 本文提出了一个基于分组ConvLSTM和Transformer的双分支遥感高光谱图像超分辨率网络(dual-branch remote sensing hyperspectral image super-resolution network based on grouped ConvLSTM and Transformer, DGCTNet), 该方法结合了Transformer捕捉长距离依赖关系和卷积长短时记忆网络(ConvLSTM)对提取序列性特征的优势, 在提取空间特征的同时保持了光谱的有序性, 增强了重建图像的效果. 此外, DGCTNet还设计了边缘学习网络, 将边缘信息扩散到图像空间中. 同时为重新校准光谱响应, 加入提出的双组级通道注意力机制(dual-group level channel self-attention, DSA). 在Houston数据集上的实验表明, DGCTNet方法在定量评价指标和多种场景下的视觉质量上, 都优于当前最先进的对比模型.
    优先出版日期:  2025-01-16 , DOI: 10.15888/j.cnki.csa.009785
    摘要:
    视音频事件定位(audio-visual event localization, AVEL)任务通过观察音频信息和相对应的视觉信息来定位视频中的事件. 本文针对AVEL任务设计了一种跨模态时间对齐网络CMTAN, 该网络包含预处理、跨模态交互、时间对齐和特征融合这4个部分. 具体而言, 在预处理部分, 通过一种新的跨模态音频指导模块和一种噪音弱化模块的处理, 模态信息中的背景和噪音被减少. 随后, 在跨模态交互部分, 使用基于多头注意力机制的信息强化和信息补充模块进行跨模态交互, 单模态信息得到全局信息优化. 在时间对齐部分, 本文设计了一种聚焦于跨模态交互前后单模态全局信息的时间对齐模块, 用于执行模态信息的特征对齐. 最后, 在特征融合过程中, 通过一种多阶段融合模块, 两种模态信息被从浅入深地融合, 且融合后的模态信息最终将被用于事件定位. 大量实验表明CMTAN在弱监督和全监督AVEL任务中都具有优秀的性能.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009781
    摘要:
    针对现有聚合物用量劈分算法, 在处理不同区块井组时自适应性不足的问题, 本文提出基于改进秃鹰搜索算法的聚合物驱油井组劈分方法, 首先通过灰色关联度分析法获得初步劈分系数, 进而计算每个采油井的累计注入量与实际产液量的差值, 并设定合理阈值范围和约束条件; 其次通过引入Sobol序列和ICMIC映射、黄金正弦莱维飞行引导机制及非线性收敛因子和自适应惯性权重策略改进秃鹰搜索算法, 增强算法的搜索能力和收敛精度; 最后利用改进秃鹰搜索算法对某油田实际区块内井组劈分系数优化模型进行求解, 结果表明计算出的劈分注入量与实际产液量吻合度较高, 具有较好的劈分精度.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009778
    摘要:
    针对雾霾、雨雪等恶劣天气下拍摄到的图像退化模糊, 难以进行准确识别与检测的问题, 本文提出模糊场景下行人与车辆检测算法LiteBlurVisionNet (轻模糊视觉网络). 在主干网络部分使用GlobalContextEnhancer注意力改进轻量级 MobileNetV3模块, 减少了参数量, 使得模型在雾霾、雨雪等恶劣天气条件下图像处理效率更高. 颈部网络采用更为轻量化的Ghost模块和由GhostBottleneck模块改进的SpectralGhostUnit模块, 能够更有效地捕获全局上下文信息, 提高特征的区分度和表达能力, 有助于减少参数数量和计算复杂度, 从而提高网络处理速度和效率; 预测部分采用DIoU NMS基于非极大抑制方法进行最大局部搜索, 去除冗余的检测框, 提高检测算法在模糊场景下的准确性. 实验结果表明, LiteBlurVisionNet算法模型的参数量比RTDETR-ResNet50算法模型下降了96.8%, 比YOLOv8n算法模型下降了55.5%, LiteBlurVisionNet算法模型的计算量比Faster R-CNN算法模型下降了99.9%, 比YOLOv8n算法模型下降了57%, LiteBlurVisionNet算法模型的mAP0.5比IAL-YOLO算法模型提高了13.71%, 比YOLOv5s算法模型提高了2.4%, 这意味着模型在存储和计算方面更加高效, 尤其适用于资源受限的环境或移动端设备.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009779
    摘要:
    自动文本摘要是自然语言处理(NLP)领域中的一个重要分支, 其主要难点之一是在于如何快速、客观且准确地评估生成摘要的质量. 针对现有文本摘要质量评估方法中评估准确度不高、需要参考文本以及计算资源消耗大的问题, 本文提出一种基于大语言模型的文本摘要质量评估方法, 设计基于思维链原理的提示词构建方法以提高大语言模型在文本摘要质量评估任务上的性能, 同时生成思维链数据集并以模型微调的方式对小型大语言模型进行训练, 显著降低了计算需求. 本文方法首先根据文本摘要的特点确定评估维度, 并基于思维链原理(chain of thought)构建提示词; 使用提示词对大型大语言模型进行引导, 使其根据摘要样本生成思维链过程与评估结果, 同时以此为基础生成思维链数据集; 使用生成的思维链数据集对小型大语言模型进行微调训练; 最后使用微调后的小型大语言模型完成文本摘要的质量评估任务. 本文在Summeval数据集上进行了对比实验与分析, 实验结果表明, 本评估方法显著提高了小型大语言模型在文本摘要质量评估任务上的评估准确度, 实现了一种无需参考文本、评估准确度高、计算需求低、便于部署的文本摘要质量评估方法.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009768
    摘要:
    在光谱三维CT数据中, 传统卷积的全局特征捕捉能力不足, 而全尺度的自注意力机制则需要大量的计算资源. 为了解决这一问题, 本文引入一种新视觉注意力范式(wave self-attention, WSA). 相比于ViT技术, 该机制使用更少的资源获得同等的自注意力信息. 此外, 为更充分的提取器官间的相对依赖关系并提高模型的鲁棒性和执行速度, 本文为WSA机制设计了一种即插即用的模块——波随机编码器(wave random encoder, WRE). 该编码器能够生成一对互逆的非对称全局(局部)位置信息矩阵. 其中, 全局位置矩阵用来对波特征进行全局性的随机取样, 局部位置矩阵则用于补充因随机取样而丢失的局部相对依赖. 本文在标准数据集Synapse和COVID-19的肾脏和肺实质的分割任务上进行实验. 结果表明, 本文方法在精度、参数量和推理速率方面均超越了nnFormer、Swin-UNETR等现有模型, 达到了SOTA水平.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009766
    摘要:
    由于虚假新闻检测任务的现有工作往往忽略了新闻文本的语义稀疏性及丰富信息之间的潜在联系, 限制了模型对虚假新闻的理解和识别能力, 本文提出了一种基于异质子图注意力网络的虚假新闻检测方法. 针对新闻样本的文本、所属党派、主题等多种信息, 构建了异质图, 以建模虚假新闻的丰富特征. 在特征层采用异质图注意力网络捕获不同类型信息之间的关系, 在样本层引入子图注意力网络挖掘新闻样本间的交互. 同时基于自监督对比学习的互信息机制关注全局图结构中的判别性子图表征, 以捕获新闻样本的特异性. 实验结果表明, 本文提出的方法在Liar数据集上相比现有方法在准确率与F1值分别取得了约9%和12%的提升, 显著提升了虚假新闻检测的性能.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009773
    摘要:
    在知识蒸馏(knowledge distillation, KD)领域中, 基于特征的方法可以有效挖掘教师模型所蕴含的丰富知识. 然而, 基于Logit的方法常面临着知识传递不充分和效率低下等问题. 解耦知识蒸馏(decoupled knowledge distillation, DKD)通过将教师模型和学生模型输出的Logit划分为目标类和非目标类进行蒸馏. 这种方式虽然提升了蒸馏精度, 但其基于单实例的蒸馏方式使得批次内样本间的动态关系无法被捕捉到, 尤其是当教师模型和学生模型的输出分布存在显著差异时, 仅依靠解耦蒸馏无法有效弥合这种差异. 为了解决DKD中存在的问题, 本文提出感知重构的方法. 该方法引入一个感知矩阵, 利用模型的表征能力对Logit进行重新校准, 细致分析类内动态关系, 重建更细粒度的类间关系. 由于学生模型的目标是最小化表征差异, 因此将该方法扩展到解耦知识蒸馏中, 把教师模型和学生模型的输出映射到感知矩阵上, 从而使学生模型能够学习到教师模型中更加丰富的知识. 本文方法在CIFAR-100和ImageNet-1K数据集上进行了一系列的验证, 实验结果表明, 该方法训练的学生模型在CIFAR-100数据集上的分类准确率达到了74.98%, 相较于基准方法提升了0.87个百分点, 提升了学生模型的图像分类效果. 此外, 通过对多种方法进行对比实验, 进一步验证了该方法的优越性.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009743
    摘要:
    矿井下光照缺失、环境复杂, 安全帽目标尺寸较小, 导致一般目标检测模型对安全帽的检测效果不佳. 针对上述问题, 提出了一种基于改进YOLOv8s的矿井下安全帽佩戴检测模型. 首先, 将effectiveSE模块和YOLOv8s Neck层中的C2f模块相结合, 设计得到新的C2f-eSE模块, 提高了网络结构的特征提取能力, 并用Wise-EIoU损失函数替代CIoU损失函数, 提高了模型的鲁棒性; 其次, 在检测头中引入空间和通道重建卷积模块SCConv, 并根据参数共享思想设计了新的轻量化SPS检测头, 降低了模型的参数量和计算复杂度; 最后在模型中增加一层P2检测层, 使模型的特征提取网络融入更多的浅层信息, 提高了对小尺寸目标的检测能力. 实验结果表明, 改进后模型的mAP50指标提升了3.2%, 参数量降低1.6%, GFLOPs降低5.6%.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009763
    摘要:
    复杂地形条件下, 基于深度强化学习的无人机编队航迹规划可以完成无人机编队的轨迹寻优, 路径长度和环境适应性均优于传统启发式算法, 但仍存在训练稳定性不足、规划实时性差等问题. 面向领航者-跟随者模式的无人机集群, 本文提出了一种基于SPER-TD3算法的无人机编队实时三维航迹规划方法. 首先, 将基于SumTree的优先经验回放机制融入TD3算法, 设计了SPER-TD3算法, 确定无人机编队的轨迹; 然后, 使用基于角度队形控制方法优化跟随者的飞行轨迹, 并应用动态轨迹平滑算法优化转向角. 为了加快SPER-TD3算法的训练收敛速度和稳定性, 解决长时间依赖性问题, 设计了结合LSTM、自注意力机制以及多重感知机的网络模型结构. 在多种障碍物环境下进行了仿真实验, 结果表明, 所提方法在轨迹安全覆盖率、飞行路径平滑度、成功率、奖励大小等方面综合表现优于8种主流的深度强化学习算法, 其重要性综合评估值比当前方法提升8.5%–72.9%不等, 且训练稳定性最佳.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009764
    摘要:
    关键句提取技术是指利用人工智能, 自动从一段长文本中寻找核心句. 该技术可用于信息检索的预处理, 对文本分类、抽取式摘要等下游任务有着重要意义. 传统的无监督关键句提取技术多数基于统计学以及图模型的方法, 存在着精度不高以及需要提前建立大规模语料库等问题. 本文提出了一种中文环境下的无监督提取关键句方法T5KSEChinese, 该方法利用编码器-解码器架构, 通过输入和输出提示词来忽略目标句与原文长度不匹配的问题, 以得到更准确的结果. 同时, 本文提出一种对比学习正样本构造方式, 并将该方式结合对比学习来对模型编码器部分进行半监督训练, 提升下游任务效果. 本研究使用轻量化的模型, 在无监督下游任务中得分优于参数量大于自身数十倍的大语言模型, 最终实验结果证明了提出方法的准确度和可靠性.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009774
    摘要:
    在时下的无监督深度哈希研究领域中, 基于对比学习而提出的方法占主流地位. 但是对比学习所采用的随机抽取负样本方式, 会带来采样偏差问题, 从而对图像检索精度造成负面影响. 为解决以上问题, 本文提出了一种基于偏差抑制对比学习的无监督深度哈希(unsupervised deep hashing based on bias suppressing contrastive learning, BSCDH). 本文在对比学习框架的基础上提出了偏差抑制方法(bias suppression, BSS), 将错误负样本近似为极困难负样本, 并设计了偏差抑制系数来抑制极困难负样本从而缓解采样偏差的负面影响. 本文根据当前负样本与查询样本的相似度来确定其对应的抑制系数取值, 并引入当前负样本与邻近的聚类中心间的距离关系对抑制系数进行取值修正, 降低正常负样本被过度抑制的可能性. 最终BSCDH的64位哈希码mAP@5000指标在CIFAR-10、FLICKR25K、NUS-WIDE数据集上分别达到0.696、0.833、0.819, 相较baseline具有显著的性能优势. 本文开展的大量实验证明了BSCDH在无监督图像检索方法中拥有较高的检索精度, 且能有效应对采样偏差问题.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009769
    摘要:
    现有的知识图谱链路预测方法在学习语义信息的过程中大多只关注单个三元组中头实体h、关系r和尾实体t之间的语义关系, 没有考虑不同三元组中相关实体和实体关系之间的联系. 针对此问题, 本文提出了DeepE_CL模型. 首先, 通过DeepE模型学习相关三元组的语义信息和具有相同实体关系对的实体或具有相同实体的实体关系对的语义信息. 其次, 利用提取的相关三元组语义信息计算相应的评分函数和交叉熵损失, 并采用对比学习模型对提取的具有相同实体关系对的实体或具有相同实体的实体关系对的语义信息进行优化, 从而实现对相关三元组缺失信息的预测. 本文在4个常见的数据集上进行验证, 运用MRMRRHit@1和Hit@10这4个评价指标对所提方法和其他基线模型进行对比, 实验结果表明DeepE_CL模型在所有指标上都取得了最好的结果. 为了进一步验证模型的实用性, 本文还将模型应用到了1个真实的中成药数据集, 实验结果显示DeepE_CL模型比DeepE模型在MR指标上降低了18, 在MRRHit@1指标上分别提升了0.8%、1.1%, 在Hit@10指标上维持不变. 实验证明了引入对比学习模型的DeepE_CL模型在提升知识图谱链路预测性能方面的有效性.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009770
    摘要:
    密度峰值聚类(density peaks clustering, DPC)算法通过考虑局部密度和相对距离来识别簇中心以实现聚类. 然而, 该算法在处理密度分布不均匀和类簇大小不平衡的数据时容易忽视低密度区域的类簇中心, 需要人为设定类簇数量, 并且其分配策略中一个数据点分配错误会导致后续点的错误分配. 为了解决上述问题, 本文提出一种自适应稀疏感知密度峰值聚类算法. 首先, 引入模糊点概念以降低对子簇合并过程的影响; 其次, 利用减法聚类方法识别低密度区域的中心; 然后, 根据新的局部密度和反向最近邻数来识别噪声并更新子簇中心; 最后, 给出改进的全局交叠度, 结合全局可分度指导子簇融合, 并在这些度量下自动确定聚类结果. 实验结果表明, 在合成数据集和UCI数据集上, 与DPC及其改进算法相比, 本文提出的算法能够更好地识别稀疏簇、减少非中心分配带来的连锁反应, 自动确定最优类簇数目并获得更加准确的聚类结果.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009765
    摘要:
    基于Transformer的目标检测算法往往存在着精度不足, 收敛速度慢的问题. 许多研究针对这些问题进行改进, 取得了一定的成果. 但是这些研究大都忽视了Transformer结构应用于目标检测领域时存在的两个不足之处. 首先, 自注意力运算结果缺乏多样性. 其次, 因集合预测难度大, 使得模型在匹配目标的过程中表现不稳定. 为了弥补上述缺陷, 首先设计了自适应token池化模块, 增加自注意力权重的多样性. 其次, 设计了一种基于粗预测的锚框定位模块, 并利用该模块为查询提供位置先验信息, 从而提高二分图匹配过程的稳定性. 最后, 设计了基于组的去噪任务, 通过训练模型对位于目标附近的正负查询进行区分, 从而提高模型进行集合预测的能力. 实验表明, 本文提出的改进算法在COCO数据集上取得了较好的训练结果. 与基线模型相比, 改进算法在检测精度与收敛速度上有较大提升.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009746
    摘要:
    为充分挖掘专家历史事故根原因分析经验, 提升事故根原因分析的准确性与全面性, 减少化工安全事故发生, 本文提出一种基于历史事故报告与根原因指标体系关联挖掘的分析方法. 通过构建事故报告与指标体系的关联矩阵, 采用预训练模型对事故文本和指标项文本进行表征, 基于注意力机制融合二级和三级指标项的信息, 最后运用图卷积神经网络进行事故根原因分析. 通过在1351份数据集上进行验证, 实验结果表明: 该方法显著提高了根原因预测准确性, 能够有效利用专家历史分析经验辅助当前事故分析, 并揭示历史事故分析不完整的问题. 同时, 该方法也能通过不完整的事故描述准确挖掘事故根原因, 该方法的应用将提升事故预防和安全生产风险管理的水平.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009751
    摘要:
    YOLOv8n算法在面对背景繁杂、目标密集、像素点小的情况下, 表现出识别精度欠佳、目标漏检及误识别的问题. 针对上述问题, 提出一种LNCE-YOLOv8n安全装备佩戴检测算法. 包括提出线性多尺度融合注意力LMSFA (linear multi-scale fusion attention)机制, 自适应聚焦关键特征, 提升对小目标信息提取的能力且减少计算. 提出C2f_NewNet (C2f_New network)结构, 通过有效的并行化设计, 保持高性能且减少深度. 结合轻量级通用上采样算子CARAFE (content-aware reassembly of feature), 实现跨尺度的高效特征融合与传播, 在大的感受野内聚合上下文信息. 基于SIoU (symmetric intersection over union)损失函数提出ESIoU (enhanced symmetric intersection over union), 提升模型在复杂环境中的适应性和精度. 实验采用safety equipment数据集进行训练测试, 结果表明LNCE-YOLOv8n算法相比YOLOv8n算法, 精度提升了5.1%, mAP50提升了2.7%, mAP50-95提升了3.4%, 有效提高建筑工地复杂场景的工人安全装备佩戴检测精度.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009752
    摘要:
    肺炎是一种常见的呼吸系统疾病, 早期诊断对于有效治疗至关重要. 本研究提出了卷积神经网络(CNN)和Transformer结合的CTFNet混合模型, 旨在实现高效准确的肺炎辅助诊断. 该模型融合了卷积分词器和聚焦线性注意力机制. 卷积分词器通过卷积操作实现更紧凑的特征提取, 并保留图像的关键局部特征降低计算复杂度, 提高模型的表达能力. 聚焦线性注意力机制缓解了Transformer的计算需求, 优化了注意力框架, 大幅提升了模型性能. 在Chest X-ray Images数据集上, CTFNet在肺炎分类任务中表现出色, 达到了99.32%的准确率、99.55%的精确率、99.55%的召回率和99.55%的F1值. 较好的性能凸显了该模型在临床应用中的潜力. 为了评估CTFNet的泛化能力, 我们将其应用于COVID-19 Radiography Database数据集. 在该数据集中, CTFNet被用于多个二分类任务均达到98%以上的准确率. 这些结果表明, CTFNet在肺炎图像分类的各种任务中具有较好的泛化能力和可靠性.
    优先出版日期:  2024-12-13 , DOI: 10.15888/j.cnki.csa.009753
    摘要:
    传统的知识感知传播推荐算法中存在高阶特征相关度低、信息利用不平衡以及噪声引入问题. 提出一种多层次图间知识增强对比学习的知识感知传播推荐算法(MCLK-KE), 通过构建增强视图, 并利用自监督掩码重建预训练技术, 提取关键三元组的更深层信息, 有效抑制了噪声信号. 算法实现了知识与交互信号的均衡利用, 并以图间对比强化了特征表达, 捕捉到全局范围内的有效节点属性. 多任务训练通过联合训练推荐预测、对比学习和掩码重建任务, 提升模型性能. 在3个公开数据集上, MCLK-KE与最佳基线模型对比AUC指标最大提升3.3%, F1值最高增长5.3%.
    优先出版日期:  2024-12-13 , DOI: 10.15888/j.cnki.csa.009762
    摘要:
    对于配备多种传感器的自动驾驶车辆, 在野外扬尘环境中进行高精度三维目标检测是一项重大挑战, 野外地形的多变性导致采集目标的区域特征差异性加剧, 同时扬尘颗粒物还会模糊目标特征. 为了克服这些困难, 本文提出了多模态特征动态融合的三维目标检测方法, 构建了多级特征自适应融合模块和特征对齐增强模块, 其中, 多级特征自适应融合模块动态调整模型对全局级特征和区域级特征的关注程度, 充分利用多级感受野, 减少区域差异对识别效果的影响; 而特征对齐增强模块则在多模态特征对齐之前增强感兴趣区域的特征表达, 有效抑制扬尘等干扰因素. 实验结果表明, 提出方法在自建野外数据集中比基线的平均精度提高了2.79%, 在KITTI数据集的困难级别检测中提高了1.7%, 表现出较好的鲁棒性和准确性.
    优先出版日期:  2024-12-13 , DOI: 10.15888/j.cnki.csa.009767
    摘要:
    卡通角色面部检测是一项比人脸检测更具挑战性的任务, 它涉及许多困难的场景. 针对卡通角色面部间存在巨大差异的特点, 本文提出了一种卡通角色面部检测算法, 命名为YOLO-DEL. 首先, 基于GELAN融合BDD设计了DBBNCSPELAN模块, 旨在减小模型体积的同时增强检测性能. 接下来, 引入一种称为ELA的多尺度注意机制, 用于改善SPPF结构, 增强主干模型的特征提取能力. 最后, 设计了新的共享卷积检测头, 使网络更轻便. 同时也用Shape-IoU代替原CIoU损失函数, 提升模型的收敛效率. 在iCartoonFace数据集上进行实验, 通过消融实验验证得到的模型, 并将其与YOLOv3-tiny、YOLOv5n和YOLOv6等模型进行比较. 改进模型YOLO-DEL的mAP达到90.3%, 比YOLOv8提高了1.2%, 参数量为1.69M, 与YOLOv8相比参数量降低47%, GFLOPs 降低44%. 实验表明, 本文方法能有效提高卡通角色面部的检测精度, 同时缩小网络模型的大小, 验证本文方法的有效性.
    优先出版日期:  2024-12-09 , DOI: 10.15888/j.cnki.csa.009780
    摘要:
    针对现有的图像去雾算法仍然存在去雾不彻底、去雾后的图像边缘模糊、细节信息丢失等问题, 本文提出了一种基于Transformer和门控融合机制的图像去雾算法. 通过改进的通道自注意力机制提取图像的全局特征, 提高模型处理图像的效率, 设计多尺度门控融合块捕获不同尺度的特征, 门控融合机制通过动态调整权重, 提高模型对不同雾化程度的适应能力, 同时更好地保留图像边缘及细节信息, 并使用残差连接增强特征的重用性, 提高模型泛化能力. 经实验验证, 所提出的去雾算法可以有效恢复真实有雾图像中的内容信息, 在合成的有雾图像数据集SOTS上的峰值信噪比达到了34.841 dB, 结构相似性达到了0.984, 去雾后的图像内容信息完整且没有出现细节信息模糊和去雾不彻底等现象.
    优先出版日期:  2024-12-09 , DOI: 10.15888/j.cnki.csa.009777
    摘要:
    针对人群计数面临的人头尺寸不统一、人群密度分布不均匀、背景复杂干扰等问题, 提出一种解决多尺度变化加强关注人群区域的卷积神经网络模型 (multi-scale feature weighted fusion attention convolutional neural network, MSFANet). 该网络前端采用改进的VGG-16模型对输入人群图像做第1步的粗粒度特征提取, 中间加入多尺度特征提取模块提取图像的多尺度特征信息. 随后添加注意力模块对多尺度特征进行特征加权. 后端利用锯齿状空洞卷积模块增大感受野, 以提取图像的细节特征, 生成高质量的人群密度图. 对该模型在3个公开数据集上进行实验, 结果显示, 在Shanghai Tech Part B数据集上MAE (平均绝对误差)达到7.8, MSE (均方误差)达到12.5. 在Shanghai Tech Part A数据集上MAE达到64.9, MSE达到108.4. 在UCF_CC_50数据集上MAE达到185.1, MSE达到249.8. 实验结果证实该模型有较好的准确度和鲁棒性.
    优先出版日期:  2024-12-09 , DOI: 10.15888/j.cnki.csa.009784
    摘要:
    面对视频质量评估领域标记数据不足的问题, 研究者开始转向自监督学习方法, 旨在借助大量未标记数据来学习视频质量评估模型. 然而现有自监督学习方法主要聚焦于视频的失真类型和视频内容信息, 忽略了视频随时间变化的动态信息和时空特征, 这导致在复杂动态场景下的评估效果不尽人意. 针对上述问题, 提出了一种新的自监督学习方法, 通过播放速度预测作为预训练的辅助任务, 使模型能更好地捕捉视频的动态变化和时空特征, 并结合失真类型预测和对比学习, 增强模型对视频质量差异的敏感性学习. 同时, 为了更全面捕捉视频的时空特征, 进一步设计了多尺度时空特征提取模块等以加强模型的时空建模能力. 实验结果显示, 所提方法在LIVE、CSIQ以及LIVE-VQC数据集上, 性能显著优于现有的基于自监督学习的方法, 在LIVE-VQC数据集上, 本方法在PLCC指标上平均提升7.90%, 最高提升17.70%. 同样, 在KoNViD-1k数据集上也展现了相当的竞争力. 这些结果表明, 本文提出的自监督学习框架有效增强视频质量评估模型的动态特征捕捉能力, 并在处理复杂动态视频中显示出独特优势.
    优先出版日期:  2024-12-06 , DOI: 10.15888/j.cnki.csa.009747
    摘要:
    现有的基于卷积神经网络的超分辨率重建方法由于感受野限制, 难以充分利用遥感图像丰富的上下文信息和自相关性, 导致重建效果不佳. 针对该问题, 本文提出了一种基于多重蒸馏与Transformer的遥感图像超分辨率(remote sensing image super-resolution based on multi-distillation and Transformer, MDT)重建方法. 首先结合多重蒸馏和双注意力机制, 逐步提取低分辨率图像中的多尺度特征, 以减少特征丢失. 接着, 构建一种卷积调制Transformer来提取图像的全局信息, 恢复更多复杂的纹理细节, 从而提升重建图像的视觉效果. 最后, 在上采样过程中添加全局残差路径, 提高特征在网络中的传播效率, 有效减少了图像的失真与伪影问题. 在AID和UCMerced两个数据集上的进行实验, 结果表明, 本文方法在放大至4倍超分辨率任务上的峰值信噪比和结构相似度分别最高达到了29.10 dB和0.7807, 重建图像质量明显提高, 并且在细节保留方面达到了更好的视觉效果.
    优先出版日期:  2024-12-06 , DOI: 10.15888/j.cnki.csa.009748
    摘要:
    在任务计算密集型和延迟敏感型的场景下, 无人机辅助的移动边缘计算由于其高机动性和放置成本低的特点而被广泛研究. 然而, 无人机的能耗限制导致其无法长时间工作并且卸载任务内的不同模块往往存在着依赖关系. 针对这种情况, 以有向无环图(direct acyclic graph, DAG)为基础对任务内部模块的依赖关系进行建模, 综合考虑系统时延和能耗的影响, 以最小化系统成本为优化目标得到最优的卸载策略. 为了解决这一优化问题, 提出了一种基于亚群、高斯变异和反向学习的二进制灰狼优化算法(binary grey wolf optimization algorithm based on subpopulation, Gaussian mutation, and reverse learning, BGWOSGR). 仿真结果表明, 所提出算法计算出的系统成本比其他4种对比方法分别降低了约19%、27%、16%、13%, 并且收敛速度更快.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009761
    摘要:
    分布式存储系统采用纠删码来实现高可靠和低开销的数据存储. 为了提供不同的可靠性和多样的访问性能, 存储系统需要对纠删码数据进行冗余转换, 即改变其编码参数. 条带合并机制为存储系统的冗余转换提供了一种思路. 然而, 基于传统纠删码的条带合并会在过程中引发大量的数据块重分布和校验块重计算I/O开销, 且在多次合并中会进一步加剧I/O. 针对此问题, 本文提出了一种新的树型里德-所罗门码, 通过分散数据块以消除数据块重分布I/O, 并通过设计编码矩阵以节约校验块重计算I/O. 树型里德-所罗门码进一步设计了存储单元, 将参与合并的条带组织成一颗树, 使得多次合并依据树结构自底向上高效完成. 本文设计实现了分布式存储原型系统. 实验表明, 树型里德-所罗门码相较于传统纠删码, 可以大大减少条带合并的完成时间.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009757
    摘要:
    Android应用异步消息执行顺序的不确定性是导致其不稳定的主要原因. 现有不稳定测试研究大多通过随机确定异步消息的执行顺序以触发不稳定测试, 其检测效果不佳且效率较低. 本文提出一种基于Happens-Before (HB)关系的Android应用并发不稳定测试检测方法, 通过分析Android应用测试用例执行轨迹中异步消息间的HB关系, 进而确定异步消息的可执行区间; 并设计最大差异化调度策略, 有指导性地确定异步消息执行顺序, 使调度后的测试执行轨迹上异步消息执行序与原测试执行轨迹差异最大化, 进而尝试改变测试执行结果, 检测测试的不稳定性. 为验证本文方法的有效性, 针对40个Android应用程序的50个不稳定测试用例进行实验, 实验结果表明, 本文方法可检测全部不稳定测试用例, 相比当前主流工具检测效果提升6%, 且平均检测时间缩短31.78%.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009771
    摘要:
    针对当下层级文本分类模型尚未充分利用层级实例的标签信息以及缺乏对类别分布不平衡的处理这两方面问题, 本文提出一种面向标签共现和长尾分布的层级文本分类方法(hierarchical text classification for label co-occurrence and long-tail distribution, LC-LTD), 对基于共享标签的文本全局语义和面向长尾分布的平衡损失函数进行研究. 首先, 设计一种基于共享标签的对比学习目标, 使具有更多共享标签的文本表示在特征空间中的语义距离更近, 引导模型生成具有判别性的语义表征; 其次, 引入分布平衡损失函数替换二进制交叉熵损失, 缓解层级分类固有的长尾分布问题, 提高模型的泛化能力. 在WOS、BGC两个公开数据集上将LC-LTD与当前多个主流模型进行比较, 结果表明所提方法具有更好的分类性能, 更适合处理层级文本分类任务.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009772
    摘要:
    图像隐写分析旨在检测图像是否经过隐写术处理从而携带了秘密信息. 基于孪生网络的隐写分析算法通过计算待检测图像左右分区的不相似性以此判断图像是否携带秘密信息, 是目前深度学习图像隐写分析算法里面准确度较高的网络. 然而, 基于孪生网络的图像隐写分析算法仍然存在一些局限性. 首先, 孪生网络在预处理层和特征提取层中叠加的卷积块, 忽略了隐写信号从浅层传递到深层过程中容易丢失的问题. 其次, 现有的孪生网络使用的SRM滤波器仍然沿用其他网络使用的高通滤波器来抑制图像内容, 忽略了生成的残差图大小单一的问题. 为了解决以上问题, 本文提出了基于增强残差特征的孪生网络图像隐写分析方法. 本文方法设计了一种基于注意力的倒残差模块, 通过在预处理层和特征提取层的卷积块后添加基于注意力的倒残差模块, 重用图像特征, 引入注意力机制, 增强网络对图像纹理复杂区域的特征图赋予更多权重. 同时为了更好地抑制图像内容, 提出多尺度滤波器, 将残差类型调整为多个尺寸不同的卷积核进行操作, 丰富残差特征. 实验结果表明, 本文提出的基于注意力的倒残差模块和多尺度滤波器相较于现有方法分类效果更佳.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009758
    摘要:
    在自动驾驶技术的领域中, 利用鸟瞰图(bird’s eye view, BEV)进行3D目标检测任务已经引起了广泛的关注. 针对现有相机至鸟瞰视图转换方法, 实时性不足、部署复杂度较高的难题, 提出了一种简单高效、无需任何特殊工程操作即可部署的视图转换方法. 首先, 针对完整图像特征存在大量冗余信息, 引入宽度特征提取器并辅以单目3D检测任务, 提炼图像的关键特征, 确保过程中信息损失的最小化; 其次, 提出一种特征引导的极坐标位置编码方法, 增强相机视角与鸟瞰图表示之间的映射关系与模型空间理解能力; 最后, 通过单层交叉注意力机制实现可学习BEV嵌入与宽度图像特征的交互, 从而生成高质量的BEV特征. 实验结果表明: 在nuScenes验证集上该网络架构与LSS (lift, splat, shoot)相比mAP从29.5%提升到32.0%, 提升了8.5%, NDS从37.1%提升到38.0%, 提升了2.4%, 表明该模型在自动驾驶场景下的3D目标检测任务的有效性. 同时相比于LSS在延迟上降低了41.12 %.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009755
    摘要:
    无人机(unmanned aerial vehicle, UAV)搭载边缘服务器构成移动边缘服务器, 可以在一些基站难以部署的场景下为用户设备(user equipment, UE)提供计算服务, 借助深度强化学习对智能体进行训练, 能够在连续复杂的状态空间中制定合理的卸载决策, 将用户产生的计算密集型任务部分卸载至边缘服务器处执行, 提高系统的续航和响应时间, 但目前的深度强化学习算法所使用的全连接神经网络无法较好地处理UAV辅助移动边缘计算(mobile edge computing, MEC)场景下的时间序列数据, 算法的智能体训练效率低, 决策性能差, 针对上述问题, 本文以最小化UAV辅助MEC系统总时延为目标, 提出了一种基于长短期记忆网络的双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient algorithm based on long short term memory, LSTM-TD3), 利用LSTM改进TD3算法的Actor-Critic网络结构, 将网络划分成3部分: 包含LSTM的记忆提取单元, 当前特征提取单元, 以及感知整合单元; 并在改进了经验池中的样本数据, 定义了历史数据, 使记忆提取单元能够得到更好的训练效果. 仿真结果表明, 与AC算法、DQN算法和DDPG算法相比, LSTM-TD3算法在以系统最小总时延为目标对卸载策略进行优化时具有最好的性能.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009739
    摘要:
    为求解带时间窗的车辆路径问题, 以最小化总行驶里程为目标建立混合整数规划模型, 提出了一种具有时间窗约束松弛的混合蚁群算法. 首先, 提出改进的蚁群算法与“TSP-Split编码与解码”相结合的方法, 来构建允许违反时间窗约束的解路径, 以提高算法的全局寻优能力. 然后, 利用“及时返回”原则和惩罚函数方法, 提出基于变邻域搜索的修复策略来修复不可行解. 最后, 对56个Solomon和12个Homberger基准算例进行试验计算, 结果表明该算法的求解质量优于文献中的对比算法, 且在50个测试实例上获得了已知最优解, 其余实例也能在可接受计算时间内获得准最优解, 验证了所提算法的有效性.
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2000,9(2):38-41, DOI:
    [摘要] (12743) [HTML] (0) [PDF ] (22842)
    摘要:
    本文详细讨论了VRML技术与其他数据访问技术相结合 ,实现对数据库实时交互的技术实现方法 ,并简要阐述了相关技术规范的语法结构和技术要求。所用技术手段安全可靠 ,具有良好的实际应用表现 ,便于系统移植。
    1993,2(8):41-42, DOI:
    [摘要] (9791) [HTML] (0) [PDF ] (32592)
    摘要:
    本文介绍了作者近年来应用工具软件NU清除磁盘引导区和硬盘主引导区病毒、修复引导区损坏磁盘的 经验,经实践检验,简便有效。
    1995,4(5):2-5, DOI:
    [摘要] (9349) [HTML] (0) [PDF ] (14940)
    摘要:
    本文简要介绍了海关EDI自动化通关系统的定义概况及重要意义,对该EDI应用系统下的业务运作模式所涉及的法律问题,采用EDIFACT国际标准问题、网络与软件技术问题,以及工程管理问题进行了结合实际的分析。
    2016,25(8):1-7, DOI: 10.15888/j.cnki.csa.005283
    [摘要] (9004) [HTML] () [PDF 1167952] (39689)
    摘要:
    从2006年开始,深度神经网络在图像/语音识别、自动驾驶等大数据处理和人工智能领域中都取得了巨大成功,其中无监督学习方法作为深度神经网络中的预训练方法为深度神经网络的成功起到了非常重要的作用. 为此,对深度学习中的无监督学习方法进行了介绍和分析,主要总结了两类常用的无监督学习方法,即确定型的自编码方法和基于概率型受限玻尔兹曼机的对比散度等学习方法,并介绍了这两类方法在深度学习系统中的应用,最后对无监督学习面临的问题和挑战进行了总结和展望.
    2008,17(5):122-126, DOI:
    [摘要] (8003) [HTML] (0) [PDF ] (49381)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
    2011,20(11):80-85, DOI:
    [摘要] (7706) [HTML] () [PDF 863160] (43475)
    摘要:
    在研究了目前主流的视频转码方案基础上,提出了一种分布式转码系统。系统采用HDFS(HadoopDistributed File System)进行视频存储,利用MapReduce 思想和FFMPEG 进行分布式转码。详细讨论了视频分布式存储时的分段策略,以及分段大小对存取时间的影响。同时,定义了视频存储和转换的元数据格式。提出了基于MapReduce 编程框架的分布式转码方案,即Mapper 端进行转码和Reducer 端进行视频合并。实验数据显示了转码时间随视频分段大小和转码机器数量不同而变化的趋势。结
    1999,8(7):43-46, DOI:
    [摘要] (7377) [HTML] (0) [PDF ] (24507)
    摘要:
    用较少的颜色来表示较大的色彩空间一直是人们研究的课题,本文详细讨论了半色调技术和抖动技术,并将它们扩展到实用的真彩色空间来讨论,并给出了实现的算法。
    2022,31(5):1-20, DOI: 10.15888/j.cnki.csa.008463
    [摘要] (6898) [HTML] (4348) [PDF 2584043] (6473)
    摘要:
    深度学习方法的提出使得机器学习研究领域得到了巨大突破, 但是却需要大量的人工标注数据来辅助完成. 在实际问题中, 受限于人力成本, 许多应用需要对从未见过的实例类别进行推理判断. 为此, 零样本学习(zero-shot learning, ZSL)应运而生. 图作为一种表示事物之间联系的自然数据结构, 目前在零样本学习中受到了越来越多的关注. 本文对零样本图学习方法进行了系统综述. 首先概述了零样本学习和图学习的定义, 并总结了零样本学习现有的解决方案思想. 然后依据图的不同利用方式对目前零样本图学习的方法体系进行了分类. 接下来讨论了零样本图学习所涉及到的评估准则和数据集. 最后指明了零样本图学习进一步研究中需要解决的问题以及未来可能的发展方向.
    2012,21(3):260-264, DOI:
    [摘要] (6600) [HTML] () [PDF 336300] (45765)
    摘要:
    开放平台的核心问题是用户验证和授权问题,OAuth 是目前国际通用的授权方式,它的特点是不需要用户在第三方应用输入用户名及密码,就可以申请访问该用户的受保护资源。OAuth 最新版本是OAuth2.0,其认证与授权的流程更简单、更安全。研究了OAuth2.0 的工作原理,分析了刷新访问令牌的工作流程,并给出了OAuth2.0 服务器端的设计方案和具体的应用实例。
    2007,16(9):22-25, DOI:
    [摘要] (6548) [HTML] (0) [PDF ] (7684)
    摘要:
    本文结合物流遗留系统的实际安全状态,分析了面向对象的编程思想在横切关注点和核心关注点处理上的不足,指出面向方面的编程思想解决方案对系统进行分离关注点处理的优势,并对面向方面的编程的一种具体实现AspectJ进行分析,提出了一种依据AspectJ对遗留物流系统进行IC卡安全进化的方法.
    (), DOI:
    [摘要] (6489) [HTML] (19) [PDF ] (14)
    摘要:
    2011,20(7):184-187,120, DOI:
    [摘要] (6448) [HTML] () [PDF 731903] (34494)
    摘要:
    针对智能家居、环境监测等的实际要求,设计了一种远距离通讯的无线传感器节点。该系统采用集射频与控制器于一体的第二代片上系统CC2530 为核心模块,外接CC2591 射频前端功放模块;软件上基于ZigBee2006 协议栈,在ZStack 通用模块基础上实现应用层各项功能。介绍了基于ZigBee 协议构建无线数据采集网络,给出了传感器节点、协调器节点的硬件设计原理图及软件流程图。实验证明节点性能良好、通讯可靠,通讯距离较TI 第一代产品有明显增大。
    2019,28(6):1-12, DOI: 10.15888/j.cnki.csa.006915
    [摘要] (6157) [HTML] (19676) [PDF 672566] (27048)
    摘要:
    知识图谱是以图的形式表现客观世界中的概念和实体及其之间关系的知识库,是语义搜索、智能问答、决策支持等智能服务的基础技术之一.目前,知识图谱的内涵还不够清晰;且因建档不全,已有知识图谱的使用率和重用率不高.为此,本文给出知识图谱的定义,辨析其与本体等相关概念的关系.本体是知识图谱的模式层和逻辑基础,知识图谱是本体的实例化;本体研究成果可以作为知识图谱研究的基础,促进知识图谱的更快发展和更广应用.本文罗列分析了国内外已有的主要通用知识图谱和行业知识图谱及其构建、存储及检索方法,以提高其使用率和重用率.最后指出知识图谱未来的研究方向.
    2004,13(10):7-9, DOI:
    [摘要] (6091) [HTML] (0) [PDF ] (12747)
    摘要:
    本文介绍了车辆监控系统的组成,研究了如何应用Rockwell GPS OEM板和WISMOQUIKQ2406B模块进行移动单元的软硬件设计,以及监控中心 GIS软件的设计.重点介绍嵌入TCP/IP协议处理的Q2406B模块如何通过AT指令接入Internet以及如何和监控中心传输TCP数据.
    2008,17(1):113-116, DOI:
    [摘要] (6030) [HTML] (0) [PDF ] (50833)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(8):87-89, DOI:
    [摘要] (5955) [HTML] (0) [PDF ] (42778)
    摘要:
    随着面向对象软件开发技术的广泛应用和软件测试自动化的要求,基于模型的软件测试逐渐得到了软件开发人员和软件测试人员的认可和接受。基于模型的软件测试是软件编码阶段的主要测试方法之一,具有测试效率高、排除逻辑复杂故障测试效果好等特点。但是误报、漏报和故障机理有待进一步研究。对主要的测试模型进行了分析和分类,同时,对故障密度等参数进行了初步的分析;最后,提出了一种基于模型的软件测试流程。
    2008,17(8):2-5, DOI:
    [摘要] (5822) [HTML] (0) [PDF ] (33488)
    摘要:
    本文介绍了一个企业信息门户中单点登录系统的设计与实现。系统实现了一个基于Java EE架构的结合凭证加密和Web Services的单点登录系统,对门户用户进行统一认证和访问控制。论文详细阐述了该系统的总体结构、设计思想、工作原理和具体实现方案,目前系统已在部分省市的广电行业信息门户平台中得到了良好的应用。
    2004,13(8):58-59, DOI:
    [摘要] (5781) [HTML] (0) [PDF ] (29010)
    摘要:
    本文介绍了Visual C++6.0在对话框的多个文本框之间,通过回车键转移焦点的几种方法,并提出了一个改进方法.
    2009,18(5):182-185, DOI:
    [摘要] (5745) [HTML] (0) [PDF ] (35402)
    摘要:
    DICOM 是医学图像存储和传输的国际标准,DCMTK 是免费开源的针对DICOM 标准的开发包。解读DICOM 文件格式并解决DICOM 医学图像显示问题是医学图像处理的基础,对医学影像技术的研究具有重要意义。解读了DICOM 文件格式并介绍了调窗处理的原理,利用VC++和DCMTK 实现医学图像显示和调窗功能。
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2007,16(10):48-51, DOI:
    [摘要] (4884) [HTML] (0) [PDF 0.00 Byte] (89588)
    摘要:
    论文对HDF数据格式和函数库进行研究,重点以栅格图像为例,详细论述如何利用VC++.net和VC#.net对光栅数据进行读取与处理,然后根据所得到的象素矩阵用描点法显示图像.论文是以国家气象中心开发Micaps3.0(气象信息综合分析处理系统)的课题研究为背景的.
    2002,11(12):67-68, DOI:
    [摘要] (4192) [HTML] (0) [PDF 0.00 Byte] (60494)
    摘要:
    本文介绍非实时操作系统Windows 2000下,利用VisualC++6.0开发实时数据采集的方法.所用到的数据采集卡是研华的PCL-818L.借助数据采集卡PCL-818L的DLLs中的API函数,提出三种实现高速实时数据采集的方法及优缺点.
    2008,17(1):113-116, DOI:
    [摘要] (6030) [HTML] (0) [PDF 0.00 Byte] (50833)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(5):122-126, DOI:
    [摘要] (8003) [HTML] (0) [PDF 0.00 Byte] (49381)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号