2025, 34(1):1-10. DOI: 10.15888/j.cnki.csa.009782 CSTR: 32024.14.csa.009782
摘要:提示词工程在解锁大语言模型潜能上具有重要作用. 该方法通过设计提示指令指导模型响应, 确保响应的相关性、连贯性和准确性. 提示工程无需微调模型参数, 可与下游任务无缝衔接. 因此, 各种提示词工程技术成为近年来研究的热点. 据此, 介绍了创建有效提示词的关键步骤, 总结了基础和高级提示词工程技术方法, 如思维链、思维树, 深入探讨了每种方法的优势和局限性. 同时, 讨论了如何从不同角度和不同方法评估提示方法的有效性. 这些技术的迅速发展使大语言模型在各种应用中取得了成功, 从教育、医疗到代码生成等. 最后, 展望了提示词工程技术的未来研究方向.
2025, 34(1):11-25. DOI: 10.15888/j.cnki.csa.009709 CSTR: 32024.14.csa.009709
摘要:急性缺血性脑卒中是临床上最常见的卒中类型, 因其症状突发且治疗时间窗较短等特点, 成为全球导致残疾和死亡的重要因素之一. 随着人工智能领域的迅速发展, 深度学习技术在急性缺血性脑卒中的诊疗中展现出巨大的潜力. 深度学习模型能够快速高效地根据患者脑部图像对病灶进行分割与检测. 本文介绍深度学习模型的发展历程和用于脑卒中研究的常用公开数据集. 针对计算机断层扫描(computerized tomography, CT)和磁共振成像(magnetic resonance imaging, MRI)衍生出的多种模态和扫描序列, 详细阐述了深度学习技术在急性缺血性脑卒中病灶分割与检测领域的研究进展, 总结并分析了相关研究的改进思路. 最后, 指出了深度学习在该领域现存的挑战并提出了可能的解决方案.
2025, 34(1):26-36. DOI: 10.15888/j.cnki.csa.009733 CSTR: 32024.14.csa.009733
摘要:微观剩余油赋存形态分类识别研究在剩余油开采领域发挥着至关重要的作用, 其对油田提高采收率具有重要的意义. 近年来, 该领域的大量研究通过引入深度学习方法来推动微观剩余油识别技术的发展, 但深度学习技术在微观剩余油识别领域尚未形成一个较为统一的框架, 也没有一个规范化的操作流程. 为了给今后的研究人员提供指导, 对目前的剩余油识别方法进行梳理, 从图像采集及类别划分标准、图像处理、剩余油识别方法等方面介绍了基于机器视觉的微观剩余油识别技术. 将剩余油识别方法分为基于传统和基于深度学习的识别方法, 传统识别方法分为基于人工特征提取和基于机器学习分类, 基于深度学习的识别方法划分为单阶段和两阶段方法, 并对其中数据增强、预训练、图像分割和图像分类方面进行详细归纳. 最后, 讨论了将深度学习应用于微观剩余油识别领域面临的挑战, 并对未来的发展趋势进行了展望.
2025, 34(1):37-46. DOI: 10.15888/j.cnki.csa.009742 CSTR: 32024.14.csa.009742
摘要:具身智能(embodied AI)需要能够与环境进行互动和感知, 并具备自主规划、决策和行动等能力. 行为树(BT)由于其模块化和高效控制的特性, 已经成为机器人技术中广泛使用的方法. 然而, 现有的行为树生成技术在处理复杂任务时仍面临一定的挑战. 这些方法通常依赖于领域专业知识, 生成行为树的能力有限. 此外, 许多现有方法在语言理解方面存在不足, 或者在理论上无法保证行为树的成功, 从而导致在机器人上的实际部署难度较大. 本研究提出一种新的行为树自动生成方法, 该方法基于大语言模型(LLM)和场景语义感知, 生成包含任务目标的初始行为树. 本文的方法根据机器人的能力设计机器人动作原语和相关条件节点, 并以此设计提示(prompt)使LLM输出行为规划(generated plan), 然后将行为规划转化为初始行为树. 虽然本文以此为示例, 但该方法具有广泛的适用性, 可以根据不同需求应用于其他类型的机器人任务. 同时, 本文将这种方法应用于机器人任务中, 并给出具体实现方法和示例. 在机器人执行任务过程中, 行为树可以根据机器人操作失误和环境变化动态更新, 对外部环境变化具有一定的鲁棒性. 本文进行了初始行为树生成验证实验, 并在仿真机器人环境中进行了验证, 展示了本文方法的有效性.
2025, 34(1):47-57. DOI: 10.15888/j.cnki.csa.009760 CSTR: 32024.14.csa.009760
摘要:由于人体器官的不规则形变, 可变形三维医学图像配准仍然是医学图像处理中的难题. 针对该问题, 本文提出了一种基于Transformer的多尺度可变形三维医学图像配准方法. 该方法首先采用多尺度策略来实现多层次的连接, 以捕捉不同层次的信息. 通过自注意力机制提取全局特征, 并利用膨胀卷积捕获更广泛的上下文信息和更细节的局部特征, 从而增强配准网络对全局和局部特征的融合能力. 其次, 本文根据图像梯度的稀疏性先验, 引入了归一化总梯度作为损失函数, 有效减少了噪声和伪影对配准过程的干扰, 更好地适应不同模态的医学图像. 在公开的脑MRI数据集(OASIS和LPBA)上评估本文所提方法的性能. 综合结果表明, 该方法不仅能保持基于学习的方法在运行时间上的优势, 还在均方误差和结构相似性等指标上表现出较高的性能. 此外, 消融实验的结果进一步证明了本文所提方法和归一化总梯度损失函数设计的有效性.
2025, 34(1):58-68. DOI: 10.15888/j.cnki.csa.009722 CSTR: 32024.14.csa.009722
摘要:在当前的电力市场中, 现货日清数据量已达百万或千万级. 随着交易活动的增加和市场结构的复杂化, 确保交易数据的完整性、透明性和可追溯性是我国现阶段市场清算领域待研究的关键问题. 为此, 研究提出了一种基于PROV模型和智能合约的电力市场清算数据溯源方法, 旨在通过智能合约自动化存储及更新溯源信息, 从而提高清算过程的透明度和参与方信任. 本方法利用PROV模型中的实体、活动和代理等元素, 结合区块链技术的可层次存储及不可篡改性, 记录和追踪电力市场中的交易活动和规则变更. 本方法不仅增强了数据的透明度和市场参与方的信任度, 也优化了数据管理和存储策略, 降低了操作成本. 此外, 本方法为电力市场清算提供了合规性证明, 帮助市场参与方满足日益增长的法规要求.
2025, 34(1):69-79. DOI: 10.15888/j.cnki.csa.009744 CSTR: 32024.14.csa.009744
摘要:在视觉跟踪领域, 大多数基于深度学习的跟踪器过分地强调精度, 而忽视了算法速度. 因此, 这些算法在移动平台上的部署(无人机), 受到了阻碍. 在本文中, 提出了一种基于Siamese的深度交叉指导跟踪器(SiamDCG). 为了更好地在边缘计算设备上部署, 在MobileNetV3-small的基础上设计了独特的backbone结构. 此外, 针对无人机场景的复杂性, 传统使用狄拉克 δ分布预测目标框的方式有很大的弊端, 为了克服边界框存在的模糊效应, SiamDCG将回归框分支转为预测偏移量的分布, 并且用学习到的分布去指导分类的准确性. 在多个无人机benchmark上的优秀表现, 都显示了其鲁棒性与高效性. 在Intel i5 12代CPU上, SiamDCG运行速度是SiamRPN++的167倍, 使用的参数仅为它的1/98, FLOPs是1/410 .
2025, 34(1):80-89. DOI: 10.15888/j.cnki.csa.009725 CSTR: 32024.14.csa.009725
摘要:针对现有消防机器人在城区内中远程环境执行火灾救援应急任务时, 难以提前获取全局先验地图, 需人工遥控机器人至灭火地点, 操作繁琐, 影响灭火效率的问题, 设计了一种消防机器人城区内自主导航系统, 系统基于商业电子地图(如高德地图、百度地图等2D电子地图), 有效整合了全球定位系统(GNSS)和局部激光环境感知技术. 首先借助商业电子地图来规划粗略的全局子目标点, 将全局目标点序列与真实定位信息进行数据配准, 然后将序列发送至局部规划器. 之后在激光感知建立的局部栅格地图中, 按照子目标点的顺序执行局部规划任务, 改进型局部规划器在运动过程根据实时环境变化更新子目标点. 在仿真环境中多次模拟并使用履带式小车在实际场景进行验证, 结果表明设计系统可以在事先未建立环境先验地图的情况下, 准确进行室外远距离的导航任务, 可作为消防机器人高效安全户外导航的方案.
2025, 34(1):90-99. DOI: 10.15888/j.cnki.csa.009740 CSTR: 32024.14.csa.009740
摘要:城市街道场景实例分割算法可以显著提升城市环境感知和智能交通系统的准确性与效率, 针对城市街景行人和车辆之间相互遮挡和背景干扰严重等问题, 提出一种基于频率注意力机制和多尺度特征融合的实例分割模型FMInst. 首先, 构建一种高低频注意力机制进行交互编码从而增加高分辨率细节信息. 其次, 在Swin Transformer主干网络的Patch Merging层引入软池化操作, 减少特征信息损失, 有效提高小尺度目标分割结果. 最后, 结合MLP层构建多尺度的深度卷积, 有效增强目标局部信息提取, 提升实例分割精度. 在Cityscapes公共数据集进行对比实验, 结果表明FMInst的mAP提高1.2%, 达35.6%, 同时AP50提高2.2%, 达61.4%, 极大地改善实例分割的掩码质量和分割效果.
2025, 34(1):100-109. DOI: 10.15888/j.cnki.csa.009759 CSTR: 32024.14.csa.009759
摘要:本文提出了一种基于半监督学习和条件概率的膝关节软骨分割方法, 旨在解决医学图像分割中标注样本数量不足和质量差的问题. 现有的标签树嵌入深度学习模型难以对网络输出间的层次关系进行有效建模, 而本文提出了一种条件到无条件的混合训练与任务级一致性结合的方法, 有效地利用了标签之间的层次关系和相似性, 提高了分割精度. 具体来说, 本文使用一个联合预测像素级分割图和目标的几何感知水平集表示的双任务深度网络. 通过可微分的任务变换层, 将水平集表示转换为近似的分割映射. 同时, 本文在标签和未标记数据上引入了基于水平线的分割映射与直接预测的分割映射之间的任务级一致性正则化. 在两个公共数据集上的大量实验表明, 本文的方法可以通过包含未标记的数据来显著提高性能.
2025, 34(1):110-117. DOI: 10.15888/j.cnki.csa.009734 CSTR: 32024.14.csa.009734
摘要:该研究旨在深入探究在复杂多变的交通环境下交通标志与信号灯的联合检测问题, 分析并解决恶劣天气、低光照和图像背景干扰等不利因素对检测精度的影响. 为此, 采用了一种改进RT-DETR网络的策略. 基于资源有限的运行环境, 并为提高模型对于遮挡以及小目标的检测能力, 提出PE-ResNet (ResNet with PConv and efficient multi-scale attention)网络作为主干网络. 为了增强特征融合能力, 提出了NCFM (new cross-scale feature-fusion module)模块, 有助于更好地整合图像中的语义信息和细节信息, 对复杂场景的理解更为全面. 最后引入MPDIoU损失函数, 更精确地衡量目标框之间的位置关系. 改进后的网络相较于基线模型参数量降低了约14%. 在CCTSDB 2021数据集、S2TLD数据集以及自制的MTST (multi-scene traffic signs)数据集上, mAP50:95分别增加了1.9%、2.2%和3.7%. 实验结果表明, 改进之后的RT-DETR模型可以有效地改进复杂场景下目标检测精度.
2025, 34(1):118-127. DOI: 10.15888/j.cnki.csa.009723 CSTR: 32024.14.csa.009723
摘要:近年来, 随着深度学习技术的发展, 卷积神经网络(convolutional neural network, CNN)和Transformer在图像超分辨率(super-resolution, SR)领域取得了显著的进展. 但是, 对于图像全局特征的提取, 过去的方法大多采用的是堆叠单个算子重复计算来逐步扩大感受野的方式. 为了更好地利用全局信息, 提出了对局部、区域和全局特征进行显式建模. 具体来说, 通过通道注意增强卷积、基于划分窗口的Transformer和CNN的双分支并行架构、标准的Transformer和划分窗口的Transformer双分支并行架构, 以一种层次递进的方式对图像的局部信息、区域与局部信息、全局与区域信息进行提取和融合. 此外, 设计了一种层次特征融合方式来对CNN分支提取到的局部信息和划分窗口的Transformer提取到的区域信息进行特征融合. 大量的实验表明, 所提网络在轻量级SR领域实现了更好的结果. 例如, 在Manga109数据集的4倍放大实验中, 该网络的峰值信噪比(PSNR)相较于SwinIR提升了0. 51 dB.
2025, 34(1):128-136. DOI: 10.15888/j.cnki.csa.009724 CSTR: 32024.14.csa.009724
摘要:针对现有方法无法有效利用签到信息为用户提供更精准的位置推荐服务的问题, 提出一种基于双粒度序列融合的下一个兴趣点推荐模型. 首先, 该模型综合考虑了细粒度的时空序列信息和现实生活中天然存在的粗粒度类别序列信息, 并通过门控循环单元有效捕捉长期依赖关系, 从而丰富签到上下文信息. 然后, 利用提取到的信息将固定划分签到长序列的“硬”划分方式转变为能有效提取完整局部子序列语义信息的“软”划分方式. 最后, 通过对各局部子序列的显著信息进行聚合来构建推荐模型. 提出的模型在Foursquare数据集上召回率、归一化折损累计增益分别平均提升9.07%、9.72%, 在Gowalla数据集上分别平均提升9.37%、10.24%, 实验结果表明该模型具有更优的推荐性能.
2025, 34(1):137-144. DOI: 10.15888/j.cnki.csa.009730 CSTR: 32024.14.csa.009730
摘要:骶髂关节病变是预警强直性脊柱炎的主要体征之一, 精确高效的骶髂关节自动分割对于协助医生临床诊断和治疗至关重要. 针对骶髂关节灰度多变、背景复杂、且因骶髂间隙狭小而存在容积效应导致的特征提取受限, 分割精度难以提升的问题, 本研究利用层次级联补偿下采样信息丢失以及注意力并行保留跨维信息特征的思想, 提出首个用于骶髂关节分割诊断的U型网络. 此外, 为了提高临床诊断的效率, 将U型网络中传统的卷积替换为高效部分卷积块. 本实验在山西白求恩医院提供的骶髂关节CT数据集中, 验证了分割精度及效率平衡方面的有效性, 最终DICE达到91.52%, IoU达到84.41%. 实验结果表明, 改进的U型分割网络能有效提高骶髂关节分割精度, 减轻医疗专业人员的负担.
2025, 34(1):145-152. DOI: 10.15888/j.cnki.csa.009754 CSTR: 32024.14.csa.009754
摘要:考虑到软件需求文本区别于其他普通文本的独特领域信息外, 还包含一些重要的上下文关系以及固有的二义性问题, 本文提出了一个图卷积与BERT融合的软件需求自动分类模型——BERT-FGCN (BERT-FusionGCN), 将图卷积网络(GCN)用于软件需求分类领域, 利用GCN对邻居节点信息进行信息传播和特征聚合的优势, 捕捉需求语句中单词或句子之间的上下文关系, 以进一步提高需求分类的结果. 首先构建需求文本的文本共现图和依存句法图, 将两种图进行融合来捕获句子的结构信息, 利用GCN对建模后的需求语句的图结构进行卷积得到图向量, 最后将图向量与BERT特征提取后得到的向量进行融合, 以此来对软件需求文本自动分类. 在PROMISE数据集上进行实验, BERT-FGCN在二分类上的F1分数达到95%, 多分类任务的F1分数提高2%.
2025, 34(1):153-160. DOI: 10.15888/j.cnki.csa.009741 CSTR: 32024.14.csa.009741
摘要:由图像到文本的跨模态行人重识别中缩小模态间差异一直是一个主要挑战, 针对该问题, 研究了一种基于CLIP-ReID (contrastive language-image pretraining-person re-identification)的改进方法. 引入了上下文调整网络模块和跨模态注意力机制模块. 上下文调整网络模块对图像特征进行深层次的非线性转换, 并有效地与可学习上下文向量相结合, 增强图像和文本间的语义关联性. 跨模态注意力机制模块通过对图像和文本特征进行动态加权和融合, 使得模型能够在处理一个模态的信息时考虑到另一模态, 提升模型在不同模态间的交互. 该方法分别在MSMT17、Market1501、DukeMTMC公共数据集上进行了评估, 实验结果在mAP值上分别提升了2.2%、0.5%、0.4%; 在R1值上分别提升了1.1%、0.1%、1.2%. 结果表明所提方法有效地提升了行人重识别的精度.
2025, 34(1):161-170. DOI: 10.15888/j.cnki.csa.009736 CSTR: 32024.14.csa.009736
摘要:由于大气雾和气溶胶的存在, 图像能见度显著下降且色彩失真, 给高级图像识别带来极大困难. 现有的图像去雾算法常存在过度增强、细节丢失和去雾不充分等问题. 针对过度增强和去雾不充分的问题, 本文提出了一种基于频率和注意力机制的图像去雾算法(frequency and attention mechanism of the image dehazing network, FANet). 该算法采用编码器-解码器结构, 通过构建双分支频率提取模块获取全局和局部的高低频信息. 构建频率融合模块调整高低频信息的权重占比, 并在下采样过程中引入附加通道-像素模块和通道-像素注意力模块, 以优化去雾效果. 实验结果显示, FANet在SOTS-indoor数据集上的PSNR和SSIM分别为40.07 dB和0.9958, 在SOTS-outdoor数据集上分别为39.77 dB和0.9958. 同时, 该算法也在HSTS和Haze4k测试集上取得了不错的结果, 与其他去雾算法相比有效缓解了颜色失真和去雾不彻底等问题.
2025, 34(1):171-178. DOI: 10.15888/j.cnki.csa.009719 CSTR: 32024.14.csa.009719
摘要:知识蒸馏(KD)中的温度在以前的大多数工作中被设置为蒸馏过程的固定值. 然而, 重新研究温度时, 发现固定的温度限制了对每个样本中固有知识的利用. 本文根据能量得分将数据集分为低能量样本和高能量样本, 通过实验证实了低能量样本的置信度得分高, 表明其预测是确定的, 而高能量样本的置信度得分低, 意味着预测是不确定的. 为了通过调整非目标类预测来提取最佳的知识, 本文对低能量样本应用较高的温度以创建更平滑的分布, 并对高能量样本应用较低的温度以获得更清晰的分布. 此外, 为解决学生对突出特征的不平衡依赖和对暗知识的疏忽, 本文引入熵重加权的知识蒸馏, 这是利用教师预测中的熵在样本基础上重新加权能量蒸馏损失的方法. 本文方法可以很容易地应用于其他基于逻辑的知识蒸馏方法中, 并获得更好的性能, 可以更接近甚至优于基于特征的方法. 本文在图像分类数据集(CIFAR-100、ImageNet)上进行了广泛的实验, 证明了该方法的有效性.
2025, 34(1):179-189. DOI: 10.15888/j.cnki.csa.009737 CSTR: 32024.14.csa.009737
摘要:针对道路损伤检测面临的多尺度目标、复杂的目标结构、样本分布不均及难易样本对边界框回归的影响等问题, 本研究提出了一种基于改进YOLOv8的道路损伤检测算法. 该方法通过引入动态蛇形卷积 (dynamic snake convolution, DSConv) 替代原有C2f (faster implementation of CSP bottleneck with 2 convolutions) 模块中的部分Conv, 以自适应聚焦于细小而曲折的局部特征, 增强对几何结构的感知. 在每个检测头前引入高效多尺度注意力 (efficient multi-scale attention, EMA) 模块, 实现跨维度交互, 捕获像素级别关系, 提升对复杂全局特征的泛化能力. 同时, 增设小目标检测层以提高小目标检测精度. 最后, 提出Flex-PIoUv2策略, 通过线性区间映射和尺寸适应性惩罚因子, 有效缓解样本分布不均和锚框膨胀问题. 实验结果表明, 该改进模型在RDD2022数据集上的F1分数、平均精度均值 (mAP50、mAP50-95) 分别提高了1.5百分点、2.1百分点和1.2百分点. 此外, 在GRDDC2020和China road damage数据集上的验证结果显示, 该算法具有良好的泛化性.
2025, 34(1):190-199. DOI: 10.15888/j.cnki.csa.009721 CSTR: 32024.14.csa.009721
摘要:针对现有的小样本关系三元组抽取方法难以解决单句话中存在多个三元组以及未考虑支持集和查询集之间语义相似性等问题, 提出了一种基于模块转移和语义相似性推断的小样本关系三元组抽取方法. 该方法采用一种在关系抽取、实体识别和三元组判别这3个模块不断转移的机制, 高效地提取出查询实例中存在的多个关系三元组. 在关系抽取部分, 将BiLSTM和注意力机制相融合, 以更好地捕捉应急预案文本的序列信息. 此外, 在实体识别部分设计了一种基于语义相似性推断的方法识别句子中存在的应急组织机构实体. 最终, 在应急预案领域数据集ERPs+上进行了大量的实验. 实验结果显示, 相较于其他基线模型, 所提模型更适应于应急预案领域的关系三元组抽取任务.
2025, 34(1):200-210. DOI: 10.15888/j.cnki.csa.009749 CSTR: 32024.14.csa.009749
摘要:针对自然果园环境下苹果果实的识别, 本文提出了一种改进YOLOv8n模型的轻量化苹果检测算法. 首先, 通过使用DSConv和FEM特征提取模块的组合来替换主干网络中的部分常规卷积进行轻量化改进, 缩减卷积过程中的浮点数和计算量; 为了在轻量化过程中保持性能, 在特征处理的过程中, 引入结构化状态空间模型构建CBAMamba模块, 使用Mamba结构高效处理特征; 此后将检测头处的卷积替换为RepConv, 并减小卷积层; 最后, 更改边界框损失函数为动态非单调聚焦机制WIoU, 提高模型收敛速度, 进一步提升模型检测性能. 实验表明, 在公开数据集上, 本文提出的 YOLOv8改进算法比原始YOLOv8n算法分别提升1.6%的mAP@0.5和1.2%的mAP@0.5:0.95, 与此同时提升了8.0%的FPS并降低了13.3%的模型参数量, 轻量化的设计使之在机器人和嵌入式系统部署领域具有较强的实用性.
2025, 34(1):211-222. DOI: 10.15888/j.cnki.csa.009729 CSTR: 32024.14.csa.009729
摘要:卷烟激光喷码识别是烟草稽查工作的重要手段. 本文提出一种基于双态非对称网络的烟码识别方法, 针对畸变烟码训练样本不足导致模型泛化能力弱的问题, 设计非线性局部增强方法(nonlinear local augmentation, NLA), 通过在烟码图像边缘设置可控基准点进行空间变换, 生成有效畸变训练样本以增强模型泛化能力; 针对烟码与背景图案特征相似导致识别精度低的问题, 提出双态非对称网络(dual-state asymmetric network, DSANet), 将CRNN的卷积层划分为训练模式和部署模式, 训练模式通过引入非对称卷积优化特征权重分布, 增强模型关键特征提取能力; 为保证实时性, 部署模式设计BN融合和分支融合方法, 通过计算融合权重并初始化卷积核, 将卷积层等效转换回原始网络结构, 降低用户端推理时间; 最后, 在循环层中引入自注意力机制, 通过动态调整序列特征权重, 进一步加强模型对烟码特征的提取能力. 通过对比实验, 该方法具有更高的识别精度和速度, 其识别精度达到87.34%.
2025, 34(1):223-235. DOI: 10.15888/j.cnki.csa.009750 CSTR: 32024.14.csa.009750
摘要:针对实际运行机械设备信号易受噪声干扰导致故障特征难以准确提取, 以及设备单一位置信息无法全面反映运行状态的问题, 本研究提出了一种改进的信号自适应分解与多源数据融合的时空故障分类方法. 首先, 提出了一种改进的信号自适应分解算法SAVMD (signal adaptive variational mode decomposition), 并构建加权峭度稀疏度指标WKS (weighted kurtosis sparsity)筛选出富含特征信息的IMF (intrinsic mode function)分量, 以实现信号重构. 其次, 将不同位置传感器的多源数据进行融合, 并以周期性采样得到的数据集作为模型的输入. 最后, 构建了一个时空故障分类模型来处理多源数据, 通过改进的稀疏自注意力机制降低噪声干扰, 并利用双编码器机制实现对时间步长和空间通道信息的有效处理. 在3个公开的机械设备故障数据集上进行实验, 平均准确率分别达到了99.1%、98.5%和99.4%. 与其他故障分类方法相比表现更好, 具有良好的自适应性和鲁棒性, 为机械设备的故障诊断提供了一种可行的方法.
2025, 34(1):236-247. DOI: 10.15888/j.cnki.csa.009735 CSTR: 32024.14.csa.009735
摘要:针对网约车运营中经济、环境和社会效益这3方面存在的相互制衡关系, 提出了一种平衡经济、环境和社会效益三重底线的多目标调度问题模型以及基于动态解空间规划的求解算法. 问题模型首次将传统出租车服务与共享出行模式整合, 全面覆盖4种不同的司机与乘客互动情景, 旨在通过优化策略实现3方面效益的协同提升. 求解算法创新性地结合了LAPJV算法与分支限界法, 确保在给定阈值约束下, 能够高效探索并确定满足多目标优化的最优匹配策略. 该算法相比于SCIP, 结果平均误差在4%内, 求解平均速度提升了99.1%. 研究进一步通过系统性地应用此算法, 针对不同阈值约束条件, 求解并生成帕累托前沿图, 直观展示了经济、环境与社会效益这3个目标在其他两项指标约束下的权衡与变化趋势, 为网约车运营提供了决策参考依据.
2025, 34(1):248-257. DOI: 10.15888/j.cnki.csa.009686 CSTR: 32024.14.csa.009686
摘要:传统的目标检测算法存在检测效果不佳及检测效率低等问题, 针对这些问题, 提出了一种基于YOLOv7网络改进的小目标检测方法. 该方法在原网络的高效层聚合模块(efficient layer aggregation network, ELAN)中添加了更多路径, 且将不同路径中的特征信息有效融合后引入SKNet网络, 使得模型更加关注网络中不同尺度大小的特征, 提取出更多有效信息; 同时为了加强小目标对空间信息的感知能力, 设计了一个eSE模块连接在ELAN末端, 以此构建新的高效层聚合网络模块(enhanced features efficient layer aggregation network, EF-ELAN), 该模块完整地保留了图像特征信息, 提高了网络的泛化能力. 同时设计了一种CS-ASFF (cross stage-adaptively spatial feature fusion)模块来应对小目标检测出现的特征尺度不一致问题, 该模块基于 ASFF网络和Nest连接方式进行改进, 对特征金字塔的每一张图片进行卷积、池化等操作提取权重, 将特征信息作用在某一层上, 同时利用其余特征层来加强网络的特征处理能力. 实验结果表明, 本文提出的算法在DIOR数据集和DOTA数据集上的平均精准率分别提高了1.5%、2.1%, 实验结果验证了所提出的算法能够有效地提升小目标的检测效果.
2025, 34(1):258-266. DOI: 10.15888/j.cnki.csa.009700 CSTR: 32024.14.csa.009700
摘要:随着智能物联网的快速发展及运用, 其对网络的使用寿命、可靠性及覆盖范围提出了新的挑战. 目前的无线传感器网络(wireless sensor network, WSN)是由大量部署在监测区域内的自组织型传感器节点组成, 其具备低成本、节能、自组织和大规模部署等优势. 然而, 如何在此基础上进一步延长网络寿命, 提高WSN的覆盖可靠性, 是当前研究面临的主要挑战. 为此, 将骨干网络与覆盖模型、传感器节点协同感知和空间相关性结合, 提出了一种覆盖可靠性评估模型. 在此基础上, 提出了一种基于可信信息覆盖的覆盖可靠性优化算法, 一方面, 利用可信信息覆盖模型保证数据的协同感知, 增强网络服务质量, 另一方面, 采用骨干网络优化路由, 节省能量消耗. 进一步地, 为验证所提算法的优越性, 以传感器多状态、覆盖率为评价指标, 以RMSE阈值和能耗为性能指标, 将所提算法与ACR和CICR算法进行对比. 最后, 在Matlab仿真软件上搭建了验证模型, 仿真结果表明, 所提算法能显著提高覆盖可靠性.
2025, 34(1):267-275. DOI: 10.15888/j.cnki.csa.009738 CSTR: 32024.14.csa.009738
摘要:针对现有大气能见度检测方法易受主观因素和设备复杂度影响的问题, 提出一种新型的图像处理估算的能见度算法. 首先结合暗通道先验理论, 提出一种基于图像亮度与饱和度差值的全局大气光值估计方法, 进一步求解大气透射率; 然后采用曲率滤波对透射率进行细化处理; 接着, 通过车道线检测技术和消光系数计算得出大气能见度估算值; 最后, 建立一个基于线性回归方程的能见度修正模型对大气能见度的估算值进行修正. 实验结果验证了所提算法在雾霾天气下对交通监控场景中的能见度估算具有准确性和实用性.
2025, 34(1):276-284. DOI: 10.15888/j.cnki.csa.009731 CSTR: 32024.14.csa.009731
摘要:大语言模型的兴起对自然语言处理领域产生了深远影响. 随着计算资源的增长和模型规模的扩大, 大语言模型在自然语言处理中的应用潜力日益显现. 然而, 广泛使用的低秩适应微调方法在面对模型规模增大时, 遇到了微调效率和存储成本等方面的挑战. 为了解决这一问题, 本文提出了一种基于奇异值分解的适应微调方法. 该方法只需将奇异值分解得到的对角矩阵和缩放向量作为可训练参数, 从而在降低训练成本的同时, 实现了在多个自然语言处理任务上的性能提升. 实验结果显示, 基于奇异值分解的适应微调方法在GLUE和E2E基准测试中的性能超越了同等数量级的方法. 通过与常用的参数高效微调方法进行比较, 发现基于奇异值分解的适应微调方法在减少可训练参数数量和提高微调效率方面具有显著优势, 并在可训练参数微调效率实验中实现了最高的性能增益. 在未来的研究中, 将专注于进一步优化基于奇异值分解的适应微调方法, 在更广泛的任务和更大规模的模型中实现更高效的微调.
2025, 34(1):285-293. DOI: 10.15888/j.cnki.csa.009717 CSTR: 32024.14.csa.009717
摘要:时间序列分段线性表示算法利用时间序列的趋势变化特征, 用序列中较少点来表示整个时间序列. 但是大多算法主要关注局部序列点信息, 很少关注全局数据, 且部分算法只关注算法在数据集上的拟合, 很少应用到分类问题中. 针对上述问题, 本文提出了基于角度关键点和转向点的时间序列趋势特征提取算法, 首先, 该算法根据序列数据的角度变化值来选择角度显著点, 然后基于角度关键点的基础上再提取转向点, 根据分段的要求, 判断是否进行插值操作, 从而得到符合要求的分段点序列. 本文在模拟数据和40个公开数据集上进行拟合和分类实验, 实验结果表明, 本文算法相较于分段聚合近似PAA、自底向下TD、自顶向上BU、基于拐点FFTO、基于转折点和趋势段Trend、基于趋势转折点ITTP等算法, 在模拟数据集拟合效果更好; 在UCR公开数据集平均拟合误差为1.165; 分类准确性同Keogh团队公布的DTW-1NN算法高出2.8%.
2025, 34(1):294-307. DOI: 10.15888/j.cnki.csa.009703 CSTR: 32024.14.csa.009703
摘要:针对现有二进制模糊测试难以深入程序内部发现漏洞这一问题, 提出一种融合硬件程序追踪、静态分析和混合执行3种技术的多角度优化方案. 首先, 利用静态分析和硬件追踪评估程序路径复杂度及执行概率; 之后, 根据路径复杂度与执行概率进行种子选择和变异能量分配; 同时, 利用混合执行辅助种子生成并记录关键字节用于针对性变异. 实验结果表明, 相比现有模糊测试方案, 该方案在多数情况下能发现更多的程序路径和crash.