2024年第0卷第12期文章目次

2024, 33(12):1-15. DOI: 10.15888/j.cnki.csa.009708 CSTR: 32024.14.csa.009708

摘要 (94) HTML (30) PDF 1.79 M (745) 评论 (0) 收藏

摘要:皮肤癌是最常见和最致命的癌症类型之一, 患病数量在世界范围内急剧增加. 如果没有在早期阶段诊断出来, 它可能转移, 导致高死亡率. 结合近几年的相关文献就传统机器学习和深度学习两种学习方法在皮肤癌病变诊断中的应用作一系统综述, 为皮肤癌诊断的深入研究提供相应的参考价值, 首先对几个皮肤病公共可获取数据集进行整理, 其次分析和比较不同的学习算法在皮肤癌病变分类中的应用, 更好地了解它们在实际应用中的优势和局限性, 重点阐述在卷积神经网络领域的分类诊断. 在深入了解这些算法的基础上, 还将探讨它们在处理皮肤疾病时的性能差异、改进思路. 最终, 通过对当前挑战和未来发展方向的探讨, 将为进一步提升皮肤癌早期诊断系统的性能和可靠性提供有益的参考和建议.

多类型任务负载预测的负载均衡任务卸载

胡辉，沈艳

2024, 33(12):16-29. DOI: 10.15888/j.cnki.csa.009711 CSTR: 32024.14.csa.009711

摘要 (38) HTML (17) PDF 2.26 M (292) 评论 (0) 收藏

摘要:在移动边缘计算(mobile edge computing, MEC)背景下, 不合理的任务卸载策略和资源分配以及多类型任务数量急剧增加导致边缘服务器间的负载不均衡. 针对上述问题, 本文基于多用户多MEC的边缘环境, 提出一种面向多类型任务的负载预测以及均衡分配方案(load prediction and balanced assignment scheme for multi-type tasks, LBMT). 该方案包括划分任务类型、任务负载预测、任务自适应映射3个部分. 首先, 考虑任务类型的多样性设计了任务类型模型, 利用该模型划分任务类型. 其次, 考虑不同任务对服务器造成的负载具有差异性提出了任务负载预测模型, 并在此基础上采用改进KNN (K-nearest neighbor)算法用于预测任务负载. 然后, 综合考虑MEC服务器异构性、资源有限等因素, 结合MEC服务器负载均衡模型设计了任务分配模型, 并提出基于自适应任务映射算法用于任务分配. 最后, LBMT针对MEC服务器资源利用率和任务处理率进行优化, 得到最优负载均衡任务卸载策略. LBMT与基于改进的min-min卸载方案、基于中间节点的卸载方案、基于加权二分图的卸载等方案进行仿真实验对比, 实验结果表明LBMT在资源利用率上提高了12.5%以上, 任务处理率提高了20.3%以上, 并显著降低了负载均衡标准差值, 更有效地实现了服务器之间的负载均衡.

基于频率感知图像恢复的自监督肝部病灶检测

梁金鑫，李炜，唐郑熠，李佐勇

2024, 33(12):30-42. DOI: 10.15888/j.cnki.csa.009727 CSTR: 32024.14.csa.009727

摘要 (34) HTML (29) PDF 2.33 M (300) 评论 (0) 收藏

摘要:计算机断层扫描产生的肝部影像为医生进行肝部病灶区域发现提供了素材. 但肝部病灶的人工检测严重依赖于医生的专业技能, 且费时费力. 现有的肝部病灶区域检测算法对细微病灶的检测效果欠佳. 为此, 本文提出了一种基于频率感知图像恢复的自监督肝部病灶检测算法. 首先, 此算法设计了一个基于合成异常的自监督任务, 用于合成更加广泛且适宜的伪异常图像, 从而缓解算法模型训练时异常数据不足的问题. 其次, 为了抑制重建网络对合成肝部异常的敏感性, 设计了提取图像高频信息的模块, 通过从图像的高频成分中恢复图像, 以减轻重建网络对异常的不利泛化. 最后, 其采用权重衰减训练策略以训练分割子网络, 减少训练前期的琐碎解问题, 实现局部细微病灶的检测. 在真实公开数据集上进行的大量实验表明, 本文方法在肝部病灶检测任务中取得了领先的性能.

基于全局-个体特征融合的群体行为识别

程勇，程遥，王军，杨玲，许小龙，高园元，张开华

2024, 33(12):43-54. DOI: 10.15888/j.cnki.csa.009698 CSTR: 32024.14.csa.009698

摘要 (37) HTML (21) PDF 2.38 M (291) 评论 (0) 收藏

摘要:群体行为识别是计算机视觉领域中备受关注的研究方向之一, 旨在通过多个个体动作与互动关系确定整体的行为. 然而, 由于确定个体互动关系、联系紧密程度以及活动关键人物三者的困难, 现有方法常关注于人物的个体特征, 忽略了与活动场景上下文的相互联系. 针对该问题, 提出一个基于全局-个体特征融合的群体行为识别推理模型GIFFNet (global-individual feature fusion network). 通过构建全局-个体特征融合(GIFF)模块, GIFFNet在聚焦关键信息的基础上, 有效整合了场景上下文与个体人物特征, 获取了更具表征能力的融合特征, 以弥补预测群体行为时场景信息缺失的问题. 随后, GIFFNet利用融合特征计算场景中人物之间的交互关系图, 并使用图卷积网络(GCN)进行训练和群体行为类别预测. 此外, 为解决数据集样本失衡的问题, GIFFNet采用动态分配权重的策略优化损失函数. 实验结果表明, GIFFNet在Volleyball、Collective Activity数据集上的多类分类准确度分别为93.8%、96.1%, 类平均精确度分别为93.9%、95.8%, 优于其他现有的深度学习方法. GIFFNet通过特征融合为行为分类提供了表征能力更加强大的特征, 有效地提升了行为识别的精确度.

基于PFEC-Transformer的DNS隐蔽隧道检测

江魁，黄锐滨，邓昭蕊，伍波，朱思霖

2024, 33(12):55-66. DOI: 10.15888/j.cnki.csa.009691 CSTR: 32024.14.csa.009691

摘要 (41) HTML (25) PDF 1.59 M (279) 评论 (0) 收藏

摘要:DNS作为互联网基础设施, 很少受到防火墙的深度监控, 导致黑客和APT组织通过DNS隐蔽隧道来窃取数据或控制网络, 对网络安全造成严重威胁. 针对现有检测方案容易被攻击者绕过以及泛化能力较弱的问题, 本研究改进了DNS流量的表征方法, 并提出了PFEC-Transformer (pcap features extraction CNN-Transformer)模型. 该模型以表征后的十进制数值序列作为输入, 在经过CNN模块进行局部特征提取后, 再通过Transformer分析局部特征间的长距离依赖模式并进行分类. 研究采集了互联网流量以及各类DNS隐蔽隧道工具生成的数据包构建数据集, 并使用包含未知隧道工具流量的公开数据集进行泛化能力测试. 实验结果表明, 该模型在测试数据集上取得了高达99.97%的准确率, 在泛化测试集上也达到了92.12%的准确率, 有效地证明了其在检测未知DNS隐蔽隧道方面的优异性能.

具有标点区分纠错能力的中英盲文转换系统

李泽芃，罗远新，孙家宁，陈洪，郦铖

2024, 33(12):67-77. DOI: 10.15888/j.cnki.csa.009713 CSTR: 32024.14.csa.009713

摘要 (35) HTML (23) PDF 1.53 M (437) 评论 (0) 收藏

摘要:盲文转换技术可以推进盲人群体的信息无障碍化进程, 有着相当的重要性. 随着信息全球化发展, 盲人不可避免地接触到包含中英双语的信息. 现有中英盲文转换系统能较好完成中英文字符到盲文的转换, 但是对标点的转换效果不佳, 表现为对一符多用情况区分效果不好、未对中英标点混用情况进行纠错两方面. 若未能恰当处理一符多用及中英标点混用情况, 很可能会对盲人阅读造成影响甚至误解. 本文详细分析以上问题, 设计并实现一种具有标点区分和纠错能力的中英盲文转换系统. 基于BCC语料库构建测试语料, 对该系统开展一系列测试和评估. 实验结果表明, 与其他类型转换系统相比, 本系统能够结合语言类型和上下文结构, 有效区分标点转换中的一符多用情况, 并能纠正中英标点混用问题, 对我国信息无障碍化进程起到促进作用.

基于联邦学习的异常日志检测

连宇瀚，廖声扬，张坤三，邹维福，林楠

2024, 33(12):78-88. DOI: 10.15888/j.cnki.csa.009714 CSTR: 32024.14.csa.009714

摘要 (26) HTML (7) PDF 1.53 M (458) 评论 (0) 收藏

摘要:Hadoop系统作为大数据存储的分布式架构被广泛使用, 运行时生成大量日志数据来记录设备的异常情况, 这为定位和分析问题提供重要线索. 然而, 传统的日志异常检测模型通常在中心服务器上收集日志数据, 导致数据收集过程中存在敏感信息泄露的风险. 联邦学习作为一种新的机器学习范式, 通过在本地服务器上训练模型并仅在中心服务器上聚合模型参数, 有效解决了数据隐私问题. 本文提出了一种基于联邦学习的日志异常检测架构, 结合本地服务器和中心服务器进行检测任务, 避免了敏感信息在网络传输过程中的泄露风险. 此外, 本文采用树解析器实现日志模板标准化. 为了有效地捕获日志数据中的复杂模式和异常行为, 建立基于自注意力机制的BiLSTM模型作为本地服务器模型. 为了验证所提出方法的有效性, 本文使用公开的分布式系统架构数据集进行仿真实验. 结果表明, 该模型的综合评价指标稳定, 准确率保持在93%以上, 具有较高的适用性.

面向改装电动车的中小目标检测

黄峻，刘涌

2024, 33(12):89-96. DOI: 10.15888/j.cnki.csa.009597 CSTR: 32024.14.csa.009597

摘要 (28) HTML (7) PDF 2.84 M (244) 评论 (0) 收藏

摘要:由于电动车的普及, 越来越多的电动车进行非法改装雨棚. 然而, 这种改装行为会增加一些安全隐患. 首先, 挡雨板会遮挡骑行者视野, 增加事故的风险. 其次当速度过快时, 挡雨板也会在不经意间擦伤行人, 带来极大的安全隐患, 给交通安全带来了严重威胁. 本文提出了一种改进的YOLOv7-tiny算法, 用于电动车非法改装检测. 首先在网络的结构上加入BiFormer注意力机制, 不仅可以捕获更多电动车细节的信息, 而且可以使得模型更加关注一些较小的目标信息. 其次将改进的特征金字塔结构和特征融合网络的张量拼接操作进行结合, 提升对中小型目标的检测能力. 最后对框架的ELAN模块和SPPCSPC模块进行改进和优化, 可以在不增加过多参数量的同时, 提升对中小目标的检测精度, 增强提取特征的效果.

融合特征选择和交叉网络的增强推荐模型

师欣雨，林珊玲，刘珂，林坚普，吕珊红，林志贤，郭太良

2024, 33(12):97-105. DOI: 10.15888/j.cnki.csa.009706 CSTR: 32024.14.csa.009706

摘要 (20) HTML (10) PDF 1.88 M (227) 评论 (0) 收藏

摘要:针对目前大多数推荐模型在特征交互时, 存在忽视特征重要程度使得推荐模型准确率不高的问题, 为此本文提出融合特征选择和交叉网络的增强推荐模型. 该模型采用SENet网络在特征交互前过滤不重要的特征, 使其挖掘到更有价值的交互信息. 在此基础上, 进一步使用并行的交叉网络和深度神经网络, 以捕捉显式特征交互和隐式特征交互. 同时, 在交叉网络中引入低秩技术, 将权重向量改进为低秩矩阵, 在保证模型性能的同时, 降低模型的训练成本. 该模型在MovieLens-1M、Criteo数据集上与其他推荐模型进行了对比实验, 实验结果表明所提推荐模型在AUC指标上明显优于其他模型, 证明了所提推荐模型的有效性.

基于Conformer-SE的端到端语音识别

马永杰，李罡

2024, 33(12):106-114. DOI: 10.15888/j.cnki.csa.009718 CSTR: 32024.14.csa.009718

摘要 (19) HTML (7) PDF 1.80 M (196) 评论 (0) 收藏

摘要:基于自注意力机制的Transformer端到端模型在语音识别任务中表现出了卓越的性能. 然而, 该模型在浅层处理时对局部特征信息的捕捉能力存在一定的局限, 同时也没有充分考虑不同块之间的相互依赖性. 为了解决这些问题, 提出了一种改进的Conformer-SE端到端语音识别系统模型. 该模型首先采用了Conformer结构来替代Transformer中的编码器部分, 从而增强了模型对局部特征的提取能力. 接着, 通过引入SE注意力通道机制, 将每个块的输出以加权求和的形式整合到最终的输出中. 在Aishell-1这一公开数据集上的实验结果显示, 相较于原始的Transformer模型, Conformer-SE模型在字符错误率上相对降低了18.18%.

双注意力记忆多智能体强化学习

马裕博，周长东，张志文，杨培泽，张博

2024, 33(12):115-122. DOI: 10.15888/j.cnki.csa.009705 CSTR: 32024.14.csa.009705

摘要 (20) HTML (6) PDF 1.71 M (172) 评论 (0) 收藏

摘要:多智能体协同在强化学习研究领域占据重要地位, 旨在深入探讨智能体如何通过相互协作实现共同目标. 大部分协作多智能体算法注重合作的构建, 但忽略了个体策略的强化. 为解决上述问题, 本文提出一种BiTransformer记忆(BTM)在线强化学习模型, 该模型不仅考虑多智能体之间的协同, 还利用记忆模块辅助个体决策. BTM由双注意力编码器和双注意力解码器组成, 分别用于个体策略的增强和多智能体系统的协作. 在双注意力编码器中, 受人类的决策经验依赖的启发, 提出记忆注意力模块为当前决策提供历史决策经验. 与传统利用RNN的方法不同, BTM为每一个提供的是一个显式历史决策经验库, 而非隐藏单元. 此外, 提出融合注意力模块, 在历史决策经验的辅助下处理当下的局部观测信息, 从而获取环境中最具决策价值的信息, 进一步提高智能体个体的决策能力. 在双注意力解码器中, 本文提出了决策注意力模块和合作注意力模块两个模块, 通过综合考虑其他已经做出决策智能体与当前智能体的合作收益以及带有历史决策经验的局部观察, 从而促进历史决策辅助下的多智能体潜在合作的形成. 最终本文在星际争霸中的多个场景下对BTM进行了测试, 取得了93%的平均胜率.

深度残差频率自适应的DEM超分辨重建

李智杰，米德源，李昌华，张颉，董玮

2024, 33(12):123-130. DOI: 10.15888/j.cnki.csa.009692 CSTR: 32024.14.csa.009692

摘要 (24) HTML (6) PDF 2.87 M (202) 评论 (0) 收藏

摘要:目前超分辨率重建技术运用于诸多场景, 但对于数字高程模型(digital elevation model, DEM)的重建存在许多挑战, 针对无法充分利用DEM复杂地形特征导致的细节缺失和失真问题, 提出了深度残差频率自适应的DEM超分辨重建模型, 由多个高低频特征提取模块组成残差网络结构, 提升对DEM特征的整体感知能力, 并加入频率选择特征提取模块, 增强对复杂地形特征的识别和捕捉能力, 其次在模型中加入了空洞空间金字塔池化, 通过融合多尺度信息, 改善重建质量并充分保留地形特征的细节和结构, 最终在梯度域和高度域双重约束下完成超分辨率重建. 实验结果表明, 在以两种精度的陕西秦岭高程图作为实验数据下, 深度残差频率自适应DEM超分辨率模型相较于其他先进模型, 在各个指标上均取得了提升, 重建后的DEM细节更加丰富、纹理更加清晰.

基于改进RT-DETR的水下目标检测

张路，魏本昌，魏鸿奥，周龙刚

2024, 33(12):131-140. DOI: 10.15888/j.cnki.csa.009684 CSTR: 32024.14.csa.009684

摘要 (31) HTML (11) PDF 3.12 M (340) 评论 (0) 收藏

摘要:水下目标检测技术在海洋探测中具有重要的现实意义. 针对水下场景复杂, 以及存在遮挡重叠导致目标特征提取有限的问题, 提出了一种适用于水下目标检测的FERT-DETR网络. 该模型首先提出了一种特征提取模块Faster-EMA, 用于替换RT-DETR中ResNet18的BasicBlock, 能够在有效降低模型参数量和模型深度的同时, 显著提升对水下目标的特征提取能力; 其次在编码部分使用级联群体注意力模块AIFI-CGA, 减少多头注意力中的计算冗余, 提高注意力的多样性; 最后使用高水平筛选特征金字塔HS-FPN替换CCFM, 实现多层次融合, 提高检测的准确性和鲁棒性. 实验结果表明, 所提算法FERT-DETR在URPC2020数据集和DUO数据集上比RT-DETR检测准确率提高了3.1%和1.7%, 参数量压缩了14.7%, 计算量减少了9.2%, 能够有效改善水下复杂环境中不同尺寸目标漏检、误检的问题.

改进YOLOv8n-Pose的形变QR码校正与识别

刘云，邹复民，蔡祈钦，李俊清，钟继雄

2024, 33(12):141-152. DOI: 10.15888/j.cnki.csa.009715 CSTR: 32024.14.csa.009715

摘要 (20) HTML (10) PDF 5.50 M (270) 评论 (0) 收藏

摘要:针对 QR 码图像检测过程中因环境复杂性和拍摄角度变化等因素导致 QR 码读取率低的问题, 本文提出一种基于改进YOLOv8n-Pose的形变QR码校正与识别算法. 首先, 在主干网络引入高效通道注意力机制(efficient channel attention, ECA)模块, 该模块通过不降维的方式实现跨通道交互, 有效提升网络的特征提取能力和检测精度. 其次, 采用Slim-neck架构重构颈部网络, 减少模型的复杂度, 提高对不同尺度QR码的检测能力. 最后, 通过模型检测到的QR码角点, 结合逆透视变换对QR码进行校正, 并使用ZBar算法进行读取. 实验结果表明, 在公开的QR码数据集上, 改进的算法相比原算法, mAP50和mAP50-95分别提升1.6%和1.1%, 模型参数量和模型计算量分别降低6.5%和9.5%, 在CPU和GPU上检测速度分别提升0.3 f/s和0.7 f/s, 达到14.2 f/s和59.6 f/s, 能够高效地满足QR码角点检测需求. 此外, 在自制的形变QR 码数据集上, 基于改进YOLOv8n-Pose的QR码识别方法相比单独使用ZBar算法的QR 码识别方法, QR 码读取率提高23.66%, 达到87.41%. 该方法仅需拍摄一张照片就可识别所有货物的信息, 能够有效提高货物管理的效率.

基于多视图立体深度学习的堆叠工件三维重建

姬田杰，郑飂默，曹克让，王诗宇，周淞杰

2024, 33(12):153-160. DOI: 10.15888/j.cnki.csa.009710 CSTR: 32024.14.csa.009710

摘要 (24) HTML (9) PDF 2.10 M (313) 评论 (0) 收藏

摘要:随着工业自动化的不断发展, 工件的三维重建技术在制造业中扮演着越来越重要的角色. 在实际的工作环境下, 工件普遍存在堆叠问题, 对后续的机器人识别抓取等工作存在较大影响. 目前三维重建技术对于一些具有弱纹理区域的工件重建, 仍存在图像特征点提取难度大、特征配准精度低的问题. 针对以上问题, 本文提出了一种基于多视图立体匹配深度学习的堆叠工件三维重建方法. 首先, 输入多张不同视角的图像经过融合DCNv2的特征金字塔网络, 进行特征提取; 然后, 进行单应性变换构建代价体, 再使用方差聚合为一个统一的代价体; 接着在代价体正则化部分, 引入SE通道注意力机制模块来提高网络的特征表达能力, 增强模型的性能和泛化能力; 此方法在DTU (Danish Technical University)数据集上具有较好的表现, 并且运用该方法生成的堆叠工件点云模型对以后的工业自动化开展具有重要意义.

基于金字塔池化权值印记的训练后混合精度量化算法

张瑞轩，赵宇峰，徐飞，禹婷婷，张乐怡

2024, 33(12):161-169. DOI: 10.15888/j.cnki.csa.009720 CSTR: 32024.14.csa.009720

摘要 (17) HTML (9) PDF 1.43 M (150) 评论 (0) 收藏

摘要:模型量化方法现已广泛应用于深度神经网络模型快速推理和部署中. 由于训练后量化重新训练所需时间少, 性能损失小而备受研究人员关注, 但现有训练后量化方法在量化过程中大多以理论假设或是固定分配网络层的比特位宽, 导致量化后的网络会出现显著的性能损失, 尤其是在低位情况下. 为了提升训练后量化网络模型的精度, 本文提出一种训练后混合精度量化方法(MSQ), 该方法通过在网络模型每一层后插入一个融合了金字塔池化模块和权值印记技术的任务预测器模块, 来对网络每一层进行准确度估计, 从而评估每一层网络的重要性, 根据重要性评估来确定每一层的量化比特位宽. 实验表明, 本文所提出的MSQ算法在多个流行的网络架构上都优于现有的一些混合精度量化方法, 量化后的网络模型在边缘硬件设备上测试性能更好, 延迟更低.

基于YOLOv8和改进UNet++变电站指针式仪表读数识别

李春蕾，阮艺铭，张小明，王宏淼，王明杰

2024, 33(12):170-176. DOI: 10.15888/j.cnki.csa.009694 CSTR: 32024.14.csa.009694

摘要 (29) HTML (11) PDF 1.32 M (145) 评论 (0) 收藏

摘要:针对变电站仪表背景复杂、多旋转角度图像导致读数识别准确率低的问题, 提出一种基于YOLOv8和改进UNet++的指针式仪表读数识别方法. 采用YOLOv8模型检测仪表区域, 并利用透视变换进行旋转校正; 采用极化自注意力模块改进的UNet++算法分割表盘图像提取刻度、指针区域; 经过提取指针直线后, 采用角度法计算仪表读数. 实验结果表明: 提出方法识别仪表读数的平均引用误差为1.82%, 具有较高的识别准确性, 将其应用于变电站指针式仪表智能化巡检中具有一定的可行性.

基于标签噪声对比学习的肺癌淋巴结转移鉴别

祁婧，李子荣，刘秀婷，马露，陈俊豪

2024, 33(12):177-184. DOI: 10.15888/j.cnki.csa.009704 CSTR: 32024.14.csa.009704

摘要 (17) HTML (16) PDF 1.52 M (238) 评论 (0) 收藏

摘要:基于深度学习的人工智能诊断模型严重依赖于高质量地详尽注释数据进行算法训练, 但受到标签噪声信息的影响. 为了增强模型的鲁棒性并防止有噪声的标签记忆, 提出了一种标签噪声样本选择 (noise label sample selection, NLSS)模型来充分挖掘噪声样本的隐藏信息, 减轻模型过拟合问题. 首先, 通过将混合增强图像作为输入, 提取图像分布式特征表示; 其次, 引入对比损失函数以及比较样本预测标签分布与其真实标签分布的相似性来评估样本, 进行样本选择; 最后, 通过标签重分配模块的伪标签提升策略在样本选择的基础上重新纠正噪声标签的监督信息. 以非小细胞肺癌 (non-small cell lung cancer, NSCLC)患者的 PET/CT 数据集为例进行实验, 结果表明提出的模型均比对比模型有一定的提升, 可降低淋巴结转移状态诊断中标签噪声的干扰.

基于深度强化学习的四旋翼无人机抗扰控制

徐博洋，时宏伟

2024, 33(12):185-196. DOI: 10.15888/j.cnki.csa.009675 CSTR: 32024.14.csa.009675

摘要 (40) HTML (19) PDF 2.46 M (821) 评论 (0) 收藏

摘要:随着无人机应用需求不断拓展, 为了保证无人机能够按要求完成预定任务, 抗干扰控制器的设计受到了诸多关注. 目前广泛使用的传统控制算法稳定性较好但抗干扰能力较差. 针对上述问题, 提出了一种基于改进双延迟深度确定性策略梯度(TD3)算法的混合抗干扰控制器, 该方法使用非线性模型预测控制(NMPC)作为基础控制器, 并引入了一个基于改进TD3的干扰补偿器进行混合控制. 该方法结合了NMPC控制器的优点的同时解决了传统控制算法在抗干扰方面的不足. 本文将多头注意力机制(MA)以及长短期记忆网络(LSTM)引入TD3的Actor网络中, 提高了TD3对于空间管理信息以及时间关联信息的捕捉能力, 同时引入一种连续型对数奖励函数来提高训练稳定性和收敛速度, 并使用带随机干扰的随机任务场景进行训练以提高模型泛化性. 在实验中将NMPC-MALSTM-TD3架构与使用DDPG、SAC、TD3、PPO算法作为干扰补偿器的架构进行对比, 实验结果表明, NMPC-MALSTM-TD3架构的综合表现最好, 而且对NMPC的稳定性和实时性影响较小.

基于改进TD3算法的无人机轨迹规划

牟文心，时宏伟

2024, 33(12):197-209. DOI: 10.15888/j.cnki.csa.009687 CSTR: 32024.14.csa.009687

摘要 (47) HTML (10) PDF 2.76 M (246) 评论 (0) 收藏

摘要:深度强化学习算法在无人机的航迹规划任务中的应用越来越广泛, 但是许多研究没有考虑随机变化的复杂场景, 针对以上问题, 本文提出一种基于TD3改进的PP-CMNTD3算法, 提出了一种简单有效的先验策略并且借鉴人工势场的思想设计了密集奖励, 能够更好地引导无人机有效避开障碍物并且快速接近目标点. 仿真结果表明, 算法的改进可以有效提高网络的训练效率以及在复杂场景中的航迹规划表现, 同时能够在不同初始电量的情况下都能够灵活调整策略, 做到在能耗和迅速抵达目的地之间的有效平衡.

考虑骑手异质性的众包配送策略优化

王会静，袁鹏程

2024, 33(12):210-221. DOI: 10.15888/j.cnki.csa.009726 CSTR: 32024.14.csa.009726

摘要 (13) HTML (8) PDF 1.64 M (265) 评论 (0) 收藏

摘要:针对当前众包平台面临的订单类型多样性(外卖订单与快递订单)和配送骑手的同质化(单一外卖型与单一快递型)问题, 且现有众包配送机制较少兼顾商家和顾客满意度, 在派单模式下考虑骑手的异质性, 通过引入全能型骑手, 将骑手划分为单一外卖型、单一快递型和全能型3类, 根据各类骑手可服务的订单类型差异, 构建基于模糊时间窗的商家和顾客对于骑手到达取送货点时间的满意度成本函数, 将商家和顾客的满意度转化为时间惩罚函数, 建立了以时间惩罚成本、路径行驶成本、人员运营成本最小化为目标的模型, 针对模型的特点以及传统算法存在的问题, 设计将遗传算法与大规模领域搜索算法相结合的混合算法, 随后通过具体算例, 采用模拟退火算法、遗传算法和混合算法分别进行求解, 通过不同算法的优化结果对比分析, 验证模型和改进算法的可行性和有效性. 实验结果表明: 在众包配送过程中合理考虑骑手异质性以及商家和顾客的满意度不仅能够有效提升商家和顾客满意度, 也能够降低众包平台配送成本和提高配送效率, 对于众包平台制定配送策略具有一定的参考意义.

基于DAF-STDC实时模型的岩屑图像语义分割识别

潘显珊，王正勇，罗彬彬，滕奇志，何小海

2024, 33(12):222-230. DOI: 10.15888/j.cnki.csa.009716 CSTR: 32024.14.csa.009716

摘要 (16) HTML (7) PDF 3.13 M (235) 评论 (0) 收藏

摘要:岩屑识别是地质勘探录井工作中的重要手段, 为了解决传统人工岩性识别效率低下和常见深度学习网络推理速度慢计算量大等问题, 本文借助于表现较好的短时密集串联网络模型, 提出了一种实时岩屑图像语义分割网络DAF-STDC. 该网络使用空洞卷积在提取特征过程中保持分辨率, 利用注意力机制帮助模型获取特征图中全局信息, 从而细化岩屑颗粒边缘信息, 使用特征融合模块加强低阶细节特征与高阶语义特征的融合程度, 帮助特征表达. 经实验证明, 改进后的网络模型在精度方面有了大幅提升, 在岩屑录井工作中收集到的6类岩屑图像, 制成的数据集RC_Dataset上, 平均交并比达到83.12%, 在保持参数量的同时, 推理速度和分割精度有了明显提升, 为岩屑录井数字化提供了有效参考.

基于改进Transformer的剩余时间预测

刘海洲，高俊涛

2024, 33(12):231-239. DOI: 10.15888/j.cnki.csa.009728 CSTR: 32024.14.csa.009728

摘要 (28) HTML (9) PDF 1.05 M (153) 评论 (0) 收藏

摘要:剩余时间预测能够帮助企业提升业务流程执行的质量和效率. 尽管现有的深度学习方法在剩余时间预测上有一定提升, 但在处理复杂业务流程时, 仍面临时间特征利用不足和局部特征挖掘能力有限的问题, 预测精度有待提高. 为此, 本研究提出了一种基于改进Transformer编码器模型的剩余时间预测方法. 针对已有方法忽略事件时间特征以及难以捕捉局部依赖的不足, 本研究在模型中引入了时间特征编码模块和局部依赖增强模块. 时间编码模块通过嵌入学习和多粒度拼接方式, 构建了富有语义且具判别力的事件时间表示. 局部依赖增强模块采用卷积神经网络, 在Transformer编码器之后提取轨迹前缀的局部细节特征. 实验表明, 融合时间特征和局部依赖增强可以提升复杂业务流程剩余时间的预测准确性.

基于YOLOv8s的X光违禁品识别

陈冠豪，潘广贞

2024, 33(12):240-247. DOI: 10.15888/j.cnki.csa.009696 CSTR: 32024.14.csa.009696

摘要 (30) HTML (16) PDF 1.30 M (198) 评论 (0) 收藏

摘要:快速增长的安检需求推动了智能安检技术的发展, 由于X光图片的特殊性, 导致小目标违禁品检测难度大, 本文提出一种改进YOLOv8s的违禁品识别网络进行解决. 首先引入Focal L1 Loss函数改进CIoU, 优化预测框位置与长宽比, 以提高网络对于违禁品的标记能力. 将改进后的可变形卷积加入浅层主干网络中, 捕获不同方向上的违禁品特征信息. 在SPPF模块加入LSKA扩大网络感受野, 并使用Swin-CS模块捕获全局信息、补充维度交互, 最后使用3种注意力堆叠的注意力块进行处理, 提高了网络对小目标的敏感性. 改进后的网络在SIXray数据集上的平均精度均值达到96.1%, 相比原有的YOLOv8s提高5.4%, mAP50-95达到0.682, 提高4.5%. 实验结果表明, 提出的模型能够准确给出预测框, 应对复杂场景中的违禁品检测, 证明了算法的有效性.

E2E-DRNet: 基于EfficientNetV2模型的糖尿病视网膜病变识别

刘圆圆，陈麓，鲁峰，叶阳，安禹潼，金明慧，邢开原，曾光

2024, 33(12):248-255. DOI: 10.15888/j.cnki.csa.009690 CSTR: 32024.14.csa.009690

摘要 (43) HTML (17) PDF 1.91 M (260) 评论 (0) 收藏

摘要:本文提出一种名为E2E-DRNet的模型, 旨在解决当前人工糖尿病视网膜病变(diabetic retinopathy, DR)诊断中分类性能差、耗时费力以及视网膜图像等级差异小、病灶不明显等问题. 该模型基于EfficientNetV2, 并结合了有效通道注意力模块. 通过对DR数据集进行处理和优化, 引入了Focal Loss损失函数以解决样本不均衡问题, 并将模型分为两个阶段以实现DR分类的细分. 实验结果表明, 该方法在公开数据集和临床数据集上表现良好, 提高了对眼底病变区域的可解释性, 有助于提高DR病变的筛查效率, 克服了人工诊断的局限性.

基于多指标关联的航路网络节点和连边识别

孟贤，田勇，李江晨

2024, 33(12):256-263. DOI: 10.15888/j.cnki.csa.009707 CSTR: 32024.14.csa.009707

摘要 (18) HTML (8) PDF 1.79 M (203) 评论 (0) 收藏

摘要:航段和航路点对网络正常运行具有重要意义, 正确识别关键航段和关键航路点, 并分析各个指标对航段或航路点的重要程度的关联程度有利于针对性地提升航路网络的抗打击能力. 为改善航路网络对各种突发情况的弱“抵抗力”情况, 从静态指标和动态指标两个方面入手, 采用熵权法从数据本身的波动程度出发确定静态指标和动态指标的权重, 并采用优劣解距离法通过计算连边的最优和最劣解, 得到各个航段和航路点的综合得分. 并继续分析各个指标之间及指标与航段或航路点综合得分之间的关联度, 结果表明各个指标之间都相对独立, 但各个指标与航段或航路点得分的关联度较高, 该结论为航路网络结构优化提出改进依据.

微信公众号

网站二维码

>综述文章

当期目录

年份

刊期