• 当期目录
  • 优先出版
  • 过刊浏览
  • 点击排行
  • 下载排行
  • 综述文章
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    2024,33(12):1-15, DOI: 10.15888/j.cnki.csa.009708, CSTR: 32024.14.csa.009708
    [摘要] (101) [HTML] (36) [PDF 1.79 M] (753)
    摘要:
    皮肤癌是最常见和最致命的癌症类型之一, 患病数量在世界范围内急剧增加. 如果没有在早期阶段诊断出来, 它可能转移, 导致高死亡率. 结合近几年的相关文献就传统机器学习和深度学习两种学习方法在皮肤癌病变诊断中的应用作一系统综述, 为皮肤癌诊断的深入研究提供相应的参考价值, 首先对几个皮肤病公共可获取数据集进行整理, 其次分析和比较不同的学习算法在皮肤癌病变分类中的应用, 更好地了解它们在实际应用中的优势和局限性, 重点阐述在卷积神经网络领域的分类诊断. 在深入了解这些算法的基础上, 还将探讨它们在处理皮肤疾病时的性能差异、改进思路. 最终, 通过对当前挑战和未来发展方向的探讨, 将为进一步提升皮肤癌早期诊断系统的性能和可靠性提供有益的参考和建议.
    2024,33(12):16-29, DOI: 10.15888/j.cnki.csa.009711, CSTR: 32024.14.csa.009711
    [摘要] (40) [HTML] (22) [PDF 2.26 M] (297)
    摘要:
    在移动边缘计算(mobile edge computing, MEC)背景下, 不合理的任务卸载策略和资源分配以及多类型任务数量急剧增加导致边缘服务器间的负载不均衡. 针对上述问题, 本文基于多用户多MEC的边缘环境, 提出一种面向多类型任务的负载预测以及均衡分配方案(load prediction and balanced assignment scheme for multi-type tasks, LBMT). 该方案包括划分任务类型、任务负载预测、任务自适应映射3个部分. 首先, 考虑任务类型的多样性设计了任务类型模型, 利用该模型划分任务类型. 其次, 考虑不同任务对服务器造成的负载具有差异性提出了任务负载预测模型, 并在此基础上采用改进KNN (K-nearest neighbor)算法用于预测任务负载. 然后, 综合考虑MEC服务器异构性、资源有限等因素, 结合MEC服务器负载均衡模型设计了任务分配模型, 并提出基于自适应任务映射算法用于任务分配. 最后, LBMT针对MEC服务器资源利用率和任务处理率进行优化, 得到最优负载均衡任务卸载策略. LBMT与基于改进的min-min卸载方案、基于中间节点的卸载方案、基于加权二分图的卸载等方案进行仿真实验对比, 实验结果表明LBMT在资源利用率上提高了12.5%以上, 任务处理率提高了20.3%以上, 并显著降低了负载均衡标准差值, 更有效地实现了服务器之间的负载均衡.
    2024,33(12):30-42, DOI: 10.15888/j.cnki.csa.009727, CSTR: 32024.14.csa.009727
    [摘要] (35) [HTML] (33) [PDF 2.33 M] (304)
    摘要:
    计算机断层扫描产生的肝部影像为医生进行肝部病灶区域发现提供了素材. 但肝部病灶的人工检测严重依赖于医生的专业技能, 且费时费力. 现有的肝部病灶区域检测算法对细微病灶的检测效果欠佳. 为此, 本文提出了一种基于频率感知图像恢复的自监督肝部病灶检测算法. 首先, 此算法设计了一个基于合成异常的自监督任务, 用于合成更加广泛且适宜的伪异常图像, 从而缓解算法模型训练时异常数据不足的问题. 其次, 为了抑制重建网络对合成肝部异常的敏感性, 设计了提取图像高频信息的模块, 通过从图像的高频成分中恢复图像, 以减轻重建网络对异常的不利泛化. 最后, 其采用权重衰减训练策略以训练分割子网络, 减少训练前期的琐碎解问题, 实现局部细微病灶的检测. 在真实公开数据集上进行的大量实验表明, 本文方法在肝部病灶检测任务中取得了领先的性能.
    2024,33(12):43-54, DOI: 10.15888/j.cnki.csa.009698, CSTR: 32024.14.csa.009698
    [摘要] (38) [HTML] (26) [PDF 2.38 M] (295)
    摘要:
    群体行为识别是计算机视觉领域中备受关注的研究方向之一, 旨在通过多个个体动作与互动关系确定整体的行为. 然而, 由于确定个体互动关系、联系紧密程度以及活动关键人物三者的困难, 现有方法常关注于人物的个体特征, 忽略了与活动场景上下文的相互联系. 针对该问题, 提出一个基于全局-个体特征融合的群体行为识别推理模型GIFFNet (global-individual feature fusion network). 通过构建全局-个体特征融合(GIFF)模块, GIFFNet在聚焦关键信息的基础上, 有效整合了场景上下文与个体人物特征, 获取了更具表征能力的融合特征, 以弥补预测群体行为时场景信息缺失的问题. 随后, GIFFNet利用融合特征计算场景中人物之间的交互关系图, 并使用图卷积网络(GCN)进行训练和群体行为类别预测. 此外, 为解决数据集样本失衡的问题, GIFFNet采用动态分配权重的策略优化损失函数. 实验结果表明, GIFFNet在Volleyball、Collective Activity数据集上的多类分类准确度分别为93.8%、96.1%, 类平均精确度分别为93.9%、95.8%, 优于其他现有的深度学习方法. GIFFNet通过特征融合为行为分类提供了表征能力更加强大的特征, 有效地提升了行为识别的精确度.
    2024,33(12):55-66, DOI: 10.15888/j.cnki.csa.009691, CSTR: 32024.14.csa.009691
    [摘要] (42) [HTML] (33) [PDF 1.59 M] (286)
    摘要:
    DNS作为互联网基础设施, 很少受到防火墙的深度监控, 导致黑客和APT组织通过DNS隐蔽隧道来窃取数据或控制网络, 对网络安全造成严重威胁. 针对现有检测方案容易被攻击者绕过以及泛化能力较弱的问题, 本研究改进了DNS流量的表征方法, 并提出了PFEC-Transformer (pcap features extraction CNN-Transformer)模型. 该模型以表征后的十进制数值序列作为输入, 在经过CNN模块进行局部特征提取后, 再通过Transformer分析局部特征间的长距离依赖模式并进行分类. 研究采集了互联网流量以及各类DNS隐蔽隧道工具生成的数据包构建数据集, 并使用包含未知隧道工具流量的公开数据集进行泛化能力测试. 实验结果表明, 该模型在测试数据集上取得了高达99.97%的准确率, 在泛化测试集上也达到了92.12%的准确率, 有效地证明了其在检测未知DNS隐蔽隧道方面的优异性能.
    2024,33(12):67-77, DOI: 10.15888/j.cnki.csa.009713, CSTR: 32024.14.csa.009713
    [摘要] (36) [HTML] (29) [PDF 1.53 M] (444)
    摘要:
    盲文转换技术可以推进盲人群体的信息无障碍化进程, 有着相当的重要性. 随着信息全球化发展, 盲人不可避免地接触到包含中英双语的信息. 现有中英盲文转换系统能较好完成中英文字符到盲文的转换, 但是对标点的转换效果不佳, 表现为对一符多用情况区分效果不好、未对中英标点混用情况进行纠错两方面. 若未能恰当处理一符多用及中英标点混用情况, 很可能会对盲人阅读造成影响甚至误解. 本文详细分析以上问题, 设计并实现一种具有标点区分和纠错能力的中英盲文转换系统. 基于BCC语料库构建测试语料, 对该系统开展一系列测试和评估. 实验结果表明, 与其他类型转换系统相比, 本系统能够结合语言类型和上下文结构, 有效区分标点转换中的一符多用情况, 并能纠正中英标点混用问题, 对我国信息无障碍化进程起到促进作用.
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009743
    摘要:
    矿井下光照缺失、环境复杂, 安全帽目标尺寸较小, 导致一般目标检测模型对安全帽的检测效果不佳. 针对上述问题, 提出了一种基于改进YOLOv8s的矿井下安全帽佩戴检测模型. 首先, 将effectiveSE模块和YOLOv8s Neck层中的C2f模块相结合, 设计得到新的C2f-eSE模块, 提高了网络结构的特征提取能力, 并用Wise-EIoU损失函数替代CIoU损失函数, 提高了模型的鲁棒性; 其次, 在检测头中引入空间和通道重建卷积模块SCConv, 并根据参数共享思想设计了新的轻量化SPS检测头, 降低了模型的参数量和计算复杂度; 最后在模型中增加一层P2检测层, 使模型的特征提取网络融入更多的浅层信息, 提高了对小尺寸目标的检测能力. 实验结果表明, 改进后模型的mAP50指标提升了3.2%, 参数量降低1.6%, GFLOPs降低5.6%.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009763
    摘要:
    复杂地形条件下, 基于深度强化学习的无人机编队航迹规划可以完成无人机编队的轨迹寻优, 路径长度和环境适应性均优于传统启发式算法, 但仍存在训练稳定性不足、规划实时性差等问题. 面向领航者-跟随者模式的无人机集群, 本文提出了一种基于SPER-TD3算法的无人机编队实时三维航迹规划方法. 首先, 将基于SumTree的优先经验回放机制融入TD3算法, 设计了SPER-TD3算法, 确定无人机编队的轨迹; 然后, 使用基于角度队形控制方法优化跟随者的飞行轨迹, 并应用动态轨迹平滑算法优化转向角. 为了加快SPER-TD3算法的训练收敛速度和稳定性, 解决长时间依赖性问题, 设计了结合LSTM、自注意力机制以及多重感知机的网络模型结构. 在多种障碍物环境下进行了仿真实验, 结果表明, 所提方法在轨迹安全覆盖率、飞行路径平滑度、成功率、奖励大小等方面综合表现优于8种主流的深度强化学习算法, 其重要性综合评估值比当前方法提升8.5%–72.9%不等, 且训练稳定性最佳.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009764
    摘要:
    关键句提取技术是指利用人工智能, 自动从一段长文本中寻找核心句. 该技术可用于信息检索的预处理, 对文本分类、抽取式摘要等下游任务有着重要意义. 传统的无监督关键句提取技术多数基于统计学以及图模型的方法, 存在着精度不高以及需要提前建立大规模语料库等问题. 本文提出了一种中文环境下的无监督提取关键句方法T5KSEChinese, 该方法利用编码器-解码器架构, 通过输入和输出提示词来忽略目标句与原文长度不匹配的问题, 以得到更准确的结果. 同时, 本文提出一种对比学习正样本构造方式, 并将该方式结合对比学习来对模型编码器部分进行半监督训练, 提升下游任务效果. 本研究使用轻量化的模型, 在无监督下游任务中得分优于参数量大于自身数十倍的大语言模型, 最终实验结果证明了提出方法的准确度和可靠性.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009766
    摘要:
    由于虚假新闻检测任务的现有工作往往忽略了新闻文本的语义稀疏性及丰富信息之间的潜在联系, 限制了模型对虚假新闻的理解和识别能力, 本文提出了一种基于异质子图注意力网络的虚假新闻检测方法. 针对新闻样本的文本、所属党派、主题等多种信息, 构建了异质图, 以建模虚假新闻的丰富特征. 在特征层采用异质图注意力网络捕获不同类型信息之间的关系, 在样本层引入子图注意力网络挖掘新闻样本间的交互. 同时基于自监督对比学习的互信息机制关注全局图结构中的判别性子图表征, 以捕获新闻样本的特异性. 实验结果表明, 本文提出的方法在Liar数据集上相比现有方法在准确率与F1值分别取得了约9%和12%的提升, 显著提升了虚假新闻检测的性能.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009768
    摘要:
    在光谱三维CT数据中, 传统卷积的全局特征捕捉能力不足, 而全尺度的自注意力机制则需要大量的计算资源. 为了解决这一问题, 本文引入一种新视觉注意力范式(wave self-attention, WSA). 相比于ViT技术, 该机制使用更少的资源获得同等的自注意力信息. 此外, 为更充分的提取器官间的相对依赖关系并提高模型的鲁棒性和执行速度, 本文为WSA机制设计了一种即插即用的模块——波随机编码器(wave random encoder, WRE). 该编码器能够生成一对互逆的非对称全局(局部)位置信息矩阵. 其中, 全局位置矩阵用来对波特征进行全局性的随机取样, 局部位置矩阵则用于补充因随机取样而丢失的局部相对依赖. 本文在标准数据集Synapse和COVID-19的肾脏和肺实质的分割任务上进行实验. 结果表明, 本文方法在精度、参数量和推理速率方面均超越了nnFormer、Swin-UNETR等现有模型, 达到了SOTA水平.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009773
    摘要:
    在知识蒸馏(knowledge distillation, KD)领域中, 基于特征的方法可以有效挖掘教师模型所蕴含的丰富知识. 然而, 基于Logit的方法常面临着知识传递不充分和效率低下等问题. 解耦知识蒸馏(decoupled knowledge distillation, DKD)通过将教师模型和学生模型输出的Logit划分为目标类和非目标类进行蒸馏. 这种方式虽然提升了蒸馏精度, 但其基于单实例的蒸馏方式使得批次内样本间的动态关系无法被捕捉到, 尤其是当教师模型和学生模型的输出分布存在显著差异时, 仅依靠解耦蒸馏无法有效弥合这种差异. 为了解决DKD中存在的问题, 本文提出感知重构的方法. 该方法引入一个感知矩阵, 利用模型的表征能力对Logit进行重新校准, 细致分析类内动态关系, 重建更细粒度的类间关系. 由于学生模型的目标是最小化表征差异, 因此将该方法扩展到解耦知识蒸馏中, 把教师模型和学生模型的输出映射到感知矩阵上, 从而使学生模型能够学习到教师模型中更加丰富的知识. 本文方法在CIFAR-100和ImageNet-1K数据集上进行了一系列的验证, 实验结果表明, 该方法训练的学生模型在CIFAR-100数据集上的分类准确率达到了74.98%, 相较于基准方法提升了0.87个百分点, 提升了学生模型的图像分类效果. 此外, 通过对多种方法进行对比实验, 进一步验证了该方法的优越性.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009778
    摘要:
    针对雾霾、雨雪等恶劣天气下拍摄到的图像退化模糊, 难以进行准确识别与检测的问题, 本文提出模糊场景下行人与车辆检测算法LiteBlurVisionNet (轻模糊视觉网络). 在主干网络部分使用GlobalContextEnhancer注意力改进轻量级 MobileNetV3模块, 减少了参数量, 使得模型在雾霾、雨雪等恶劣天气条件下图像处理效率更高. 颈部网络采用更为轻量化的Ghost模块和由GhostBottleneck模块改进的SpectralGhostUnit模块, 能够更有效地捕获全局上下文信息, 提高特征的区分度和表达能力, 有助于减少参数数量和计算复杂度, 从而提高网络处理速度和效率; 预测部分采用DIoU NMS基于非极大抑制方法进行最大局部搜索, 去除冗余的检测框, 提高检测算法在模糊场景下的准确性. 实验结果表明, LiteBlurVisionNet算法模型的参数量比RTDETR-ResNet50算法模型下降了96.8%, 比YOLOv8n算法模型下降了55.5%, LiteBlurVisionNet算法模型的计算量比Faster R-CNN算法模型下降了99.9%, 比YOLOv8n算法模型下降了57%, LiteBlurVisionNet算法模型的mAP0.5比IAL-YOLO算法模型提高了13.71%, 比YOLOv5s算法模型提高了2.4%, 这意味着模型在存储和计算方面更加高效, 尤其适用于资源受限的环境或移动端设备.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009779
    摘要:
    自动文本摘要是自然语言处理(NLP)领域中的一个重要分支, 其主要难点之一是在于如何快速、客观且准确地评估生成摘要的质量. 针对现有文本摘要质量评估方法中评估准确度不高、需要参考文本以及计算资源消耗大的问题, 本文提出一种基于大语言模型的文本摘要质量评估方法, 设计基于思维链原理的提示词构建方法以提高大语言模型在文本摘要质量评估任务上的性能, 同时生成思维链数据集并以模型微调的方式对小型大语言模型进行训练, 显著降低了计算需求. 本文方法首先根据文本摘要的特点确定评估维度, 并基于思维链原理(chain of thought)构建提示词; 使用提示词对大型大语言模型进行引导, 使其根据摘要样本生成思维链过程与评估结果, 同时以此为基础生成思维链数据集; 使用生成的思维链数据集对小型大语言模型进行微调训练; 最后使用微调后的小型大语言模型完成文本摘要的质量评估任务. 本文在Summeval数据集上进行了对比实验与分析, 实验结果表明, 本评估方法显著提高了小型大语言模型在文本摘要质量评估任务上的评估准确度, 实现了一种无需参考文本、评估准确度高、计算需求低、便于部署的文本摘要质量评估方法.
    优先出版日期:  2024-12-19 , DOI: 10.15888/j.cnki.csa.009781
    摘要:
    针对现有聚合物用量劈分算法, 在处理不同区块井组时自适应性不足的问题, 本文提出基于改进秃鹰搜索算法的聚合物驱油井组劈分方法, 首先通过灰色关联度分析法获得初步劈分系数, 进而计算每个采油井的累计注入量与实际产液量的差值, 并设定合理阈值范围和约束条件; 其次通过引入Sobol序列和ICMIC映射、黄金正弦莱维飞行引导机制及非线性收敛因子和自适应惯性权重策略改进秃鹰搜索算法, 增强算法的搜索能力和收敛精度; 最后利用改进秃鹰搜索算法对某油田实际区块内井组劈分系数优化模型进行求解, 结果表明计算出的劈分注入量与实际产液量吻合度较高, 具有较好的劈分精度.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009774
    摘要:
    在时下的无监督深度哈希研究领域中, 基于对比学习而提出的方法占主流地位. 但是对比学习所采用的随机抽取负样本方式, 会带来采样偏差问题, 从而对图像检索精度造成负面影响. 为解决以上问题, 本文提出了一种基于偏差抑制对比学习的无监督深度哈希(unsupervised deep hashing based on bias suppressing contrastive learning, BSCDH). 本文在对比学习框架的基础上提出了偏差抑制方法(bias suppression, BSS), 将错误负样本近似为极困难负样本, 并设计了偏差抑制系数来抑制极困难负样本从而缓解采样偏差的负面影响. 本文根据当前负样本与查询样本的相似度来确定其对应的抑制系数取值, 并引入当前负样本与邻近的聚类中心间的距离关系对抑制系数进行取值修正, 降低正常负样本被过度抑制的可能性. 最终BSCDH的64位哈希码mAP@5000指标在CIFAR-10、FLICKR25K、NUS-WIDE数据集上分别达到0.696、0.833、0.819, 相较baseline具有显著的性能优势. 本文开展的大量实验证明了BSCDH在无监督图像检索方法中拥有较高的检索精度, 且能有效应对采样偏差问题.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009769
    摘要:
    现有的知识图谱链路预测方法在学习语义信息的过程中大多只关注单个三元组中头实体h、关系r和尾实体t之间的语义关系, 没有考虑不同三元组中相关实体和实体关系之间的联系. 针对此问题, 本文提出了DeepE_CL模型. 首先, 通过DeepE模型学习相关三元组的语义信息和具有相同实体关系对的实体或具有相同实体的实体关系对的语义信息. 其次, 利用提取的相关三元组语义信息计算相应的评分函数和交叉熵损失, 并采用对比学习模型对提取的具有相同实体关系对的实体或具有相同实体的实体关系对的语义信息进行优化, 从而实现对相关三元组缺失信息的预测. 本文在4个常见的数据集上进行验证, 运用MRMRRHit@1和Hit@10这4个评价指标对所提方法和其他基线模型进行对比, 实验结果表明DeepE_CL模型在所有指标上都取得了最好的结果. 为了进一步验证模型的实用性, 本文还将模型应用到了1个真实的中成药数据集, 实验结果显示DeepE_CL模型比DeepE模型在MR指标上降低了18, 在MRRHit@1指标上分别提升了0.8%、1.1%, 在Hit@10指标上维持不变. 实验证明了引入对比学习模型的DeepE_CL模型在提升知识图谱链路预测性能方面的有效性.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009770
    摘要:
    密度峰值聚类(density peaks clustering, DPC)算法通过考虑局部密度和相对距离来识别簇中心以实现聚类. 然而, 该算法在处理密度分布不均匀和类簇大小不平衡的数据时容易忽视低密度区域的类簇中心, 需要人为设定类簇数量, 并且其分配策略中一个数据点分配错误会导致后续点的错误分配. 为了解决上述问题, 本文提出一种自适应稀疏感知密度峰值聚类算法. 首先, 引入模糊点概念以降低对子簇合并过程的影响; 其次, 利用减法聚类方法识别低密度区域的中心; 然后, 根据新的局部密度和反向最近邻数来识别噪声并更新子簇中心; 最后, 给出改进的全局交叠度, 结合全局可分度指导子簇融合, 并在这些度量下自动确定聚类结果. 实验结果表明, 在合成数据集和UCI数据集上, 与DPC及其改进算法相比, 本文提出的算法能够更好地识别稀疏簇、减少非中心分配带来的连锁反应, 自动确定最优类簇数目并获得更加准确的聚类结果.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009765
    摘要:
    基于Transformer的目标检测算法往往存在着精度不足, 收敛速度慢的问题. 许多研究针对这些问题进行改进, 取得了一定的成果. 但是这些研究大都忽视了Transformer结构应用于目标检测领域时存在的两个不足之处. 首先, 自注意力运算结果缺乏多样性. 其次, 因集合预测难度大, 使得模型在匹配目标的过程中表现不稳定. 为了弥补上述缺陷, 首先设计了自适应token池化模块, 增加自注意力权重的多样性. 其次, 设计了一种基于粗预测的锚框定位模块, 并利用该模块为查询提供位置先验信息, 从而提高二分图匹配过程的稳定性. 最后, 设计了基于组的去噪任务, 通过训练模型对位于目标附近的正负查询进行区分, 从而提高模型进行集合预测的能力. 实验表明, 本文提出的改进算法在COCO数据集上取得了较好的训练结果. 与基线模型相比, 改进算法在检测精度与收敛速度上有较大提升.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009746
    摘要:
    为充分挖掘专家历史事故根原因分析经验, 提升事故根原因分析的准确性与全面性, 减少化工安全事故发生, 本文提出一种基于历史事故报告与根原因指标体系关联挖掘的分析方法. 通过构建事故报告与指标体系的关联矩阵, 采用预训练模型对事故文本和指标项文本进行表征, 基于注意力机制融合二级和三级指标项的信息, 最后运用图卷积神经网络进行事故根原因分析. 通过在1351份数据集上进行验证, 实验结果表明: 该方法显著提高了根原因预测准确性, 能够有效利用专家历史分析经验辅助当前事故分析, 并揭示历史事故分析不完整的问题. 同时, 该方法也能通过不完整的事故描述准确挖掘事故根原因, 该方法的应用将提升事故预防和安全生产风险管理的水平.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009751
    摘要:
    YOLOv8n算法在面对背景繁杂、目标密集、像素点小的情况下, 表现出识别精度欠佳、目标漏检及误识别的问题. 针对上述问题, 提出一种LNCE-YOLOv8n安全装备佩戴检测算法. 包括提出线性多尺度融合注意力LMSFA (linear multi-scale fusion attention)机制, 自适应聚焦关键特征, 提升对小目标信息提取的能力且减少计算. 提出C2f_NewNet (C2f_New network)结构, 通过有效的并行化设计, 保持高性能且减少深度. 结合轻量级通用上采样算子CARAFE (content-aware reassembly of feature), 实现跨尺度的高效特征融合与传播, 在大的感受野内聚合上下文信息. 基于SIoU (symmetric intersection over union)损失函数提出ESIoU (enhanced symmetric intersection over union), 提升模型在复杂环境中的适应性和精度. 实验采用safety equipment数据集进行训练测试, 结果表明LNCE-YOLOv8n算法相比YOLOv8n算法, 精度提升了5.1%, mAP50提升了2.7%, mAP50-95提升了3.4%, 有效提高建筑工地复杂场景的工人安全装备佩戴检测精度.
    优先出版日期:  2024-12-16 , DOI: 10.15888/j.cnki.csa.009752
    摘要:
    肺炎是一种常见的呼吸系统疾病, 早期诊断对于有效治疗至关重要. 本研究提出了卷积神经网络(CNN)和Transformer结合的CTFNet混合模型, 旨在实现高效准确的肺炎辅助诊断. 该模型融合了卷积分词器和聚焦线性注意力机制. 卷积分词器通过卷积操作实现更紧凑的特征提取, 并保留图像的关键局部特征降低计算复杂度, 提高模型的表达能力. 聚焦线性注意力机制缓解了Transformer的计算需求, 优化了注意力框架, 大幅提升了模型性能. 在Chest X-ray Images数据集上, CTFNet在肺炎分类任务中表现出色, 达到了99.32%的准确率、99.55%的精确率、99.55%的召回率和99.55%的F1值. 较好的性能凸显了该模型在临床应用中的潜力. 为了评估CTFNet的泛化能力, 我们将其应用于COVID-19 Radiography Database数据集. 在该数据集中, CTFNet被用于多个二分类任务均达到98%以上的准确率. 这些结果表明, CTFNet在肺炎图像分类的各种任务中具有较好的泛化能力和可靠性.
    优先出版日期:  2024-12-13 , DOI: 10.15888/j.cnki.csa.009753
    摘要:
    传统的知识感知传播推荐算法中存在高阶特征相关度低、信息利用不平衡以及噪声引入问题. 提出一种多层次图间知识增强对比学习的知识感知传播推荐算法(MCLK-KE), 通过构建增强视图, 并利用自监督掩码重建预训练技术, 提取关键三元组的更深层信息, 有效抑制了噪声信号. 算法实现了知识与交互信号的均衡利用, 并以图间对比强化了特征表达, 捕捉到全局范围内的有效节点属性. 多任务训练通过联合训练推荐预测、对比学习和掩码重建任务, 提升模型性能. 在3个公开数据集上, MCLK-KE与最佳基线模型对比AUC指标最大提升3.3%, F1值最高增长5.3%.
    优先出版日期:  2024-12-13 , DOI: 10.15888/j.cnki.csa.009767
    摘要:
    卡通角色面部检测是一项比人脸检测更具挑战性的任务, 它涉及许多困难的场景. 针对卡通角色面部间存在巨大差异的特点, 本文提出了一种卡通角色面部检测算法, 命名为YOLO-DEL. 首先, 基于GELAN融合BDD设计了DBBNCSPELAN模块, 旨在减小模型体积的同时增强检测性能. 接下来, 引入一种称为ELA的多尺度注意机制, 用于改善SPPF结构, 增强主干模型的特征提取能力. 最后, 设计了新的共享卷积检测头, 使网络更轻便. 同时也用Shape-IoU代替原CIoU损失函数, 提升模型的收敛效率. 在iCartoonFace数据集上进行实验, 通过消融实验验证得到的模型, 并将其与YOLOv3-tiny、YOLOv5n和YOLOv6等模型进行比较. 改进模型YOLO-DEL的mAP达到90.3%, 比YOLOv8提高了1.2%, 参数量为1.69M, 与YOLOv8相比参数量降低47%, GFLOPs 降低44%. 实验表明, 本文方法能有效提高卡通角色面部的检测精度, 同时缩小网络模型的大小, 验证本文方法的有效性.
    优先出版日期:  2024-12-13 , DOI: 10.15888/j.cnki.csa.009762
    摘要:
    对于配备多种传感器的自动驾驶车辆, 在野外扬尘环境中进行高精度三维目标检测是一项重大挑战, 野外地形的多变性导致采集目标的区域特征差异性加剧, 同时扬尘颗粒物还会模糊目标特征. 为了克服这些困难, 本文提出了多模态特征动态融合的三维目标检测方法, 构建了多级特征自适应融合模块和特征对齐增强模块, 其中, 多级特征自适应融合模块动态调整模型对全局级特征和区域级特征的关注程度, 充分利用多级感受野, 减少区域差异对识别效果的影响; 而特征对齐增强模块则在多模态特征对齐之前增强感兴趣区域的特征表达, 有效抑制扬尘等干扰因素. 实验结果表明, 提出方法在自建野外数据集中比基线的平均精度提高了2.79%, 在KITTI数据集的困难级别检测中提高了1.7%, 表现出较好的鲁棒性和准确性.
    优先出版日期:  2024-12-09 , DOI: 10.15888/j.cnki.csa.009777
    摘要:
    针对人群计数面临的人头尺寸不统一、人群密度分布不均匀、背景复杂干扰等问题, 提出一种解决多尺度变化加强关注人群区域的卷积神经网络模型 (multi-scale feature weighted fusion attention convolutional neural network, MSFANet). 该网络前端采用改进的VGG-16模型对输入人群图像做第1步的粗粒度特征提取, 中间加入多尺度特征提取模块提取图像的多尺度特征信息. 随后添加注意力模块对多尺度特征进行特征加权. 后端利用锯齿状空洞卷积模块增大感受野, 以提取图像的细节特征, 生成高质量的人群密度图. 对该模型在3个公开数据集上进行实验, 结果显示, 在Shanghai Tech Part B数据集上MAE (平均绝对误差)达到7.8, MSE (均方误差)达到12.5. 在Shanghai Tech Part A数据集上MAE达到64.9, MSE达到108.4. 在UCF_CC_50数据集上MAE达到185.1, MSE达到249.8. 实验结果证实该模型有较好的准确度和鲁棒性.
    优先出版日期:  2024-12-09 , DOI: 10.15888/j.cnki.csa.009780
    摘要:
    针对现有的图像去雾算法仍然存在去雾不彻底、去雾后的图像边缘模糊、细节信息丢失等问题, 本文提出了一种基于Transformer和门控融合机制的图像去雾算法. 通过改进的通道自注意力机制提取图像的全局特征, 提高模型处理图像的效率, 设计多尺度门控融合块捕获不同尺度的特征, 门控融合机制通过动态调整权重, 提高模型对不同雾化程度的适应能力, 同时更好地保留图像边缘及细节信息, 并使用残差连接增强特征的重用性, 提高模型泛化能力. 经实验验证, 所提出的去雾算法可以有效恢复真实有雾图像中的内容信息, 在合成的有雾图像数据集SOTS上的峰值信噪比达到了34.841 dB, 结构相似性达到了0.984, 去雾后的图像内容信息完整且没有出现细节信息模糊和去雾不彻底等现象.
    优先出版日期:  2024-12-09 , DOI: 10.15888/j.cnki.csa.009784
    摘要:
    面对视频质量评估领域标记数据不足的问题, 研究者开始转向自监督学习方法, 旨在借助大量未标记数据来学习视频质量评估模型. 然而现有自监督学习方法主要聚焦于视频的失真类型和视频内容信息, 忽略了视频随时间变化的动态信息和时空特征, 这导致在复杂动态场景下的评估效果不尽人意. 针对上述问题, 提出了一种新的自监督学习方法, 通过播放速度预测作为预训练的辅助任务, 使模型能更好地捕捉视频的动态变化和时空特征, 并结合失真类型预测和对比学习, 增强模型对视频质量差异的敏感性学习. 同时, 为了更全面捕捉视频的时空特征, 进一步设计了多尺度时空特征提取模块等以加强模型的时空建模能力. 实验结果显示, 所提方法在LIVE、CSIQ以及LIVE-VQC数据集上, 性能显著优于现有的基于自监督学习的方法, 在LIVE-VQC数据集上, 本方法在PLCC指标上平均提升7.90%, 最高提升17.70%. 同样, 在KoNViD-1k数据集上也展现了相当的竞争力. 这些结果表明, 本文提出的自监督学习框架有效增强视频质量评估模型的动态特征捕捉能力, 并在处理复杂动态视频中显示出独特优势.
    优先出版日期:  2024-12-06 , DOI: 10.15888/j.cnki.csa.009747
    摘要:
    现有的基于卷积神经网络的超分辨率重建方法由于感受野限制, 难以充分利用遥感图像丰富的上下文信息和自相关性, 导致重建效果不佳. 针对该问题, 本文提出了一种基于多重蒸馏与Transformer的遥感图像超分辨率(remote sensing image super-resolution based on multi-distillation and Transformer, MDT)重建方法. 首先结合多重蒸馏和双注意力机制, 逐步提取低分辨率图像中的多尺度特征, 以减少特征丢失. 接着, 构建一种卷积调制Transformer来提取图像的全局信息, 恢复更多复杂的纹理细节, 从而提升重建图像的视觉效果. 最后, 在上采样过程中添加全局残差路径, 提高特征在网络中的传播效率, 有效减少了图像的失真与伪影问题. 在AID和UCMerced两个数据集上的进行实验, 结果表明, 本文方法在放大至4倍超分辨率任务上的峰值信噪比和结构相似度分别最高达到了29.10 dB和0.7807, 重建图像质量明显提高, 并且在细节保留方面达到了更好的视觉效果.
    优先出版日期:  2024-12-06 , DOI: 10.15888/j.cnki.csa.009748
    摘要:
    在任务计算密集型和延迟敏感型的场景下, 无人机辅助的移动边缘计算由于其高机动性和放置成本低的特点而被广泛研究. 然而, 无人机的能耗限制导致其无法长时间工作并且卸载任务内的不同模块往往存在着依赖关系. 针对这种情况, 以有向无环图(direct acyclic graph, DAG)为基础对任务内部模块的依赖关系进行建模, 综合考虑系统时延和能耗的影响, 以最小化系统成本为优化目标得到最优的卸载策略. 为了解决这一优化问题, 提出了一种基于亚群、高斯变异和反向学习的二进制灰狼优化算法(binary grey wolf optimization algorithm based on subpopulation, Gaussian mutation, and reverse learning, BGWOSGR). 仿真结果表明, 所提出算法计算出的系统成本比其他4种对比方法分别降低了约19%、27%、16%、13%, 并且收敛速度更快.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009738
    摘要:
    针对现有大气能见度检测方法易受主观因素和设备复杂度影响的问题, 提出一种新型的图像处理估算的能见度算法. 首先结合暗通道先验理论, 提出一种基于图像亮度与饱和度差值的全局大气光值估计方法, 进一步求解大气透射率; 然后采用曲率滤波对透射率进行细化处理; 接着, 通过车道线检测技术和消光系数计算得出大气能见度估算值; 最后, 建立一个基于线性回归方程的能见度修正模型对大气能见度的估算值进行修正. 实验结果验证了所提算法在雾霾天气下对交通监控场景中的能见度估算具有准确性和实用性.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009740
    摘要:
    城市街道场景实例分割算法可以显著提升城市环境感知和智能交通系统的准确性与效率, 针对城市街景行人和车辆之间相互遮挡和背景干扰严重等问题, 提出一种基于频率注意力机制和多尺度特征融合的实例分割模型FMInst. 首先, 构建一种高低频注意力机制进行交互编码从而增加高分辨率细节信息. 其次, 在Swin Transformer主干网络的Patch Merging层引入软池化操作, 减少特征信息损失, 有效提高小尺度目标分割结果. 最后, 结合MLP层构建多尺度的深度卷积, 有效增强目标局部信息提取, 提升实例分割精度. 在Cityscapes公共数据集进行对比实验, 结果表明FMInst的mAP提高1.2%, 达35.6%, 同时AP50提高2.2%, 达61.4%, 极大地改善实例分割的掩码质量和分割效果.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009741
    摘要:
    由图像到文本的跨模态行人重识别中缩小模态间差异一直是一个主要挑战, 针对该问题, 研究了一种基于CLIP-ReID (contrastive language-image pretraining-person re-identification)的改进方法. 引入了上下文调整网络模块和跨模态注意力机制模块. 上下文调整网络模块对图像特征进行深层次的非线性转换, 并有效地与可学习上下文向量相结合, 增强图像和文本间的语义关联性. 跨模态注意力机制模块通过对图像和文本特征进行动态加权和融合, 使得模型能够在处理一个模态的信息时考虑到另一模态, 提升模型在不同模态间的交互. 该方法分别在MSMT17、Market1501、DukeMTMC公共数据集上进行了评估, 实验结果在mAP值上分别提升了2.2%、0.5%、0.4%; 在R1值上分别提升了1.1%、0.1%、1.2%. 结果表明所提方法有效地提升了行人重识别的精度.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009754
    摘要:
    考虑到软件需求文本区别于其他普通文本的独特领域信息外, 还包含一些重要的上下文关系以及固有的二义性问题, 本文提出了一个图卷积与BERT融合的软件需求自动分类模型——BERT-FGCN (BERT-FusionGCN), 将图卷积网络(GCN)用于软件需求分类领域, 利用GCN对邻居节点信息进行信息传播和特征聚合的优势, 捕捉需求语句中单词或句子之间的上下文关系, 以进一步提高需求分类的结果. 首先构建需求文本的文本共现图和依存句法图, 将两种图进行融合来捕获句子的结构信息, 利用GCN对建模后的需求语句的图结构进行卷积得到图向量, 最后将图向量与BERT特征提取后得到的向量进行融合, 以此来对软件需求文本自动分类. 在PROMISE数据集上进行实验, BERT-FGCN在二分类上的F1分数达到95%, 多分类任务的F1分数提高2%.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009757
    摘要:
    Android应用异步消息执行顺序的不确定性是导致其不稳定的主要原因. 现有不稳定测试研究大多通过随机确定异步消息的执行顺序以触发不稳定测试, 其检测效果不佳且效率较低. 本文提出一种基于Happens-Before (HB)关系的Android应用并发不稳定测试检测方法, 通过分析Android应用测试用例执行轨迹中异步消息间的HB关系, 进而确定异步消息的可执行区间; 并设计最大差异化调度策略, 有指导性地确定异步消息执行顺序, 使调度后的测试执行轨迹上异步消息执行序与原测试执行轨迹差异最大化, 进而尝试改变测试执行结果, 检测测试的不稳定性. 为验证本文方法的有效性, 针对40个Android应用程序的50个不稳定测试用例进行实验, 实验结果表明, 本文方法可检测全部不稳定测试用例, 相比当前主流工具检测效果提升6%, 且平均检测时间缩短31.78%.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009771
    摘要:
    针对当下层级文本分类模型尚未充分利用层级实例的标签信息以及缺乏对类别分布不平衡的处理这两方面问题, 本文提出一种面向标签共现和长尾分布的层级文本分类方法(hierarchical text classification for label co-occurrence and long-tail distribution, LC-LTD), 对基于共享标签的文本全局语义和面向长尾分布的平衡损失函数进行研究. 首先, 设计一种基于共享标签的对比学习目标, 使具有更多共享标签的文本表示在特征空间中的语义距离更近, 引导模型生成具有判别性的语义表征; 其次, 引入分布平衡损失函数替换二进制交叉熵损失, 缓解层级分类固有的长尾分布问题, 提高模型的泛化能力. 在WOS、BGC两个公开数据集上将LC-LTD与当前多个主流模型进行比较, 结果表明所提方法具有更好的分类性能, 更适合处理层级文本分类任务.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009772
    摘要:
    图像隐写分析旨在检测图像是否经过隐写术处理从而携带了秘密信息. 基于孪生网络的隐写分析算法通过计算待检测图像左右分区的不相似性以此判断图像是否携带秘密信息, 是目前深度学习图像隐写分析算法里面准确度较高的网络. 然而, 基于孪生网络的图像隐写分析算法仍然存在一些局限性. 首先, 孪生网络在预处理层和特征提取层中叠加的卷积块, 忽略了隐写信号从浅层传递到深层过程中容易丢失的问题. 其次, 现有的孪生网络使用的SRM滤波器仍然沿用其他网络使用的高通滤波器来抑制图像内容, 忽略了生成的残差图大小单一的问题. 为了解决以上问题, 本文提出了基于增强残差特征的孪生网络图像隐写分析方法. 本文方法设计了一种基于注意力的倒残差模块, 通过在预处理层和特征提取层的卷积块后添加基于注意力的倒残差模块, 重用图像特征, 引入注意力机制, 增强网络对图像纹理复杂区域的特征图赋予更多权重. 同时为了更好地抑制图像内容, 提出多尺度滤波器, 将残差类型调整为多个尺寸不同的卷积核进行操作, 丰富残差特征. 实验结果表明, 本文提出的基于注意力的倒残差模块和多尺度滤波器相较于现有方法分类效果更佳.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009761
    摘要:
    分布式存储系统采用纠删码来实现高可靠和低开销的数据存储. 为了提供不同的可靠性和多样的访问性能, 存储系统需要对纠删码数据进行冗余转换, 即改变其编码参数. 条带合并机制为存储系统的冗余转换提供了一种思路. 然而, 基于传统纠删码的条带合并会在过程中引发大量的数据块重分布和校验块重计算I/O开销, 且在多次合并中会进一步加剧I/O. 针对此问题, 本文提出了一种新的树型里德-所罗门码, 通过分散数据块以消除数据块重分布I/O, 并通过设计编码矩阵以节约校验块重计算I/O. 树型里德-所罗门码进一步设计了存储单元, 将参与合并的条带组织成一颗树, 使得多次合并依据树结构自底向上高效完成. 本文设计实现了分布式存储原型系统. 实验表明, 树型里德-所罗门码相较于传统纠删码, 可以大大减少条带合并的完成时间.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009724
    摘要:
    针对现有方法无法有效利用签到信息为用户提供更精准的位置推荐服务的问题, 提出一种基于双粒度序列融合的下一个兴趣点推荐模型. 首先, 该模型综合考虑了细粒度的时空序列信息和现实生活中天然存在的粗粒度类别序列信息, 并通过门控循环单元有效捕捉长期依赖关系, 从而丰富签到上下文信息. 然后, 利用提取到的信息将固定划分签到长序列的“硬”划分方式转变为能有效提取完整局部子序列语义信息的“软”划分方式. 最后, 通过对各局部子序列的显著信息进行聚合来构建推荐模型. 提出的模型在Foursquare数据集上召回率、归一化折损累计增益分别平均提升9.07%、9.72%, 在Gowalla数据集上分别平均提升9.37%、10.24%, 实验结果表明该模型具有更优的推荐性能.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009735
    摘要:
    针对网约车运营中经济、环境和社会效益这3方面存在的相互制衡关系, 提出了一种平衡经济、环境和社会效益三重底线的多目标调度问题模型以及基于动态解空间规划的求解算法. 问题模型首次将传统出租车服务与共享出行模式整合, 全面覆盖4种不同的司机与乘客互动情景, 旨在通过优化策略实现3方面效益的协同提升. 求解算法创新性地结合了lapjv算法与分支限界法, 确保在给定阈值约束下, 能够高效探索并确定满足多目标优化的最优匹配策略. 该算法相比于SCIP, 结果平均误差在4%内, 求解平均速度提升了99.1%. 研究进一步通过系统性地应用此算法, 针对不同阈值约束条件, 求解并生成帕累托前沿图, 直观展示了经济、环境与社会效益这3个目标在其他两项指标约束下的权衡与变化趋势, 为网约车运营提供了决策参考依据.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009736
    摘要:
    由于大气雾和气溶胶的存在, 图像能见度显著下降且色彩失真, 给高级图像识别带来极大困难. 现有的图像去雾算法常存在过度增强、细节丢失和去雾不充分等问题. 针对过度增强和去雾不充分的问题, 本文提出了一种基于频率和注意力机制的图像去雾算法(frequency and attention mechanism of the image dehazing network, FANet). 该算法采用编码器-解码器结构, 通过构建双分支频率提取模块获取全局和局部的高低频信息. 构建频率融合模块调整高低频信息的权重占比, 并在下采样过程中引入附加通道-像素模块和通道-像素注意力模块, 以优化去雾效果. 实验结果显示, FANet在SOTS-indoor数据集上的PSNR和SSIM分别为40.07 dB和0.9958, 在SOTS-outdoor数据集上分别为39.77 dB和0.9958. 同时, 该算法也在HSTS和Haze4k测试集上取得了不错的结果, 与其他去雾算法相比有效缓解了颜色失真和去雾不彻底等问题.
    优先出版日期:  2024-11-25 , DOI: 10.15888/j.cnki.csa.009731
    摘要:
    大语言模型的兴起对自然语言处理领域产生了深远影响. 随着计算资源的增长和模型规模的扩大, 大语言模型在自然语言处理中的应用潜力日益显现. 然而, 广泛使用的低秩适应微调方法在面对模型规模增大时, 遇到了微调效率和存储成本等方面的挑战. 为了解决这一问题, 本文提出了一种基于奇异值分解的适应微调方法. 该方法只需将奇异值分解得到的对角矩阵和缩放向量作为可训练参数, 从而在降低训练成本的同时, 实现了在多个自然语言处理任务上的性能提升. 实验结果显示, 基于奇异值分解的适应微调方法在GLUE和E2E基准测试中的性能超越了同等数量级的方法. 通过与常用的参数高效微调方法进行比较, 发现基于奇异值分解的适应微调方法在减少可训练参数数量和提高微调效率方面具有显著优势, 并在可训练参数微调效率实验中实现了最高的性能增益. 在未来的研究中, 将专注于进一步优化基于奇异值分解的适应微调方法, 在更广泛的任务和更大规模的模型中实现更高效的微调.
    优先出版日期:  2024-11-25 , DOI: 10.15888/j.cnki.csa.009733
    摘要:
    微观剩余油赋存形态分类识别研究在剩余油开采领域发挥着至关重要的作用, 其对油田提高采收率具有重要的意义. 近年来, 该领域的大量研究通过引入深度学习方法来推动微观剩余油识别技术的发展, 但深度学习技术在微观剩余油识别领域尚未形成一个较为统一的框架, 也没有一个规范化的操作流程. 为了给今后的研究人员提供指导, 对目前的剩余油识别方法进行梳理, 从图像采集及类别划分标准、图像处理、剩余油识别方法等方面介绍了基于机器视觉的微观剩余油识别技术. 将剩余油识别方法分为基于传统和基于深度学习的识别方法, 传统识别方法分为基于人工特征提取和基于机器学习分类, 基于深度学习的识别方法划分为单阶段和两阶段方法, 并对其中数据增强、预训练、图像分割和图像分类方面进行详细归纳. 最后, 讨论了将深度学习应用于微观剩余油识别领域面临的挑战, 并对未来的发展趋势进行了展望.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009729
    摘要:
    卷烟激光喷码识别是烟草稽查工作的重要手段. 本文提出一种基于双态非对称网络的烟码识别方法, 针对畸变烟码训练样本不足导致模型泛化能力弱的问题, 设计非线性局部增强方法(nonlinear local augmentation, NLA), 通过在烟码图像边缘设置可控基准点进行空间变换, 生成有效畸变训练样本以增强模型泛化能力; 针对烟码与背景图案特征相似导致识别精度低的问题, 提出双态非对称网络(dual-state asymmetric network, DSANet), 将CRNN的卷积层划分为训练模式和部署模式, 训练模式通过引入非对称卷积优化特征权重分布, 增强模型关键特征提取能力; 为保证实时性, 部署模式设计BN融合和分支融合方法, 通过计算融合权重并初始化卷积核, 将卷积层等效转换回原始网络结构, 降低用户端推理时间; 最后, 在循环层中引入自注意力机制, 通过动态调整序列特征权重, 进一步加强模型对烟码特征的提取能力. 通过对比实验, 该方法具有更高的识别精度和速度, 其识别精度达到87.34%.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009730
    摘要:
    骶髂关节病变是预警强直性脊柱炎的主要体征之一, 精确高效的骶髂关节自动分割对于协助医生临床诊断和治疗至关重要. 针对骶髂关节灰度多变、背景复杂、且因骶髂间隙狭小而存在容积效应导致的特征提取受限, 分割精度难以提升的问题, 本研究利用层次级联补偿下采样信息丢失以及注意力并行保留跨维信息特征的思想, 提出首个用于骶髂关节分割诊断的U型网络. 此外, 为了提高临床诊断的效率, 将U型网络中传统的卷积替换为高效部分卷积块. 本实验在山西白求恩医院提供的骶髂关节CT数据集中, 验证了分割精度及效率平衡方面的有效性, 最终DICE达到91.52%, IoU达到84.41%. 实验结果表明, 改进的U型分割网络能有效提高骶髂关节分割精度, 减轻医疗专业人员的负担.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009700
    摘要:
    随着智能物联网的快速发展及运用, 其对网络的使用寿命、可靠性及覆盖范围提出了新的挑战. 目前的无线传感器网络(wireless sensor network, WSN)是由大量部署在监测区域内的自组织型传感器节点组成, 其具备低成本、节能、自组织和大规模部署等优势. 然而, 如何在此基础上进一步延长网络寿命, 提高WSN的覆盖可靠性, 是当前研究面临的主要挑战. 为此, 将骨干网络与覆盖模型、传感器节点协同感知和空间相关性结合, 提出了一种覆盖可靠性评估模型. 在此基础上, 提出了一种基于可信信息覆盖的覆盖可靠性优化算法, 一方面, 利用可信信息覆盖模型保证数据的协同感知, 增强网络服务质量, 另一方面, 采用骨干网络优化路由, 节省能量消耗. 进一步地, 为验证所提算法的优越性, 以传感器多状态、覆盖率为评价指标, 以RMSE阈值和能耗为性能指标, 将所提算法与ACR和CICR算法进行对比. 最后, 在Matlab仿真软件上搭建了验证模型, 仿真结果表明, 所提算法能显著提高覆盖可靠性.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009709
    摘要:
    急性缺血性脑卒中是临床上最常见的卒中类型, 因其症状突发且治疗时间窗较短等特点, 成为全球导致残疾和死亡的重要因素之一. 随着人工智能领域的迅速发展, 深度学习技术在急性缺血性脑卒中的诊疗中展现出巨大的潜力. 深度学习模型能够快速高效地根据患者脑部图像对病灶进行分割与检测. 本文介绍深度学习模型的发展历程和用于脑卒中研究的常用公开数据集. 针对计算机断层扫描(computerized tomography, CT)和磁共振成像(magnetic resonance imaging, MRI)衍生出的多种模态和扫描序列, 详细阐述了深度学习技术在急性缺血性脑卒中病灶分割与检测领域的研究进展, 总结并分析了相关研究的改进思路. 最后, 指出了深度学习在该领域现存的挑战并提出了可能的解决方案.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009721
    摘要:
    针对现有的小样本关系三元组抽取方法难以解决单句话中存在多个三元组以及未考虑支持集和查询集之间语义相似性等问题, 提出了一种基于模块转移和语义相似性推断的小样本关系三元组抽取方法. 该方法采用一种在关系抽取、实体识别和三元组判别这3个模块不断转移的机制, 高效地提取出查询实例中存在的多个关系三元组. 在关系抽取部分, 将BiLSTM和注意力机制相融合, 以更好地捕捉应急预案文本的序列信息. 此外, 在实体识别部分设计了一种基于语义相似性推断的方法识别句子中存在的应急组织机构实体. 最终, 在应急预案领域数据集ERPs+上进行了大量的实验. 实验结果显示, 相较于其他基线模型, 所提模型更适应于应急预案领域的关系三元组抽取任务.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009722
    摘要:
    在当前的电力市场中, 现货日清数据量已达百万或千万级. 随着交易活动的增加和市场结构的复杂化, 确保交易数据的完整性、透明性和可追溯性是我国现阶段市场清算领域待研究的关键问题. 为此, 研究提出了一种基于PROV模型和智能合约的电力市场清算数据溯源方法, 旨在通过智能合约自动化存储及更新溯源信息, 从而提高清算过程的透明度和参与方信任. 本方法利用PROV模型中的实体、活动和代理等元素, 结合区块链技术的可层次存储及不可篡改性, 记录和追踪电力市场中的交易活动和规则变更. 本方法不仅增强了数据的透明度和市场参与方的信任度, 也优化了数据管理和存储策略, 降低了操作成本. 此外, 本方法为电力市场清算提供了合规性证明, 帮助市场参与方满足日益增长的法规要求.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009723
    摘要:
    近年来, 随着深度学习技术的发展, 卷积神经网络(convolutional neural network, CNN)和Transformer在图像超分辨率(super-resolution, SR)领域取得了显著的进展. 但是, 对于图像全局特征的提取, 过去的方法大多采用的是堆叠单个算子重复计算来逐步扩大感受野的方式. 为了更好地利用全局信息, 提出了对局部、区域和全局特征进行显式建模. 具体来说, 通过通道注意增强卷积、基于划分窗口的Transformer和CNN的双分支并行架构、标准的Transformer和划分窗口的Transformer双分支并行架构, 以一种层次递进的方式对图像的局部信息、区域与局部信息、全局与区域信息进行提取和融合. 此外, 设计了一种层次特征融合方式来对CNN分支提取到的局部信息和划分窗口的Transformer提取到的区域信息进行特征融合. 大量的实验表明, 所提网络在轻量级SR领域实现了更好的结果. 例如, 在Manga109数据集的4倍放大实验中, 该网络的峰值信噪比(PSNR)相较于SwinIR提升了0. 51 dB.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009758
    摘要:
    在自动驾驶技术的领域中, 利用鸟瞰图(bird’s eye view, BEV)进行3D目标检测任务已经引起了广泛的关注. 针对现有相机至鸟瞰视图转换方法, 实时性不足、部署复杂度较高的难题, 提出了一种简单高效、无需任何特殊工程操作即可部署的视图转换方法. 首先, 针对完整图像特征存在大量冗余信息, 引入宽度特征提取器并辅以单目3D检测任务, 提炼图像的关键特征, 确保过程中信息损失的最小化; 其次, 提出一种特征引导的极坐标位置编码方法, 增强相机视角与鸟瞰图表示之间的映射关系与模型空间理解能力; 最后, 通过单层交叉注意力机制实现可学习BEV嵌入与宽度图像特征的交互, 从而生成高质量的BEV特征. 实验结果表明: 在nuScenes验证集上该网络架构与LSS (lift, splat, shoot)相比mAP从29.5%提升到32.0%, 提升了8.5%, NDS从37.1%提升到38.0%, 提升了2.4%, 表明该模型在自动驾驶场景下的3D目标检测任务的有效性. 同时相比于LSS在延迟上降低了41.12 %.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009759
    摘要:
    本文提出了一种基于半监督学习和条件概率的膝关节软骨分割方法, 旨在解决医学图像分割中标注样本数量不足和质量差的问题. 现有的标签树嵌入深度学习模型难以对网络输出间的层次关系进行有效建模, 而本文提出了一种条件到无条件的混合训练与任务级一致性结合的方法, 有效地利用了标签之间的层次关系和相似性, 提高了分割精度. 具体来说, 我们使用一个联合预测像素级分割图和目标的几何感知水平集表示的双任务深度网络. 通过可微分的任务变换层, 将水平集表示转换为近似的分割映射. 同时, 我们在标签和未标记数据上引入了基于水平线的分割映射与直接预测的分割映射之间的任务级一致性正则化. 在两个公共数据集上的大量实验表明, 我们的方法可以通过包含未标记的数据来显著提高性能.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009760
    摘要:
    由于人体器官的不规则形变, 可变形三维医学图像配准仍然是医学图像处理中的难题. 针对该问题, 本文提出了一种基于Transformer的多尺度可变形三维医学图像配准方法. 该方法首先采用多尺度策略来实现多层次的连接, 以捕捉不同层次的信息. 通过自注意力机制提取全局特征, 并利用膨胀卷积捕获更广泛的上下文信息和更细节的局部特征, 从而增强配准网络对全局和局部特征的融合能力. 其次, 本文根据图像梯度的稀疏性先验, 引入了归一化总梯度作为损失函数, 有效减少了噪声和伪影对配准过程的干扰, 更好地适应不同模态的医学图像. 在公开的脑MRI数据集(OASIS和LPBA)上评估本文所提方法的性能. 综合结果表明, 该方法不仅能保持基于学习的方法在运行时间上的优势, 还在均方误差和结构相似性等指标上表现出较高的性能. 此外, 消融实验的结果进一步证明了本文所提方法和归一化总梯度损失函数设计的有效性.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009755
    摘要:
    无人机(unmanned aerial vehicle, UAV)搭载边缘服务器构成移动边缘服务器, 可以在一些基站难以部署的场景下为用户设备(user equipment, UE)提供计算服务, 借助深度强化学习对智能体进行训练, 能够在连续复杂的状态空间中制定合理的卸载决策, 将用户产生的计算密集型任务部分卸载至边缘服务器处执行, 提高系统的续航和响应时间, 但目前的深度强化学习算法所使用的全连接神经网络无法较好地处理UAV辅助移动边缘计算(mobile edge computing, MEC)场景下的时间序列数据, 算法的智能体训练效率低, 决策性能差, 针对上述问题, 本文以最小化UAV辅助MEC系统总时延为目标, 提出了一种基于长短期记忆网络的双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient algorithm based on long short term memory, LSTM-TD3), 利用LSTM改进TD3算法的Actor-Critic网络结构, 将网络划分成3部分: 包含LSTM的记忆提取单元, 当前特征提取单元, 以及感知整合单元; 并在改进了经验池中的样本数据, 定义了历史数据, 使记忆提取单元能够得到更好的训练效果. 仿真结果表明, 与AC算法、DQN算法和DDPG算法相比, LSTM-TD3算法在以系统最小总时延为目标对卸载策略进行优化时具有最好的性能.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009749
    摘要:
    针对自然果园环境下苹果果实的识别, 本文提出了一种改进YOLOv8n模型的轻量化苹果检测算法. 首先, 通过使用DSConv和FEM特征提取模块的组合来替换主干网络中的部分常规卷积进行轻量化改进, 缩减卷积过程中的浮点数和计算量; 为了在轻量化过程中保持性能, 在特征处理的过程中, 引入结构化状态空间模型构建CBAMamba模块, 使用Mamba结构高效处理特征; 此后将检测头处的卷积替换为RepConv, 并减小卷积层; 最后, 更改边界框损失函数为动态非单调聚焦机制WIoU, 提高模型收敛速度, 进一步提升模型检测性能. 实验表明, 在公开数据集上, 本文提出的 YOLOv8改进算法比原始YOLOv8n算法分别提升1.6%的mAP@0.5和1.2%的mAP@0.5:0.95, 与此同时提升了8.0%的FPS并降低了13.3%的模型参数量, 轻量化的设计使之在机器人和嵌入式系统部署领域具有较强的实用性.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009750
    摘要:
    针对实际运行机械设备信号易受噪声干扰导致故障特征难以准确提取, 以及设备单一位置信息无法全面反映运行状态的问题, 本研究提出了一种改进的信号自适应分解与多源数据融合的时空故障分类方法. 首先, 提出了一种改进的信号自适应分解算法SAVMD (signal adaptive variational mode decomposition), 并构建加权峭度稀疏度指标WKS (weighted kurtosis sparsity)筛选出富含特征信息的IMF (intrinsic mode function)分量, 以实现信号重构. 其次, 将不同位置传感器的多源数据进行融合, 并以周期性采样得到的数据集作为模型的输入. 最后, 构建了一个时空故障分类模型来处理多源数据, 通过改进的稀疏自注意力机制降低噪声干扰, 并利用双编码器机制实现对时间步长和空间通道信息的有效处理. 在3个公开的机械设备故障数据集上进行实验, 平均准确率分别达到了99.1%、98.5%和99.4%. 与其他故障分类方法相比表现更好, 具有良好的自适应性和鲁棒性, 为机械设备的故障诊断提供了一种可行的方法.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009782
    摘要:
    提示词工程在解锁大语言模型潜能上具有重要作用. 该方法通过设计提示指令指导模型响应, 确保响应的相关性、连贯性和准确性. 提示工程无需微调模型参数, 可与下游任务无缝衔接. 因此, 各种提示词工程技术成为近年来研究的热点. 据此, 介绍了创建有效提示词的关键步骤, 总结了基础和高级提示词工程技术方法, 如思维链、思维树, 深入探讨了每种方法的优势和局限性. 同时, 讨论了如何从不同角度和不同方法评估提示方法的有效性. 这些技术的迅速发展使大语言模型在各种应用中取得了成功, 从教育、医疗到代码生成等. 最后, 展望了提示词工程技术的未来研究方向.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009744
    摘要:
    在视觉跟踪领域, 大多数基于深度学习的跟踪器过分地强调精度, 而忽视了算法速度. 因此, 这些算法在移动平台上的部署(无人机), 受到了阻碍. 在本文中, 提出了一种基于Siamese的深度交叉指导跟踪器(SiamDCG). 为了更好地在边缘计算设备上部署, 在MobileNetV3-small的基础上设计了独特的backbone结构. 此外, 针对无人机场景的复杂性, 传统使用狄拉克 δ分布预测目标框的方式有很大的弊端, 为了克服边界框存在的模糊效应, SiamDCG将回归框分支转为预测偏移量的分布, 并且用学习到的分布去指导分类的准确性. 在多个无人机benchmark上的优秀表现, 都显示了其鲁棒性与高效性. 在Intel i5 12代CPU上, SiamDCG运行速度是SiamRPN++的167倍, 使用的参数仅为它的1/98, FLOPs是1/410 .
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009742
    摘要:
    具身智能(embodied AI)需要能够与环境进行互动和感知, 并具备自主规划、决策和行动等能力. 行为树(BT)由于其模块化和高效控制的特性, 已经成为机器人技术中广泛使用的方法. 然而, 现有的行为树生成技术在处理复杂任务时仍面临一定的挑战. 这些方法通常依赖于领域专业知识, 生成行为树的能力有限. 此外, 许多现有方法在语言理解方面存在不足, 或者在理论上无法保证行为树的成功, 从而导致在机器人上的实际部署难度较大. 本研究提出一种新的行为树自动生成方法, 该方法基于大语言模型(LLM)和场景语义感知, 生成包含任务目标的初始行为树. 本文的方法根据机器人的能力设计机器人动作原语和相关条件节点, 并以此设计提示(prompt)使LLM输出行为规划(generated plan), 然后将行为规划转化为初始行为树. 虽然本文以此为示例, 但该方法具有广泛的适用性, 可以根据不同需求应用于其他类型的机器人任务. 同时, 本文将这种方法应用于机器人任务中, 并给出具体实现方法和示例. 在机器人执行任务过程中, 行为树可以根据机器人操作失误和环境变化动态更新, 对外部环境变化具有一定的鲁棒性. 本文进行了初始行为树生成验证实验, 并在仿真机器人环境中进行了验证, 展示了本文方法的有效性.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009739
    摘要:
    为求解带时间窗的车辆路径问题, 以最小化总行驶里程为目标建立混合整数规划模型, 提出了一种具有时间窗约束松弛的混合蚁群算法. 首先, 提出改进的蚁群算法与“TSP-Split编码与解码”相结合的方法, 来构建允许违反时间窗约束的解路径, 以提高算法的全局寻优能力. 然后, 利用“及时返回”原则和惩罚函数方法, 提出基于变邻域搜索的修复策略来修复不可行解. 最后, 对56个Solomon和12个Homberger基准算例进行试验计算, 结果表明该算法的求解质量优于文献中的对比算法, 且在50个测试实例上获得了已知最优解, 其余实例也能在可接受计算时间内获得准最优解, 验证了所提算法的有效性.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009717
    摘要:
    时间序列分段线性表示算法利用时间序列的趋势变化特征, 用序列中较少点来表示整个时间序列. 但是大多算法主要关注局部序列点信息, 很少关注全局数据, 且部分算法只关注算法在数据集上的拟合, 很少应用到分类问题中. 针对上述问题, 本文提出了基于角度关键点和转向点的时间序列趋势特征提取算法, 首先, 该算法根据序列数据的角度变化值来选择角度显著点, 然后基于角度关键点的基础上再提取转向点, 根据分段的要求, 判断是否进行插值操作, 从而得到符合要求的分段点序列. 本文在模拟数据和40个公开数据集上进行拟合和分类实验, 实验结果表明, 本文算法相较于分段聚合近似PAA、自底向下TD、自顶向上BU、基于拐点FFTO、基于转折点和趋势段Trend、基于趋势转折点ITTP等算法, 在模拟数据集拟合效果更好; 在UCR公开数据集平均拟合误差为1.165; 分类准确性同Keogh团队公布的DTW-1NN算法高出2.8%.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009719
    摘要:
    知识蒸馏(KD)中的温度在以前的大多数工作中被设置为蒸馏过程的固定值. 然而, 重新研究温度时, 发现固定的温度限制了对每个样本中固有知识的利用. 本文根据能量得分将数据集分为低能量样本和高能量样本, 通过实验证实了低能量样本的置信度得分高, 表明其预测是确定的, 而高能量样本的置信度得分低, 意味着预测是不确定的. 为了通过调整非目标类预测来提取最佳的知识, 本文对低能量样本应用较高的温度以创建更平滑的分布, 并对高能量样本应用较低的温度以获得更清晰的分布. 此外, 为解决学生对突出特征的不平衡依赖和对暗知识的疏忽, 本文引入熵重加权的知识蒸馏, 这是利用教师预测中的熵在样本基础上重新加权能量蒸馏损失的方法. 本文方法可以很容易地应用于其他基于逻辑的知识蒸馏方法中, 并获得更好的性能, 可以更接近甚至优于基于特征的方法. 本文在图像分类数据集(CIFAR-100、ImageNet)上进行了广泛的实验, 证明了该方法的有效性.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009703
    摘要:
    针对现有二进制模糊测试难以深入程序内部发现漏洞这一问题, 提出一种融合硬件程序追踪、静态分析和混合执行3种技术的多角度优化方案. 首先, 利用静态分析和硬件追踪评估程序路径复杂度及执行概率; 之后, 根据路径复杂度与执行概率进行种子选择和变异能量分配; 同时, 利用混合执行辅助种子生成并记录关键字节用于针对性变异. 实验结果表明, 相比现有模糊测试方案, 该方案在多数情况下能发现更多的程序路径和crash.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009686
    摘要:
    传统的目标检测算法存在检测效果不佳及检测效率低等问题, 针对这些问题, 提出了一种基于YOLOv7网络改进的小目标检测方法. 该方法在原网络的高效层聚合模块(efficient layer aggregation network, ELAN)中添加了更多路径, 且将不同路径中的特征信息有效融合后引入SKNet网络, 使得模型更加关注网络中不同尺度大小的特征, 提取出更多有效信息; 同时为了加强小目标对空间信息的感知能力, 设计了一个eSE模块连接在ELAN末端, 以此构建新的高效层聚合网络模块(enhanced features efficient layer aggregation network, EF-ELAN), 该模块完整地保留了图像特征信息, 提高了网络的泛化能力. 同时设计了一种CS-ASFF (cross stage-adaptively spatial feature fusion)模块来应对小目标检测出现的特征尺度不一致问题, 该模块基于 ASFF网络和Nest连接方式进行改进, 对特征金字塔的每一张图片进行卷积、池化等操作提取权重, 将特征信息作用在某一层上, 同时利用其余特征层来加强网络的特征处理能力. 实验结果表明, 本文提出的算法在DIOR数据集和DOTA数据集上的平均精准率分别提高了1.5%、2.1%, 实验结果验证了所提出的算法能够有效地提升小目标的检测效果.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009725
    摘要:
    针对现有消防机器人在城区内中远程环境执行火灾救援应急任务时, 难以提前获取全局先验地图, 需人工遥控机器人至灭火地点, 操作繁琐, 影响灭火效率的问题, 设计了一种消防机器人城区内自主导航系统, 系统基于商业电子地图(如高德地图、百度地图等2D电子地图), 有效整合了全球定位系统(GNSS)和局部激光环境感知技术. 首先借助商业电子地图来规划粗略的全局子目标点, 将全局目标点序列与真实定位信息进行数据配准, 然后将序列发送至局部规划器. 之后在激光感知建立的局部栅格地图中, 按照子目标点的顺序执行局部规划任务, 改进型局部规划器在运动过程根据实时环境变化更新子目标点. 在仿真环境中多次模拟并使用履带式小车在实际场景进行验证, 结果表明设计系统可以在事先未建立环境先验地图的情况下, 准确进行室外远距离的导航任务, 可作为消防机器人高效安全户外导航的方案.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009734
    摘要:
    该研究旨在深入探究在复杂多变的交通环境下交通标志与信号灯的联合检测问题, 分析并解决恶劣天气、低光照和图像背景干扰等不利因素对检测精度的影响. 为此, 采用了一种改进RT-DETR网络的策略. 基于资源有限的运行环境, 并为提高模型对于遮挡以及小目标的检测能力, 提出PE-ResNet (ResNet with PConv and efficient multi-scale attention)网络作为主干网络. 为了增强特征融合能力, 提出了NCFM (new cross-scale feature-fusion module)模块, 有助于更好地整合图像中的语义信息和细节信息, 对复杂场景的理解更为全面. 最后引入MPDIoU损失函数, 更精确地衡量目标框之间的位置关系. 改进后的网络相较于基线模型参数量降低了约14%. 在CCTSDB 2021数据集、S2TLD数据集以及自制的MTST (multi-scene traffic signs)数据集上, mAP50:95分别增加了1.9%、2.2%和3.7%. 实验结果表明, 改进之后的RT-DETR模型可以有效地改进复杂场景下目标检测精度.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009737
    摘要:
    针对道路损伤检测面临的多尺度目标、复杂的目标结构、样本分布不均及难易样本对边界框回归的影响等问题, 本研究提出了一种基于改进YOLOv8的道路损伤检测算法. 该方法通过引入动态蛇形卷积 (dynamic snake convolution, DSConv) 替代原有C2f (faster implementation of CSP bottleneck with 2 convolutions) 模块中的部分Conv, 以自适应聚焦于细小而曲折的局部特征, 增强对几何结构的感知. 在每个检测头前引入高效多尺度注意力 (efficient multi-scale attention, EMA) 模块, 实现跨维度交互, 捕获像素级别关系, 提升对复杂全局特征的泛化能力. 同时, 增设小目标检测层以提高小目标检测精度. 最后, 提出Flex-PIoUv2策略, 通过线性区间映射和尺寸适应性惩罚因子, 有效缓解样本分布不均和锚框膨胀问题. 实验结果表明, 该改进模型在RDD2022数据集上的F1分数、平均精度均值 (mAP50、mAP50-95) 分别提高了1.5个百分点、2.1个百分点和1.2个百分点. 此外, 在GRDDC2020和China road damage数据集上的验证结果显示, 该算法具有良好的泛化性.
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2000,9(2):38-41, DOI:
    [摘要] (12721) [HTML] (0) [PDF ] (22418)
    摘要:
    本文详细讨论了VRML技术与其他数据访问技术相结合 ,实现对数据库实时交互的技术实现方法 ,并简要阐述了相关技术规范的语法结构和技术要求。所用技术手段安全可靠 ,具有良好的实际应用表现 ,便于系统移植。
    1993,2(8):41-42, DOI:
    [摘要] (9772) [HTML] (0) [PDF ] (32205)
    摘要:
    本文介绍了作者近年来应用工具软件NU清除磁盘引导区和硬盘主引导区病毒、修复引导区损坏磁盘的 经验,经实践检验,简便有效。
    1995,4(5):2-5, DOI:
    [摘要] (9319) [HTML] (0) [PDF ] (14476)
    摘要:
    本文简要介绍了海关EDI自动化通关系统的定义概况及重要意义,对该EDI应用系统下的业务运作模式所涉及的法律问题,采用EDIFACT国际标准问题、网络与软件技术问题,以及工程管理问题进行了结合实际的分析。
    2016,25(8):1-7, DOI: 10.15888/j.cnki.csa.005283
    [摘要] (8958) [HTML] () [PDF 1167952] (39213)
    摘要:
    从2006年开始,深度神经网络在图像/语音识别、自动驾驶等大数据处理和人工智能领域中都取得了巨大成功,其中无监督学习方法作为深度神经网络中的预训练方法为深度神经网络的成功起到了非常重要的作用. 为此,对深度学习中的无监督学习方法进行了介绍和分析,主要总结了两类常用的无监督学习方法,即确定型的自编码方法和基于概率型受限玻尔兹曼机的对比散度等学习方法,并介绍了这两类方法在深度学习系统中的应用,最后对无监督学习面临的问题和挑战进行了总结和展望.
    2008,17(5):122-126, DOI:
    [摘要] (7968) [HTML] (0) [PDF ] (48925)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
    2011,20(11):80-85, DOI:
    [摘要] (7688) [HTML] () [PDF 863160] (43070)
    摘要:
    在研究了目前主流的视频转码方案基础上,提出了一种分布式转码系统。系统采用HDFS(HadoopDistributed File System)进行视频存储,利用MapReduce 思想和FFMPEG 进行分布式转码。详细讨论了视频分布式存储时的分段策略,以及分段大小对存取时间的影响。同时,定义了视频存储和转换的元数据格式。提出了基于MapReduce 编程框架的分布式转码方案,即Mapper 端进行转码和Reducer 端进行视频合并。实验数据显示了转码时间随视频分段大小和转码机器数量不同而变化的趋势。结
    1999,8(7):43-46, DOI:
    [摘要] (7362) [HTML] (0) [PDF ] (24089)
    摘要:
    用较少的颜色来表示较大的色彩空间一直是人们研究的课题,本文详细讨论了半色调技术和抖动技术,并将它们扩展到实用的真彩色空间来讨论,并给出了实现的算法。
    2022,31(5):1-20, DOI: 10.15888/j.cnki.csa.008463
    [摘要] (6630) [HTML] (4064) [PDF 2584043] (6039)
    摘要:
    深度学习方法的提出使得机器学习研究领域得到了巨大突破, 但是却需要大量的人工标注数据来辅助完成. 在实际问题中, 受限于人力成本, 许多应用需要对从未见过的实例类别进行推理判断. 为此, 零样本学习(zero-shot learning, ZSL)应运而生. 图作为一种表示事物之间联系的自然数据结构, 目前在零样本学习中受到了越来越多的关注. 本文对零样本图学习方法进行了系统综述. 首先概述了零样本学习和图学习的定义, 并总结了零样本学习现有的解决方案思想. 然后依据图的不同利用方式对目前零样本图学习的方法体系进行了分类. 接下来讨论了零样本图学习所涉及到的评估准则和数据集. 最后指明了零样本图学习进一步研究中需要解决的问题以及未来可能的发展方向.
    2012,21(3):260-264, DOI:
    [摘要] (6574) [HTML] () [PDF 336300] (45381)
    摘要:
    开放平台的核心问题是用户验证和授权问题,OAuth 是目前国际通用的授权方式,它的特点是不需要用户在第三方应用输入用户名及密码,就可以申请访问该用户的受保护资源。OAuth 最新版本是OAuth2.0,其认证与授权的流程更简单、更安全。研究了OAuth2.0 的工作原理,分析了刷新访问令牌的工作流程,并给出了OAuth2.0 服务器端的设计方案和具体的应用实例。
    2007,16(9):22-25, DOI:
    [摘要] (6540) [HTML] (0) [PDF ] (7212)
    摘要:
    本文结合物流遗留系统的实际安全状态,分析了面向对象的编程思想在横切关注点和核心关注点处理上的不足,指出面向方面的编程思想解决方案对系统进行分离关注点处理的优势,并对面向方面的编程的一种具体实现AspectJ进行分析,提出了一种依据AspectJ对遗留物流系统进行IC卡安全进化的方法.
    2011,20(7):184-187,120, DOI:
    [摘要] (6414) [HTML] () [PDF 731903] (33972)
    摘要:
    针对智能家居、环境监测等的实际要求,设计了一种远距离通讯的无线传感器节点。该系统采用集射频与控制器于一体的第二代片上系统CC2530 为核心模块,外接CC2591 射频前端功放模块;软件上基于ZigBee2006 协议栈,在ZStack 通用模块基础上实现应用层各项功能。介绍了基于ZigBee 协议构建无线数据采集网络,给出了传感器节点、协调器节点的硬件设计原理图及软件流程图。实验证明节点性能良好、通讯可靠,通讯距离较TI 第一代产品有明显增大。
    (), DOI:
    [摘要] (6320) [HTML] (19) [PDF ] (14)
    摘要:
    2019,28(6):1-12, DOI: 10.15888/j.cnki.csa.006915
    [摘要] (6118) [HTML] (19367) [PDF 672566] (26401)
    摘要:
    知识图谱是以图的形式表现客观世界中的概念和实体及其之间关系的知识库,是语义搜索、智能问答、决策支持等智能服务的基础技术之一.目前,知识图谱的内涵还不够清晰;且因建档不全,已有知识图谱的使用率和重用率不高.为此,本文给出知识图谱的定义,辨析其与本体等相关概念的关系.本体是知识图谱的模式层和逻辑基础,知识图谱是本体的实例化;本体研究成果可以作为知识图谱研究的基础,促进知识图谱的更快发展和更广应用.本文罗列分析了国内外已有的主要通用知识图谱和行业知识图谱及其构建、存储及检索方法,以提高其使用率和重用率.最后指出知识图谱未来的研究方向.
    2004,13(10):7-9, DOI:
    [摘要] (6068) [HTML] (0) [PDF ] (12291)
    摘要:
    本文介绍了车辆监控系统的组成,研究了如何应用Rockwell GPS OEM板和WISMOQUIKQ2406B模块进行移动单元的软硬件设计,以及监控中心 GIS软件的设计.重点介绍嵌入TCP/IP协议处理的Q2406B模块如何通过AT指令接入Internet以及如何和监控中心传输TCP数据.
    2008,17(1):113-116, DOI:
    [摘要] (6007) [HTML] (0) [PDF ] (50403)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(8):87-89, DOI:
    [摘要] (5939) [HTML] (0) [PDF ] (42377)
    摘要:
    随着面向对象软件开发技术的广泛应用和软件测试自动化的要求,基于模型的软件测试逐渐得到了软件开发人员和软件测试人员的认可和接受。基于模型的软件测试是软件编码阶段的主要测试方法之一,具有测试效率高、排除逻辑复杂故障测试效果好等特点。但是误报、漏报和故障机理有待进一步研究。对主要的测试模型进行了分析和分类,同时,对故障密度等参数进行了初步的分析;最后,提出了一种基于模型的软件测试流程。
    2008,17(8):2-5, DOI:
    [摘要] (5810) [HTML] (0) [PDF ] (33049)
    摘要:
    本文介绍了一个企业信息门户中单点登录系统的设计与实现。系统实现了一个基于Java EE架构的结合凭证加密和Web Services的单点登录系统,对门户用户进行统一认证和访问控制。论文详细阐述了该系统的总体结构、设计思想、工作原理和具体实现方案,目前系统已在部分省市的广电行业信息门户平台中得到了良好的应用。
    2004,13(8):58-59, DOI:
    [摘要] (5762) [HTML] (0) [PDF ] (28579)
    摘要:
    本文介绍了Visual C++6.0在对话框的多个文本框之间,通过回车键转移焦点的几种方法,并提出了一个改进方法.
    2009,18(5):182-185, DOI:
    [摘要] (5730) [HTML] (0) [PDF ] (34952)
    摘要:
    DICOM 是医学图像存储和传输的国际标准,DCMTK 是免费开源的针对DICOM 标准的开发包。解读DICOM 文件格式并解决DICOM 医学图像显示问题是医学图像处理的基础,对医学影像技术的研究具有重要意义。解读了DICOM 文件格式并介绍了调窗处理的原理,利用VC++和DCMTK 实现医学图像显示和调窗功能。
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2007,16(10):48-51, DOI:
    [摘要] (4869) [HTML] (0) [PDF 0.00 Byte] (89117)
    摘要:
    论文对HDF数据格式和函数库进行研究,重点以栅格图像为例,详细论述如何利用VC++.net和VC#.net对光栅数据进行读取与处理,然后根据所得到的象素矩阵用描点法显示图像.论文是以国家气象中心开发Micaps3.0(气象信息综合分析处理系统)的课题研究为背景的.
    2002,11(12):67-68, DOI:
    [摘要] (4161) [HTML] (0) [PDF 0.00 Byte] (60050)
    摘要:
    本文介绍非实时操作系统Windows 2000下,利用VisualC++6.0开发实时数据采集的方法.所用到的数据采集卡是研华的PCL-818L.借助数据采集卡PCL-818L的DLLs中的API函数,提出三种实现高速实时数据采集的方法及优缺点.
    2008,17(1):113-116, DOI:
    [摘要] (6007) [HTML] (0) [PDF 0.00 Byte] (50403)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(5):122-126, DOI:
    [摘要] (7968) [HTML] (0) [PDF 0.00 Byte] (48925)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号