• 当期目录
  • 优先出版
  • 过刊浏览
  • 点击排行
  • 下载排行
  • 综述文章
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    2024,33(11):1-14, DOI: 10.15888/j.cnki.csa.009677, CSTR:
    [摘要] (229) [HTML] (150) [PDF 3.76 M] (978)
    摘要:
    为了解决图像采集过程中眼图消失和头部姿态估计不准确的问题, 利用基于非接触式的眼部信息获取方法采集人脸图像, 从单个图像帧中确定飞行员当前的注视方向. 同时, 针对现有网络忽略头部运动对视线造成遮挡所导致的分类效果不佳问题, 结合人脸图像与头部姿态特征, 通过改进的MobileViT模型提出一种用于飞行员注视区域分类的多模态数据融合网络. 首先提出了多模态数据融合模块解决特征拼接过程中尺寸不平衡导致的过拟合问题, 其次提出一种基于并行分支SE机制的逆残差块, 充分利用网络浅层的空间和通道特征信息, 并结合Transformer的全局注意力机制捕捉多尺度特征. 最后, 重新设计了Mobile Block结构, 使用深度可分离卷积降低模型复杂度. 利用自制数据集FlyGaze对新模型和主流基线模型进行对比, 实验结果表明, PilotT模型对注视区域0、3、4、5的分类准确率均在92%以上, 且对人脸发生偏转的情况具有较强适应力. 研究结果对提升飞行训练质量以及飞行员意图识别和疲劳评估具有实际应用价值.
    2024,33(11):15-26, DOI: 10.15888/j.cnki.csa.009681, CSTR:
    [摘要] (94) [HTML] (134) [PDF 3.61 M] (773)
    摘要:
    在多目标跟踪任务中, 外界噪声的干扰会导致传统方法的系统建模不可靠, 从而降低目标位置预测的准确性; 而密集人群引起的拥挤和遮挡问题则会严重影响目标外观的可靠性, 导致错误的身份关联. 为了解决这些问题, 本文提出一种多目标跟踪算法Ecsort. 该算法在传统运动预测的基础上, 引入噪声补偿模块, 降低噪声干扰引起的误差, 提高位置预测的准确性. 其次, 引入特征相似度匹配模块, 通过学习目标的判别性外观特征, 并结合运动线索和判别性外观特征的优势, 从而实现精确的身份关联. 通过在多目标跟踪基准数据集上进行的大量实验结果表明, 与基线模型相比, 该方法在MOT17测试集上的IDF1 (ID F1 score)、HOTA (higher order tracking accuracy)、AssA (association accuracy)、DetA (detection accuracy)分别提高了1.1%、0.5%、0.6%、0.3%, 在MOT20测试集上的IDF1、HOTA、AssA、DetA分别提高了2.3%、1.9%、3.4%、0.2%.
    2024,33(11):27-37, DOI: 10.15888/j.cnki.csa.009682, CSTR:
    [摘要] (139) [HTML] (120) [PDF 1.95 M] (712)
    摘要:
    为了能够更准确且快速地识别人脸表情, 提出了一种优化的基于ResNet34网络的双线性结构(OBSR-Net)来进行人脸表情识别. OBSR-Net采用双线性网络结构作为整体框架, 主干网络使用ResNet34网络, 通过平移不变的方式对局部成对特征交互进行建模, 从而提取更加完整有效的特征, 同时采用迁移学习的策略来降低人脸表情小样本图像数据集对深度学习方法的限制. 此外, 在训练过程中使用一种新的通用优化技术, 即梯度集中. 该方法通过将梯度向量集中到零均值来直接对梯度进行操作, 可以看作是一种具有约束损失函数的投影梯度下降方法. OBSR-Net在Fer2013和CK+两个公开数据集上进行实验, 分别取得了77.65%和98.82%的识别准确率. 实验结果表明, 与其他先进的人脸表情识别方法相比, OBSR-Net表现出较强的竞争力.
    2024,33(11):38-47, DOI: 10.15888/j.cnki.csa.009702, CSTR:
    [摘要] (100) [HTML] (106) [PDF 2.23 M] (778)
    摘要:
    相比集中式的云计算框架, 边缘计算在云中心和现场智能设备之间部署了额外的“边缘服务器”, 支持现场智能设备快速、高效地完成运算任务和事件处理. 边缘计算系统中, 现场智能设备数量庞大、边缘计算服务器繁杂, 它们存储的数据敏感和私密性要求高. 边缘计算系统的这些特点, 给网络安全防护带来困难. 解决边缘计算系统的信息和网络安全是边缘计算技术大规模产业化的关键. 而由于边缘服务器设备和现场智能设备的计算能力、网络能力和存储能力的局限, 传统的计算机网络安全技术不能完全满足要求. 分析适合边缘计算系统的联邦学习、轻量加密、混淆与虚拟位置信息、匿名身份认证等有效的敏感数据保护技术, 以及探讨人工智能和区块链等新技术在边缘计算防范恶意攻击的应用, 助力边缘计算的产业化发展.
    2024,33(11):48-57, DOI: 10.15888/j.cnki.csa.009683, CSTR:
    [摘要] (100) [HTML] (116) [PDF 1.76 M] (745)
    摘要:
    随着深度学习技术的发展, 多数研究工作将短临降水预报视为雷达回波序列的预测任务. 由于降水复杂性的非线性时空变换, 现有的短临预报存在准确性低、外推时效短、难以应对复杂的非线性时空变换等缺点. 为解决以上问题, 本文基于U-Net和LSTM提出了S-UNet短临降水预报网络. 首先本文提出了S-UNet layer (SL)模块, 以帮助网络更好地提取雷达序列特征, 构建时空变化的整体趋势, 从而提高网络效率, 增加网络的外推时长. 其次, 为更好地应对雷达回波的变形、积累和消散的复杂性, 增强网络对复杂的空间关系的捕获能力和运动轨迹的模拟能力, 本文基于LSTM构建了雷达特征模块radar feature (RF). 最后, 将SL模块和RF模块与U-Net框架结合, 提出了S-UNet短临降水预报网络, 并在KNMI数据集上实现了先进的性能. 实验结果表明, 在KNMI的NL-50和NL-20数据集上, 本文所提的方法与主流方法相比, 海德克技能得分和关键成功指数分别提高了5.25% (6.57%)和2.17% (4.75%), 达到了0.30 (0.29)和0.72 (0.58); 准确率提高了2.10% (1.35%), 达到了0.80 (0.80); 假接受率降低了4.27% (1.80%), 达到了0.24 (0.38). 除此之外, 本文通过消融实验证明了所提出模块及结合方法的有效性.
    2024,33(11):58-67, DOI: 10.15888/j.cnki.csa.009678, CSTR:
    [摘要] (142) [HTML] (116) [PDF 15.41 M] (914)
    摘要:
    钢材表面缺陷的检测质量直接影响工业生产安全性和机器性能质量, 现实工厂钢材质量把控受限于设备条件, 在实现高精度强实时的检测效果仍面临着挑战. 为了解决这一问题, 提出一种多尺度融合的轻量级YOLOv8n检测算法. 首先引入一种结合HGnetv2与RepConv的轻量级多尺度融合主干网络(RepHGnetv2), 提高Backbone的特征提取能力与泛化能力同时降低了模型的复杂度; 在Head部分, 利用ADown下采样模块替换原算法的普通卷积(Conv), 降低计算量并提高语义保留能力; 最后将原算法的Loss函数替换为SlideLoss, 改善样本之间不平衡的问题. 在NEU-DET数据集上进行消融与对比实验, 改进算法与原算法相比, mAP@0.5提升6.7%, Precision提升9.3%, 模型大小下降25.5%, 计算量下降了17.2%, FPS也有一定的提升; 并在VOC2012数据集上进行了通用性对比实验, 实验结果表明改进算法可以有效提高缺陷检测精度与效率, 同时具有较好的通用性.
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009740
    摘要:
    城市街道场景实例分割算法可以显著提升城市环境感知和智能交通系统的准确性与效率, 针对城市街景行人和车辆之间相互遮挡和背景干扰严重等问题, 提出一种基于频率注意力机制和多尺度特征融合的实例分割模型FMInst. 首先, 构建一种高低频注意力机制进行交互编码从而增加高分辨率细节信息. 其次, 在Swin Transformer主干网络的Patch Merging层引入软池化操作, 减少特征信息损失, 有效提高小尺度目标分割结果. 最后, 结合MLP层构建多尺度的深度卷积, 有效增强目标局部信息提取, 提升实例分割精度. 在Cityscapes公共数据集进行对比实验, 结果表明FMInst的mAP提高1.2%, 达35.6%, 同时AP50提高2.2%, 达61.4%, 极大地改善实例分割的掩码质量和分割效果.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009741
    摘要:
    由图像到文本的跨模态行人重识别中缩小模态间差异一直是一个主要挑战, 针对该问题, 研究了一种基于CLIP-ReID (contrastive language-image pretraining-person re-identification)的改进方法. 引入了上下文调整网络模块和跨模态注意力机制模块. 上下文调整网络模块对图像特征进行深层次的非线性转换, 并有效地与可学习上下文向量相结合, 增强图像和文本间的语义关联性. 跨模态注意力机制模块通过对图像和文本特征进行动态加权和融合, 使得模型能够在处理一个模态的信息时考虑到另一模态, 提升模型在不同模态间的交互. 该方法分别在MSMT17、Market1501、DukeMTMC公共数据集上进行了评估, 实验结果在mAP值上分别提升了2.2%、0.5%、0.4%; 在R1值上分别提升了1.1%、0.1%、1.2%. 结果表明所提方法有效地提升了行人重识别的精度.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009738
    摘要:
    针对现有大气能见度检测方法易受主观因素和设备复杂度影响的问题, 提出一种新型的图像处理估算的能见度算法. 首先结合暗通道先验理论, 提出一种基于图像亮度与饱和度差值的全局大气光值估计方法, 进一步求解大气透射率; 然后采用曲率滤波对透射率进行细化处理; 接着, 通过车道线检测技术和消光系数计算得出大气能见度估算值; 最后, 建立一个基于线性回归方程的能见度修正模型对大气能见度的估算值进行修正. 实验结果验证了所提算法在雾霾天气下对交通监控场景中的能见度估算具有准确性和实用性.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009757
    摘要:
    Android应用异步消息执行顺序的不确定性是导致其不稳定的主要原因. 现有不稳定测试研究大多通过随机确定异步消息的执行顺序以触发不稳定测试, 其检测效果不佳且效率较低. 本文提出一种基于Happens-Before (HB)关系的Android应用并发不稳定测试检测方法, 通过分析Android应用测试用例执行轨迹中异步消息间的HB关系, 进而确定异步消息的可执行区间; 并设计最大差异化调度策略, 有指导性地确定异步消息执行顺序, 使调度后的测试执行轨迹上异步消息执行序与原测试执行轨迹差异最大化, 进而尝试改变测试执行结果, 检测测试的不稳定性. 为验证本文方法的有效性, 针对40个Android应用程序的50个不稳定测试用例进行实验, 实验结果表明, 本文方法可检测全部不稳定测试用例, 相比当前主流工具检测效果提升6%, 且平均检测时间缩短31.78%.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009761
    摘要:
    分布式存储系统采用纠删码来实现高可靠和低开销的数据存储. 为了提供不同的可靠性和多样的访问性能, 存储系统需要对纠删码数据进行冗余转换, 即改变其编码参数. 条带合并机制为存储系统的冗余转换提供了一种思路. 然而, 基于传统纠删码的条带合并会在过程中引发大量的数据块重分布和校验块重计算I/O开销, 且在多次合并中会进一步加剧I/O. 针对此问题, 本文提出了一种新的树型里德-所罗门码, 通过分散数据块以消除数据块重分布I/O, 并通过设计编码矩阵以节约校验块重计算I/O. 树型里德-所罗门码进一步设计了存储单元, 将参与合并的条带组织成一颗树, 使得多次合并依据树结构自底向上高效完成. 本文设计实现了分布式存储原型系统. 实验表明, 树型里德-所罗门码相较于传统纠删码, 可以大大减少条带合并的完成时间.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009771
    摘要:
    针对当下层级文本分类模型尚未充分利用层级实例的标签信息以及缺乏对类别分布不平衡的处理这两方面问题, 本文提出一种面向标签共现和长尾分布的层级文本分类方法(hierarchical text classification for label co-occurrence and long-tail distribution, LC-LTD), 对基于共享标签的文本全局语义和面向长尾分布的平衡损失函数进行研究. 首先, 设计一种基于共享标签的对比学习目标, 使具有更多共享标签的文本表示在特征空间中的语义距离更近, 引导模型生成具有判别性的语义表征; 其次, 引入分布平衡损失函数替换二进制交叉熵损失, 缓解层级分类固有的长尾分布问题, 提高模型的泛化能力. 在WOS、BGC两个公开数据集上将LC-LTD与当前多个主流模型进行比较, 结果表明所提方法具有更好的分类性能, 更适合处理层级文本分类任务.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009772
    摘要:
    图像隐写分析旨在检测图像是否经过隐写术处理从而携带了秘密信息. 基于孪生网络的隐写分析算法通过计算待检测图像左右分区的不相似性以此判断图像是否携带秘密信息, 是目前深度学习图像隐写分析算法里面准确度较高的网络. 然而, 基于孪生网络的图像隐写分析算法仍然存在一些局限性. 首先, 孪生网络在预处理层和特征提取层中叠加的卷积块, 忽略了隐写信号从浅层传递到深层过程中容易丢失的问题. 其次, 现有的孪生网络使用的SRM滤波器仍然沿用其他网络使用的高通滤波器来抑制图像内容, 忽略了生成的残差图大小单一的问题. 为了解决以上问题, 本文提出了基于增强残差特征的孪生网络图像隐写分析方法. 本文方法设计了一种基于注意力的倒残差模块, 通过在预处理层和特征提取层的卷积块后添加基于注意力的倒残差模块, 重用图像特征, 引入注意力机制, 增强网络对图像纹理复杂区域的特征图赋予更多权重. 同时为了更好地抑制图像内容, 提出多尺度滤波器, 将残差类型调整为多个尺寸不同的卷积核进行操作, 丰富残差特征. 实验结果表明, 本文提出的基于注意力的倒残差模块和多尺度滤波器相较于现有方法分类效果更佳.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009754
    摘要:
    考虑到软件需求文本区别于其他普通文本的独特领域信息外, 还包含一些重要的上下文关系以及固有的二义性问题, 本文提出了一个图卷积与BERT融合的软件需求自动分类模型——BERT-FGCN (BERT-FusionGCN), 将图卷积网络(GCN)用于软件需求分类领域, 利用GCN对邻居节点信息进行信息传播和特征聚合的优势, 捕捉需求语句中单词或句子之间的上下文关系, 以进一步提高需求分类的结果. 首先构建需求文本的文本共现图和依存句法图, 将两种图进行融合来捕获句子的结构信息, 利用GCN对建模后的需求语句的图结构进行卷积得到图向量, 最后将图向量与BERT特征提取后得到的向量进行融合, 以此来对软件需求文本自动分类. 在PROMISE数据集上进行实验, BERT-FGCN在二分类上的F1分数达到95%, 多分类任务的F1分数提高2%.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009735
    摘要:
    针对网约车运营中经济、环境和社会效益这3方面存在的相互制衡关系, 提出了一种平衡经济、环境和社会效益三重底线的多目标调度问题模型以及基于动态解空间规划的求解算法. 问题模型首次将传统出租车服务与共享出行模式整合, 全面覆盖4种不同的司机与乘客互动情景, 旨在通过优化策略实现3方面效益的协同提升. 求解算法创新性地结合了lapjv算法与分支限界法, 确保在给定阈值约束下, 能够高效探索并确定满足多目标优化的最优匹配策略. 该算法相比于SCIP, 结果平均误差在4%内, 求解平均速度提升了99.1%. 研究进一步通过系统性地应用此算法, 针对不同阈值约束条件, 求解并生成帕累托前沿图, 直观展示了经济、环境与社会效益这3个目标在其他两项指标约束下的权衡与变化趋势, 为网约车运营提供了决策参考依据.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009736
    摘要:
    由于大气雾和气溶胶的存在, 图像能见度显著下降且色彩失真, 给高级图像识别带来极大困难. 现有的图像去雾算法常存在过度增强、细节丢失和去雾不充分等问题. 针对过度增强和去雾不充分的问题, 本文提出了一种基于频率和注意力机制的图像去雾算法(frequency and attention mechanism of the image dehazing network, FANet). 该算法采用编码器-解码器结构, 通过构建双分支频率提取模块获取全局和局部的高低频信息. 构建频率融合模块调整高低频信息的权重占比, 并在下采样过程中引入附加通道-像素模块和通道-像素注意力模块, 以优化去雾效果. 实验结果显示, FANet在SOTS-indoor数据集上的PSNR和SSIM分别为40.07 dB和0.9958, 在SOTS-outdoor数据集上分别为39.77 dB和0.9958. 同时, 该算法也在HSTS和Haze4k测试集上取得了不错的结果, 与其他去雾算法相比有效缓解了颜色失真和去雾不彻底等问题.
    优先出版日期:  2024-11-28 , DOI: 10.15888/j.cnki.csa.009724
    摘要:
    针对现有方法无法有效利用签到信息为用户提供更精准的位置推荐服务的问题, 提出一种基于双粒度序列融合的下一个兴趣点推荐模型. 首先, 该模型综合考虑了细粒度的时空序列信息和现实生活中天然存在的粗粒度类别序列信息, 并通过门控循环单元有效捕捉长期依赖关系, 从而丰富签到上下文信息. 然后, 利用提取到的信息将固定划分签到长序列的“硬”划分方式转变为能有效提取完整局部子序列语义信息的“软”划分方式. 最后, 通过对各局部子序列的显著信息进行聚合来构建推荐模型. 提出的模型在Foursquare数据集上召回率、归一化折损累计增益分别平均提升9.07%、9.72%, 在Gowalla数据集上分别平均提升9.37%、10.24%, 实验结果表明该模型具有更优的推荐性能.
    优先出版日期:  2024-11-25 , DOI: 10.15888/j.cnki.csa.009731
    摘要:
    大语言模型的兴起对自然语言处理领域产生了深远影响. 随着计算资源的增长和模型规模的扩大, 大语言模型在自然语言处理中的应用潜力日益显现. 然而, 广泛使用的低秩适应微调方法在面对模型规模增大时, 遇到了微调效率和存储成本等方面的挑战. 为了解决这一问题, 本文提出了一种基于奇异值分解的适应微调方法. 该方法只需将奇异值分解得到的对角矩阵和缩放向量作为可训练参数, 从而在降低训练成本的同时, 实现了在多个自然语言处理任务上的性能提升. 实验结果显示, 基于奇异值分解的适应微调方法在GLUE和E2E基准测试中的性能超越了同等数量级的方法. 通过与常用的参数高效微调方法进行比较, 发现基于奇异值分解的适应微调方法在减少可训练参数数量和提高微调效率方面具有显著优势, 并在可训练参数微调效率实验中实现了最高的性能增益. 在未来的研究中, 将专注于进一步优化基于奇异值分解的适应微调方法, 在更广泛的任务和更大规模的模型中实现更高效的微调.
    优先出版日期:  2024-11-25 , DOI: 10.15888/j.cnki.csa.009733
    摘要:
    微观剩余油赋存形态分类识别研究在剩余油开采领域发挥着至关重要的作用, 其对油田提高采收率具有重要的意义. 近年来, 该领域的大量研究通过引入深度学习方法来推动微观剩余油识别技术的发展, 但深度学习技术在微观剩余油识别领域尚未形成一个较为统一的框架, 也没有一个规范化的操作流程. 为了给今后的研究人员提供指导, 对目前的剩余油识别方法进行梳理, 从图像采集及类别划分标准、图像处理、剩余油识别方法等方面介绍了基于机器视觉的微观剩余油识别技术. 将剩余油识别方法分为基于传统和基于深度学习的识别方法, 传统识别方法分为基于人工特征提取和基于机器学习分类, 基于深度学习的识别方法划分为单阶段和两阶段方法, 并对其中数据增强、预训练、图像分割和图像分类方面进行详细归纳. 最后, 讨论了将深度学习应用于微观剩余油识别领域面临的挑战, 并对未来的发展趋势进行了展望.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009729
    摘要:
    卷烟激光喷码识别是烟草稽查工作的重要手段. 本文提出一种基于双态非对称网络的烟码识别方法, 针对畸变烟码训练样本不足导致模型泛化能力弱的问题, 设计非线性局部增强方法(nonlinear local augmentation, NLA), 通过在烟码图像边缘设置可控基准点进行空间变换, 生成有效畸变训练样本以增强模型泛化能力; 针对烟码与背景图案特征相似导致识别精度低的问题, 提出双态非对称网络(dual-state asymmetric network, DSANet), 将CRNN的卷积层划分为训练模式和部署模式, 训练模式通过引入非对称卷积优化特征权重分布, 增强模型关键特征提取能力; 为保证实时性, 部署模式设计BN融合和分支融合方法, 通过计算融合权重并初始化卷积核, 将卷积层等效转换回原始网络结构, 降低用户端推理时间; 最后, 在循环层中引入自注意力机制, 通过动态调整序列特征权重, 进一步加强模型对烟码特征的提取能力. 通过对比实验, 该方法具有更高的识别精度和速度, 其识别精度达到87.34%.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009730
    摘要:
    骶髂关节病变是预警强直性脊柱炎的主要体征之一, 精确高效的骶髂关节自动分割对于协助医生临床诊断和治疗至关重要. 针对骶髂关节灰度多变、背景复杂、且因骶髂间隙狭小而存在容积效应导致的特征提取受限, 分割精度难以提升的问题, 本研究利用层次级联补偿下采样信息丢失以及注意力并行保留跨维信息特征的思想, 提出首个用于骶髂关节分割诊断的U型网络. 此外, 为了提高临床诊断的效率, 将U型网络中传统的卷积替换为高效部分卷积块. 本实验在山西白求恩医院提供的骶髂关节CT数据集中, 验证了分割精度及效率平衡方面的有效性, 最终DICE达到91.52%, IoU达到84.41%. 实验结果表明, 改进的U型分割网络能有效提高骶髂关节分割精度, 减轻医疗专业人员的负担.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009749
    摘要:
    针对自然果园环境下苹果果实的识别, 本文提出了一种改进YOLOv8n模型的轻量化苹果检测算法. 首先, 通过使用DSConv和FEM特征提取模块的组合来替换主干网络中的部分常规卷积进行轻量化改进, 缩减卷积过程中的浮点数和计算量; 为了在轻量化过程中保持性能, 在特征处理的过程中, 引入结构化状态空间模型构建CBAMamba模块, 使用Mamba结构高效处理特征; 此后将检测头处的卷积替换为RepConv, 并减小卷积层; 最后, 更改边界框损失函数为动态非单调聚焦机制WIoU, 提高模型收敛速度, 进一步提升模型检测性能. 实验表明, 在公开数据集上, 本文提出的 YOLOv8改进算法比原始YOLOv8n算法分别提升1.6%的mAP@0.5和1.2%的mAP@0.5:0.95, 与此同时提升了8.0%的FPS并降低了13.3%的模型参数量, 轻量化的设计使之在机器人和嵌入式系统部署领域具有较强的实用性.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009750
    摘要:
    针对实际运行机械设备信号易受噪声干扰导致故障特征难以准确提取, 以及设备单一位置信息无法全面反映运行状态的问题, 本研究提出了一种改进的信号自适应分解与多源数据融合的时空故障分类方法. 首先, 提出了一种改进的信号自适应分解算法SAVMD (signal adaptive variational mode decomposition), 并构建加权峭度稀疏度指标WKS (weighted kurtosis sparsity)筛选出富含特征信息的IMF (intrinsic mode function)分量, 以实现信号重构. 其次, 将不同位置传感器的多源数据进行融合, 并以周期性采样得到的数据集作为模型的输入. 最后, 构建了一个时空故障分类模型来处理多源数据, 通过改进的稀疏自注意力机制降低噪声干扰, 并利用双编码器机制实现对时间步长和空间通道信息的有效处理. 在3个公开的机械设备故障数据集上进行实验, 平均准确率分别达到了99.1%、98.5%和99.4%. 与其他故障分类方法相比表现更好, 具有良好的自适应性和鲁棒性, 为机械设备的故障诊断提供了一种可行的方法.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009755
    摘要:
    无人机(unmanned aerial vehicle, UAV)搭载边缘服务器构成移动边缘服务器, 可以在一些基站难以部署的场景下为用户设备(user equipment, UE)提供计算服务, 借助深度强化学习对智能体进行训练, 能够在连续复杂的状态空间中制定合理的卸载决策, 将用户产生的计算密集型任务部分卸载至边缘服务器处执行, 提高系统的续航和响应时间, 但目前的深度强化学习算法所使用的全连接神经网络无法较好地处理UAV辅助移动边缘计算(mobile edge computing, MEC)场景下的时间序列数据, 算法的智能体训练效率低, 决策性能差, 针对上述问题, 本文以最小化UAV辅助MEC系统总时延为目标, 提出了一种基于长短期记忆网络的双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient algorithm based on long short term memory, LSTM-TD3), 利用LSTM改进TD3算法的Actor-Critic网络结构, 将网络划分成3部分: 包含LSTM的记忆提取单元, 当前特征提取单元, 以及感知整合单元; 并在改进了经验池中的样本数据, 定义了历史数据, 使记忆提取单元能够得到更好的训练效果. 仿真结果表明, 与AC算法、DQN算法和DDPG算法相比, LSTM-TD3算法在以系统最小总时延为目标对卸载策略进行优化时具有最好的性能.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009782
    摘要:
    提示词工程在解锁大语言模型潜能上具有重要作用. 该方法通过设计提示指令指导模型响应, 确保响应的相关性、连贯性和准确性. 提示工程无需微调模型参数, 可与下游任务无缝衔接. 因此, 各种提示词工程技术成为近年来研究的热点. 据此, 介绍了创建有效提示词的关键步骤, 总结了基础和高级提示词工程技术方法, 如思维链、思维树, 深入探讨了每种方法的优势和局限性. 同时, 讨论了如何从不同角度和不同方法评估提示方法的有效性. 这些技术的迅速发展使大语言模型在各种应用中取得了成功, 从教育、医疗到代码生成等. 最后, 展望了提示词工程技术的未来研究方向.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009758
    摘要:
    在自动驾驶技术的领域中, 利用鸟瞰图(bird’s eye view, BEV)进行3D目标检测任务已经引起了广泛的关注. 针对现有相机至鸟瞰视图转换方法, 实时性不足、部署复杂度较高的难题, 提出了一种简单高效、无需任何特殊工程操作即可部署的视图转换方法. 首先, 针对完整图像特征存在大量冗余信息, 引入宽度特征提取器并辅以单目3D检测任务, 提炼图像的关键特征, 确保过程中信息损失的最小化; 其次, 提出一种特征引导的极坐标位置编码方法, 增强相机视角与鸟瞰图表示之间的映射关系与模型空间理解能力; 最后, 通过单层交叉注意力机制实现可学习BEV嵌入与宽度图像特征的交互, 从而生成高质量的BEV特征. 实验结果表明: 在nuScenes验证集上该网络架构与LSS (lift, splat, shoot)相比mAP从29.5%提升到32.0%, 提升了8.5%, NDS从37.1%提升到38.0%, 提升了2.4%, 表明该模型在自动驾驶场景下的3D目标检测任务的有效性. 同时相比于LSS在延迟上降低了41.12 %.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009759
    摘要:
    本文提出了一种基于半监督学习和条件概率的膝关节软骨分割方法, 旨在解决医学图像分割中标注样本数量不足和质量差的问题. 现有的标签树嵌入深度学习模型难以对网络输出间的层次关系进行有效建模, 而本文提出了一种条件到无条件的混合训练与任务级一致性结合的方法, 有效地利用了标签之间的层次关系和相似性, 提高了分割精度. 具体来说, 我们使用一个联合预测像素级分割图和目标的几何感知水平集表示的双任务深度网络. 通过可微分的任务变换层, 将水平集表示转换为近似的分割映射. 同时, 我们在标签和未标记数据上引入了基于水平线的分割映射与直接预测的分割映射之间的任务级一致性正则化. 在两个公共数据集上的大量实验表明, 我们的方法可以通过包含未标记的数据来显著提高性能.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009760
    摘要:
    由于人体器官的不规则形变, 可变形三维医学图像配准仍然是医学图像处理中的难题. 针对该问题, 本文提出了一种基于Transformer的多尺度可变形三维医学图像配准方法. 该方法首先采用多尺度策略来实现多层次的连接, 以捕捉不同层次的信息. 通过自注意力机制提取全局特征, 并利用膨胀卷积捕获更广泛的上下文信息和更细节的局部特征, 从而增强配准网络对全局和局部特征的融合能力. 其次, 本文根据图像梯度的稀疏性先验, 引入了归一化总梯度作为损失函数, 有效减少了噪声和伪影对配准过程的干扰, 更好地适应不同模态的医学图像. 在公开的脑MRI数据集(OASIS和LPBA)上评估本文所提方法的性能. 综合结果表明, 该方法不仅能保持基于学习的方法在运行时间上的优势, 还在均方误差和结构相似性等指标上表现出较高的性能. 此外, 消融实验的结果进一步证明了本文所提方法和归一化总梯度损失函数设计的有效性.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009721
    摘要:
    针对现有的小样本关系三元组抽取方法难以解决单句话中存在多个三元组以及未考虑支持集和查询集之间语义相似性等问题, 提出了一种基于模块转移和语义相似性推断的小样本关系三元组抽取方法. 该方法采用一种在关系抽取、实体识别和三元组判别这3个模块不断转移的机制, 高效地提取出查询实例中存在的多个关系三元组. 在关系抽取部分, 将BiLSTM和注意力机制相融合, 以更好地捕捉应急预案文本的序列信息. 此外, 在实体识别部分设计了一种基于语义相似性推断的方法识别句子中存在的应急组织机构实体. 最终, 在应急预案领域数据集ERPs+上进行了大量的实验. 实验结果显示, 相较于其他基线模型, 所提模型更适应于应急预案领域的关系三元组抽取任务.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009722
    摘要:
    在当前的电力市场中, 现货日清数据量已达百万或千万级. 随着交易活动的增加和市场结构的复杂化, 确保交易数据的完整性、透明性和可追溯性是我国现阶段市场清算领域待研究的关键问题. 为此, 研究提出了一种基于PROV模型和智能合约的电力市场清算数据溯源方法, 旨在通过智能合约自动化存储及更新溯源信息, 从而提高清算过程的透明度和参与方信任. 本方法利用PROV模型中的实体、活动和代理等元素, 结合区块链技术的可层次存储及不可篡改性, 记录和追踪电力市场中的交易活动和规则变更. 本方法不仅增强了数据的透明度和市场参与方的信任度, 也优化了数据管理和存储策略, 降低了操作成本. 此外, 本方法为电力市场清算提供了合规性证明, 帮助市场参与方满足日益增长的法规要求.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009723
    摘要:
    近年来, 随着深度学习技术的发展, 卷积神经网络(convolutional neural network, CNN)和Transformer在图像超分辨率(super-resolution, SR)领域取得了显著的进展. 但是, 对于图像全局特征的提取, 过去的方法大多采用的是堆叠单个算子重复计算来逐步扩大感受野的方式. 为了更好地利用全局信息, 提出了对局部、区域和全局特征进行显式建模. 具体来说, 通过通道注意增强卷积、基于划分窗口的Transformer和CNN的双分支并行架构、标准的Transformer和划分窗口的Transformer双分支并行架构, 以一种层次递进的方式对图像的局部信息、区域与局部信息、全局与区域信息进行提取和融合. 此外, 设计了一种层次特征融合方式来对CNN分支提取到的局部信息和划分窗口的Transformer提取到的区域信息进行特征融合. 大量的实验表明, 所提网络在轻量级SR领域实现了更好的结果. 例如, 在Manga109数据集的4倍放大实验中, 该网络的峰值信噪比(PSNR)相较于SwinIR提升了0. 51 dB.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009709
    摘要:
    急性缺血性脑卒中是临床上最常见的卒中类型, 因其症状突发且治疗时间窗较短等特点, 成为全球导致残疾和死亡的重要因素之一. 随着人工智能领域的迅速发展, 深度学习技术在急性缺血性脑卒中的诊疗中展现出巨大的潜力. 深度学习模型能够快速高效地根据患者脑部图像对病灶进行分割与检测. 本文介绍深度学习模型的发展历程和用于脑卒中研究的常用公开数据集. 针对计算机断层扫描(computerized tomography, CT)和磁共振成像(magnetic resonance imaging, MRI)衍生出的多种模态和扫描序列, 详细阐述了深度学习技术在急性缺血性脑卒中病灶分割与检测领域的研究进展, 总结并分析了相关研究的改进思路. 最后, 指出了深度学习在该领域现存的挑战并提出了可能的解决方案.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009700
    摘要:
    随着智能物联网的快速发展及运用, 其对网络的使用寿命、可靠性及覆盖范围提出了新的挑战. 目前的无线传感器网络(wireless sensor network, WSN)是由大量部署在监测区域内的自组织型传感器节点组成, 其具备低成本、节能、自组织和大规模部署等优势. 然而, 如何在此基础上进一步延长网络寿命, 提高WSN的覆盖可靠性, 是当前研究面临的主要挑战. 为此, 将骨干网络与覆盖模型、传感器节点协同感知和空间相关性结合, 提出了一种覆盖可靠性评估模型. 在此基础上, 提出了一种基于可信信息覆盖的覆盖可靠性优化算法, 一方面, 利用可信信息覆盖模型保证数据的协同感知, 增强网络服务质量, 另一方面, 采用骨干网络优化路由, 节省能量消耗. 进一步地, 为验证所提算法的优越性, 以传感器多状态、覆盖率为评价指标, 以RMSE阈值和能耗为性能指标, 将所提算法与ACR和CICR算法进行对比. 最后, 在Matlab仿真软件上搭建了验证模型, 仿真结果表明, 所提算法能显著提高覆盖可靠性.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009703
    摘要:
    针对现有二进制模糊测试难以深入程序内部发现漏洞这一问题, 提出一种融合硬件程序追踪、静态分析和混合执行3种技术的多角度优化方案. 首先, 利用静态分析和硬件追踪评估程序路径复杂度及执行概率; 之后, 根据路径复杂度与执行概率进行种子选择和变异能量分配; 同时, 利用混合执行辅助种子生成并记录关键字节用于针对性变异. 实验结果表明, 相比现有模糊测试方案, 该方案在多数情况下能发现更多的程序路径和crash.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009686
    摘要:
    传统的目标检测算法存在检测效果不佳及检测效率低等问题, 针对这些问题, 提出了一种基于YOLOv7网络改进的小目标检测方法. 该方法在原网络的高效层聚合模块(efficient layer aggregation network, ELAN)中添加了更多路径, 且将不同路径中的特征信息有效融合后引入SKNet网络, 使得模型更加关注网络中不同尺度大小的特征, 提取出更多有效信息; 同时为了加强小目标对空间信息的感知能力, 设计了一个eSE模块连接在ELAN末端, 以此构建新的高效层聚合网络模块(enhanced features efficient layer aggregation network, EF-ELAN), 该模块完整地保留了图像特征信息, 提高了网络的泛化能力. 同时设计了一种CS-ASFF (cross stage-adaptively spatial feature fusion)模块来应对小目标检测出现的特征尺度不一致问题, 该模块基于 ASFF网络和Nest连接方式进行改进, 对特征金字塔的每一张图片进行卷积、池化等操作提取权重, 将特征信息作用在某一层上, 同时利用其余特征层来加强网络的特征处理能力. 实验结果表明, 本文提出的算法在DIOR数据集和DOTA数据集上的平均精准率分别提高了1.5%、2.1%, 实验结果验证了所提出的算法能够有效地提升小目标的检测效果.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009717
    摘要:
    时间序列分段线性表示算法利用时间序列的趋势变化特征, 用序列中较少点来表示整个时间序列. 但是大多算法主要关注局部序列点信息, 很少关注全局数据, 且部分算法只关注算法在数据集上的拟合, 很少应用到分类问题中. 针对上述问题, 本文提出了基于角度关键点和转向点的时间序列趋势特征提取算法, 首先, 该算法根据序列数据的角度变化值来选择角度显著点, 然后基于角度关键点的基础上再提取转向点, 根据分段的要求, 判断是否进行插值操作, 从而得到符合要求的分段点序列. 本文在模拟数据和40个公开数据集上进行拟合和分类实验, 实验结果表明, 本文算法相较于分段聚合近似PAA、自底向下TD、自顶向上BU、基于拐点FFTO、基于转折点和趋势段Trend、基于趋势转折点ITTP等算法, 在模拟数据集拟合效果更好; 在UCR公开数据集平均拟合误差为1.165; 分类准确性同Keogh团队公布的DTW-1NN算法高出2.8%.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009719
    摘要:
    知识蒸馏(KD)中的温度在以前的大多数工作中被设置为蒸馏过程的固定值. 然而, 重新研究温度时, 发现固定的温度限制了对每个样本中固有知识的利用. 本文根据能量得分将数据集分为低能量样本和高能量样本, 通过实验证实了低能量样本的置信度得分高, 表明其预测是确定的, 而高能量样本的置信度得分低, 意味着预测是不确定的. 为了通过调整非目标类预测来提取最佳的知识, 本文对低能量样本应用较高的温度以创建更平滑的分布, 并对高能量样本应用较低的温度以获得更清晰的分布. 此外, 为解决学生对突出特征的不平衡依赖和对暗知识的疏忽, 本文引入熵重加权的知识蒸馏, 这是利用教师预测中的熵在样本基础上重新加权能量蒸馏损失的方法. 本文方法可以很容易地应用于其他基于逻辑的知识蒸馏方法中, 并获得更好的性能, 可以更接近甚至优于基于特征的方法. 本文在图像分类数据集(CIFAR-100、ImageNet)上进行了广泛的实验, 证明了该方法的有效性.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009725
    摘要:
    针对现有消防机器人在城区内中远程环境执行火灾救援应急任务时, 难以提前获取全局先验地图, 需人工遥控机器人至灭火地点, 操作繁琐, 影响灭火效率的问题, 设计了一种消防机器人城区内自主导航系统, 系统基于商业电子地图(如高德地图、百度地图等2D电子地图), 有效整合了全球定位系统(GNSS)和局部激光环境感知技术. 首先借助商业电子地图来规划粗略的全局子目标点, 将全局目标点序列与真实定位信息进行数据配准, 然后将序列发送至局部规划器. 之后在激光感知建立的局部栅格地图中, 按照子目标点的顺序执行局部规划任务, 改进型局部规划器在运动过程根据实时环境变化更新子目标点. 在仿真环境中多次模拟并使用履带式小车在实际场景进行验证, 结果表明设计系统可以在事先未建立环境先验地图的情况下, 准确进行室外远距离的导航任务, 可作为消防机器人高效安全户外导航的方案.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009739
    摘要:
    为求解带时间窗的车辆路径问题, 以最小化总行驶里程为目标建立混合整数规划模型, 提出了一种具有时间窗约束松弛的混合蚁群算法. 首先, 提出改进的蚁群算法与“TSP-Split编码与解码”相结合的方法, 来构建允许违反时间窗约束的解路径, 以提高算法的全局寻优能力. 然后, 利用“及时返回”原则和惩罚函数方法, 提出基于变邻域搜索的修复策略来修复不可行解. 最后, 对56个Solomon和12个Homberger基准算例进行试验计算, 结果表明该算法的求解质量优于文献中的对比算法, 且在50个测试实例上获得了已知最优解, 其余实例也能在可接受计算时间内获得准最优解, 验证了所提算法的有效性.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009742
    摘要:
    具身智能(embodied AI)需要能够与环境进行互动和感知, 并具备自主规划、决策和行动等能力. 行为树(BT)由于其模块化和高效控制的特性, 已经成为机器人技术中广泛使用的方法. 然而, 现有的行为树生成技术在处理复杂任务时仍面临一定的挑战. 这些方法通常依赖于领域专业知识, 生成行为树的能力有限. 此外, 许多现有方法在语言理解方面存在不足, 或者在理论上无法保证行为树的成功, 从而导致在机器人上的实际部署难度较大. 本研究提出一种新的行为树自动生成方法, 该方法基于大语言模型(LLM)和场景语义感知, 生成包含任务目标的初始行为树. 本文的方法根据机器人的能力设计机器人动作原语和相关条件节点, 并以此设计提示(prompt)使LLM输出行为规划(generated plan), 然后将行为规划转化为初始行为树. 虽然本文以此为示例, 但该方法具有广泛的适用性, 可以根据不同需求应用于其他类型的机器人任务. 同时, 本文将这种方法应用于机器人任务中, 并给出具体实现方法和示例. 在机器人执行任务过程中, 行为树可以根据机器人操作失误和环境变化动态更新, 对外部环境变化具有一定的鲁棒性. 本文进行了初始行为树生成验证实验, 并在仿真机器人环境中进行了验证, 展示了本文方法的有效性.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009744
    摘要:
    在视觉跟踪领域, 大多数基于深度学习的跟踪器过分地强调精度, 而忽视了算法速度. 因此, 这些算法在移动平台上的部署(无人机), 受到了阻碍. 在本文中, 提出了一种基于Siamese的深度交叉指导跟踪器(SiamDCG). 为了更好地在边缘计算设备上部署, 在MobileNetV3-small的基础上设计了独特的backbone结构. 此外, 针对无人机场景的复杂性, 传统使用狄拉克 δ分布预测目标框的方式有很大的弊端, 为了克服边界框存在的模糊效应, SiamDCG将回归框分支转为预测偏移量的分布, 并且用学习到的分布去指导分类的准确性. 在多个无人机benchmark上的优秀表现, 都显示了其鲁棒性与高效性. 在Intel i5 12代CPU上, SiamDCG运行速度是SiamRPN++的167倍, 使用的参数仅为它的1/98, FLOPs是1/410 .
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009734
    摘要:
    该研究旨在深入探究在复杂多变的交通环境下交通标志与信号灯的联合检测问题, 分析并解决恶劣天气、低光照和图像背景干扰等不利因素对检测精度的影响. 为此, 采用了一种改进RT-DETR网络的策略. 基于资源有限的运行环境, 并为提高模型对于遮挡以及小目标的检测能力, 提出PE-ResNet (ResNet with PConv and efficient multi-scale attention)网络作为主干网络. 为了增强特征融合能力, 提出了NCFM (new cross-scale feature-fusion module)模块, 有助于更好地整合图像中的语义信息和细节信息, 对复杂场景的理解更为全面. 最后引入MPDIoU损失函数, 更精确地衡量目标框之间的位置关系. 改进后的网络相较于基线模型参数量降低了约14%. 在CCTSDB 2021数据集、S2TLD数据集以及自制的MTST (multi-scene traffic signs)数据集上, mAP50:95分别增加了1.9%、2.2%和3.7%. 实验结果表明, 改进之后的RT-DETR模型可以有效地改进复杂场景下目标检测精度.
    优先出版日期:  2024-11-15 , DOI: 10.15888/j.cnki.csa.009737
    摘要:
    针对道路损伤检测面临的多尺度目标、复杂的目标结构、样本分布不均及难易样本对边界框回归的影响等问题, 本研究提出了一种基于改进YOLOv8的道路损伤检测算法. 该方法通过引入动态蛇形卷积 (dynamic snake convolution, DSConv) 替代原有C2f (faster implementation of CSP bottleneck with 2 convolutions) 模块中的部分Conv, 以自适应聚焦于细小而曲折的局部特征, 增强对几何结构的感知. 在每个检测头前引入高效多尺度注意力 (efficient multi-scale attention, EMA) 模块, 实现跨维度交互, 捕获像素级别关系, 提升对复杂全局特征的泛化能力. 同时, 增设小目标检测层以提高小目标检测精度. 最后, 提出Flex-PIoUv2策略, 通过线性区间映射和尺寸适应性惩罚因子, 有效缓解样本分布不均和锚框膨胀问题. 实验结果表明, 该改进模型在RDD2022数据集上的F1分数、平均精度均值 (mAP50、mAP50-95) 分别提高了1.5个百分点、2.1个百分点和1.2个百分点. 此外, 在GRDDC2020和China road damage数据集上的验证结果显示, 该算法具有良好的泛化性.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009698
    摘要:
    群体行为识别是计算机视觉领域中备受关注的研究方向之一, 旨在通过多个个体动作与互动关系确定整体的行为. 然而, 由于确定个体互动关系、联系紧密程度以及活动关键人物三者的困难, 现有方法常关注于人物的个体特征, 忽略了与活动场景上下文的相互联系. 针对该问题, 提出一个基于全局-个体特征融合的群体行为识别推理模型GIFFNet (global-individual feature fusion network). 通过构建全局-个体特征融合(GIFF)模块, GIFFNet在聚焦关键信息的基础上, 有效整合了场景上下文与个体人物特征, 获取了更具表征能力的融合特征, 以弥补预测群体行为时场景信息缺失的问题. 随后, GIFFNet利用融合特征计算场景中人物之间的交互关系图, 并使用图卷积网络(GCN)进行训练和群体行为类别预测. 此外, 为解决数据集样本失衡的问题, GIFFNet采用动态分配权重的策略优化损失函数. 实验结果表明, GIFFNet在Volleyball、Collective Activity数据集上的多类分类准确度分别为93.8%、96.1%, 类平均精确度分别为93.9%、95.8%, 优于其他现有的深度学习方法. GIFFNet通过特征融合为行为分类提供了表征能力更加强大的特征, 有效地提升了行为识别的精确度.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009728
    摘要:
    剩余时间预测能够帮助企业提升业务流程执行的质量和效率. 尽管现有的深度学习方法在剩余时间预测上有一定提升, 但在处理复杂业务流程时, 仍面临时间特征利用不足和局部特征挖掘能力有限的问题, 预测精度有待提高. 为此, 本研究提出了一种基于改进Transformer编码器模型的剩余时间预测方法. 针对已有方法忽略事件时间特征以及难以捕捉局部依赖的不足, 本研究在模型中引入了时间特征编码模块和局部依赖增强模块. 时间编码模块通过嵌入学习和多粒度拼接方式, 构建了富有语义且具判别力的事件时间表示. 局部依赖增强模块采用卷积神经网络, 在Transformer编码器之后提取轨迹前缀的局部细节特征. 实验表明, 融合时间特征和局部依赖增强可以提升复杂业务流程剩余时间的预测准确性.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009720
    摘要:
    模型量化方法现已广泛应用于深度神经网络模型快速推理和部署中. 由于训练后量化重新训练所需时间少, 性能损失小而备受研究人员关注, 但现有训练后量化方法在量化过程中大多以理论假设或是固定分配网络层的比特位宽, 导致量化后的网络会出现显著的性能损失, 尤其是在低位情况下. 为了提升训练后量化网络模型的精度, 本文提出一种新颖的训练后混合精度量化方法(MSQ), 该方法通过在网络模型每一层后插入一个融合了金字塔池化模块和权值印记技术的任务预测器模块, 来对网络每一层进行准确度估计, 从而评估每一层网络的重要性, 根据重要性评估来确定每一层的量化比特位宽. 实验表明, 本文所提出的MSQ算法在多个流行的网络架构上都优于现有的一些混合精度量化方法, 量化后的网络模型在边缘硬件设备上测试性能更好, 延迟更低.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009718
    摘要:
    基于自注意力机制的Transformer端到端模型在语音识别任务中表现出了卓越的性能. 然而, 该模型在浅层处理时对局部特征信息的捕捉能力存在一定的局限, 同时也没有充分考虑不同块之间的相互依赖性. 为了解决这些问题, 提出了一种改进的Conformer-SE端到端语音识别系统模型. 该模型首先采用了Conformer结构来替代Transformer中的编码器部分, 从而增强了模型对局部特征的提取能力. 接着, 通过引入SE注意力通道机制, 将每个块的输出以加权求和的形式整合到最终的输出中. 在Aishell-1这一公开数据集上的实验结果显示, 相较于原始的Transformer模型, Conformer-SE模型在字符错误率上相对降低了18.18%.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009714
    摘要:
    Hadoop系统作为大数据存储的分布式架构被广泛使用, 运行时生成大量日志数据来记录设备的异常情况, 这为定位和分析问题提供重要线索. 然而, 传统的日志异常检测模型通常在中心服务器上收集日志数据, 导致数据收集过程中存在敏感信息泄露的风险. 联邦学习作为一种新的机器学习范式, 通过在本地服务器上训练模型并仅在中心服务器上聚合模型参数, 有效解决了数据隐私问题. 本文提出了一种基于联邦学习的日志异常检测架构, 结合本地服务器和中心服务器进行检测任务, 避免了敏感信息在网络传输过程中的泄露风险. 此外, 本文采用树解析器实现日志模板标准化. 为了有效地捕获日志数据中的复杂模式和异常行为, 建立基于自注意力机制的BiLSTM模型作为本地服务器模型. 为了验证所提出方法的有效性, 本文使用公开的分布式系统架构数据集进行仿真实验. 结果表明, 该模型的综合评价指标稳定, 准确率保持在93%以上, 具有较高的适用性.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009715
    摘要:
    针对 QR 码图像检测过程中因环境复杂性和拍摄角度变化等因素导致 QR 码读取率低的问题, 本文提出一种基于改进YOLOv8n-Pose的形变QR码校正与识别算法. 首先, 在主干网络引入高效通道注意力机制(efficient channel attention, ECA)模块, 该模块通过不降维的方式实现跨通道交互, 有效提升网络的特征提取能力和检测精度. 其次, 采用Slim-neck架构重构颈部网络, 减少模型的复杂度, 提高对不同尺度QR码的检测能力. 最后, 通过模型检测到的QR码角点, 结合逆透视变换对QR码进行校正, 并使用ZBar算法进行读取. 实验结果表明, 在公开的QR码数据集上, 改进的算法相比原算法, mAP50和mAP50-95分别提升1.6%和1.1%, 模型参数量和模型计算量分别降低6.5%和9.5%, 在CPU和GPU上检测速度分别提升0.3 f/s和0.7 f/s, 达到14.2 f/s和59.6 f/s, 能够高效地满足QR码角点检测需求. 此外, 在自制的形变QR 码数据集上, 基于改进YOLOv8n-Pose的QR码识别方法相比单独使用ZBar算法的QR 码识别方法, QR 码读取率提高23.66%, 达到87.41%. 该方法仅需拍摄一张照片就可识别所有货物的信息, 能够有效提高货物管理的效率.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009687
    摘要:
    深度强化学习算法在无人机的航迹规划任务中的应用越来越广泛, 但是许多研究没有考虑随机变化的复杂场景, 针对以上问题, 本文提出一种基于TD3改进的PP-CMNTD3算法, 提出了一种简单有效的先验策略并且借鉴人工势场的思想设计了密集奖励, 能够更好地引导无人机有效避开障碍物并且快速接近目标点. 仿真结果表明, 算法的改进可以有效提高网络的训练效率以及在复杂场景中的航迹规划表现, 同时能够在不同初始电量的情况下都能够灵活调整策略, 做到在能耗和迅速抵达目的地之间的有效平衡.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009692
    摘要:
    目前超分辨率重建技术运用于诸多场景, 但对于数字高程模型(digital elevation model, DEM)的重建存在许多挑战, 针对无法充分利用DEM复杂地形特征导致的细节缺失和失真问题, 提出了深度残差频率自适应的DEM超分辨重建模型, 由多个高低频特征提取模块组成残差网络结构, 提升对DEM特征的整体感知能力, 并加入频率选择特征提取模块, 增强对复杂地形特征的识别和捕捉能力, 其次在模型中加入了空洞空间金字塔池化, 通过融合多尺度信息, 改善重建质量并充分保留地形特征的细节和结构, 最终在梯度域和高度域双重约束下完成超分辨率重建. 实验结果表明, 在以两种精度的陕西秦岭高程图作为实验数据下, 深度残差频率自适应DEM超分辨率模型相较于其他先进模型, 在各个指标上均取得了提升, 重建后的DEM细节更加丰富、纹理更加清晰.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009694
    摘要:
    针对变电站仪表背景复杂、多旋转角度图像导致读数识别准确率低的问题, 提出一种基于YOLOv8和改进UNet++的指针式仪表读数识别方法. 采用YOLOv8模型检测仪表区域, 并利用透视变换进行旋转校正; 采用极化自注意力模块改进的UNet++算法分割表盘图像提取刻度、指针区域; 经过提取指针直线后, 采用角度法计算仪表读数. 实验结果表明: 提出方法识别仪表读数的平均引用误差为1.82%, 具有较高的识别准确性, 将其应用于变电站指针式仪表智能化巡检中具有一定的可行性.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009705
    摘要:
    多智能体协同在强化学习研究领域占据重要地位, 旨在深入探讨智能体如何通过相互协作实现共同目标. 大部分协作多智能体算法注重合作的构建, 但忽略了个体策略的强化. 为解决上述问题, 本文提出一种BiTransformer记忆(BTM)在线强化学习模型, 该模型不仅考虑多智能体之间的协同, 还利用记忆模块辅助个体决策. BTM由双注意力编码器和双注意力解码器组成, 分别用于个体策略的增强和多智能体系统的协作. 在双注意力编码器中, 受人类的决策经验依赖的启发, 提出记忆注意力模块为当前决策提供历史决策经验. 与传统利用RNN的方法不同, BTM为每一个提供的是一个显式历史决策经验库, 而非隐藏单元. 此外, 提出融合注意力模块, 在历史决策经验的辅助下处理当下的局部观测信息, 从而获取环境中最具决策价值的信息, 进一步提高智能体个体的决策能力. 在双注意力解码器中, 本文提出了决策注意力模块和合作注意力模块两个模块, 通过综合考虑其他已经做出决策智能体与当前智能体的合作收益以及带有历史决策经验的局部观察, 从而促进历史决策辅助下的多智能体潜在合作的形成. 最终本文在星际争霸中的多个场景下对BTM进行了测试, 取得了93%的平均胜率.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009707
    摘要:
    航段和航路点对网络正常运行具有重要意义, 正确识别关键航段和关键航路点, 并分析各个指标对航段或航路点的重要程度的关联程度有利于针对性地提升航路网络的抗打击能力. 为改善航路网络对各种突发情况的弱“抵抗力”情况, 从静态指标和动态指标两个方面入手, 采用熵权法从数据本身的波动程度出发确定静态指标和动态指标的权重, 并采用优劣解距离法通过计算连边的最优和最劣解, 得到各个航段和航路点的综合得分. 并继续分析各个指标之间及指标与航段或航路点综合得分之间的关联度, 结果表明各个指标之间都相对独立, 但各个指标与航段或航路点得分的关联度较高, 该结论为航路网络结构优化提出改进依据.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009708
    摘要:
    皮肤癌是最常见和最致命的癌症类型之一, 患病数量在世界范围内急剧增加. 如果没有在早期阶段诊断出来, 它可能转移, 导致高死亡率. 结合近几年的相关文献就传统机器学习和深度学习两种学习方法在皮肤癌病变诊断中的应用作一系统综述, 为皮肤癌诊断的深入研究提供相应的参考价值, 首先对几个皮肤病公共可获取数据集进行整理, 其次分析和比较不同的学习算法在皮肤癌病变分类中的应用, 更好地了解它们在实际应用中的优势和局限性, 重点阐述在卷积神经网络领域的分类诊断. 在深入了解这些算法的基础上, 还将探讨它们在处理皮肤疾病时的性能差异、改进思路. 最终, 通过对当前挑战和未来发展方向的探讨, 将为进一步提升皮肤癌早期诊断系统的性能和可靠性提供有益的参考和建议.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009597
    摘要:
    由于电动车的普及, 越来越多的电动车进行非法改装雨棚. 然而, 这种改装行为会增加一些安全隐患. 首先, 挡雨板会遮挡骑行者视野, 增加事故的风险. 其次当速度过快时, 挡雨板也会在不经意间擦伤行人, 带来极大地安全隐患, 给交通安全带来了严重威胁. 本文提出了一种改进的YOLOv7-tiny算法, 用于电动车非法改装检测. 首先在网络的结构上加入BiFormer注意力机制, 不仅可以捕获更多电动车细节的信息, 而且可以使得模型更加关注一些较小的目标信息. 其次将改进的特征金字塔结构和特征融合网络的张量拼接操作进行结合, 提升对中小型目标的检测能力. 最后对框架的ELAN模块和SPPCSPC模块进行改进和优化, 可以在不增加过多参数量的同时, 提升对中小目标的检测精度, 增强提取特征的效果.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009716
    摘要:
    岩屑识别是地质勘探录井工作中的重要手段, 为了解决传统人工岩性识别效率低下和常见深度学习网络推理速度慢计算量大等问题, 本文借助于表现较好的短时密集串联网络模型, 提出了一种实时岩屑图像语义分割网络DAF-STDC. 该网络使用空洞卷积在提取特征过程中保持分辨率, 利用注意力机制帮助模型获取特征图中全局信息, 从而细化岩屑颗粒边缘信息, 使用特征融合模块加强低阶细节特征与高阶语义特征的融合程度, 帮助特征表达. 经实验证明, 改进后的网络模型在精度方面有了大幅提升, 在岩屑录井工作中收集到的6类岩屑图像, 制成的数据集RC_Dataset上, 平均交并比达到83.12%, 在保持参数量的同时, 推理速度和分割精度有了明显提升, 为岩屑录井数字化提供了有效参考.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009711
    摘要:
    在移动边缘计算(mobile edge computing, MEC)背景下, 不合理的任务卸载策略和资源分配以及多类型任务数量急剧增加导致边缘服务器间的负载不均衡. 针对上述问题, 本文基于多用户多MEC的边缘环境, 提出一种面向多类型任务的负载预测以及均衡分配方案(load prediction and balanced assignment scheme for multi-type tasks, LBMT). 该方案包括划分任务类型, 任务负载预测, 任务自适应映射3个部分. 首先, 考虑任务类型的多样性设计了任务类型模型, 利用该模型划分任务类型. 其次, 考虑不同任务对服务器造成的负载具有差异性提出了任务负载预测模型, 并在此基础上采用改进KNN (K-nearest neighbor)算法用于预测任务负载. 然后, 综合考虑MEC服务器异构性、资源有限等因素, 结合MEC服务器负载均衡模型设计了任务分配模型, 并提出基于自适应任务映射算法用于任务分配. 最后, LBMT针对MEC服务器资源利用率和任务处理率进行优化, 得到最优负载均衡任务卸载策略. LBMT与基于改进的min-min卸载方案、基于中间节点的卸载方案、基于加权二分图的卸载等方案进行仿真实验对比, 实验结果表明LBMT在资源利用率上提高了12.5%以上, 任务处理率提高了20.3%以上, 并显著降低了负载均衡标准差值, 更有效的实现了服务器之间的负载均衡.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009726
    摘要:
    针对当前众包平台面临的订单类型多样性(外卖订单与快递订单)和配送骑手的同质化(单一外卖型与单一快递型)问题, 且现有众包配送机制较少兼顾商家和顾客满意度, 在派单模式下考虑骑手的异质性, 通过引入全能型骑手, 将骑手划分为单一外卖型、单一快递型和全能型3类, 根据各类骑手可服务的订单类型差异, 构建基于模糊时间窗的商家和顾客对于骑手到达取送货点时间的满意度成本函数, 将商家和顾客的满意度转化为时间惩罚函数, 建立了以时间惩罚成本、路径行驶成本、人员运营成本最小化为目标的模型, 针对模型的特点以及传统算法存在的问题, 设计将遗传算法与大规模领域搜索算法相结合的混合算法, 随后通过具体算例, 采用模拟退火算法、遗传算法和混合算法分别进行求解, 通过不同算法的优化结果对比分析, 验证模型和改进算法的可行性和有效性. 实验结果表明: 在众包配送过程中合理考虑骑手异质性以及商家和顾客的满意度不仅能够有效提升商家和顾客满意度, 也能够降低众包平台配送成本和提高配送效率, 对于众包平台制定配送策略具有一定的参考意义.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009727
    摘要:
    计算机断层扫描产生的肝部影像为医生进行肝部病灶区域发现提供了素材. 但肝部病灶的人工检测严重依赖于医生的专业技能, 且费时费力. 现有的肝部病灶区域检测算法对细微病灶的检测效果欠佳. 为此, 本文提出了一种基于频率感知图像恢复的自监督肝部病灶检测算法. 首先, 此算法设计了一个基于合成异常的自监督任务, 用于合成更加广泛且适宜的伪异常图像, 从而缓解算法模型训练时异常数据不足的问题. 其次, 为了抑制重建网络对合成肝部异常的敏感性, 设计了提取图像高频信息的模块, 通过从图像的高频成分中恢复图像, 以减轻重建网络对异常的不利泛化. 最后, 其采用权重衰减训练策略以训练分割子网络, 减少训练前期的琐碎解问题, 实现局部细微病灶的检测. 在真实公开数据集上进行的大量实验表明, 本文方法在肝部病灶检测任务中取得了领先的性能.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009713
    摘要:
    盲文转换技术可以推进盲人群体的信息无障碍化进程, 有着相当的重要性. 随着信息全球化发展, 盲人不可避免地接触到包含中英双语的信息. 现有中英盲文转换系统能较好完成中英文字符到盲文的转换, 但是对标点的转换效果不佳, 表现为对一符多用情况区分效果不好、未对中英标点混用情况进行纠错两方面. 若未能恰当处理一符多用及中英标点混用情况, 很可能会对盲人阅读造成影响甚至误解. 本文详细分析以上问题, 设计并实现一种具有标点区分和纠错能力的中英盲文转换系统. 基于BCC语料库构建测试语料, 对该系统开展一系列测试和评估. 实验结果表明, 与其他类型转换系统相比, 本系统能够结合语言类型和上下文结构, 有效区分标点转换中的一符多用情况, 并能纠正中英标点混用问题, 对我国信息无障碍化进程起到促进作用.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009710
    摘要:
    随着工业自动化的不断发展, 工件的三维重建技术在制造业中扮演着越来越重要的角色. 在实际的工作环境下, 工件普遍存在堆叠问题, 对后续的机器人识别抓取等工作存在较大影响. 目前三维重建技术对于一些具有弱纹理区域的工件重建, 仍存在图像特征点提取难度大、特征配准精度低的问题. 针对以上问题, 本文提出了一种基于多视图立体匹配深度学习的堆叠工件三维重建方法. 首先, 输入多张不同视角的图像经过融合DCNv2的特征金字塔网络, 进行特征提取; 然后, 进行单应性变换构建代价体, 再使用方差聚合为一个统一的代价体; 接着在代价体正则化部分, 引入SE通道注意力机制模块来提高网络的特征表达能力, 增强模型的性能和泛化能力; 此方法在DTU (Danish Technical University)数据集上具有较好的表现, 并且运用该方法生成的堆叠工件点云模型对以后的工业自动化开展具有重要意义.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009684
    摘要:
    水下目标检测技术在海洋探测中具有重要的现实意义. 针对水下场景复杂, 以及存在遮挡重叠导致目标特征提取有限的问题, 提出了一种适用于水下目标检测的FERT-DETR网络. 该模型首先提出了一种特征提取模块Faster-EMA, 用于替换RT-DETR中ResNet18的BasicBlock, 能够在有效降低模型的参数量和模型深度的同时, 显著提升对水下目标的特征提取能力; 其次在编码部分使用级联群体注意力模块AIFI-CGA, 减少多头注意力中的计算冗余, 提高注意力的多样性; 最后使用高水平筛选特征金字塔HS-FPN替换CCFM, 实现多层次融合, 提高检测的准确性和鲁棒性. 实验结果表明, 所提算法FERT-DETR在URPC2020数据集和DUO数据集上较RT-DETR检测准确率提高了3.1%和1.7%, 参数量压缩了14.7%, 计算量减少了9.2%, 能够有效改善水下复杂环境中不同尺寸目标漏检、误检的问题.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009690
    摘要:
    本文提出一种名为E2E-DRNet的模型, 旨在解决当前人工DR诊断的分类性能差、耗时费力以及视网膜图像等级差异小、病灶不明显等问题. 该模型基于EfficientNetV2, 并结合了有效通道注意力模块. 通过对DR数据集进行处理和优化, 引入了Focal Loss损失函数以解决样本不均衡问题, 并将模型分为两个阶段以实现DR分类的细分. 实验结果表明, 该方法在公开数据集和临床数据集上表现良好, 提高了对眼底病变区域的可解释性, 有助于提高DR病变的筛查效率, 克服了人工诊断的局限性.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009691
    摘要:
    DNS作为互联网基础设施, 很少受到防火墙的深度监控, 导致黑客和APT组织通过DNS隐蔽隧道来窃取数据或控制网络, 对网络安全造成严重威胁. 针对现有检测方案容易被攻击者绕过以及泛化能力较弱的问题, 本研究改进了DNS流量的表征方法, 并提出了PFEC-Transformer (pcap features extraction CNN-Transformer)模型. 该模型以表征后的十进制数值序列作为输入, 在经过CNN模块进行局部特征提取后, 再通过Transformer分析局部特征间的长距离依赖模式并进行分类. 研究采集了互联网流量以及各类DNS隐蔽隧道工具生成的数据包构建数据集, 并使用包含未知隧道工具流量的公开数据集进行泛化能力测试. 实验结果表明, 该模型在测试数据集上取得了高达99.97%的准确率, 在泛化测试集上也达到了92.12%的准确率, 有效地证明了其在检测未知DNS隐蔽隧道方面的优异性能.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009706
    摘要:
    针对目前大多数推荐模型在特征交互时, 存在忽视特征重要程度使得推荐模型准确率不高的问题, 为此本文提出融合特征选择和交叉网络的增强推荐模型. 该模型采用SENet网络在特征交互前过滤不重要的特征, 使其挖掘到更有价值的交互信息. 在此基础上, 进一步使用并行的交叉网络和深度神经网络, 以捕捉显式特征交互和隐式特征交互. 同时, 在交叉网络中引入低秩技术, 将权重向量改进为低秩矩阵, 在保证模型性能的同时, 降低模型的训练成本. 该模型在MovieLens-1M、Criteo数据集上与其他推荐模型进行了对比实验, 实验结果表明所提推荐模型在AUC指标上明显优于其他模型, 证明了所提推荐模型的有效性.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009696
    摘要:
    快速增长的安检需求推动了智能安检技术的发展, 由于X光图片的特殊性, 导致小目标违禁品检测难度大, 本文提出一种改进YOLOv8s的违禁品识别网络进行解决. 首先引入Focal L1 Loss函数改进CIoU, 优化预测框位置与长宽比, 以提高网络对于违禁品的标记能力. 将改进后的可变形卷积加入浅层主干网络中, 捕获不同方向上的违禁品特征信息. 在SPPF模块加入LSKA扩大网络感受野, 并使用Swin-CS模块捕获全局信息、补充维度交互, 最后使用3种注意力堆叠的注意力块进行处理, 提高了网络对小目标的敏感性. 改进后的网络在SIXray数据集上的平均精度均值达到96.1%, 相比原有的YOLOv8s提高5.4%, mAP50-95达到0.682, 提高4.5%. 实验结果表明, 提出的模型能够准确给出预测框, 应对复杂场景中的违禁品检测, 证明了算法的有效性.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009704
    摘要:
    基于深度学习的人工智能诊断模型严重依赖于高质量地详尽注释数据进行算法训练, 但受到标签噪声信息的影响. 为了增强模型的鲁棒性并防止有噪声的标签记忆, 提出了一种标签噪声样本选择 (noise label sample selection, NLSS)模型来充分挖掘噪声样本的隐藏信息, 减轻模型过拟合问题. 首先, 通过将混合增强图像作为输入, 提取图像分布式特征表示; 其次, 引入对比损失函数以及比较样本预测标签分布与其真实标签分布的相似性来评估样本, 进行样本选择; 最后, 通过标签重分配模块的伪标签提升策略在样本选择的基础上重新纠正噪声标签的监督信息. 以非小细胞肺癌 (non-small cell lung cancer, NSCLC)患者的 PET/CT 数据集为例进行实验, 结果表明提出的模型均比对比模型有一定的提升, 可降低淋巴结转移状态诊断中标签噪声的干扰.
    优先出版日期:  2024-09-24 , DOI: 10.15888/j.cnki.csa.009675
    摘要:
    随着无人机应用需求不断拓展, 为了保证无人机能够按要求完成预定任务, 抗干扰控制器的设计受到了诸多关注. 目前广泛使用的传统控制算法稳定性较好但抗干扰能力较差. 针对上述问题, 提出了一种基于改进双延迟深度确定性策略梯度(TD3)算法的混合抗干扰控制器, 该方法使用非线性模型预测控制(NMPC)作为基础控制器, 并引入了一个基于改进TD3的干扰补偿器进行混合控制. 该方法结合了NMPC控制器的优点的同时解决了传统控制算法在抗干扰方面的不足. 本文将多头注意力机制(MA)以及长短期记忆网络(LSTM)引入TD3的Actor网络中, 提高了TD3对于空间管理信息以及时间关联信息的捕捉能力, 同时引入一种连续型对数奖励函数来提高训练稳定性和收敛速度, 并使用带随机干扰的随机任务场景进行训练以提高模型泛化性. 在实验中将NMPC-MALSTM-TD3架构与使用DDPG、SAC、TD3、PPO算法作为干扰补偿器的架构进行对比, 实验结果表明, NMPC-MALSTM-TD3架构的综合表现最好, 而且对NMPC的稳定性和实时性影响较小.
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2000,9(2):38-41, DOI:
    [摘要] (12719) [HTML] (0) [PDF ] (22338)
    摘要:
    本文详细讨论了VRML技术与其他数据访问技术相结合 ,实现对数据库实时交互的技术实现方法 ,并简要阐述了相关技术规范的语法结构和技术要求。所用技术手段安全可靠 ,具有良好的实际应用表现 ,便于系统移植。
    1993,2(8):41-42, DOI:
    [摘要] (9768) [HTML] (0) [PDF ] (32138)
    摘要:
    本文介绍了作者近年来应用工具软件NU清除磁盘引导区和硬盘主引导区病毒、修复引导区损坏磁盘的 经验,经实践检验,简便有效。
    1995,4(5):2-5, DOI:
    [摘要] (9304) [HTML] (0) [PDF ] (14373)
    摘要:
    本文简要介绍了海关EDI自动化通关系统的定义概况及重要意义,对该EDI应用系统下的业务运作模式所涉及的法律问题,采用EDIFACT国际标准问题、网络与软件技术问题,以及工程管理问题进行了结合实际的分析。
    2016,25(8):1-7, DOI: 10.15888/j.cnki.csa.005283
    [摘要] (8945) [HTML] () [PDF 1167952] (39084)
    摘要:
    从2006年开始,深度神经网络在图像/语音识别、自动驾驶等大数据处理和人工智能领域中都取得了巨大成功,其中无监督学习方法作为深度神经网络中的预训练方法为深度神经网络的成功起到了非常重要的作用. 为此,对深度学习中的无监督学习方法进行了介绍和分析,主要总结了两类常用的无监督学习方法,即确定型的自编码方法和基于概率型受限玻尔兹曼机的对比散度等学习方法,并介绍了这两类方法在深度学习系统中的应用,最后对无监督学习面临的问题和挑战进行了总结和展望.
    2008,17(5):122-126, DOI:
    [摘要] (7966) [HTML] (0) [PDF ] (48796)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
    2011,20(11):80-85, DOI:
    [摘要] (7687) [HTML] () [PDF 863160] (42989)
    摘要:
    在研究了目前主流的视频转码方案基础上,提出了一种分布式转码系统。系统采用HDFS(HadoopDistributed File System)进行视频存储,利用MapReduce 思想和FFMPEG 进行分布式转码。详细讨论了视频分布式存储时的分段策略,以及分段大小对存取时间的影响。同时,定义了视频存储和转换的元数据格式。提出了基于MapReduce 编程框架的分布式转码方案,即Mapper 端进行转码和Reducer 端进行视频合并。实验数据显示了转码时间随视频分段大小和转码机器数量不同而变化的趋势。结
    1999,8(7):43-46, DOI:
    [摘要] (7357) [HTML] (0) [PDF ] (24022)
    摘要:
    用较少的颜色来表示较大的色彩空间一直是人们研究的课题,本文详细讨论了半色调技术和抖动技术,并将它们扩展到实用的真彩色空间来讨论,并给出了实现的算法。
    2022,31(5):1-20, DOI: 10.15888/j.cnki.csa.008463
    [摘要] (6618) [HTML] (4010) [PDF 2584043] (5875)
    摘要:
    深度学习方法的提出使得机器学习研究领域得到了巨大突破, 但是却需要大量的人工标注数据来辅助完成. 在实际问题中, 受限于人力成本, 许多应用需要对从未见过的实例类别进行推理判断. 为此, 零样本学习(zero-shot learning, ZSL)应运而生. 图作为一种表示事物之间联系的自然数据结构, 目前在零样本学习中受到了越来越多的关注. 本文对零样本图学习方法进行了系统综述. 首先概述了零样本学习和图学习的定义, 并总结了零样本学习现有的解决方案思想. 然后依据图的不同利用方式对目前零样本图学习的方法体系进行了分类. 接下来讨论了零样本图学习所涉及到的评估准则和数据集. 最后指明了零样本图学习进一步研究中需要解决的问题以及未来可能的发展方向.
    2012,21(3):260-264, DOI:
    [摘要] (6569) [HTML] () [PDF 336300] (45314)
    摘要:
    开放平台的核心问题是用户验证和授权问题,OAuth 是目前国际通用的授权方式,它的特点是不需要用户在第三方应用输入用户名及密码,就可以申请访问该用户的受保护资源。OAuth 最新版本是OAuth2.0,其认证与授权的流程更简单、更安全。研究了OAuth2.0 的工作原理,分析了刷新访问令牌的工作流程,并给出了OAuth2.0 服务器端的设计方案和具体的应用实例。
    2007,16(9):22-25, DOI:
    [摘要] (6537) [HTML] (0) [PDF ] (7052)
    摘要:
    本文结合物流遗留系统的实际安全状态,分析了面向对象的编程思想在横切关注点和核心关注点处理上的不足,指出面向方面的编程思想解决方案对系统进行分离关注点处理的优势,并对面向方面的编程的一种具体实现AspectJ进行分析,提出了一种依据AspectJ对遗留物流系统进行IC卡安全进化的方法.
    2011,20(7):184-187,120, DOI:
    [摘要] (6411) [HTML] () [PDF 731903] (33851)
    摘要:
    针对智能家居、环境监测等的实际要求,设计了一种远距离通讯的无线传感器节点。该系统采用集射频与控制器于一体的第二代片上系统CC2530 为核心模块,外接CC2591 射频前端功放模块;软件上基于ZigBee2006 协议栈,在ZStack 通用模块基础上实现应用层各项功能。介绍了基于ZigBee 协议构建无线数据采集网络,给出了传感器节点、协调器节点的硬件设计原理图及软件流程图。实验证明节点性能良好、通讯可靠,通讯距离较TI 第一代产品有明显增大。
    (), DOI:
    [摘要] (6309) [HTML] (19) [PDF ] (14)
    摘要:
    2019,28(6):1-12, DOI: 10.15888/j.cnki.csa.006915
    [摘要] (6102) [HTML] (19292) [PDF 672566] (25553)
    摘要:
    知识图谱是以图的形式表现客观世界中的概念和实体及其之间关系的知识库,是语义搜索、智能问答、决策支持等智能服务的基础技术之一.目前,知识图谱的内涵还不够清晰;且因建档不全,已有知识图谱的使用率和重用率不高.为此,本文给出知识图谱的定义,辨析其与本体等相关概念的关系.本体是知识图谱的模式层和逻辑基础,知识图谱是本体的实例化;本体研究成果可以作为知识图谱研究的基础,促进知识图谱的更快发展和更广应用.本文罗列分析了国内外已有的主要通用知识图谱和行业知识图谱及其构建、存储及检索方法,以提高其使用率和重用率.最后指出知识图谱未来的研究方向.
    2004,13(10):7-9, DOI:
    [摘要] (6068) [HTML] (0) [PDF ] (12141)
    摘要:
    本文介绍了车辆监控系统的组成,研究了如何应用Rockwell GPS OEM板和WISMOQUIKQ2406B模块进行移动单元的软硬件设计,以及监控中心 GIS软件的设计.重点介绍嵌入TCP/IP协议处理的Q2406B模块如何通过AT指令接入Internet以及如何和监控中心传输TCP数据.
    2008,17(1):113-116, DOI:
    [摘要] (6003) [HTML] (0) [PDF ] (50235)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(8):87-89, DOI:
    [摘要] (5934) [HTML] (0) [PDF ] (42308)
    摘要:
    随着面向对象软件开发技术的广泛应用和软件测试自动化的要求,基于模型的软件测试逐渐得到了软件开发人员和软件测试人员的认可和接受。基于模型的软件测试是软件编码阶段的主要测试方法之一,具有测试效率高、排除逻辑复杂故障测试效果好等特点。但是误报、漏报和故障机理有待进一步研究。对主要的测试模型进行了分析和分类,同时,对故障密度等参数进行了初步的分析;最后,提出了一种基于模型的软件测试流程。
    2008,17(8):2-5, DOI:
    [摘要] (5805) [HTML] (0) [PDF ] (32952)
    摘要:
    本文介绍了一个企业信息门户中单点登录系统的设计与实现。系统实现了一个基于Java EE架构的结合凭证加密和Web Services的单点登录系统,对门户用户进行统一认证和访问控制。论文详细阐述了该系统的总体结构、设计思想、工作原理和具体实现方案,目前系统已在部分省市的广电行业信息门户平台中得到了良好的应用。
    2004,13(8):58-59, DOI:
    [摘要] (5757) [HTML] (0) [PDF ] (28456)
    摘要:
    本文介绍了Visual C++6.0在对话框的多个文本框之间,通过回车键转移焦点的几种方法,并提出了一个改进方法.
    2009,18(5):182-185, DOI:
    [摘要] (5728) [HTML] (0) [PDF ] (34723)
    摘要:
    DICOM 是医学图像存储和传输的国际标准,DCMTK 是免费开源的针对DICOM 标准的开发包。解读DICOM 文件格式并解决DICOM 医学图像显示问题是医学图像处理的基础,对医学影像技术的研究具有重要意义。解读了DICOM 文件格式并介绍了调窗处理的原理,利用VC++和DCMTK 实现医学图像显示和调窗功能。
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2007,16(10):48-51, DOI:
    [摘要] (4866) [HTML] (0) [PDF 0.00 Byte] (88931)
    摘要:
    论文对HDF数据格式和函数库进行研究,重点以栅格图像为例,详细论述如何利用VC++.net和VC#.net对光栅数据进行读取与处理,然后根据所得到的象素矩阵用描点法显示图像.论文是以国家气象中心开发Micaps3.0(气象信息综合分析处理系统)的课题研究为背景的.
    2002,11(12):67-68, DOI:
    [摘要] (4156) [HTML] (0) [PDF 0.00 Byte] (59917)
    摘要:
    本文介绍非实时操作系统Windows 2000下,利用VisualC++6.0开发实时数据采集的方法.所用到的数据采集卡是研华的PCL-818L.借助数据采集卡PCL-818L的DLLs中的API函数,提出三种实现高速实时数据采集的方法及优缺点.
    2008,17(1):113-116, DOI:
    [摘要] (6003) [HTML] (0) [PDF 0.00 Byte] (50235)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(5):122-126, DOI:
    [摘要] (7966) [HTML] (0) [PDF 0.00 Byte] (48796)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号