快速检索
    过刊检索
    全选反选导出
    显示模式:
    2025,34(7):1-13, DOI: 10.15888/j.cnki.csa.009942, CSTR: 32024.14.csa.009942
    [摘要] (129) [HTML] (73) [PDF 6.74 K] (85)
    摘要:
    人工智能若想从根本上理解我们周围的世界, 关键在于它能否学会从所观察到的低级感官数据中识别并解开隐藏的潜在可解释因素. 解耦表征学习正是为了从数据中提取出这些独立且可解释的潜在变量, 而因果解耦表征学习则更进一步强调了这些潜在变量之间的因果关系, 从而更真实地模拟现实世界的复杂性. 鉴于因果学习的重要性日益增长, 本文对结合因果学习的解耦表征学习的相关方法进行了详细、全面地介绍, 旨在为解耦表征学习的未来发展提供支持. 根据常用的因果学习的相关方法对因果解耦表征学习进行分类, 主要探讨了结合结构因果模型和基于流模型的解耦表征学习方法以及常用的数据集与评价指标. 此外, 还分析了因果解耦表征学习在图像生成、3D姿态估计和无监督领域适应等应用的实际案例, 并对未来的研究方向进行前瞻性展望, 为科研人员和实践者揭示未来可能的探索方向, 促进该领域的持续发展和创新.
    2025,34(7):14-22, DOI: 10.15888/j.cnki.csa.009940, CSTR: 32024.14.csa.009940
    摘要:
    光伏板的清洁与维护是光伏电站运行中的关键任务, 其中搭载机械臂和光伏清洁终端的光伏清洁摆渡车系统成为一种创新的解决方案. 这类系统需要精确获取光伏板的位姿, 包括车身相对光伏板的倾角与距离. 为解决这一问题, 本文提出了一种基于单目相机的光伏板视觉定位方法. 本文首先对YOLOv8-pose关键点检测模型进行改进以提高检测精度. 引入PSA注意力机制优化骨干网络, 采用DySample动态上采样模块并提出ADown*下采样模块对颈部网络进行增强. 然后结合改进后的YOLOv8-pose与光伏板的几何特征, 提出倾角和距离计算方法, 从而实现光伏板的姿态定位. 实验结果表明, 本文提出的改进算法相较于原始YOLOv8-pose计算的光伏板倾角与距离精度分别提升了26.2%与20.1%, 能够更准确地对光伏板进行定位.
    2025,34(7):23-36, DOI: 10.15888/j.cnki.csa.009878, CSTR: 32024.14.csa.009878
    [摘要] (140) [HTML] (43) [PDF 6.72 K] (208)
    摘要:
    为解决复杂背景干扰导致的行人检测精度低和漏检率高的问题, 本文提出一种融合改进注意力的自适应双分支密集行人检测算法DACD-YOLO. 首先, 主干网络采用自适应融合双分支结构, 通过动态权重实现不同特征的融合, 并引入深度可分离卷积降低计算量, 有效缓解传统单分支网络中信息丢失的问题; 其次, 提出自适应视觉中心, 通过动态优化增强层内特征提取, 并重设通道数以平衡精度与计算量; 然后, 提出坐标双通道注意力机制, 结合异构卷积核设计轻量化融合模块, 降低计算复杂度并增强对关键特征的捕捉能力; 最后, 采用膨胀卷积检测头, 通过不同膨胀率卷积融合多尺度特征, 有效增强小目标和遮挡目标的特征提取能力. 实验结果表明, 与原版YOLOv8n相比, 改进算法在WiderPerson数据集上的mAP@0.5和mAP@0.5:0.95分别提高2.3%和2.2%, 在CrowdHuman数据集上mAP@0.5和mAP@0.5:0.95分别提升3.5%和4.6%. 实验结果表明, 改进算法在密集行人检测方面相较于原算法具有显著的精度提升.
    2025,34(7):37-47, DOI: 10.15888/j.cnki.csa.009939, CSTR: 32024.14.csa.009939
    [摘要] (101) [HTML] (48) [PDF 6.76 K] (84)
    摘要:
    随着自动化技术和机器人领域的快速发展, 移动机器人路径规划的精确性要求日益提高. 针对深度强化学习在复杂环境下路径规划存在的收敛稳定性差、样本效率低及环境适应性不足等问题, 提出了一种改进的基于决斗深度双Q网络的路径规划算法(R-D3QN). 通过构建双网络架构解耦动作选择与价值估计过程, 有效缓解Q值过估计问题, 提高收敛稳定性; 设计时序优先经验回放机制, 结合长短期记忆网络(LSTM)的时空特征提取能力, 改进样本利用效率; 提出基于模拟退火的多阶段探索策略, 平衡了探索与利用, 增强环境适应性. 实验结果表明, 与传统DQN算法相比, R-D3QN算法在简单环境下平均奖励值提高了9.25%, 收敛次数减少了24.39%, 碰撞次数减少了41.20%; 在复杂环境下, 平均奖励值提升了12.98%, 收敛次数减少了11.86%, 碰撞次数减少了42.14%. 同时与其他改进的DQN算法对比也具有明显的优势, 验证了所提算法的有效性.
    2025,34(7):48-58, DOI: 10.15888/j.cnki.csa.009888, CSTR: 32024.14.csa.009888
    [摘要] (85) [HTML] (57) [PDF 6.77 K] (133)
    摘要:
    随着互联网的普及, 越来越多用户倾向于在社交平台公开表达自己的个人细节和情感内容, 这些网络文本数据往往体现着不同场景下的真实表达, 反映了用户内在的心理特质及人格倾向. 近年来, 基于社交文本的人格检测研究取得了显著进展, 然而, 研究者们大多直接使用未经处理的公开数据集, 这些数据集因其收集过程导致不可避免地存在噪声, 此外, 大多过分依赖预训练模型提取的文本语义特征, 而缺乏对心理语言学特征的引入. 为了解决以上问题, 提出一种新型的人格检测研究方法. 该方法首先基于置信学习完成噪声数据清洗, 提高数据集质量. 其次, 提取多层次心理语言学特征来填补单一文本语义特征的不足. 最后通过动态深度图卷积网络来优化特征表达, 完成最终的人格检测任务. 在公开的Kaggle MBTI数据集上对该方法进行性能评估, 结果表明, 与目前先进的方法相比, 该方法在准确率和F1值上分别提升了5.48%和4.22%.
    2025,34(7):59-71, DOI: 10.15888/j.cnki.csa.009908, CSTR: 32024.14.csa.009908
    [摘要] (83) [HTML] (41) [PDF 6.79 K] (121)
    摘要:
    光学遥感图像中的云遮挡问题是遥感数据处理中的核心挑战之一, 针对目前云层去除技术在处理云层边缘信息及保留图像细节方面的缺陷, 本文提出基于时谱域融合与时序自注意力增强的生成对抗网络(TGAN). TGAN通过其两阶段模块化设计, 实现了遥感图像修复质量与处理效率的双重提升. 第1阶段, 基于时序自注意力机制的特征提取模块, 用线性升维层捕获时域、谱域特征, 以一维线性降维层弥补传统最大池化不足, 增强时间序列位置特征建模能力, 还设计含权重分配策略的多头自注意力机制精准捕捉边缘信息; 第2阶段为自适应图像修复模块, 由随机噪声消除与局部对比增强子模块协同改善图像细节、抑制噪声. 此外, TGAN 的鉴别器采用多尺度模块, 这一策略实现了全局一致性与局部细节之间的平衡. 通过生成器与鉴别器之间的交互博弈, 生成器持续优化修复图像, 以提高修复效果. 这种动态的博弈过程推动了生成器在图像修复任务中的迭代优化. 为了验证TGAN的有效性, 本文在Sen2_MTC数据集上进行了实验. 实验结果表明, TGAN在峰值信噪比(PSNR)和主观视觉评估方面均显著优于现有方法, 在训练集和测试集的PSNR分别达到了21.547 dB和20.206 dB, 表明该方法在遥感云层图像修复任务中具有较好的性能与应用潜力.
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    优先出版日期:  2025-07-14 ,DOI: 10.15888/j.cnki.csa.009925
    摘要:
    针对水下目标检测任务中图像分辨率低、目标尺寸变化大、水体浑浊及目标遮挡而导致检测精度低的问题, 提出一种基于细节增强与多尺度特征融合的水下目标检测模型DEMF-YOLO11n (YOLO11n underwater object detection model based on detail enhancement and multi-scale feature fusion). 模型以YOLO11n为主体, 为改善普通下采样对低分辨率图像及小目标造成特征损失的问题, 使用浅层与深层鲁棒下采样方法RFD (robust feature downsampling)分别替换模型浅层及深层步长卷积. 同时, 使用多核并行卷积模块PKIModule (poly kernel inception module)及上下文锚点注意力CAA (context anchor attention)对模型骨干中的C3k2进行重新设计, 以增强模型对遮挡目标及不同尺度目标的特征提取效果, 以及对复杂背景下目标的感知能力. 最后, 为解决水体浑浊等因素所导致的目标边缘细节模糊问题, 在头部网络中使用CGAFusion (content guide attention fusion)模块将深层特征与经EEM (edge enhance module)进行边缘增强后的浅层纹理特征进行自适应融合. 在RUOD数据集上的实验结果表明, DEMF-YOLO11n较基准模型mAP50提升2.8%, mAP50-95提升4.1%, 而参数量仅增加0.53M.
    优先出版日期:  2025-07-14 ,DOI: 10.15888/j.cnki.csa.009926
    摘要:
    目前, 人工智能模型版权保护研究主要集中在水印技术的鲁棒性和模型精度提升, 而对于模型溯源追踪的研究仍然较少. 针对多用户模式下盗版难于追踪的问题, 提出了一个支持盗版溯源的模型指纹框架. 该框架为每个用户随机抽取唯一的可控数据增强组合, 基于此生成各用户的溯源指纹集. 接着结合多任务学习技术, 利用指纹集同时再训练源模型和接收源模型输出的溯源模型. 再训练完成后, 嵌入独特指纹集特征的源模型转化为用户专有模型, 溯源模型则能根据指纹集在对应专有模型上的预测结果推断出对应用户, 实现溯源有效性和专有模型性能之间的平衡. 在CIFAR10和Fashion-MNIST数据集上的实验结果表明, 所提出的方法在盗版检测和溯源追踪任务上均达到了90%以上的准确度, 验证了其在不同任务场景下的有效性.
    优先出版日期:  2025-07-14 ,DOI: 10.15888/j.cnki.csa.009928
    摘要:
    在智慧城市中, 无线通信网络连接了众多边缘智能设备, 用于收集和传输各种类型的数据. 为了保护数据隐私, 联邦学习被广泛应用于智慧城市环境中. 然而, 城市中的高密度建筑物和复杂多径传播会导致信道衰落, 严重影响通信质量和联邦学习的性能. 针对这一问题, 提出了一种基于强化学习的无线联邦学习系统自适应延迟等待时间调整算法. 该算法通过强化学习方法自动调整等待时间, 以适应动态变化的信道条件, 缓解由信道衰落引起的数据传输延迟问题, 并通过优化等待时间避免因部分客户端延迟掉队而导致的模型不可信问题. 在MNIST和CIFAR-10数据集上的仿真结果表明, 所提出的算法在保证系统性能的同时能够确保结果的可信性, 并且在多个关键性能指标上显著优于其他基线算法.
    优先出版日期:  2025-07-14 ,DOI: 10.15888/j.cnki.csa.009929
    摘要:
    目前, 异质图神经网络已经取得了显著的进展, 但仍存在着参数量过大, 计算时间长等问题. 量子图神经网络通过利用量子计算的特性, 能够显著优化传统图神经网络的计算性能, 为解决这一问题提供了一种潜在的解决方案. 然而, 由于异质图中复杂的语义关系和多样的特征类型, 目前基于同质图的量子图神经网络无法直接迁移到这类图结构. 为了解决上述问题, 本文提出量子异质图注意力网络(quantum heterogeneous graph attention network, QHAN). 首先, 本文提出了一种动态图分解策略, 根据不同量子设备上可用量子比特的最大数量进一步分解子图, 并设计了对应的双向振幅编码方式来进行量子态编码. 在此基础上, 我们基于线性组合酉实现了不同层次语义注意力系数的参数化量子线路设计, 该方法可以并行化计算节点级和语义级注意力系数, 并实现同层级上的参数共享. 在3个基准数据集上进行的实验表明, 与以前的量子图神经网络模型相比, QHAN模型在分类任务的性能上具有显著的优势. 此外, 本文模型能达到与经典异质图神经网络相近的结果, 但是所用参数更少.
    优先出版日期:  2025-07-14 ,DOI: 10.15888/j.cnki.csa.009934
    摘要:
    国有大型火力发电厂冷凝塔的水温预测对“双碳”减排有重要意义, 为提高电厂运行能效, 解决监测数据非实时预测方法中的原始数据波动大、预测精度低等问题, 本文提出一种基于PINN-CEEMDAN-GA-BiLSTM分解组合模型的预测方法. 首先, 使用自适应噪声完全集合经验模态分解(CEEMDAN)模型在快速提取非线性和非光滑信号的时频特征方面的优势, 对分解得到的13个固有模态函数(IMF)进行重构. 其次, 使用遗传算法(GA)对CEEMDAN的参数进行优化调整. 最后, 引入物理信息神经网络(PINN)来引导物理规律和约束条件, 将物理信息纳入损失函数中, 利用双向长短期记忆神经网络(BiLSTM)模型在物理信息神经网络下对在每个重构的IMF分量进行建模和预测. 这种组合利用BiLSTM在物理信息神经网络下对数据进行更准确的建模, 有助于提高预测精度和模型的稳定性. 通过将该模型与其他混合模型进行对比分析, 结果证明, 所提出模型具有较高的预测精度, 决定系数、均方根误差、平均绝对误差和平均绝对百分比误差分别为0.9987、0.1295、0.1001、0.4541, 验证了该模型在水温预测方面的有效性.
    优先出版日期:  2025-06-27 ,DOI: 10.15888/j.cnki.csa.009921
    摘要:
    联邦学习已广泛应用于工业控制系统入侵检测, 通过整合不同系统的高质量数据集, 共同训练高性能神经网络模型, 显著提升入侵检测能力. 然而, 现有工控联邦学习方法难以在高性能、低资源消耗和高隐私保护之间实现平衡. 为此, 提出一种面向工控入侵检测的双服务器安全串行联邦学习(dual-server secure serial federated learning, DS-SSFL)方法. 通过双中心服务器协调客户端进行异步串行训练, 高效挖掘各个客户端的数据特征, 共同构建高性能入侵检测模型; 结合决策差分隐私保护机制, 全方位保护数据隐私安全; 并通过抗遗忘聚合策略有效缓解串行训练中的模型灾难性遗忘问题. 实验结果表明, 相比于传统联邦学习方法, DS-SSFL显著降低了通信和计算资源开销, 提升了模型的鲁棒性与收敛效率.
    优先出版日期:  2025-06-27 ,DOI: 10.15888/j.cnki.csa.009923
    摘要:
    方面级多模态情感分析属于情感分析以及观点挖掘方向的一个子领域, 旨在方面或属性级别开展情感和观点的分析. 在过去的图文多模态情感分析研究里, 研究者针对如何从图像和文本中提取并融合特征提出了各种方法, 由于图文信息初始所在的语义空间不一致, 最常用的方法是先从单模态中通过模块提取相应的深层信息, 将图像和文本特征映射到一个相同的深层语义空间中, 随后使用特征融合模块进行图文特征融合. 然而, 这种方法势必会引入多个模块用于处理图像和文本的特征并进行融合, 这不可避免增加了模型的参数量和复杂度. 随着如今大语言模型的发展, 在浅层空间将图像和文本的语义空间进行对齐已成为可能. 本研究利用通义千问开源大模型, 在预处理阶段通过提示词生成图像的文本描述, 让多模态情感分析回归到单模态情感分析任务, 仅通过文本处理模块就能得到最终的图文情感分析结果. 实验表明, 与先前的大多数模型相比, 该方法显著降低了参数量且取得了性能上的提升. 与同样轻量级的TISRI模型相比, 该模型在训练速度和资源占用上均取得了显著优势. 代码实现参考https://github.com/triangleXIV/ITFFT.
    优先出版日期:  2025-06-27 ,DOI: 10.15888/j.cnki.csa.009950
    摘要:
    视觉重定位一直是三维视觉领域广泛讨论的问题, 该问题解决在给定先验地图的情况下, 估计出查询图像的6DOF相机位姿. 在大规模室内环境中进行重定位是增强现实和机器人导航等应用的关键, 然而当相机移动时, 场景外观会快速变化, 这对重定位系统来说非常具有挑战性. 为了解决这个问题, 本文提出了一种基于虚拟视图合成的方法, 旨在特定场景下, 丰富查询数据库并优化位姿估计. 与基于渲染真实图像的虚拟视图合成方法不同, 其无需高质量的三维模型. 本文方法选择直接渲染虚拟视点下的全局和局部特征, 并将它们分别应用于后续的图像检索和特征匹配操作. 所提方法可以在大规模室内环境中大幅提高重定位性能, 例如在InLoc数据集上取得了7.1%和12.2%的提升.
    优先出版日期:  2025-06-27 ,DOI: 10.15888/j.cnki.csa.009919
    摘要:
    针对高分辨率光学遥感影像地表覆盖复杂性增加、同质区域异质性增加、不同区域相似性增加导致分类难度增加等问题. 对高斯混合模型(Gaussian mixture model, GMM)进行改进, 提出一种基于双邻域关系的高斯回归混合模型(Gaussian regression mixture model, GRMM)监督学习方法. 首先, 对影像区域进行监督采样, 通过最小二乘法对直方图进行拟合, 对每个土地覆盖建立高斯混合模型表征复杂的土地覆盖灰度特征. 其次, 将相邻像素的局部空间信息引入到影像灰度空间中, 构建高斯回归模型. 最后, 在隶属度空间中, 对邻域关系进行再次处理, 实现分类决策. GRMM在合成影像及真实高分辨率遥感影像上的Kappa系数分别达到了97.2%、98.5%, 与现有主流模型相比具有较强的分类效率、去噪能力以及泛化能力, 分类结果边界清晰, 有效提高了高分辨率遥感影像分类能力.
    优先出版日期:  2025-06-27 ,DOI: 10.15888/j.cnki.csa.009915
    摘要:
    针对皮肤图像中存在目标分割区域尺度变化大、病变区域误分割及边界模糊等问题, 本文提出了一种名为MSANet的皮肤病变分割方法. 该方法以pyramid vision Transformer v2 (PVT v2)网络模型作为骨架网络, 结合Transformer 和卷积神经网络 (CNN)的优势, 通过对多层融合解码策略进行改进, 提升了皮肤病变分割的准确性. 首先, 解码部分利用分割门控注意力模块 (SGA)获取多尺度全局和局部空间特征, 增强模型对上下文信息的捕获能力. 随后采用多尺度上下文注意力模块 (MCA)抽取并整合通道和位置信息, 提升网络对病灶区域的精准定位. 在ISIC2017和ISIC2018数据集上的实验结果表明, MSANet的主要指标Dice系数分别达到了90.12%和90.91%, mIoU分别为85.82%和84.27%, 其分割性能优于现有方法.
    优先出版日期:  2025-06-27 ,DOI: 10.15888/j.cnki.csa.009912
    摘要:
    红外小目标检测旨在从红外图像中将小目标与背景进行像素级别的分离, 在军事、安防和航天等领域具有重要应用. 然而, 由于低对比度和低信噪比的影响, 现有方法容易丢失红外小目标的边缘信息, 也未能有效利用红外图像中低级和高级特征间的关系. 为此, 本文提出了一种边缘引导与交叉融合的红外小目标检测方法. 针对现有方法在提取边缘信息方面的不足, 本文构建了边缘引导的特征提取模块. 该模块通过注意力加权的方式将图像的边缘信息融入图像的全局-局部和细节特征中, 从而更有效地利用小目标的边缘信息. 此外, 为了更好地融合图像的高级和低级特征并提高目标与背景的分离能力, 本文设计了双分支交叉融合模块. 该模块通过空间注意力和通道注意力分别处理图像的低级和高级特征, 并通过交叉融合充分利用不同级别特征之间的互补性. 在两个基准数据集上的实验结果表明, 该方法相较于先进方法, IoU指标提升了1.89%, nIoU指标提升了2.28%.
    优先出版日期:  2025-06-27 ,DOI: 10.15888/j.cnki.csa.009896
    摘要:
    针对YOLOv5s算法作为DeepSORT的目标检测器具有计算量大、模型复杂以及检测精度有待提高等问题. 首先, 引入GhostNet轻量化模块对YOLOv5s模型进行轻量化, 减少模型的参数量与计算量, 以满足移动端的部署要求; 其次, 引入ECA注意力机制, 增强模型的感知能力, 提升检测性能; 最后, 对YOLOv5s模型进行知识蒸馏, 进一步提升模型的检测精度. 改进后的YOLOv5s在精确度、召回率和mAP@0.5上与未改进的YOLOv5s相比分别提高2%、1%和0.8%, 模型参数量降低47%, 模型复杂度降低48%. 将改进后的YOLOv5s与DeepSORT算法相结合, 与未改进的YOLOv5s相比在MOTA、MOTP和IDF1上分别提升1.2%、3.1%和2.7%, IDS下降35. 通过实验验证, 改进后的YOLOv5s作为检测器能够提升检测速度, 减少行人ID的切换, 能有效应用于行人跟踪.
    优先出版日期:  2025-06-24 ,DOI: 10.15888/j.cnki.csa.009893
    摘要:
    高通量X射线衍射(X-ray diffraction, XRD)分析在加速材料发现方面至关重要, 但传统方法通常依赖大量人工解释, 且在处理复杂的XRD数据时容易忽视低强度峰值信息, 从而限制准确性的提升. 为解决这一问题, 本文提出了一个面向多模态晶体结构预测的大语言模型(large language model, LLM)代理框架, 该框架集成了GPT-4驱动的智能代理以及基于XRD和对分布函数的多模态投票模型, 能够自主执行晶体结构和空间群预测任务. 此外, 本文通过引入知识图谱来增强LLM的推理能力, 帮助其理解晶体特征之间的关系, 进一步提升预测的准确性. 实验结果表明, 该框架在晶体结构预测和空间群预测任务上的准确率分别达到97.5%和98.7%. 这一设计显著提升了高通量分析的准确性和效率, 有望推动材料科学研究的进展, 为解决其他具有高度关联性的多任务问题提供宝贵的启示.
    优先出版日期:  2025-06-24 ,DOI: 10.15888/j.cnki.csa.009909
    摘要:
    近年来, 方面级情感分析利用图神经网络挖掘依赖句法信息逐渐成为趋势, 但现有方法大多未考虑不同关系类型对内容词的影响, 难以区分关键的关联词. 此外, 多视角信息的相互补充对捕捉情感特征起重要作用, 但在过去的研究中融合机制常被忽视. 为解决这些问题, 提出一种多源信息融合图卷积网络(multi-source information graph convolutional network, MSI-GCN)有效捕获和集成三视角信息. 首先, 设计了一个双通道信息提取模块SSD-GCN (syntax-semantics dual graph convolutional network), 由类型嵌入的句法增强图卷积网络(TES-GCN)和语义图卷积网络(SEM-GCN)组成. TES-GCN通过引入类型嵌入层, 使用句法模块学习不同类型的权重来增强句法信息. SEM-GCN对自注意矩阵进行编码, 捕获语义信息, 并引入正交正则化来增强语义关联. 其次, 嵌入外部知识图表示丰富词汇特征. 最后, 引入局部门控-全局卷积网络, 充分利用视角之间的互补性, 对其进行有效融合. 本文在4个公开数据集上对提出的方法进行了评估, 准确率和Macro-F1值相比于基线模型均有所提升.
    优先出版日期:  2025-06-24 ,DOI: 10.15888/j.cnki.csa.009910
    摘要:
    近年来, 随着自闭症谱系障碍(ASD)诊断需求的增加, 基于脑电信号的自动化检测方法受到广泛关注. 然而, 现有方法在准确性、泛化能力、鲁棒性和可解释性方面仍面临诸多挑战. 本研究提出了一种改进的自闭症检测模型ACLNet (attention-CosCNN-LSTM-net), 通过多维注意力机制提升模型对关键信号的关注度, 结合余弦卷积神经网络捕捉脑电信号的频率特征, 以及树状LSTM模块建模信号中的层次化结构与长期依赖, 全面提取脑电信号的时空与频域特征. 基于ASD脑电信号数据集的5折交叉验证实验表明, ACLNet实现了94.11%的分类准确率、93.29%的召回率和93.78%的精确率, 显著优于现有检测方法. 此外, 模型在不同数据划分及未见数据上表现稳定, 泛化能力和鲁棒性得到充分验证. 本研究还设计了消融实验分析关键模块对性能的贡献, 验证其对特征提取的重要贡献. 本研究为ASD自动化检测提供了一种高效、稳定且具可解释性的解决方案, 进一步推动了脑电信号在ASD检测中的应用, 为相关研究和临床诊断提供支持.
    优先出版日期:  2025-06-24 ,DOI: 10.15888/j.cnki.csa.009911
    摘要:
    在流程挖掘领域, 众多流程操作高度依赖于事件日志中精确的时间戳信息. 因此, 与时间戳相关的质量问题影响尤为显著, 特别是相同时间戳错误, 这种错误会引发误导性的流程见解, 进而造成严重的流程偏差. 现有研究在处理此类错误时, 缺乏对事件间长期依赖关系以及属性间潜在关联性的充分考量, 在一定程度上限制了相同时间戳错误的修复精度. 针对这一问题, 本文提出了一种基于分层Transformer模型修复相同时间戳错误的方法. 该方法通过分层信息传递结合多视角交互, 捕获事件间的长距离行为依赖以及属性间的深层关联信息, 逐层完成对错误事件重排序以及对应时间戳的预测任务, 继而实现对相同时间戳错误事件日志的有效修复. 通过4个公开可用的数据集进行评估, 结果表明, 所提方法能够有效提高相同时间戳错误的修复精度.
    优先出版日期:  2025-06-24 ,DOI: 10.15888/j.cnki.csa.009914
    摘要:
    缓冲区溢出漏洞广泛存在于由不安全的高级语言所编写的程序中. 利用缓冲区溢出漏洞, 攻击者可以实现控制流劫持等危险攻击方式. 基于canary的栈保护技术是处理缓冲区溢出漏洞的一种简单有效且广泛部署的防御手段, 然而位置固定和取值相同的特点使其容易被攻击者分析和破解. 本文提出一种基于软件多样性的栈保护技术, 它以拥有随机化大小和偏移的异构canary为核心, 不仅能直接抵御常规canary无法处理的泄漏类和覆盖类攻击, 而且能构造出各种更加安全的多样性软件系统. 实验结果表明, 异构canary在有效提升安全性的同时仅为SPEC CPU 2017基准程序集额外引入了不高于2%的编译开销和平均3.22%的运行开销.
    优先出版日期:  2025-06-24 ,DOI: 10.15888/j.cnki.csa.009944
    摘要:
    针对ST-GCN算法在动作识别中需要预先定义人体骨架拓扑图及准确率有待提高等问题, 提出了基于OpenPose与改进ST-GCN结合的跌倒检测算法. 利用OpenPose算法提取人体骨骼关键点数据, 将骨骼关键点数据输入改进的ST-GCN算法中进行动作识别. 对ST-GCN算法进行改进, 引入自适应图卷积模块, 通过动态调整图结构, 增强模型对不同动作类型特征提取的灵活性; 引入注意力机制模块, 进一步提升模型的识别性能. 在公开数据集上验证的结果显示, NTU-RGB+D 60数据集上, X-Sub和X-View的top-1准确率与改进前相比分别提高2.2%和2.5%; Kinetics-Skeleton数据集上, top-1和top-5准确率分别提高3.1%和4%. 自建数据集上的准确率与改进前相比提高4.7%. 实验结果表明, 所提出的算法满足实际应用需求.
    优先出版日期:  2025-06-24 ,DOI: 10.15888/j.cnki.csa.009949
    摘要:
    在联邦学习中, 不稳定客户端可能通过数据污染或恶意行为干扰全局模型的训练过程. 传统的防御方法通常侧重于排除这些客户端, 但忽视了不稳定客户端生成的数据也可以为模型提供有价值的训练信号. 为此, 本文提出了一种增强适应性的联邦对抗训练方法(Fed-ATEA), 利用不稳定客户端生成的对抗样本来增强全局模型的鲁棒性. 该框架允许在不排除不稳定客户端的情况下, 将其生成的对抗样本融入信任组客户端的训练过程, 进而增强模型的稳健性和鲁棒性. 通过动态调整训练策略, 最大化地利用不稳定客户端提供的有益信号, 并有效抑制其负面影响. 实验结果表明, 相对其他联邦学习方法, Fed-ATEA在应对攻击和噪声干扰时展现出更强的稳健性和鲁棒性.
    优先出版日期:  2025-06-24 ,DOI: 10.15888/j.cnki.csa.009924
    摘要:
    针对视听情绪识别中如何高效融合音视频特征并准确提取时间依赖性情绪信息的问题, 本研究提出了一种基于KLSTM (Kolmogorov-Arnold long short-term memory)的互信息视听情绪识别模型. 利用互信息方法进行特征选择和自适应窗口处理, 从音频和视频信号中提取情绪相关的关键片段, 以减少信息冗余; 在特征提取中引入KLSTM网络, 有效捕捉视听模态信号的时间依赖特性; 在融合阶段, 通过跨模态一致性最大化确保音视频特征的协调性与互补性. 实验结果显示所提模型在CMU-MOSI和CMU-MOSEI数据集上均优于现有基准模型, 验证了其在多模态情绪识别任务中的有效性.
    优先出版日期:  2025-06-20 ,DOI: 10.15888/j.cnki.csa.009922
    摘要:
    动态二进制翻译(DBT)技术是一种高效的指令集仿真技术, 常用于构建CPU的仿真模型. 但是, 该技术在仿真数字信号处理器(DSP)时面临诸多挑战. 高性能DSP (例如TI的TMS320C6X系列)常采用超长指令字(VLIW)架构, 而且设计了专用的硬件和指令来简化软件流水线循环的使用. 由于软件流水线循环代码中缺少显式的条件跳转指令和循环计数器修改操作, 而且循环内的指令会被重排、重叠和屏蔽, 因此使用DBT技术翻译这类循环非常困难. 为此, 本文提出了一种新型动态翻译方案, 通过将并行执行的循环迭代串行化, 生成不同状态的翻译块, 以及将内循环和外循环的指令重叠并按照周期对齐, 以同步翻译外循环和内循环, 来正确地模拟软件流水线循环的执行. 实验表明, 在运行含有软件流水线的常用代码时(如dsplib), 采用该翻译方案的仿真器能够得到和硬件开发板相同的结果, 证明了本文方案的正确性, 且本文的仿真器性能是TI官方仿真器的3.25倍.
    优先出版日期:  2025-06-20 ,DOI: 10.15888/j.cnki.csa.009941
    摘要:
    视觉惯性里程计(visual-inertial odometry, VIO)通过融合视觉和惯性数据来实现位姿估计. 在复杂环境中, 惯性数据受噪声干扰, 长时间运动会导致累积误差, 同时大多数VIO忽略了模态间局部信息交互, 未充分利用不同模态的互补性, 从而影响位姿估计精度. 针对上述问题, 本文提出了一种基于注意力机制与局部交互的视觉惯性里程计(attention and local interaction-based visual-inertial odometry, ALVIO)模型. 首先, 该模型分别提取到视觉特征和惯性特征. 其次, 保留惯性特征的历史时序信息, 并通过基于离散余弦变换 (discrete cosine transform, DCT)的通道注意力机制增强低频有效特征, 抑制高频噪声. 接着, 设计了多模态局部交互与全局融合模块, 利用改进的分散注意力机制与MLP-Mixer逐步实现模态间的局部交互与全局融合, 根据不同模态的贡献调节局部特征权重, 实现模态间互补, 再在全局维度上整合特征, 得到统一表征. 最后, 将融合的特征进行时间建模和位姿回归得到相对位姿. 为了验证模型在复杂环境下的有效性, 对公开数据集KITTI和EuRoC进行了低质量处理并实验, 实验表明, ALVIO相较于直接特征拼接模型、多头注意力融合模型、软掩码融合模型, 平移误差分别减少了49.92%、32.82%、37.74%, 旋转误差分别减少了51.34%、25.96%、29.54%, 且具有更高的效率和鲁棒性.
    优先出版日期:  2025-06-20 ,DOI: 10.15888/j.cnki.csa.009951
    摘要:
    随着卫星视频成像技术的显著进步, 卫星视频中的目标跟踪任务引起了越来越多研究人员的关注. 然而之前的研究大多通过全局注意力机制获得空间信息, 这种方法使得模型关注背景部分从而忽略目标; 而且只利用视频帧中目标的空间信息, 目标定位不准确. 本文对现有的孪生网络目标跟踪模型SiamCAR进行改进, 提出时空孪生网络模型Siam-STM. 具体来说, 本文提出基于注意力机制的空间信息感知模块, 聚合图像中的上下文信息并增强卫星视频中小目标特征的辨别力; 为了利用视频帧之间的时间信息, 本文还提出时间信息感知模块对视频中当前帧和历史帧进行融合, 从而学习到不同时刻目标的位置信息, 更好的关注目标轨迹, 缓解相似干扰物的影响. 此外, 为了缓解卫星视频中常见的遮挡影响, 本文在卡尔曼滤波器的基础上引入线性拟合方法, 进而提出一种运动估计机制, 可以有效地建模目标的运动特征进而在目标被遮挡时准确定位目标. 在SatSOT数据集上通过与现有先进模型的实验对比验证了Siam-STM的有效性.
    优先出版日期:  2025-06-20 ,DOI: 10.15888/j.cnki.csa.009907
    摘要:
    单目深度估计(monocular depth estimation, MDE)是计算机视觉中的核心任务之一, 在空间理解、三维重建、自动驾驶等领域扮演着重要角色. 基于深度学习的单目深度估计方法能够从单张图像中预测物体的相对深度, 但由于缺乏度量尺度信息, 常面临尺度不一致的问题, 限制了其在视觉SLAM、三维重建和新视角合成等下游任务中的应用效果. 为此, 单目度量深度估计(monocular metric depth estimation, MMDE)应运而生, 通过对场景尺度的精确推断, 解决了深度预测中的一致性难题, 不仅显著提升了在时序任务中的深度估计稳定性, 还简化了下游任务的适配, 进一步拓展了实际应用场景. 本文系统回顾了深度估计技术的发展历程, 从传统几何方法到深度学习方法的转向, 全面梳理了该领域的技术演进及其关键突破. 在此基础上, 重点讨论了尺度不可知(scale-agnostic)方法在零样本(zero-shot)泛化中的贡献, 分析其如何为MMDE的进一步发展奠定基础. 文章还深入探讨了零样本MMDE的最新研究进展, 聚焦当前的核心挑战, 包括模型的泛化能力、边缘细节丢失等问题. 针对这些问题, 研究社区通过无标数据扩充、图像分块、模型结构优化和生成式方法等创新途径, 取得了一定进展. 本文详细剖析了这些方向的最新成果及其解决思路, 揭示了当前研究的前沿路线与技术局限. 最后, 总结了零样本MMDE领域内最新研究成果之间的内在联系, 梳理了尚待解决的关键问题, 并展望了未来研究方向. 通过对领域现状与发展趋势的全面分析, 旨在为研究者提供清晰的技术脉络和前沿洞察, 助力研究者更快掌握MMDE的研究现状, 为推动更广泛的应用和技术创新提供启示.
    优先出版日期:  2025-06-20 ,DOI: 10.15888/j.cnki.csa.009945
    摘要:
    针对现有算法无法有效整合局部细节和全局结构的问题, 提出一种融合注意力机制优化局部和全局特征的三阶段人脸图像修复算法. 第1阶段引入位置注意力(position attention module, PAM)和聚焦线性注意力机制(focused linear attention, FLA)以增强图像局部纹理细节和全局上下文特征的提取. 在第2阶段优化中, 为了提升局部细节的修复效果, 引入卷积注意力模块(convolutional block attention module, CBAM), 并结合跳跃连接机制. 该设计通过通道和空间维度的差异化权重分配强化特征关注, 同时利用下采样过程中的细节保留策略, 有效实现局部区域的精细化重建. 最后, 引入第3阶段整合特征, 使修复图像更具有鲁棒性. 实验结果表明, 该方法在CelebA-HQ数据集上PSNR和SSIM平均提高了0.1214 dB和0.0022, LPIPS平均下降了0.00065, 显著提高了修复图像质量和视角效果.
    优先出版日期:  2025-06-20 ,DOI: 10.15888/j.cnki.csa.009943
    摘要:
    为提升调制识别的准确性和鲁棒性, 本文提出了一种全新的双模态混合调制识别模型. 模型同时考虑原始时域同相正交(in-phase and quadrature, I/Q)和幅度相位(amplitude and phase, A/P)双模态数据以探索信号的时空相关性. 采用双路对称结构对A/P模态数据进一步处理, 更有效地学习数据间的重复特征, 避免信息冗余. 模型中引入双向长短时记忆网络(bidirectional long short-term memory network, BiLSTM), 利用其双向时序特征提取能力, 增强模型对复杂时序信息的理解. 实验结果表明, 所提模型在数据集RadioML2016.10A上表现良好. 当SNR低于–8 dB时, 平均识别精度比主流模型提升6%, 而SNR在0–18 dB时, 平均识别精度比主流模型提高2%–10%, 且在SNR为16 dB时, 识别精度高达94.32%. 另外, 将模型迁移到数据集RadioML2016.10B所得结果同样最优, 且当SNR为18 dB时识别精度高达93.91%.
    优先出版日期:  2025-06-13 ,DOI: 10.15888/j.cnki.csa.009913
    摘要:
    由于太阳能具有间歇性、不稳定性和随机性, 精确的短期光伏(photovoltaic, PV)功率预测具有较大的挑战, 阻碍了光伏与智能电网的有机整合. 为此, 本文提出了一种名为WVPD (WOA-VMD和PSO-DSN)的方法. 首先, 应用变分模态分解(variational mode decomposition, VMD)获得多个本征模态函数(intrinsic mode function, IMF)分量. 同时, 结合鲸鱼优化算法(whale optimization algorithm, WOA)算法进行模式分量和惩罚因子参数优化, 解决VMD分解不足和模式混合问题. 然后, 利用PV功率和数值天气预报(numerical weather prediction, NWP)数据的空间和时间相关性构建新型双流网络(dual-stream network, DSN), 即结合挤压和激励网络(squeeze-and-excitation networks, SENet)以及双向门控循环单元(bidirectional gated recurrent unit, BiGRU). 同时, 采用粒子群优化算法(particle swarm optimization, PSO)优化DSN中学习率和批量大小. 最后, 验证得出与深度学习混合模型相比, MSE平均提升78.6%, RMSE平均提升53.7%, MAE平均提升37.7%, 所提出的WVPD性能优越. 代码共享于https://github.com/ruanyuyuan/PV-power-forecast.
    优先出版日期:  2025-06-13 ,DOI: 10.15888/j.cnki.csa.009916
    摘要:
    针对通信辐射源细微指纹特征难以提取及单一特征识别率不高的问题, 提出了一种联合最小巴氏距离和相关性分析的变分模态分解与多域特征参数融合的通信辐射源个体识别方法. 首先, 采用基于最小巴氏距离的变分模态分解方法对通信辐射源信号的每个符号波形进行分解, 得到若干个包含数据信息的低频本征模态函数和包含指纹信息的高频本征模态函数; 然后, 计算各本征模态函数与其符号波形信号的相关系数, 选取相关系数小的本征模态函数作为辐射源细微特征分量, 对细微特征分量提取时域、频域及熵多特征参数, 并拼接融合成多域特征向量实现对通信辐射源符号波形的特征提取; 最后, 通过长短期记忆网络对辐射源信号每个符号的多域特征向量依次进行学习分类, 实现通信辐射源个体识别. 选择公开的Oracle数据集进行了实验验证, 实验结果表明当信噪比为6 dB时, 本文提出的方法识别准确率可达96.7%, 比各单一域平均识别准确率提高了22.1%.
    优先出版日期:  2025-06-13 ,DOI: 10.15888/j.cnki.csa.009917
    摘要:
    城市遥感图像具有分辨率高、背景多样、纹理复杂等特点, 这对边界分割提出了挑战. 当前主流的语义分割模型遇到了一些困难, 包括边缘模糊、平滑角等缺陷和无法捕获远程依赖关系. 为了解决这些挑战, 本研究提出了一种基于UNet++的增强模型ARD-UNet++. 我们采用了7×7深度可分离卷积来减少参数计数, 促进更密集的特征提取和更全面的上下文信息捕获; 引入SimAM非参数注意力机制, 在不引入额外参数的情况下选择性地关注关键特征, 有效地抑制无关信息; 集成了残差连接以防止局部最优, 其中Res-SimAM模块取代了上采样节点中的标准卷积块. 与UNet++相比, 本增强模型在UAVid和Potsdam数据集上表现出显著的提升效果, mIoU分别提高了6.77%和1.79%, F1分别提高了4.71%和1.17%, OA分别提高了4.99%和0.98%. 通过与当前主流模型的对比分析, ARD-UNet++具有优越的性能, 是城市遥感图像精确分割的理想解决方案.
    优先出版日期:  2025-06-13 ,DOI: 10.15888/j.cnki.csa.009920
    摘要:
    以物体为中心的学习方法旨在以组成式的方式对场景进行解析与建模, 并提取场景中物体的表示. 早期以物体为中心的学习方法通常使用简单的像素混合解码器来建模场景. 然而, 这些方法在处理复杂的合成数据集和真实世界数据集时通常表现不佳. 相比之下, 最近的一些以物体为中心的学习方法已经开始尝试使用结构更为复杂的解码器(例如自回归Transformer和扩散模型) 来更有效地提取物体表示并建模场景. 尽管这些近期的方法相比于早期的方法具有更好的效果, 但这些方法采用的非组成式建模方法与人类的直觉相悖, 且它们无法根据物体的表示生成对应的物体图像. 为了解决这个问题, 本文提出了以物体为中心的扩散模型(object-centric diffusion model, OCD), OCD使用一种改进的扩散模型作为解码器, 在重构场景的过程中分别生成物体的外观和掩码, 从而在保证模型效果的同时实现图像的组成式建模. 大量的实验证明, OCD在多种数据集(包括两个合成数据集和两个真实世界数据集) 上的图像分割和生成任务中表现出色, 证明了其普适性和有效性.
    优先出版日期:  2025-05-12 ,DOI: 10.15888/j.cnki.csa.009901
    摘要:
    针对遥感图像场景分类中存在的场景尺度多变性、类内多样性和类间相似性, 以及有标签训练样本稀缺的问题, 本文提出了一种结合多尺度特征和细节感知策略的Vision Transformer (ViT)模型用于遥感图像场景分类. 该模型通过引入空洞空间金字塔池化模块, 有效捕捉并融合了遥感图像中的多尺度特征, 同时增强了对局部特征信息的利用, 从而进一步提升了特征判别能力. 另外, 采用创新的细节感知掩码策略, 使得模型能够有效利用无标签遥感图像数据, 促进模型学习到更为精细的特征表示, 以实现更高效、更准确的遥感图像场景分类. 在实验部分, 本文首先在大规模无标签遥感图像数据集上进行预训练, 随后将预训练模型迁移至下游场景分类任务中进行微调. 在多个公开遥感图像数据集上的实验结果表明, 所提模型在自监督预训练阶段能够有效提取图像特征, 并在下游场景分类任务中实现较高的准确率, 展现出良好的鲁棒性和有效性.
    优先出版日期:  2025-05-12 ,DOI: 10.15888/j.cnki.csa.009895
    摘要:
    图在各种应用中扮演着至关重要的角色, 广泛用于建模实体之间的关系. 图面临的工作负载可分为事务型工作负载和分析型工作负载. 许多应用场景需要同时处理这两类工作负载. 然而, 大多数现有的图存储系统只针对其中一种工作负载进行了优化, 无法同时高效地处理两类工作负载. 为了解决这一问题, 本文提出了面向混合工作负载的图存储系统HGraph. 本文通过仔细分析两类工作负载的访问模式, 设计了一种适应混合工作负载的数据结构. 此外, HGraph引入了一种基于撤销日志的多版本并发控制实现, 该方案不仅能够节省内存, 还能提升遍历操作的性能. HGraph还采用了写时复制和乐观并发控制策略, 以优化事务处理流程, 进一步增强系统的并发能力. 在真实和合成数据集上的实验结果表明, HGraph的性能优于其他图存储系统.
    优先出版日期:  2025-05-12 ,DOI: 10.15888/j.cnki.csa.009897
    摘要:
    由于实际应用中丝织物瑕疵样本的稀缺性和异常区域的细微性, 现有方法可能对瑕疵区域不敏感从而导致定位错误. 因此, 为了借助Transformer注意力机制识别细微特征的优势, 本文旨在建立一种适合丝织物瑕疵检测任务的动态注意力共享机制, 以增强模型对细微纹理的捕捉能力. 具体来说, 本文提出了一种基于混合多头注意力重建网络的丝织物瑕疵检测模型: 首先, 使用预训练Transformer编码器提取丝织物图像特征; 然后, 使用带有MeanDropout的瓶颈层以减少模型对重复特征的依赖; 此外, 提出一种混合多头注意力机制(mix mutil-head attention, MMHA)和LLamaMLP相结合的解码器以协助注意力头动态选择适当的丝织物特征, 从而提升对关键细微纹理的关注; 最后, 通过解码器松散重建多层特征的组合, 以实现瑕疵检测和定位. 在真实公开数据集上进行了大量的实验. 实验结果表明, 所提方法在两种数据集上的图像级指标分别提升了2.1%和0.6%, 并且在像素级指标上分别达到了96.0%和60.5%, 取得了领先的性能.
    优先出版日期:  2025-04-25 ,DOI: 10.15888/j.cnki.csa.009900
    摘要:
    在深度强化学习领域, 特别是在高维连续的任务中, 如何高效利用有限的训练数据, 避免过拟合, 同时提高模型的泛化能力, 是一个重要的研究课题. 传统的强化学习算法通常采用单一经验池机制, 这种方法在处理高维连续状态和动作空间时, 往往面临探索效率低下和样本利用率不足的问题. 一种基于样本独特性的强化学习经验回放机制DER (distinctive experience replay)被提出, 该机制通过选择具有显著独特性的样本进行经验回放, DER的核心思想是在训练过程中识别并选择具有显著独特性的样本, 将其存储在专门的独特性样本经验池中. 该机制不仅能够有效利用多样化的样本, 避免神经网路过拟合, 还能提高智能体在复杂环境中的学习效率和决策质量. 实验结果表明, DER在经典强化学习环境中显著提高了智能体的学习效率和最终性能.
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2000,9(2):38-41
    [摘要] (12934) [HTML] (0) [PDF 0.00 Byte] (23990)
    摘要:
    本文详细讨论了VRML技术与其他数据访问技术相结合 ,实现对数据库实时交互的技术实现方法 ,并简要阐述了相关技术规范的语法结构和技术要求。所用技术手段安全可靠 ,具有良好的实际应用表现 ,便于系统移植。
    1993,2(8):41-42
    [摘要] (9983) [HTML] (0) [PDF 0.00 Byte] (33526)
    摘要:
    本文介绍了作者近年来应用工具软件NU清除磁盘引导区和硬盘主引导区病毒、修复引导区损坏磁盘的 经验,经实践检验,简便有效。
    1995,4(5):2-5
    [摘要] (9588) [HTML] (0) [PDF 0.00 Byte] (16233)
    摘要:
    本文简要介绍了海关EDI自动化通关系统的定义概况及重要意义,对该EDI应用系统下的业务运作模式所涉及的法律问题,采用EDIFACT国际标准问题、网络与软件技术问题,以及工程管理问题进行了结合实际的分析。
    2016,25(8):1-7 ,DOI: 10.15888/j.cnki.csa.005283
    [摘要] (9260) [HTML] (0) [PDF 1.11 M] (41710)
    摘要:
    从2006年开始,深度神经网络在图像/语音识别、自动驾驶等大数据处理和人工智能领域中都取得了巨大成功,其中无监督学习方法作为深度神经网络中的预训练方法为深度神经网络的成功起到了非常重要的作用. 为此,对深度学习中的无监督学习方法进行了介绍和分析,主要总结了两类常用的无监督学习方法,即确定型的自编码方法和基于概率型受限玻尔兹曼机的对比散度等学习方法,并介绍了这两类方法在深度学习系统中的应用,最后对无监督学习面临的问题和挑战进行了总结和展望.
    ()
    摘要:
    2008,17(5):122-126
    [摘要] (8364) [HTML] (0) [PDF 0.00 Byte] (50925)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
    2011,20(11):80-85
    [摘要] (7882) [HTML] (0) [PDF 842.93 K] (44994)
    摘要:
    在研究了目前主流的视频转码方案基础上,提出了一种分布式转码系统。系统采用HDFS(HadoopDistributed File System)进行视频存储,利用MapReduce 思想和FFMPEG 进行分布式转码。详细讨论了视频分布式存储时的分段策略,以及分段大小对存取时间的影响。同时,定义了视频存储和转换的元数据格式。提出了基于MapReduce 编程框架的分布式转码方案,即Mapper 端进行转码和Reducer 端进行视频合并。实验数据显示了转码时间随视频分段大小和转码机器数量不同而变化的趋势。结
    2022,31(5):1-20 ,DOI: 10.15888/j.cnki.csa.008463
    [摘要] (7790) [HTML] (5207) [PDF 2.46 M] (8490)
    摘要:
    深度学习方法的提出使得机器学习研究领域得到了巨大突破, 但是却需要大量的人工标注数据来辅助完成. 在实际问题中, 受限于人力成本, 许多应用需要对从未见过的实例类别进行推理判断. 为此, 零样本学习(zero-shot learning, ZSL)应运而生. 图作为一种表示事物之间联系的自然数据结构, 目前在零样本学习中受到了越来越多的关注. 本文对零样本图学习方法进行了系统综述. 首先概述了零样本学习和图学习的定义, 并总结了零样本学习现有的解决方案思想. 然后依据图的不同利用方式对目前零样本图学习的方法体系进行了分类. 接下来讨论了零样本图学习所涉及到的评估准则和数据集. 最后指明了零样本图学习进一步研究中需要解决的问题以及未来可能的发展方向.
    1999,8(7):43-46
    [摘要] (7620) [HTML] (0) [PDF 0.00 Byte] (25827)
    摘要:
    用较少的颜色来表示较大的色彩空间一直是人们研究的课题,本文详细讨论了半色调技术和抖动技术,并将它们扩展到实用的真彩色空间来讨论,并给出了实现的算法。
    2012,21(3):260-264
    [摘要] (6869) [HTML] (0) [PDF 328.42 K] (46857)
    摘要:
    开放平台的核心问题是用户验证和授权问题,OAuth 是目前国际通用的授权方式,它的特点是不需要用户在第三方应用输入用户名及密码,就可以申请访问该用户的受保护资源。OAuth 最新版本是OAuth2.0,其认证与授权的流程更简单、更安全。研究了OAuth2.0 的工作原理,分析了刷新访问令牌的工作流程,并给出了OAuth2.0 服务器端的设计方案和具体的应用实例。
    2007,16(9):22-25
    [摘要] (6757) [HTML] (0) [PDF 0.00 Byte] (9594)
    摘要:
    本文结合物流遗留系统的实际安全状态,分析了面向对象的编程思想在横切关注点和核心关注点处理上的不足,指出面向方面的编程思想解决方案对系统进行分离关注点处理的优势,并对面向方面的编程的一种具体实现AspectJ进行分析,提出了一种依据AspectJ对遗留物流系统进行IC卡安全进化的方法.
    2011,20(7):184-187,120
    [摘要] (6666) [HTML] (0) [PDF 714.75 K] (36409)
    摘要:
    针对智能家居、环境监测等的实际要求,设计了一种远距离通讯的无线传感器节点。该系统采用集射频与控制器于一体的第二代片上系统CC2530 为核心模块,外接CC2591 射频前端功放模块;软件上基于ZigBee2006 协议栈,在ZStack 通用模块基础上实现应用层各项功能。介绍了基于ZigBee 协议构建无线数据采集网络,给出了传感器节点、协调器节点的硬件设计原理图及软件流程图。实验证明节点性能良好、通讯可靠,通讯距离较TI 第一代产品有明显增大。
    2019,28(6):1-12 ,DOI: 10.15888/j.cnki.csa.006915
    [摘要] (6627) [HTML] (20720) [PDF 656.80 K] (28966)
    摘要:
    知识图谱是以图的形式表现客观世界中的概念和实体及其之间关系的知识库,是语义搜索、智能问答、决策支持等智能服务的基础技术之一.目前,知识图谱的内涵还不够清晰;且因建档不全,已有知识图谱的使用率和重用率不高.为此,本文给出知识图谱的定义,辨析其与本体等相关概念的关系.本体是知识图谱的模式层和逻辑基础,知识图谱是本体的实例化;本体研究成果可以作为知识图谱研究的基础,促进知识图谱的更快发展和更广应用.本文罗列分析了国内外已有的主要通用知识图谱和行业知识图谱及其构建、存储及检索方法,以提高其使用率和重用率.最后指出知识图谱未来的研究方向.
    2004,13(10):7-9
    [摘要] (6298) [HTML] (0) [PDF 0.00 Byte] (14359)
    摘要:
    本文介绍了车辆监控系统的组成,研究了如何应用Rockwell GPS OEM板和WISMOQUIKQ2406B模块进行移动单元的软硬件设计,以及监控中心 GIS软件的设计.重点介绍嵌入TCP/IP协议处理的Q2406B模块如何通过AT指令接入Internet以及如何和监控中心传输TCP数据.
    2008,17(1):113-116
    [摘要] (6230) [HTML] (0) [PDF 0.00 Byte] (52800)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(8):87-89
    [摘要] (6145) [HTML] (0) [PDF 0.00 Byte] (44075)
    摘要:
    随着面向对象软件开发技术的广泛应用和软件测试自动化的要求,基于模型的软件测试逐渐得到了软件开发人员和软件测试人员的认可和接受。基于模型的软件测试是软件编码阶段的主要测试方法之一,具有测试效率高、排除逻辑复杂故障测试效果好等特点。但是误报、漏报和故障机理有待进一步研究。对主要的测试模型进行了分析和分类,同时,对故障密度等参数进行了初步的分析;最后,提出了一种基于模型的软件测试流程。
    2008,17(8):2-5
    [摘要] (6025) [HTML] (0) [PDF 0.00 Byte] (34904)
    摘要:
    本文介绍了一个企业信息门户中单点登录系统的设计与实现。系统实现了一个基于Java EE架构的结合凭证加密和Web Services的单点登录系统,对门户用户进行统一认证和访问控制。论文详细阐述了该系统的总体结构、设计思想、工作原理和具体实现方案,目前系统已在部分省市的广电行业信息门户平台中得到了良好的应用。
    2004,13(8):58-59
    [摘要] (6002) [HTML] (0) [PDF 0.00 Byte] (30649)
    摘要:
    本文介绍了Visual C++6.0在对话框的多个文本框之间,通过回车键转移焦点的几种方法,并提出了一个改进方法.
    2009,18(5):182-185
    [摘要] (5914) [HTML] (0) [PDF 0.00 Byte] (37330)
    摘要:
    DICOM 是医学图像存储和传输的国际标准,DCMTK 是免费开源的针对DICOM 标准的开发包。解读DICOM 文件格式并解决DICOM 医学图像显示问题是医学图像处理的基础,对医学影像技术的研究具有重要意义。解读了DICOM 文件格式并介绍了调窗处理的原理,利用VC++和DCMTK 实现医学图像显示和调窗功能。
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2007,16(10):48-51
    [摘要] (5085) [HTML] (0) [PDF 0.00 Byte] (91352)
    摘要:
    论文对HDF数据格式和函数库进行研究,重点以栅格图像为例,详细论述如何利用VC++.net和VC#.net对光栅数据进行读取与处理,然后根据所得到的象素矩阵用描点法显示图像.论文是以国家气象中心开发Micaps3.0(气象信息综合分析处理系统)的课题研究为背景的.
    2002,11(12):67-68
    [摘要] (4549) [HTML] (0) [PDF 0.00 Byte] (62367)
    摘要:
    本文介绍非实时操作系统Windows 2000下,利用VisualC++6.0开发实时数据采集的方法.所用到的数据采集卡是研华的PCL-818L.借助数据采集卡PCL-818L的DLLs中的API函数,提出三种实现高速实时数据采集的方法及优缺点.
    2008,17(1):113-116
    [摘要] (6230) [HTML] (0) [PDF 0.00 Byte] (52800)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(5):122-126
    [摘要] (8364) [HTML] (0) [PDF 0.00 Byte] (50925)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。

下载归智APP ,关注本刊

友情链接

您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号