快速检索
    过刊检索
    全选反选导出
    显示模式:
    2025,34(7):1-13, DOI: 10.15888/j.cnki.csa.009942, CSTR: 32024.14.csa.009942
    [摘要] (199) [HTML] (240) [PDF 6.74 K] (94)
    摘要:
    人工智能若想从根本上理解我们周围的世界, 关键在于它能否学会从所观察到的低级感官数据中识别并解开隐藏的潜在可解释因素. 解耦表征学习正是为了从数据中提取出这些独立且可解释的潜在变量, 而因果解耦表征学习则更进一步强调了这些潜在变量之间的因果关系, 从而更真实地模拟现实世界的复杂性. 鉴于因果学习的重要性日益增长, 本文对结合因果学习的解耦表征学习的相关方法进行了详细、全面地介绍, 旨在为解耦表征学习的未来发展提供支持. 根据常用的因果学习的相关方法对因果解耦表征学习进行分类, 主要探讨了结合结构因果模型和基于流模型的解耦表征学习方法以及常用的数据集与评价指标. 此外, 还分析了因果解耦表征学习在图像生成、3D姿态估计和无监督领域适应等应用的实际案例, 并对未来的研究方向进行前瞻性展望, 为科研人员和实践者揭示未来可能的探索方向, 促进该领域的持续发展和创新.
    2025,34(7):14-22, DOI: 10.15888/j.cnki.csa.009940, CSTR: 32024.14.csa.009940
    [摘要] (127) [HTML] (334) [PDF 6.75 K] (85)
    摘要:
    光伏板的清洁与维护是光伏电站运行中的关键任务, 其中搭载机械臂和光伏清洁终端的光伏清洁摆渡车系统成为一种创新的解决方案. 这类系统需要精确获取光伏板的位姿, 包括车身相对光伏板的倾角与距离. 为解决这一问题, 本文提出了一种基于单目相机的光伏板视觉定位方法. 本文首先对YOLOv8-pose关键点检测模型进行改进以提高检测精度. 引入PSA注意力机制优化骨干网络, 采用DySample动态上采样模块并提出ADown*下采样模块对颈部网络进行增强. 然后结合改进后的YOLOv8-pose与光伏板的几何特征, 提出倾角和距离计算方法, 从而实现光伏板的姿态定位. 实验结果表明, 本文提出的改进算法相较于原始YOLOv8-pose计算的光伏板倾角与距离精度分别提升了26.2%与20.1%, 能够更准确地对光伏板进行定位.
    2025,34(7):23-36, DOI: 10.15888/j.cnki.csa.009878, CSTR: 32024.14.csa.009878
    [摘要] (165) [HTML] (326) [PDF 6.72 K] (217)
    摘要:
    为解决复杂背景干扰导致的行人检测精度低和漏检率高的问题, 本文提出一种融合改进注意力的自适应双分支密集行人检测算法DACD-YOLO. 首先, 主干网络采用自适应融合双分支结构, 通过动态权重实现不同特征的融合, 并引入深度可分离卷积降低计算量, 有效缓解传统单分支网络中信息丢失的问题; 其次, 提出自适应视觉中心, 通过动态优化增强层内特征提取, 并重设通道数以平衡精度与计算量; 然后, 提出坐标双通道注意力机制, 结合异构卷积核设计轻量化融合模块, 降低计算复杂度并增强对关键特征的捕捉能力; 最后, 采用膨胀卷积检测头, 通过不同膨胀率卷积融合多尺度特征, 有效增强小目标和遮挡目标的特征提取能力. 实验结果表明, 与原版YOLOv8n相比, 改进算法在WiderPerson数据集上的mAP@0.5和mAP@0.5:0.95分别提高2.3%和2.2%, 在CrowdHuman数据集上mAP@0.5和mAP@0.5:0.95分别提升3.5%和4.6%. 实验结果表明, 改进算法在密集行人检测方面相较于原算法具有显著的精度提升.
    2025,34(7):37-47, DOI: 10.15888/j.cnki.csa.009939, CSTR: 32024.14.csa.009939
    [摘要] (143) [HTML] (316) [PDF 6.76 K] (93)
    摘要:
    随着自动化技术和机器人领域的快速发展, 移动机器人路径规划的精确性要求日益提高. 针对深度强化学习在复杂环境下路径规划存在的收敛稳定性差、样本效率低及环境适应性不足等问题, 提出了一种改进的基于决斗深度双Q网络的路径规划算法(R-D3QN). 通过构建双网络架构解耦动作选择与价值估计过程, 有效缓解Q值过估计问题, 提高收敛稳定性; 设计时序优先经验回放机制, 结合长短期记忆网络(LSTM)的时空特征提取能力, 改进样本利用效率; 提出基于模拟退火的多阶段探索策略, 平衡了探索与利用, 增强环境适应性. 实验结果表明, 与传统DQN算法相比, R-D3QN算法在简单环境下平均奖励值提高了9.25%, 收敛次数减少了24.39%, 碰撞次数减少了41.20%; 在复杂环境下, 平均奖励值提升了12.98%, 收敛次数减少了11.86%, 碰撞次数减少了42.14%. 同时与其他改进的DQN算法对比也具有明显的优势, 验证了所提算法的有效性.
    2025,34(7):48-58, DOI: 10.15888/j.cnki.csa.009888, CSTR: 32024.14.csa.009888
    [摘要] (106) [HTML] (350) [PDF 6.77 K] (141)
    摘要:
    随着互联网的普及, 越来越多用户倾向于在社交平台公开表达自己的个人细节和情感内容, 这些网络文本数据往往体现着不同场景下的真实表达, 反映了用户内在的心理特质及人格倾向. 近年来, 基于社交文本的人格检测研究取得了显著进展, 然而, 研究者们大多直接使用未经处理的公开数据集, 这些数据集因其收集过程导致不可避免地存在噪声, 此外, 大多过分依赖预训练模型提取的文本语义特征, 而缺乏对心理语言学特征的引入. 为了解决以上问题, 提出一种新型的人格检测研究方法. 该方法首先基于置信学习完成噪声数据清洗, 提高数据集质量. 其次, 提取多层次心理语言学特征来填补单一文本语义特征的不足. 最后通过动态深度图卷积网络来优化特征表达, 完成最终的人格检测任务. 在公开的Kaggle MBTI数据集上对该方法进行性能评估, 结果表明, 与目前先进的方法相比, 该方法在准确率和F1值上分别提升了5.48%和4.22%.
    2025,34(7):59-71, DOI: 10.15888/j.cnki.csa.009908, CSTR: 32024.14.csa.009908
    [摘要] (111) [HTML] (333) [PDF 6.79 K] (137)
    摘要:
    光学遥感图像中的云遮挡问题是遥感数据处理中的核心挑战之一, 针对目前云层去除技术在处理云层边缘信息及保留图像细节方面的缺陷, 本文提出基于时谱域融合与时序自注意力增强的生成对抗网络(TGAN). TGAN通过其两阶段模块化设计, 实现了遥感图像修复质量与处理效率的双重提升. 第1阶段, 基于时序自注意力机制的特征提取模块, 用线性升维层捕获时域、谱域特征, 以一维线性降维层弥补传统最大池化不足, 增强时间序列位置特征建模能力, 还设计含权重分配策略的多头自注意力机制精准捕捉边缘信息; 第2阶段为自适应图像修复模块, 由随机噪声消除与局部对比增强子模块协同改善图像细节、抑制噪声. 此外, TGAN 的鉴别器采用多尺度模块, 这一策略实现了全局一致性与局部细节之间的平衡. 通过生成器与鉴别器之间的交互博弈, 生成器持续优化修复图像, 以提高修复效果. 这种动态的博弈过程推动了生成器在图像修复任务中的迭代优化. 为了验证TGAN的有效性, 本文在Sen2_MTC数据集上进行了实验. 实验结果表明, TGAN在峰值信噪比(PSNR)和主观视觉评估方面均显著优于现有方法, 在训练集和测试集的PSNR分别达到了21.547 dB和20.206 dB, 表明该方法在遥感云层图像修复任务中具有较好的性能与应用潜力.

下载归智APP ,关注本刊

友情链接

您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号