• 当期目录
  • 优先出版
  • 过刊浏览
  • 点击排行
  • 下载排行
  • 综述文章
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    2025,34(4):1-17, DOI: 10.15888/j.cnki.csa.009839, CSTR: 32024.14.csa.009839
    摘要:
    近年来, 随着伪造人脸技术的快速发展, 通过伪造人脸技术合成的人脸已经非常逼真, 人眼很难鉴别, 部分不法分子对伪造人脸技术的非法应用已经对社会稳定、个人隐私造成了恶劣影响, 因此伪造人脸检测技术的重要性日益凸显. 本文系统地探讨了伪造人脸检测技术的现状, 主要从伪造人脸图像和伪造人脸视频的检测两个方面进行分析. 在伪造人脸图像检测方面, 重点讨论了基于图像空间域和频率域的方法、身份一致性检测以及人脸区域定位技术的应用. 在伪造人脸视频检测方面, 研究聚焦于时空特征融合、生理特征利用及视听信息的结合. 此外, 本文介绍了常用的评估指标, 系统分析了多种重要数据集, 包括其特点和适用场景. 同时还指出当前文献中的局限性, 例如对抗样本的鲁棒性不足、检测方法对新型伪造技术的适应性差等问题. 基于这些分析, 我们提出了未来可能的研究方向, 包括跨域检测技术的优化、新算法的探索及模型的可解释性研究. 本文不仅为研究者提供了对伪造人脸检测技术的全面了解, 也为后续研究指明了发展方向, 具有重要的理论价值和实际应用意义.
    2025,34(4):18-33, DOI: 10.15888/j.cnki.csa.009865, CSTR: 32024.14.csa.009865
    摘要:
    随着神经辐射场(NeRF)的提出, 其基于神经隐式表示场景的方法在生成高保真地图方面具有显著优势, 将NeRF应用于同时定位与地图构建(SLAM)中, 即基于NeRF的SLAM方法, 能够在实现高精度的定位的同时进行连续的3D建模, 通过渲染新视角并预测未知区域, 提高场景重建的质量和细节. 为了跟踪该领域的最新研究成果, 对近年来基于NeRF的SLAM的关键算法进行了回顾和综述. 首先介绍了NeRF技术的核心原理并全面概述了基于NeRF的SLAM方法的框架, 其次重点探讨了基于NeRF的SLAM的改进和优化, 包括提高神经隐式表征效率、解决大尺度场景建图问题、增加回环和全局优化实现全局一致性和解决动态干扰问题, 最后对基于NeRF的SLAM方法进行了展望, 为相关研究人员提供有价值的参考, 以促进更多创新研究.
    2025,34(4):34-44, DOI: 10.15888/j.cnki.csa.009819, CSTR: 32024.14.csa.009819
    摘要:
    针对单目图像中不同深度目标的尺度差异所导致的单目3D目标检测算法精度不佳的问题, 提出一种基于融合采样和深尺约束的检测算法. 首先, 为增强采样特征对不同尺度目标的表征能力, 构建多尺度特征融合模块 (multi-scale fusion module, MFM), 通过分层聚合和迭代聚合对不同层级、不同尺度的特征进行融合采样, 从而提高对目标隐式尺度特征的提取能力. 此外, 构造深度尺度相关化模块 (depth-scale correlation module, DSCM), 利用深度与尺度之间的线性投影约束将不同尺度的目标补偿式放缩至同一特征水平, 以此平衡模型对不同距离目标的关注度. 基于KITTI数据集和Waymo数据集的定量结果表明, 所提出的算法相较于同类算法在多种难度下的整体平均精度AP3D分别提升了1.56个百分点和3.07个百分点, 验证了算法的有效性及泛化性, 同时基于两类数据集的定性结果验证了该算法显著缓解了目标尺度差异对检测性能造成的影响.
    2025,34(4):45-54, DOI: 10.15888/j.cnki.csa.009838, CSTR: 32024.14.csa.009838
    摘要:
    针对现有乡村道路图像数据集数据样本少且类别不均衡的问题, 提出了一种基于改进StyleGAN的数据增强方法. 在原有StyleGAN框架基础上引入了解耦映射网络, 以降低W空间隐编码的耦合度; 综合卷积与Transformer的优点, 设计了一个卷积耦合迁移模块(CCTB), 该模块中的核心十字形窗口自注意力机制增强了网络对复杂上下文和空间布局的捕捉能力. 这两项改进使网络性能大幅提升. 通过消融实验对比改进前后的StyleGAN网络, IS指标从42.38提高到了77.31, FID值从25.09降至12.42, 表明了数据生成质量和真实性得到了显著提升. 为了验证数据增强对模型性能的影响, 采用了2种经典且主流的目标检测算法进行测试, 比较了原数据集与增强后数据集的性能差异, 进一步证实了改进措施的有效性.
    2025,34(4):55-63, DOI: 10.15888/j.cnki.csa.009825, CSTR: 32024.14.csa.009825
    摘要:
    目前, 有多种谎言识别方法, 包括使用测谎仪测谎. 然而这些方法执行起来效果有限, 不仅需要与被测谎对象产生接触, 而且要求相关人员具备专业知识, 不便于实行, 且效果有限. 心理学研究表明, 微表情是人脸上的一种持续时间极其短暂的细微肌肉运动, 能反映人在做出此表情时的真实内心状态. 相关研究表明, 人脸上的微表情特征可以作为谎言识别的线索. 本文研究基于微表情特征的谎言识别, 首先构建一个说谎时的微表情数据集, 命名为MED. 其次, 设计一个基于多层自注意力机制的微表情特征学习模型MEDR, 根据学习到的说谎和未说谎时的微表情特征进行谎言识别. 最后, 本文还在新构建的数据集上, 对本文设计的模型与一些现有模型进行实验对比, 实验结果显示, 本模型在自制高质量数据集上取得94.33%的准确率, 表明本模型在谎言识别方面具备出色的性能.
    2025,34(4):64-75, DOI: 10.15888/j.cnki.csa.009808, CSTR: 32024.14.csa.009808
    摘要:
    随着网络视频平台(network video platform, NVP)应用, 网络视频在不同视频平台分享时常面临被侵权和跨平台版权检测问题, 所以本文提出了一种基于区块链跨平台网络视频版权保护方案(blockchain-based cross-platform network video copyright protection scheme, BCVCP) 旨在通过区块链和利用生成的所有权序列(ownership sequence, OS), 进行所有权序列检测, 来实现跨视频平台的网络视频版权保护. 本方案包括身份认证、提取关键帧、所有权序列的生成和检测、网络视频控制管理等部分. 具体来说, 在对网络视频上传或访问等操作之前, 需要进行身份认证, 确保身份信息的安全. 其次, 上传网络视频过程中会生成所有权序列, 存储在分布式节点中. 然后, 提取视频关键帧, 把生成的所有权序列嵌入到视频关键帧中. 最后, 调用智能合约进行跨平台所有权序列检测和对网络视频的传播控制管理, 避免侵权行为. 在实验中, 验证了跨视频平台传输网络视频时所有权编码质量和所有权识别的鲁棒性, 保护了网络视频的版权.

下载归智APP ,关注本刊

友情链接

您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号