2022, 31(9):1-2. DOI: 10.15888/j.cnki.csa.008845 CSTR:
摘要:
2022, 31(9):3-14. DOI: 10.15888/j.cnki.csa.008844 CSTR:
摘要:随着在云计算领域得到广泛的应用和关注, 集群容器编排管理平台Kubernetes已广泛应用于容器化应用服务的自动部署和发布、应用弹性扩展和回滚更新、故障检测和自我修复等服务场景. 第5代精简指令集计算机 (fifth-generation reduced instruction-set computer, RISC-V)具有精简化、模块化、可扩展和开源4大技术特点和优势, 已经得到学术界和工业界的广泛关注. 本文立足于Kubernetes生态和RISC-V生态的协同研究点, 为Kubernetes调度器提供异构指令集架构(instruction set architecture, ISA)的云服务任务调度支持. 本文通过对生产环境中RISC-V指令集架构的各类计算任务需求进行了量化分析, 发现现有的集群容器编排平台Kubernetes不具备调度RISC-V指令集架构的计算任务的能力, 尤其是其调度算法无法利用RISC-V用户自定义的可扩展指令集架构特性提供高性能的可靠服务. 为解决上述问题, 本文提出了一种创建时调度的ISAMatch模型, 综合考虑指令集亲和性、同种指令集架构节点数量和节点资源利用率等多个方面, 实现任务的最佳分配. 本文以现有的集群调度器为基础, 完善其针对多种指令集架构任务的调度需求, 相对比默认调度器正确率62% (调度RISC-V基础指令集任务)、41% (调度RISC-V扩展指令集任务)、67% (调度RISC-V扩展指令集任务且有“RISC-V”节点匹配标签), 在不考虑资源限制的条件下, ISAMatch模型可以达到100%的任务调度正确率.
2022, 31(9):15-23. DOI: 10.15888/j.cnki.csa.008843 CSTR:
摘要:随着硬件技术的不断演进和软件需求的持续增长, 人们对以QEMU为代表的指令集架构仿真平台的执行性能提出了更高的要求. 本文针对目标架构支持虚拟内存的场景, 分析了QEMU现有动态跳转处理机制及其存在的问题, 根据常见虚拟内存系统的特点提出了基于地址空间标识符的动态跳转优化方案, 并以RISC-V为目标架构在QEMU主线6.2.0版本上实现了该方案. 实验表明, 相较于原生QEMU, 基于地址空间标识符的动态跳转方案提升了约12%的运行性能.
2022, 31(9):24-30. DOI: 10.15888/j.cnki.csa.008841 CSTR:
摘要:RISC-V作为精简指令集的代表, 也会反映一些精简指令集的弊端, 程序体积偏大就是其中之一. 在精简指令集(RISC)中, 实现一些复杂操作所需要的指令条数普遍会多于复杂指令集(CISC), 进而导致最后生成的二进制程序体积相较CISC程序更大. 并且嵌入式设备的RAM和ROM普遍较小, 因此在嵌入式场景中, 程序的体积变得尤为重要. 为了在现有压缩指令集的基础上尽可能的优化RISC-V程序代码体积, RISC-V指令集子扩展Zce制定了一系列指令. 其中以LWGP为代表的一系列指令被用来减少加载/存储字节数据时的指令条数. 本文分析了以LWGP为代表的指令对于代码体积的优化原理并且将之实现在LLD链接器上, 通过分析使用LWGP等指令前后程序体积的变化评估对于二进制程序体积优化的效率并且提出后续改进建议.
2022, 31(9):31-38. DOI: 10.15888/j.cnki.csa.008842 CSTR:
摘要:近年来, 随着RISC-V架构以其独特的开源、精简、模块化等优势在工业界快速铺开, 市场中涌现出大量基于RISC-V架构的处理器IP核及基于RISC-V架构设计的片上系统(system on chip). 现有调试器作为RISC-V软件开发过程中的一个重要部件, 存在性能低、部署成本高以及二次开发难度大等问题, 难以应对现今井喷发展的RISC-V架构芯片的RTL设计与验证、程序开发与调试、量产批量编程的需求. 为了解决这些问题, 本文提出一种全新的、开源的、模块化基于轻量级远程过程调用实现互操作的RISC-V调试协议栈方案—Morpheus. 实验及分析结果表明, 该调试方案能够有效提高调试性能, 降低部署成本和二次开发难度.
2022, 31(9):39-49. DOI: 10.15888/j.cnki.csa.008840 CSTR:
摘要:内存安全性是一项非常重要的性质, 但它很容易被攻击者利用. 过去针对内存安全问题提出的许多防御方案, 由于性能代价高昂, 很少能够部署在生产环境中. 最近, 随着RISC-V等开源处理器架构的兴起, 安全领域迎来了设计新的处理器硬件安全拓展的热潮, 硬件辅助防御方案的性能代价降低, 变得可以接受. 为了更好地支持内存安全处理器拓展的设计, 以及更好地评估处理器内存安全性能, 我们设计了一款兼具综合性、可移植性内存安全测试框架, 并开源了一个160测例大小的初始版本测试集, 覆盖了内存时空安全性、访问控制、指针和控制流完整性等方面, 并在x86-64和RISC-V64两种指令集架构的平台上进行了测试.
2022, 31(9):50-56. DOI: 10.15888/j.cnki.csa.008839 CSTR:
摘要:本文以沁恒微电子内置 RSIC-V处理器内核的 CH32V307 微控制器为基础, 利用AHL- CH32V307 硬件系统阐述嵌入式技术实践. 首先简要介绍嵌入式系统的知识体系, 降低具有高技术门槛的嵌入式系统开发工作, 实现嵌入式人工智能的敏捷开发生态系统. 接着给出并测试嵌入式开发硬件, 以多功能嵌入式集成开发环境编译、下载与运行第一个嵌入式程序的直观体验, 学员可以开始进入嵌入式系统的学习之旅. 对应开发套件的硬件系统, 文中给出一些常见嵌入式系统被控单元如彩灯、红外传感器与汇编工程的树型结构的基本原理、电路接法和编程实践. 利用CH32V307 微控制器设计一套简单实用基于图像识别的嵌入式物体认知系统, 可作为人工智能的快速入门系统. 本文所介绍的教学案例适用于高等学校嵌入式系统的教学或技术培训, 也可以提供给嵌入式系统技术人员作为研发参考.
2022, 31(9):57-69. DOI: 10.15888/j.cnki.csa.008661 CSTR:
摘要:日志异常检测是当前数据中心智能运维管理的典型核心应用场景. 随着机器学习技术的快速发展和逐步成熟, 将机器学习技术应用于日志异常检测任务已经形成热点. 首先, 文章介绍了日志异常检测任务的一般流程, 并指出了相关过程中的技术分类和典型方法. 其次, 论述了日志分析任务中机器学习技术应用的分类及特点, 并从日志不稳定性、噪声干扰、计算存储要求、算法可移植性等方面分析了日志分析任务的技术难点. 再次, 对领域内相关研究成果进行了梳理总结和技术特点的比较分析. 最后, 文章从日志语义表征、模型在线更新、算法并行度和通用性3个方面讨论了日志异常检测今后的研究重点及思考.
2022, 31(9):70-81. DOI: 10.15888/j.cnki.csa.008708 CSTR:
摘要:医疗命名实体识别指从海量的非结构化的医疗数据中提取关键信息, 为医学研究的发展和智慧医疗系统的普及提供了基础. 深度学习运用深层非线性的神经网络结构能够学习到复杂、抽象的特征, 可实现对数据更本质的表征. 医疗命名实体识别采用深度学习模型可明显提升效果. 首先, 本文综述了医疗命名实体识别特有的难点以及传统的识别方法; 其次, 总结了基于深度学习方法的模型并介绍了较为流行的模型改进方法, 包括针对特征向量的改进, 针对数据匮乏、 复杂命名实体识别等问题的改进; 最后, 通过综合论述对未来的研究方向进行展望.
2022, 31(9):82-90. DOI: 10.15888/j.cnki.csa.008664 CSTR:
摘要:哈希表以访问效率时间复杂度O(1)著称, 作为一类可提供大规模数据高效访问的算法和数据结构为各类大数据应用所采用, 例如, 适用于各类新兴高性能(HPC)领域、数据库领域的工作负载和场景. 随着高性能协处理器GPU硬件性能的日益提升, 面向高性能GPU环境的哈希表并行优化已逐渐吸引了大量研究工作. 当前的各类GPU哈希表优化方法和解决方案集中于利用GPU的大规模线程环境和高内存带宽来提升哈希表的事务高并发性处理和键值对数据快速访问. 然而, 由于现有GPU哈希表结构的研究工作普遍忽略了GPU资源有效管理, 并没有以如何充分利用GPU线程资源和显存资源. 同时, 由于GPU显存空间的大小限制, 用于存储哈希表结构数据的空间有限, 无法应对更大规模的哈希表结构. 因此, 面向GPU环境下的哈希表方法的可扩展性和性能仍存在着技术挑战. 本文提出并设计了一种面向GPU环境的可处理大规模并发事务的哈希表技术, 命名为Starfish. Starfish提出了新的基于异步GPU流的“交换层” (swap layer)技术, 用以支持GPU显存外的动态哈希表, 同时也保障了GPU哈希表的索引方法性能. 为了解决GPU大规模线程的访问带来的哈希冲突开销, Starfish设计了一类紧凑型数据结构, 并研究了一种可分页显存的分配方法, 不仅为GPU哈希表技术提供了静态哈希方法的高性能, 而且也支持动态哈希的高可扩展性. 性能评估实验表明, Starfish显著优于其他GPU哈希表技术, 包括cudpp-Hash, SlabHash.
2022, 31(9):91-98. DOI: 10.15888/j.cnki.csa.008649 CSTR:
摘要:在电力行业, 目前电厂对电力管道服役状态的监督管理仍然停留在由人工完成的“静态”阶段, 存在掌控信息不全面和不及时的问题, 无法满足安全生产的需要. 传统的数字化软件操作繁琐、功能不足, 且缺乏对管道运维信息的关注. 针对以上问题, 本文提出了数字孪生五维模型的三维电力管道系统设计. 首先, 采用草图造型和参数化方法进行管道系统的三维重建, 快速实现虚拟实体的构建, 直观展示系统的真实场景; 然后, 采用智能的管理技术, 获取和维护管道的运行信息, 评估与预测管道的安全状态, 实现物理与虚拟信息的融合; 最后, 基于系统的应用框架进行系统设计, 并实现了界面简洁和功能实用的系统原型. 目前该系统已经在电厂试运行, 初步结果显示该系统对电厂的运维和安全化管理起到了较好的效果.
2022, 31(9):99-113. DOI: 10.15888/j.cnki.csa.008662 CSTR:
摘要:业务上云在近些年已经成为趋势, 而新冠疫情也加速了这一趋势. 然而公有云并不适用于所有用户. 尤其是出于数据隐私的考虑, 很多用户尤其是政府用户更希望在后疫情时代建设他们自己的私有云或者混合云. 超融合设备(HCI)是达到这一目标的有效手段. 在超融合设备中, 计算、网络、存储等资源都被完全虚拟化, 传统的物理网络设备单元也被一段段代码所替代. 此外为了获得高性能的网络转发能力, 很多创新技术应运而生, 其中DPDK技术是其中翘楚而被广泛应用. 开发者可以利用DPDK技术实现多种多样地、定制化地网络转发应用. 虚拟化技术和DPDK技术可以大大提升设备资源的利用率以及网络转发性能, 降低大中小企业或者机构的数据中心或者私有云的构建难度和成本. 但同时高度的虚拟化也给网络运维人员带来了巨大的挑战. 这些虚拟网元对网络运维人员而言是没有实体的, 虚拟网络在运维人员看来就像一个“黑盒”. 当网络出现故障时(如丢包), 传统的针对物理网络设备的排障手段在虚拟网络中变得不可用, 这就大大增加了网络排障的时间, 进而对业务的持续运行造成影响. 针对这种问题, 设计了一种虚拟网络持续性丢包探测系统Flowprobe, 该系统旨在解决基于DPDK用户态虚拟网络的持续性丢包检测及根因定位问题. 通过该系统, 用户可以观测数据包在虚拟网络中的详细路径、经历的转发行为, 定位丢包的位置, 获知丢包的原因. 实验表明, 该系统可以针对576种虚拟网络持续丢包场景进行检测以及给出问题根因, 并且该系统做到了对正常转发业务的无影响, 性能测试表明, 该系统开启以后, 对用户正常业务的转发影响可以控制在1%以内. 该系统已经在超融合生产环境持续运行了3年, 帮助用户以及网络运维人员解决了诸多虚拟网络故障问题.
陈培,王超,段国栋,王德奎,王斌,王文潇,孙辽东,荆荣讯,邢良占,刘慧兴,姬贵阳
2022, 31(9):114-126. DOI: 10.15888/j.cnki.csa.008672 CSTR:
摘要:人工智能技术的快速发展和在云原生上部署应用高效等优点让越来越多的开发者和互联网企业将人工智能应用部署在Kubernetes集群上, 但Kubernetes并不是主要针对深度学习而设计, 对深度学习这个特定领域需要做定制优化. 本文针对具有一定规模的Kubernetes集群上部署深度学习负载的场景, 设计和实现了一系列优化方案, 主要从深度学习所要求的数据处理、graphics processing unit (GPU)计算、分布式训练等几个方面进行优化, 本文提出的优化方案覆盖了数据处理、计算等方面, 这些技术极大简化人工智能负载在规模化云原生平台上的部署难度和提高运行效率, 同时从实践上来看也验证了以上技术对人工智能应用有着显著的提升作用.
2022, 31(9):127-135. DOI: 10.15888/j.cnki.csa.008681 CSTR:
摘要:知识推理是补全知识图谱的重要方法, 旨在根据图谱中已有的知识, 推断出未知的事实或关系. 针对多数推理方法仍存在没有充分考虑实体对之间的路径信息, 且推理效率偏低、可解释性差的问题, 提出了将TuckER嵌入和强化学习相结合的知识推理方法TuckRL (TuckER embedding with reinforcement learning). 首先, 通过TuckER嵌入将实体和关系映射到低维向量空间, 在知识图谱环境中采用策略引导的强化学习算法对路径推理过程进行建模, 然后在路径游走进行动作选择时引入动作修剪机制减少无效动作的干扰, 并将LSTM作为记忆组件保存智能体历史动作轨迹, 促使智能体更准确地选择有效动作, 通过与知识图谱的交互完成知识推理. 在3个主流大规模数据集上进行了实验, 结果表明TuckRL优于现有的大多数推理方法, 说明将嵌入和强化学习相结合的方法用于知识推理的有效性.
2022, 31(9):136-144. DOI: 10.15888/j.cnki.csa.008657 CSTR:
摘要:智能电网通过引入信息和通信技术服务, 带来了传统电网的技术演变, 与此同时在安全方面也带来了严重的挑战. 本文提出了一种智能电网入侵检测系统安全架构和一种基于无监督学习的新型入侵检测系统(intrusion detection system, IDS). 我们设计了区域式训练(block-training)架构, 不仅可以减轻数据中心的计算压力, 还可以对本地流量进行特征训练. 我们还提出了一种基于交叉验证的递归特征消除的差分自编码器算法(RFECV-VAE). RFECV-VAE综合了RFECV和VAE模型, 在特征选择过程使用递归特征消除交叉验证法(recursive feature elimination cross-validation, RFECV), 异常检测采用差分自编码器(variational autoencoders, VAE), 它可以对大规模高维数据进行高精度异常检测. 最后, 本文选择深度自编码器、深度自编码器高斯混合模型、单类支持向量机、隔离森林、差分自编码器作为对比算法, 采用准确率、ROC_AUC、F1_score和训练时间等指标来进行性能评估. 实验结果表明, RFECV-VAE算法结果优于其他比较算法.
2022, 31(9):145-151. DOI: 10.15888/j.cnki.csa.008650 CSTR:
摘要:提单是国际物流中的重要单证, 应用于铁路运输时将提高货物和资金流转效率. 现存的电子提单系统存在安全性低、公信力不足等问题, 难以保障各个参与方的权益. 本文在满足提单主要功能的基础上, 利用区块链去中心化、可溯源、可编程的特性, 确定了基于区块链的电子提单系统框架. 采用超级账本技术, 本文设计并实现了在区块链网络中多机构、多角色参与的电子提单发布、审核、质押等业务逻辑, 保证了电子提单安全、高效地流转. 经过区块链系统打包的交易数据, 凭借共识机制被锚定在链上, 实现了交易信息实时共享与查询, 有效地解决了物权争议与货物追踪问题.
2022, 31(9):152-158. DOI: 10.15888/j.cnki.csa.008693 CSTR:
摘要:针对政策术语具有时效性、低频度、稀疏性和复合短语的特点, 传统术语抽取方法难以满足需求的问题, 设计实现了语义增强的多策略政策术语抽取系统. 该系统从频繁项挖掘和语义相似度两个维度对政策文本特征进行建模, 融合多种频繁模式挖掘策略选取特征种子词, 利用预训练语言模型增强语义匹配来召回低频且稀疏的政策术语, 实现了从无词库冷启动到有词库热启动半自动化的政策术语抽取. 该系统能够提升政策文本分析效果, 为建设智慧政务服务平台提供技术支持.
2022, 31(9):159-166. DOI: 10.15888/j.cnki.csa.008718 CSTR:
摘要:基于RGB图像的手势识别因其对设备要求低、采集数据方便等在人机交互领域得到广泛的应用. 在RGB图像的手势识别与交互过程中, 一方面由于RGB的手势图像在采集过程中存在光照影响导致利用肤色信息进行手势分割的效率较低, 另一方面用户对交互手势的认知与设计师设计的手势有差异, 导致用户交互体验反馈较差. 针对这两个问题我们进行了系统性的优化: 首先把用户的认知与交互手势设计原则联系起来建立手势共识集; 其次进行手势图像的色彩平衡处理, 利用椭圆肤色模型分割手势区域; 然后将二值化手势图像输入到MobileNet-V2轻量化卷积神经网络进行手势识别率的计算. 手势的终端用户主观评价与手势识别技术结合可以较系统地为交互任务进行手势设计, 减少用户在实际交互过程中的认知偏差, 提高交互系统的可用性和效率.
2022, 31(9):167-172. DOI: 10.15888/j.cnki.csa.008699 CSTR:
摘要:随着云计算、物联网技术的发展, 边缘计算模式开始兴起. RISC-V开源指令集架构和openEuler开源操作系统正在逐渐形成一个开放、灵活、不断演进和架构包容的软件生态体系, 为边缘计算应用的构建提供了良好的软硬件创新平台. 然而, 在其之上的支持面向边缘计算的软件开发环境、开发框架和工具链等基础设施尚不够完善. COMO是解决C++软件资产复用的构件化技术, 将COMO技术与RISC-V、openEuler 结合有助于RISC-V、openEuler 生态在新的软件技术架构上发展. 本文提出了在基于RISC-V架构和openEuler 操作系统的软硬件平台上进行COMO构件程序运行与开发环境移植的思路和方法, 并通过实验证明了COMO构件技术与RISC-V指令集架构和openEuler 操作系统的兼容性和可行性; 通过一个简单的实例介绍COMO的ServiceManager框架在边缘计算中的应用, 在为面向云计算与物联网的边缘计算应用提供XaaS服务的构件化程序开发模式的方向上进行了有益的探索.
2022, 31(9):173-182. DOI: 10.15888/j.cnki.csa.008700 CSTR:
摘要:现有的医学影像标志点定位算法未能很好地利用医学影像本身固有的特点, 且不能很好地感知医学影像蕴含的精细特征. 本文提出基于拓扑结构约束和特征增强的医学影像标志点定位算法, 利用标志点之间的拓扑结构不变性来提升算法的定位精度, 并通过为网络引入多分辨率注意力机制和多分支空洞卷积模块实现增强特征的提取, 使得网络不仅可以加强对重要特征的关注, 还可以在不增加计算量和参数量的情况下提升对上下文特征的感知能力. 使用公开数据集的实验表明, 本文提出的算法在各个指标上均超过了当前主流算法, 具有较高的标志点定位精度.
2022, 31(9):183-191. DOI: 10.15888/j.cnki.csa.008671 CSTR:
摘要:由于物联网设备本身缺少安全机制, 物联网环境面临着严峻的安全挑战. 而远程证明能够认证设备真实性和完整性, 可以通过远程方式建立对物联网设备的信任. 集群证明是远程证明技术的扩展, 可以适用于大量设备构成的集群. 相较于传统的远程证明, 集群证明解放了验证设备, 提高了验证的效率. 目前, 集群证明方法主要是针对静态网络, 而且对于受损设备也缺乏高效的修复机制. 针对这些问题, 本文提出了一种基于信誉机制和Merkle树的安全集群证明及修复方法. 首先, 本文方法使用信誉机制实现了多对一的证明协议, 能有效解决单点故障, 从设备触发验证, 并且能够适用于半动态网络. 其次, 本文引入Merkle树进行度量, 能够快速地识别被感染的代码块, 并进行高效地恢复; 最后, 本文对提出的集群证明方法进行了安全性分析和性能评估, 结果表明, 本文集群证明在提高了安全性的同时导致的性能开销是可以接受的.
2022, 31(9):192-200. DOI: 10.15888/j.cnki.csa.008679 CSTR:
摘要:模糊测试在挖掘软件安全漏洞、提高软件安全性方面发挥着巨大的作用, 本文针对模糊测试变异策略效率较低以及种子评分策略不合理的问题进行了讨论, 提出了基于聚类的变异优化策略和基于新覆盖信息的能量分配策略. 第1个改进策略通过产生新覆盖的非确定性变异提取有效的组合变异位置, 然后利用聚类算法进一步确定有效变异的位置, 在变异阶段对有效变异的位置进行细粒度确定性变异. 本文第2个改进策略针对种子评分策略, 种子产生的新覆盖信息与静态分析的分支转移信息作为种子评分的重要指标. 我们将改进后的模糊测试工具-AgileFuzz与现有的模糊测试改进工具AFL 2.52b、AFLFast以及EcoFuzz进行比较, 对binutils、libxmll2等开源程序进行了多次实验. 实验结果表明, AgileFuzz在相同时间内发现了更多的程序分支覆盖, 并且在测试过程中发现了fontforge、harfbuzz等开源软件中5个未知的漏洞.
2022, 31(9):201-209. DOI: 10.15888/j.cnki.csa.008703 CSTR:
摘要:为了有效地整合文本中的复杂特征和提取不同的上下文信息, 提出了基于门控图注意力网络的归纳式文本分类方法(TextIGAT). 该方法首先为语料库中的每个文档进行单独构图, 并将其中所有的单词作为图中的节点, 以此保留完整的文本序列. 文本图中设计单向连接的文档节点, 使词节点能与全局信息交互, 并合并不同的上下文关系连接词节点, 从而在单个文本图中引入更多的文本信息. 然后, 方法基于图注意力网络(GAT)和门控循环单元(GRU)来更新词节点的表示, 并根据图中保留的文本序列应用双向门控循环单元(Bi-GRU)来增强节点的顺序表示. TextIGAT能灵活地整合来自文本本身的信息, 因此能对包含新词和关系的文本进行归纳式学习. 在4个基准数据集(MR、Ohsumed、R8、R52)上的大量实验和详细分析表明了所提出的方法在文本分类任务上的有效性.
2022, 31(9):210-216. DOI: 10.15888/j.cnki.csa.008761 CSTR:
摘要:针对隧道结构安全监测数据存在野值, 噪声等严重影响后续分析的问题, 提出了一种自适应跟踪系统噪声的可靠卡尔曼滤波算法进行数据去噪. 首先结合滑动窗口使用最小二乘法对野值进行补偿; 其次继承卡尔曼的“一步一推导”思想, 动态估计噪声值, 有效解决了传统卡尔曼滤波器在面对野值及非线性系统时存在的无法准确建模的问题; 最后使用北京某施工地铁数据进行数值验证, 结果表明, 与经典算法相比, 该算法在精度方面有极大的提升.
2022, 31(9):217-225. DOI: 10.15888/j.cnki.csa.008654 CSTR:
摘要:小样本图片分类的目标是根据极少数带有标注的样本去识别该类别, 其中两个关键问题是带标注的数据量过少和不可见类别(训练类别和测试类别的不一致). 针对这两个问题, 我们提出了一个新的小样本分类模型: 融合扩充-双重特征提取模型. 首先, 我们引入了一个融合扩充机制(FE), 这个机制利用可见类别样本中同一类别不同样本之间的变化规则, 对支持集的样本进行扩充, 从而增加支持集中的样本数量, 使提取的特征更具鲁棒性. 其次, 我们提出了一种双重特征提取机制(DF), 该机制首先利用基类的大量数据训练两个不同的特征提取器: 局部特征提取器和整体特征提取器, 利用两个不同的特征提取器对样本特征进行提取, 使提取的特征更加全面, 然后根据局部和整体特征对比, 突出对分类影响最大的特征, 从而提高分类准确性. 在Mini-ImageNet和Tiered-ImageNet数据集上, 我们的模型都取得了较好的效果.
2022, 31(9):226-232. DOI: 10.15888/j.cnki.csa.008698 CSTR:
摘要:自动驾驶任务是当前深度学习研究的热门领域, 环境感知作为自动驾驶中最重要的模块之一, 是一项极具挑战性并具有深远意义的任务, 包括目标检测、车道线检测、可行驶区域分割等. 传统的深度学习算法通常只解决环境感知中的一个检测任务, 无法满足自动驾驶同时感知多种环境因素的需求. 本文使用YOLOv5作为骨干网络及目标检测分支, 结合实时语义分割网络ENet进行车道线检测和可行驶区域分割, 实现了多任务自动驾驶环境感知算法, 损失计算时采用$\alpha $-IoU提高回归精度, 对噪声有更好的鲁棒性. 实验表明, 在BDD100K数据集上, 本文提出的算法结构优于当前现有的多任务深度学习网络, 并且在GTX1080Ti上可达到76.3 FPS的速度.
2022, 31(9):233-240. DOI: 10.15888/j.cnki.csa.008715 CSTR:
摘要:复句关系是指复句分句之间的逻辑语义关系, 复句关系识别是对分句间语义关系的甄别, 是自然语言处理中的难点问题. 本文以有标复句为研究对象, 提出了一种BERT-FHAN模型, 该模型利用BERT模型获取词向量, 在HAN模型中融入关系词本体知识以及词性、句法依存关系、语义依存关系特征. 通过实验对提出的模型进行验证, BERT-FHAN模型取得的最高宏平均F1值和准确率分别为95.47%与96.97%, 表明了本文方法的有效性.
2022, 31(9):241-249. DOI: 10.15888/j.cnki.csa.008684 CSTR:
摘要:由于移动自组网的开放性、分散性的特点, 导致传统的OLSR信任模型存在无法明确量化节点的信任指标和忽视节点的网络环境的问题. 针对上述问题, 本文提出一种基于环境自适应决策的双层模糊逻辑信任模型, 并与OLSR协议搭建了EFT-OLSR协议. 该模型划分为参数提取模块、双层模糊推理模块、决策模块. 首先选取节点剩余能量(P), 阻止隐式的自私攻击; 其次通过运用改进的双层模糊逻辑结构, 限制计算节点信任指标的复杂度; 最后根据网络环境动态调整路由协议中的信任阈值. 实验表明, EFT-OLSR协议在数据包传递率(PDR)、平均端到端延迟、丢包率方面优于现有的FT-OLSR信任模型.
2022, 31(9):250-256. DOI: 10.15888/j.cnki.csa.008688 CSTR:
摘要:河流水面污染物是危害河流资源的重要污染物, 及时发现并处理水面污染物可以有效地保护河流环境以及水资源, 能进一步实现减污降碳, 提升生态系统碳汇能力. 随着智能化的大范围推广, 传统的河流水面污染物的监测处理方法已经不能满足当今的需求. 针对辽河流域水面污染问题, 本文将计算机视觉技术应用到了河流水面污染分类上, 提出了基于分组卷积与双注意力机制的河流水面污染图像分类算法模块(grouped convolution dual attention, GCDA), 在分组卷积的基础上引入简化的双注意力机制, 使用较少的参数量增强了网络对图像的特征提取能力, 进一步提升图像分类效果. 通过固定位截取图像的方式对辽河流域中的温泉城水站取水口、王营河入细河、高台子断面、津源污水排口和清源污水处理厂溢流口5个河流监控摄像图像做了预处理工作并建立了一个河流水面污染物数据集, 图像分为污染和未污染两类, 通过实验证明在此数据集上, 添加使用GCDA模块的网络相较于原网络以及分别添加空间、通道注意力机制的网络在河流水面污染物图像的二分类任务中效果有明显提升.
2022, 31(9):257-264. DOI: 10.15888/j.cnki.csa.008668 CSTR:
摘要:零水印技术为保护图像版权的有效手段之一. 然而, 现有的许多零水印算法大多采用传统的数学理论进行人工提取特征, 在结合神经网络进行图片特征提取的零水印方向上并没有广泛研究. 目前神经网络在图像特征提取上已经取得了很好的成绩, 充分利用卷积自编码器和注意力机制, 提出了一种用于构造零水印的深度注意自编码器模型(attention mechanism and autoencoder, AMAE). 首先是利用带有注意力的卷积神经网络构建自编码器, 然后对自编码器进行训练; 其次, 利用训练好的编码器输出的特征构造图像的整体特征; 最后, 将获得的特征图进行二值模式处理得到特征二值矩阵, 再与水印图像异或运算得到零水印, 并在知识产权信息数据库进行注册, 零水印一旦注册, 原图像便处于水印技术的保护下. 在训练过程中, 借鉴对抗训练的思想, 对模型进行加噪训练, 这提高了模型的鲁棒性. 实验结果表明, 本文的零水印算法在旋转、噪声和滤波等攻击下, 提取水印图像与原水印图像的归一化系数(normalized correlation, NC)值均超过0.9, 证明了提出算法的有效性和优越性.
2022, 31(9):265-271. DOI: 10.15888/j.cnki.csa.008686 CSTR:
摘要:随着向量长度的不断增长, SIMD扩展部件得以处理更为庞大的数据级并行, 但程序的并行阈值也随之提高. 对于现有的自动向量化编译器, 如果在分析阶段不能从串行代码中发掘出足够的数据级并行以完全填充向量寄存器, 则不会进入相应的向量代码变换阶段, 从而无法向量化. 较长的向量长度使得某些并行性不足的程序失去了向量化的机会, 造成了性能下降. 为了更加充分的利用SIMD部件, 介绍了一种面向基本块的非满载向量化方法ISLP. 基于开源GCC编译器, 从并行性检测、代码生成和代价模型3个方面详细阐述了ISLP的设计与实现. 在标准测试集上的实验结果表明, 该方法可以有效地对超字级并行性不足的程序进行向量化处理, 提高程序执行效率. 选取的测试用例在向量化后的平均加速比达到1.14, 性能较常规SLP方法提升11.8%.
2022, 31(9):272-279. DOI: 10.15888/j.cnki.csa.008750 CSTR:
摘要:传统的命名实体识别方法可以凭借充足的监督数据实现较好的识别效果. 而在针对电力文本的命名实体识别中, 由于对专业知识的依赖, 往往很难获取足够的监督数据, 即存在少样本场景. 同时, 由于电力行业的精确性要求, 相比于一般的开放领域任务, 电力领域的实体类型更多, 因此难度更大. 针对这些挑战, 本文提出了一个基于主题提示的命名实体识别方法. 该方法将每个实体类型视为一个主题, 并使用主题模型从训练语料中获取与类型相关的主题词. 通过枚举实体跨度、实体类型、主题词以填充模板并构建提示句. 使用生成式预训练语言模型对提示句排序, 最终识别出实体与对应类型标签. 实验结果表明, 在中文电力命名实体识别数据集上, 相比于几种传统命名实体方法, 基于主题提示的方法取得了更好的效果.
2022, 31(9):280-286. DOI: 10.15888/j.cnki.csa.008677 CSTR:
摘要:针对传统的Single-Pass聚类算法对数据输入顺序过于敏感和准确率较低的问题, 提出一种以子话题为粒度, 考虑新闻文本动态性、时效性和上下文语义特征的增量文本聚类算法(SP-HTD). 首先通过解析LDA2Vec主题模型, 联合训练文档向量和词向量, 获得上下文向量, 充分挖掘文本的语义特征及重要性关系. 然后在Single-Pass算法基础上, 根据提取到的热点主题特征词, 划分子话题, 并设置时间阈值, 来确认类簇中心的时效性, 将挖掘的语义特征和任务相结合, 动态更新类簇中心. 最后以时间特性为辅, 更新话题质心向量, 提高文本相似度计算的准确性. 结果表明, 所提方法的F值最高可达89.3%, 且在保证聚类精度的前提下, 在漏检率和误检率上较传统算法有明显改善, 能够有效提高话题检测的准确性.
2022, 31(9):287-293. DOI: 10.15888/j.cnki.csa.008716 CSTR:
摘要:支持向量机理论简单, 实用性很强, 被大量应用于故障诊断问题中. 在分析支持向量机参数对分类结果影响的过程发现, 不恰当的参数选择往往带来较差的分类结果. 采用启发式优化方法可以避免人为选择的不足, 但单纯以等效间隔距离为寻优目标又会较大概率出现“过学习”现象. 为降低整体结构风险, 将等效间隔距离、支持向量数量和错分率等同时作为优化目标, 提出了一种基于粒子群的多目标支持向量机方法, 并采用定时重启、动态学习因子等策略提升算法全局寻优能力. 最后将其应用于多故障强关联耦合的复杂柴油机故障诊断问题中. 实验结果表明, 该方法可以有效解决少样本、不完备或不确定征兆的柴油机异响故障诊断问题, 筛选得到的综合最优解更符合人们的期望.
2022, 31(9):294-299. DOI: 10.15888/j.cnki.csa.008694 CSTR:
摘要:用户分类是用能分析的一种重要方法, 而智能电表的广泛应用为用户用能分析提供了大量的可用数据. 为进一步提高用户分类精度与用能特征的提取能力, 本文提出了一种自学习边权重的图卷积网络. 所提出的网络通过具有注意力机制的特殊初始化层将原始能耗数据转换为图, 并从生成的图中提取能耗特征, 最终根据图的学习特征输出用户类. 为证明所提出方法的有效性, 本文在实际用能数据集上进行了对比实验. 实验结果表明, 本文方法不仅能够更好地提取用户特征, 而且取得了更好的分类性能.
2022, 31(9):300-305. DOI: 10.15888/j.cnki.csa.008685 CSTR:
摘要:单视图三维重建在计算机视觉领域中是一个具有挑战性的问题. 为了提升现有三维重建算法重建后三维模型的精度, 本文除了提取图像全局特征之外还提取图像局部特征, 结合全局特征和局部特征并选取SDF (signed distance function)作为重建后的三维物体表达方式, 不仅提高了模型的精度, 生成了更高质量的3D形状, 还增强了模型的泛化能力, 使得深度模型可以以较高质量重建出其他物体种类. 实验结果表明, 本文提出的深度网络结构和3D形状表示方法与当今最先进的重建算法相比, 无论在重建后三维模型的效果还是新型物体的泛化中都有更好的表现.
2022, 31(9):306-312. DOI: 10.15888/j.cnki.csa.008682 CSTR:
摘要:交通流预测是智慧交通领域的研究热点之一, 为了深层次地挖掘交通流序列的时空特征, 提高预测精度, 提出了一种基于离散小波变换(discrete wavelet transformation, DWT)和图卷积网络(graph convolutional network, GCN)短时交通流预测模型. 首先, 利用DWT算法将原始交通序列分解为细节分量与近似分量, 降低交通流数据的非平稳性; 其次, 引入距离因子项优化GCN模型中的邻接矩阵, 进一步提取路网的空间特征; 最后, 将DWT分解的各组分量数据分别作为GCN模型的输入进行预测, 并对各组预测结果进行重构, 得到最终预测值. 利用美国加利福尼亚州交通局PeMS数据库实测交通数据对模型进行测试, 结果表明, 该模型相比于ARIMA、WNN、GCN, 平均绝对误差平均降低57%, 平均绝对百分比误差平均降低59%, 是一种有效的短时交通流预测方法.
2022, 31(9):313-318. DOI: 10.15888/j.cnki.csa.008696 CSTR:
摘要:监控场景下人脸图像质量分析技术的研究具有重要意义. 由于监控视频采集到人脸模糊、头部角度不正、被其他物体遮挡等的低质量图像进入识别系统会造成识别准确率下降. 为了解决上述问题, 通过实验, 研究了监控场景下影响图像质量的两个重要因素: 人脸角度、图像清晰度. 设计了基于聚类的人脸图像质量分析算法, 提出了人脸图像质量分数的计算公式, 实验表明该技术能够有效过滤监控视频下采集到的低质量图像, 进而提高人脸识别系统的准确率.
2022, 31(9):319-323. DOI: 10.15888/j.cnki.csa.008683 CSTR:
摘要:以海量半结构化的气象数值预报数据产品为研究对象, 针对传统数据抽取方法效率不高的问题, 基于多进程处理技术, 设计了一种基于精准位置寻址的快速数据块定位算法, 实现了数据块的精准定位; 设计了可按需在空间范围内进行裁剪的截取算法, 可按需根据数据的属性维度、经纬度范围等信息实现数据按需抽取; 基于上述算法实现了全流程统一控制的多进程数据读取的业务流程. 并以单平面耗时为主要考核指标, 分别采用1进程, 4进程、8进程以及16进程进行数据处理, 实际测试结果表明, 采用16进程处理比单个进程处理的速度由257 ms提高到37 ms. 该方法有效的提升非结构气象数值预报产品数据的抽取效率, 已在面向城市治理等气象决策分析业务中业务化应用.
2022, 31(9):324-332. DOI: 10.15888/j.cnki.csa.008710 CSTR:
摘要:邮件集散中心航空运力调度涉及固定运力和备选运力两种调度对象, 本文在航空运力资源充足的前提下, 建立了以最小化运输成本为目标的优化模型, 研究了一种改进的乌鸦搜索算法求解方法. 首先根据问题的数学模型, 引入惩罚函数法将部分约束转化为惩罚项, 与目标函数共同构成适应度函数; 然后引入Logistic混沌映射提高初始种群的多样性; 根据问题的特点, 提出了基于个体最优追随机制和正余弦算法的位置更新策略, 并引入交叉变异机制以丰富搜索过程中种群的多样性. 通过大量算例实验分析, 证明了该算法的有效性与优越性.
2022, 31(9):333-341. DOI: 10.15888/j.cnki.csa.008669 CSTR:
摘要:为充分运用钻井监测平台多个监测因子的长时序信息, 实现海上石油钻井卡钻事故的准确预测, 提出一种多因子长时序信息联合建模的深度卷积卡钻预测方法(CNN-MFT), 利用自注意力机制结合卷积网络对多个监测因子的时序信息进行联合建模, 同时考虑当前时刻各因子的具体值的信息以及各因子的历史时序信息, 实现准确的卡钻预测. 使用海上钻井平台实际监测数据开展验证对比, 与目前常用的基于随机森林(RF)、SVM等8种卡钻预测方法相比, 所提的CNN-MFT方法在50%和70%等不同训练样本比例的条件下, 其卡钻事故预测准确率最高, 且稳定性强, 可为海上石油事故预测应用提供关键算法支撑.
2022, 31(9):342-351. DOI: 10.15888/j.cnki.csa.008719 CSTR:
摘要:面向多转包商的外包选择是当今制造企业面临的一大运营管理挑战. 它与内部作业调度的一体化决策对企业降本增效至关重要. 本文针对有多个转包商可供作业外包选择的单机批调度联合优化问题, 在外包总成本和外包作业最晚交付期均受上限前提下建立以最小化外包总成本与内部批加工总成本之和为目标的0-1整数规划模型, 并为该问题设计了改进型遗传算法和贪婪算法. 以某陶瓷企业的外包与批调度联合决策场景为实例, 对比分析了这两种算法的求解性能, 发现改进型遗传算法在求解质量和时间上具有比较优势. 在模型的灵敏度实验分析中发现, 外包作业最晚交付期对作业运营总成本有显著影响, 而作业外包总成本的给定上限值对作业运营总成本的影响不显著.
2022, 31(9):352-359. DOI: 10.15888/j.cnki.csa.008717 CSTR:
摘要:预训练语言模型虽然能够为每个词提供优良的上下文表示特征, 但却无法显式地给出词法和句法特征, 而这些特征往往是理解整体语义的基础. 鉴于此, 本文通过显式地引入词法和句法特征, 探究其对于预训练模型阅读理解能力的影响. 首先, 本文选用了词性标注和命名实体识别来提供词法特征, 使用依存分析来提供句法特征, 将二者与预训练模型输出的上下文表示相融合. 随后, 我们设计了基于注意力机制的自适应特征融合方法来融合不同类型特征. 在抽取式机器阅读理解数据集CMRC2018上的实验表明, 本文方法以极低的算力成本, 利用显式引入的词法和句法等语言特征帮助模型在F1和EM指标上分别取得0.37%和1.56%的提升.
2022, 31(9):360-367. DOI: 10.15888/j.cnki.csa.008712 CSTR:
摘要:相比于基于像素的建筑物提取方法, 面向对象方法能减少“异物同谱”和“同物异谱”现象, 提高提取精度; 针对遥感影像特征繁多, 造成特征维数灾难的问题, 本文提出了一种面向对象的特征优化方法进行建筑物提取. 首先将最小误差自动阈值分割方法和多尺度分割相结合, 优化分割技术; 然后基于Relief算法和fast correlation-based filter (FCBF)算法进行特征选择, 构建最优特征子集; 最后使用随机森林方法进行建筑物提取并用最小外接矩形方法优化建筑物边界. 结果显示, 特征重要性差异较大, 基于最优特征子集建筑物提取的总体精度达到0.93, Kappa系数为0.91, 明显高于原始特征集和优化特征集提取结果.
2022, 31(9):368-375. DOI: 10.15888/j.cnki.csa.008697 CSTR:
摘要:由于运动原因会造成活体心脏MRI图像中左心室心内膜与心肌边缘轮廓模糊, 进而导致分割不准确以及分割精度较低, 针对这些问题, 本文提出一种基于光流场与语义特征融合的心脏4D Cine-MRI (magnetic resonance imaging)左心室心肌分割模型OSFNet. 该模型包含了光流场计算和语义分割网络: 将光流场计算得到的运动特征与图像语义特征进行融合, 通过网络学习达到了最优的分割效果. 模型采用编码器-解码器结构, 本文提出的多感受野平均池化模块用于提取多尺度语义特征, 减少了特征丢失; 解码器部分使用了多路上采样方法和跳跃连接, 保证了语义特征被有效还原. 本文使用ACDC公开数据集对模型进行训练与测试, 并分别与DenseNet和U-Net在左心室内膜分割、左心室内膜和心肌分割目标上进行对比. 实验结果表明, OSFNet在Dice和HD等多个指标上取得了最佳效果.
2022, 31(9):376-381. DOI: 10.15888/j.cnki.csa.008691 CSTR:
摘要:外周穿刺置入中心静脉导管(PICC)技术被广泛运用于中长期静脉治疗. 在PICC置管时会导致各种并发症和不良反应, 如PICC相关性血栓. 随着机器学习和深度神经网络的不断发展与完善, 为PICC相关性血栓的辅助诊断提供了基于临床医学数据的解决方法. 本文构建了基于DeepFM和XGBoost的融合模型, 针对稀疏数据进行特征融合并能降低过拟合的情况, 能够对PICC相关性血栓提供风险预测. 实验结果表明, 融合模型能够有效地对PICC相关性血栓进行特征重要性提取并预测患病概率, 辅助临床在外周穿刺置过程中识别血栓高危风险因素, 及时进行干预从而预防血栓的发生.
2022, 31(9):382-388. DOI: 10.15888/j.cnki.csa.008690 CSTR:
摘要:在室内单目视觉导航任务中, 场景的深度信息十分重要. 但单目深度估计是一个不适定问题, 精度较低. 目前, 2D激光雷达在室内导航任务中应用广泛, 且价格低廉. 因此, 本文提出一种融合2D激光雷达的室内单目深度估计算法来提高深度估计精度. 本文在编解码结构上增加了2D激光雷达的特征提取, 通过跳跃连接增加单目深度估计结果的细节信息, 并提出一种运用通道注意力机制融合2D激光雷达特征和RGB图像特征的方法. 本文在公开数据集NYUDv2上对算法进行验证, 并针对本文算法的应用场景, 制作了带有2D激光雷达数据的深度数据集. 实验表明, 本文提出的算法在公开数据集和自制数据集中均优于现有的单目深度估计.
2022, 31(9):389-395. DOI: 10.15888/j.cnki.csa.008759 CSTR:
摘要:认识风廓线雷达数据在不同天气条件下的普适性特征对于改善预报服务质量具有重要意义. 本文基于数据挖掘中的聚类技术, 以天津静海风廓线雷达逐时观测数据为研究对象, 构建了风廓线雷达数据特征聚类分析模型, 并在此基础上挖掘出了静海风廓线雷达的最大探测高度、最大垂直速度在晴天、多云、降水发生前、降水期间和降水结束后等天气条件下的不同特征, 为天气预报服务提供了新参考依据, 为风廓线雷达数据特征分析提供了新思路.
2022, 31(9):396-402. DOI: 10.15888/j.cnki.csa.008695 CSTR:
摘要:以多层建筑为背景, 研究应急疏散问题, 基于改进的路径规划算法, 并将多智能体技术应用在模型间的通信交流上. 采用机器人感知周围环境, 通过设置机器人个数以及初始位置, 对灾情中室内被困人员进行智能搜救, 并采集现场实时数据, 作出决策分析. 机器人实时感知现场状况的变化, 引导人员疏散, 并将实时数据传输给施救人员, 采取进一步救援措施. 结果表明, 该三维仿真技术为有效减少人员疏散中的伤亡和最佳救援方案的制定提供了参考, 具有一定的现实指导意义.
2022, 31(9):403-408. DOI: 10.15888/j.cnki.csa.008648 CSTR:
摘要:在针对短文本分类中文本特征稀疏难以提取、用词不规范导致OOV (out of vocabulary)等问题, 提出了基于FastText模型多通道嵌入词向量, 和GRU (gate recurrent unit)与多层感知机(multi-layer perceptron, MLP)混合网络结构(GRU-MLP hybrid network architecture, GM)的短文本分类模型GM-FastText. 该模型使用FastText模型以N-gram方式分别产生不同的嵌入词向量送入GRU层和MLP层获取短文本特征, 通过GRU对文本的特征提取和MLP层混合提取不同通道的文本特征, 最后映射到各个分类中. 多组对比实验结果表明: 与TextCNN、TextRNN方法对比, GM-FastText模型F1指标提升0.021和0.023, 准确率提升1.96和2.08个百分点; 与FastText, FastText-CNN, FastText-RNN等对比, GM-FastText模型F1指标提升0.006、0.014和0.016, 准确率提升0.42、1.06和1.41个百分点. 通过对比发现, 在FastText多通道词向量和GM混合结构网络的作用下, 多通道词向量在短文本分类中有更好的词向量表达且GM网络结构对多参数特征提取有更好的性能.
2022, 31(9):409-415. DOI: 10.15888/j.cnki.csa.008701 CSTR:
摘要:本文主要基于Unity物理引擎, 以四旋翼无人机作为研究对象, 通过建立无人机运行模式的数学模型, 进行仿真模型研究.一方面, 通过将无人机受力模型直接应用在电机对应位置, 来仿真现实物体的受力状态, 从而免去了对模型的刚体数学建模, 简化了仿真建模过程; 另一方面, 通过分析无人机运动原理, 对无人机进行动力系统和控制系统建模, 其中控制系统采用串级PID控制算法进行姿态控制; 本文最后, 通过飞行实验和测试验证了无人机模型的稳定性、有效性, 满足了四旋翼无人机的仿真要求.