2021, 30(11):1-2. DOI: 10.15888/j.cnki.csa.008352 CSTR:
摘要:
2021, 30(11):3-10. DOI: 10.15888/j.cnki.csa.008346 CSTR:
摘要:经过多年的发展, X86架构与ARM架构的处理器逐渐分别占据了桌面端和移动端市场的主导地位. 虽然无论从技术角度还是从生态体系方面, 这两类架构的处理器性能越来越高, 但是由于其指令集臃肿、技术复杂、授权困难等原因, 使得开发这两类架构的处理器的门槛较高. 研究院所还没有一个合适的指令集用于体系结构的研究和创新. RISC-V指令集的开源使得这一局面得以缓解. 其具备精简、开源、敏捷开发等特点引起了工业界与学术界的广泛关注与积极参与. 性能计数器(Hardware Performance Counter, HPC)是处理器研究和性能调优的重要工具. 由于RISC-V制定的标准性能计数器的可拓展性欠佳、可同时捕获事件的数量有限等不足, 本文提出一种新的基于RISC-V的分布式硬件性能计数器. 本文使用Genesys2开发板作为实验平台, 将这种性能计数器适配到lowRISC-v0.4开源SoC项目上, 完成了对该设计方案的验证与评估. 该性能计数器只占用3个控制状态寄存器(Control and Status Registers, CSRs)就可以同时捕获比标准的性能计数器多近乎一个数量级的事件, 在RISC-V处理器的性能分析、结构优化、侧信道攻防等方面为研究者提供了翔实的统计数据.
2021, 30(11):11-19. DOI: 10.15888/j.cnki.csa.008351 CSTR:
摘要:内存溢出攻击是计算机系统中历史悠久且依旧广泛存在的攻击手段, 而指针加密技术可以有效阻止此攻击. 通过软件手段实现这一技术的方式将导致程序运行效率的显著降低并且产生额外的内存开销. 所以本文基于RocketChip的RoCC (Rocket Custom Coprocessor)接口实现一个加解密指针的协处理器PEC-V. 其通过RISC-V的自定义指令控制协处理器加解密返回地址和函数指针等值达到阻止溢出攻击的目的. PEC-V主要使用PUF(Physical Unclonable Function)来避免在内存中储存加密指针的键值, 所以此机制在保证了加密键值的随机性的同时也减少了访问内存的次数. 实验结果显示, PEC-V能够有效防御各类缓冲区溢出攻击, 且程序平均运行效率仅下降3%, 相对既往方案显著提高了性能.
2021, 30(11):20-26. DOI: 10.15888/j.cnki.csa.008347 CSTR:
摘要:RISC-V指令集架构具有模块化、可扩展等特性. 基于RISC-V架构的处理器, 可以在整数指令集的基础之上, 有选择地支持官方标准指令集扩展, 以及非标准的用户自定义指令集扩展. 这也意味着, 对于每个新增的自定义扩展指令集, 用户都需要自己在编译工具链中实现相应支持. 通过分析LLVM编译框架, 研究RISC-V自定义扩展指令支持的通用方法, 并以玄铁C910自定义指令集为例进行实现和验证. 为基于LLVM基础架构的RISC-V自定义指令集扩展研究与实现提供借鉴.
2021, 30(11):27-32. DOI: 10.15888/j.cnki.csa.008349 CSTR:
摘要:为了能够生成正确、优化的机器指令代码, 需要在编译器后端代码的生成阶段, 设计和使用合适的程序栈帧布局. 由于RISC-V向量扩展架构具有可伸缩性、其向量寄存器的长度在编译时不可知, 传统的栈帧布局无法适用. 之前LLVM中针对向量扩展实现的栈帧布局虽然能够生成正确的机器指令, 但存在访存指令较多, 栈帧空间较大, 以及预留寄存器较多等问题. 我们对原有实现所存在的问题进行分析, 在此基础上提出了新的布局方式以及向量对象地址计算方式, 并通过巴塞罗那超算中心开发的测试集进行验证. 实验表明新的栈帧布局能够有效减少访存指令数和栈空间大小.
2021, 30(11):33-40. DOI: 10.15888/j.cnki.csa.008348 CSTR:
摘要:本文设计并实现了一套面向RISC-V的汇编程序语义等价性自动化测试系统. 在面向RISC-V开发软件时, 尤其是基于扩展指令(例如向量指令)编写高效的程序时, 很难避免以手写汇编的方式编写代码. 例如, 为标准的C函数库编写相应的向量版函数. 与编译器自动生成的代码不同, 手写的汇编代码虽然可以最大限度地提高程序的效率, 但因绕过了编译时对程序的约束(如类型检查、寄存器分配等)而对开发者提出了更高的要求. 能否对新版本与标准版本的汇编程序进行快速地、自动化的语义等价性测试, 将大大影响代码的正确性和软件开发和调试的效率. 已有面向RISC-V的测试框架缺乏对语义等价性测试的支持, 也未考虑程序执行带来的副作用. 本研究基于模拟器的动态测试环境, 设计并实现了一套面向RISC-V的汇编程序语义等价性自动化测试系统. 系统通过跟踪机器状态, 捕获程序执行的副作用, 并结合用户定义的测试目标生成测试报告. 实验表明, 本系统相比已有的测试系统, 能够有效地对RISC-V汇编程序的语义等价性进行测试.
2021, 30(11):41-45. DOI: 10.15888/j.cnki.csa.008350 CSTR:
摘要:本文介绍了基于RISC-V的嵌入式智能小车控制系统的硬件连接方案、基于状态机的智能小车状态分析方法和不同应用场景下的电机控制方案. 系统以运行RISC-V软核的FPGA开发板作为智能小车的主控板, 通过RISC-V的GPIO模块采集智能小车的超声波传感器和红外传感器信号来分别检测小车前方和后方的障碍物, 利用GPIO中断对碰撞检测传感器和倾斜角传感器信号作出快速响应, 利用PWM模块实现不同场景下的电机控制. 测试结果表明, 本文介绍的控制系统能够实现智能小车的自主避障、碰撞检测和姿态检测等功能.
2021, 30(11):46-53. DOI: 10.15888/j.cnki.csa.008170 CSTR:
摘要:根据给定查询实体与知识图谱(Knowledge Graph, KG)中其他实体的相关程度对实体进行排序, 是相关实体搜索的重要支撑技术. 实体间的相关性不仅体现在KG中, 还体现在快速产生的Web文档中. 现有的方法主要根据KG来计算实体间的相关度, 但KG无法及时地反映真实世界中快速演化的知识, 导致计算结果不够客观. 因此, 本文首先基于TransH模型提出一种候选实体搜索算法, 通过分析实体在不同关系超平面中的语义表示来针对不同关系选择候选实体. 为了提高候选实体排序的准确性, 提出实体无向带权图模型(Entity Undirected Weighted Graph, EUWG), 通过量化查询实体与候选实体在Web文档和KG中反映出的相关性, 从而准确地对候选实体进行排序. 实验结果表明, 本文的方法能够在大规模KG中准确地搜索候选实体并对其正确排序.
2021, 30(11):54-62. DOI: 10.15888/j.cnki.csa.008180 CSTR:
摘要:自然语言处理中的文档分类任务需要模型从低层级词向量中抽取高层级特征. 通常, 深度神经网络的特征抽取会利用文档中所有词语, 这种做法不能很好适应内容较长的文档. 此外, 训练深度神经网络需要大量标记数据, 在弱监督情况下往往不能取得良好效果. 为迎接这些挑战, 本研究提出应对弱监督长文档分类的方法. 一方面, 利用少量种子信息生成伪文档以增强训练数据, 应对缺乏标记数据造成的精度难以提升的局面. 另一方面, 使用循环局部注意力学习, 仅基于若干文档片段抽取出摘要特征, 就足以支撑后续类别预测, 提高模型的速度和精度. 实验表明, 本研究提出的伪文档生成模型确实能够增强训练数据, 对预测精度的提升在弱监督情况下尤为显著; 同时, 基于局部注意力机制的长文档分类模型在预测精度上显著高于基准模型, 处理速度也表现优异, 具有实际应用价值.
2021, 30(11):63-70. DOI: 10.15888/j.cnki.csa.008232 CSTR:
摘要:新冠疫情的暴发, 学生教工无法返校的情况下, 绝大多数高校采用VPN的方式保证远程学习和科研. 为了解具体情况, 采集了2020年2月至2020年9月新冠疫情期间北京大学的VPN日志, 从使用人数、登录登出时间、使用时长、聚类分析、用户类别5个方面进行讨论. VPN每日使用人数最高约1.5万, 同时在线人数最高约0.5万, 每日的用户平均使用时长最高325 min, 几项数据表明, 学生教工高度依赖VPN进行远程学习和科研, 根据用户的每日平均使用时长和使用天数对用户进行聚类分析, 可以大致将用户分为4类; 对用户类别进行分析, 理工科用户VPN使用时间比文科用户略长, 但变化趋势基本一致. 这些数据对于了解VPN使用情况, VPN资源调整具有参考价值. 虽然新冠疫情期间VPN为校内资源的获取提供了便利, 但其带来的安全隐患也不容忽视, 用户终端如果保护措施不足就容易受到黑客的攻击, 从而作为跳板窃取校内资源或者攻击校内其他机器. 在远程学习和科研将成为新常态的趋势下, 是“甘饴”还是“毒药”? 高校都应该做好充足的准备来应对.
2021, 30(11):71-81. DOI: 10.15888/j.cnki.csa.008145 CSTR:
摘要:在智能化技术革新各个传统行业的过程中, 对于传统病房护理人们提出了更高水平的服务诉求. 在传统病房实地调研的基础上, 为了提高患者日常病房生活中的自理能力, 加强医护和家属对病人生活状况的实时监控, 结合现有物联网智能控制技术, 本文提出一种融合语音和脑电的智慧病房控制系统, 实现了病房电器等基础设施的控制和云端病房实时监测. 此外, 基于眨眼动作的ElectroEncephaloGraphy (EEG)控制方法在一定程度上解决了对患者身体状况的更高要求的问题. 根据涉及10名受试者的两个实验, 语音识别的准确度达到98%, 对健康人和患者基于脑电的眨眼识别的准确率分别为94.3%和82.9%. 结果表明, 该系统能够在病房这类复杂环境下稳定运行, 为患者提供更加智能舒适的疗养环境.
2021, 30(11):82-90. DOI: 10.15888/j.cnki.csa.008183 CSTR:
摘要:在中国, 手机网民规模已达到9.32亿, 其在整个网民中占比达99.2%. 其中, 我国高校学生的智能手机普及率接近100%, 这使得在高校内利用智能手机APP辅助教学成为可能. 论文研究在高校课堂中引入手机APP进行学习评测和管理的方法, 即将传统的课程、班级管理及部分评价方法融入手机APP中, 以提高高校课堂学习管理的效率和学生学习知识的积极性. 论文对3门课程16个班级的884名学生进行了手机课堂测验应用, 并对其中两门课4个班级的165名学生进行了手机课堂测验和纸质测验的对比试验, 同时对124名学生进行针对手机测验的课堂调查. 结果表明, 手机测验相较于传统纸质测验得到更低的测试成绩, 但是从主观上却引起学生极大的兴趣, 增加了课堂活跃度. 总体而言, 大多数学生认可手机考试形式是一种趋势, 在将来的教学中可能会成为一种重要的教学评价手段. 但是, 课堂手机评价系统还属于新兴事物, 具有强大的生命力, 还需要进一步研究.
2021, 30(11):91-98. DOI: 10.15888/j.cnki.csa.008148 CSTR:
摘要:在传统的工业互联网平台中, 终端设备产生数据的安全和隐私问题是阻碍工业互联网发展的主要瓶颈. 伴随着终端数据量几何式的增长, 保护数据的安全性和完整性已经成为工业互联网的核心研究领域. 本文首先设计了一种基于区块链的设备和数据管理的体系架构, 提供了一个可靠的防篡改的数据库. 然后, 利用数字证书对平台采用权限访问控制机制, 提高平台的准入的安全等级. 其次, 通过链码间接地对终端设备及其配置文件进行管理, 避免了终端设备随意地接入对数据造成污染的问题. 最后, 通过终端设备自身的公私钥来对终端设备产生的数据进行打包加密处理, 利用区块链的共识机制, 存储在区块链上. 通过实验表明, 所提出的方案具有良好的稳定性、安全性和可操作性.
2021, 30(11):99-105. DOI: 10.15888/j.cnki.csa.008168 CSTR:
摘要:为了更好地将投影映射技术应用于博物馆的数字展览, 获得高质量的投影效果, 设计出一套具有真实感的3D效果和高保真外观的三维数字文物展示系统. 该系统利用机械旋转的实物模型和真实文物的图像, 将多投影映射技术和光学透视显示相结合, 采用几何学与辐射定标方法, 在不发生透视畸变的情况下, 将高质量的文物纹理正确地投射到动态的3D文物模型投影面上, 增加投影效果和投影内容的自由度. 为了评估该系统在一般博物馆环境光的影响和周围物阴影遮挡等问题, 利用不同强度的光线对该系统投影区和展示区进行了测试, 证明了该系统对周围环境光具有较强的鲁棒性和博物馆环境下的部署潜力, 使博物馆数字文物展示内容变得更为丰富.
2021, 30(11):106-111. DOI: 10.15888/j.cnki.csa.008130 CSTR:
摘要:汽车补漆机器人需要面对各种不同大小的车型, 适配各种造型曲面和颜色, 这种高度自适应要求使得补漆机器人在目标跟踪、路径规划、运动空间等方面的设计难度远超汽车厂的喷漆机器人. 因此需要重新规划喷漆路径, 首先对汽车的点云数据进行分部位切割, 然后以八邻域法计算封闭曲面轮廓, 最后以切片法在曲面上生成光栅轨迹, 形成了每一个补漆面的关键路径. 设计了八轴桁架机器人系统, 用蚁群算法计算生成八轴联动时的路径规划, 再通过倍福的ADS协议将路径数据和梯形曲线的加速度下发到PLC运动控制程序, 完成各关节轴的联动协同补漆运动. 实测表明, 该系统能针对不同汽车, 自动控制机器人工具轴心以法向量对准任意曲面, 并以联动方式驱动八轴平稳跟踪曲面运动. 该系统可广泛应用于各种曲面的机器人加工.
2021, 30(11):112-117. DOI: 10.15888/j.cnki.csa.008169 CSTR:
摘要:现如今的慈善领域总会面临着数据无法公开透明的问题, 人们无法对不公开数据的慈善组织报以信任, 即使公开了数据, 也要面临着数据造假的质疑. 针对现有慈善组织存在的公信力不足、便捷性低, 以及善款流向不透明等问题, 本系统采用区块链技术, 通过设计新型数据存储模型, 将上传的项目数据按照所需的要求进行加解密等操作, 使得数据具有保密性; 同时将交易数据进行链上存储, 利用区块链不可篡改可追溯等特性, 将所有经过本系统的交易数据进行上链操作, 使得交易数据变得公开透明, 同时无法对已经完成的交易的数据进行修改, 从而使整个系统具有足够的公信力, 有效地弥补了传统慈善系统的数据不公开, 同时可能存在数据造假的不足.
2021, 30(11):118-126. DOI: 10.15888/j.cnki.csa.008177 CSTR:
摘要:在工程现场因不佩戴安全帽导致的悲剧时有发生, 为了协助工程现场管理人员保障工人的人身安全, 本文设计实现了一种基于深度学习的安全帽智能监管系统. 该系统采用集速度和精度为一体的YOLOv4目标检测模型, 在数据集上使用K-means算法聚类分析生成新的先验框, 并使用新的先验框进行训练, 将安全帽的检测精度提高至92%; 将检测模型YOLOv4与跟踪模型DeepSORT相结合, 有效解决重复警告和无法对违规数据进行统计的问题; 最终制作成跨平台移动APP, 方便管理人员使用移动端随时随地监管安全帽佩戴情况. 本系统是一套集安全帽检测、检测视频实时直播、智能警告、违规图片抓取并展示, 违规数据可视化等功能为一体的安全帽智能监管系统, 它的使用能够大大提高工程现场的生产安全系数和监管效率.
2021, 30(11):127-137. DOI: 10.15888/j.cnki.csa.008166 CSTR:
摘要:带有回程取货约束的车辆路径问题(Vehicle Routing Problem with Backhauls, VRPB)和二维装箱问题(two-dimensional Bin Packing Problem, 2L-BPP)是两个经典的组合优化问题, 在融合两者的基础上, 本文提出了一种新的组合最优化问题, 即2L-VRPB. 在该问题中, 车队的最优路径规划和货物的最优装载设计需要同时进行考虑, 该问题的优化目标是在满足所有客户的送货和取货需求的前提下, 为车队中的车辆制定尽可能最优的行驶路线和货物装载方案, 使得车队的总的服务成本最低. 该问题在实际生活中有着广泛的应用场景, 例如在设备维修和零售行业的货物运输中可经常遇到此类情形, 但是文献中关于此类问题的研究论文仍然较少. 为了求解2L-VRPB问题, 我们提出了一种具有自适应性机制的混合模因算法(HMA), 该算法采用改进的模因算法(IMA)来规划最优路径, 并通过增强的组合装箱算法(MultiPack)来设计货物的最优装载方案. 在实验环节, 通过在VRPB问题的Goetschalckx & Jacobs-Blecha测试算例和2L-VRPB 问题的Gendreau测试算例上设计对比实验, 我们验证了混合模因算法在求解VRPB和2L-VRPB问题时的鲁棒性和有效性.
2021, 30(11):138-144. DOI: 10.15888/j.cnki.csa.008128 CSTR:
摘要:为解决基于视频流的人体关键点检测效果不佳及视频流切片后可能会发生运动模糊的问题, 提出了一种改进的RetinaNet-CPN网络对人体关键点进行检测, 有效解决切片后运动模糊图像的干扰并提高了人体关键点的检测准确率. 视频流切片后, 先用改进的RetinaNet网络检测出图片中的所有人并对每个目标框做模糊检测, 对大于阈值的目标框做去模糊处理, 最后用引入注意力机制的CPN网络提取关键点. 将RetinaNet衡量预测框与真实框差异的IOU函数改成DIOU后, 在仿真实验中目标检测AP提高了近3%; 对于模糊的图片, 利用匀速直线运动频谱特征估算出的模糊核与实际模糊核相差不大, 对其做去模糊处理后基本能恢复出原清晰图片; 同时引入注意力机制为各通道和特征层分配合理的权重, 使得CPN检测AP提高近1%, AR提升0.5%.
2021, 30(11):145-154. DOI: 10.15888/j.cnki.csa.008127 CSTR:
摘要:针对现有的模糊测试方法缺乏对程序内部信息细粒度的认知, 使用孤立的因素进行种子筛选, 导致模糊测试时间消耗和增益不对等的问题, 提出了一种基于函数重要度的模糊测试方法, 首先, 本文使用属性标记的过程间控制流图(Attributed?Interprocedural?Control?Flow?Graph, AICFG)对函数信息和函数关系进行综合表征, 然后, 在该表征基础上对种子进行评分和评价, 根据评分和评价本文提出了更有效的种子变异策略, 同时, 本文在测试过程中根据函数命中次数对过程间控制流图的属性范围进行调整, 使用图传播算法传播属性的变化. 实验结果表明, 我们的两个优化策略对软件flvemeta测试中在路径数目发现方面与基线模糊测试工具Azmerican Fuzzy Lop (AFL)相比分别提升了11.6%和13.7%左右, 我们实现的工具FunAFL在对jhead、flvmeta和libelfin等软件测试中也获得了比MOPT和FairFuzz更高的覆盖率, 在实际应用中在binutils、ffjpeg、xpdf、jhead、libtiff和libelfin等软件上发现了7个bug, 获得了1个CVE编号.
2021, 30(11):155-163. DOI: 10.15888/j.cnki.csa.008151 CSTR:
摘要:提出一种基于强化学习的生成对抗网络(Reinforcement learning-based Generative Adversarial Networks, Re-GAN)能耗预测方法. 该算法将强化学习与生成对抗网络相结合, 将GAN (Generative Adversarial Nets) 中的生成器以及判别器分别构建为强化学习中Agent (生成器)以及奖赏函数. 在训练过程中, 将当前的真实能耗序列作为Agent的输入状态, 构建一组固定长度的生成序列, 结合判别器及蒙特卡洛搜索方法进一步构建当前序列的奖赏函数, 并以此作为真实样本序列后续第一个能耗值的奖赏. 在此基础之上, 构建关于奖赏的目标函数, 并求解最优参数. 最后使用所提算法对唐宁街综合大楼公开的建筑能耗数据进行预测试验, 实验结果表明, 所提算法比多层感知机、门控循环神经网络和卷积神经网络具有更高的预测精度.
2021, 30(11):164-171. DOI: 10.15888/j.cnki.csa.008198 CSTR:
摘要:数字水印是保护数字版权的关键技术, 本文首先给出双水印算法形式化的定义, 然后基于小波变换(DWT)、SM4分组密码算法和Paillier同态密码, 设计了一个密文域双水印算法. 在嵌入水印时, 将载体图像进行三重DWT变换, 将频带集分为加密部分、水平高频LH3水印部分和垂直高频HL3水印部分. 利用SM4分组密码和Paillier公钥密码分别对加密部分和水印部分频带系数加密, 同时利用Paillier公钥密码体制对数字水印信息进行加密, 利用最低有效位(LSB)方法, 分别在LH3和HL3的密文域嵌入两个用户水印信息. 最后DWT小波逆变换后生成含水印的密文图像. 在水印提取时, 由于Paillier具有同态特性, 实现了在解密后的明文提取水印. 实验结果表明, 该算法具有加解密速度快, 水印的不可见性好等特性.
2021, 30(11):172-178. DOI: 10.15888/j.cnki.csa.008193 CSTR:
摘要:将智能仓储中的自主移动群机器人订单任务分配, 建模成群机器人协同调度的多目标优化问题, 将成员机器人完成拣货任务的路径代价和时间代价作为优化目标. 设计了蚁群-遗传算法融合框架并在其中求解. 该框架中, 蚁群算法作为副算法, 用于初始种群优化; 遗传算法改进后作为主算法. 具体地, 在遗传算法轮盘赌选择算子后引入精英保留策略, 并在遗传操作中加入逆转算子. 针对不同数量的订单任务, 使用不同规模的群机器人系统进行了任务分配仿真实验. 结果表明, 在本文所提的融合框架中求解, 较分别使用蚁群算法或遗传算法单独求解, 性能上具有明显优势, 能够发挥蚁群算法鲁棒性好和遗传算法全局搜索能力强的特点, 提高智能仓储系统的整体运行效率.
2021, 30(11):179-187. DOI: 10.15888/j.cnki.csa.008179 CSTR:
摘要:随着地质研究与大数据的融合, 形成了“多元异构、高容量、低价值密度的”海量地质数据. 尤其在城市建设中反映地表和地面沉降情况的地质形变监测数据, 具有容量大、时变性、维度复杂的特点. 如何通过可视化技术更直观的服务于地质研究分析与问题决策, 成为该领域数据可视化研究与应用热点. 本文针对这一问题, 通过干涉合成孔径雷达(Interferomeric Synthetic Aperture Radar, InSAR)采集的数据, 提出一种在Cesium和Geoserver融合构建的Web三维场景下, 展示地域沉降形变监测情况的可视化方法. 在形变图层展示效果上, 不同于Google Earth单一的渲染效果, 设计出一种动态改变形变监测点云数据过渡颜色的方式. 在可视化分析交互上与ENVI/SARscape进行对比. 实践及应用结果表明, 相对于传统方法如二维平面展示以及通过Google Earth导入数据的集成展示, 本文方法对形变监测结果有更加直观的展示. 同时拥有更加丰富的人机交互方式, 为地质专业者提供更良好的辅助决策功能.
2021, 30(11):188-194. DOI: 10.15888/j.cnki.csa.008147 CSTR:
摘要:本文提出一种基于K-means聚类与机器学习回归算法的预测模型以解决零售行业多个商品的销售预测问题, 首先通过聚类分析识别出具有相似销售模式的商品从而实现数据集的划分, 然后分别在每个子数据集上训练了支持向量回归、随机森林以及XGBoost模型, 通过构建数据池的方式增加了用于训练模型的数据量以及预测变量的选择范围. 在一家零售企业的真实销售数据集上对提出的模型进行了验证, 实验结果表明基于K-means和支持向量回归的预测模型表现最优, 且所提出的模型预测效果明显优于基准模型以及不使用聚类的机器学习模型.
2021, 30(11):195-202. DOI: 10.15888/j.cnki.csa.008133 CSTR:
摘要:传统图像描述算法存在提取图像特征利用不足、缺少上下文信息学习和训练参数过多的问题, 提出基于ViLBERT和双层长短期记忆网络(BiLSTM)结合的图像描述算法. 使用ViLBERT作为编码器, ViLBERT模型能将图片特征和描述文本信息通过联合注意力的方式进行结合, 输出图像和文本的联合特征向量. 解码器使用结合注意力机制的BiLSTM来生成图像描述. 该算法在MSCOCO2014数据集进行训练和测试, 实验评价标准BLEU-4和BLEU得分分别达到36.9和125.2, 优于基于传统图像特征提取结合注意力机制图像描述算法. 通过生成文本描述对比可看出, 该算法生成的图像描述能够更细致地表述图片信息.
2021, 30(11):203-209. DOI: 10.15888/j.cnki.csa.008163 CSTR:
摘要:针对线、面特征匹配的激光雷达测距与地图构建算法(Lightweight and Ground-Optimized Lidar Odometry And Mapping, LeGO-LOAM)在自动导引运输车(Automated Guided Vehicle, AGV)室内室外实时建图与定位时, 易出现激光里程计累积误差大和旋转估计不准确等问题, 本工作采用惯性测量单元(Inertial Measurement Unit, IMU)与激光雷达紧耦合的LeGO-LOAM算法, 通过IMU为激光雷达提供的初始位姿信息, 构建IMU与激光雷达联合误差函数, 实现位姿共同迭代优化. 其中, 对于室外结构化信息较少时, 在点对点的迭代最近点算法(Iterative Closest Point, ICP)较高定位精度的基础上, 结合LeGO-LOAM算法和ICP算法互补性, 进一步提出基于IMU与激光雷达紧耦合的混合匹配算法: 当环境中结构信息较多时, 激光里程计采用LeGO-LOAM算法, 而当环境中结构化信息较少时采用ICP算法. 实验结果表明, 基于IMU与激光雷达紧耦合的混合匹配算法可有效降低激光里程计相对位姿误差和累积误差, 提高AGV小车定位精度以消除部分地图重影.
2021, 30(11):210-216. DOI: 10.15888/j.cnki.csa.008153 CSTR:
摘要:为了提高图像分类性能, 本文提出一种多模型特征和注意力模块融合的图像分类算法(image classification algorithm based on Multi-model Feature and Reduced Attention fusion, MFRA). 通过多模型特征融合, 使网络学习输入图像不同层次的特征, 增加特征互补性, 提高特征提取能力; 通过加入注意力模块, 使网络更关注有目标的区域, 降低无关的背景干扰信息. 本文算法在Cifar-10, Cifar-100, Caltech-101这3个公开数据集上的大量实验对比, 验证了其有效性. 与现有算法对比, 本文算法的分类性能有较为明显的提升.
2021, 30(11):217-223. DOI: 10.15888/j.cnki.csa.008171 CSTR:
摘要:在以用户为中心的超密集网络(User-centric Ultra-Dense Networking, UUDN)中, 由于进行信道估计的导频序列长度有限, 导致传统的基于信息论准则的窃听检测技术效果不理想甚至完全失效. 针对这种情况, 提出了一种基于LS-FDC准则的多节点联合检测算法. 首先, 该方法利用统计学中的线性收缩(Linear Shrinkage, LS)理论, 对各节点接收到的样本协方差矩阵进行收缩优化, 使其特征分解后更好的拟合总体特征值的分布情况; 然后, 接入节点组(Access Points Group, APG)中的各节点利用灵活检测准则(Flexible Detection Criterion, FDC)算法进行联合判定是否存在窃听用户; 最后, 仿真实验与理论分析表明: 相较于其他的信源估计检测算法, 该算法在较低信噪比和导频序列长度有限时的检测概率显著提高, 甚至在导频序列长度小于节点天线数的情况下都能达到很好的检测效果.
2021, 30(11):224-230. DOI: 10.15888/j.cnki.csa.008192 CSTR:
摘要:司机的异常驾驶行为会引发交通事故从而威胁司机、乘客及他人的生命安全, 因此检测司机的异常驾驶行为可以有效保障人们的出行安全. 在实际驾驶过程中, 发生在司机嘴部区域的异常行为复杂多样, 因此本文提出一种无监督检测算法来检测嘴部区域的异常行为. 算法首先使用人脸关键点检测网络获取嘴部异常高发区域; 之后通过改进后的Convolutional Auto-Encoder (CAE)算法重构嘴部区域图片并计算重构误差以此来判断是否发生异常. 包括以下3点改进: 加入skip connect结构用来更好地重构输入图片; 加入Inception结构并调整优化分支通道比例, 用来更好的拟合输入图片特征; 在训练时加入高斯白噪声进一步提高模型检测的鲁棒性. 实验结果表明: 本文提出的算法框架与传统CAE算法相比, AUC从0.682提高到0.938, 并且能够在嵌入式系统上运行.
2021, 30(11):231-239. DOI: 10.15888/j.cnki.csa.008182 CSTR:
摘要:网联车跟驰模型的研究可为未来实施大规模的实地测试提供模型参考, 已成为交通流及智能交通领域的研究热点. 为了更好地研究智能网联车的跟驰特性, 在MVD模型的基础上, 提出了一种考虑后视效应和多前车信息的跟驰模型(BL-MVDAM), 利用线性稳定性分析方法推导出BL-MVDAM模型的交通流稳定性判断依据, 并分别分析了模型中各参数对系统稳定性的影响, 给出分析结果并进行了数值仿真实验. 仿真实验选取在环形道路上给行驶过程中的车队施加轻微扰动, 并根据跟驰车对后车的关注程度P和前车数量k设计数值模拟实验, 当其他条件一致时, 本文模型相比FVD, MVD, OMVC和BLVD模型, BL-MVDAM模型中车队的速度波动率较小, 尤其是当P=0.8, k=3时, 车队速度平均波动率最小可以达0.24%, 实验分析结果表明, 所提出模型在引入后视效应和多前车信息后, 具备更优的稳定区域, 能较好地吸收扰动且有利于增强车队行驶的稳定性.
2021, 30(11):240-246. DOI: 10.15888/j.cnki.csa.008205 CSTR:
摘要:能够自动识别、统计航道上的船只类型与数量, 对建设“智慧航道”、水上智能预警、通航辅助决策等具有重要意义. 通过使用YOLOv3预训练模型, 对船只样本图片进行训练, 调参优化得到航道中船只检测模型, 然后利用深度学习模型善于进行目标特征提取的特点, 结合目标HSV颜色直方特征和LBP局部特征来实现目标选择, 针对跟踪目标容易出现的漂移和抖动问题, 设计校正网络融合使用了基于回归的方向判断和可变时间窗的目标计数方法, 较好地实现了水上运动目标的自动检测、跟踪和自校正计数. 测试表明本文方法稳定健壮, 适合用于自动分析航道视频, 提取统计数据.
2021, 30(11):247-253. DOI: 10.15888/j.cnki.csa.008150 CSTR:
摘要:针对传统的投影方法在人眼定位时易受光照干扰以及难以获得精准的人眼中心点的问题, 提出一种基于多尺度自商图和改进的积分投影法的人眼定位算法. 首先利用多尺度自商图消除人脸图像的光照影响; 然后分析眼睛在水平方向上灰度分布的特点, 采用两个行梯度算子对积分投影法进行了改进, 以提升眼睛区域特征并初步定位人眼区域; 接着采用Sobel算子对人眼区域进行滤波得到人眼滤波图, 并对人眼滤波图的垂直积分投影曲线进行高斯函数拟合, 根据拟合结果分割出左眼窗口和右眼窗口; 最后, 计算左眼窗口和右眼窗口的尺寸, 获取左眼窗口和右眼窗口的中心点, 即为人眼中心点. 在YaleB人脸数据库和JAFFE人脸数据库上测试表明, 本文方法对复杂光照、人脸边缘以及人脸表情适应性强, 可以获得较为精准的人眼中心点.
2021, 30(11):254-259. DOI: 10.15888/j.cnki.csa.008152 CSTR:
摘要:导向定位测序(GPS)是一种全基因组DNA甲基化检测的新测序技术, 产生的测序数据具有成本低、没有序列偏好等优势. 目前, 甲基化分析中最重要的一步是将其测序产生的序列比对到参考基因组上. 但是, 现有导向定位测序的方法使用Smith-Waterman进行局部序列比对, 时间消耗过大且容易对序列比对位置产生误判. 因此, 提出一种导向定位测序数据的改进比对算法, 该算法利用其双端测序的优势, 先用甲基化序列端数据进行序列比对, 对多位置匹配的序列再利用常规数据端数据进行比对位置确定. 实验结果表明: 本文方法和现有方法的准确率相当, 而具有更高的唯一比对比率, 时间性能有3倍以上的提升.
2021, 30(11):260-265. DOI: 10.15888/j.cnki.csa.008178 CSTR:
摘要:近年来无人机在物流运输领域发展十分迅速, 这其中一个重要原因是无人机可以应对各种复杂的交通环境如城市的交通拥堵和乡村偏远地区的较差路况. 而路径规划则是其在实际应用过程当中的一个重要环节, 本文针对于此设计了一种自适应大邻域搜索算法来解决该问题. 该算法通过引入自适应的机制来对传统的邻域搜索进行改善, 使其能具有找到更好的解的潜力. 在一些经典数据集上的仿真实验显示, 本文提出的算法具有较强的鲁棒性和稳定性. 另外通过该算法和其他元启发式算法的对比实验验证了本算法能够有效地减少使用无人机进行物流配送的费用.
2021, 30(11):266-272. DOI: 10.15888/j.cnki.csa.008206 CSTR:
摘要:针对载体图像内容安全与数字水印版权保护, 结合Arnold置换与直方图平移可逆水印算法, 提出基于Arnold置换的交换加密水印算法. 算法利用置换后图像直方图不变的特性, 将在密文中嵌入水印的操作映射到明文中, 实现了加密与水印操作先后顺序的交换. 在提取水印时, 可直接从含水印的密文中提取水印, 也可解密后再提取水印. 实验结果表明, 该算法加密操作与水印嵌入操作间的先后顺序不影响含水印密文的生成, 解密操作与水印提取操作的先后顺序不影响水印提取与图像恢复, 且直接解密得到的含水印明文图像质量较高, 水印的不可见性好, 算法有较高的效率.
2021, 30(11):273-280. DOI: 10.15888/j.cnki.csa.008233 CSTR:
摘要:为了获取高速公路交通视频中目标车辆的行驶轨迹, 提出一种基于视频的多目标车辆跟踪及实时轨迹分布算法, 为交通管理系统和交通决策提供目标车辆交通信息. 首先, 使用YOLOv4算法检测目标车辆位置及置信度. 其次, 在不同场景条件下, 使用提出的基于稀疏帧检测的跟踪方法, 结合KCF跟踪算法, 将车辆数据进行关联获取完整轨迹. 最后, 用车辆分布图和交通场景俯视图显示轨迹, 便于交通管理与分析. 实验结果表明, 提出的跟踪方法在车辆跟踪中有较高的跟踪正确率, 同时基于稀疏帧检测的跟踪方法处理速度也较快, 实时轨迹分布正确反映了真实场景的车道信息以及目标车辆运动信息.
2021, 30(11):281-288. DOI: 10.15888/j.cnki.csa.008124 CSTR:
摘要:针对高维群组变量下的分类问题, 本文提出了一种基于MCP惩罚的AdaBoost集成剪枝逻辑回归模型(AdaMCPLR), 将MCP函数同时应用于特征选择和集成剪枝, 在简化模型的同时有效地提升了预测精度. 由于传统的坐标下降算法效率较低, 本文引用并改进了PICASSO算法使其能够应用于群组变量选择, 大大提高了模型的求解效率. 通过模拟实验, 发现AdaMCPLR方法的变量选择和分类预测效果均优于其他预测方法. 最后, 本文将提出的AdaMCPLR方法应用于我国上市公司财务困境预测中.
2021, 30(11):289-297. DOI: 10.15888/j.cnki.csa.008162 CSTR:
摘要:本文研究了考虑编制受限情况下的机场地勤人员排班问题. 目的是从管理角度最小化成本, 解决无法通过雇佣外界临时工以满足需求的人员紧缺问题, 同时提高由不确定性因素造成计划中断的应对能力. 本文建立了考虑编制受限的均衡任务覆盖混合整数优化模型, 针对问题的特点设计了高效的启发式算法求解, 并通过大型机场的真实算例验证算法及模型的效果. 从无法覆盖的任务在排班周期内分布情况和员工间公平性两个角度分析模型在实际应用中的情况, 证实模型能够很好应对用人高峰问题, 提高机场运营效率, 同时协助管理者在人员组成上进行决策.
2021, 30(11):298-303. DOI: 10.15888/j.cnki.csa.008164 CSTR:
摘要:因为身份验证的过程有概率会让使用者的秘密信息暴露, 导致恶意敌手可能会追踪到用户的秘密信息, 并对其进行不法利用产生危害和利益损失. 比如在基于SmartCard的匿名PAKA协议方案中, SmartCard遗失后便没有办法防御敌手的离线字典攻击. 因此, 将双线性配对操作、D-H困难和椭圆曲线运算等操作与注册和认证过程相结合, 分别基于口令和智能卡进行改进设计了新方案. 并将智能卡与改进的基于口令AKA方案相结合, 提出了基于智能卡和口令结合的AKA协议方案, 给了出安全性证明. 进一步提高了基于SmartCard和密码的PAKA协议的可靠安全性.
2021, 30(11):304-309. DOI: 10.15888/j.cnki.csa.008165 CSTR:
摘要:伴随着社会经济的快速发展, 地铁、隧道、桥梁等建筑在人们的生活中占据的地位越来越高, 预测分析建筑的结构变形数据, 及时发现存在的安全隐患, 至关重要. 结合长短时记忆网络(Long Short Time Memory, LSTM)的优点, 本文提出了一种基于双向长短时记忆网络(Bidirectional Long Short Time Memory, Bi-LSTM)的结构变形预测模型. 该模型通过记忆时间节点前后的规律, 预测当前节点变形数据, 充分挖掘变形数据内部的关联信息. 与WNN、LSTM、GRU模型进行对比, 结果表明, 该模型RMSE、MAPE、MAE分别下降了66.0%、61.2%、66.2%, 是一种有效预测结构形变的方法.
2021, 30(11):310-316. DOI: 10.15888/j.cnki.csa.008191 CSTR:
摘要:图像特征点及描述子提取是SLAM、SFM和3D重建等任务的基础, 较好的图像特征点及描述子提取算法会对这些任务的进步产生十分重要的作用. 本文聚焦于提取特征点和描述子算法中鲁棒性较高、性能较好的SuperPoint网络, 对该网络进行了一定程度的改进. 针对其计算量和参数较大的问题, 首先将普通卷积改成深度可分离卷积, 改变卷积层数和下采样方式, 之后改进通道剪枝算法, 使其可以应用于深度可分离卷积, 对网络进行剪枝. 实验结果显示, 在轻微损失特征点检测和匹配效果的情况下, 将网络参数量压缩为原来网络的15%, 运算量压缩为原来网络的5%, FPS提升6.64倍, 取得了较好的实验效果.
2021, 30(11):317-322. DOI: 10.15888/j.cnki.csa.008199 CSTR:
摘要:换挡毂线轮廓度测量评价难度大, 单一的系统工程软件难以实时高效地实现线轮廓度评价的任务需求. 采用.NET面向对象编程接口技术, 利用Matlab开发线轮廓度评价算法, LabView进行实时数据的采集分析, 实现联合编程, 开发了线轮廓度评价软件. 联合编程技术加速实现了从控制、采集、分析等任务的集成到实际部署应用的进程, 提高了开发效率.
2021, 30(11):323-328. DOI: 10.15888/j.cnki.csa.008188 CSTR:
摘要:针对传统人工织物疵点检测存在的误检及低效等问题, 提出了一种基于视觉感知机制的自适应织物疵点轮廓检测方法. 首先, 模拟视觉系统中视网膜感受野对视觉信息的处理机制对织物疵点图像进行滤波及疵点增强; 其次, 依据初级视皮层(V1)区对视觉信息响应的方向选择性机制构建织物疵点图像边缘检测模型, 实现对织物疵点图像的边缘检测. 最后, 采用自适应阈值选择的方法对检测到的边缘进行二次处理, 获得织物图像疵点的轮廓. 为验证本文方法的有效性和准确性, 对4类织物疵点图像进行测试, 并定性和定量两方面进行比较分析, 结果表明文中提出的方法能够较好地检测出织物疵点轮廓信息, 不仅可以得到质量较高的织物疵点轮廓图像, 而且在整个检测过程中能够自适应的选择参数, 避免受人的主观因素影响, 具有实际的应用价值.
2021, 30(11):329-335. DOI: 10.15888/j.cnki.csa.008280 CSTR:
摘要:随着现阶段数字孪生技术的不断发展, 围绕着数字孪生的研究和应用逐渐成为了热点. 由于传统的自动驾驶测试方法存在着不同程度的功能性、安全性以及测试成本方面的各种缺陷, 本文针对数字孪生的基本特征以及自动驾驶的测试方法, 提出了一种混合现实下数字孪生自动驾驶测试环境的构建方法, 利用空间坐标映射、碰撞检测模型、虚拟场景注册, 将实际环境下的自动驾驶信息映射到虚拟场景中, 同时构建了对应的混合现实的自动驾驶测试模型, 并通过实验展示了混合现实系统具有交互特征的碰撞测试, 对比了50 ms、200 ms和1000 ms采样频率下系统的性能并进行了分析, 实验表明, 本文算法在采样频率200 ms或以上, 有较好的运行帧率特征.
2021, 30(11):336-341. DOI: 10.15888/j.cnki.csa.008146 CSTR:
摘要:为了进一步提升红外和可见光图像的融合效果, 提出了一种基于多尺度卷积算子和密集连接网络的图像融合模型. 该模型首先使用多尺度卷积算子计算图像的直接多尺度特征, 然后使用密集连接网络计算图像的间接多尺度特征. 为了得到图像像素信息在不同尺度下的融合权重, 通过叠加的方式将各个尺度密集连接网络的输出进行融合, 并使用活动图方法计算两类图像的融合权重, 最后根据权重计算结果得到融合图像, 实验在THO数据集和CMA数据集获得较好的识别率.
2021, 30(11):342-347. DOI: 10.15888/j.cnki.csa.008149 CSTR:
摘要:人群模型评估是虚拟人群仿真研究的关键问题, 现有的研究多通过个体仿真轨迹与真实轨迹之间的误差来评估人群模型. 然而人群行为本质上是复杂的随机系统, 简单的轨迹对比并不能有效反映模型能力. 本文应用熵度量的模型评估方法, 通过估计真实人群状态与仿真人群状态的误差分布实现了精确的人群仿真定量评估. 同时引入失真情况的判断和处理规则, 使得评估方法在仿真失真情况下能够保持准确性. 实验结果表明, 本文提出的算法及规则能有效地实现人群仿真模型的定量评估并给出模型参数选择的指导.