2021, 30(12):1-9. DOI: 10.15888/j.cnki.csa.008245
摘要:近年来, 越来越多的应用或微服务部署到云端. 虚拟网络是云端部署运行的基本保障. 为了构建面向虚拟机和容器等虚拟实例的虚拟网络, 网卡虚拟化在物理网卡的基础上, 构建虚拟网卡和虚拟网桥等设备, 并对各虚拟设备进行配置和管理. 本文从虚拟网卡和虚拟网桥出发, 调研了网卡虚拟化中目前流行的虚拟技术, 并将这些技术进行了分类和比较, 最后就网卡虚拟化的现状及未来进行了总结和展望.
2021, 30(12):10-17. DOI: 10.15888/j.cnki.csa.008252
摘要:在大规模、数据量密集的特定应用场景下, 以行存储访问数据的方式弊端日益凸显, 逐渐不能满足数据高速访问的性能需求, 数据亟需更加高效的传输和处理方式. 因此, 拓展新的内存访问方式, 并且同时兼容行、列方向的访问对提升访问效率、降低整体功耗、节省内存空间有着重要意义. 本文围绕动态随机存储和非易失性存储两个方面来详细介绍实现列方向的内存访问方式, 重点分析了存储单元的结构设计以及实现列向存储访问过程. 最后, 对内存两种不同访问方式进行了比较和总结, 并且对行列访问的内存数据库、数据挖掘、数据加密算法、实时系统的应用场景进行了展望.
2021, 30(12):18-27. DOI: 10.15888/j.cnki.csa.008208
摘要:数值模拟是宇宙学中重要的研究方法, 可以帮助科学家了解宇宙演化过程和验证理论模型. 可视化是分析模拟数据最有效的手段之一, 通过对模拟数据的可视化和交互式探索可以极大提高科学家的分析效率. 随着超级计算机的发展和宇宙学理论的不断完善, 数值模拟的规模越来越大并且精度越来越高, 这对可视化产生了多种分析需求和数据处理挑战. 本文概述了宇宙数值模拟中可视化的主要方法, 并且通过多个研究案例展示了可视化方法在宇宙模拟数据分析中的作用. 最后, 本文总结了当前研究的热点和面临的挑战.
2021, 30(12):28-36. DOI: 10.15888/j.cnki.csa.008289
摘要:边缘计算可以有效解决传统云计算中传输时延大、用户数据安全性不够高、传输带宽压力大以及终端移动设备计算能力受限、能耗大等问题. 计算卸载是边缘计算中的关键技术, 针对当前计算卸载技术的研究现状和存在的不足, 本文围绕计算卸载, 首先介绍边缘计算的体系架构以及部分应用和分析4种主要的影响因素以及相应具体的条件; 其次针对3种决策目标分析了算法策略及对应变量在算法中的作用; 最后总结目前在计算卸载中存在的不足.
2021, 30(12):37-45. DOI: 10.15888/j.cnki.csa.008195
摘要:众多基因生物标志物选择方法常因研究样本较少而不能直接用于临床诊断. 于是有学者提出整合不同基因表达数据同时保留生物信息完整性的方法. 然而, 由于存在批量效应, 导致直接整合不同基因表达数据可能会增加新的系统误差. 针对上述问题, 提出一个融合自主学习与SCAD-Net正则化的分析框架. 一方面, 自主学习方法能够先从低噪声样本中学习出基础模型, 然后再通过高噪声样本学习使得模型更加稳健, 从而避免批量效应; 另一方面, SCAD-Net正则化融合了基因表达数据与基因间的交互信息, 可以实现更好的特征选择效果. 不同情形下的模拟数据以及在乳腺癌细胞系数据集上的结果表明, 基于自主学习与SCAD-Net正则化的回归模型在处理高维复杂网络数据集时具有更好的预测效果.
2021, 30(12):46-54. DOI: 10.15888/j.cnki.csa.008279
摘要:细胞受到致癌因子刺激时引起突变, 突变过程使基因组发生具有一定模式的改变, 称为突变印迹. 突变印迹分析是阐明致癌因子的致癌机制及驱动癌症发展的一项重要任务, 将为肿瘤早期诊断和个体化治疗提供新的依据和选择. 下一代测序技术的突破和发展使得海量体细胞突变被识别, 从而使从大规模基因组中挖掘突变印迹成为可能. 本文详细解释了突变印迹识别问题的数学模型, 介绍了求解方法和重要参数, 系统全面地比较了主流算法和软件, 指明了突变印迹提取的注意事项. 最后, 对该领域的未来发展趋势进行了探讨.
2021, 30(12):55-62. DOI: 10.15888/j.cnki.csa.008229
摘要:针对在线问诊中患者主诉医疗信息表述多样化, 医疗知识利用不足的问题, 本文设计实现了基于医疗知识图谱的交互式智能导诊系统. 该系统引入医疗知识图谱提供导诊知识, 通过实体识别和实体链接技术规范化主诉文本中的医疗表述, 利用医疗实体生成知识图谱子图并获取子图语义信息, 融合子图和患者主诉的语义信息得到科室置信度. 当推荐科室置信度低时, 通过多轮交互问询的方式补充患者症状信息, 最终给出推荐科室. 该系统能够为建立快速精准智能医疗体系提供技术支持, 有效提升导诊效率, 缓解医疗资源紧张.
2021, 30(12):63-72. DOI: 10.15888/j.cnki.csa.008226
摘要:现代作战体系中通常涉及来自多个领域的复杂系统, 因而体系设计时会采用到多个不同的建模工具与仿真工具, 导致体系建模工具之间异构数据难以共享、体系建模工具与仿真工具联动困难等不足. 为解决上述问题, 提出了一种新型的多架构体系建模与仿真联合平台, 形成了“元模型设计-体系建模-仿真验证”的全覆盖设计能力. 在此基础上, 以空地协同防御体系中的人机协同防御场景为例, 验证了该平台对体系设计的有效性. 具体来说, 采用该平台设计了与案例场景相对应的元模型、建立了作战视图体系模型, 并对作战任务中的战机行为进行了仿真, 为战机出战方案设计提供了理论依据.
2021, 30(12):73-83. DOI: 10.15888/j.cnki.csa.008222
摘要:目前, 传统的军用车辆管理方法已经无法适应部队信息化的发展, 迫切需要使用一种高效的、融合新技术的管理模式. 为此, 本文针对管理中涉及的安全认证和授权方面, 设计了一款基于人工智能的军用车辆远程授权及监控系统. 该系统采用了最新的人脸识别技术和网络技术, 由车辆端、服务器端和客户端3部分组成. 其中, 车辆端部署于车辆驾驶室内的NVIDIA Jeston Nano AI开发板上, 使用人脸识别模型对驾驶员进行认证, 并与服务端进行数据交互. 服务端部署于云服务器, 用于管理车辆端和客户端信息、汇总车辆端上传数据、在车辆端和客户端建立数据交互. 客户端部署于移动智能终端, 用于进行远程授权、远程监控等. 通过测试表明, 本系统能够实现车辆的自动化认证、远程授权和远程监控, 防止了车辆的非法使用行为, 有力保障了车辆的使用安全.
2021, 30(12):84-94. DOI: 10.15888/j.cnki.csa.008236
摘要:许多新材料研发企业的研发设计、制备以及测试表征分处于不同部门, 导致材料制备工艺数据、测试表征数据以及研发设计数据呈离散化、碎片化状态, 形成信息孤岛, 且不能与材料计算有效地关联. 开发一个通用的, 能将材料测试表征、制备和服役数据深度融合的数据库系统, 进而基于数据驱动方法, 构建“成分-组织-工艺-性质”预测模型, 有着非常重要的意义. 然而, 材料种类和体系众多, 不同材料其测试表征方法以及制备方法多样性, 给开发一种通用的融合材料测试表征和制备工艺的数据库系统带来很大挑战. 基于此, 我们首先参照CSTM材料基因工程数据通则, 提出了一个材料测试表征和制备工艺数据库框架, 进而基于无代码编程理念和语义UI模板, 研发了一个通用的材料测试表征和制备工艺数据库无代码构建系统MatFusion. MatFusion能适用于不同的材料体系, 帮助企业快速构建材料专用数据库, 并在液态金属测试表征和制备工艺专用数据库的构建中得到了应用.
2021, 30(12):95-102. DOI: 10.15888/j.cnki.csa.008228
摘要:随着社会的发展, 人才履历真实与否在企业招聘环节至关重要, 传统基于第三方机构的履历存证存在数据管理中心化、履历造假等问题难以解决. 针对上述问题, 提出一种基于区块链的可搜索加密人才履历共享方案. 首先, 利用区块链不可篡改的特性结合链上链下协同存储机制保证了履历数据的真实性; 其次, 在履历数据共享过程中, 利用区块链去中心化的特性取代传统第三方机构, 并结合可搜索加密技术实现了参与方之间的公平性与数据存储、更新时的隐私保护; 最后从安全性和正确性角度对方案进行分析, 证明了本方案能解决上述难题.
2021, 30(12):103-108. DOI: 10.15888/j.cnki.csa.008209
摘要:针对电力线巡检需求, 本文设计并实现了一套基于低成本多激光雷达组合的电力线安全距离监测预警系统. 将单线激光雷达(思岚RPLIDAR S1)安置在RoboMaster GM6020云台电机上构成一套设备可以进行三维环境感知, 在电力作业斗臂车四周安装4套同样的设备进行环境感知, 通过布设标靶纸, 同时采集点云数据并测量标靶纸全局坐标系坐标, 根据最小二乘原理进行4个激光雷达之间的空间位置关系标定并统一到同一个坐标系下. 通过网络通信将4套设备采集的点云实时数据传输至数据处理平台进行可视化显示、安全距离监测和报警, 可以有效避免安全隐患, 提高带电作业的安全水平.
2021, 30(12):109-115. DOI: 10.15888/j.cnki.csa.008234
摘要:在经济快速发展、道路建设不足等多重压力下, 城市交通负担越来越重. 在现有的资源条件下, 如何提高道路资源的利用效率和道路的通行效率是缓解交通问题的重要途径. 本文以设计一种基于交通流量自适应控制的路口子系统为目标, 首先分析、研究了交通管控系统的相关算法和相关信息系统的现状, 在综合现有系统的基础上, 设计了一个交通管控系统的体系结构, 系统包括路口子系统、区域中心和信息与控制中心等3部分. 通过路口子系统实现交通流数据的实时采集和路口本地的智能控制; 设计并实现了路口子系统的检测方案, 路口子系统的数据采集和本地的智能控制是云数据存储, 以及实时的交通信息平台发布的关键, 同时对于实现多个路口的协调管控具有重要的意义.
2021, 30(12):116-122. DOI: 10.15888/j.cnki.csa.008221
摘要:针对目前安检场景中违禁品种类复杂、人工检查效率低易出错等问题, 文章提出一种名为Res152-YOLO的网络架构, 该架构基于YOLOv4 (You Only Look Once)优化目标检测网络. 为提高对X光图像中危险品的检测精度, Res152-YOLO采用ResNet-152网络代替原YOLOv4中的CSPDarknet-53网络, 将改进后的ResNet残差网络与YOLOv4网络连接. 实验中利用YOLOv4、Res152-YOLO等一系列网络在同一数据集上进行对比实验, 分别比较上述网络的损失曲线、对各类危险品的检测性能以及各网络的总体性能. 结果表明, Res152-YOLO网络在以上实验中性能优于原YOLOv4网络, 并且满足安检设备的帧率要求. 改进后的网络有效提高了安检的准确率, 能够消除一定的安全隐患.
2021, 30(12):123-127. DOI: 10.15888/j.cnki.csa.008201
摘要:监控设备大规模安装和应用带来了运维困难的问题. 本文研发了一个通用运维管理平台, 平台通过前端状态采集装置获取监控设备运行时产生的各种状态信息; 平台的运维管理系统汇总、存储状态信息, 并提供监控、统计、分析、报警等管理功能以支持运维业务; 平台的可视化展示子系统对状态信息进行可视化渲染呈现, 为系统运维提供智能化的支持. 状态采集装置模块化和冗余设计使得设备具有通用性、可扩展性、高可靠性和易维护性. 状态信息具有时序数据特征, 运维管理系统使用InfluxDB存储状态信息, 大幅度降低了存储空间需求, 并保证了数据查询和管理的性能需求. 基于InfluxDB的监控设备通用运维管理平台已在多个用户单位安装试用, 运行状态良好, 具有很好的经济社会效益和推广价值.
2021, 30(12):128-138. DOI: 10.15888/j.cnki.csa.008214
摘要:为了解决目前多目标跟踪算法在行人遮挡后无法再次准确跟踪的问题, 提出了一种融入注意力机制和改进卡尔曼滤波的多目标跟踪算法, 选用联合检测和重识别框架提取特征, 同时完成目标检测和重识别任务. 设计了并行支路注意力机制, 包括空间注意力和通道注意力两个部分, 每个部分都采用并行支路的方式完成池化和卷积操作. 在跟踪阶段, 本文提出了速度先验卡尔曼滤波, 实现对行人运动状态更精确的预测. 采用CUHK-SYSU数据集对算法进行训练, 并在MOT16数据集上做算法的验证和测试. 本算法的多目标跟踪准确度(MOTA)达到了65.1%, 多目标跟踪精确度(MOTP)达到了78.8%, 识别F1值(IDF1)达到62.3%. 实验表明, 提出的跟踪算法可以有效地提高跟踪的整体性能, 实现对目标的持续跟踪.
2021, 30(12):139-146. DOI: 10.15888/j.cnki.csa.008207
摘要:针对卫星星座健康状态管理文档涉及多项遥测参数的查询和计算、文档格式要求严格、编制工作量巨大、人工耗时较长的问题, 提出了一种卫星星座健康状态管理文档自动生成方法. 通过对文档中所含的基本数据类型进行归类分析, 制定配置文件存储规则, 对文档模板进行自定义设置, 并应用文档自动生成算法, 利用文档模板及相关参数生成数据汇总文档. 该方法能够实现文档编制过程中的知识复用和通用内容生成, 建立规范有效的文档编制流程.
2021, 30(12):147-154. DOI: 10.15888/j.cnki.csa.008211
摘要:在大规模网络环境下, 主机面临的安全威胁也愈发多样. 随着基于机器学习检测恶意文件的技术快速崛起, 极大的提升了对恶意软件的检测能力, 也迫使对手改变了攻击策略. 其中“Living off the land”策略通过调用操作系统工具或者执行任务的自动化管理程序来实现恶意行为. 威胁检测可以从父子进程的上下文中发现可疑行为, 将父子进程链及其派生的相关事件看作无向图, 应用监督学习XGBoost算法进行权重分配, 生成无向加权图. 最后使用社区发现算法从图中识别出更大的攻击序列, 在MIRTE ATT & CK仿真攻击数据集上进行验证.
2021, 30(12):155-162. DOI: 10.15888/j.cnki.csa.008200
摘要:区别于传统深度强化学习中通过从经验回放单元逐个选择的状态转移样本进行训练的方式, 针对采用整个序列轨迹作为训练样本的深度Q网络(Deep Q Network, DQN), 提出基于遗传算法的交叉操作扩充序列样本的方法. 序列轨迹是由智能体与环境交互的试错决策过程中产生, 其中会存在相似的关键状态. 以两条序列轨迹中的相似状态作为交叉点, 能产生出当前未出现过的序列轨迹, 从而达到扩充序列样本数量、增大序列样本的多样性的目的, 进而增加智能体的探索能力, 提高样本效率. 与深度Q网络随机采样训练样本和采用序列样本向后更新的算法(Episodic Backward Update, EBU)进行对比, 所提出的方法在Playing Atari 2600视频游戏中能取得更高的奖赏值.
2021, 30(12):163-171. DOI: 10.15888/j.cnki.csa.008210
摘要:为了提高嵌入式实时系统软件的质量和可靠性, 采用基于模型的软件测试方法是最有效的途径之一. 但是, 由于该类软件具有实时特性且十分复杂, 一般的模型通常缺乏对其实时特性以及软件行为的描述, 且需要丰富的专业领域知识才能将其建立的较为精确完整, 导致建模的难度和成本增加, 难以保证测试的充分性和有效性. 使用场景是用户与软件之间的交互实例, 详细描述了软件的系统行为而不关注其内部的复杂结构. 因此, 为了降低建模的难度, 本文基于使用场景的规范化表示Scene来构建模型, 并使用时间扩展EFSM模型来描述该类软件的实时特性; 为了保证所建模型的完整性, 本文设计了模型完整性评估准则, 通过验证模型迁移中约束条件的完整性来确定模型是否完整的表征了系统的行为; 针对不完整的模型, 根据约束条件设计了待补全迁移生成策略生成待补全迁移, 并通过动态模拟模型的可行迁移序列执行过程将其补全到模型中, 以提高模型的完整性. 最后, 本文针对4个嵌入式实时系统软件构建时间扩展EFSM模型并进行了一系列的实验. 实验表明, 本文提出的方法不仅有效的构建了模型, 而且能够将生成的待补全迁移有效补全到模型中, 进一步提高了模型的完整性.
2021, 30(12):172-179. DOI: 10.15888/j.cnki.csa.008203
摘要:进行基于表征学习的网络游戏流量识别研究. 首先, 由于流量识别领域公开数据集中缺乏游戏流量, 采集各类游戏流量, 并建立各种游戏与进程端口的映射关系, 基于该映射关系从采集的流量中过滤游戏流量, 扩展公开数据集; 利用深度学习中的表征学习模型, 对经过预处理的原始端到端游戏流量自动进行特征学习和特征选择; 最后用分类器进行游戏类别识别. 通过构建特征空间由卷积神经网络自学习原始信息的特征, 成功避免传统机器学习算法中流量数据集的二次处理导致的信息丢失以及流量分类模型对特征选择的依赖. 实验结果表明, 相比于原数据集的分类效果, 扩充后的数据集在神经网络模型上的分类准确率提高了5%, 游戏流量识别准确率达到92%, 识别性能明显提升.
2021, 30(12):180-186. DOI: 10.15888/j.cnki.csa.008223
摘要:针对基于接收信号强度指数(Received Signal Strength Indicator, RSSI)的多目标定位问题, 结合点估计与椭圆估计算法, 提出一种新的分布式多边融合定位(Distributed Multi-lateral Fusion Localization, DMFL)算法. 首先, 通过多边定位算法进行粗定位, 估计目标的大致位置. 其次, 基于区间分析理论在线获取泰勒展式高阶余项的边界, 并通过集员递归算法求解多目标定位问题. 最后, 通过实验和仿真验证该算法的定位性能. 结果表明, 在相同的节点布置条件下, 与最新的RSSI定位算法相比, 该算法的定位精度更高, 最大误差小于0.3 m, 并可提供保证包含目标真实位置的最优区域.
2021, 30(12):187-193. DOI: 10.15888/j.cnki.csa.008290
摘要:传统的协同过滤算法过于依赖用户之间的评分, 容易出现冷启动和数据稀疏性问题, 同时推荐结果单一, 针对以上问题, 本文提出了一种融合信任因子的多样化电影推荐算法. 首先对用户相似度计算方法进行改进, 引入用户间信任度关系和属性特征信息. 接着使用聚类方法把具有相同兴趣的用户划分在同一社群. 最后在评分时综合考虑用户活跃度对电影的推荐度, 引入惩罚因子, 从而为目标用户提供个性化、多样化的电影推荐. 实验结果表明, 本文提出的算法在推荐精度和多样性指标上均有所提高, 有较好的推荐效果.
2021, 30(12):194-201. DOI: 10.15888/j.cnki.csa.008220
摘要:人工智能促进了风控行业的发展, 智能风控的核心在于风险控制, 信贷违约预测模型是解决这一问题必须倚靠的手段. 传统的解决方案是基于人工和广义线性模型建立的, 然而现在通过网络完成的交易数据, 具有高维性和多重来源等特点, 远远超出了现有模型的处理能力, 对于传统风控提出了巨大的挑战. 因此, 本文提出一种基于融合方法的可解释信贷违约预测模型, 首先选取LightGBM、DeepFM和CatBoost作为基模型, CatBoost作为次模型, 通过模型融合提升预测结果的准确性, 然后引入基于局部的、与模型无关的可解释性方法LIME, 解释融合模型的预测结果. 基于真实数据集的实验结果显示, 该模型在信贷违约预测任务上具有较好的精确性和可解释性.
2021, 30(12):202-210. DOI: 10.15888/j.cnki.csa.008216
摘要:API相关的知识通常分散隐含在多个信息源, 如API参考文档、问答网站等非结构化的文本中, 不利于API的查询与检索. 为此, 提出一种多源信息融合的API知识图谱构建方法, 以提高API检索的效率. API参考文档从设计者角度描述了API的功能和结构, Stack Overflow问答网站从用户角度提供了API的使用目的及应用场景, 二者互为补充, 可共同为API查询与检索提供支持. 通过分析API参考文档, 抽取API和领域概念作为实体, 构建API和领域概念之间的关联关系; 利用Stack Overflow问答网站, 抽取问答QA和API概念作为实体, 构建问答QA和API概念之间的关联关系. 在此基础上, 将二者进行知识融合, 构建多源API知识图谱, 以实现基于知识图谱的API推荐. 为验证本文方法, 分别从知识抽取的准确性和推荐应用两方面对本文构建API知识图谱的有效性进行评估. 实验结果表明, 基于知识图谱的API推荐, 在推荐效果及效率上均有提升.
2021, 30(12):211-217. DOI: 10.15888/j.cnki.csa.008249
摘要:针对自动驾驶场景下三维点云车辆的识别和定位问题, 提出了一种基于注意力机制的三维点云车辆目标检测算法. 算法将稀疏无序的点云空间划分成等距规则的体素表示, 用三维稀疏卷积和辅助网络同步从所有体素中提取内部点云特征, 进而生成鸟瞰图. 但在将内部三维的点云特征转化为二维的鸟瞰图后, 通常会造成目标空间特征信息丢失, 使得最终检测结果以及方向性预估差. 为进一步提取鸟瞰图中特征信息, 提出了一种注意力机制模块, 其中包含两种注意力模型, 并对其采用首、中、尾的“立体式”布局结构, 实现对鸟瞰图中特征信息的放大和抑制, 最后使用卷积神经网络和PS-Warp变换机制对处理过后的鸟瞰图进行三维目标检测. 实验表明, 该算法在保证实时检测效率的前提下, 与现有算法相比, 具有更好的方向预估性以及更高的检测精度.
2021, 30(12):218-225. DOI: 10.15888/j.cnki.csa.008235
摘要:情绪识别作为人机交互的热门领域, 其技术已经被应用于医学、教育、安全驾驶、电子商务等领域.情绪主要由面部表情、声音、话语等进行表达, 不同情绪表达时的面部肌肉、语气、语调等特征也不相同, 使用单一模态特征确定的情绪的不准确性偏高, 考虑到情绪表达主要通过视觉和听觉进行感知, 本文提出了一种基于视听觉感知系统的多模态表情识别算法, 分别从语音和图像模态出发, 提取两种模态的情感特征, 并设计多个分类器为单特征进行情绪分类实验, 得到多个基于单特征的表情识别模型. 在语音和图像的多模态实验中, 提出了晚期融合策略进行特征融合, 考虑到不同模型间的弱依赖性, 采用加权投票法进行模型融合, 得到基于多个单特征模型的融合表情识别模型. 本文使用AFEW数据集进行实验, 通过对比融合表情识别模型与单特征的表情识别模型的识别结果, 验证了基于视听觉感知系统的多模态情感识别效果要优于基于单模态的识别效果.
2021, 30(12):226-234. DOI: 10.15888/j.cnki.csa.008225
摘要:本文基于祖冲之(ZUC)算法, 设计实现了一种可分离加密图像可逆水印算法, 算法中内容所有者先进行图像标记并生成位置图, 然后使用ZUC加密算法加密载体图像; 水印嵌入者得到加密图像后根据位置图将水印信息嵌在选中像素的第7位或第8位; 接收者根据加密密钥和嵌入密钥可以得到直接解密图像、水印信息和恢复图像. 算法使用ZUC算法对图像进行加解密, 很好地保证算法的安全性; 在嵌入水印信息之前对图像进行标记, 将水印信息嵌在选中的位置上; 接收者在利用相邻像素相关性基础上通过一种自适应差值算法实现水印提取和图像恢复, 保证恢复的载体图像和直接解密图像的质量. 实验表明所提出的算法具有较高的安全性并且达到可分离的效果, 同时恢复的载体图像和直接解密图像都具有较高质量.
2021, 30(12):235-242. DOI: 10.15888/j.cnki.csa.008194
摘要:车道线检测是无人驾驶任务中最重要的模块之一. 由于车道线具有独特的结构, 且容易受到各种各样复杂环境(比如光线、遮挡、模糊等)的影响, 因此车道线检测也是一项很具有挑战性的任务. 传统的卷积神经网络(CNN)难以直接学习到精细的车道线空间特征, 本文使用空间特征聚合模块对CNN提取的特征在空间维度进行融合增强, 为级联的车道线预测器提供了丰富的空间特征信息. 实验证明, 空间特征聚合模块通过聚合水平和垂直方向的特征图获取精细的全局信息, 在多种复杂环境下都能提升车道线检测算法的性能, 且不会影响检测的速度.
2021, 30(12):243-247. DOI: 10.15888/j.cnki.csa.008212
摘要:随着医疗数据信息化的发展, 电子病历在异地就诊以及医学研究方面的作用越来越大. 为解决异地就医时电子病历的交互问题, 拟提出一个跨组织的多医院间电子病历交互平台; 根据平台的业务流程, 提取各个组织的活动和资源元素; 针对交互过程中各组织的活动和资源之间的关系, 结合多色集合和围道矩阵分别从不同组织的不同视角提取各组织的外部交互活动和交互资源; 同时, 对业务流程进行研究并提出相应的形式化描述模型.
2021, 30(12):248-254. DOI: 10.15888/j.cnki.csa.008202
摘要:针对关系型知识蒸馏方法中教师网络与学生网络的层数差距过大导致蒸馏效果下降的问题, 提出一种基于关系型蒸馏的分步神经网络压缩方法. 该方法的要点在于, 在教师网络和学生网络之间增加一个中间网络分步进行关系型蒸馏, 同时在每一次蒸馏过程中都增加额外的单体信息来进一步优化和增强学生模型的学习能力, 实现神经网络压缩. 实验结果表明, 本文的方法在CIFAR-10和CIFAR-100图像分类数据集上的分类准确度相较于原始的关系型知识蒸馏方法均有0.2%左右的提升.
2021, 30(12):255-261. DOI: 10.15888/j.cnki.csa.008215
摘要:用户在使用现有的搜索引擎时, 常因为无法构造清晰准确的查询词而导致检索效果不佳, 传统的查询推荐方法没有充分考虑用户行为的关联性, 导致了查询推荐的结果不准确. 本文提出了一个新的查询推荐模型, 即基于点击模型和网络嵌入的查询推荐模型. 该模型首先通过点击链式模型嵌入用户的历史检视行为和点击行为, 并通过注意力机制衡量查询和返回文档的相关性; 然后利用属性异构网络来获取复杂异质网络结构中的潜在语义信息; 最后通过多头注意力捕获多个空间的复杂信息, 并利用多任务学习来做评分预测. 在搜狗实验室提供的公开查询日志上的实验结果表明, 我们的模型在查询建议的鉴别式任务和生成式任务中均优于基线模型.
2021, 30(12):262-267. DOI: 10.15888/j.cnki.csa.008227
摘要:针对企业命名实体的识别任务的过程复杂、学科交叉、实时性差等难点, 提出了一种基于并行子空间优化的方法. 首先, 建立系统的目标-约束方程完成系统级优化; 其次, 再通过构建文字检测、文字识别两级模型, 并考虑现存不同模型的优缺点进行模型选择的方法对涉及学科进行并行优化; 随后, 再使用图像阈值、灰度化、霍夫变换等算法构建两级模型的衔接; 最后, 通过仿真实验, 验证了本文方法相比其他两级文字检测识别模型的识别准确率提高了9%, 推理速度提升约20%.
2021, 30(12):268-272. DOI: 10.15888/j.cnki.csa.008196
摘要:短文本匹配是自然语言处理领域中的一个核心问题, 可应用于信息检索、问答系统、复述问题等任务. 过去的工作大多在提取文本特征时只考虑文本内部信息, 忽略了两个文本之间的交互信息, 或者仅进行单层次交互. 针对以上问题, 提出一种基于Transformer改进的短文本匹配模型ISTM. ISTM模型以DSSM为基本架构, 利用BERT模型对文本进行向量化表示, 解决Word2Vec一词多义的问题, 使用Transformer编码器对文本进行特征提取, 获取文本内部信息, 并考虑两个文本之间的多层次交互信息, 最后由拼接向量推理计算出两个文本之间的语义匹配度. 实验表明, 相比经典深度短文本匹配模型, 本文提出的ISTM模型在LCQMC中文数据集上表现出了更好的效果.
2021, 30(12):273-278. DOI: 10.15888/j.cnki.csa.008184
摘要:传统的KNN算法存在分类效率低等缺点. 针对这些缺点, 本文提出一种高效的结合多代表点思想的加权KNN算法, 利用变精度粗糙集上下近似区域的概念, 结合聚类算法生成代表点集合构造分类模型, 再运用结构风险最小化理论优化分类模型并对影响分类模型的因素进行分析. 分类过程中根据测试样本与各代表点的相似度, 得到测试样本的相对位置. 其中属于样本点下近似区域的测试样本可直接判断其类别. 若测试样本在其他区域, 则根据测试样本与各代表点的相对位置对各代表点覆盖范围内的样本进行加权后判断测试样本的类别. 在文本分类领域的数据集上进行实验, 结果表明该算法能有效的提高分类模型的性能.
2021, 30(12):279-287. DOI: 10.15888/j.cnki.csa.008181
摘要:机组排班是航空公司运营计划非常重要的一个环节, 合理的机组排班可以为航空公司省下一大笔机组成本支出, 从而增加航空公司的收益. 由于机组排班过程涉及大量的复杂约束, 属于NP难问题, 因此优化求解困难. 本文提出了一种基于可满足性模理论(Satisfiability Modulo Theories, SMT)的航空公司机组排班问题的优化求解方法, 将机组排班过程中的各种约束转化为一阶逻辑公式, 设立求解目标为最小化成本和最大化机组利用率, 将问题转化为求在给定逻辑公式可满足情况下的最优解, 并利用SMT求解器Z3进行求解. 实验表明, 本文的算法能有效的求解一定规模航班计划的机组排班问题, 给航空公司带来一定的收益.
2021, 30(12):288-298. DOI: 10.15888/j.cnki.csa.008253
摘要:针对含有自动引导小车(Automated Guided Vehicle, AGV)的离散化车间物流调度问题, 以最小化物流任务时间惩罚成本和最小化运载小车的总行驶距离为优化目标, 构建离散化车间多目标物流调度优化模型, 设计一种基于Pareto寻优的多目标混合变邻域搜索遗传算法(VNSGA-II). 以遗传算法为基础, 通过使用NSGA-II的Pareto分层和拥挤度计算方法评估种群优劣实现多目标优化, 为了提高算法的寻优能力, 避免算法陷入局部最优, 通过添加保优记忆库对精英个体进行保护, 并利用变邻域搜索算法在搜索过程中的局部寻优能力, 针对本文模型特点, 设计6个随机邻域结构, 来达到算法求解最优值的目标. 并提出了基于关键AGV小车的插入邻域和基于关键物流任务的交换邻域调整策略以进一步降低成本. 最后, 以某离散车间物流调度为实例, 分别使用VNSGA-II、带精英策略的快速非支配排序遗传算法II (Nondominated Sorting Genetic Algorithm II, NSGA-II)和强Pareto进化算法(Strong Pareto Evolutionary Algorithm 2, SPEA2)对问题进行求解, 计算结果表明, VNSGA-II能得到更好的Pareto解集, 验证了算法的有效性和可行性.
2021, 30(12):299-307. DOI: 10.15888/j.cnki.csa.008224
摘要:一种基于节点负载的数据动态分区系统, 主要考虑节点CPU、内存、带宽负载情况, 首先采用二次平滑法预测节点的负载, 再结合AHP和熵值指标权重法得到每个节点的处理能力, 最后针对不同应用场景动态地调整系统的负载均衡性, 提高应用的响应速度; 该系统主要包括负载监测采集、预测、数据预分区、数据迁移等模块. 由于分布式环境存在节点资源的异构性, 为了数据分析计算过程中减少节点之间数据的传输, 充分利用节点计算资源, 通过负载均衡性提高应用分析的并行计算速度. 为此, 本文提出一种基于节点负载的数据动态分区机制和策略来改善系统负载均衡性及提高应用的响应速度, 辅助相关工作人员完成决策. 本论文结合Spark和Elasticsearch集成的数据分析应用场景进行测试.
2021, 30(12):308-316. DOI: 10.15888/j.cnki.csa.008230
摘要:社会网络数据的发布可能导致用户隐私被泄露, 例如用户的身份信息可能被恶意攻击者通过分析网络中节点的度数识别出来, 针对这个问题提出一种基于节点平均度的k-度匿名隐私保护方案. 方案首先利用基于平均度的贪心算法对社会网络节点进行划分, 使得同一分组中节点的度都修改成平均度, 从而生成k-度匿名序列; 然后利用优先保留重要边的图结构修改方法对图进行修改, 从而实现图的k-度匿名化. 本方案在生成k-度匿名序列时引入平均度, 提高了聚类的精度, 降低了图结构修改的代价. 同时, 由于在图结构修改时考虑了衡量边重要性的指标—邻域中心性, 重要的边被优先保留, 保持了稳定的网络结构. 实验结果表明, 本方案不仅能有效地提高网络抵抗度攻击的能力, 还能极大降低信息损失量, 在保护用户隐私的同时提高了发布数据的可用性.
2021, 30(12):317-325. DOI: 10.15888/j.cnki.csa.008268
摘要:为进一步简化增值税发票识别流程和和提高识别效率, 提出了一种基于HRNet和YOLOv4的增值税票面信息结构化识别的方法. 首先利用HRNet进行增值税发票关键点检测, 进行增值税发票对齐; 其次利用YOLOv4进行发票元素的检测; 然后通过CRNN对发票元素进行文本识别; 最后形成结构化数据. 在业务数据集中的实验表明, 检测准确率在0.5 mAP下达到75.7, 检测速度达到12.85 fps, 元素识别率ECR达到69.30%, 实验结果表明算法能有效简化识别流程, 提高识别准确率, 在实时性要求较高和业务噪声复杂的增值税票据识别中有较好适应性和广泛应用前景.
2021, 30(12):326-331. DOI: 10.15888/j.cnki.csa.008173
摘要:为快速构建大尺度、高质量中国人脸识别数据集, 本文提出一种半自动构建方法. 相较于现有的数据集构建方法, 该方法可以快速地构建大尺度中国名人人脸数据集, 将此数据集命名为CCFace (Chinese Celebrities Face). CCFace数据集包含431个人物,
2021, 30(12):332-338. DOI: 10.15888/j.cnki.csa.008262
摘要:自然场景乌金体藏文文本信息作为高度浓缩的高层语义信息, 不仅具有较大的研究和实用价值, 而且可以用于协助藏文场景文本理解领域的研究. 目前针对自然场景下乌金体藏文的检测与识别的相关研究甚少, 本文在人工收集的自然场景乌金体藏文图像数据集的基础上, 对比了目前常见的文字检测算法在自然场景乌金体藏文上的检测性能以及在不同特征提取网络下基于序列的文字识别算法CRNN在自然场景乌金体藏文图像数据集上的识别准确率并分析了在314张真实自然场景下乌金体藏文识别出错的特殊例子. 实验表明本文在文字检测阶段采用的可微分的二值化网络DBNet在测试集上具有更好的检测性能, 该方法在测试集上的准确率、召回率、F1值分别达到了0.89、0.59、0.71; 在文字识别阶段采用MobileNetV3 Large作为特征提取网络时, CRNN算法在测试集上的识别准确率最高, 达到了0.4365.
2021, 30(12):339-344. DOI: 10.15888/j.cnki.csa.008189
摘要:卷缩轮(Autonomic Nerve Wreath, ANW)是虹膜诊断学中一个重要的诊断标志. 而如何提取易受光斑、色素斑及睫毛等干扰影响的卷缩轮在目前仍是一个难题. 本文提出了一种基于遗传算法的虹膜卷缩轮提取方法. 该方法以区域点密度作为适应度, 并通过轮盘赌来选择最优个体, 比较相邻两染色体间基因适应度来进行父本的选择. 实验结果表明提出的方法能有效避免光斑、色素斑及睫毛等信息的干扰, 提高了算法的搜索效率和准确率, 提取出的卷缩轮与实际的卷缩轮较一致.
2021, 30(12):345-349. DOI: 10.15888/j.cnki.csa.008185
摘要:射频识别系统中电子标签与读卡器之间基于无线方式交互数据, 因无线方式固有的开放性, 使得二者间交互数据易被第三方人员获取, 为确保数据安全性, 文中设计一种轻量级的认证协议. 文中选取轻量级的伪随机函数作为数据加密算法, 能够使得射频识别系统整体计算量降低, 且同时确保交互数据的安全性; 伪随机函数可以对任意输入长度参数进行运算, 使其输出结果长度相同. 通过安全角度、计算量角度、门电路角度综合分析文中协议, 表明协议具备较高安全需求的同时, 整体计算量优于其他对比协议.
2021, 30(12):350-354. DOI: 10.15888/j.cnki.csa.008197
摘要:为解决非接触式睡眠监测系统中混合信号的可靠获取以及生理特征参数的有效分离和识别等问题, 采用压电薄膜传感器获取人体睡眠状态下压力信号, 并采用电荷放大电路和信号调理电路进行实时采集; 信号处理过程中先利用经验小波变换方法分离心冲击(BCG)和呼吸信号等单一模态分量, 然后使用K-means算法对分离出的心冲击信号中不同类型的波峰聚类, 进而通过平均心跳周期计算心率. 实验结果表明, 所设计的监测系统具有较强的自适应性, 能有效提取呼吸和心跳信号.
2021, 30(12):355-359. DOI: 10.15888/j.cnki.csa.008167
摘要:针对三峡升船机船厢结构复杂, 设备巡视路线难以选择的问题, 以升船机船厢巡视路线为研究对象, 将设备巡视点检路线规划转换为TSP旅行商问题. 通过巡视路线无向加权图及点位空间坐标, 建立升船机设备巡视点检点位空间结构模型. 结合蚁群算法在Matlab软件中分别计算出白班及中班的最佳巡视路线. 实验结果表明, 基于蚁群算法计算的最佳巡视路线符合三峡升船机设备巡视要求.
2021, 30(12):360-367. DOI: 10.15888/j.cnki.csa.008295
摘要:污水处理工艺是针对城市生活污水和工业废水的处理问题所提出的一套完整的解决方案, 并且被广泛应用于各个领域. 城市污水处理工艺应根据处理规模、水质特性、受纳水体的环境功能及当地的实际情况和要求, 在工艺技术特性与经济成本的衡量中选择优化方案确定, 其可以看作是一种特殊形式的多参数优化问题: 首先统计污水处理的工艺方法并设计污水处理工艺知识库; 其次将各工艺的参数和环境信息作为输入, 以工艺知识库作为支撑, 依托设定好的智能算法自动生成由工艺知识库中的工艺组合而成的方案, 方案包括各工艺模块的顺序、工艺内部组件的尺寸、预测运行成本以及处理效果. 本文提出了使用messy遗传算法对污水处理工艺流程进行选优推荐, 将工艺序列的总成本的倒数作为适应度, 根据工艺知识库与优化目标, 自动生成在多个污染物指标达标的情况下成本最低的优化方案. 通过实验验证, messy遗传算法能够在工艺序列长度变化的情况下实现方案的高效准确推荐.