2022, 31(3):1-8. DOI: 10.15888/j.cnki.csa.008415
摘要:由于流程挖掘技术的快速发展, 流程挖掘算法种类增加迅速, 已有的算法研究文章介绍已不全面. 针对这一情况对迄今为止的流程挖掘主要算法进行系统性的分析总结. 首先对流程挖掘算法现状进行总体分析, 接着根据算法特性将流程挖掘算法分为传统的流程挖掘算法和基于计算智能和机器学习技术的流程挖掘算法两大类, 简要介绍其中代表性算法的基本思想和相关步骤, 最后比较了各类算法的优势和不足. 其中关于算法的分类和总结有助于初学者梳理流程挖掘领域相关算法知识, 而对发展现状和算法比较的分析则可以启发研究人员有待突破的方面.
2022, 31(3):9-18. DOI: 10.15888/j.cnki.csa.008361
摘要:虚拟现实中自我中心距离的准确认知、指点光标的合理设计对用户的交互体验及任务执行效率起着至关重要的作用. 结合费茨定律在三维指点任务中的拓展研究, 以指点光标类型、自我中心距离、目标大小及方位角作为变量, 展开虚拟空间指点交互实验研究. 首先提出指点光标、自我中心距离、目标大小及方位角的不同对自我中心距离认知准确性及目标指点速度存在影响等6个假设. 其次通过分析实验数据所得目标指点准确度及目标指点时间, 讨论自我中心距离认知准确度与目标指点速度的变化规律. 实验结果表明, 在虚拟现实中, 指点光标、目标大小对自我中心距离认知准确度、目标指点速度均有显著性影响, 目标方位角、自我中心距离仅对目标指点速度有显著性影响; 指点光标与自我中心距离对自我中心距离认知准确度及目标指点速度均有双向交互效应. 两种指点光标的目标指点时间均与难度系数线性正相关, 即符合费茨定律在三维指点任务中的扩展模型. 该结论揭示了自我中心距离认知的影响因素, 能够有效指导虚拟现实中交互方式及三维指点任务的设计.
2022, 31(3):19-29. DOI: 10.15888/j.cnki.csa.008376
摘要:为解决图像语义分割任务中面对的分割场景的复杂性、分割对象的多样性及分割对象空间位置的差异性问题, 提高语义分割模型的精度, 提出基于稠密扩张卷积的双分支多层级语义分割网络(double branch and multi-stages network, DBMSNet). 首先采用主干网络提取输入图像的4个不同分辨率的特征图(De1、De2、De3、De4), 其次采用特征精炼(feature refine, FR)模块对De1和De3这两个特征图进行特征精炼处理, 特征精炼处理之后的输出分支经过混合扩张卷积模块(mixed dilation module, MDM)编码空间位置特征, De4分支采用金字塔池化模块(pyramid pooling module, PPM)编码高级语义特征, 最后将两个分支进行融合, 输出分割结果. 在数据集CelebAMask-HQ和Cityscapes中进行实验, 分别得到mIoU精度为74.64%、78.29%. 结果表明, 本文方法的分割精度高于对比方法, 且具有更少的参数量.
2022, 31(3):30-37. DOI: 10.15888/j.cnki.csa.008372
摘要:从脑电信号中检测P300电位是实现P300脑机接口的关键. 由于不同个体间的脑电信号存在较大差异, 现有的基于深度学习的P300检测方法均需要大量的脑电数据来训练模型. 对于小样本的患者数据, 至今仍没有令人满意的解决方案. 本文提出了一种改进的适用于小样本P300脑电信号检测的原型网络方法. 该模型通过卷积神经网络提取特征, 结合度量方法余弦相似度, 实现P300脑电信号的分类和识别. 在第三届国际脑机接口竞赛的数据集II上进行测试和比较, 取得了平均字符识别率达95%的良好识别性能. 进一步地, 我们把该方法应用于小样本的意识障碍患者意识状态检测中. 在基于命令遵循的意识状态检测实验中, 5位正常人的准确率均为100%, 10位意识障碍患者的意识状态检测结果与临床评估结果相匹配. 研究证明该模型对改进应用于小样本的P300脑机接口系统具有重要意义.
2022, 31(3):38-47. DOI: 10.15888/j.cnki.csa.008343
摘要:针对用户跨域访问数据资源的数据共享场景, 为了保证用户的身份合法性以及安全通信, 提出了一种基于区块链的生物特征和口令双因子跨域认证与密钥协商方案. 用户生物特征通过模糊提取技术转换为生物密钥和生物公开信息参与认证, 避免生物特征被泄露. 包含生物密钥和生物公开信息的用户身份信息存储在区块链账本中, 保证身份信息一致以及不被篡改. 认证域的认证服务器在跨域认证时无须与用户注册域的认证服务器交互, 而是直接通过查询区块链账本获取用户身份信息, 完成对跨域访问用户的认证. 安全性和性能分析表明, 方案所提协议能够以更少的计算开销, 提供更强的安全性.
2022, 31(3):48-55. DOI: 10.15888/j.cnki.csa.008377
摘要:面对当前日益庞大的教育大数据, 如何在海量数据中高效、准确地提取出高价值的知识, 以满足个性化教学需求, 已成为当前智慧教育的一个研究热点. 作为一种可视化分析技术, 知识图谱可有效构建和挖掘知识及知识间的相互联系, 现已成功应用于诸多领域. 而图嵌入技术的引入, 则有利于提升大数据背景下知识图谱的处理效率. 针对个性化教育的知识处理需求, 首先介绍了知识图谱与图嵌入算法的基本概念, 并从向量平移、基于张量因式分解和基于神经网络等3个方面, 介绍基于三元组的表征学习模型. 然后, 从7种应用类型的角度, 综述知识图谱与图嵌入技术在个性化教育领域中的研究现状. 最后, 总结全文并给出未来的研究展望.
2022, 31(3):56-64. DOI: 10.15888/j.cnki.csa.008362
摘要:遥感变化检测旨在通过比较同一位置不同时期遥感影像以检测出存在显著或者潜在的遥感变化的区域. 目前, 大多数相关工作聚焦于正时序变化检测上, 对反时序变化检测表现较差. 为了避免时序对变化检测带来影响, 通常的做法是将正时序和反时序的数据都囊括构成数据集. 然而, 这会导致模型训练时间更长. 本文提出一种双通道孪生网络, 在保证模型精度的同时实现高效的模型训练. 首先, 本文将现有模型改造为对称的结构, 使之既能仅采用原始正时序数据集快速训练, 又能同时学习正时序和反时序变化的特征信息. 然后, 本文提出了双通道孪生输入以获取更加鲁棒的特征. 最后, 本文加入了双通道孪生融合对特征进行精炼. 在Onera Satellite Change Detection Sentinel-2数据集上, 所提出的模型, 在精度和训练有效性都超过了现有模型. 进一步的消融实验验证了本文模型中两个模块的性能.
2022, 31(3):65-74. DOI: 10.15888/j.cnki.csa.008399
摘要:随着国家管网建设的不断发展, 系统业务与灾害数据信息规模大幅增长, 同时为防范长距离管道运输过程中易受地质灾害影响发生事故的发生, 开发基于微服务框架的管道地质灾害监测预警系统. 系统采用前后端分离开发模式, 具有高并发、低耦合、高可用、易扩展等特点, 集观测、上报、研究、风险评估、预报预警功能于一体. 目前系统长期稳定运行于国家管网分公司, 有效解决灾害预警、灾害处理、灾害信息管理等问题, 为长距离运输管道行业提供了有效解决方案.
2022, 31(3):75-84. DOI: 10.15888/j.cnki.csa.008357
摘要:智能轮椅能有效提高行动不便者在日常生活中的活动能力和自理能力, 但目前智能轮椅的控制方案往往存在着控制动作困难, 响应速度慢等难题. 针对这一情况, 本文结合现有生物电机械接口技术和设备控制技术, 提出一套基于脑电信号和肌电信号协同控制的设备控制方案, 该方案允许用户仅通过4种简单的头部动作, 即使用眨眼、左咬合、右咬合和专注这4个动作控制设备前进、后退、停止、左右转向和速度状态. 实验结果表明, 该套控制方案能够有效应用于控制智能小车进行日常运动功能, 且具有较高的控制准确率和较快的控制响应速度.
2022, 31(3):85-94. DOI: 10.15888/j.cnki.csa.008341
摘要:传统的大数据交易集市以促成大数据交易为主, 类似普通商品交易平台, 提供的主要功能偏重于数据目录管理、交易过程的事务管理. 这种方式存在诸多弊端, 除公开数据外, 各数据所有者考虑到数据安全、隐私或数据被滥用, 或分享数据损害自身竞争优势, 仍对数据交换持谨慎态度, 同时各企业对不同行业、多领域存在的数据了解有限, 制约了数据的交换, 仅靠数据目录无法完全达到能力输出的目的, 为有效解决上述弊端, 本文设计了一种大数据交易集市平台, 系统采用Spring MVC构建后台整体架构, 集成了Redis、MyBatis等技术, 向数据机构提供公用的Hive集群保存数据集, 并实现了数据集购买, 查看样本数据, 用户筛选数据集内容等功能.
2022, 31(3):95-102. DOI: 10.15888/j.cnki.csa.008382
摘要:网络课程C语言编程学习中, 师生互动性差、教学效率低, 学生难以凭借自身能力解决编程中常见的代码缺陷问题. 为了更好帮助学生解决学习中的难题, 辅助老师达到教学目的, 研究一款代码缺陷检测辅助学生编程实践系统. 该系统首先对易犯的代码缺陷分类, 分析编译器不易检测的语法、词法和语义缺陷; 然后构建智能分析器, 集成多种检测工具, 在系统中存储知识规则集合并扩展常见代码缺陷抽象模式; 最后检测代码并给出错误报告和修改意见, 通过配合学生模型辅助学生编程学习. 实验结果表明: 该系统能成功检测出常见代码缺陷并辅助学生编程实践.
2022, 31(3):103-112. DOI: 10.15888/j.cnki.csa.008396
摘要:良好的学习动机对于明确学习目标、端正学习态度、激发学习潜能等方面都起到至关重要的作用. 现有的增强学习动机的策略或单从促进同伴间的互动来考虑, 或单从游戏化教学活动来考虑, 或将这两种措施简单相结合, 均存在局限性. 鉴于此, 本文通过综合考虑同伴互动中的竞争与合作两种模式, 并结合丰富游戏化的机制, 设计了一种新颖的游戏化同伴学习策略, 最终基于该策略开发了一个游戏化同伴学习系统. 该系统能够创建一个供学生使用的游戏化在线协作答题环境. 在该环境中, 系统首先根据学生的历史答题记录将学生划分等级, 学生从而可以根据等级收益规则自由组队并进行协作答题. 系统最后根据组队双方学生的等级和答题结果计算答题收益并更新双方学生等级. 教学实践表明本文提出的游戏化同伴学习系统能够达到增强学生学习动机的目的.
2022, 31(3):113-121. DOI: 10.15888/j.cnki.csa.008333
摘要:针对现有实验设计方法难以对复杂系统进行高效实验设计的问题, 本文提出了一种基于变分自编码器的实验设计方法, 首先利用实验历史记录数据训练变分自编码器将复杂的实验样本空间编码到一个较为简单的隐变量空间, 然后在该隐变量空间里进行取样, 最后通过解码器还原产生新的实验样本, 完成实验设计. 通过对比本文方法与数种基准实验设计方法的结果在拟合直航鱼雷命中模型时的表现情况, 表明在取相同样本数的情况下, 本文方法可以优化实验设计, 提高实验效率.
2022, 31(3):122-128. DOI: 10.15888/j.cnki.csa.008327
摘要:本文分析了三维地理信息系统和大屏展示系统的现状及特点, 以通用性的综合展示平台为例, 选取南宁市数字孪生可视化展示为主题, 从空间信息场景设计、表达对象选取、页面布局、平台色彩设计、符号设计、图表设计、动效设计的角度切入, 提出了基于三维GIS的大屏可视化策略. 并基于上述策略, 对该类型平台搭建的系统架构和关键技术点展开阐述, 最终实现平台的研发, 以期为同类型可视化案例提供参考.
2022, 31(3):129-135. DOI: 10.15888/j.cnki.csa.008367
摘要:DNS (domain name system)作为网络的重要基础服务设施, 是终端访问互联网必要的一环. 近年来, 越来越多尝试将用户通过DNS系统引入恶意服务器的攻击, 对互联网安全产生重要威胁. 防范与化解针对恶意域名或IP的访问, 如钓鱼网站、垃圾邮件、勒索软件、色情网站等, 无论是对于运营商还是网络监管机构都具有重要的现实意义. 论文阐述RPZ (response policy zones)的工作原理, 构建DNS的RPZ安全防护系统, 再进行相关核心软件的配置, 最后通过实验验证, 检验系统针对恶意域名和IP的防护效果.
2022, 31(3):136-142. DOI: 10.15888/j.cnki.csa.008390
摘要:针对移动机器人定位系统中单一传感器定位精度低与环境地图的重要性问题, 提出了一种基于多传感器融合的移动机器人定位方法. 首先, 在未知环境下, 分别利用单一里程计, 扩展卡尔曼滤波(extended Kalman filter, EKF)算法融合里程计、惯性测量单元(inertial measurement unit, IMU)进行定位, 实验表明他们存在累积误差; 然后, 在已知环境下, 利用自适应蒙特卡洛定位(adaptive Monte Carlo localization, AMCL)算法, 融合里程计、IMU、激光雷达进行定位. 最后, 实验结果表明, 该方法可以对累积误差进行校正, 相较于未知环境下的单一里程计定位与EKF算法融合定位, 误差均值分别减少了68%、30%, 验证了所提出定位方法的有效性以及环境地图的重要性.
2022, 31(3):143-149. DOI: 10.15888/j.cnki.csa.008384
摘要:由于现在缺乏多语言教学中的主观题自动评分, 针对这一问题提出了一种基于孪生网络和BERT模型的主观题自动评分系统. 主观题的问题文本和答案文本通过自然语言预处理BERT模型得到文本的句向量, BERT模型已经在大规模多种语言的语料上经过训练, 得到的文本向量包含了丰富的上下文语义信息, 并且能处理多种语言信息. 然后把问题文本和答案文本的句向量再通过深度网络的孪生网络进行语义相似度的计算, 最后连接逻辑回归分类器, 完成主观题的自动评分. 实验所使用数据集由Hewlett基金提供的英文数据集以及翻译后的中文数据集, 并以二次加权 Kappa系数作为模型的评估指标. 实验结果表明, 对比其他基准模型, 基于孪生网络和BERT模型的自动评分系统在各个数据子集得到的结果最好.
2022, 31(3):150-158. DOI: 10.15888/j.cnki.csa.008363
摘要:蜉蝣算法是一种受蜉蝣飞行及交配行为启发的新型群智能优化算法, 具有良好的寻优性能, 但其在求解高维复杂问题时依然存在因失效蜉蝣而影响算法效率的问题. 鉴于此, 提出一种偏移进化蜉蝣算法(migration evolutionary mayfly algorithm, MEMA). 针对蜉蝣种群进行个体能力评价, 剔除种群中生命周期较长但进化能力较弱的个体, 同时以其为据点进行全局位置偏移, 以获取新生个体. 对新个体进行指向性动态进化训练, 从而提升种群整体优化能力. 最后在Matlab环境下, 随机抽取了6个benchmark测试函数设计仿真实验以验证MEMA算法的有效性, 实验结果表明, 相比于其他5种对比算法, MEMA算法在低维及高维函数测试中均能更好地实现最优解搜索, 在收敛精度、收敛速度以及鲁棒性等方面均具备一定优势.
2022, 31(3):159-168. DOI: 10.15888/j.cnki.csa.008359
摘要:针对油田作业现场监控视频中的工人安全着装小目标检测效果较差的问题, 提出了改进YOLOv5的油田场景规范化着装检测方法Cascade-YOLOv5 (C-YOLOv5). 首先搭建YOLO-people与YOLO-dress级联的小目标检测网络, 定位行人目标, 然后裁剪出行人区域并进行尺度变换, 最后对行人进行安全着装检测; 为了充分融合浅层与深层特征信息, 在各级网络中使用4个不同尺度的卷积特征层来预测待检测目标. 最后在原始图像中用不同颜色的框标出行人以及行人的着装部件类别, 从而判定行人是否着装规范. 实验证明, 相比原始YOLOv5算法, C-YOLOv5方法不仅满足实时性的要求, 而且检测的mAP提升了2.3%. 同时, 融合了深浅层信息的改进方法有效地增强了特征的表征能力, 提高了小目标的检测精度.
2022, 31(3):169-177. DOI: 10.15888/j.cnki.csa.008370
摘要:5G通讯技术的迅猛发展使工业物联网得到了全面提升, 工业物联网数据规模将越来越大、数据维度也越来越高, 如何高效利用流聚类进行工业物联网数据挖掘工作是一个亟需解决的问题. 提出了一种基于工业物联网数据流自适应聚类方法. 该算法利用微簇之间的高密性, 计算各微簇节点的局部密度峰值以自适应产生宏簇数; 采用引力能量函数对微集群进行递归在线更新; 并且去除边缘相交微簇之间的计算以达到降低维护宏簇所需的计算量. 理论分析和实验对比表明所提出的方法跟当前主流的流聚类算法相比有着更高质量的聚类效果.
2022, 31(3):178-187. DOI: 10.15888/j.cnki.csa.008407
摘要:针对当前教育资源共享安全性低和身份认证困难的问题, 提出了一种区块链技术与无证书签名相结合的可跨域身份认证方案, 将无证书签名技术的高安全性、无密钥托管问题等优点应用到区块链的分布式网络中, 实现了身份认证过程中用户安全、跨域认证、恶意用户可追溯、注册信息不可篡改. 首先, 基于教育区块链与无证书签名的身份认证方案是建立在区块链架构下的身份认证模型, 设计了域内区块链和跨域区块链, 建立了跨域认证的模型. 其次, 利用无证书签名以及陷门哈希函数, 确保认证过程用户安全以及恶意用户可追溯. 通过分析, 本方案满足相互认证、用户身份安全等安全属性. 与其他方案相比, 用户计算代价小, 安全性更高, 更能满足用户端算力有限的计算环境.
2022, 31(3):188-196. DOI: 10.15888/j.cnki.csa.008393
摘要:智能汽车的发展对高精度定位需求日益显现. 针对汽车在城市建筑群、立交桥等特殊环境下, 可见GPS卫星数量下降、车载GPS和惯性测量单元(inertial measurement unit, IMU)组合定位系统中IMU产生积累误差导致不能精确定位问题, 本文提出一种基于无迹卡尔曼滤波(unscented Kalman filter, UKF)的超宽带(ultra wide band, UWB)和GPS融合定位算法. 通过构建系统方案, 优化UWB模块数据解析算法, 构建UWB和GPS非线性融合系统模型, 分析算法复杂度, 将算法写入控制器进行实时滤波, 对不同算法下的噪声误差和方差进行数据分析. 实验表明基于无迹卡尔曼滤波的UWB和GPS融合定位算法实时性好、解算精度高、无滤波发散现象, 可满足车辆在城市特殊环境下高精度定位需求.
2022, 31(3):197-202. DOI: 10.15888/j.cnki.csa.008375
摘要:传统供应链服务的发展面临诸多痛点, 包括造假风险、企业信息孤岛、核心企业信用不能跨级传递、违约风险高等. 针对供应链企业信息孤岛以及非法用户对网络资源的非授权访问等问题, 本文提出了一种基于智能合约和企业信用的访问控制模型, 用以保障果品质量溯源系统的数据安全性和完整性. 该模型将RBAC和ABAC相结合, 以智能合约作为底层技术, 引入企业信用值作为跨域访问的参考属性, 利用主体属性与信用值作为决策依据实现域内与域间的访问控制. 实验结果表明了本文提出的访问控制模型的有效性.
2022, 31(3):203-211. DOI: 10.15888/j.cnki.csa.008392
摘要:针对传统的基于多图谱的医学图像分割过程中的相似度加权融合的方法没有考虑图谱集的干扰性和冗余性的不足, 提出一种基于两步图谱选择策略的脑MR图像分割方法. 该方法首先采用一种基于最小角回归的方法进行图谱粗选择, 其次则采用基于豪斯多夫距离的以目标为导向的图谱精选择. 粗选择方法可以在总体上来寻找和目标图像较为相似的图谱, 删除某些无效变量, 降低图谱集的干扰性和冗余性. 精选择方法更加注重于目标组织本身的相似度计算, 并且得到的相似性结果不受目标组织尺寸和目标组织位置的影响. 实验结果表明, 相比于传统的基于矩形区域相似度计算的单步图谱选择方法, 该方法具有更高的鲁棒性和准确性.
2022, 31(3):212-219. DOI: 10.15888/j.cnki.csa.008417
摘要:机器阅读理解与问答一直以来被认为是自然语言理解的核心问题之一, 要求模型通过给定的文章与问题去挑选出最佳答案. 随着 BERT 等预训练模型的兴起, 众多的自然语言处理任务取得了重大突破, 然而在复杂的阅读理解任务方面仍然存在一些不足, 针对该任务, 提出了一个基于回顾式阅读器的机器阅读理解模型. 模型使用 RoBERTa 预训练模型对问题与文章进行编码, 并将阅读理解部分分为词级别的精读模块与句子级别的泛读模块两个模块. 这两个模块以两种不同的粒度来获取文章和问题的语义信息, 最终结合两个模块的预测答案合并输出. 该模型在 CAIL2020 的数据集上综合F1值达到了66.15%, 相较于RoBERTa模型提升了5.38%, 并通过消融实验证明了本模型的有效性.
2022, 31(3):220-225. DOI: 10.15888/j.cnki.csa.008386
摘要:图像超分辨率重建技术一直是计算机视觉领域的热门研究方向. 为了提高重建后图像的质量, 本文提出一种基于内容感知的上采样技术用于图像的重建. 将稠密残差网络作为骨干网络, 用基于内容感知上采样取代传统的亚像素卷积上采样技术, 即在特征重建阶段, 卷积核不会在整个特征图中共享参数, 而是神经网络可以根据特征图的内容在每个像素处生成特定的卷积核. 该算法减少了参数数量, 从而加快了网络训练速度. 通过多轮训练和测试, 结果显示使用改进技术得到了更加清晰的重建图像, 取得了良好的视觉效果.
2022, 31(3):226-233. DOI: 10.15888/j.cnki.csa.008379
摘要:图像主体轮廓包含图像非常重要的信息, 精准有效地提取图像主体轮廓不仅能减少信息冗余, 而且能降低后续图像分析和处理的时间复杂度. 本文基于视觉神经元信息处理机理, 提出了一种基于时空脉冲编码的图像主体轮廓提取方法. 首先, 利用Gabor函数模拟神经节细胞感受野对图像进行多尺度多方向的信息提取; 其次, 模拟视网膜非经典感受野构建各向异性抑制模型抑制图像背景纹理边缘. 然后针对不同尺度感受野获取的视觉图像, 基于视觉感受野小尺度可以提取到图像的大多数细节纹理信息, 而大尺度下提取可以使图像大部分细节纹理消失只保留一些主体轮廓的特性自适应调整权值, 进行时空脉冲编码; 最后, 采用漏积分点火神经元模型提取图像主体轮廓, 并采用非极大值抑制和滞后阈值二值化处理获得最终图像主体轮廓. 从主观和客观两方面在RUG40数据库上对本文提出的方法进行仿真验证, 并与现有的主流的图像轮廓提取方法进行性能对比. 实验结果表明, 本文提出的方法能够有效地提高主体轮廓提取的精度的同时减少图像主体轮廓冗余信息.
2022, 31(3):234-240. DOI: 10.15888/j.cnki.csa.008409
摘要:本文为提高停车场的使用效率提出一种基于视觉的车位检测与分类算法. 针对现有停车场车位分类方法自动化程度低, 设备与部署成本高昂, 以及现有的检测算法召回率低、准确性差的问题. 首先, 对车位进行检测, 建立车位表并增量式地扩充车位分类模型数据集; 其次, 利用测试数据集训练支持向量机车位分类模型; 最后, 根据监控视频流数据实时地对每个车位能否泊车进行判断. 实验结果表明: 在不同的光照条件下, 车位直线检测的召回率在94%以上, 车位分类模型的准确率在95%以上. 该算法自动化程度高, 准确率良好, 部署简便, 具有良好的应用价值.
2022, 31(3):241-247. DOI: 10.15888/j.cnki.csa.008374
摘要:随着无人机技术的飞速发展, 无人机被广泛用于各种领域的巡检任务. 近年来, 电力网络的规模和长度都在快速增长, 无人机因其独特的性能和优势成为了电力巡检的首选, 无人机巡检不仅能保证安全性, 还能有效地提高巡检效率, 而路径规划是其在实际应用中的关键一步. 本文提出了一种新的混合元启发式方法, 用于解决电力巡检中带有多个站点的无人机群路径规划问题. 该算法在自适应大邻域搜索的框架下添加变邻域下降为下属策略, 加强邻域搜索能力, 增加找到更优解的可能. 实验结果表明, 本文提出的算法能够有效地解决该问题, 并且具有较好的稳定性和鲁棒性. 另外, 通过实验对比了本算法和其他元启发式算法, 验证了本算法能有效地减少巡检中使用的无人机数量和时间成本.
2022, 31(3):248-254. DOI: 10.15888/j.cnki.csa.008378
摘要:为了使得优质石墨资源得到优质优用, 提出利用迁移学习和焦点损失卷积神经网络的石墨分类识别算法. 在自建的初始数据集基础上, 通过对数据集的离线扩充与在线增强, 有效扩大数据集并减低深层CNN过拟合的风险. 以VGG16、ResNet34和MobileNet V2为基础模型, 重新设计新的输出模块载入全连接层, 提高了模型的泛化能力与鲁棒性; 结合焦点损失函数, 修改模型超参数并在石墨数据集上训练. 实验仿真发现, 本文所提方法的准确率均在95%以上, 识别准确率提高, 收敛速度加快, 模型更加稳定, 证明了所提算法的可行性与有效性.
2022, 31(3):255-261. DOI: 10.15888/j.cnki.csa.008340
摘要:人工智能的逐步应用对行业的生产效率和技术变革影响显著, 传统行业因样本收集难度大、成本高、涉及个人隐私等原因, 进行深度学习时, 面临着小样本和不平衡数据问题. 现有的样本扩充方法存在着生成效果不能兼顾广泛性和合理性等问题. 为此, 提出一种基于变分自编码器潜变量语义提炼的样本扩充算法, 利用神经网络的权重作为输入特征与潜变量相关性的度量, 获取输入特征与变分自编码器潜变量的依赖关系, 为潜变量赋予语义提供重要依据, 实现显式控制潜变量的不同维度, 生成满足总体分布且在原训练集未包含的样本. 在对民用建筑结构安全数据库的样本扩充结果表明, 该方法能有效生成特定属性的样本, 能一定程度上解决小样本问题和不平衡数据问题.
2022, 31(3):262-268. DOI: 10.15888/j.cnki.csa.008358
摘要:为了满足分布式存储系统的动态存储和异构存储, 本文提出一种基于节点共边的异构部分重复码(heterogeneous fractional repetition codes based on node common edge, HFRC-NCE)的构造算法. 具体地, 将MDS码编码后的数据块分为冷数据块和热数据块, 结合节点共边的特性, 分别将冷数据块和热数据块复制不同的倍数存储到各个节点中, 构造的异构部分重复码更加简单直观, 可实现故障节点的精确无编码修复. 理论分析表明, 与基于完全图和部分正则图构造的部分重复码相比, 基于节点共边的异构部分重复码虽然存储开销和修复带宽开销略大, 但其节点修复选择度更高, 节点存储数据容量更多样化, 重构度更小.
2022, 31(3):269-274. DOI: 10.15888/j.cnki.csa.008395
摘要:在老旧仓库中使用传统人工势场算法进行路径规划时, 原本出现频率极低的与远目标端障碍物相撞、目标点不可达、局部极小值等缺陷出现的频率极大提高. 为提升人工势场算法寻径的成功率, 本文提出了改进人工势场算法, 对上述3种缺陷进行了修正, 并使用Matlab模拟仿真验证了算法的有效性. 在改进人工势场算法中, 通过对引力与斥力的改进, 有效解决了与远目标端障碍物相撞及目标点不可达问题. 通过引入临时障碍物, 则有效解决了局部极小值问题. 在实验部分, 针对不同仿真环境, 我们以路径长度和程序运行时间作为评价指标, 对比了传统人工势场算法与改进人工势场算法的路径规划效果. 实验结果显示不论环境中是否存在缺陷, 改进人工势场算法总优于传统人工势场算法.
2022, 31(3):275-281. DOI: 10.15888/j.cnki.csa.008373
摘要:FSSD (fast and efficient subgroup set discovery)是一种子群发现算法, 旨在短时间内提供多样性模式集, 然而此算法为了减少运行时间, 选择域数量少的特征子集, 当特征子集与目标类不相关或者弱相关时, 模式集质量下降. 针对这个问题, 提出一种基于集成特征选择的FSSD算法, 它在预处理阶段使用基于ReliefF (Relief-F)和方差分析的集成特征选择来获得多样性和相关性强的特征子集, 再使用FSSD算法返回高质量模式集. 在UCI数据集、全国健康和营养调查报告(NHANES)数据集上的实验结果表明, 改进后的FSSD算法提高了模式集质量, 归纳出更有趣的知识. 在NHANES数据集上, 进一步分析模式集的特征有效性和阳性预测值.
2022, 31(3):282-287. DOI: 10.15888/j.cnki.csa.008342
摘要:目前基于传统深度学习的关系抽取方法在复杂语境下抽取较为困难, 且未考虑语境中非目标关系对关系抽取所带来的影响. 针对这一问题, 本文提出了控制输入长短期记忆网络CI-LSTM (control input long short-term memory), 该网络在传统LSTM的基础上增加了由注意力机制和控制门阀单元组成的输入控制单元, 控制门阀单元可依据控制向量进行关键位置上的重点学习, 注意力机制对单个LSTM的输入的不同特征进行计算. 本文通过实验最终选择使用句法依存关系生成控制向量并构建关系抽取模型, 同时使用SemEval-2010 Task8关系数据集以及该数据集中具有复杂语境的样本对所提方法进行实验. 结果表明, 相比于传统的关系抽取方法, 本文所提CI-LSTM在准确率上有进一步提升, 并在复杂语境中具有更好的表现.
2022, 31(3):288-293. DOI: 10.15888/j.cnki.csa.008356
摘要:随着互联网技术的发展以及2020年新冠疫情的爆发, 越来越多的学生选择在线教育. 然而在线课程数量庞大, 往往无法及时找到合适的课程, 个性化智能推荐系统是解决这一问题的有效方案. 本文根据用户在线学习具有明显时序性的特点, 提出一种基于改进自编码器的在线课程推荐模型. 首先, 利用长短期记忆网络改进自编码器, 使得模型可以提取数据的时序性特征; 然后, 利用Softmax函数进行课程的推荐. 实验结果表明, 所提方法与协同过滤算法和基于传统自编码器的推荐模型相比, 具有更高的推荐准确率.
2022, 31(3):294-301. DOI: 10.15888/j.cnki.csa.008339
摘要:视频流服务的迅猛发展, 大规模用户共享带宽链路的场景不断增多. 现存的DASH视频流采用的ABR算法多用于提高单客户端用户的体验质量(quality of experience, QoE), 还有一些算法仅针对数个客户端的情况. 本文提出一种应用于大规模客户端场景的带宽调度算法, 通过聚类算法减小调度规模, 再将带宽分配同ABR算法结合, 对聚类客户端进行比特率决策, 提高带宽利用率, 保证总体QoE最大化. 我们的实验结果表明, 与均分带宽的调度方式相比, 通过对聚类客户端带宽调度并应用到所有客户端的方式总用户QoE提升99.4%, 相比于最先进的Minerva方案总QoE提高10.7%.
2022, 31(3):302-309. DOI: 10.15888/j.cnki.csa.008391
摘要:针对现有算法和模型对于网络中用户影响力计算大多只考虑拓扑结构和贪心算法而较少考虑真实社会网络中信任度对于节点影响力的重要性这一问题, 该文提出一种全局信任模型(global trust model, GTM)用于评估节点的影响力. 首先计算节点与邻居节点间的信任关系作为局部信任度, 其次利用Beta信誉模型在节点局部信任度的基础上得到全局信任度, 最后根据节点的全局信任度评估节点的影响力大小. 在真实的网络数据集上对该模型与经典影响力算法进行实验对比, 结果表明, 该文提出的方法不仅具有更低的时间复杂度, 并且在保证节点可信度与精确度的同时也具有良好的影响传播能力.
2022, 31(3):310-317. DOI: 10.15888/j.cnki.csa.008416
摘要:早产是新生儿死亡及病残的首要原因, 且影响新生儿的远期健康. 然而早产的准确预测一直是医学上的一个难题. 目前医学上早产的早期筛查多基于特殊检查, 但因成本核算等问题难以大规模临床应用, 而电子病历的普及和人工智能技术的发展, 为产科疾病的早期风险评估提供支持. 本文利用产科电子病历的诊疗信息, 构建 GRU和GBDT的混合模型预测早产. 混合模型利用GRU在孕妇多次产检信息中探究早产发生的概率, 并将结果融入孕前和28周前末次产检数据, 最后利用GBDT对孕妇进行更加精确的早产风险预测. 实验结果表明, 基于GRU和GBDT的早产预测模型在AUC和ROC等评估指标上优于其他单一模型, 本研究方法可有效帮助产科医护人员在妊娠早中期判断孕妇是否有早产风险.
2022, 31(3):318-325. DOI: 10.15888/j.cnki.csa.008383
摘要:针对现有的视频点播技术无法直接在智慧矿山管控平台中直接使用的问题, 基于HTTP的自适应码率流媒体传输协议与FFmpeg开源库设计一种视频点播技术. 该技术包括客户端模块、Web请求处理模块、多媒体处理模块. 该技术中客户端模块通过设定的视频源信息向Web请求处理模块发送视频请求; Web请求处理模块利用请求中的视频源信息调用多媒体处理模块获取多媒体流文件, 并将流媒体文件请求地址返回给客户端; 客户端接收到流媒体地址后, 根据流媒体地址请求视频文件并播放. 通过引入hls.js开源库, 该技术可以在任何使用HTML5技术的客户端中实现视频信息的点播, 实现了智慧矿山管控平台的跨终端浏览器、多业务模块、去插件的嵌入视频信息, 满足了视频信息与煤矿安全生产的各业务信息的融合展示与协同分析的需求.
2022, 31(3):326-332. DOI: 10.15888/j.cnki.csa.008385
摘要:电话诈骗日益猖獗, 严重影响人民的生命和财产安全, 如何有效防范电话诈骗已成为社会的一大焦点问题. 本文提出一种基于Attention-BiLSTM模型的诈骗电话识别方法. 该方法以电话文本为数据集, 采用双向长短时记忆神经网络(bi-directional long short-term memory)模型提取句子的长距离特征. 通过引入注意力机制增强电话文本中与诈骗相关词汇的特征权重, 得到电话文本的句子层面的特征向量表示, 最后输入Softmax层进行分类预测. 实验结果表明, 基于注意力机制的BiLSTM诈骗电话分类模型的准确率较基线模型分别提高了2.15%和0.6%, 具有更好的预测性能.
2022, 31(3):333-339. DOI: 10.15888/j.cnki.csa.008355
摘要:共享数据的云存储审计是指对群用户共享的云数据的完整性进行审计. 由于在共享数据云存储审计中, 用户可能因各种原因加入和离开用户群, 因此这种方案通常支持群用户撤销. 在大多数现存的共享数据云审计方案中, 用户撤销的计算开销与用户群要上传的文件块总数成线性关系, 造成很大的计算和通信代价, 如何减少用户撤销产生的计算和通信开销成为实现共享云存储审计的关键问题. 然而, 本文在提出了一种高效可撤销的共享数据云存储审计方案, 利用椭圆曲线技术实现了无对认证, 利用中国剩余定理实现了高效的用户撤销, 在保证安全用户撤销的基础上, 极大地减少了共享数据云存储审计方案的通信和计算代价. 此外, 本方案采用基于身份密码学技术, 解决了传统公钥密码学复杂的证书管理问题. 安全性分析和实验结果表明了所提方案的可行性和高效性.
2022, 31(3):340-344. DOI: 10.15888/j.cnki.csa.008381
摘要:针对农业植保区域的喷洒作业问题, 以植保无人直升机为应用对象, 提出一种基于最小喷洒单元的作业航线优化分割方法. 从返航点的选择、转弯次数、作业路程的角度, 分析了多种全覆盖作业方式的优劣, 确定了无人直升机的全覆盖作业方式. 根据无流量喷洒模式下无人机电量、油量、药量等参数, 确定植保作业时最小的喷洒单元, 利用矩形切割的思想对矩形农田进行优化分割, 最终实现植保作业区域的全局规划. 仿真结果表明, 该植保区域优化分割方法可以有效地提高无人机喷洒效率, 降低无效飞行带来的经济损耗, 达到了能耗与时间的优化, 给未来高标准农田建设提供可参考的解决方案.
2022, 31(3):345-350. DOI: 10.15888/j.cnki.csa.008371
摘要:构建个人信用风险评估模型的过程中, 特征工程很大程度上决定了评估器的性能, 传统的特征选择方法无法全面的考虑高维度指标对评估结果的影响, 且大多数研究在构建模型的过程中人为决定特征集大小, 导致随机性强、可信度低; 基于此, 提出基于传统风控指标优化XGBoost的随机森林模型(IV-XGBoostRF), 将传统风控指标IV与XGBoost相结合对原始特征集进行筛选, 建立较为完善的信用评估模型. 通过对比实验的结果显示改进后的随机森林模型准确度提高了0.90%, 且其他各项评估指标均优于传统信用评估模型, 证明了该组合特征选择方法的可行性, 有一定的应用价值.
2022, 31(3):351-355. DOI: 10.15888/j.cnki.csa.008394
摘要:随着业务量和功能需求的不断增长, 各大业务系统的应用正逐步实现Spring Boot架构到Spring Cloud微服务架构的升级. 由于版本的变更度较大, 需要经过充分的内部测试与对外联调才能正式上线. 在现有联调环境存在DMZ域机器资源有限, 以及尽量减少公网暴露面等要求下, 文章提出了基于Nginx-F5的双架构应用并行及流量切换方案, 使测试系统同时具备Boot和Cloud两种架构应用的对外联调测试功能. 该方案将外部商户的请求按照商户编码、业务类型或省代码等属性标识及一定的百分比进行拆分并转发至微服务应用系统, 使微服务版本的应用获得充分的调测, 为需要进行大版本并行测试的系统扩展和建设提供参考.