2022年第31卷第11期文章目次

2022, 31(11):1-9. DOI: 10.15888/j.cnki.csa.008802

摘要 (1511) HTML (3418) PDF 1.26 M (2934) 评论 (0) 收藏

摘要:图神经网络作为一种新的深度学习模型, 被广泛运用在图数据中, 并极大地推动了推荐系统、社交网络、知识图谱等应用的发展. 现有的异构图神经网络通常事先定义了多条元路径来学习异构图中的复合关系. 然而, 这些模型通常在特征聚合步骤中只考虑单条元路径, 导致模型只关注了元路径的局部结构, 忽略了元路径之间的全局相关性; 还有一些模型则是忽略掉了元路径的中间节点和边信息, 导致模型无法学习到元路径内部的语义信息. 针对以上问题, 本文提出一种基于元路径的图Transformer神经网络(MaGTNN). 该模型首先将异构图采样为基于元路径的多关系子图, 利用提出的位置编码和边编码的方法来获取元路径中的语义信息. 随后使用改进的图Transformer层计算出目标节点与其元邻居的相似度, 并利用该相似度来聚合其所有的元邻居信息. 在3个公开数据集的节点分类和节点聚类任务中, MaGTNN均高于最新的基准模型.

注意力分配策略对界面任务绩效和视觉行为的影响机制

王傲然，吕健，刘翔

2022, 31(11):10-20. DOI: 10.15888/j.cnki.csa.008786

摘要 (822) HTML (1206) PDF 3.09 M (1932) 评论 (0) 收藏

摘要:在工程领域, 作业人员通常需要面对刺激分布不均的复杂信息界面, 并执行相关的交互任务. 作业人员的视觉注意力分配已被证明与任务绩效密切相关, 但对于复杂界面中基于不同信息分配策略的多优先级刺激对作业人员的视觉注意力分配及任务绩效间的潜在联系仍亟待研究. 对此, 本文基于多优先级注意力分配策略实验对作业人员在不同负荷条件下的任务绩效和视觉行为的影响机制展开研究. 实验结果表明, 差异性的分配策略和信息优先级划分提升了任务绩效表现, 不同分配策略和优先级划分条件下的视觉行为存在显著差异, 并受脑力负荷的影响. 该结论能够为人机交互界面的设计和优化提供参考, 从而提高作业人员在任务中的绩效表现.

基于节点1-邻居图相似性的社会网络匿名技术

李啸林，章红艳，许佳钰，许力，黄赞

2022, 31(11):21-30. DOI: 10.15888/j.cnki.csa.008822

摘要 (769) HTML (996) PDF 1.72 M (1478) 评论 (0) 收藏

摘要:利用传统的k匿名技术在社会网络中进行隐私保护时会存在聚类准则单一、图中数据信息利用不足等问题. 针对该问题, 提出了一种利用Kullback-Leibler (KL)散度衡量节点1-邻居图相似性的匿名技术(anonymization techniques for measuring the similarity of node 1-neighbor graph based on Kullback-Leibler divergence, SNKL). 根据节点1-邻居图分布的相似性对原始图节点集进行划分, 按照划分好的类进行图修改, 使修改后的图满足k匿名, 完成图的匿名发布. 实验结果表明, SNKL方法与HIGA方法相比在聚类系数上的改变量平均降低了17.3%, 同时生成的匿名图与原始图重要性节点重合度保持在95%以上. 所提方法在有效保证隐私的基础上, 可以显著的降低对原始图结构信息的改变.

跨库语音情感识别研究进展

张石清，刘瑞欣，赵小明

2022, 31(11):31-48. DOI: 10.15888/j.cnki.csa.008811

摘要 (760) HTML (3836) PDF 1.78 M (4335) 评论 (0) 收藏

摘要:语音情感识别在人机交互过程中发挥极为重要的作用, 近年来备受关注. 目前, 大多数的语音情感识别方法主要在单一情感数据库上进行训练和测试 . 然而, 在实际应用中训练集和测试集可能来自不同的情感数据库. 由于这种不同情感数据库的分布存在巨大差异性, 导致大多数的语音情感识别方法取得的跨库识别性能不尽人意. 为此, 近年来不少研究者开始聚焦跨库语音情感识别方法的研究. 本文系统性综述了近年来跨库语音情感识别方法的研究现状与进展, 尤其对新发展起来的深度学习技术在跨库语音情感识别中的应用进行了重点分析与归纳. 首先, 介绍了语音情感识别中常用的情感数据库, 然后结合深度学习技术, 从监督、无监督和半监督学习角度出发, 总结和比较了现有基于手工特征和深度特征的跨库语音情感识别方法的研究进展情况, 最后对当前跨库语音情感识别领域存在的挑战和机遇进行了讨论与展望.

面向深度学习的空气质量预测研究进展

赵小明，顾珂铭，张石清

2022, 31(11):49-59. DOI: 10.15888/j.cnki.csa.008847

摘要 (1102) HTML (6254) PDF 1.45 M (6162) 评论 (0) 收藏

摘要:空气污染是影响公共卫生的重要因素, 空气质量预测是空气污染预警的关键, 是近年来环境学、统计学、计算机科学等领域中的热点研究课题. 本文综述了空气质量预测方法的研究现状与进展, 尤其对近年来新发展起来的深度学习方法在空气质量预测方面的应用进行了系统分析与总结. 首先, 介绍了空气质量预测方法的演变历程和空气污染数据集. 然后, 阐述了传统空气质量预测方法. 随后, 从时间信息、时空信息、注意力机制等角度出发, 重点分析和比较了现有面向深度学习的空气质量预测方法的进展. 最后, 对空气质量预测方法的未来发展趋势进行了总结与展望.

基于Token语义构建的代码克隆检测

王文杰，徐云

2022, 31(11):60-67. DOI: 10.15888/j.cnki.csa.008783

摘要 (931) HTML (1704) PDF 1.37 M (2414) 评论 (0) 收藏

摘要:传统的基于Token的克隆检测方法利用代码字符串的序列化特性, 可以在大型代码仓中快速检测克隆. 但是与基于抽象语法树(AST)、程序依赖图(PDG)的方法相比, 由于缺少语法及语义信息, 针对文本有较大差异的克隆代码检测困难. 为此, 提出一种赋予语义信息的Token克隆检测方法. 首先, 分析抽象语法树, 使用AST路径抽象位于叶子节点的Token的语义信息; 然后, 在函数名和类型名角色的Token上建立低成本索引, 达到快速并有效地筛选候选克隆片段的目的. 最后, 使用赋予语义信息的Token判定代码块之间的相似性. 在公开的大规模数据集BigCloneBench实验结果表明, 该方法在文本相似度较低的Moderately Type-3和Weakly Type-3/Type-4类型克隆上显著优于主流方法, 包括NiCad、Deckard、CCAligner等, 同时在大型代码仓上需要更少的检测时间.

基于MQTT协议扩展的IoT设备完整性监控

齐兵，秦宇，李敏虹，谢宏，尚科彤，冯伟，李为

2022, 31(11):68-78. DOI: 10.15888/j.cnki.csa.008765

摘要 (1032) HTML (2124) PDF 1.68 M (1914) 评论 (0) 收藏

摘要:随着物联网飞速发展, 设备数量呈指数级增长, 随之而来的IoT安全问题也受到了越来越多的关注. 通常IoT设备完整性认证采用软件证明方法实现设备完整性校验, 以便及时检测出设备中恶意软件执行所导致的系统完整性篡改. 但现有IoT软件证明存在海量设备同步证明性能低、通用IoT通信协议难以扩展等问题. 针对这些问题, 本文提供一种轻量级的异步完整性监控方案, 在通用MQTT协议上扩展软件证明安全认证消息, 异步推送设备完整性信息, 在保障IoT系统高安全性的同时, 提高了设备完整性证明验证效率. 我们的方案实现了以下3方面安全功能: 以内核模块方式实现设备完整性度量功能, 基于MQTT的设备身份和完整性轻量级认证扩展, 基于MQTT扩展协议的异步完整性监控. 本方案能够抵抗常见的软件证明和MQTT协议攻击, 具有轻量级异步软件证明、通用MQTT安全扩展等特点. 最后在基于MQTT的IoT认证原型系统的实验结果表明, IoT节点的完整性度量、MQTT协议连接认证、PUBLISH报文消息认证性能较高, 都能满足海量IoT设备完整性监控的应用需求.

基于LEBERT的多模态领域知识图谱构建

李华昱，付亚凤，闫阳，李家瑞

2022, 31(11):79-90. DOI: 10.15888/j.cnki.csa.008799

摘要 (1341) HTML (3221) PDF 3.41 M (2208) 评论 (0) 收藏

摘要:多模态知识图谱(multi-modal knowledge graph, MMKG)是近几年新兴的人工智能领域研究热点. 本文提供了一种多模态领域知识图谱的构建方法, 以解决计算机学科领域知识体系庞大分散的问题. 首先, 通过爬取计算机学科的相关多模态数据, 构建了一个系统化的多模态知识图谱. 但构建多模态知识图谱需要耗费大量的人力物力, 本文训练了基于LEBERT模型和关系抽取规则的实体-关系联合抽取模型, 最终实现了一个能够自动抽取关系三元组的多模态计算机学科领域知识图谱.

智慧城市运营管控关键技术展望

范明月，于皖豫，席瑞，张亮，张弘

2022, 31(11):91-99. DOI: 10.15888/j.cnki.csa.008796

摘要 (563) HTML (924) PDF 2.51 M (1461) 评论 (0) 收藏

摘要:智慧城市是社会空间、物理空间和信息系统三元有机融合的条件下城市智慧化转型的新型态, 运用新一代信息化技术优化城市系统, 提升城市品质和综合竞争力, 实现可持续发展. 近年来, 智慧城市建设的重视程度也在不断加强, 但其并未如其他领域智慧化转型那般顺利, 建设过程依然存在诸多问题, 也在一定程度上对城市的发展产生了制约作用. 本文以城区级规模的幸福林带建筑为例, 简要介绍了其智慧化运营管控平台, 并针对其在数字化、可视化、智能化和开放式开发框架等方面的需求, 凝练了一个智慧化平台的技术参考框架. 最后, 以此经验为基础, 对智慧城市运营管控平台的建设给出一些建议, 并提出了其潜在的关键技术需求.

基于事件抽取的学科建设知识图谱构建与应用

李家瑞，李华昱，闫阳，付亚凤

2022, 31(11):100-110. DOI: 10.15888/j.cnki.csa.008798

摘要 (726) HTML (1148) PDF 3.65 M (1759) 评论 (0) 收藏

摘要:学科建设是高校发展的核心, 随着高校学科建设的不断深入与强化, 学科建设信息持续增加, 且以离散的文件组织形式难以对学科建设成果进行高效的管理, 不利于后续分析与评估工作的开展. 针对此问题, 对学科建设知识图谱的构建及相关应用进行了研究. 首先通过BERT-BiLSTM-CRF模型对学科建设文本进行事件抽取, 并使用爬虫进行相关知识的补充. 然后选择属性图模型存储知识, 完成学科建设知识图谱的初步构建. 基于构建好的知识图谱, 搭建了学科建设可视化系统, 并引入最小斯坦纳树算法实现智能问答应用. 最后, 通过对学科建设事件抽取与智能问答方法进行实验分析, 验证了本文所提出方法的有效性.

基于残差双注意力与跨级特征融合模块的静态手势识别

吴佳璐，田秋红，岳金鸿

2022, 31(11):111-119. DOI: 10.15888/j.cnki.csa.008770

摘要 (1013) HTML (1442) PDF 1.74 M (1843) 评论 (0) 收藏

摘要:为解决卷积神经网络提取特征遗漏、手势多特征提取不充分问题, 本文提出基于残差双注意力与跨级特征融合模块的静态手势识别方法. 设计了一种残差双注意力模块, 该模块对ResNet50网络提取的低层特征进行增强, 能够有效学习关键信息并更新权重, 提高对高层特征的注意力, 然后由跨级特征融合模块对不同阶段的高低层特征进行融合, 丰富高级特征图中不同层级之间的语义和位置信息, 最后使用全连接层的Softmax分类器对手势图像进行分类识别. 本文在ASL美国手语数据集上进行实验, 平均准确率为99.68%, 相比基础ResNet50网络准确率提升2.52%. 结果验证本文方法能充分提取与复用手势特征, 有效提高手势图像的识别精度.

基于5G的塔机远程控制系统

张琨，张维，王辉，王开强，李迪，梁博

2022, 31(11):120-129. DOI: 10.15888/j.cnki.csa.008791

摘要 (809) HTML (1623) PDF 2.73 M (1853) 评论 (0) 收藏

摘要:在建筑施工现场, 塔式起重机现有的操控方式存在安全风险高、操作人员利用率低等问题. 对此, 提出基于5G MEC的塔机远程控制系统, 能够实现不同地理位置的多台塔机、多个客户端的灵活接入和综合管控. 通过对状态数据、控制数据、媒体流数据的转发控制采用模块化设计及有针对性的策略, 保证了基于5G通讯的低时延在应用层面得以实现, 对于多设备多客户端的分布式远程控制应用具有一定的参考价值.

基于HXDSP的OpenCL运行时任务调度

顾经纬，宁成明，郑启龙

2022, 31(11):130-138. DOI: 10.15888/j.cnki.csa.008780

摘要 (670) HTML (1225) PDF 2.00 M (1472) 评论 (0) 收藏

摘要:OpenCL是一种开源免费的异构计算框架, 被各类架构处理器广泛采用. HXDSP是中国电子科技集团公司第38研究所自主研发的国产高性能DSP芯片. 为了解决HXDSP异构计算平台调度困难和硬件利用不充分, 本文针对OpenCL运行时任务调度系统展开研究, 设计了OpenCL运行时期间的任务图自动化提取方法, 并结合HXDSP硬件特性和OpenCL执行模型特性对经典的静态调度算法HEFT进行改进, 提出了一种异构双粒度最早完成时间优先调度算法HDGEFT, 并在HXDSP异构计算平台上设计实验验证算法. 实验结果表明经过特殊设计的调度算法在执行效率上有明显优势.

面向产学研服务的政策匹配方法与系统

罗扬，颜瑞新，李伟刚，朱登明

2022, 31(11):139-147. DOI: 10.15888/j.cnki.csa.008794

摘要 (612) HTML (1094) PDF 1.97 M (1378) 评论 (0) 收藏

摘要:近年来, 产学研合作成为推动产业升级和经济发展的重要因素, 产学研服务可以快速整合多方资源, 提高创新效率, 增强企业的综合竞争力, 因此各级政府也围绕产学研合作推出了各种支持政策. 然而各类企业, 作为产学研合作的重要一环, 在申报过程中难以快速收集、整理与其相关的支持政策. 因此, 我们面向产学研服务, 利用人工智能文本分析的技术, 设计和实现了政策匹配系统, 可以对各类政策进行分析和预处理, 使得企业在政策池中能快速地获取与自身条件相匹配的政策, 从而节省企业的人力, 提高企业申报政策的效率.

结合向前状态预测和隐空间约束的强化学习表示算法

项宇，秦进，袁琳琳

2022, 31(11):148-156. DOI: 10.15888/j.cnki.csa.008801

摘要 (783) HTML (1566) PDF 1.82 M (1594) 评论 (0) 收藏

摘要:虽然深度强化学习能够解决很多复杂的控制问题, 但是需要付出的代价是必须和环境进行大量的交互, 这是深度强化学习所面临的一大挑战. 造成这一问题的原因之一是仅依靠值函数损失难以让智能体从高维的复杂输入中提取有效特征. 导致智能体对所处状态理解不足, 从而不能正确给状态分配价值. 因此, 为了让智能体认识所处环境, 提高强化学习样本效率, 本文提出一种结合向前状态预测与隐空间约束的表示学习方法(regularized predictive representation learning, RPRL). 帮助智能体从高维视觉输入中学习并提取状态特征, 以此来提高强化学习样本效率. 该方法用前向的状态转移损失作为辅助损失, 使智能体学习到的特征包含环境转移的相关动态信息. 同时在向前预测的基础上添加正则化项对隐空间的状态表示进行约束, 进一步帮助智能体学习到高维度输入的平滑、规则表示. 该方法在DeepMind Control (DMControl)环境中与其他的基于模型的方法以及加入了表示学习的无模型方法进行比较, 都获得了更好的性能.

改进Inception-v3网络的手势图像识别

邓志军，田秋红

2022, 31(11):157-166. DOI: 10.15888/j.cnki.csa.008793

摘要 (829) HTML (1503) PDF 1.74 M (1570) 评论 (0) 收藏

摘要:鉴于Inception-v3网络参数量过大的问题, 本文提出了一种有效的手势图像识别方法, 能够满足在模型参数量较少的情况下高精度手势识别的需求. 本文利用Inception-v3的结构, 对原Inception-v3的Inception模块重新进行设计, 降低学习的参数量和难度, 结合残差连接, 保护信息的完整性, 防止网络退化, 引入注意力机制模块, 让模型聚焦于有用的信息而淡化无用信息, 在一定程度上也防止了模型的过拟合, 并且在模型中进行上采样与低层特征进行特征融合, 融合后的特征比原输入特征更具有判别能力, 进一步提高模型的准确率. 实验结果表明改进的Inception-v3网络的参数量仅为1.65 M, 而且拥有更高的准确率和更快的收敛速度. 将ASL手语数据集与孟加拉手语数据集分别打乱, 然后按照4:1的比例单独划分出训练集和验证集. 改进的Inception-v3在ASL手语数据集与孟加拉手语数据集上的识别率分别达到了100%和95.33%.

基于通道注意力与条件生成对抗网络的图像去雾

赵茂军，郭凰，白俊峰，廖聪

2022, 31(11):167-174. DOI: 10.15888/j.cnki.csa.008804

摘要 (885) HTML (1690) PDF 2.28 M (1769) 评论 (0) 收藏

摘要:针对当前去雾方法存在雾残留、颜色失真等问题, 结合生成对抗网络在图像超分辨率重建的优势, 提出基于通道注意力与条件生成对抗网络图像去雾算法(CGAN-ECA). 网络基于编码-解码结构, 生成器设计多尺度残差模块(multi-scale residual block, MRBlk)和高效通道注意力模块(efficient channel attention, ECA)扩大感受野, 提取多尺度特征, 动态调整不同通道权重, 提高特征利用率. 使用马尔可夫判别器分块评价图像, 提高图像判别准确率. 损失函数增加内容损失, 减少去雾图像的像素和特征级损失, 保留图像更多的细节信息, 实现高质量的图像去雾. 在公开数据集RESIDE实验结果表明, 提出的模型相比于DCP、AOD-Net、DehazeNet和GCANet方法峰值信噪比和结构相似性分别平均提高36.36%, 8.80%, 改善了颜色失真和去雾不彻底的现象, 是一种有效的图像去雾算法.

基于对比学习的细粒度遮挡人脸表情识别

奚琰

2022, 31(11):175-183. DOI: 10.15888/j.cnki.csa.008813

摘要 (929) HTML (1603) PDF 2.07 M (1677) 评论 (0) 收藏

摘要:和实验室环境不同, 现实生活中的人脸表情图像场景复杂, 其中最常见的局部遮挡问题会造成面部外观的显著改变, 使得模型提取到的全局特征包含与情感无关的冗余信息从而降低了判别力. 针对此问题, 本文提出了一种结合对比学习和通道-空间注意力机制的人脸表情识别方法, 学习各局部显著情感特征并关注局部特征与全局特征之间的关系. 首先引入对比学习, 通过特定的数据增强方法设计新的正负样本选取策略, 对大量易获得的无标签情感数据进行预训练, 学习具有感知遮挡能力的表征, 再将此表征迁移到下游人脸表情识别任务以提高识别性能. 在下游任务中, 将每张人脸图像的表情分析问题转化为多个局部区域的情感检测问题, 使用通道-空间注意力机制学习人脸不同局部区域的细粒度注意力图, 并对加权特征进行融合, 削弱遮挡内容带来的噪声影响, 最后提出约束损失联合训练, 优化最终用于分类的融合特征. 实验结果表明, 无论是在公开的非遮挡人脸表情数据集(RAF-DB和FER2013)还是人工合成的遮挡人脸表情数据集上, 所提方法都取得了与现有先进方法可媲美的结果.

融合阈值分割和注意力网络的建筑阴影检测

孟慧，陶为翔，吕俊杰

2022, 31(11):184-191. DOI: 10.15888/j.cnki.csa.008803

摘要 (651) HTML (985) PDF 2.86 M (1364) 评论 (0) 收藏

摘要:针对高分辨率高层建筑物遥感影像噪声干扰大、阴影检测困难的问题, 本文提出了一种改进阈值分割和注意力残差网络结合的高层建筑物遥感影像阴影检测方法. 首先, 利用改进最大类间和最小类内阈值分割算法建立阈值分割模型, 并基于轮廓间的连通域特性和端点位置约束关系利用欧几里得度量算法对断裂轮廓进行修补得到阴影轮廓; 然后, 利用生成对抗网络模型对误判数据集进行扩充; 最后, 对残差网络进行改进, 在特征图中加入注意力机制进行全局特征融合. 在不同场景下, 分别与辐射模型、直方图阈值分割、彩色模型阴影检测方法, 支持向量机、视觉几何群网络、Inception和残差网络分类网络进行了对比实验, 本文方法综合误判率和漏检率分别为2.1%、1.5%. 结果表明, 本文提出的高层建筑遥感阴影检测算法能较好地完成阴影区域的分割和检测, 有利于节约人力物力资源、协助工作人员进行遥感信息的解译、遥感档案建立等工作, 具有实用价值.

瓷砖表面非常规尺寸瑕疵的检测

陈凯，鲁涵统，程浩宇，方梦园

2022, 31(11):192-198. DOI: 10.15888/j.cnki.csa.008807

摘要 (693) HTML (1046) PDF 2.64 M (1512) 评论 (0) 收藏

摘要:与普通目标检测任务不同, 瓷砖表面瑕疵检测的困难之处在于检测小尺寸和大长宽比等非常规尺寸的目标. 为了解决这两个问题, 本文提出了一种基于改进 Cascade R-CNN 的新型瓷砖表面瑕疵检测算法. 为了提高模型对小瑕疵的检测能力, 本文模型利用侧向连接结构进行上下层语义信息的融合, 使用可切换空洞率的空洞卷积来增加模型的感受野; 为了提高模型对于大长宽比瑕疵的检测能力, 本文模型在标准卷积上引入偏移域以更好提取目标特征信息. 此外, 本文模型调整 Cascade R-CNN 框架中预选锚框的大小和长宽比例. 实验结果表明, 在从瓷砖工厂收集的数据集上, 本文所提出算法的平均精度均值 (mean average precision, mAP) 达到了 73.5%, 比改进前的 Cascade R-CNN 模型提高了9.7%. 本文实验代码可从以下链接获取: https://github.com/mashibin/Ceramic-tile-defect-detection.

序的分类预测在进化算法中的应用

毛立伟，贺慧芳，李文彬，郭观七

2022, 31(11):199-206. DOI: 10.15888/j.cnki.csa.008760

摘要 (572) HTML (806) PDF 1.19 M (1349) 评论 (0) 收藏

摘要:昂贵优化问题的求解往往伴随着计算成本灾难, 为了减少目标函数的真实评估次数, 将序预测方法用于进化算法中候选解的选取. 通过分类预测直接得到候选解的相对优劣关系, 避免了对目标函数建立精确代理模型的需求, 并且设计了序样本集约简方法, 以降低序样本集的冗余性, 提高序预测模型的训练效率. 接下来, 将序预测与遗传算法相结合. 序预测辅助遗传算法在昂贵优化测试函数上的仿真实验表明, 序预测方法可有效降低求解昂贵优化问题时的计算成本.

改进的SemBERT特征重组模型

龚安靖，陈红英

2022, 31(11):207-214. DOI: 10.15888/j.cnki.csa.008775

摘要 (733) HTML (1263) PDF 1.61 M (1598) 评论 (0) 收藏

摘要:SemBERT模型实现了对BERT模型的提升, 但存在两个明显的缺陷. 第一, 模型获得向量表示的能力不足. 第二, 没有从特征的种类出发, 直接使用传统特征进行任务分类. 针对这两个缺陷, 提出了一种新的特征重组网络. 该模型在SemBERT内部添加自注意力机制, 外接特征重组机制, 得到更好的向量表示并且重新分配特征权重. 实验数据表明新的方法在MRPC数据集上比经典的SemBERT模型在F1值上提高了1%. 实现在小数据集上的明显提升, 并且超越了大多数优秀模型.

基于骨架序列提取的异常行为识别

吴晨，孙强，倪宏宇，颜文旭

2022, 31(11):215-222. DOI: 10.15888/j.cnki.csa.008773

摘要 (673) HTML (1386) PDF 1.60 M (2264) 评论 (0) 收藏

摘要:视频监控系统中的人员异常行为识别研究具有重要意义. 针对传统算法检测实时性和准确性差, 易受环境影响的问题, 提出一种基于骨架序列提取的异常行为识别算法. 首先, 改进YOLOv3网络用以对目标进行检测、结合RT-MDNet算法进行跟踪, 得到目标的运动轨迹; 然后, 利用OpenPose模型提取轨迹中目标的骨架序列; 最后通过时空图卷积网络结合聚类对目标进行异常行为识别. 实验结果表明, 在存在光照变化的复杂环境下, 算法识别准确率达94%, 处理速度达18.25 fps, 能够实时、准确地识别多种目标的异常行为.

基于EMD-TCN-ELM的短期电力负荷预测

李飞宏，肖迎群

2022, 31(11):223-229. DOI: 10.15888/j.cnki.csa.008781

摘要 (768) HTML (1232) PDF 1.73 M (1610) 评论 (0) 收藏

摘要:为降低负荷序列的复杂性, 利用EMD分解方法得到不同的分量. 为降低训练时间和减小分量逐个预测所带来的累计误差, 利用分量过零率大小将分量重构为高频分量和低频分量, 利用TCN模型预测负荷的高频分量, 利用极限学习机ELM预测负荷低频分量. 通过实验将所提模型EMD-TCN-ELM分别与3个单模型TCN、ELM、LSTM和3个混合模型EMD-TCN、EMD-ELM、EMD-LSTM比较, 其MAPE分别降低0.538%, 1.866%, 1.191%, 0.026%, 1.559%, 0.323%, 所提模型的预测精度最高. 且所提模型在预测精度前3的模型中训练时间最短, 验证了所提模型在负荷预测精度和训练时间方面的优越性.

基于深度学习的早期火灾预警算法

李牧，何允帅，卢金波，王芬婷，杨恒

2022, 31(11):230-237. DOI: 10.15888/j.cnki.csa.008789

摘要 (872) HTML (1548) PDF 2.23 M (2896) 评论 (0) 收藏

摘要:传统火灾预警方法存在检测精度低、未发生火灾时不能及时预警的问题, 提出一种基于深度学习的早期火灾预警算法. 首先, 使用红外热像仪采集特定场景中的红外图像, 构建数据集; 其次, 使用改进的YOLOv4算法进行训练得到网络权重, 在主干网络的3个输出特征层后引入卷积注意力模块, 提升网络对关键信息的提取能力; 在主干网络和路径聚合网络中增加卷积层, 提高特征提取的能力; 最后, 使用提出的智能火灾检测(intelligent fire detection, IFD)算法对预测图像处理并根据得分评估火灾隐患. 实验结果表明, 改进YOLOv4算法在数据集上的mAP达到98.31%, 比原始YOLOv4算法的mAP提高了2.7%, FPS达到37.1 f/s, IFD算法精确度为93%, 误检率为3.2%. 提出的早期火灾预警算法具有检测精度高, 未形成火灾时及时预警的优点.

基于改进人工蜂群算法的文本对抗样本生成

杨帆，李邵梅，金柯君

2022, 31(11):238-245. DOI: 10.15888/j.cnki.csa.008820

摘要 (636) HTML (960) PDF 1.36 M (1203) 评论 (0) 收藏

摘要:文本对抗样本的生成对于研究基于深度学习的自然语言处理系统的脆弱性, 提升这类系统的鲁棒性具有重要的意义. 本文对词级对抗样本生成中的重要步骤, 替换词的搜索展开研究, 针对现有算法存在的早熟收敛和有效性差的问题, 提出了基于改进人工蜂群搜索算法的文本对抗样本生成方法. 首先, 根据知网HowNet库中单词的义原标注筛选得到拟被替换词的搜索空间; 然后, 基于改进的人工蜂群算法搜索并定位替换词生成高质量的文本对抗样本. 本文针对当前主流的基于深度神经网络的文本分类模型, 在两个文本分类数据集上进行了攻击测试. 结果表明, 跟已有文本对抗样本生成方法相比, 本文提出的方法能以较高的攻击成功率误导文本分类系统, 并更多地保留语义和语法的正确性.

基于关键词与指针生成网络的摘要生成算法

邓珍荣，汤园钰，杨睿，张永林

2022, 31(11):246-253. DOI: 10.15888/j.cnki.csa.008745

摘要 (626) HTML (1175) PDF 3.11 M (1576) 评论 (0) 收藏

摘要:为解决传统生成式模型在生成摘要的过程中会忽略关键词信息为摘要提供的重要线索, 导致关键词信息的丢失, 生成的摘要不能很好地契合原文信息, 文章提出了一种以指针生成网络为骨架融合BERT预训练模型和关键词信息的摘要生成方法. 首先, 结合TextRank算法与基于注意力机制的序列模型进行关键词的提取, 使得生成的关键词能够包含更多的原文信息. 其次, 将关键词注意力加入到指针生成网络的注意力机制里, 引导摘要的生成. 此外, 我们使用双指针拷贝机制来替代指针生成网络的拷贝机制, 提高拷贝机制的覆盖率. 在LCSTS数据集上的结果表明, 所设计的模型能够包含更多的关键信息, 提高了摘要生成的准确性和可读性.

基于双检测头的轻量级目标检测算法

郭昕刚，纪超群，翟双，程超

2022, 31(11):254-260. DOI: 10.15888/j.cnki.csa.008768

摘要 (766) HTML (1195) PDF 1.67 M (1460) 评论 (0) 收藏

摘要:为解决轻量级目标检测算法中由于分类损失较大导致算法精确度低的问题, 提出一种对目标的位置与分类使用双检测头的检测方法. 算法中用卷积头对位置进行检测, 用全连接头对分类进行检测; 分类检测时特征图经过卷积层后融合位置回归分支的特征图, 再使用全连接层对特征图进行处理; 并提出分组全连接的方式进一步减少全连接层的计算量. 在VOC数据集上对算法进行训练, 结果表明, 改进后模型的分类损失有了明显的下降, 有效地提升了轻量级目标检测算法的检测精确度, 算法在VOC测试集上达到70.08%的精确度.

基于骨架的快速手势识别模型

赵阳，刘汉超，董兰芳

2022, 31(11):261-267. DOI: 10.15888/j.cnki.csa.008795

摘要 (772) HTML (1701) PDF 1.17 M (1929) 评论 (0) 收藏

摘要:对于手势识别来说, 骨架数据是一种紧凑且对环境条件稳健的数据模态. 最近基于骨架的手势识别研究多使用深度神经网络去提取空间和时间的信息, 然而这些方法可能存在复杂的计算和大量的模型参数的问题. 为了解决这个问题, 我们提出一种轻量高效的手势识别模型. 该模型使用从骨架序列上计算出的两种空间几何特征, 以及自动学习的运动轨迹特征, 然后只使用卷积网络作为骨干网络实现手势分类. 最终我们的模型参数量最少情况下仅为0.16 M, 计算复杂度最大情况为0.03 GFLOPs. 我们在公开的两个数据集上评估了我们的方法, 与其他输入为骨架模态的方法相比, 我们的方法取得了相应数据集上最好的结果.

融合多特征与时间序列的人群行为识别模型

吴敏忠，王雷，盛捷

2022, 31(11):268-274. DOI: 10.15888/j.cnki.csa.008788

摘要 (672) HTML (1245) PDF 1.61 M (1590) 评论 (0) 收藏

摘要:人群行为识别在公共安全等领域具有重要的应用价值. 现有研究分别考虑了人群情绪、人群类型、人群密度以及人群社会文化环境等因素对于人群行为的影响, 但少有综合考虑这些因素的模型, 导致模型性能受限. 本文综合考虑人群的物理特征、社交特征、情绪人格特征和文化背景特征之间的相关性, 以及相结合之后对人群行为的影响, 提出一种融合多特征与时间序列的人群行为识别模型. 模型采用两个并行的网络层分别处理多特征相关性和时间序列依赖性对于人群行为的影响, 同时为提高模型可解释性, 网络层采用融合结构因果模型(SCM)与图神经网络(GNN)的因果图网络(CGN). 通过在运动情感数据集(MED)上进行实验并与其他方法模型进行对比, 证明了本文方法能够成功识别人群行为, 并且优于目前最先进的方法.

基于启发式带时间窗的车辆路径规划问题求解

刘烁佳，李学强

2022, 31(11):275-281. DOI: 10.15888/j.cnki.csa.008818

摘要 (784) HTML (2109) PDF 1.39 M (2018) 评论 (0) 收藏

摘要:车辆路径规划问题广泛地存在于现代物流行业中, 该问题属于NP难的组合优化问题. 随着客户需求的多样化、道路限行等因素的影响, 该问题变得更加的复杂, 采用传统的组合优化方法和运筹学方法往往难以求解. 本文对一类常见的带时间窗的车辆路径规划问题进行了研究, 根据时间窗参数来调整客户的优先级, 以减少车辆的等待时间, 由此改进了几个常见的启发式算法, 并对56个常见的车辆路径规划问题进行了测试, 实验结果表明, 改进的节约算法在带容量约束的车辆路径问题中效果较好, 改进的插入法则在带时间窗的车辆路径问题中具有优越性, 另外, 改进的启发式算法在4个测试用例上使用更多车辆时可使总路程优于已知最优值.

基于两阶段算法的列车调度问题

李晓辉，刘元东，赵毅，董媛

2022, 31(11):282-289. DOI: 10.15888/j.cnki.csa.008831

摘要 (673) HTML (1276) PDF 2.09 M (1507) 评论 (0) 收藏

摘要:考虑突发铁路损坏对列车运行的影响, 在列车运行调度理论的基础上, 建立了单线铁路调度模型, 设计了一种带有突发事件处理能力的两阶段列车调度算法, 第1阶段对列车区间运行速度进行调整, 第2阶段对列车的停站时间进行调整. 将3种有效的搜索算子、一种自适应更新规则与粒子群算法相结合, 以列车延迟率作为优化目标, 求解单线铁路列车调度问题. 通过将所提算法与其他算法在相同实验条件下进行测试对比, 并进行突发事件测试, 验证了所提算法的有效性.

快速近似计算Shapley值的归因解释方法

余晓晗，王从波，谢瑗瑗，张中辉，马荣

2022, 31(11):290-295. DOI: 10.15888/j.cnki.csa.008751

摘要 (899) HTML (1477) PDF 1.37 M (2312) 评论 (0) 收藏

摘要:Shapley值归因解释方法虽然能更准确量化解释结果, 但过高的计算复杂度严重影响了该方法的实用性. 本文引入KD树重新整理待解释模型的预测数据, 通过在KD树上插入虚节点, 使之满足TreeSHAP算法的使用条件, 在此基础上提出了KDSHAP方法. 该方法解除了TreeSHAP算法仅能解释树结构模型的限制, 将该算法计算Shapley值的高效性放宽到对所有的黑盒模型的解释中, 同时保证了计算准确度. 通过实验对比分析, KDSHAP方法的可靠性, 以及在解释高维输入模型时的适用性.

基于预训练模型和基础词典扩展的酒店评论情感分析

丁美荣，冯伟森，黄荣翔，罗嘉俊

2022, 31(11):296-308. DOI: 10.15888/j.cnki.csa.008779

摘要 (678) HTML (1527) PDF 2.45 M (2105) 评论 (0) 收藏

摘要:本文主要针对酒店领域的评论信息进行情感分析, 研究用户对于酒店配置、服务等方面的态度, 以便为酒店提高个性化服务质量提供一定的帮助. 本文基于BiLSTM神经网络构建预训练模型进行实验, 同时与传统的机器学习算法进行比较, 实验结果显示, 相较于朴素贝叶斯, 支持向量机的分析准确率更为稳定, 而利用预训练模型进行预测的精确率相比前两者有小幅度的提高; 同时以基础词典为主体, 构建适用于酒店评论的扩展情感词典, 对否定词的权重进行了弱化处理, 减小对带有相反含义语句的分类效果的影响, 将基础词典与扩展词典对获取的同一语料进行情感分类, 比较二者的结果表明采用扩展词典进行正向分类的准确率为86%, 负向分类的准确率为84%, 结果显示扩展词典分类比基础词典的分类效果更好.

Wi-Fi网络下多AP协作边缘计算资源分配策略

韩启福，方旭明

2022, 31(11):309-319. DOI: 10.15888/j.cnki.csa.008792

摘要 (784) HTML (1539) PDF 1.57 M (1549) 评论 (0) 收藏

摘要:近年来, AR/VR、在线游戏、4K/8K超高清视频等计算密集且时延敏感型应用不断涌现, 而部分移动设备受自身硬件条件的限制, 无法在时延要求内完成此类应用的计算, 且运行此类应用会带来巨大的能耗, 降低移动设备的续航能力. 为了解决这一问题, 本文提出了一种Wi-Fi网络多AP (access point)协作场景下边缘计算卸载和资源分配方案. 首先, 通过遗传算法确定用户的任务卸载决策. 随后, 利用匈牙利算法为进行任务卸载的用户分配通信资源. 最后, 根据任务处理时延限制, 为进行任务卸载的用户分配边缘服务器计算资源, 使其满足任务处理时延限制要求. 仿真结果表明, 所提出的任务卸载与资源分配方案能够在满足任务处理时延限制的前提下有效降低移动设备的能耗.

RoCE协议下基于在网计算的MPI通信优化

李嘉群，蔡文杰，沈瑜，齐法制，曾珊，李京

2022, 31(11):320-329. DOI: 10.15888/j.cnki.csa.008809

摘要 (878) HTML (2480) PDF 1.68 M (2547) 评论 (0) 收藏

摘要:高性能计算中, 通信上的巨大开销已成为其算力提升的主要瓶颈之一, 通信性能的优化一直是一个重要挑战. 针对通信优化任务, 提出一种基于在网计算技术降低通信开销的方法. 该方法在基于以太网的超算环境下, 利用RoCEv2协议、可编程交换机以及OpenMPI, 实现将归约计算卸载到可编程交换机, 支持Node和Socket两种通信模式. 在真实超算环境下开展了集合通信基准测试和OpenFOAM应用测试实验, 结果表明, 当服务器节点数达到一定规模时, 该方法在Node和Socket两种模式下相较于传统的主机通信, 均呈现出较好的性能提升, 其中集合通信基准测试有10%–30%左右性能提升, 在应用级测试中应用整体性能有1%–5%左右提升.

基于t分布的贝叶斯深度学习模型及其应用

毕秀春，杨皓峰

2022, 31(11):330-338. DOI: 10.15888/j.cnki.csa.008787

摘要 (797) HTML (1416) PDF 1.35 M (1741) 评论 (0) 收藏

摘要:贝叶斯深度学习(BDL)融合了贝叶斯方法与深度学习(DL)的互补优势, 成为复杂问题中不确定性建模与推断的强大工具. 本文构建了基于t 分布和循环随机梯度汉密尔顿蒙特卡罗采样算法的BDL框架, 并基于数据不确定性和模型定不确定性给出了不确定性的度量. 为了验证模型框架的有效性和适用性, 我们分别基于人工神经网络(ANN)、卷积神经网络(CNN) 和循环神经网络(RNN)构建了相应的BDL模型, 并将模型应用于全球15个股票指数预测, 实证结果显示: 1)该框架在ANN、CNN和RNN 下均适用, 对全部指数的预测效果均很出色; 2) 在预测精度和通用性方面, 基于t分布BDL的模型比基于正态分布的BDL模型具有显著优越性; 3)在给定不确定性阈值之下的预测MAE 比初始MAE显著提升, 表明文中定义的不确定性是有效的, 对不确定性建模具有重要意义. 鉴于该BDL框架在预测精度、易于拓展和具备提供预测不确定性度量的优势, 其在金融和其他具有复杂数据特征的领域均有广阔的应用前景.

电场中导电液滴电场效应的数值模拟

刘建河，杨海朋

2022, 31(11):339-348. DOI: 10.15888/j.cnki.csa.008763

摘要 (713) HTML (1478) PDF 3.48 M (1844) 评论 (0) 收藏

摘要:为研究低电导率导电液滴的电场效应, 采用开源计算流体力学(CFD)软件OpenFOAM, 设计了一种基于漏介质模型(leaky dielectric model)和流体体积(volume of fluid, VOF)法的电流体雾化(electrohydrodynamic atomization, EHDA)求解器, 并将数值结果与Taylor的解析值进行了比较. 模拟结果预测了液滴的变形方式以及液滴内外的环流模式. 研究发现, 在外加电场作用下, 液滴会发生“扁长型”或“扁圆型”变形, 并在内部形成稳定的环流, 液滴只会发生变形, 而不会发生宏观运动; 随着电场强度的增加, 液滴的变形越来越大, 小变形情况下, 模拟值与理论值基本吻合, 验证了数值方法的正确性; 当液滴的变形量较大时, 模拟结果开始偏离理论值, 与实验观察结果一致. 此外, 电导率比值的改变对液滴变形的影响也比较明显, 而介电常数比的改变对液滴变形的影响则不太明显.

基于增量预训练和对抗训练的文本匹配模型

司志博文，李少博，单丽莉，孙承杰，刘秉权

2022, 31(11):349-357. DOI: 10.15888/j.cnki.csa.008778

摘要 (784) HTML (1714) PDF 2.06 M (1948) 评论 (0) 收藏

摘要:文本匹配是自然语言理解的关键技术之一, 其任务是判断两段文本的相似程度. 近年来随着预训练模型的发展, 基于预训练语言模型的文本匹配技术得到了广泛的应用. 然而, 这类文本匹配模型仍然面临着在某一特定领域泛化能力不佳、语义匹配时鲁棒性较弱这两个挑战. 为此, 本文提出了基于低频词的增量预训练及对抗训练方法来提高文本匹配模型的效果. 本文通过针对领域内低频词的增量预训练, 帮助模型向目标领域迁移, 增强模型的泛化能力; 同时本文尝试多种针对低频词的对抗训练方法, 提升模型对词级别扰动的适应能力, 提高模型的鲁棒性. 本文在LCQMC数据集和房产领域文本匹配数据集上的实验结果表明, 增量预训练、对抗训练以及这两种方式的结合使用均可明显改善文本匹配结果.

格点QCD基础求解器及其异构计算实现的性能优化

杨子江，张克龙，刘倩，徐顺，孙鹏

2022, 31(11):358-364. DOI: 10.15888/j.cnki.csa.008774

摘要 (935) HTML (1431) PDF 1.56 M (1600) 评论 (0) 收藏

摘要:格点量子色动力学(格点QCD)是研究夸克、胶子等微观粒子间相互作用的重要理论和方法. 通过将时空离散化为四维结构网格, 并将量子色动力学的基本场量定义在网格上, 让研究人员可以使用数值模拟方法, 从第一性原理出发研究强子间相互作用和性质, 但这个过程中的计算量极大, 需要进行大规模并行计算. 格点QCD计算的核心基础为格点QCD求解器, 是程序运行主要的计算热点模块. 本文研究在国产异构计算平台下格点QCD求解器的实现与优化, 提出一套格点QCD求解器的设计实现, 实现了BiCGSTAB求解器, 显著降低了迭代次数; 通过对奇偶预处理技术, 降低了所求问题的计算规模; 针对国产异构加速卡的特点, 优化了Dslash模块的访存操作. 实验测试表明, 相比优化前的求解器获得了约30倍的加速比, 为国产异构超算下格点QCD软件性能优化提供了有益的参考价值.

融合残差上采样结构的P²Net无监督单目深度估计

刘安旭，黎向锋，刘晋川，赵康，李高扬，左敦稳

2022, 31(11):365-372. DOI: 10.15888/j.cnki.csa.008790

摘要 (691) HTML (1249) PDF 2.33 M (1603) 评论 (0) 收藏

摘要:单目深度估计是计算机视觉领域中的一个基本问题, 面片匹配与平面正则化网络(P²Net)是现阶段最先进的无监督单目深度估计方法之一. 由于P²Net中深度预测网络所采用的上采样方法为计算过程较为简单的最近邻插值算法, 使得预测深度图的生成质量较差. 因此, 本文基于多种上采样算法构建出残差上采样结构来替换原网络中的上采样层, 以获取更多特征信息, 提高物体结构的完整性. 在NYU-Depth V2数据集上的实验结果表明, 基于反卷积算法、双线性插值算法和像素重组算法的改进P²Net网络相较原网络在均方根误差RMSE指标上分别降低了2.25%、2.73%和3.05%. 本文的残差上采样结构提高了预测深度图的生成质量, 降低了预测误差.

聚类概率矩阵分解的变分推断及应用

刘杰，叶子锋

2022, 31(11):373-379. DOI: 10.15888/j.cnki.csa.008766

摘要 (739) HTML (916) PDF 5.45 M (1526) 评论 (0) 收藏

摘要:概率矩阵分解模型根据用户历史交互信息个性化推荐商品, 是协同过滤中的经典方法之一. 传统矩阵分解假设下无法利用不同用户之间的相似性, 且在面对异常值时常预测失准. 根据用户聚类信息, 可构建共轭先验分布与类别相关的聚类概率矩阵分解模型, 同时改变相关共轭先验分布形式, 完成对参数作正则化处理. 通过变分推断, 理论推导变分参数的显式表达式, 从而建立相应评分预测算法. 模拟及真实数据集均表明该模型的预测性能优于基准模型, 并能对用户评分做出现实解释.

基于谱聚类的Web多级缓存替换策略

刘露，吴珏，杨雷，杨福军

2022, 31(11):380-386. DOI: 10.15888/j.cnki.csa.008797

摘要 (719) HTML (821) PDF 1.59 M (1321) 评论 (0) 收藏

摘要:服务器缓存性能的核心是缓存替换策略, 缓存替换策略直接影响缓存的命中率, Web缓存可以解决网络拥塞和用户访问延迟问题, 提高服务器的性能. 传统缓存替换算法的命中率往往不高, 为此文中提出了一种基于谱聚类的多级缓存替换策略. 该策略利用循环滑动窗口机制提取日志文件的多项时序特征和访问属性, 通过谱聚类对过滤后的数据集进行聚类分析从而得到访问预测结果. 多级缓存替换策略综合考虑了缓存对象的局部频率、全局频率以及资源大小能更好地对低价值资源进行剔除, 同时对高价值资源进行保留. 通过与传统替换算法LRU、LFU、RC、FIFO进行实验对比, 实验结果表明本文将谱聚类和多级缓存替换策略进行结合有效地提高了缓存请求命中率和字节命中率.

基于排序学习的复杂网络节点接近中心性近似排序

陈妤，秦威

2022, 31(11):387-392. DOI: 10.15888/j.cnki.csa.008645

摘要 (650) HTML (1189) PDF 1.64 M (1780) 评论 (0) 收藏

摘要:随着网络规模的增大, 节点接近中心性的精确算法效率越来越低. 本文提出一种基于RankNet排序学习算法的模型以快速逼近复杂网络节点接近中心性排序. 首先通过相关性分析得到与接近中心性呈正相关的节点重要度指标作为模型的输入特征, 然后在给定网络中随机选取节点子集用于模型的训练样本数据. 在一个真实航空网络数据集和典型的复杂网络模型上对提出的模型进行了验证, 实验结果表明基于RankNet排序学习算法的模型能够在一定程度上降低计算时间复杂度, 而且保持了较高的近似准确性, 所提出的模型排序效果明显优于采用回归学习的基准模型.

基于MFCC-IMFCC和GA-SVM的鸟声识别

韩鹏飞，陈晓

2022, 31(11):393-399. DOI: 10.15888/j.cnki.csa.008819

摘要 (798) HTML (1539) PDF 1.50 M (1622) 评论 (0) 收藏

摘要:鸟声识别研究中声音特征选取对识别分类的准确度有很大影响. 为了提高鸟声识别正确率, 针对传统的梅尔倒谱系数(MFCC)对鸟声高频信息表征不足. 提出了基于Fisher准则MFCC和翻转梅尔倒谱系数(IMFCC)的特征融合, 得到新的特征参数MFCC-IMFCC应用于鸟声识别, 提高对鸟声高频信息表征. 同时通过遗传算法(GA)对支持向量机(SVM)中的惩罚因子C和核参数g进行优化, 训练出GA-SVM分类模型. 实验表明, 在同一条件下, MFCC-IMFCC与MFCC相比, 识别率有一定的提高.

微信公众号

网站二维码

>综述文章

当期目录

年份

刊期