2023, 32(5):1-10. DOI: 10.15888/j.cnki.csa.009086 CSTR:
摘要:注意力不能集中是一种注意力障碍, 该现象普遍存在于青少年中, 这直接影响人们的学习和工作效率. 传统的注意力检测方法大多依赖对表情、姿势等行为的观察, 难以客观精准地反映注意力情况. 随着生理检测技术的迅猛发展, 基于脑电信号的注意力检测近年来受到极大的关注. 然而, 相关研究仍存在检测准确率不高的问题. 本研究收集了155位大学生在注意力集中、注意力非集中和放松3种状态下的脑电信号, 并基于信号的小波特征、微分熵特征及功率谱特征, 采用多种机器学习方法对3种注意力状态进行了识别. 结果表明, 脑电信号的小波特征, 微分熵特征及功率谱特征可以有效区分被试的注意力状态, 且基于对称双通道特征的平均准确率为(80.84±3)%, 其检测精度明显高于基于单通道特征的检测精度.
2023, 32(5):11-19. DOI: 10.15888/j.cnki.csa.009063 CSTR:
摘要:地貌晕渲是大尺度战场仿真中的重要一环, 针对现有的地貌晕渲技术在细节处纹理特征不明显的问题, 提出了一种结合高程曲率和环境光遮蔽的大尺度战场地貌晕渲增强方法. 第1步, 通过分析数字高程数据的曲率属性生成地形曲率图, 曲率图与卫星影像叠加可以突出显示地貌特征线. 第2步, 提出一种基于深度可分离卷积的环境光遮蔽计算方法, 能够增强战场地形在沟壑处的视觉表现. 最后将曲率图、环境光遮蔽与卫星影像三者融合生成实时地貌晕渲效果. 实验表明, 本文方法可以在较低级别的全球卫星影像上呈现更好的视觉效果, 使得观察者在把握三维地形整体走势的同时, 能进一步分析地貌细节处的纹理特征.
2023, 32(5):20-27. DOI: 10.15888/j.cnki.csa.009062 CSTR:
摘要:为对半导体晶圆的表面缺陷进行快速检测, 提出一种基于深度可分离卷积和注意力机制的轻量级网络, 并在WM-811K数据集上进行了实验. 为解决该数据集中9种不同类别的缺陷比例相对不平衡问题, 采用了数据增强方法对较少数据的缺陷类别进行数据扩充. 本文模型中的深度可分离卷积可以降低模型的参数量, 提高模型的推理速度; 注意力机制可以使模型更加关注晶圆图像中有缺陷的区域, 使模型达到更好的分类效果. 实验表明, 所提方法在WM-811K数据集上的平均准确率高达96.5%, 相对于ANN、VGG16、MobileNetv2等方法均有不同程度的提高, 并且参数量和运算量只是经典轻量级网络MobileNetv2的73.5%和28.6%.
2023, 32(5):28-35. DOI: 10.15888/j.cnki.csa.009120 CSTR:
摘要:近年来, 研究者们发现基于双分支结构的高光谱图像分类方法可以更有效地提取图像的光谱特征和空间特征用于分类. 但在双分支结构中, 各分支只侧重于细化、提取光谱特征或空间特征, 忽略了对光谱-空间跨维特征交互的研究, 且两分支各自提取的部分交互不明显, 因此影响了分类的性能. 针对这一问题, 本文提出了一种基于全局注意力信息交互的高光谱图像分类方法. 首先采用密集连接网络分两个分支分别细化图像的光谱特征和空间特征, 然后结合全局注意力机制(GAM)得到通道全局注意力特征和空间全局注意力特征, 最后通过一个信息交互的模块实现光谱和空间信息的交互, 更充分地利用光谱和空间信息实现分类. 本文提出的方法分别在 Pavia University (PU)和Salinas Valley (SV)两个数据集上进行了实验, 相较于其他的4种方法, 本文提出的方法在分类性能上取得了明显的提升.
2023, 32(5):36-44. DOI: 10.15888/j.cnki.csa.009055 CSTR:
摘要:使用人工势场法进行无人机路径规划时, 往往存在目标不可达、运动轨迹迂回反复和路径长度过长等问题. 传统的人工势场法不能根据环境具体信息对斥力系数进行调整, 而现有的改进方法不能在自适应调整斥力系数的同时兼顾规划效果和规划时长. 针对以上问题, 提出了一种基于深度学习的无人机自适应斥力系数路径规划方法. 首先通过融合遗传算法与人工势场法找出在特定环境下最合适的斥力系数样本集, 其次利用该样本集训练残差神经网络, 最后通过残差神经网络计算适应环境的斥力系数, 进而使用人工势场法进行路径规划. 仿真实验表明, 该方法在一定程度上解决了人工势场法规划中目标不可达、运动轨迹迂回反复和路径长度过长等问题, 规划效果和规划时长方面均有优异表现, 能很好地满足无人机路径规划中对当前环境的自适应要求和快速规划的要求.
2023, 32(5):45-56. DOI: 10.15888/j.cnki.csa.009110 CSTR:
摘要:在移动边缘计算(mobile edge computing, MEC)系统中, 用户的卸载策略会影响能耗和计算成本, 进而影响用户效益. 然而, 目前多数研究未考虑边缘服务器随机分布场景中用户的卸载策略和资源请求策略对效益的影响. 针对该问题, 提出了一种基于改进双重拍卖算法的计算卸载和资源分配策略. 首先, 该策略将用户与边缘服务器之间的交互过程建模为Stackelberg博弈, 并且证明了在该博弈内存在唯一纳什均衡点; 其次, 计算出用户对于不同服务器的卸载意愿以及计算资源请求量, 并将用户与最优服务器进行拍卖; 最后, 采用遍历法交换上一轮拍卖中部分交易中的用户与服务器, 以实现系统整体效益最优. 仿真实验结果表明, 与其他基准算法相比, 所提算法在服务器随机分布场景下提高了33.4%的系统用户总效益, 有效降低系统损失.
2023, 32(5):57-66. DOI: 10.15888/j.cnki.csa.009070 CSTR:
摘要:容器监控是保证容器基础设施正常运行的核心要素之一, 然而当前容器监控角度较为单一, 尚缺少直观有效的方法协助运维人员快速定位业务容器异常原因. 本文设计并实现了一个面向Kubernetes的容器立体化监控系统, 通过监控指标相关性分析, 把相关性较强的指标作为立体化监控的核心指标提供给运维人员, 更好地实现对容器的全局统筹监控.
2023, 32(5):67-76. DOI: 10.15888/j.cnki.csa.009105 CSTR:
摘要:为提升航空兵场站信息化建设过程中的数据应用与管理能力, 提出了一种基于Spark的场站飞行保障大数据可视化平台. 以场站信息化系统和物联网络数据采集数据为基础, 利用Spark计算引擎集成Kafka消息队列, 使用Hive完成数据列表库的建立和存储, 基于Spark RDD和Spark SQL完成数据预处理与交互, 并选择Vue框架嵌入ECharts组件完成前端数据可视化呈现, 并最终对设计方案进行了实现与应用. 相较于当前业务隔离的信息系统建设模式, 平台具备更高的数据融合与处理分析能力, 能够更好地实现场站飞行保障数据价值.
2023, 32(5):77-86. DOI: 10.15888/j.cnki.csa.009103 CSTR:
摘要:为保证气象部门各单位对外服务时天气实况数据的统一、准确和高时效, 针对基于用户位置服务的应用场景, 对我国区域范围内1 km分辨率的天气实况数据, 按照经度进行1°间隔的切块整合, 设计了分块数据处理、存储和查询模型; 并采用微服务应用模式开发了天气实况数据服务接口, 数据服务延时提升到分钟级, 系统支持20万以上访问并发量, 为解决同一时刻同一位置不同应用发布的天气实况数据不一致的问题提供了技术支撑. 截至2021年12月, 已向全国气象部门54个应用提供天气实况数据, 单月访问量超过1亿, 系统的高并发、高时效、高可用得到验证.
2023, 32(5):87-96. DOI: 10.15888/j.cnki.csa.009102 CSTR:
摘要:潜油电泵井系统是油田开采重要工具, 具有排量大、扬程高与作业环境灵活多变等优点. 为了降低潜油电泵井系统故障危害, 需要对其发生故障部件进行快速精确定位并维修. 本文提出一种基于知识图谱的潜油电泵井故障诊断方法. 采用改进BiLSTM-CRF实体识别算法与BERT关系抽取算法提取故障数据中的专家知识, 构建潜油电泵井故障诊断领域知识图谱; 利用构建知识图谱搭建以故障征兆为初始节点的贝叶斯推理网络, 利用历史故障数据与条件概率解耦的计算方式推理出故障原因. 本文通过故障诊断真实案例进行方法验证.
2023, 32(5):97-104. DOI: 10.15888/j.cnki.csa.009087 CSTR:
摘要:医疗机构之间的医疗数据共享对于实现跨医院诊断并促进医学研究发展有着举足轻重的作用. 为了解决医疗机构之间医疗数据共享困难的问题, 我们提出了一种基于跨链的医疗数据安全共享方案. 采用中继链、跨链网关和数据链结合的跨链架构, 结合AES和CP-ABE加密算法进行细粒度的医疗数据访问控制. 同时利用可搜索加密技术实现医疗数据的安全搜索. 为缓解区块链的计算存储开销, 将IPFS和区块链相结合, 链下存储密文, 链上存储密文地址和密钥. 通过安全性分析和实验证明, 该方案在医疗数据安全共享方面具有可行性.
2023, 32(5):105-111. DOI: 10.15888/j.cnki.csa.009078 CSTR:
摘要:针对目前基于神经网络的多视图立体视觉(multi-view stereo, MVS)深度估计算法存在参数量大、内存消耗严重, 难以满足当下低算力嵌入式平台的需求. 提出基于MVS2D极线注意力机制与MobileNetV3-Small的MVS深度感知网络(Mobile-MVS2D). 该网络采用编码器-解码器的结构, 使用MobileNetV3-Small网络进行编码特征提取, 对源图像与参考图像之间不同特征层的尺度信息耦合采用极线注意力机制, 解码阶段引入SE-Net与跳跃连接扩展解码特征细节, 提升预测精度. 实验结果表明, 提出的模型在ScanNet数据集中在深度图的评价指标中展现较高的精度. 在与视觉SLAM结合下可以展现出较准确的三维重建效果, 具有较好的鲁棒性. 在Jeston Xavier NX 上推理精度为Float16尺寸为640×480的图片组, 仅需0.17 s, GPU消耗仅需1 GB, 能够满足低算力嵌入式平台的需求.
2023, 32(5):112-122. DOI: 10.15888/j.cnki.csa.009088 CSTR:
摘要:为了在使用少量标注样本情况下提升变电站设备缺陷检测精度, 提出一种基于自监督模型SimSiam的改进缺陷检测算法. 不同于原始SimSiam, 改进后的算法无需使用标志性图像(iconic images), 如ImageNet数据集, 而是直接利用非标志性图像(non-iconic images)如COCO数据集进行对比学习, 并在下游的缺陷检测任务上获得可媲美有监督方法的性能. 通过在投影层(projection head)和预测层(prediction head)中使用全卷积网络和空间注意力模块来代替MLP, 保留高维特征的空间结构及局部信息; 同时在计算相似度前先对特征图进行均值池化以得到特征向量, 并对特征向量进行归一化以计算欧氏距离, 从而改进了自监督对比学习的损失函数. 实验结果表明该算法能充分利用非标志性图像进行对比学习, 并在只标注少量样本的条件下提升变电站设备缺陷检测的精度, 在表计表盘破损、挂空悬浮物、鸟巢、呼吸器硅胶变色及箱门闭合异常等5类缺陷检测任务上mAP达到83.84%.
2023, 32(5):123-131. DOI: 10.15888/j.cnki.csa.009082 CSTR:
摘要:对于血液中红细胞、白细胞、血小板等成分的观察和计数是临床医学诊断的重要依据. 血细胞的异常意味着可能存在凝血异常、感染、炎症等与血液相关的问题. 人工检测血细胞不仅耗费人力, 且容易出现误检、漏检的情况. 因此, 针对上述情况, 提出一种新颖的血细胞检测算法—YOLOv5-CBF. 该算法在YOLOv5框架的基础上, 通过在主干网络中加入坐标注意力(coordinate attention, CA)机制, 提高检测精度; 将颈部网络中的FPN+PAN结构中改为结合了跨尺度特征融合方法(bidirectional feature pyramid network, BiFPN)思想的特征融合结构, 使目标多尺度特征有效融合; 在三尺度检测的基础上增加了一个小目标检测层, 提高对数据集中小目标血小板的识别精度. 通过在数据集BCCD上进行的大量的实验结果表明: 与传统的YOLOv5算法相比较, 该算法在3类血细胞检测的平均精度提升2.7%, 试验效果良好, 该算法对血细胞检测具有很高的实用性.
2023, 32(5):132-140. DOI: 10.15888/j.cnki.csa.009085 CSTR:
摘要:针对道路监控下因监控探头高度角度不同, 目标非机动车辆存在不同形式的模糊形变问题且特征信息不足造成的漏检误检现象, 提出了一种融合VovNet网络和可变形卷积的非机动车辆检测模型. 使用一次聚类连接网络(VovNet)结合原网络特点提出的CSPVovNet替换原有的CSPDarknet主干网络进行特征的提取, 增强了有效特征的复用, 缓解因深层卷积造成的小目标物体特征信息进一步丢失的问题. 将可变形卷积引入到不同的网络层替换传统卷积, 在公共数据集Pascal VOC2007和自建非机动车辆数据集上分别训练测试, 根据最终性能选择YOLOv5-C方案. 改进后的网络选取EIoU_loss作为定位损失, 通过消融实验验证得出最终改进对网络性能有所提升, 最终的网络优化结果较原YOLOv5s网络mAP提升了4.14个百分点, 对漏检误检现象很好的缓解.
2023, 32(5):141-148. DOI: 10.15888/j.cnki.csa.009061 CSTR:
摘要:为有效改善多图像加密质量及其对数据传输的安全性, 提出一种基于超混沌系统的多权限多图像加密算法. 首先, 将L幅明文图像分别进行分段线性混沌映射(piece-wise linear chaotic map, PWLCM)的双层交叉耦合操作, 并通过异或进行合并得到类噪声图像; 接着, 采用最低有效位嵌入算法将类噪声图像嵌入到第L+1幅明文图像信息中, 得到半加密图像; 最后, 通过结合一维的cubic映射和一维帐篷映射, 产生一个二维cubic-帐篷混沌映射(two-dimensional cubic-tent modular map, 2D-CTMM), 利用其对半加密图像扩散后进行双层阶梯置乱, 得到密文图像. 实验结果表明: 所提方法对明文以及密钥十分敏感, 密钥空间大, 可以有效抵御统计攻击和差分攻击, 并且该算法在保证安全性的前提下, 实现了用户多权限解密以及用户部分解密工作.
2023, 32(5):149-156. DOI: 10.15888/j.cnki.csa.009064 CSTR:
摘要:海洋渔业领域中渔船轨迹数据具有时空性和非平稳性的特点, 针对目前渔船作业方式识别方法存在对数据信息提取不充分及识别精度低的问题, 提出了一种基于一维卷积神经网络(one-dimensional convolutional neural network, 1DCNN)和加入自注意力(self-attention)的门控循环单元网络(gated recurrent unit, GRU)的渔船作业方式识别模型(1DCNN-SAGRU). 模型利用一维CNN和GRU充分提取渔船轨迹数据的局部空间特征和时序上的依赖关系, 并引入自注意力机制强化模型对关键信息的关注能力. 最后引入dropout方法和RAdam优化器对模型进行改进和优化, 防止模型过拟合的同时加快网络的收敛速度和输出准确性. 经实验和分析表明, 相较于其他对比模型, 该模型在准确率上最高可提升4.4个百分点, 说明该模型能更准确地识别渔船拖网、围网和刺网作业, 有利于加强渔船监管能力和渔业资源的保护.
2023, 32(5):157-163. DOI: 10.15888/j.cnki.csa.009099 CSTR:
摘要:在机器阅读理解任务中, 由于中文实词的组合性和隐喻性, 且缺乏有关中文实词辨析的数据集, 因此传统方法对中文实词的理解程度和辨析能力仍然有限. 为此, 构建了一个大规模(600k)的中文实词辨析数据集(Chinese notional word discrimination cloze data set, CND). 在数据集中, 一句话中的一个实词被替换成了空白占位符, 需要从提供的两个候选实词中选择正确答案. 设计了一个基线模型RoBERTa-ND (RoBERTa-based notional word discrimination model)来对候选词进行选择. 模型首先利用预训练语言模型提取语境中的语义信息. 其次, 融合候选实词语义并通过分类任务计算候选词得分. 最后, 通过增强模型对位置及方向信息的感知, 进一步加强了模型的中文实词的辨析能力. 实验表明, 该模型在CND上准确率达到90.21%, 战胜了DUMA (87.59%), GNN-QA (84.23%)等主流的完形填空模型. 该工作填补了中文隐喻语义理解研究的空白, 可以在提高中文对话机器人认知能力等方向开发更多实用价值. 数据集CND及RoBERTa-ND代码均已开源: https://github.com/2572926348/CND-Large-scale-Chinese-National-word-discrimination-dataset.
2023, 32(5):164-171. DOI: 10.15888/j.cnki.csa.009053 CSTR:
摘要:针对飞针测试机检测电路板时检测时间长、测试效率低、单针检测容易撞针等问题, 提出了一种基于改进粒子群算法的测试路径规划算法. 首先, 使用分区检测的方式解决两针相撞问题; 其次, 提出一种改进的粒子群算法, 在粒子群算法的基础上加入混沌初始化公式用于约束和更新搜索的最大速度, 引入遗传算法的交叉、变异的思想, 改进粒子群算法易于趋于局部最优的缺陷, 提升了算法的全局搜索能力. 与粒子群算法、遗传算法进行有效性的对比分析与实机测试. 结果表明: 此算法可以有效解决测试时两针相撞问题; 比起其他两种算法改进粒子群算法在更少的迭代数的同时全局搜索能力更强, 可以减少30%算法运算时间、降低10%的测试距离, 具有一定的工程应用价值.
2023, 32(5):172-179. DOI: 10.15888/j.cnki.csa.009056 CSTR:
摘要:为了实时检测并识别路上的交通标志, 针对在不良光照情况影响下小型交通标志的识别精确度较低、误检、漏检严重的问题, 提出了一种基于改进YOLOv5的交通标志识别模型.首先在YOLOv5模型的浅层特征图层增加一次concat操作, 将浅层的特征信息结合中间特征图层作为一个检测头, 有利于小目标交通标志的识别效率. 其次将坐标注意力机制添加到YOLOv5模型中, 从而提高特征提取的效率. 对中国交通标志数据集TT100K进行数据扩充和暗光增强的操作, 最后在经过预处理的TT100K数据集上验证本文改进的模型检测效果. 实验结果表明本文改进的模型对小目标及昏暗情况的交通标志识别效率有很大的提升. 本文改进的YOLOv5模型与最初的YOLOv5模型均在扩充后的数据集上进行训练后的结果相比, 在准确率上提升了1.5%, 达到了93.4%; 召回率提升了6.8%, 达到了92.3%; mAP值提高了5.2%, 达到了96.2%.
2023, 32(5):180-187. DOI: 10.15888/j.cnki.csa.009068 CSTR:
摘要:面对海量的在线学习资源, 学习者往往面临“信息过载”和“信息迷航”等问题, 帮助学习者高效准确地获取适合自己的学习资源来提升学习效果, 已成为研究热点. 针对现有方法存在的可解释性差、推荐效率和准确度不足等问题, 提出了一种基于知识图谱和图嵌入的个性化学习资源推荐方法, 它基于在线学习通用本体模型构建在线学习环境知识图谱, 利用图嵌入算法对知识图谱进行训练, 以优化学习资源推荐中的图计算效率. 基于学习者的学习风格特征进行聚类来优化学习者的资源兴趣度, 以获得排序后的学习资源推荐结果. 实验结果表明, 相对于现有方法, 所提方法能在大规模图数据场景下显著提升计算效率和个性化学习资源推荐的准确度.
2023, 32(5):188-195. DOI: 10.15888/j.cnki.csa.009073 CSTR:
摘要:在电子工业领域中, 印刷电路板(printed circuit board, PCB)缺陷检测已经变得越来越重要. PCB的部分微小损伤或者不规则损伤与其密集复杂的排线等视觉纹理信息高度相关. 传统卷积神经网络提取特征向量, 容易丢失纹理特征等中级视觉特征信息, 导致对于细微损伤和不规则损伤的检测效果不明显. 针对这一问题, 提出了基于孪生深度特征融合残差网络(Siamese deep feature fusion residual network)的PCB损伤分类模型. 模型的骨干网络采用ResNet50. 特征提取阶段将纹理信息等中级视觉特征和神经网络最终输出的高级语义特征融合为一个32维的特征向量. 两个特征的向量的相似性用L2距离表示, 用于判断PCB是否有缺陷. 在训练阶段应用了三元损失和交叉熵损失, 多个损失函数的组合提高了网络的准确性. 通过实验验证了模型的有效性, 在测试数据集上的准确率达到了(95.42±0.31)%的准确率, 实现了模型在PCB缺陷分类检测的可行性.
2023, 32(5):196-203. DOI: 10.15888/j.cnki.csa.009106 CSTR:
摘要:人工神经网络发展至今, 已经在计算机视觉、类脑智能等方面得到广泛应用. 在过去几十年中, 人们对神经网络的研究注重追求更高的准确率, 从而忽略了对网络计算成本的控制. 而人脑作为高效且节能的网络, 其对人工智能的发展起到了重要启示作用. 如何仿真生物脑网络的连接特性, 建立超低能耗的人工神经网络模型实现基本相同的目标识别正确率成为当前研究的热点. 为建立低能耗的人工神经网络模型, 本文结合大脑网络的连接特性, 通过改变人工神经网络的连接实现网络的高效性. 实验结果表明, 结合生物脑网络的连接特性, 改变网络的连接, 很大程度上减少了网络的计算成本, 而网络的性能并没有受到明显影响.
2023, 32(5):204-211. DOI: 10.15888/j.cnki.csa.009083 CSTR:
摘要:针对大脑认知完好无损的患者, 却患有重度神经肌肉疾病导致肢体行动受限的问题, 为使患者重新获取障碍肢体的自主控制能力, 本文提出了一种机械臂抓取任务的脑电分类方法对患者进行障碍肢体运动康复训练. 首先使用非侵入式脑电技术对运动想象脑电信号进行采集, 通过预处理、特征提取以及多尺度特征融合卷积神经网络进行分类识别; 最后利用分类模型得到的标签解码成机械臂能够识别的指令, 控制机械臂完成特定任务. 实验结果表明: 实验选取的15名健康受试者运动想象实验采集的脑电数据具有可行性, 平均准确率达到了82%以上; 为机械臂抓取任务的脑电分类提供了一种新思路.
2023, 32(5):212-219. DOI: 10.15888/j.cnki.csa.009107 CSTR:
摘要:针对DeepLabV3+在特征提取阶段忽略了不同尺度特征重要程度出现的部分细节信息损失导致图像分割不细致, 提出一种融合双分支特征提取和注意力机制的改进算法. ResNet101骨干网络初步提取出的特征图作为注意力机制的输入特征, 解决了网络退化及梯度消失的问题, 也能够捕获到被DeepLabV3+忽略的图像细节信息; 设计双分支特征提取机制扩大特征提取能力, 细化图像边缘信息以优化网络对不同尺度特征关注不均的问题; 同时, 联合采用交叉熵损失和类别不平衡函数两种损失函数作为损失函数, 通过聚焦于前景样本降低背景的影响, 提高算法分割精度. 实验结果表明, 改进算法在PASCAL VOC 2012和CityScapes数据集上的平均交并比(MIoU)值分别达到了79.92%和68.59%, 与经典算法和基于DeepLabV3+改进的算法相比, 特征提取的准确性有所提高, 分割效果更优.
2023, 32(5):220-226. DOI: 10.15888/j.cnki.csa.009104 CSTR:
摘要:针对标准的扩展目标泊松多伯努利(Poisson multi-Bernoulli, PMB)滤波器难以有效跟踪衍生目标的问题, 提出一种改进的PMB跟踪算法. 算法采用随机矩阵法对扩展目标外形和尺寸建模, 在滤波预测阶段利用多假设模型对衍生事件进行预测, 得到多个伽玛高斯逆威沙特 (gamma Gaussian inverse Wishart, GGIW)预测假设分量, 最后在滤波更新阶段对预测分量更新得到扩展目标的运动状态和扩展形状估计. 仿真结果表明, 与标准的PMB滤波算法相比, 所提算法有效改善衍生扩展目标的跟踪性能.
2023, 32(5):227-233. DOI: 10.15888/j.cnki.csa.009071 CSTR:
摘要:针对目前基于深度学习的高分辨率遥感图像分割模型由于参数量大、计算复杂而导致高延迟、低响应的问题, 提出了一种轻量级遥感地物分割方法, 较好的平衡了速度和精度. 该方法使用MobileNetV2进行特征粗提取, 通过构建空间信息嵌入分支实现不同尺度的特征细提取, 不同层次之间引入密集连接以获取密集的上下文信息. 解码端设计特征融合优化策略逐层融合不同尺度的特征增加对细粒度特征的感知, 同时以反卷积与双线性插值交替的上采样方式减少图像边缘信息丢失. 最后采用交叉熵损失与Dice损失结合的方式加快网络收敛速度. 为了验证所提方法的有效性, 与几种常用的语义分割方法进行了对比实验. 实验结果表明, 所提算法的分割准确率为93.7%, MIoU为88.01%, 可以实现地物的有效分割.
2023, 32(5):234-243. DOI: 10.15888/j.cnki.csa.009072 CSTR:
摘要:蚊虫是多种疾病的传播媒介, 对病媒蚊虫的监测是预防蚊媒疾病的关键, 针对传统病媒蚊虫的人工鉴定方法成本较高且效率低下, 提出深度学习下的病媒蚊虫分类方法, 基于迁移学习, 微调(fine-tuning) ResNet18、DenseNet121、MobileNetV2这3种ImageNet预训练模型, 在900张少量蚊虫数据集下采用K折交叉验证, 对埃及伊蚊、白纹伊蚊、库蚊3种蚊虫进行分类, 评估模型性能, 平均峰值准确率分别达到了95%、97%、97%. 最后, 利用在900张蚊虫数据集下重新训练后的模型, 对344张蚊虫图像进行预测, 其中轻量化模型MobileNetV2达到了最高0.95的精准率(precision)、召回率(recall)、F1 score. 结合3种模型的最终预测准确率, 得出轻量化的模型MobileNetV2在少量数据集下表现更优. 实验改变了以往的模型微调方式, 通过设置模型分类层学习率为前层学习率的10倍, 与前人实验相比, 对白纹伊蚊的预测准确率提高了5%–6%, 解决了少量数据样本的训练收敛问题, 进一步拓展了病媒蚊虫识别的适用环境.
2023, 32(5):244-252. DOI: 10.15888/j.cnki.csa.009081 CSTR:
摘要:随着检索式问答技术的日趋成熟, 如何有效利用现有的模型和检索工具, 达到问答系统的整体优化, 是亟待研究的现实问题. 提出了一种基于深度语义的三阶段式问题检索模型 (TSFR-RM), 用于构筑智能客服问答系统. 首先基于深度学习方法计算用户问题和知识库问题的文本表征相似度, 锁定top-k候选答案集, 同时赋予模型泛化检索的能力; 其次针对用户问题与知识库问题答案对, 构造多角度语义特征, 进行精确比对计算; 最后构造状态预测模型返回问题检索精准答案. 通过真实文旅机构客服问答数据集实验及实际应用效果表明, 该模型相较于其他基于特征和表征的问题检索模型, 在精确率(precision)性能指标上最高提升9.3个百分点, 提升优化了智能客服检索系统的准确性.
2023, 32(5):253-261. DOI: 10.15888/j.cnki.csa.009131 CSTR:
摘要:远程监督关系抽取方法旨在高效的构建大规模的监督语料并应用在关系抽取的任务上. 但是由于远程监督构建语料的方式, 带来了噪声标签和长尾分布两大问题. 本文提出了一种新颖的远程监督关系抽取模型架构, 与以往的基于管道的训练形式不同, 除了句子编码器模块, 新添加了外部知识增强模块. 通过对知识库中已存在的实体类型与关系进行预处理和编码, 为模型提供句包文本所没有的外部知识. 有利于缓解数据集中存在部分长尾关系示例不足所导致的信息不足的问题, 以及提升了模型对噪声示例的判别能力. 通过在基准数据集NYT和GDS上的大量实验, 相较于主流最优模型在AUC值上分别提升了0.9%和5.7%, 证明了外部知识增强模块的有效性.
2023, 32(5):262-272. DOI: 10.15888/j.cnki.csa.009109 CSTR:
摘要:翻越行为检测对疫情管控、社会治安等有着重要意义, 一定程度上可以减少因为违规翻越行为而造成的意外事故. 针对目前翻越行为检测任务实时性差、需要先验知识的问题, 本文将Faster RCNN+SlowFast时空行为检测算法应用在翻越行为检测任务中, 将翻越行为进行拆分检测. 为提高时空行为检测算法中目标的检测精度和速率将目标检测模块Faster RCNN改为实时性高且轻量化的YOLOv5; 其次针对同一行为不同视角下广泛的类内多样性的问题, 将Fast支路和Slow支路的residual block分别改为 AC residual block和SE residual block来加强网络对关键特征与细粒度特征的学习能力, 最后设计翻越行为检测算法进行攀爬与下降两种状态的连续性检测, 实验结果显示该网络平均准确率达93.5%, 在翻越行为检测中表现出良好的性能.
2023, 32(5):273-282. DOI: 10.15888/j.cnki.csa.009100 CSTR:
摘要:针对视频描述生成的文本质量不高与不够新颖的问题, 本文提出一种基于特征强化与文本知识补充的编解码模型. 在编码阶段, 该模型通过局部与全局特征强化增强模型对视频中静态物体的细粒度特征提取, 提高了对物体相似语义的分辨, 并融合视觉语义与视频特征于长短期记忆网络(long short-term memory, LSTM); 在解码阶段, 为挖掘视频中不易被机器发现的隐含信息, 截取视频部分帧并检测其中视觉目标, 利用得到的视觉目标从外部知识语库提取知识用来补充描述文本的生成, 以此产生出更新颖更自然的文本描述. 在MSVD与MSR-VTT数据集上的实验结果表明, 本文方法展现出良好的性能, 并且生成的内容信息在一定程度上能够表现出新颖的隐含信息.
2023, 32(5):283-290. DOI: 10.15888/j.cnki.csa.009054 CSTR:
摘要:在化工厂区的油罐车装卸区, 防止油罐车静电的产生和危害是避免加油车燃爆的重要手段, 通过静电接地线可以将油罐车感应的静电导走, 避免与外界物质产生跳火. 如何确保接地线在装卸车流程中正确安装不会被意外拆卸或提前拆卸是厂区急需解决的问题. 为确保在防爆区内用防爆摄像头的情况下能够对实时画面进行实时检测, 针对接地线连接角度不一, 拉伸后变细等特点提出将深度学习YOLOv5目标检测算法通过引入自注意力机制CotNet的方法. 在自制的接地线数据集上进行算法的检测速度和检测精度对比, 实验结果表明, 改进后的YOLOv5算法在速度稍有降低的情况下提高了5%的检测精度, 可以满足现场接地线检测需求.
2023, 32(5):291-299. DOI: 10.15888/j.cnki.csa.009066 CSTR:
摘要:语义蕴含识别旨在检测和判断两个语句的语义是否一致, 以及是否存在蕴含关系. 然而现有方法通常面临中文同义词、一词多义现象困扰和长文本难理解的挑战. 针对上述问题, 本文提出了一种基于Transformer和HowNet义原知识融合的双驱动中文语义蕴含识别方法, 首先通过Transformer对中文语句内部结构语义信息进行多层次编码和数据驱动, 并引入外部知识库HowNet进行知识驱动建模词汇之间的义原知识关联, 然后利用soft-attention进行交互注意力计算并与义原矩阵实现知识融合, 最后用BiLSTM进一步编码文本概念层语义信息并推理判别语义一致性和蕴含关系. 本文所提出的方法通过引入HowNet义原知识手段解决多义词及同义词困扰, 通过Transformer策略解决长文本挑战问题. 在BQ、AFQMC、PAWSX等金融和多语义释义对数据集上的实验结果表明, 与DSSM、MwAN、DRCN等轻量化模型以及ERNIE等预训练模型相比, 该模型不仅可以有效提升中文语义蕴含识别的准确率(相比DSSM模型提升2.19%), 控制模型的参数量(16 M), 还能适应50字及以上的长文本蕴含识别场景.
2023, 32(5):300-307. DOI: 10.15888/j.cnki.csa.009074 CSTR:
摘要:部分最大可满足性问题是可满足性问题的重要变体, 它可以同时处理硬约束和软约束, 因此可以对广泛的现实问题进行建模. 局部搜索求解器是为该问题寻找高质量解的主流方法, 它依赖于问题实例的初始数据状态. 本文针对局部搜索求解器SATLike3.0的初始解生成过程, 提出了优先满足硬约束的改进策略, 最终得到的算法名为HFCRP-F. 该算法作用于构造初始解和初始权重配置阶段, 主要包括优先传播尚未满足的硬约束中的未赋值变量, 以及根据已找到的解为约束增加初始权重, 由此指导后续的局部搜索过程. 本文采用MaxSAT Evaluation 2018–2021中的数据集对HFCRP-F和SATLike3.0进行测试, 结果表明HFCRP-F处理加权实例的性能明显优于SATLike3.0, 同时处理非加权实例的性能与SATLike3.0基本持平.
2023, 32(5):308-315. DOI: 10.15888/j.cnki.csa.009084 CSTR:
摘要:针对多变量时间序列复杂的时间相关性和高维度使得异常检测性能较差的问题, 以对抗训练框架为基础提出基于图自编码的无监督多变量时间序列异常检测模型. 首先, 将特征转换为嵌入向量来表示; 其次, 将划分好的时间序列结合嵌入向量转换为图结构数据; 然后, 用两个图自编码器模拟对抗训练重构数据样本; 最后, 根据测试数据在模型训练下的重构误差进行异常判定. 将提出的方法与5种基线异常检测方法进行比较. 实验结果表明, 提出的模型在测试数据集获得了最高的F1分数, 总体性能分F1分数比最新的异常检测模型USAD提高了28.4%. 可见提出的模型有效提高异常检测性能.
2023, 32(5):316-322. DOI: 10.15888/j.cnki.csa.009065 CSTR:
摘要:肝癌仍然是世界癌症死亡的主要原因, 如今血管介入治疗是其主要的治疗方式, 同时肝脏血管影像在该过程中有着关键作用, 能够为专业的医生提供重要的参考价值. 但是通过人工来标注血管是复杂且耗时的任务, 因此实现自动肝脏血管分割对相关工作有着重大意义. 本文提出了注意力门控单元, 用于提高网络信息提取能力, 并将该单元与UNetR网络相结合, 提出一种新的网络结构——UNetR-AGM. 在对腹部CT的预处理上使用了均衡过滤策略, 不仅提高血管和周围组织的对比度, 而且能够对血管完成粗分割. 为了验证所提出方法有效性, 本文将UNetR-AGM与其他人员的研究方法在MSD (medical segmentation decathlon)数据集上进行对比, 并分析算法的准确性. 实验结果表明, 本文采用的方法与其他模型相比具有更好的效果.
2023, 32(5):323-329. DOI: 10.15888/j.cnki.csa.009079 CSTR:
摘要:针对HLF (Hyperledger Fabric)区块链系统在排序阶段中存在的缺陷, 提出了一种基于对应比较图的图排序优化方案. 利用对应比较图具有相关不变性质的图合并过程以及其算法运行时间短的特点, 设计了一种基于交易重要度的拓扑算法, 旨在减少由于默认的顺序排序而导致的序列化冲突问题. 通过实验与分析, 表明该方案有效解决了原始方案的序列化冲突问题, 减少了系统中无效事务的比例, 提升了系统交易效率, 节省了大量的计算与存储资源.
2023, 32(5):330-337. DOI: 10.15888/j.cnki.csa.009101 CSTR:
摘要:近年来深度学习技术在地质学的应用越来越广泛. 地质学科中的一个重要课题是根据稀疏的空间观测数据建立合理的地下模型. 最近的工作通过条件生成对抗网络来探索条件化地质建模, 产生了逼真且符合空间观测数据的地质图像. 然而, 多数方法只关注将空间观测数据作为硬条件, 忽视了对生成图像中地质属性的调节. 本文引入地质属性标签调节地质图像中具体的地质属性表现, 将表征地质属性类别的标签数据作为生成条件之一, 扩展一个属性分类器与该标签配合, 从而实现更可控的图像生成. 针对属性标签的人工标注成本大的问题, 本文采用半监督聚类利用少量的标注数据为无标签数据自动分配标签. 此外, 聚类可能产生噪声标签影响建模结果, 此方法使用对称交叉熵损失改进分类网络以提高网络对于噪声标签的鲁棒性. 本文在黄河地区的河流地质数据集上进行大量实验, 结果表明所提出的方法对于不同的属性标签生成了地质模式不同且符合空间观测数据的逼真地质图像, 证明了本方法的有效性.
2023, 32(5):338-343. DOI: 10.15888/j.cnki.csa.009077 CSTR:
摘要:本文基于UVM验证方法学对自研高性能安全存储SoC芯片系统中SATA通路进行验证, 文中对高性能安全存储SoC芯片架构及SATA通路系统工作原理进行说明, 以SATA DMA数据传输方式为例介绍了SATA协议链路通信建立及数据传输过程. 搭建UVM系统验证平台, 文中对SATA协议进行分析, 设计规划系统层面测试用例, 编写加载至系统中运行的C固件测试程序, 实现对系统应用层面关注的PIO、DMA、NCQ等SATA命令方式数据传输通路的验证. 结合具体波形分析, 结果表明, SATA通路相关集成设计是合理、满足芯片对SATA数据通路应用需求的, 实现了对高性能安全存储SoC芯片系统SATA通路的验证.