2023, 32(2):1-12. DOI: 10.15888/j.cnki.csa.008743 CSTR:
摘要:随着三维视觉的快速发展, 基于深度学习的大规模三维点云实时处理成为研究热点. 以三维空间分布无序的大规模三维点云为背景, 综合分析介绍并对比深度学习实时处理三维视觉问题的最新进展, 对点云分割、形状分类、目标检测等方面算法优势与不足进行详细分析, 给出详细的性能分析与优劣对比, 并对点云常用数据集进行简要介绍, 并给出不同数据集的算法性能对比. 最后, 指出未来在基于深度学习方法处理三维点云问题上的研究方向.
2023, 32(2):13-24. DOI: 10.15888/j.cnki.csa.008938 CSTR:
摘要:区块链技术给加密货币带来了新的变化, 并得到了广泛的应用. 然而, 它仍面临着高吞吐量、低交易延迟、安全性和去中心化的需求和目标. 此外, 消费节点(交易提供者)的意愿难以映射到leader中, 区块开采者热衷于挖矿竞赛也导致中心化和能耗的加剧. 为此, 提出了一种不同于传统PoW (proof-of-work)共识的新型共识算法——PoM (proof-of-market), 及其第一个实施案例——Achain协议. PoM的算法设计使得消费节点进行PoW工作, 并投票选出leader节点. 这不仅离散化了挖矿的工作, 提升了去中心化, 降低了能耗, 还体现了消费节点的意愿, 只有受到最多支持的节点才能成为leader. 在性能上, 相较于PoW型区块链, Achain还提升了可扩展性, 此外, 还提供了一种Achain节点存储优化方案——FastAchain; 在安全性方面, Achain辅以一套激励相容的奖惩机制使得恶意节点的收益期望为负, 这保护了诚实节点的利益, 且Achain可以容忍至多1/3的全网总算力被恶意节点控制. 为了验证Achain的性能表现, 实施了一个大规模网络下的Achain原型用来评估其相关性能, 结果表明Achain达到了预期, 优于一些主流的代表性区块链协议, 且保持了良好的链收敛性和去中心化.
2023, 32(2):25-33. DOI: 10.15888/j.cnki.csa.008919 CSTR:
摘要:准确预测商业销售量未来趋势对于企业开发经营、政府宏观调控等至关重要. 传统的数据预测方法计算时间开销大, 具有主观性, 而现有基于数据驱动的未来商业预测方法没有考虑到数据集中的特征多样. 商业销售量数据是一个时序数据, 时序数据中包含了丰富的时间窗特征、滞后历史特征和价格变化趋势特征等众多特征, 先前的研究往往只注重于其中的某些特征, 对于特征的融合和增强探究偏少, 现有的未来商业预测方法的预测精度仍然有待提高. 为此, 本文提出了一种基于多模式特征聚合的未来商业预测方法, 该方法首先将商业销售量数据进行预处理; 然后基于特征工程提取数据集的5组不同的时间窗特征和其他特征; 在机器学习上对于5组时间窗特征采用硬投票机制选择合适的模型训练, 同时也采用神经网络的优化模型提取时序特征和预测结果, 然后分析销售量数据集和某些特征之间的依赖关系; 最后基于软投票模型完整地模型融合实现了商业销售量的高精度预测. 一系列实验结果表明, 本文提出的方法具有较高预测精度和效率, 明显优于现有预测方法.
2023, 32(2):34-44. DOI: 10.15888/j.cnki.csa.008953 CSTR:
摘要:如何测度各省工业绿色发展水平高低, 判断各省工业绿色创新能力差异, 本文从绿色投入要素和绿色产出效益视角构建集结综合属性值的工业绿色发展多指标评价体系; 并在云模型基础上提出了基于混合多维云模型的区间多属性测度方法. 该方法创新性地利用区间权重和云权重的相互转换, 在解决多指标权重不一的问题后, 再运用父云贴近度计算工业绿色发展水平, 云投影度测定工业绿色创新能力; 最后采用省际间的工业面板数据进行验证. 结果表明, 相较于一般的多指标综合评价法, 该测定方法的实证结果与实际情况更相符合, 说明了该方法既能对工业绿色发展水平的整体情况进行评价分析, 也能精确计算出各指标贡献度, 从而判断其是否具有工业绿色创新能力. 因此, 本研究可为各地区调整工业绿色发展水平测度指标、制定工业绿色发展规划提供实质性建议和理论决策依据.
2023, 32(2):45-54. DOI: 10.15888/j.cnki.csa.008943 CSTR:
摘要:现有基于神经网络的电池荷电状态(state of charge, SOC)预测研究大多把重点放在模型结构和相关参数的优化上, 却忽略了训练数据的重要作用. 针对该问题, 文中提出了一种基于特征选择和数据增强的电池SOC预测方法. 首先, 方法根据原始电池充放电数据进行特征工程, 并使用排列重要性(permutation importance, PI)方法选出对模型预测最有帮助的7个特征; 其次, 通过加入高斯噪声来扩大训练数据样本总量, 达到数据增强的目的. 实验使用双向长短时记忆网络(bidirectional long short-term memory, Bi-LSTM)作为预测模型, 使用Panasonic 18650PF数据集作为训练数据. 使用标准Bi-LSTM进行预测时, 平均绝对误差(mean absolute error, MAE)和最大误差(max error, MaxE)分别为0.65%和3.92%, 而在进行特征选择和数据增强后, 模型预测的MAE和MaxE分别为0.47%和2.62%, 表明PI特征工程与高斯数据增强方法可以进一步提升电池荷电状态预测模型的精度.
2023, 32(2):55-62. DOI: 10.15888/j.cnki.csa.008970 CSTR:
摘要:针对人脸表情识别在特征提取时容易丢失大量有用的特征信息, 无法提取更加全面的人脸表情特征的问题, 提出了一种多尺度特征融合网络模型(DS-EfficientNet). 该模型包括深层网络和浅层网络两部分, 浅层网络用来提取面部表情的细节纹理信息, 深层网络提取表情的全局信息. 并在浅层网络中加入注意力机制, 增强对浅层细节信息的提取能力. 最终在通道上进行特征融合, 融合之后网络可以提取更加丰富的人脸表情信息. 为了减少模型参数, 提高模型的泛化性能, 将全连接层替换为全局平均池化层, 加入批归一化. 本文提出的方法在Fer2013和CK+上进行实验, 识别准确率达到了73.47%和98.84%. 实验证明该方法可以提取人脸更加丰富的表情信息, 模型具有更强的泛化能力.
2023, 32(2):63-74. DOI: 10.15888/j.cnki.csa.008940 CSTR:
摘要:在全媒体时代下, 基于多模态数据的推荐具有重要意义. 本文使用文本、音频、图像3种模态数据进行推荐, 通过两个阶段进行张量融合: 第1阶段通过3个平行分支对任意两个模式的相关性进行建模和融合, 第2阶段再将3个分支的结果进行融合, 不仅考虑了两模态之间的局部交互作用, 并且消除了模态融合顺序对结果的影响; 在推荐模块中, 将融合特征通过堆叠降噪自编码器作为协同过滤的辅助特征进行推荐. 本文所构建的推荐系统中模态融合与推荐采用端到端的训练过程. 同时, 为了解决推荐结果中存在的相似度高、多样性差的问题, 我们基于二阶段的张量模态融合特征构建相似度矩阵, 在已有推荐结果的基础上进一步精化结果, 实现快速的多样性推荐. 实验证明, 基于本文提出的多模态融合特征的推荐模型不仅能够有效地提升推荐性能, 并且能够增强推荐结果的多样性.
2023, 32(2):75-82. DOI: 10.15888/j.cnki.csa.008962 CSTR:
摘要:目前深度学习在医学图像分析领域取得的良好表现大多取决于高质量带标注的数据集, 但是医学图像由于其专业性和复杂性, 数据集的标注工作往往需要耗费巨大的成本. 本文针对这一问题设计了一种基于深度主动学习的半自动标注系统, 该系统通过主动学习算法减少训练深度学习标注模型所需的标注样本数量, 训练完成后的标注模型可以用于剩余数据集的标注工作. 系统基于Web应用构建, 无需安装且能跨平台访问, 便于用户完成标注工作.
2023, 32(2):83-93. DOI: 10.15888/j.cnki.csa.008971 CSTR:
摘要:针对虹膜图像中存在眼镜遮挡、模糊、角度偏差等不同噪声因素, 我们设计了一种基于Mask R-CNN的卷积神经网络(convolutional neural network, CNN), 命名为Mask-INet, 用于虹膜分割. 该网络在特征提取阶段为特征金字塔添加了一条自底向上的路径, 既提高了底层到顶层特征的定位信息, 增强语义信息融合, 又进一步加快了底层到顶层的传播效率, 有效提升对虹膜特征提取的准确性. 为了进一步挖掘特征图中的特征信息, 在掩模预测分支阶段, 我们引入上采样和CBAM网络(convolutional block attention module), 利用上采样提高特征图的空间分辨率, 利用CBAM网络让特征图中的显著信息更加显著, 增强对特征的判别性. 该方法在NIR-ISL 2021比赛提供的虹膜数据集进行了验证. 在相同实验条件下与该赛事的冠军相比, 该方法的各项指标均优于其网络. 与基线Mask R-CNN相比, 该方法的Dice相似系数、平均交并比、召回率分别提升了8.53%、11.97%、8.88%, 提升了虹膜分割效果.
2023, 32(2):94-101. DOI: 10.15888/j.cnki.csa.008977 CSTR:
摘要:为了提高边缘计算设备对植物叶片病害检测的识别速率, 本研究采用卷积神经网络搭建了植物叶片目标识别模型和植物叶片病害分类模型, 并且使用OpenCV将两个模型整合成植物叶片病害检测系统. 通过SSD (single shot multibox detector)算法对植物叶片的目标区域进行定位并裁剪, 再利用植物叶片病害分类模型对裁剪的植物叶片区域进行病害分类. 同时, 通过TensorRT加速推理对分类模型进行优化处理, 以及在同一台主机设备和Jetson Nano计算平台上, 对优化前后的模型进行了对比实验. 实验表明, 在同一主机设备上优化后的植物分类模型识别速率提升22倍. 同时, 优化后的分类模型使植物叶片病害检测系统识别速率提升7倍. 而将优化后的系统部署在Jetson Nano计算平台上, 对比优化前的植物叶片病害检测速率提升10倍, 实现了实时的植物叶片病害检测.
2023, 32(2):102-110. DOI: 10.15888/j.cnki.csa.008945 CSTR:
摘要:针对人工识别探地雷达管线图像时效率低、误差大和成本高昂等问题, 本文提出了一种基于改进Cascade R-CNN的管线目标智能化检测方法. 首先对探地雷达管线图像数据集进行预处理, 提升数据质量. 然后采用ResNeXt代替ResNet作为主干网络提取目标特征信息, 并添加多尺度特征融合模块FPN使高层特征向低层特征融合, 增强低层特征表达能力. 其次, 使用高斯形式的非极大值抑制方法Soft-NMS得到更加精准的候选框, 使用Smooth_L1作为损失函数, 加速了模型收敛并且降低了训练中发生梯度爆炸的概率. 最后, 对于管线目标特殊的形状特征, 设置合适的锚框长宽比和大小, 提高锚框的生成质量. 实验结果表明, 本文方法解决了复杂特征的地下管线目标智能化检测, 对地下管线目标检测的平均精度达到94.7%, 比Cascade R-CNN方法提高了10.1%.
2023, 32(2):111-118. DOI: 10.15888/j.cnki.csa.008939 CSTR:
摘要:针对单幅图像超分辨率(single image super-resolution, SISR)重建算法存在低分辨率图像(LR)到高分辨率图像(HR)的映射学习具有不适定性, 深层神经网络收敛慢且缺乏对高频信息的学习能力以及在深层神经网络传播过程中图像特征信息存在丢失的问题. 本文提出了基于对偶回归和残差注意力机制的图像超分辨率重建网络. 首先, 通过对偶回归约束映射空间. 其次, 融合通道和空间注意力机制构造了残差注意力模块(RCSAB), 加快模型收敛速度的同时, 有效增强了对高频信息的学习. 最后, 融入密集特征融合模块, 增强了特征信息流动性. 在Set5、Set14、BSD100、Urban100 四种基准数据集上与目前主流的单幅图像超分辨率算法进行对比, 实验结果表明该方法无论是在客观质量评价指标还是主观视觉效果均优于对比算法.
2023, 32(2):119-127. DOI: 10.15888/j.cnki.csa.008984 CSTR:
摘要:基于中央服务器的传统架构是过去后台服务搭建的重要解决方案, 但随着用户数与应用需求的爆发式增长, 该架构对中心节点的计算与存储能力提出了更高的要求, 同时也带来了信任危机. 分布式系统的一个典型代表-区块链, 作为比特币的核心技术, 它的不可篡改, 可追溯, 不可伪造数据等特性使得它在近几年受到广大研究者的广泛关注. 本文提出将联盟区块链应用到电动车, 充电桩, 智能电表, 传输电网所组成的充电网络中, 利用区块链技术来管理充电记录, 以此来保护每一方的利益, 为交易纠纷的解决提出一种数据层面的支撑. 本文在提出专用联盟区块链的同时, 也提出了一种新的适用于电动汽车可信充电模型的共识机制和对应的查询智能合约. 实验结果表明所设计的共识机制能在该可信充电网络模型中安全高效的运行, 同时也能够满足用户快速查询交易的需求.
2023, 32(2):128-138. DOI: 10.15888/j.cnki.csa.008942 CSTR:
摘要:保持安全社交距离是有效防止病毒传播的重要手段之一, 不仅可以减少感染者数量和医疗负担, 同时也极大降低死亡率. 在YOLOv4框架基础上使用轻量化网络E-GhostNet代替原网络中的CSPDarknet-53, E-GhostNet网络在输入数据和原始Ghost模块生成的输出特征之间建立关系, 使网络能够捕获上下文特征. 然后, 在E-GhostNet中引入坐标注意力机制(CA)增强模型对有效特征的关注. 另外, 使用SIoU损失函数更换CIoU损失获得更快的收敛速度和优化效果. 最后, 结合DeepSORT多目标跟踪算法来检测和标记行人, 并使用仿射变换(IPM)判定行人间距离的违规行为. 实验结果显示, 该网络检测速度为40 FPS, 精度值达到85.71%, 相比原始GhostNet算法提升2.57%, 达到实时行人距离检测的效果.
2023, 32(2):139-149. DOI: 10.15888/j.cnki.csa.008946 CSTR:
摘要:YOLO是目前计算机视觉目标检测领域比较重要的算法模型之一. 基于现有YOLOv5s模型提出了一种扩展的YOLOv5多级分类目标检测算法模型. 首先, 对LabelImg标注工具进行功能扩展, 使其满足多级分类标签文件构建; 其次在YOLOv5s算法基础上修改检测头输出格式, 在骨干网络前端引入DenseBlock、Res2Net网络模型核心设计思想, 获取丰富的多维度特征信息, 增强特征信息的重用性, 实现了YOLO多级分类目标检测任务. 在开源安全帽数据集上同时以安全帽颜色作为二级分类进行训练验证, 平均精度, 精确率和召回率分别达到了95.81%、94.90%和92.54%, 实验结果验证了YOLOv5多级分类目标检测任务的可行性, 并为目标检测及多级分类目标检测任务提供一种新的思路和方法.
2023, 32(2):150-159. DOI: 10.15888/j.cnki.csa.008951 CSTR:
摘要:原始无损路面图像对分析路面损伤演化细节及制定下一步养护方案具有重要意义, 而实地采集中无法获取路面裂缝图像对应的初始状态. 为了获取其对应的无损路面图像, 本文提出了一种基于深度图像先验的无监督沥青路面裂缝图像修复算法, 可实现对单张路面图像中裂缝的高效语义级修复. 首先采用鲁棒主成分分析算法去除路面裂缝图像表面的竖状条纹噪声. 随后, 采用最大类间方差法及形态学处理得到裂缝区域的二进制掩码图像. 最后, 运用提出的深度图像先验修复算法对裂缝区域进行修复得到最终的无损路面图像. 在自采集路面裂缝图像数据集上对所提方法进行了评估. 实验结果表明, 所提方法能够有效实现路面裂缝图像语义级修复, 峰值信噪比和结构相似性较传统的方法有了明显提升, 平均达到了
2023, 32(2):160-169. DOI: 10.15888/j.cnki.csa.008968 CSTR:
摘要:对盈千累万且错综复杂的数据集进行分析, 是一个非常具有挑战性的任务, 检测数据中的异常值的技术在该任务中发挥着举足轻重的作用. 通过聚类捕获异常的方式, 在日趋流行的异常检测技术中是最为常用的一类方法. 文中提出了一种基于二阶近邻的异常检测算法(anomaly detection based second-order proximity, SOPD), 主要包括聚类和异常检测两个阶段. 在聚类过程中, 通过二阶近邻的方式获取相似性矩阵; 在异常检测过程中, 根据簇中的点与簇中心的关系, 计算聚类生成的每一个簇中的所有的点与该簇中心的距离, 捕捉异常状态, 并把每个数据点的密度考虑进去, 排除簇边界情况. 二阶近邻的使用, 使得数据的局部性以及全局性得以被同时考虑, 进而使得聚类得到的簇数减少, 增加了异常检测的精确性. 通过大量实验, 将该算法与一些经典的异常检测算法进行比较, 结果表明, SOPD算法整体上性能较好.
2023, 32(2):170-180. DOI: 10.15888/j.cnki.csa.008920 CSTR:
摘要:相比基于特征点的传统图像特征匹配算法, 基于深度学习的特征匹配算法能产生更大规模和更高质量的匹配. 为获取较大范围且清晰的路面裂缝图像, 并解决弱纹理图像拼接过程中发生的匹配对缺失问题, 本文基于深度学习LoFTR (detector-free local feature matching with Transformers)算法实现路面图像的拼接, 并结合路面图像的特点, 提出局部拼接方法缩短算法运行的时间. 先对相邻图像做分割处理, 再通过LoFTR算法产生密集特征匹配, 根据匹配结果计算出单应矩阵值并实现像素转换, 然后通过基于小波变换的图像融合算法获得局部拼接后的图像, 最后添加未输入匹配网络的部分图像, 得到相邻图像的完整拼接结果. 实验结果表明, 与基于SIFT (scale-invariant feature transform)、SURF (speeded up robust features)、ORB (oriented FAST and rotated BRIEF)的图像拼接方法比较, 研究所提出的拼接方法对路面图像的拼接效果更佳, 特征匹配阶段产生的匹配结果置信度更高. 对于两幅路面图像的拼接, 采用局部拼接方法耗费的时间较改进之前缩短了27.53%. 研究提出的拼接方案是高效且准确的, 能够为道路病害监测提供总体病害信息.
2023, 32(2):181-189. DOI: 10.15888/j.cnki.csa.008904 CSTR:
摘要:入侵检测技术作为计算机防护的主要技术手段, 因具有适应性强、能识别新型攻击的优点而被广泛研究, 然而识别率和误报率难以保证是该技术的主要瓶颈. 为了提升异常检测技术的识别率并降低误报率, 提出了一种终端级入侵检测算法(terminal-level intrusion detection algorithm, TL-IDA). 在数据预处理阶段把终端日志切割成连续的小块命令序列, 并引入统计学的常用指标为命令序列构建特征向量, 再使用TL-IDA算法通过特征向量对用户建模. 在此基础上, 还提出了一种滑动窗口判别法, 用于判断系统是否遭受攻击, 从而提升入侵检测算法的性能. 实验结果表明, TL-IDA算法的平均识别率和误报率分别达到了83%和15%, 优于同类的基于异常技术的终端级入侵检测算法ADMIT、隐马尔可夫模型法等.
2023, 32(2):190-198. DOI: 10.15888/j.cnki.csa.008923 CSTR:
摘要:在自动化港口集装箱起重机作业流程中, 集卡车头防砸检测是不可或缺的一个环节. 针对在此环节采用人工确认方法效率低和基于激光扫描方法耗费高、系统复杂的问题, 本文提出一种基于作业场景视频图像和深度学习的算法对集卡车头进行目标检测. 建立集卡车头样本数据集, 采用DCTH-YOLOv3检测模型, 通过模型迁移学习方法进行样本训练. DCTH-YOLOv3模型是本文提出的一种改进YOLOv3算法模型, 该算法改进了YOLOv3的FPN结构提出一种新的特征金字塔结构—AF_FPN, 在高、低阶特征融合时通过引入具有注意力机制的AFF模块聚焦有效特征、抑制干扰噪声, 提高了检测精度. 另外, 使用CIoU loss度量损失替代L2损失, 提供更加准确的边界框变化信息, 模型检测精度得到进一步提升. 实验结果表明: DCTH-YOLOv3算法在GTX1080TI上检测速率可达46 fps, 相比YOLOv3算法仅降低了3 fps; 检测精度AP0.5为
2023, 32(2):199-206. DOI: 10.15888/j.cnki.csa.008988 CSTR:
摘要:异常检测是机器学习与数据挖掘的热点研究领域之一, 主要应用于故障诊断、入侵检测、欺诈检测等领域. 当前已有很多有效的相关研究工作, 特别是基于隔离森林的异常检测方法, 但在处理高维数据时仍然存在许多困难. 提出了一种新的k近邻隔离森林的异常检算法: k-nearest neighbor based isolation forest (KNIF). 该方法采用超球体作为隔离工具, 利用第k近邻的方法来构建隔离森林, 并构建基于距离的异常值计算方法. 通过充分实验表明KNIF方法能有效地进行复杂分布环境下的异常检测, 并能适应不同分布形式的应用场景.
2023, 32(2):207-216. DOI: 10.15888/j.cnki.csa.008933 CSTR:
摘要:标准蛙跳优化算法(SFLA)有寻优精度低和易陷入局部收敛区域的缺点, 为提高其性能, 提出一种基于云模型局部搜索和余弦跳跃权重更新位置的改进蛙跳算法(CSFLA). 首先通过Tent混沌映射和反向学习生成种群, 使种群的分布更均匀, 利用云模型的正态特性对子群中的优秀个体的所在区域进行探索. 同时, 对种群中其他个体引入基于余弦函数的跳跃步长权重, 使该权重在整个迭代过程中由高以不同的速率下降, 提高种群的全局搜索能力. 最后, 将CSFLA与多个优化算法在不同类型的测试函数上进行了比较. 结果表明, CSFLA具有更好的收敛速度和精度, 能有效找出全局最优解. 并且将改进算法应用至旅行商问题, 该算法可以找到总路程更短的路线.
2023, 32(2):217-225. DOI: 10.15888/j.cnki.csa.008957 CSTR:
摘要:针对雾霾环境下车辆检测准确率低、漏检严重的问题, 提出一种多尺度特征融合的雾霾环境下车辆检测算法. 首先利用条件生成对抗网络对雾霾图像进行去雾预处理, 然后针对雾霾环境下目标特征不明显的特点, 提出多尺度特征融合模块, 在YOLOv3的基础上, 从主干网络提取特征时增加一条浅层分支和深层特征进行上采样拼接融合, 得到尺度为104×104的特征图, 用于增强浅层的语义信息. 并采用CBAM注意力机制引导下的特征增强策略, 保证上下文信息的完整性, 以提高检测的精度, 最后将去雾后图片送入改进后的YOLOv3网络进行检测. 实验结果表明, 相较于原始网络, 该算法在RTTS数据集上的检测结果更加优秀, 模型可以达到81%的平均精度和67.52%的召回率, 能够更加精确的定位到车辆.
2023, 32(2):226-233. DOI: 10.15888/j.cnki.csa.008993 CSTR:
摘要:网络拓扑发现对于许多关键网络管理任务来说至关重要. 然而, 随着网络规模的不断增大, 网络结构的愈发复杂, 之前的基于SNMP的网络拓扑发现算法存在难以有效识别子网类型和多IP设备, 拓扑效率、准确率低等问题. 针对上述问题, 本文提出了基于SNMP的拓扑增强识别(SNMP-based topology enhanced identification, SNMP-TEI)算法. 首先, 启发式地确定子网IP地址并对其发送探针, 根据探测结果来判断子网类型, 在确定子网类型后及时终止探针注入防止网络负载过大; 其次通过MIB-II记录的系统信息设置设备指纹, 结合设备类型识别算法对终端主机IP进行设备指纹鉴定, 以达到识别多IP设备的目的. 实验结果表明, 此方法在仿真网络中可有效识别子网和多IP设备, 同时降低了网络负载, 探测准确率达到了96.43%.
2023, 32(2):234-241. DOI: 10.15888/j.cnki.csa.009004 CSTR:
摘要:视频场景切换检测在视频处理领域十分重要, 优秀的视频场景切换检测算法对于视频的后续处理, 包括信息标注与特征提取等都具有很大的意义. 本文以传统的图像处理方法为基础, 结合ORB (oriented FAST and rotated BRIEF)快速特征描述子, 分别实现图像的相似度估计. 通过动态融合因子, 将多种基本算法得到的相似度在完整算法中的价值量化, 并根据邻帧相似度计算动态阈值, 从而提高了算法的稳定性; 另外通过流程规划, 减少了算法中耗时长的部分的调用次数, 最终实现了高效的视频场景切换检测. 实验结果表明, 视频场景切换检测的准确率有一定程度地提升.
2023, 32(2):242-249. DOI: 10.15888/j.cnki.csa.008913 CSTR:
摘要:随着互联网的发展, 如何快速地从海量新闻中获取核心信息, 减少浏览负担, 是信息部门目前急需解决的问题. 现有的TextRank及其改进算法在新闻摘要抽取任务中, 考虑文本特征不全面. 在摘要句选择时, 只考虑到摘要的冗余度, 忽略了摘要的多样性及可读性. 针对上述问题, 本文提出了融合多特征的文本自动摘要方法MF-TextRank(multi-feature TextRank). 根据新闻的结构、句子和单词总结了更全面的文本特征信息用于改进TextRank算法的权重转移矩阵, 使句子权重计算更准确. 采用MMR算法更新句子权重, 通过集束搜索得到候选摘要集, 在MMR得分的基础上选择内聚性最高的候选摘要集作为最终的摘要输出. 实验结果表明, MF-TextRank算法在摘要抽取任务中摘要Rouge得分优于现有改进的TexRank算法, 有效提高了摘要抽取的准确性.
2023, 32(2):250-257. DOI: 10.15888/j.cnki.csa.008931 CSTR:
摘要:在计算机视觉的内窥胃部息肉检测中, 高效提取小型息肉图像特征是设计深度学习的计算机视觉模型一个难点. 针对该问题, 提出了一种YOLOv4改进的YOLOv4-polyp检测模型. 首先在YOLOv4的基础上, 引入CBAM卷积注意力模块增强模型在复杂环境的特征提取能力; 其次设计出轻量级CSPDarknet-49网络模型, 在降低模型复杂度的同时提高检测精度和检测速度; 最后根据胃息肉数据集的特点, 采用K-means++聚类算法对胃息肉数据集进行聚类分析, 得到优化后的锚框. 实验对比结果表明, YOLOv4-polyp对于经典YOLOv4模型在保持检测速率不变的同时, 在两个数据集中平均检测精度分别提升了5.21%和2.05%, 表现出良好的检测性能.
2023, 32(2):258-265. DOI: 10.15888/j.cnki.csa.008982 CSTR:
摘要:工业报警变量数量增多所导致的“报警泛滥”问题, 严重影响了报警系统的应有功能. 针对此问题, 提出一种从过程报警数据集中学习报警变量传递关系的方法. 首先, 利用传递熵具有准确衡量一阶或多阶自相关性变量间因果关系的特点, 识别变量间的因果关系. 其次以变量间熵大小为准则, 保留传递信息量较大的节点, 最后考虑变量在不同状态所占时间比重对K2算法进行改进, 学习得到最终的报警传播网络. 通过在田纳西伊斯曼过程数据集上的验证发现, 该方法能够对报警发生的根本原因做出判断并较好地学习得到报警传播路径.
2023, 32(2):266-273. DOI: 10.15888/j.cnki.csa.008995 CSTR:
摘要:针对卫星视频中存在目标特征信息少、前景背景对比性低等问题, 在SiamCAR的基础上提出了一种融合运动信息和注意力机制的目标跟踪方法; 首先引入运动激励模块和通道注意力模块以增强目标特征提取信息; 然后将相邻帧作为新模板添加到网络里形成三重网络补充模板信息; 最后加入卡尔曼滤波算法进行目标轨迹预测, 将预测模板添加到网络中形成四重网络增加目标的运动信息; 选取SatSOT卫星视频数据集中的10组数据进行测试, 实验结果表明与SiamCAR网络相比, 改进算法的跟踪准确率和成功率分别提升了6%和6.2%.
2023, 32(2):274-280. DOI: 10.15888/j.cnki.csa.008989 CSTR:
摘要:针对传统的工控网络流量数据在复杂网络环境下特征维度高, 特征处理复杂度高, 模型检测效率低等问题, 本文使用了一种基于随机森林(random forest, RF)和长短期记忆网络(long short-term memory, LSTM)结合的流量异常识别与检测方法. 首先使用随机森林算法计算流量特征的重要度评分, 筛选出重要特征, 剔除冗余特征, 然后使用LSTM进行异常流量的识别与检测. 为了评估模型的有效性与优越性, 本文使用准确率、精确率、召回率和F1-score进行模型评价, 并与传统的机器学习方法Naive Bayes、QDA、KNN算法进行对比. 实验结果表明, 在公开数据集CIC-IDS-2017中, 异常流量识别的总体准确率达99%. 与传统的机器学习算法相比, 该方法有效地提高了复杂网络环境下异常检测的准确性和效率, 在工业控制网络安全和异常检测方面具有实际应用价值.
2023, 32(2):281-287. DOI: 10.15888/j.cnki.csa.008941 CSTR:
摘要:针对具有约束性的复合分位数回归网络(monotone composite quantile regression neural network, MCQRNN)无法较好地分析负荷数据之中的时序信息和内在规律的问题, 本研究融合MCQRNN以及膨胀因果卷积网络(dilated causal convolutional networks, DCC), 提出了一种新的分位数回归模型MCQRDCC (monotone composite quantile regression dilated causal convolutional networks), 该模型将输入划分为分位点输入与非约束输入, 使该模型的输出随分位点的增大而增大, 以此解决分位数交叉的问题. 同时, 使用DCC的结构, 使该模型充分地分析负荷数据之中的序列信息, 使得预测结果更加符合真实负荷的变化趋势. 此外, MCQRNN使用指数函数对约束权重矩阵和隐藏层权重进行转化, 会影响反向传播时权重的调整, 本研究使用ReLU函数代替指数函数可以解决这个问题, 以此提高预测的精度. 使用真实的负荷数据进行实验, 实验结果表明, MCQRDCC能有效地提高预测精度, 相较于MCQRNN, 其平均Pinball损失和CWC分别下降2.11%和9.31%, AIS提升了10.51%.
2023, 32(2):288-294. DOI: 10.15888/j.cnki.csa.008948 CSTR:
摘要:针对基于深度学习的海上船舶目标检测任务中存在检测网络复杂且参数量大、检测实时性差的问题, 提出一种加强特征融合的轻量化YOLOv4算法——MA-YOLOv4. 首先使用MobileNetv3替换主干网络, 引入新的激活函数SiLU并使用深度可分离卷积代替普通3×3卷积降低网络参数量; 其次加入自适应空间特征融合模块加强特征融合; 最后使用MDK-means聚类算法得到适用于船舶目标的锚框, 用Ship7000数据集进行训练和评估. 实验结果表明, 改进算法与YOLOv4相比, 模型参数量降低82%, mAP提高2.57%, FPS提高30帧/s, 能实现对海上船舶的高精度实时检测.
2023, 32(2):295-302. DOI: 10.15888/j.cnki.csa.008935 CSTR:
摘要:为了有效改善传输速率并降低带宽负担, 提出一种基于压缩感知和超混沌系统的多图像加密方案. 首先将多幅原始图像拼接成新的明文图像, 并将部分明文信息与随机正整数结合产生混沌系统初始值, 利用超混沌系统产生的伪随机序列生成加密过程所需的测量矩阵、置乱序列及扩散序列. 其次通过离散小波变换、阈值处理以及并行测量对明文图像进行压缩处理, 有效减少运算数据量, 大大加快运行速率. 最后通过无重复置乱操作和双向加模扩散得到最终的密文图像. 经多个层面的仿真模拟实验, 验证了所提算法能有效抵御剪切攻击, 且具有比较高的安全性.
2023, 32(2):303-309. DOI: 10.15888/j.cnki.csa.008947 CSTR:
摘要:雾天退化图像的复原过程中, 针对大气光幕和大气亮度估计不准确导致光晕效应、偏色现象和对比度不足等问题, 提出一种结合WLS (weighted least square)滤波与还原控制因子的去雾算法. 首先分析WLS滤波器的原理和性能, 并用于大气光幕的有效提取; 其次利用Sobel算子检测二值化图像边缘, 将边缘数目与像素均值同时作为四叉树空间索引的依据, 提高大气亮度的估计准确性; 最后分析天空出现颜色失衡现象的原因, 引入还原控制因子改善视觉效果. 实验结果表明, 去雾后图像的平均梯度整体提高58.03%, 信息熵提高2.88%, 运行时间节省50%以上. 该方法对含有浓雾、薄雾以及天空等深度复杂的远景图像、近景图像均能得到高对比度、可视度和色彩保真度的恢复效果.
2023, 32(2):310-315. DOI: 10.15888/j.cnki.csa.008944 CSTR:
摘要:道路裂缝是路面破损的重要组成部分, 而道路裂缝分类可以对道路养护策略的制定进行针对性的安排. 针对人工标注分类耗时长, 效率低等问题, 本文提出了一个基于对比学习的道路裂缝图像分类方法, 在传统的对比学习框架中, 对特征提取部分进行改进, 使得模型对细小裂缝的特征更敏感. 首先对进行数据增强, 其次在特征提取部分对ResNet50的部分进行改进, 使用多尺度的方法提取特征; 再使用多层感知机(MLP)对提取到的特征进行降维处理, 并投影到向量空间; 最后使用余弦相似度与用归一化温度标度的交叉熵损失对模型进行优化. 实验结果表明, 改进后的模型比原模型在裂缝图像上的分类效果提高了0.22%, 达到了92.1%, 对裂缝图像分类有较好的效果.
2023, 32(2):316-321. DOI: 10.15888/j.cnki.csa.008979 CSTR:
摘要:针对岩心图像拼接效率低以及易出现鬼影现象的问题, 提出了一种基于最佳缝合线的拉普拉斯金字塔融合的岩心图像拼接方法. 首先将待拼接的两幅岩心图像进行灰度变换, 根据ORB算法计算并描述特征点; 其次使用改进的random sample consensus (RANSAC)算法对特征点进行提纯, 完成特征点匹配; 根据匹配的特征点计算图像间的配准关系, 最后根据最佳缝合线实现岩心图像的拉普拉斯金字塔融合, 完成拼接. 实验结果表明, 改进的RANSAC算法能在保证正确率的同时提升速度, 而且本文提出的图像融合方法避免了鬼影的产生, 在融合区域的PSNR、SSIM和DoEM客观评价指标上与另外两种图像融合算法相比都有所提升.
2023, 32(2):322-328. DOI: 10.15888/j.cnki.csa.008994 CSTR:
摘要:自然灾害种类繁多, 通过遥感影像语义分割相对比较困难. 为了能够更好实现遥感影像分割, 本文提出一种基于生成对抗网络的3层遥感影像语义分割模型, 针对不同场景的解析, 基于全卷积神经网络FCN, 设计一种多层次的遥感语义分割框架. 有效对遥感图像语义分割进行处理, 从而提高了模型的分割精度. 实验表明利用这种模型是有效的, 特别是受损建筑的分割结果, mIoU为82.28%, 通过该模型与其他网络模型进行对比, 其性能评价指标明显优于其他网络模型. 最后, 通过对自然灾害各种场景影像进行分析, 为应急管理部门提供一份可靠的数据报告.
2023, 32(2):329-338. DOI: 10.15888/j.cnki.csa.008934 CSTR:
摘要:随着车载GPS定位设备的普及, 产生了大量的车辆轨迹数据和位置信息, 各种轨迹挖掘技术也应运而生. 然而, 现有的轨迹挖掘技术较少考虑用户的隐私泄露问题, 因此, 本文提出了一种融合隐私保护的车辆轨迹数据停留点挖掘方法. 在该算法中, 首先通过密度聚类筛选出轨迹停留点, 其次结合差分隐私技术对停留点进行隐私保护. 通过实验验证, 该方法不仅能有效识别出停留点的位置, 还能保护其隐私不被泄露.
2023, 32(2):339-346. DOI: 10.15888/j.cnki.csa.008881 CSTR:
摘要:导光板(LGP)是液晶显示器(LCD)背光模组的主要部件. 导光板的缺陷将直接影响液晶显示器的显示效果. 针对导光板图像纹理背景复杂、低对比度、缺陷尺寸小等问题, 本文提出了一种用于大尺寸导光板缺陷检测的AYOLOv5s网络. 首先, 将导光板图像进行分图处理, 然后在主干部分和特征融合部分集成Transformer和注意力机制coordinate attention, 并选择Meta-ACON激活函数. 最后, 基于自建数据集LGPDD进行了大量实验. 实验结果表明, LGP缺陷检测算法的平均精度(mAP)可以达到99.20%, 并且FPS可达77, 可以实现在12 s/pcs内对尺寸为17英寸的导光板中的亮点、划伤、异物、磕碰伤、脏污等缺陷具有较好的实际检测效果.
2023, 32(2):347-355. DOI: 10.15888/j.cnki.csa.008921 CSTR:
摘要:针对光伏发电功率的波动性与随机性对调度部门的负荷预测以及电网安全运行带来的严峻挑战, 提出了一种基于变分模态分解(VMD)和布谷鸟搜索(CS)算法优化的双向长短期记忆网络(BiLSTM)光伏发电功率预测方法. 首先使用VMD将光伏功率序列分解成不同频率的子模态, 通过皮尔逊相关性分析确定影响各模态的关键气象因子. 其次分别构建注意力机制(AM)和BiLSTM混合的光伏发电功率预测模型, 利用CS算法获取网络最优的权重和阈值. 最后, 将不同模态的预测结果相叠加, 得到最终的预测结果. 通过对亚利桑那州地区光伏电站输出功率进行预测, 验证了所提模型的有效性.
2023, 32(2):356-363. DOI: 10.15888/j.cnki.csa.008929 CSTR:
摘要:直流充电桩作为电动汽车有效的供电设备, 其故障频发对电动汽车充电安全带来隐患. 对充电桩的故障进行准确预测将有效地确保电动汽车充电过程的安全. 本文提出了一种改进门控循环单元(gate recurrent unit, GRU)直流充电桩的故障预测模型. 首先, 分析充电过程中直流充电桩的常见故障类型, 考虑到实际采集过程中具体故障数据样本量少的情况, 利用变分自编码器(variational auto-encoder, VAE)数据增强方法对样本数据进行扩充; 然后, 基于GRU网络模型的故障预测方法, 利用粒子群优化(particle swarm optimization, PSO)算法优化GRU网络参数, 采用支持向量机(support vector machine, SVM)模型改善网络输出的分类函数, 提出了PSO-GRU-SVM直流充电桩故障诊断模型; 最后, 利用算例对比改进前后的预测精度, 分析对比混淆矩阵热力图, 并且与常用的两种网络模型进行对比, 结果表明了文中方法有效地提高了预测精度, 验证了文章中方法的可行性.
2023, 32(2):364-370. DOI: 10.15888/j.cnki.csa.008963 CSTR:
摘要:在信息抽取领域, 从非结构化文本中抽取实体关系是一项基础且重要的任务, 且面临实体重叠和模型误差累积等挑战. 本文以关系为导向, 提出一种改进的实体关系联合抽取方法. 该方法将实体关系抽取任务分为关系抽取与实体抽取两个子任务. 在关系抽取任务上采用自注意力机制关注词与词之间的重要程度从而模拟实体信息, 并使用平均池化来表征整个句子信息; 在实体抽取任务上结合关系信息使用条件随机场识别该关系下的实体对. 本模型不仅能够利用存在关系必定存在实体对的思想解决实体对重叠问题, 还能够在训练过程中利用数据集中已知的关系使实体抽取模块不依赖于关系抽取模块的结果来训练, 从而在训练阶段避免误差累积. 最后, 在WebNLG和NYT公开数据集上验证了该模型的有效性.
2023, 32(2):371-378. DOI: 10.15888/j.cnki.csa.008954 CSTR:
摘要:针对传统航拍视频图像CNN模型天气分类效果差、无法满足移动设备应用以及现有天气图像数据集匮乏且场景单一的问题, 构建了晴天、雨天、雪天、雾天4类面向多场景的无人机航拍天气图像数据集, 并提出了基于轻量级迁移学习的无人机航拍视频图像天气场景分类模型. 该模型采用迁移学习的方法, 在ImageNet数据集上训练好两种轻量级CNN, 并设计3个轻量级CNN分支进行特征提取. 特征提取首先采用ECANet注意力机制改进的EfficientNet-b0作为主分支提取整幅图像特征, 并使用两个MobileNetv2分支分别对天空和非天空局部独有的深层特征进行提取. 其次, 通过Concatenate将这3个区域进行特征融合. 最后, 使用Softmax层对4类天气场景实现分类. 实验结果表明, 该方法应用于移动等计算受限设备时对于天气场景分类的识别准确率达到了97.3%, 有着较好的分类效果.
2023, 32(2):379-386. DOI: 10.15888/j.cnki.csa.008975 CSTR:
摘要:为了轻量化模型, 便于移动端设备的嵌入, 对YOLOv4网络进行了改进. 首先, 用MobileNetV3作为主干网络, 并使用深度可分离卷积替换加强特征提取网络的普通卷积, 降低模型参数量; 其次, 在104×104特征图输出时融合空洞率为2的空洞卷积, 与52×52的特征层进行特征融合, 获取更多的语义信息和位置信息, 细化特征提取能力, 提升模型对极小目标的检测性能; 最后, 将原来的池化层使用3个5×5的Maxpool进行串联, 减少计算量, 提升检测速度. 实验结果表明, 在华为云2020数据集上, 改进算法的mAP比YM算法提高了2.33%, 在公共数据集VOC07+12上, mAP提高了3.12%, FPS比原来的YOLOv4算法提高了一倍多, 参数量降低至原来的18%, 证明了改进算法的有效性.
2023, 32(2):387-393. DOI: 10.15888/j.cnki.csa.009005 CSTR:
摘要:在电力系统中, 配电调度是一个复杂且统筹性较强的工作, 大多依赖于工作人员的经验和主观判断, 极易出现纰漏. 所以急需利用智能化手段来帮助检修计划的分析与生成. 命名实体识别是构建配电网知识图谱以及问答系统等任务的关键技术, 它能够将非结构化数据中的命名实体识别出来. 针对配电检修数据的复杂性及强关联性等特点, 本文采用BERT-IDCNN-BiLSTM-CRF深度学习模型. 该模型相较于传统的BERT-BiLSTM-CRF模型, 融入IDCNN神经网络模型, 更好地利用GPU的性能, 在保证识别准确率的前提下, 提高效率. 通过对标注好的检修计划数据进行训练, 并与其他常用模型对比, 在召回率、精确率以及F1值3个指标上, 本文提出的模型均达到最优的效果, F1值可以达到83.1%, 该模型在配电网数据识别任务上取得了很好的效果.
2023, 32(2):394-399. DOI: 10.15888/j.cnki.csa.008969 CSTR:
摘要:为了提高分布式存储系统中故障节点的修复效率, 提出一种新的部分重复(fractional repetition, FR)码的构造算法. 该算法利用完全图的因子分解进行构造, 称为CGFBFR (complete graph factorization based FR)码. 该算法首先对完全图进行因子分解, 分解完成以后确定完全图的因子分解个数, 根据需要存储数据块的重复度来选择完全图的因子个数, 将完全图选中的因子所有顶点当做分布式存储系统中需要存储的数据块, 然后对选中因子图的边进行标记, 标记的边当做分布式数据节点进行存储. 最后根据选中的因子的顶点和边生成编码矩阵, 在分布式存储系统中按照编码矩阵中的数据对数据块分别进行存储. 实验仿真结果显示, 本文提出的一种新的部分重复码构造算法, 与分布式存储系统中的里所(reed-solomon, RS)码、简单再生码(simple regenerating codes, SRC)以及最新的循环可变部分重复(variable fractional repetition, VFR)码相比, 在系统修复故障节点时, 能够快速地修复故障节点, 有效降低了故障节点的修复带宽开销、修复局部性、修复复杂度, 而且构造过程简单, 同时可以灵活选择构造参数, 广泛适用于分布式存储系统中.
2023, 32(2):400-405. DOI: 10.15888/j.cnki.csa.008932 CSTR:
摘要:点积函数是BLAS库中的一级基础函数, 其被科学计算等领域广泛调用. 由于浮点计算会引入舍入误差, 现有BLAS库中双精度点积函数不足以满足某些应用领域的精度要求, 因此需要高精度算法来实现更精确可靠的计算. 在本文中, 面向国产申威1621平台, 在现有的BLAS库的基础上, 新增高精度点积函数的实现接口, 来满足应用的高精度需求. 同时, 对于高精度点积算法运用循环展开、访存优化、指令重排等优化策略, 实现汇编级手工优化. 实验结果显示, 文中高精度点积算法的计算结果精度, 近似达到了双精度点积的两倍, 有效提升了原始算法精度. 同时, 在保证精度提升的基础上, 文中优化后的高精度点积函数相比未优化前, 平均性能加速比达到了1.61.
2023, 32(2):406-411. DOI: 10.15888/j.cnki.csa.008928 CSTR:
摘要:对于卫星视频图像中存在的目标与背景对比性低、缺乏目标特征信息等问题, 提出一种结合目标运动信息、时空背景和外观模型的目标分割和跟踪方法. 根据首帧定位得到目标区域, 首先对目标使用方向梯度直方图方法提取特征利用核相关滤波器得到目标跟踪区域1; 接着利用颜色空间特征建立目标与其周围区域上下文信息的空间模型得到目标跟踪区域2; 然后利用视觉背景提取算法以像素为单位在目标区域上检测运动目标得到单目标的分割区域3; 最后分别对3个区域进行相关计算得到最优区域作为最终目标跟踪位置和模板更新样本. 实验结果表明, 本文算法与KCF算法相比, 跟踪的成功率和准确率有很大的提高, 同时实现了单目标分割.