2024年第33卷第3期文章目次

2024, 33(3):1-11. DOI: 10.15888/j.cnki.csa.009433 CSTR: 32024.14.csa.009433

摘要 (813) HTML (2980) PDF 1.51 M (4085) 评论 (0) 收藏

摘要:在关系抽取任务中, 通常利用构建依赖树或句法树来获得更深层和丰富的结构信息. 图神经网络作为一种强大的图结构数据表示学习方法, 可以更好地对这种复杂数据结构进行建模. 本文介绍了基于图神经网络的关系抽取方法, 旨在深入理解该领域的最新研究进展和趋势. 首先简要介绍了图神经网络的分类和结构, 然后详细阐述了基于图神经网络的关系抽取方法的核心技术和应用场景, 包括句子级和文档级方法, 以及实体关系联合抽取方法. 并分析和比较了各个方法的优缺点和性能表现, 并探讨了未来可能的研究方向和挑战.

基于深度学习的眼底血管图像分割研究进展

贺鑫，王晓燕，周启香，张文凯

2024, 33(3):12-23. DOI: 10.15888/j.cnki.csa.009421 CSTR: 32024.14.csa.009421

摘要 (794) HTML (2216) PDF 2.24 M (4982) 评论 (0) 收藏

摘要:眼底血管图像分割对青光眼、糖尿病视网膜病变等多种眼部疾病有较好的辅助诊断作用, 目前深度学习因其强大的抽象特征发现能力, 有望满足人们从眼底血管图像中提取特征信息进行图像自动分割的需求, 成为眼底血管图像分割领域的研究热点. 为更好把握该领域的研究进展, 本文对相关数据集和评价指标整理归纳, 对深度学习在眼底血管图像分割中的应用进行详细阐述, 重点梳理各类分割方法的基本思想、网络结构及改进之处, 分析现有眼底血管图像分割方法存在的局限性及面临的挑战, 并对该领域未来的研究方向做出展望.

基于图偏差网络的外部自编码器时间序列异常检测

张孚容，顾磊

2024, 33(3):24-33. DOI: 10.15888/j.cnki.csa.009423 CSTR: 32024.14.csa.009423

摘要 (618) HTML (917) PDF 2.16 M (1390) 评论 (0) 收藏

摘要:随着互联网和连接技术的提高, 传感器产生的数据逐渐趋于复杂化. 深度学习方法在处理高维数据的异常检测方面取得较好的进展, 图偏差网络(graph deviation network, GDN)学习传感器节点之间关系来预测异常, 并取得一定的效果. 针对图偏差网络模型缺少对时间依赖性以及异常数据不稳定的处理, 提出了基于图偏差网络的外部自编码器模型(graph deviation network-based external attention autoencoder, AEEA-GDN)深度提取表征, 此外在模型训练时引入自适应学习机制, 帮助网络更好地适应异常数据的变化. 在3个现实收集传感器数据集上的实验结果表明, 基于图偏差网络的外部自编码器模型比基线方法更准确地检测异常, 且总体性能更优.

基于自编码标准流的异常点检测

钟海鑫，王晖，郭躬德

2024, 33(3):34-42. DOI: 10.15888/j.cnki.csa.009420 CSTR: 32024.14.csa.009420

摘要 (498) HTML (981) PDF 1.38 M (1552) 评论 (0) 收藏

摘要:在大型和高维数据上进行有效检测, 在实际应用中具有重要意义. 异常点检测是指识别出偏离一般数据分布的数据点, 其核心是密度估计. 尽管像深度自编码高斯混合模型通过先降低维度, 再进行密度估计已经取得了重大进展, 但是它对低维潜在空间引入噪声, 并且在对密度估计模块优化时存在一些限制, 例如需要保证协方差是正定矩阵. 为解决这些限制, 本文提出一种用于无监督异常检测的深度自编码标准化流(deep autoencoder normalizing flow, DANF). 该模型利用深度自编码器为每个输入样本生成低维潜在空间表示和重构误差, 进而将其输入标准化流(normalizing flow, NF), 最终映射成高斯分布. 在多个公开的基准数据集上的实验结果表明, 深度自编码标准化流模型显著优于最先进的异常检测技术, 在评估指标F1-score上最高提升26.43%.

基于节点交互度的社会网络链路预测

徐瑞阳，徐振宇，李家印，许力

2024, 33(3):43-51. DOI: 10.15888/j.cnki.csa.009430 CSTR: 32024.14.csa.009430

摘要 (604) HTML (716) PDF 1.88 M (1114) 评论 (0) 收藏

摘要:链路预测是通过已知的网络拓扑和节点属性挖掘未来时刻节点潜在关系的重要手段, 是预测缺失链路和识别虚假链路的有效方法, 在研究社会网络结构演化中具有现实意义. 传统的链路预测方法基于节点信息或路径信息相似性进行预测, 然而, 前者考虑指标单一导致预测精度受限, 后者由于计算复杂度过高不适合在规模较大网络中应用. 通过对网络拓扑结构的分析, 本文提出一种基于节点交互度(interacting degree of nodes, IDN)的社会网络链路预测方法. 该方法首先根据网络中节点间的路径特征, 引入了节点效率的概念, 从而提高对于没有公共邻居节点之间链路预测的准确性; 为了进一步挖掘节点间共同邻居的相关属性, 借助分析节点间共同邻居的拓扑结构, 该方法还创新性地整合了路径特征和局部信息, 提出了社会网络节点交互度的定义, 准确刻画出节点间的相似度, 从而增强网络链路的预测能力; 最后, 本文借助6个真实网络数据集对IDN方法进行验证, 实验结果表明, 相比于目前的主流算法, 本文提出的方法在AUC和Precision两个评价指标上均表现出更优的预测性能, 预测结果平均分别提升22%和54%. 因此节点交互度的提出在链路预测方面具有很高的可行性和有效性.

融合双分支动态偏好的会话推荐

沈学利，王乐，田学成

2024, 33(3):52-62. DOI: 10.15888/j.cnki.csa.009447 CSTR: 32024.14.csa.009447

摘要 (525) HTML (903) PDF 1.79 M (1304) 评论 (0) 收藏

摘要:针对基于会话的推荐算法仅对用户单一偏好进行静态建模而无法捕捉用户受环境影响偏好产生的波动, 从而降低推荐准确性的问题. 提出融合双分支动态偏好的会话推荐方法: 首先, 通过异构超图来建模不同类型信息, 设计双分支聚合机制获取以及整合异构超图中信息并且学习多类型节点之间的关系, 再用价格嵌入增强器来加强类别和价格之间关系; 其次, 设计双层偏好编码器, 其中采用多尺度时序Transformer提取用户动态价格偏好, 利用软注意机制和反向位置编码学习用户动态兴趣偏好; 最后, 用门控机制融合用户多类型动态偏好, 向用户进行推荐. 通过在Cosmetics和Diginetica-buy两个数据集上进行实验, 结果证明与其他对比算法相比在Precision和MRR评价指标中有显著的提升.

基于车载环境的交通目标跟踪

孟令辰，孟乔，皇甫俊逸，李鑫

2024, 33(3):63-72. DOI: 10.15888/j.cnki.csa.009410 CSTR: 32024.14.csa.009410

摘要 (495) HTML (665) PDF 4.39 M (1446) 评论 (0) 收藏

摘要:针对车载环境下小目标难以识别和相机动态移动造成的目标跟踪精度下降问题, 提出一种基于改进YOLOv5与ByteTrack的交通目标跟踪方法. 首先, 引入Transformer与加权特征金字塔(BiFPN)结构的思想重构YOLOv5检测网络, 有效捕获了特征的全局依赖关系, 缓解了深层卷积小目标信息丢失问题, 改善了车载环境下的目标检测性能. 此后, 以ByteTrack为基础提出了添加相机移动补偿的CMC-ByteTrack跟踪方法, 更精准地描述了视频前后帧的数据关联关系, 提高了相机大幅位移时的跟踪精度. 实验结果表明, 改进YOLOv5的平均检测精度(mAP)达到了82.2%, 相比原算法提高了3.9%, 与CMC-ByteTrack结合后的跟踪准确性(MOTA)相比改进前的跟踪方法提高了2.8%.

多尺度特征金字塔融合的街景图像语义分割

曲海成，王莹，董康龙，刘万军

2024, 33(3):73-84. DOI: 10.15888/j.cnki.csa.009411 CSTR: 32024.14.csa.009411

摘要 (468) HTML (915) PDF 3.33 M (1572) 评论 (0) 收藏

摘要:针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题, 本文提出了一种语义分割网络(LDPANet). 首先, 将空洞卷积与引入残差学习单元的深度可分离卷积结合, 来优化编码器结构, 在降低了计算复杂度的同时缓解梯度消失的问题. 然后利用层传递的迭代空洞空间金字塔, 将自顶向下的特征信息依次融合, 提高了上下文信息的有效交互能力; 在多尺度特征融合之后引入属性注意力模块, 使网络抑制冗余信息, 强化重要特征. 再者, 以通道扩展上采样代替双线插值上采样作为解码器, 进一步提升了特征图的分辨率. 最后, LDPANet方法在Cityscapes和CamVid数据集上的精度分别达到了91.8%和87.52%, 与近几年网络模型相比, 本文网络模型可以精确地提取像素的位置信息以及空间维度信息, 提高了语义分割的准确率.

结合注意力和改进样本选取方法的少样本高光谱分类孪生网络

杨宇新，郭躬德，王晖

2024, 33(3):85-94. DOI: 10.15888/j.cnki.csa.009432 CSTR: 32024.14.csa.009432

摘要 (415) HTML (834) PDF 2.01 M (1437) 评论 (0) 收藏

摘要:针对高光谱图像(hyperspectral image)样本人工标记困难导致的样本数量不足的问题, 本文提出了一个结合注意力和空间邻域的少样本孪生网络算法. 它首先对高光谱图像进行PCA预处理, 实现数据降维; 其次, 对模型训练样本采用间隔采样和边缘采样的方式进行选取, 以有效减少冗余信息; 之后, Siamese network以大小不同的patch形式进行两两结合, 构建出样本对作为训练集进行训练, 不仅实现了数据增强的效果, 还能在提取光谱信息特征的同时, 充分提取目标像素光谱信息以及其周围邻域空间信息; 最后, 添加光谱维度的注意力模块以及空间维度的相似度度量模块, 分别对光谱信息和空间邻域信息进行权重分布, 以达到提升分类性能的目的. 实验结果表明, 本文提出的方法在部分公开数据集上对比常用方法取得了较好的实验效果.

融合深度残差网络和字典学习的肺炎检测

朱之强，卞维新，接标，黄宜，李文虎

2024, 33(3):95-102. DOI: 10.15888/j.cnki.csa.009436 CSTR: 32024.14.csa.009436

摘要 (467) HTML (648) PDF 1.75 M (1210) 评论 (0) 收藏

摘要:由于空气污染与吸烟等原因, 肺炎已成为人类死亡率最高的疾病之一. 随着机器学习与深度学习技术在医疗图像检测上的应用, 为临床专家诊断各类疾病提供了帮助. 但由于缺少有效的配对肺部X射线数据集, 以及现有针对肺炎检测的方法均采用不是针对肺炎任务的普遍分类模型, 难以发现肺炎图像与正常图像的细微差别, 导致识别失败. 为此, 本文通过数据裁剪、旋转等方式扩充数据集中的正常图像; 再使用50层深度残差网络对胸部X射线中的浅层肺炎特征进行学习; 然后, 通过两层字典对残差网络学习到的肺炎特征进行更深度的抽象和学习, 发现不同肺部图像之间的微小差别; 最后, 融合残差网络和字典学习提取到的多级肺炎特征, 构建肺炎检测模型. 为了验证算法的有效性, 在Chest X-ray肺炎数据集上评估肺炎检测模型的性能. 根据测试结果, 本文提出模型的检测准确率为97.12%; 指标测试中, 精度与召回率之间的调和平均数上的得分为97.73%. 与现有方法相比, 获得了更高的识别精度.

基于MAU-Net的CT多器官分割

步洪禧，何利文

2024, 33(3):103-110. DOI: 10.15888/j.cnki.csa.009417 CSTR: 32024.14.csa.009417

摘要 (516) HTML (862) PDF 2.13 M (1505) 评论 (0) 收藏

摘要:基于计算机断层扫描(CT)图像的多器官精准分割能够准确诊断病灶, 快速制定治疗计划, 提高临床工作的效率. 传统分割算法针对形变大、体积较小且边缘模糊的器官分割效果相对较差. 本文提出了一种改进的U-Net的医学图像分割网络(MAU-Net), 通过引入两个模块, 旨在实现对多器官的精准分割. 多尺度空洞卷积模块通过不同内核大小实现捕捉目标器官多尺度特征. 动态注意力模块精确提取重要特征实现分支间的权重平衡. 通过消融实验和其他主流网络的对比实验, 验证了MAU-Net的优越性. 相比于传统的U-Net模型, MAU-Net在所有器官上平均Dice相关系数(DSC)提高了3.39%, 平均95%豪斯多夫距离(HD)降低了4.84 mm. MAU-Net在多器官分割任务中展现了出色的鲁棒性和应用潜力, 有助于提高临床工作效率和医疗诊断的准确性.

融合深度信息的室内场景分割算法

王柳，梁铭炬

2024, 33(3):111-117. DOI: 10.15888/j.cnki.csa.009429 CSTR: 32024.14.csa.009429

摘要 (464) HTML (883) PDF 2.59 M (895) 评论 (0) 收藏

摘要:针对室内复杂场景中, 图像语义分割存在的特征损失和双模态有效融合等问题, 提出了一种基于编码器-解码器架构的融合注意力机制的轻量级语义分割网络. 首先采用两个残差网络作为主干网络分别对RGB和深度图像进行特征提取, 并在编码器中引入极化自注意力机制, 然后设计引入双模态融合模块在不同阶段对RGB特征和深度特征进行有效融合, 接着引入并行聚合金字塔池化以获取区域之间的依赖性. 最后, 采用3个不同尺寸的解码器将前面的多尺度特征图进行跳跃连接并融合解码, 使分割结果含有更多的细节纹理. 将本文提出的网络模型在NYUDv2数据集上进行训练和测试, 并与一些较先进RGB-D语义分割网络对比, 实验证明本文网络具有较好分割性能.

保留细节特征的图像任意风格迁移

蒋亨畅，张笃振

2024, 33(3):118-125. DOI: 10.15888/j.cnki.csa.009449 CSTR: 32024.14.csa.009449

摘要 (385) HTML (776) PDF 3.94 M (1582) 评论 (0) 收藏

摘要:一些主流的图像任意风格迁移模型在保持内容图像的显著性信息和细节特征方面依然有局限性, 生成的图像往往具有内容模糊、细节失真等问题. 针对以上问题, 本文提出一种可以有效保留内容图像细节特征的图像任意风格迁移模型. 模型包括灵活地融合从编码器提取到的浅层至深层的多层级图像特征; 提出一种新的特征融合模块, 该模块可以高质量地融合内容特征和风格特征. 此外, 还提出一个新的损失函数, 该损失函数可以很好地保持内容和风格全局结构, 消除伪影. 实验结果表明, 本文提出的图像任意风格迁移模型可以很好地平衡风格和内容, 保留内容图像完整的语义信息和细节特征, 生成视觉效果更好的风格化图像.

跨层协同注意和通道分组注意的细粒度图像分类

何志祥，齐琦，何伟，郭龙源

2024, 33(3):126-133. DOI: 10.15888/j.cnki.csa.009419 CSTR: 32024.14.csa.009419

摘要 (492) HTML (831) PDF 1.70 M (1460) 评论 (0) 收藏

摘要:细粒度图像分类的主要挑战在于类间的高度相似性和类内的差异性. 现有的研究多数基于深层的特征而忽略了浅层细节信息, 然而深层的语义特征由于多次卷积和池化操作往往会丢失大量的细节信息. 为了更好地整合浅层和深层的信息, 提出了基于跨层协同注意和通道分组注意的细粒度图像分类方法. 首先, 通过ResNet50加载预训练模型作为骨干网络提取特征, 由最后3个阶段提取的特征以3个分支的形式输出, 每一个分支的特征通过跨层的方式与其余两个分支的特征计算协同注意并交互融合, 其中最后一个阶段的特征经过通道分组注意模块以增强语义特征的学习能力. 模型训练可以高效地以端到端的方式在没有边界框和注释的情况下进行训练, 实验结果表明, 该算法在3个常用细粒度图像数据集CUB-200-2011、Stanford Cars和FGVC-Aircraft上的准确率分别达到了89.5%、94.8%和94.7%.

基于三支决策的多视图低秩稀疏子空间聚类算法

方英杰，贾天夏，徐怡，骆帆

2024, 33(3):134-145. DOI: 10.15888/j.cnki.csa.009424 CSTR: 32024.14.csa.009424

摘要 (474) HTML (776) PDF 1.67 M (1303) 评论 (0) 收藏

摘要:多视图子空间聚类是一种从子空间中学习所有视图共享的统一表示, 挖掘数据潜在聚类结构的方法. 作为一种处理高维数据的聚类方法, 子空间聚类是多视图聚类领域的研究热点之一. 多视图低秩稀疏子空间聚类是一种结合了低秩表示和稀疏约束的子空间聚类方法. 该算法在构造亲和矩阵过程中, 利用低秩稀疏约束同时捕捉了数据的全局结构和局部结构, 优化了子空间聚类的性能. 三支决策是一种基于粗糙集模型的决策思想, 常被应用于聚类算法来反映聚类过程中对象与类簇之间的不确定性关系. 本文基于三支决策的思想, 设计了一种投票制度作为决策依据, 将其与多视图稀疏子空间聚类组成一个统一框架, 从而形成一种新的算法. 在多个人工数据集和真实数据集上的实验表明, 该算法可提高多视图聚类的准确性.

基于图神经网络的最大化代数连通度算法

夏春燕，侯新民

2024, 33(3):146-157. DOI: 10.15888/j.cnki.csa.009435 CSTR: 32024.14.csa.009435

摘要 (415) HTML (822) PDF 2.57 M (1401) 评论 (0) 收藏

摘要:随着智能体数量的增加, 多智能体系统中潜在的通信链路数量呈指数级增长. 过多冗余链路的存在给系统带来了大量的能源浪费和维护成本, 而盲目地去除链路又会降低系统的稳定性和安全性. 代数连通度是衡量图连通性的重要指标之一. 然而, 传统的半正定规划(SDP)方法和启发式算法在求解大规模场景下的最大化代数连通度问题时非常耗时. 在本文中, 我们提出了一种监督式的图神经网络模型来优化多智能体系统的代数连通度. 我们将传统的SDP方法应用于小规模任务场景中, 得到足够丰富的训练样本和标签. 在此基础上, 我们训练了一个图神经网络模型, 该模型可用于更大规模的任务场景中. 实验结果表明, 当需要去除15条边时, 我们的模型的平均性能达到了传统SDP方法的98.39%. 此外, 我们的模型计算时间极其有限, 可以推广到实时场景中去.

融合强化学习的多目标路径规划

周毅，刘俊

2024, 33(3):158-169. DOI: 10.15888/j.cnki.csa.009418 CSTR: 32024.14.csa.009418

摘要 (745) HTML (1035) PDF 4.02 M (2045) 评论 (0) 收藏

摘要:移动机器人路径规划问题的节点数量大、搜索空间广, 且对安全性和实时性有要求等因素, 针对移动机器人多目标路径规划问题, 提出一种新颖的融合强化学习的多目标智能优化算法. 首先, 该算法采用NSGA-II为基础框架, 利用强化学习的赋予个体学习能力, 设计一种SARSA算子提高算法的全局搜索效率. 其次, 为了加速算法的收敛速度和保证种群多样性, 增加自适应模拟二进制交叉算子(tanh-SBX)作为辅助算子, 并将种群分为两种性质不同的子种群: 精英种群和非精英种群. 最后, 设计了4种不同的策略, 通过模拟退火算法的Metropolis准则计算更新策略的概率, 让最合适的策略引导种群的优化方向, 以平衡探索和利用. 仿真实验表明, 该算法在不同复杂度的环境下均能找到最佳路径. 相比传统智能仿生算法, 在更加复杂的环境中, 所提出的算法能有效平衡优化目标, 找到更优的安全路径.

基于多混沌系统的多图像加密算法

高若云，白牡丹，黄佳鑫，郭亚丽

2024, 33(3):170-177. DOI: 10.15888/j.cnki.csa.009412 CSTR: 32024.14.csa.009412

摘要 (436) HTML (684) PDF 2.01 M (1597) 评论 (0) 收藏

摘要:针对多幅图像在传输中的安全性问题, 本文提出了一种基于多混沌系统的多图像加密算法. 首先, 利用离散小波变换对多幅图像进行预处理, 得到一幅拼接的大图像; 接着, 利用logistic-sine-cosine (LSC)映射生成混沌序列, 进而生成用于置乱的矩阵O对像素位置进行置乱; 最后, 采用超混沌Lorenz系统生成四维混沌序列, 利用其对置乱后的图像进行双向扩散和行列置乱, 获得最终密文图像. 所提算法加解密过程简单, 执行效率高. 实验结果经多方面分析后得出该算法的密钥空间大, 可以抵御多种攻击手段, 具有较好的加密效果和安全性.

基于Coordinate Attention和空洞卷积的异物识别

王春霖，吴春雷，李灿伟，朱明飞

2024, 33(3):178-186. DOI: 10.15888/j.cnki.csa.009416 CSTR: 32024.14.csa.009416

摘要 (470) HTML (610) PDF 2.26 M (1282) 评论 (0) 收藏

摘要:在我国工厂的工业化生产中, 带式运输机占有重要的地位, 但是在其运输物料的过程中, 常有木板、金属管、大型金属片等混入物料中, 从而对带式运输机的传送带造成损毁, 引起巨大的经济损失. 为了检测出传送带上的不规则异物, 设计了一种新的异物检测方法. 针对传统异物检测方法中存在的对于图像特征提取能力不足以及网络感受野相对较小的问题, 我们提出了一种基于coordinate attention和空洞卷积的单阶段异物识别方法. 首先, 网络利用coordinate attention机制, 使网络更加关注图像的空间信息, 并对图像中的重要特征进行了增强, 增强了网络的性能; 其次, 在网络提取多尺度特征的部分, 将原网络的静态卷积变为空洞卷积, 有效减少了常规卷积造成的信息损失; 除此之外, 我们还使用了新的损失函数, 进一步提高了网络的性能. 实验结果证明, 我们提出的网络能有效识别出传送带上的异物, 较好地完成异物检测任务.

融合残差注意力和标准偏差的6D姿态细化网络

邓江，陈姚节，张梦杰

2024, 33(3):187-194. DOI: 10.15888/j.cnki.csa.009444 CSTR: 32024.14.csa.009444

摘要 (444) HTML (837) PDF 1.41 M (1504) 评论 (0) 收藏

摘要:在6D物体姿态估计领域中, 现有算法往往难以实现对目标物体精准且鲁棒的姿态估计. 为解决该问题, 提出了一种结合残差注意力、混合空洞卷积和标准差信息的物体6D姿态细化网络. 首先, 在Gen6D图片特征提取网络中, 采用混合空洞卷积模块替换传统卷积模块, 以此扩大感受野、加强全局特征捕获能力. 接着, 在3D卷积神经网络中, 加入残差注意力模块, 这有助于区分特征通道的重要程度, 进而在提取关键特征的同时, 减少浅层特征的丢失. 最后, 在平均距离损失函数中, 引入了标准差信息, 从而使模型能够区分物体的更多姿态信息. 实验结果显示, 所提出的网络在LINEMOD数据集和GenMOP数据集上的ADD指标分别达到了68.79%和56.03%. 与Gen6D网络相比, ADD指标分别提升了1.78个百分点和5.64个百分点, 这一结果验证了所提出的网络能够显著提升6D姿态估计的准确性.

基于混合数据类型相关性度量的非正态数据合成

王春东，张世鹏

2024, 33(3):195-205. DOI: 10.15888/j.cnki.csa.009441 CSTR: 32024.14.csa.009441

摘要 (287) HTML (587) PDF 2.95 M (1274) 评论 (0) 收藏

摘要:数据在机器学习、人工智能等领域的研究和开发工作中占据了极其重要的地位. 然而现实中存在的一些因素导致数据需求者无法获得符合工作要求的真实数据集, 例如隐私问题、数据稀缺和数据质量较差等. 针对此现状, 在 SI (sampling-iteration) technique的基础上改进出一种非正态数据合成算法(KMSI). 该算法使用混合类型相关系数矩阵以减小SI technique在目标设定、控制循环等步骤中的度量误差, 通过替换Bootstrap采样法为核密度估计采样法以避免使用真实数据. 实验结果表明, KMSI相较SI technique能够应对复杂分布和混合类型的数据集, 且在合成结果中不包含真实数据; 相较于其他改进方法, KMSI在合成数据集样本量上能够给予使用者更大的自定义空间.

基于DH-Swin Unet的医学图像分割算法

王艺妮，时宏伟

2024, 33(3):206-212. DOI: 10.15888/j.cnki.csa.009440 CSTR: 32024.14.csa.009440

摘要 (483) HTML (795) PDF 1.54 M (1347) 评论 (0) 收藏

摘要:骨关节疾病自古以来是人类最高发的疾病之一, 随着老龄化的不断加快, 这类疾病日趋广泛, 关节外科医师面临着巨大挑战. 对人体关节的图像分割方法研究可以帮助医生进行临床诊断和治疗, 然而, 由于存在噪声、模糊、对比度低等问题, 医学图像的特征提取比普通图像更具挑战性, 而且目前大多数分割模型在编码器和解码器之间都采用了普通的跳跃连接, 没有注重解决跳跃连接过程中的信息间隙和损失问题. 为解决这些问题, 提出一种基于DH-Swin Unet的医学图像分割算法, 该模型在Swin-Unet模型的基础上, 在跳跃连接中引入密集连接的Swin Transformer块, 并加入混合注意力机制, 来强化网络的特征信息传递. 通过在某三甲医院提供的真实临床数据对所提方法的性能进行评价, 结果表明, 所提出的方法取得了DSC为86.79%、HD为32.05 mm的分割结果, 在关节疾病的临床诊断中具有一定的实用价值.

基于BSCWEformer的退火炉内分组式辊速序列预测

岳晓光，石元博

2024, 33(3):213-219. DOI: 10.15888/j.cnki.csa.009434 CSTR: 32024.14.csa.009434

摘要 (337) HTML (614) PDF 1.34 M (986) 评论 (0) 收藏

摘要:退火炉内带钢的长度受到温度、张力等因素的影响而变化, 导致辊的转速改变以及焊缝位置的不确定, 从而威胁生产安全. 为了准确预测辊的转速以计算焊缝的实时位置, 本文提出基于带状稀疏柯西自注意力的BSCWEformer (banded sparse Cauchy weight enhanced Transformer)模型. 模型采用带状稀疏的、使用基于相对位置计算的柯西分布权重值增强的自注意力结构, 在提高相邻输入序列的重要性的同时, 将自注意力的复杂度由二次方降低为线性. 通过实际生产数据进行实验, 并与LogSparse Transformer、Transformer、RNMT+等模型进行对比, 得出本文所提出的BSCWEformer模型在退火炉内分组式辊速序列预测任务上具有较高的预测精度.

基于图像点云的道路缺陷检测

李威祥，李武劲，陈思源

2024, 33(3):220-225. DOI: 10.15888/j.cnki.csa.009443 CSTR: 32024.14.csa.009443

摘要 (421) HTML (1039) PDF 1.46 M (1799) 评论 (0) 收藏

摘要:本文针对无人机图像点云道路缺陷检测问题, 提出了一种基于点云切片平面拟合与聚类的道路缺陷检测方法. 首先, 采集无人机图像进行三维重建生成图像点云, 对点云进行坡度滤波与统计离群点滤波, 消除噪声和异常点的干扰. 然后, 对点云进行切片并利用随机采样一致性平面拟合算法估计道路的平面模型. 随后, 运用点云DBSCAN聚类算法分类出边缘噪声与道路损伤点云. 最后, 采用点云切片法估计损伤程度. 在实验中, 我们使用真实无人机采集的点云数据, 并与基于点云垂直度特征检测方法进行了对比. 实验结果表明, 本文方法表现出较高的准确性和鲁棒性, 体积估计的误差为1307 cm³. 相较于传统方法, 本文方法能够更精确地检测出道路损伤, 并能适应复杂的道路形状变化.

基于定向变异策略的改进克隆选择算法

彭旭，杨超，张文豪，王道维，蒋碧波

2024, 33(3):226-232. DOI: 10.15888/j.cnki.csa.009359 CSTR: 32024.14.csa.009359

摘要 (444) HTML (705) PDF 1.86 M (1418) 评论 (0) 收藏

摘要:本文针对克隆选择算法(CSA)存在的问题, 如搜索速度慢、收敛精度低、容易陷入局部最优, 提出一种基于定向变异的改进克隆选择算法(DMSCSA). 该算法引入Halton序列来生成均匀分布的初始化种群, 实现对解空间更高效的搜索; 采用黄金正弦变异策略在迭代过程中对优秀抗体定向变异, 提升算法收敛速度; 引入柯西变异策略, 能够在保证种群多样性的前提下提高算法跳出局部最优的能力. 使用CEC2019测试函数集中的8个不同的测试函数并与其他同类型算法进行对比实验, 通过实验结果可知, DMSCSA算法在寻优精度、收敛速度等方面均有提升.

基于改进麻雀搜索算法的无信号交叉路口车辆调度优化

李金龙，刘伟

2024, 33(3):233-244. DOI: 10.15888/j.cnki.csa.009409 CSTR: 32024.14.csa.009409

摘要 (386) HTML (743) PDF 1.93 M (1314) 评论 (0) 收藏

摘要:本文将无信号交叉路口内部区域离散化为多个路权点, 并将车辆右转弯与行人或非机动车发生碰撞造成交通事故时所占的路权点设为“故障点”, 故障点有一个至多个, 本文研究无信号交叉路口在发生车辆故障时的通行效率问题. 选择麻雀搜索算法提高车辆调度的通行效率, 但是该算法存在前期易陷入局部最优值而后期寻优精度不高等问题, 为解决此问题, 引入自适应学习参数和等级反向学习的改进策略, 提出基于自适应参数和等级反向学习的麻雀算法(ALSSA). 选取13个基准测试函数以及 Wilcoxon秩和检验P值验证ALSSA的有效性, 结果表明, 改进的麻雀搜索算法与其他算法相比, 全局搜索能力、寻优精度等都有较大提升. 最后, 计算双向两车道、双向四车道、双向八车道不同车流量下的最优通行时间.

关系敏感型多子图图神经网络的多模态实体对齐

金佳惠，李治江，刘谊章

2024, 33(3):245-254. DOI: 10.15888/j.cnki.csa.009437 CSTR: 32024.14.csa.009437

摘要 (354) HTML (926) PDF 2.26 M (1601) 评论 (0) 收藏

摘要:作为融合多源异构知识图谱的主要手段, 实体对齐一般首先编码实体等图结构信息, 而后通过计算实体间相似度来获取对齐实体. 然而, 现存的多模态对齐方法往往直接引入预训练方法表达模态特征, 忽略了模态间的融合以及模态特征与图结构间的融合. 因此, 本文提出一种关系敏感型的多子图图神经网络(RAMS)方法. 通过多子图图神经网络编码方法对模态信息与图结构进行结合并获得实体表征, 通过跨域相似度计算得到对齐结果. 广泛且多角度的实验证明了本文所提出的模型在准确率、效率、鲁棒性方面均超过了基线模型.

结合语法结构和语义信息的情感三元组提取

杨芳捷，冯广，唐业凯

2024, 33(3):255-263. DOI: 10.15888/j.cnki.csa.009438 CSTR: 32024.14.csa.009438

摘要 (351) HTML (860) PDF 1.32 M (1550) 评论 (0) 收藏

摘要:针对目前大多数方面情感三元组提取方法存在着没有充分考虑语法结构和语义相关性的问题. 本文提出一种结合语法结构和语义信息的方面情感三元组提取模型, 首先提出使用依赖解析器得到所有依赖弧的概率矩阵构建语法图, 提取丰富的语法结构信息. 其次利用自注意力机制构建语义图, 表示单词与单词之间的语义相关性, 从而减低噪声词的干扰. 最后设计了一个相互仿射变换层, 让模型可以更好地交换语法图和语义图之间的相关特征, 提升模型情感三元组提取的表现. 在多个公开数据集上进行验证. 实验表明, 与现有的情感三元组提取模型相比, 精确度(P)、召回率(R)和F1值整体都有提高, 验证了结合语法结构和语义信息在方面情感三元组提取的有效性.

基于交叉特征感知融合的多领域虚假新闻检测

王振琦，陈涛，张宝宇，张明利，孙晨瑜，张卫山

2024, 33(3):264-272. DOI: 10.15888/j.cnki.csa.009439 CSTR: 32024.14.csa.009439

摘要 (617) HTML (948) PDF 1.71 M (2029) 评论 (0) 收藏

摘要:各领域虚假新闻的传播对社会造成了严重的影响, 不同领域间新闻的领域偏移问题和跨域关联问题也对模型的预测能力造成了极大的挑战. 针对上述问题, 本文提出了一种基于交叉特征感知融合的多领域虚假新闻检测方法. 该方法可以捕捉不同领域间新闻的多种特征差异, 并挖掘新闻之间的关联关系, 从多个维度控制模型在不同领域的特征融合策略. 此外, 本文还提出了一种联合训练框架. 本方法的模型使用本框架进行训练, 在中英文数据集上的预测F1分数分别达到了92.84%和85.49%, 相较于最先进的模型, 预测效果分别提升了1.16%和1.07%.

基于S-Transformer的多模态船舶轨迹预测

柯研，陈姚节

2024, 33(3):273-280. DOI: 10.15888/j.cnki.csa.009446 CSTR: 32024.14.csa.009446

摘要 (553) HTML (1106) PDF 1.57 M (2161) 评论 (0) 收藏

摘要:船舶轨迹预测是实现船舶智能航行的前提与基础. 目前, 针对船舶轨迹预测的研究大多仅依赖于船舶自动识别系统(AIS)历史数据, 而未利用到船舶上其他传感器信息. 于是本文提出了一种多模态轨迹预测模型——S-Transformer. 在该网络中, 电子海图中的海水/陆地被分割作为辅助训练目标与真实舟山港AIS数据加以综合从而对模型进行训练, 并对船舶未来航行轨迹进行预测; 其中, 本文还引入segment recurrence来捕获AIS数据的长期依赖关系. 实验结果表明, S-Transformer在不同的船舶行驶情况中都有优秀的预测结果, 并优于相关预测任务的单模态基准模型.

基于上下文赌博机的自适应实时车间调度

陈鸣，王闯，许政

2024, 33(3):281-287. DOI: 10.15888/j.cnki.csa.009454 CSTR: 32024.14.csa.009454

摘要 (368) HTML (701) PDF 1.32 M (1068) 评论 (0) 收藏

摘要:传统的多Agent车间调度方法使用单一调度规则, 忽略了生产环境变化对调度规则适用性的影响, 导致调度结果欠佳. 本文针对该问题提出一种自适应实时车间调度方法, 通过上下文赌博机对工件调度过程进行类比建模. 经过若干回合学习的上下文赌博机模型能够依据生产环境制定调度决策, 获得优异的调度结果. 最后, 通过仿真实验验证了提出方法的有效性.

微信公众号

网站二维码

>综述文章

当期目录

年份

刊期