2024, 33(8):1-17. DOI: 10.15888/j.cnki.csa.009535 CSTR: 32024.14.csa.009535
摘要:针对同一地区邻近集装箱码头往往物流功能相似、货源腹地重叠、无序竞争突出和资源利用率较低等特点, 本文重点探讨了隶属于同一组织内且位置相邻多集装箱码头的泊位-堆场一体化计划调度(multiple container terminal tactical berth and yard incorporate integrative scheduling, MCT-TBY-IIS)问题. 基于计算物流, 利用多重多背包问题将MCT-TBY-IIS抽象和分解为考虑泊位水深约束和出口集装箱可转港作业的多码头动态连续泊位分配和多码头周期滚动堆场分配两个中度耦合子问题, 进而在计算物流面向问题探索的思想下, 提出了面向层次嵌套结构的二阶段改进帝国竞争算法(hierarchical nesting oriented two-stage improved imperialist competitive algorithm, HNO-TSI-ICA)对MCT-TBY-IIS进行求解优化. 最后, 面向我国东南沿海的典型多码头联合作业实例, 遴选出面向帝国兴替的双同化帝国竞争改进算法和面向0-1背包问题的二进制帝国竞争算法组合应用于HNO-TSI-ICA, 其在求解MCT-TBY-IIS时效果较好, 且堆场作业子系统目标成本的结构较稳定, 其不受计划期内港口负荷和计划周期长度的影响, 其中, 出口箱区集装箱水平运输成本的贡献度在堆场作业子目标成本的比重最大, 稳定在83%左右. 通过对MCT-TBY-IIS的建模与优化, 可以发现多码头联合作业模式有较好的潜力帮助同一组织内邻近的多码头降本增效和提高核心资源的利用率.
2024, 33(8):18-29. DOI: 10.15888/j.cnki.csa.009582 CSTR: 32024.14.csa.009582
摘要:基于最小生成树(minimum spanning tree, MST)的聚类算法能够识别具有任意形状的簇, 该算法在如何有效构建最小生成树和识别无效边方面存在不足, 而且易受到噪声点影响. 本文利用密度峰值聚类算法思想的优点来寻找局部密度峰, 局部密度峰在保留原始数据集分布结构的同时, 排除了噪声点, 因此, 将局部密度峰与最小生成树聚类算法相结合, 采用标签传播, 提出了基于局部密度峰和标签传播的最小生成树聚类算法(DPMST). 该算法采用了局部密度峰之间基于共享邻的距离, 利用局部密度峰之间的邻域信息, 有效构造最小生成树和识别无效边, 使算法能够发现具有复杂结构的簇. 标签传播增强强标签, 削弱弱标签, 以细化错误的标签, 特别是对于边界点以及揭示复杂流形, 能够提高聚类结果的质量. 人工和真实数据集上的实验结果表明, 与经典聚类算法DPC、MST、K-means、DBSCAN、AP、SC和BIRCH比较, DPMST算法表现优异.
2024, 33(8):30-39. DOI: 10.15888/j.cnki.csa.009621 CSTR: 32024.14.csa.009621
摘要:甘肃彩陶在中国各类彩陶文化中拥有最为完整的时空序列, 然而尚未有专门针对甘肃彩陶的风格迁移研究. 为弘扬中华优秀传统文化, 构建了甘肃彩陶数据集, 提出了一种几何风格迁移方法. 该方法生成了一个神经扭曲场, 将甘肃彩陶变形为目标对象的几何风格, 并保持了彩陶的纹理. 网络结构方面加入了位置嵌入和特征增强模块, 提高特征编码的质量. 损失函数方面引入了形状一致性损失和平滑正则化项, 防止彩陶的细节发生突变, 提高变形效果. 实验结果表明, 该模型能够在甘肃彩陶与不同类的对象间进行大规模的几何风格迁移, 同时可以保持良好的彩陶细节, 产生新的视觉体验.
2024, 33(8):40-50. DOI: 10.15888/j.cnki.csa.009558 CSTR: 32024.14.csa.009558
摘要:跨项目缺陷预测(cross-project defect prediction, CPDP)已经成为软件工程和数据挖掘领域的一个重要研究方向, 利用其他数据丰富项目的缺陷代码来建立预测模型, 解决了模型构建过程中的数据不足问题. 然而源项目和目标项目的代码文件之间存在的分布差异, 导致跨项目预测效果不佳. 大多数研究采用域适应方法来解决这一问题, 但是现有的方法一方面只考虑了条件分布或边缘分布对缺陷预测的影响, 忽视了其动态性; 另一方面没有选择合适的伪标签. 基于上述两个方面, 本文提出了一种基于动态分布对齐和伪标签学习的跨项目缺陷预测方法(DPLD). 具体来说, 我们通过对抗域适应方法分别在域对齐和类别对齐模块中减小项目间的边缘分布差异和条件分布差异, 并借助动态分布因子动态、定量地描述了两种分布的相对重要性. 此外, 本文也提出了一种伪标签学习方法, 通过数据间的几何相似性来增强伪标签作为真实标签的准确性. 本文在PROMISE数据集上进行了实验, F-measure和AUC的值分别提升了22.98%、15.21%, 表明了本文方法在减小项目间分布差异、提升跨项目缺陷预测性能上的有效性.
2024, 33(8):51-59. DOI: 10.15888/j.cnki.csa.009593 CSTR: 32024.14.csa.009593
摘要:遥感影像语义分割在环境监测、土地覆盖分类和城市规划等领域发挥着至关重要的作用. 卷积神经网络及其改进模型是遥感影像语义分割的主流方法, 但此类方法更加关注局部上下文特征的学习, 无法有效建模不同物体之间的全局分布关系, 进而制约了模型的分割性能. 为了解决该问题, 本文在卷积神经网络的基础上, 构建了全局语义关系学习模块, 充分学习不同物体之间的共生关系, 有效地增强了模型的表征能力. 此外, 考虑到同一场景中, 待分割物体的尺度存在差异性, 构建了多尺度关系学习模块, 以融合不同尺度的全局语义关系. 为了评估模型的性能, 本文在Vaihingen和Potsdam两个常用的遥感影像数据集上进行了充分的实验. 实验结果表明, 本文方法能够获得比已有的基于卷积神经网络的模型更高的分割性能.
2024, 33(8):60-67. DOI: 10.15888/j.cnki.csa.009573 CSTR: 32024.14.csa.009573
摘要:格子玻尔兹曼方法(lattice Boltzmann method, LBM)是一种基于分子运动理论计算流体力学(computational fluid dynamics, CFD)的方法, 提高LBM的并行计算能力是高性能计算领域的一项重要的研究内容. 本文基于SW26010Pro处理器, 通过区域分解、数据重构、双缓冲、向量化等优化方法, 实现了LBM的多级并行. 基于以上优化方案, 测试了5 600万网格规模, 实现结果显示, 相比于MPI进行级并行, 碰撞过程的平均加速倍数达到61.737、迁移过程的平均加速倍数达到17.3, 同时对方腔流案例做了强扩展测试, 网格规模为1200×1200×1200, 以6.2万计算核心为基准, 百万核心的并行效率超过60.5%.
2024, 33(8):68-77. DOI: 10.15888/j.cnki.csa.009596 CSTR: 32024.14.csa.009596
摘要:云及其阴影的有效分割是遥感图像处理领域中重要的问题, 它对于地表特征提取、气候检测、大气校正等有很大帮助. 然而云和云影遥感图像特征复杂, 云分布多样不规则, 且边界信息模糊易受背景干扰等特点, 导致其特征难以准确提取, 也少有专门为其设计的网络. 针对以上问题, 本文提出一种ViT (vision Transformer)和D-UNet双路网络. 本文网络分为两个分支: 一路是基于卷积的局部特征提取模块, 在D-UNet的膨胀卷积模块基础上, 引入深度可分离卷积, 提取多尺度特征的同时, 减少参数; 另一路通过ViT在全局上理解上下文语义, 加深对整体特征提取. 两支路间存在信息交互, 完善提取的特征信息. 最后通过独特设计的融合特征解码器, 进行上采样, 减少信息丢失. 模型在自建的云和云影数据集以及HRC_WHU公开数据集上取得优越的性能, 在MIoU指标上分别领先次优模型0.52%和0.44%, 达到了92.05%和85.37%.
2024, 33(8):78-89. DOI: 10.15888/j.cnki.csa.009590 CSTR: 32024.14.csa.009590
摘要:知识追踪任务旨在通过对学生历史学习数据实时准确地追踪学生知识状态, 并预测学生未来的答题表现. 针对当前研究忽略了题目涵盖知识点中复杂的高阶关系的问题, 提出一种融合知识点关系的深度记忆网络知识追踪模型(deep memory network knowledge tracing model incorporating knowledge point relationships, HRGKT). 首先, HRGKT使用知识点关系图定义图中节点之间的关系信息, 表示知识点之间的丰富信息. 使用GAT获取两者之间的高阶关系. 然后, 学习过程中存在着遗忘, HRGKT综合考虑4个影响知识遗忘的因素来更准确地追踪学生知识状态. 最后, 根据真实在线教育数据集上的实验比较结果, 与当前知识追踪模型相比, HRGKT在追踪学生知识掌握状态方面表现更加准确, 并且具备更好的预测性能.
2024, 33(8):90-97. DOI: 10.15888/j.cnki.csa.009595 CSTR: 32024.14.csa.009595
摘要:伪装目标检测是一项在复杂场景中定位和识别伪装目标的任务. 目前基于深度神经网络的方法已初步运用, 但在复杂场景下遇到干扰时, 许多方法无法充分利用目标的多级特征来提取丰富的语义信息, 仅依靠固定尺寸特征识别伪装目标. 为解决这一问题, 本文提出了一种基于多尺度特征融合交互的伪装目标检测网络. 该网络包含两个创新设计: 多尺度特征感知模块和双阶段邻级交互模块. 前者旨在通过结合多尺度特征的方式充分捕获复杂场景中丰富的局部-全局场景对比信息. 后者则是整合来自相邻层的特征以利用跨层相关性将有价值的上下文信息从编码器传输到解码器网络. 本文在CHAMELEON、CAMO-Test、COD10K-Test这3个公共数据集上对提出的方法进行了评测并与当前的主流方法对比. 实验结果表明, 本文方法的性能超越了当前的主流方法, 在各项指标上达到了优异的性能水平.
2024, 33(8):98-107. DOI: 10.15888/j.cnki.csa.009589 CSTR: 32024.14.csa.009589
摘要:本文旨在解决共享医疗数据场景下的群组用户授权管理与完整性验证问题. 首先, 为防止群组用户越权操作, 引入授权标识符, 医疗数据持有者凭授权标识符, 结合用户身份完成权限分配; 而授权标识符的数学构造可有效保证其不可伪造性. 其次, 为记录撤销用户并剥夺其访问权限, 引入基于跳表设计的撤销用户表; 跳表的快速查找和插入的特性, 使方案撤销用户的开销仅为${\mathrm{O}}(\log n)$. 随后, 完善了共享数据完整性验证的具体流程与数学设计. 最后通过安全性分析和仿真实验证明了方案的安全性和高效性.
2024, 33(8):108-114. DOI: 10.15888/j.cnki.csa.009575 CSTR: 32024.14.csa.009575
摘要:固体氧化物燃料电池(SOFC)表面缺陷的图像分割, 对单片SOFC质量检测具有重要意义. 针对单片SOFC表面缺陷图像边缘模糊、背景复杂等问题, 提出一种融合自注意力的SOFC表面缺陷图像分割方法. 首先, 提出多通道自注意力模块, 以增强多通道间关联和提升通道表示; 其次, 利用多尺度注意力融合模块, 进一步提升网络对不同尺度缺陷特征的提取能力; 最后, 提出三元联合损失函数对训练过程进行监督. 实验表明, 提出方法在提升网络分割性能的同时可有效提取单片SOFC表面缺陷.
2024, 33(8):115-122. DOI: 10.15888/j.cnki.csa.009601 CSTR: 32024.14.csa.009601
摘要:稀疏移动群智感知是一种新兴的模式, 它从感知区域的子集收集数据, 然后推理其他区域的数据. 然而, 在实际应用中, 工人不足或分布不均的情况广泛存在. 因此, 在有限的预算下, 必须优先选择相对更重要的工人收集数据. 此外, 许多稀疏移动群智感知应用对数据的时效性要求较高. 因此本文将考虑数据的新鲜度, 并使用信息年龄作为新鲜度指标. 为了解决这些挑战, 本文提出了一种轻量级年龄敏感的数据感知和推理框架. 该框架旨在预算约束下, 选择合适的工人收集数据, 并通过准确捕捉感知数据时空关系进行数据推理, 以优化信息年龄和推理的准确性. 由于预算和工人有限, 可能会导致数据量较少的情况. 因此, 本文还提出了精简数据推理模型的方法, 以提高推理效率. 通过广泛的实验进一步论证了该框架在实际应用中的优越性.
2024, 33(8):123-131. DOI: 10.15888/j.cnki.csa.009627 CSTR: 32024.14.csa.009627
摘要:针对传统降水预测方法的局限性, 提出了一种融合多源数据的深度学习短时降水预测模型MSF-Net. 在GPM历史降水数据的基础上融合了ERA5气象数据、雷达数据和DEM数据. 利用气象特征提取模块学习多源数据的气象特征, 通过注意力融合预测模块进行特征融合并实现短时降水预测. 将MSF-Net的降水预测结果与多种人工智能方法进行对比, 实验结果表明, MSF-Net模型的风险评分TS和偏差评分Bias最优, 表明其可以在6 h的预测时效内提升数据驱动降水预测的效果.
2024, 33(8):132-144. DOI: 10.15888/j.cnki.csa.009574 CSTR: 32024.14.csa.009574
摘要:随着点云采集技术的发展和三维应用需求的增加, 实际场景要求针对流动数据持续动态地更新点云分析网络. 对此, 提出了双重特征增强的三维点云类增量学习方法, 通过增量学习使点云目标分类技术能够适应新数据中不断出现新类别目标的场景. 该方法通过对点云数据特性和旧类信息的研究分别提出了差异性局部增强模块和知识注入网络, 以缓解类增量学习中的新类偏好问题. 具体而言, 差异性局部增强模块通过感知丰富的局部语义, 表征出三维点云物体中不同的局部结构特性. 随后, 根据目标中每个局部结构的全局信息获得各个局部的重要性权重, 强化对差异性局部特征的感知, 从而提高新旧类特征差异性. 另外, 知识注入网络将旧模型中的旧知识注入新模型的特征学习过程中, 增强后的混合特征能够更有效缓解旧类信息不足导致的新类偏好加剧现象. 在三维点云数据集ModelNet40, ScanObjectNN, ScanNet, ShapeNet上的实验表明, 该方法与现有最优方法相比, 在4个数据集上的平均增量准确率有2.03%、2.18%、1.65%、1.28% 提升.
2024, 33(8):145-154. DOI: 10.15888/j.cnki.csa.009606 CSTR: 32024.14.csa.009606
摘要:隐式反馈数据是推荐系统的重要数据来源, 但通常是稀疏的, 并且存在曝光偏差和从众偏差. 已知的去偏方法往往只针对其中一种偏差, 影响个性化推荐的效果, 或者需要一个昂贵的无偏数据集作为多重去偏的辅助信息. 为此, 本文提出了一个适用于稀疏隐式反馈数据, 同时对曝光偏差和从众偏差去偏的协同过滤推荐算法. 该算法通过我们提出的双重逆倾向加权方法和对比学习辅助任务去除输入双塔自编码器的隐式反馈数据中包含的两种偏差, 估计用户对物品的偏好概率. 实验结果显示, 本文的算法在公开无偏数据集Coat、Yahoo!R3上, 归一化折扣累积增益NDCG@K、均值平均精度MAP@K和召回率Recall@K优于对比的算法.
2024, 33(8):155-165. DOI: 10.15888/j.cnki.csa.009521 CSTR: 32024.14.csa.009521
摘要:合成孔径雷达(synthetic aperture radar, SAR)与光学图像融合旨在利用卫星传感器的成像互补性, 生成更全面的地貌信息. 然而, 由于各单一卫星传感器数据分布的异质性和成像物理机制的差异, 现有网络模型在融合过程中往往存在成像精度低的问题. 为了解决上述问题, 本文提出DNAP-Fusion, 一种新的结合双非局部注意力感知的SAR和光学图像金字塔细节融合网络(dual non-local-aware-based pyramid fusion net). 该方法利用双非局部注意力模块, 在空间尺度逐渐减小的多级图像金字塔中提取SAR图像的结构信息和光学图像的纹理细节. 然后在空间和通道维度上融合它们的互补特征. 然后, 通过图像重构将融合特征注入上采样光学图像中, 得到最终的融合结果. 此外, 在网络训练之前, 采用图像封装决策来增强同一场景中SAR和光学图像中目标之间的共性关系. 定性和定量的实验结果表明, 提出的方法优于现有融合方法, 其中客观评价指标中的相关系数(correlation coefficient, CC)为0.990 6, 峰值信噪比(peak signal to noise ratio, PSNR)为32.156 0 dB. 此外, 所提方法有效地融合了SAR图像和可见光图像的互补特征, 为提高遥感图像融合的精度和有效性提供了一种有价值的思路和方法.
2024, 33(8):166-175. DOI: 10.15888/j.cnki.csa.009571 CSTR: 32024.14.csa.009571
摘要:由于细粒度图像类间差异小, 类内差异大的特点, 因此细粒度图像分类任务关键在于寻找类别间细微差异. 最近, 基于Vision Transformer的网络大多侧重挖掘图像最显著判别区域特征. 这存在两个问题: 首先, 网络忽略从其他判别区域挖掘分类线索, 容易混淆相似类别; 其次, 忽略了图像的结构关系, 导致提取的类别特征不准确. 为解决上述问题, 本文提出动态自适应调制和结构关系学习两个模块, 通过动态自适应调制模块迫使网络寻找多个判别区域, 再利用结构关系学习模块构建判别区域间结构关系; 最后利用图卷积网络融合语义信息和结构信息得出预测分类结果. 所提出的方法在CUB-200-2011数据集和NA-Birds数据集上测试准确率分别达到92.9%和93.0%, 优于现有最先进网络.
2024, 33(8):176-186. DOI: 10.15888/j.cnki.csa.009599 CSTR: 32024.14.csa.009599
摘要:随着GPS定位技术和移动互联网的发展, 各类LBS (location-based service)应用积累了大量带有位置和文本标记的空间文本数据, 这些数据广泛应用于市场营销、城市规划等设施选址决策中. 空间文本选址的目标是从候选位置集合中挖掘最佳地点新建设施, 以期影响最多空间文本对象, 如用户或车辆等, 其中空间距离越接近且文本越相似则影响力越大. 现有方案未考虑现实普遍存在的同行竞争, 也忽略了用户对设施的评价因素. 为更合理地在同行竞争环境结合用户评级进行选址决策, 本文提出新的空间文本竞争选址问题CoSTUR. 通过引入权衡影响的确定性和数量的阈值, 解决传统模型中对象只能被单一设施影响的局限, 建模了用户可能同时受多个设施影响的真实情况. 借鉴经典的竞争均分模型, 实现了不同评级设施间竞争量化. 为降低大规模数据导致的高昂计算代价, 构建了新型空间文本索引结构TaR-tree, 并结合阈值设计基于影响范围的两个剪枝策略, 实现基于分支定界思想的空间连接和范围查询两种方案. 在真实和合成数据集上的实验结果显示, 相比基线算法计算效率能够提升近一个量级, 说明提出方法的有效性.
2024, 33(8):187-195. DOI: 10.15888/j.cnki.csa.009591 CSTR: 32024.14.csa.009591
摘要:古汉语文本承载着丰富的历史和文化信息, 对这类文本进行实体关系抽取研究并构建相关知识图谱对于文化传承具有重要作用. 针对古汉语文本中存在大量生僻汉字、语义模糊和复义等问题, 提出了一种基于BERT古文预训练模型的实体关系联合抽取模型 (entity relation joint extraction model based on BERT-ancient-Chinese pre-trained model, JEBAC). 首先, 通过融合BiLSTM神经网络和注意力机制的BERT古文预训练模型 (BERT-ancient-Chinese pre-trained model integrated BiLSTM neural network and attention mechanism, BACBA), 识别出句中所有的subject实体和object实体, 为关系和object实体联合抽取提供依据. 接下来, 将subject实体的归一化编码向量与整个句子的嵌入向量相加, 以更好地理解句中subject实体的语义特征; 最后, 结合带有subject实体特征的句子向量和object实体的提示信息, 通过BACBA实现句中关系和object实体的联合抽取, 从而得到句中所有的三元组信息(subject实体, 关系, object实体). 在中文实体关系抽取DuIE2.0数据集和CCKS 2021的文言文实体关系抽取C-CLUE小样本数据集上, 与现有的方法进行了性能比较. 实验结果表明, 该方法在抽取性能上更加有效, F1值分别可达79.2%和55.5%.
2024, 33(8):196-204. DOI: 10.15888/j.cnki.csa.009613 CSTR: 32024.14.csa.009613
摘要:在计算机视觉分割任务中, 基于Transformer的图像分割模型需要大量的图像数据才能达到最好的性能, 医学图像相对于自然图像, 数据量非常稀少, 而卷积本身具有更高的感应偏差, 使得它更适合医学图像方面的应用. 为了将Transformer的远程表征学习与CNN的感应偏差相结合, 本文设计了残差ConvNeXt模块来模拟Transformer的设计结构, 采用深度卷积和逐点卷积组成的残差ConvNeXt模块来提取特征信息, 极大地降低了参数量. 并对感受野和特征通道进行了有效的缩放和扩展, 丰富了特征信息. 此外, 本文提出了一个非对称3D U型网络ASUNet用于脑肿瘤图像的分割. 在非对称U型结构中, 采用残差连接, 将最后两个编码器的输出特征进行连接来扩大通道数. 最后, 在上采样的过程中采用深度监督, 促进了上采样过程中语义信息的恢复. 在BraTS 2020和FeTS 2021数据集上的实验结果表明, ET、WT和TC的骰子分数分别达到了77.08%、90.83%、83.41%和75.63%、90.45%、84.21%. 并且通过对比实验, ASUNet在准确性方面完全可以与Transformer构建的模型竞争, 同时保持了标准卷积神经网络的简单性和高效性.
2024, 33(8):205-213. DOI: 10.15888/j.cnki.csa.009594 CSTR: 32024.14.csa.009594
摘要:实体肿瘤学中, 利用荧光原位杂交(FISH)技术处理后的间期细胞核荧光显微图像上, DNA扩增往往呈现为衍射极限斑点, 成像条件限制了图像质量, 导致图像信噪比较低、背景干扰严重且存在非斑点结构干扰. 设计适用的斑点检测方法, 提供客观且定量的数据, 有助于医生对于癌症病情的诊断. 算法首先采用3层小波多尺度求和对荧光图像去噪, 随后利用多尺度高斯拉普拉斯算子增强斑点区域, 最后通过4个方向的单边二阶高斯核抑制非斑点区域, 完成斑点检测. 实验结果表明, 对于自建数据库中83张图像, 算法平均F分数达到0.96, 平均运行时间0.5 s以下.
2024, 33(8):214-221. DOI: 10.15888/j.cnki.csa.009572 CSTR: 32024.14.csa.009572
摘要:针对人工鱼群算法存在的全局搜索能力欠缺, 鲁棒性差及易陷入局部极值等不足, 提出一种自适应差分变异的人工鱼群算法(ADMAFSA). 首先, 该算法采用自适应视野和步长策略, 改善种群个体在较优区域的精细搜索能力, 提升算法的寻优精度. 其次, 在人工鱼群的随机行为中引入反向学习机制, 通过发掘潜在的寻优空间, 提高算法的全局搜索性能, 避免算法早熟收敛. 最后, 借鉴差分进化算法对质量较差的人工鱼进行变异操作, 从而增加鱼群的多样性, 降低算法陷入局部极值的可能性. 为验证改进算法的性能, 本文对6个基准测试函数和8个CEC2019函数进行仿真, 与其他AFSA变体、新型智能算法进行对比, 实验结果表明, ADMAFSA在寻优精度和鲁棒性方面均有所提高. 最后, 在齿轮系设计问题上, 进一步证明了改进算法具有较好的优化效果.
2024, 33(8):222-230. DOI: 10.15888/j.cnki.csa.009562 CSTR: 32024.14.csa.009562
摘要:人脸识别技术的恶意运用可能会导致个人信息泄露, 对个人隐私安全构成巨大威胁, 通过通用对抗攻击保护人脸隐私具有重要的研究意义. 然而, 现有的通用对抗攻击算法多数专注于图像分类任务, 应用于人脸识别模型时, 常面临攻击成功率低和生成扰动明显等问题. 为解决这一挑战, 研究提出了一种基于共性梯度的人脸识别通用对抗攻击方法. 该方法通过多张人脸图像的对抗扰动的共性梯度优化通用对抗扰动, 并利用主导型特征损失提升扰动的攻击能力, 结合多阶段训练策略, 实现了攻击效果与视觉质量的均衡. 在公开数据集上的实验证明, 该方法在人脸识别模型上的攻击性能优于Cos-UAP、SGA等方法, 并且生成的对抗样本具有更好的视觉效果, 表明了所提方法的有效性.
2024, 33(8):231-239. DOI: 10.15888/j.cnki.csa.009577 CSTR: 32024.14.csa.009577
摘要:近年来基于卷积神经网络(CNN)的图像分割应用已十分广泛, 在特征提取的部分取得了很大进展. 然而随着卷积层数越来越深, 感受野不断增大, 使模型丢失局部特征信息进而影响模型性能. 使用图卷积网络(GCN)处理图数据结构的信息, 能够在保留局部特征同时不随层数的加深而丢失局部信息. 本文主要研究将基于CNN结构的对称全卷积网络(U-Net)特征提取与基于GCN的图像分割结合, 提取全局与局部、浅层与深层的多尺度特征集应用于多模态脑胶质瘤核核磁共振(MR)序列图像分割, 可分为两个阶段: 第1阶段利用 U-Net 对多模态脑核磁共振胶质瘤MR序列图像进行特征提取, 通过多个池化层实现多尺度特征提取及上采样进行特征融合, 其中底层输出较低级别特征, 高层输出更加抽象的高级特征; 第2阶段通过膨胀邻域及稀疏化处理将 U-Net 获得的特征图数据转化为 GCN 所需的图结构数据, 将图像分割问题转化为图节点分类问题, 最后通过余弦相似度量对图结构数据进行分类. 在BraTS 2018公开数据库上的实验结果取得分割准确度0.996、灵敏度0.892的效果. 相比其他深度学习模型, 本方法通过多尺度特征融合, 利用GCN建立高低级别特征的拓扑连接, 确保局部信息不丢失以取得较好的分割效果, 能够胜任临床脑胶质瘤核磁共振图像的分析需求, 进而有效提高脑胶质瘤诊断精度.
2024, 33(8):240-249. DOI: 10.15888/j.cnki.csa.009629 CSTR: 32024.14.csa.009629
摘要:针对考虑缓冲区容量限制和机器加工档位的流水车间调度问题(FSSP_LBMPG), 建立了有限缓冲区绿色流水车间数学规划模型, 模型以最小化最大完工时间和最小化加工能量消耗为目标函数, 将缓冲区容量纳入约束, 通过合理选择机器的加工档位达到协调加工速度和加工能耗的效果. 针对问题模型特点, 提出了一种改进蒲公英优化算法(IDOA), 算法首先根据调度问题的特点设计了双层实数编码机制表示问题的解, 通过引入一种初始化机制, 提高初始解质量和求解效率. 算法迭代过程中, 设计了实数交叉策略和变邻域搜索策略, 弥补了原始蒲公英算法局部搜索能力较差的缺点, 提高了改进算法的开发能力. 最后通过设计案例上的对比实验, 表明所提改进措施能有效增强算法性能, 也验证了算法的有效性和鲁棒性.
2024, 33(8):250-256. DOI: 10.15888/j.cnki.csa.009602 CSTR: 32024.14.csa.009602
摘要:在三维人体姿态估计任务当中, 人体关节之间的连接关系形成了一种复杂的拓扑结构, 利用图卷积网络对该结构进行建模, 可以有效捕捉局部关节间的联系; 尽管不相邻关节之间没有直接的物理连接, 但由于人体的运动和姿态受到生物力学约束以及人体关节之间的协同作用, 利用Transformer编码器建立关节之间的上下文关系, 可以更好地推断出人体姿态; 在大模型的背景下, 如何在保证模型性能的同时, 降低参数量, 也显得尤为重要. 针对上述问题, 设计了一个基于图卷积和Transformer的多层空间特征融合网络模型(MLSFFN), 在使用相对少量的参数基础上, 有效地融合了局部和全局空间特征. 实验结果表明, 本文提出的方法在仅需2.1M参数量的情况下, 在Human3.6M数据集上达到了49.9 mm的平均每关节误差(MPJPE). 此外, 模型在MPI-INF-3DHP数据集上也展示出了较强的泛化能力.
2024, 33(8):257-263. DOI: 10.15888/j.cnki.csa.009586 CSTR: 32024.14.csa.009586
摘要:虽然以ChatGPT为代表的自然语言生成(NLG)大语言模型在自然语言处理中的大多数任务中取得了良好的表现, 但其在序列识别任务, 如命名实体识别任务中的表现暂且不如基于BERT的深度学习模型. 针对这一点, 本文探究性的通过将现有的中文命名实体识别问题改造成机器阅读理解问题, 提出并设计了基于情境学习和模型微调的新方法, 使NLG语言模型在识别命名实体达到了更好的效果, 并且该方法不同于其他方法需要改变基层模型的预训练参数. 同时, 由于命名实体是模型生成的结果而不是对原始数据的分类, 不存在边界问题. 为了验证新框架在命名实体识别任务上的有效性, 本文在多个中文命名实体识别数据集上进行了实验. 其中, 在Resume和Weibo数据集上的F1分数分别达到了96.04%和67.87%, 相较于SOTA模型分别提高了0.4和2.7个百分点, 从而验证了新框架能有效利用NLG语言模型在文本生成上的优势完成命名实体识别任务.