2024, 33(6):1-15. DOI: 10.15888/j.cnki.csa.009531 CSTR:
摘要:随着合成孔径雷达(SAR)技术的不断进步, 大范围观测和高分辨率成像使得SAR图像中包含了大量特征微弱的小尺寸目标, 通常涵盖飞机、车辆、油罐、船舶等高价值民用目标和关键军事目标, 这类目标尺寸较小、特征微弱、稠密相连、形态多变, 对它们进行精确的检测是当前SAR图像解译的难题. 随着深度学习技术的发展, 研究者们针对SAR弱小目标的成像特性和检测挑战, 通过对深度学习网络的精细调整和优化, 成功地推动了本领域的进步. 本文将全面回顾基于深度学习的SAR图像弱小目标检测, 以数据集和方法为研究对象, 深入分析SAR弱小目标检测任务所面临的主要挑战, 总结最新检测方法的特点和应用场景, 并汇总整理了公开数据集与常用性能评估指标. 最后, 总结本任务的应用现状, 并对未来的发展趋势进行展望.
2024, 33(6):16-27. DOI: 10.15888/j.cnki.csa.009559 CSTR:
摘要:近年来, 不断发展的量子计算已成为众人关注的焦点. 然而, 量子硬件存在稀缺性和噪声等问题, 这使得研究量子算法、验证量子芯片等行为都依赖运行在经典计算机上的量子模拟器. 本文讨论了不同量子模拟器使用的主要模拟方法, 并讨论了主流的全振幅状态向量模拟器和基于张量网络的量子模拟器的各种优化. 最后, 我们总结了量子模拟器的现状和未来发展方向.
2024, 33(6):28-36. DOI: 10.15888/j.cnki.csa.009529 CSTR:
摘要:传统的火灾检测方法大多基于目标检测技术, 存在火灾样本获取难度高、人工标注成本高的问题. 为解决该问题, 本研究提出了一种基于对比学习和伪异常合成的无监督火灾检测模型. 为了实现无监督图像特征学习, 提出了交叉输入对比学习模块. 然后, 引入了一个记忆原型学习正常场景图像的特征分布, 通过特征重建实现对火灾场景的判别. 并且, 提出了伪异常火灾场景合成方法和基于欧氏距离的异常特征区分损失, 使模型对于火灾场景具有针对性. 根据实验表明, 我们的方法在Fire-Flame-Dataset和Fire-Detection-Image-Dataset两个公开火灾检测数据集上的图像级AUC分别达到89.86%和89.56%, 优于PatchCore、PANDA、Mean-Shift等主流图像异常检测算法.
2024, 33(6):37-47. DOI: 10.15888/j.cnki.csa.009530 CSTR:
摘要:犹豫模糊C-均值(hesitant fuzzy C-means, HFCM)聚类算法在一定程度上处理了图像中不同像素块之间的不确定性, 但由于其目标函数中不包含任何局部空间信息, 因此对噪声比较敏感, 当噪声较大时无法获得较好的分割精度. 针对上述问题, 提出了一种改进犹豫模糊C-均值(improved hesitant fuzzy C-means, IHFCM)的图像分割方法. 首先给出了犹豫模糊元(hesitant fuzzy element)的补齐方法, 然后提出了犹豫模糊元之间的相似性度量, 利用犹豫模糊元之间的相似性度量构造了新颖的模糊因子融合到HFCM的目标函数中, 新的模糊因子不仅考虑了局部窗口中的空间信息而且考虑了像素间的相似性, 平衡噪声带来的影响且保留了图像细节. 最后, 在合成图像、BSDS500数据集图像以及自然图像上的分割实验结果表明, 所提出的IHFCM算法对噪声有良好的鲁棒性, 提升了分割精度.
2024, 33(6):48-57. DOI: 10.15888/j.cnki.csa.009507 CSTR:
摘要:混合样本数据增强方法只注重模型对于图像所属类别的正向表达, 而忽略图像是否属于某一类别的反向判定. 为了解决描述图像类别方式单一而影响模型性能的问题, 提出一种反向目标干扰的图像数据增强方法. 该方法增加图像背景及目标的多样性, 防止网络模型过拟合. 其次采用反向学习机制, 让网络模型在正确辨别原图像所属类别的同时, 对填充图像不属于该类别的属性进行充分学习, 从而增强网络模型对原图像所属类别辨识的置信度. 最后, 为验证该方法的有效性, 使用不同的网络模型在CIFAR-10、CIFAR-100等5个数据集上进行大量实验. 实验结果表明, 本文方法与其他先进的数据增强方法相比较, 可以显著提高模型在复杂背景下的学习效果和泛化能力.
2024, 33(6):58-69. DOI: 10.15888/j.cnki.csa.009542 CSTR:
摘要:在实现不同来源的图谱数据融合过程中, 实体对齐是关键的步骤, 其目的在于确定不同图谱间等价的实体对. 现有实体对齐方法大多基于图嵌入方式, 通过考虑图谱的结构和属性信息进行对齐, 但并未很好处理二者之间的交互关系, 同时忽略对关系及多阶邻居信息的利用. 为解决上述问题, 提出一种融合结构与属性注意力机制模型(fused structural and attribute attention mechanism model, FSAAM)的实体对齐方法. 该模型首先根据图谱数据特征划分为属性和结构通道数据, 其次使用属性注意力机制实现对属性信息的学习, 在实现对结构信息的学习中增加对关系信息的学习, 利用图注意力机制寻找对于实体对齐有益的邻居特征, 引入Transformer编码器更好的关联实体之间的信息, 并通过Highway网络减少可能学习到噪声信息的影响, 最后对学习到的结构通道和属性通道信息的相似度矩阵利用LS-SVM网络, 得到集成相似度矩阵从而实现实体对齐. 所提模型在公开数据集DBP15K的3个子数据集上进行验证. 实验结果表明, 相较于基线模型中效果最好的结果, 其Hits@1分别提高了2.7%, 4.3%和1.7%, 且Hits@10和MRR也均有提升, 表明本模型能够有效提高实体对齐的准确性.
2024, 33(6):70-80. DOI: 10.15888/j.cnki.csa.009509 CSTR:
摘要:结肠息肉的准确分割对于切除异常组织和降低息肉转换为结肠癌的风险具有重要意义. 目前的结肠息肉分割模型在对息肉图像进行分割时存在着较高的误判率和分割精度较低的问题. 为了实现对息肉图像的精准分割, 提出了一种融合多尺度门控卷积和窗口注意力的结肠息肉分割模型(MGW-Net). 首先, 设计一种改进的多尺度门控卷积块(MGCM)取代U-Net的卷积块, 来实现对结肠息肉图像信息的充分提取. 其次, 为了减少跳跃连接处的信息损失并充分利用网络底部信息, 结合改进的空洞卷积和混合增强的残差窗口注意力构建了多信息融合增强模块(MFEM), 以优化跳跃连接处的特征融合. 在CVC-ClinicDB和Kvasir-SEG数据集上的实验结果表明, MGW-Net的相似性系数分别为93.8%和92.7%, 平均交并比分别为89.4%和87.9%, 在CVC-ColonDB、CVC-300和ETIS数据集上的实验结果表明其拥有较强的泛化性能, 从而验证了MGW-Net可以有效地提高对结肠息肉分割的准确性和鲁棒性.
2024, 33(6):81-90. DOI: 10.15888/j.cnki.csa.009514 CSTR:
摘要:在输电线路防外力破坏巡检场景中, 当前部署于边缘端的轻量级目标检测算法, 存在检测精度不足、推理速度慢等问题. 针对以上问题, 本文提出一种基于全局上下文增强的稀疏卷积电网防外力破坏检测算法Fast-YOLOv5. 基于YOLOv5算法, 设计了FasterNet+网络作为新的特征提取网络, 在保持检测精度的同时, 提升模型的推理速度, 并降低计算复杂度; 在算法的瓶颈层中, 设计了具有高效通道注意力的ECAFN模块, 通过自适应地校准通道方向上的特征响应, 高效获取跨通道的交互信息来提升检测效果, 并进一步减少参数量和计算量; 提出了具有上下文增强的稀疏卷积网络SCN替换模型的检测层, 通过捕获全局上下文信息来增强前景焦点特征, 提高模型的预测能力. 实验结果表明, 改进后的模型与原模型相比, 精度提升了1.9%, 检测速度提升了1倍, 达到56.2 f/s, 参数量和计算量分别下降了50%和53%, 更符合输电线路高效检测的要求.
2024, 33(6):91-98. DOI: 10.15888/j.cnki.csa.009537 CSTR:
摘要:实体关系联合抽取旨在从文本中抽取出实体关系三元组, 是构建知识图谱十分重要的步骤之一. 针对实体关系抽取中存在的信息表达能力不强、泛化能力较差、实体重叠和关系冗余等问题, 提出了一种实体关系联合抽取模型RGPNRE. 使用RoBERTa预训练模型作为编码器, 提高了模型的表达信息能力. 在训练过程中引入了对抗训练, 提升了模型的泛化能力. 使用全局指针, 解决了实体重叠的问题. 使用关系预测, 排除不可能的关系, 减少了冗余的关系. 在基于schema的中文医学信息抽取数据集CMeIE上进行的实体关系抽取实验表明, 模型的F1值比基准模型提升了约2个百分点, 在实体对重叠的情况下, 模型的F1值提升了近10个百分点, 在单一实体重叠情况下, 模型的F1值提升了大约1个百分点, 说明该模型能够更准确地提取实体关系三元组, 从而有效提升知识图谱构建的准确度. 在含有1–5个三元组的对比实验中, 在拥有4个三元组的句子中, 模型的F1值提升了约2个百分点, 而在拥有5个及以上三元组的复杂句子中, F1值提升了约1个百分点, 说明该模型能够较好地处理复杂句子场景.
2024, 33(6):99-107. DOI: 10.15888/j.cnki.csa.009501 CSTR:
摘要:视网膜血管分割是医学图像分割中常见的一项任务, 视网膜血管图像有着分割目标小而多的特点, 过去的网络在分割中可以较好地提取粗血管, 但是很容易忽略细血管, 而这部分细血管的提取在一定程度上影响网络的性能, 甚至是诊断的结果. 因此, 为了达到在保证准确提取粗血管的前提下, 提取到更多更连续的细血管的目标, 本文使用对称编解码网络作为基础网络, 使用一种新的卷积模块DR-Conv, 旨在防止过拟合的同时提高网络的学习能力. 同时, 针对最大池化层造成的信息损失问题, 考虑使用小波变换进行图像分解并使用逆小波变换对图像进行恢复, 利用混合损失函数结合不同损失函数的特性以弥补单个损失函数优化能力不足的问题. 为了评估网络的性能, 在3个公共视网膜血管数据集上分别对网络进行了测试, 并与最新方法进行了比较, 实验结果表明本文网络拥有更优的性能.
2024, 33(6):108-116. DOI: 10.15888/j.cnki.csa.009522 CSTR:
摘要:储层岩性分类是地质研究基础, 基于数据驱动的机器学习模型虽然能较好地识别储层岩性, 但由于测井数据是特殊的序列数据, 模型很难有效提取数据的空间相关性, 造成模型对储层识别仍存在不足. 针对此问题, 本文结合双向长短期循环神经网络(bidirectional long short-term memory, BiLSTM)和极端梯度提升决策树(extreme gradient boosting decision tree, XGBoost), 提出双向记忆极端梯度提升(BiLSTM-XGBoost, BiXGB)模型预测储层岩性. 该模型在传统XGBoost基础上融入了BiLSTM, 大大增强了模型对测井数据的特征提取能力. BiXGB模型使用BiLSTM对测井数据进行特征提取, 将提取到的特征传递给XGBoost分类模型进行训练和预测. 将BiXGB模型应用于储层岩性数据集时, 模型预测的总体精度达到了91%. 为了进一步验证模型的准确性和稳定性, 将模型应用于UCI公开的Occupancy序列数据集, 结果显示模型的预测总体精度也高达93%. 相较于其他机器学习模型, BiXGB模型能准确地对序列数据进行分类, 提高了储层岩性的识别精度, 满足了油气勘探的实际需要, 为储层岩性识别提供了新的方法.
2024, 33(6):117-125. DOI: 10.15888/j.cnki.csa.009541 CSTR:
摘要:当前在处理急性淋巴细胞白血病(acute lymphoblastic leukemia, ALL)分类时存在着背景信息杂乱和的差异性细微问题. 由于在血液样本图像中, 选取关键特征并减少背景噪声仍然困难, 传统方法难以捕捉到重要且细微的特征, 难以有效地分类和识别各种血液细胞类型, 进而影响了结果的准确性与可靠性. 本文提出一种基于ResNeXt50分类模型, 采用图像增强来减少背景噪声对图像的影响, 并通过改进空洞金字塔特征提取方法增强对各个尺度和上下文信息的感知能力, 加入改进SA注意力机制, 使得模型可以更好地关注并学习对结果影响较大的信息. 本文提出的模型在伊朗德黑兰(Taleqani)医院的Blood Cells Cancer公开数据集进行了实验, 准确率和精确率分别达到了98.39%, 98.33%, 结果表明该模型不仅具备一定的临床意义和实用价值, 而且为ALL辅助诊断提供了新的思路.
2024, 33(6):126-132. DOI: 10.15888/j.cnki.csa.009543 CSTR:
摘要:对养殖动物的高效识别是畜牧养殖场开展各类精准养殖的基础, 需要建设相应识别系统做支撑. 本文所设计系统采用无人机直播联动方式进行样本采集和巡检识别, 既能将视频实时上传到数据中心, 又比无人机普通拍摄具有更少的小目标和遮挡问题发生, 在此基础上, 系统选用YOLOv7算法模型进行动物行为和数量的识别, 并对YOLOv7算法模型优化和轻量化, 以提升识别精度和降低系统负载, 最后将识别数据输出到标准接口供各类精准养殖程序便捷调用. 系统既适应养殖场的场景需求又兼顾系统的高效运行, 能为养殖场实施各类精准养殖提供统一数据支持, 降低重复设计成本和分散管理成本.
2024, 33(6):133-142. DOI: 10.15888/j.cnki.csa.009548 CSTR:
摘要:工业自动化领域广泛使用时间敏感网络技术. 该领域业务流的调度方式主要包含静态调度和动态调度. 静态调度一次计算所有业务流, 可以最大程度节省链路和时间资源, 但是计算时间长, 无法灵活处理新增业务流. 动态调度以增量的形式计算新增业务流, 计算时间短, 但是资源分配不够合理, 会产生时隙碎片. 全局流重配置机制可以定期对网络中所有业务流进行重新规划, 来优化链路和时间资源的分配, 但该机制只适用于拥有较少业务流的小型网络, 业务流数量的增多会引起计算时间的急剧增长, 影响后续到来的业务流. 本文在现有动态调度算法的基础上, 设计了批量重配置算法. 该算法给出了新的评价指标——网络吞吐率, 并在满足动态调度秒级响应时间的情况下, 定期重配置网络中的部分业务流, 优化网络资源配置. 此外, 算法给出了重配置业务流的选取标准, 并优化了流的路径选择标准和传输开始时间计算方式. 本文针对原算法和增加了批量重配置机制的改进算法进行了仿真实验, 实验结果表明, 改进算法可以在拥有数千条业务流的大型网络运行, 并在网络吞吐率和调度成功的流数量方面有16.5%和5.5%的提升, 同时保证了算法的秒级计算时间.
2024, 33(6):143-152. DOI: 10.15888/j.cnki.csa.009533 CSTR:
摘要:在低照度环境下拍摄到的视频往往有对比度低、噪点多、细节不清晰等问题, 严重影响后续的目标检测、分割等计算机视觉任务. 现有的低照度视频增强方法大都是基于卷积神经网络构建的, 由于卷积无法充分利用像素之间的长程依赖关系, 生成的视频往往会有部分区域细节丢失、颜色失真的问题. 针对上述问题, 提出了一种局部与全局相融合的孪生低照度视频增强网络模型, 通过基于可变形卷积的局部特征提取模块来获取视频帧的局部特征, 并且设计了一个轻量级自注意力模块来捕获视频帧的全局特征, 最后通过特征融合模块对提取到的局部特征和全局特征进行融合, 指导模型能生成颜色更真实、更具细节的增强视频. 实验结果表明, 本方法能有效提高低照度视频的亮度, 生成颜色和细节都更丰富的视频, 并且在峰值信噪比和结构相似性等评价指标中也都优于近几年提出的方法.
2024, 33(6):153-160. DOI: 10.15888/j.cnki.csa.009525 CSTR:
摘要:为了解决现有遥感图像超分辨率重建模型对长期特征相似性和多尺度特征相关性关注不足的问题, 提出了一种基于跨尺度混合注意力机制的遥感图像超分辨率重建算法. 首先提出了一个全局层注意力机制(global layer attention, GLA), 利用层注意力机制加权融合不同层级的全局特征, 建模低分辨率与高分辨率图像特征间的长期依赖关系. 同时, 设计了跨尺度局部注意力机制(cross-scale local attention, CSLA), 在多尺度的低分辨率特征图中寻找与高分辨率图像匹配的局部信息补丁, 并融合不同尺度的补丁特征, 以优化模型对图像细节信息的恢复能力. 最后, 提出一种局部信息感知损失函数来指导图像的重建过程, 进一步提高了重建图像的视觉质量和细节保留能力. 在UC-Merced数据集上的实验结果表明, 本文方法在3种放大倍数下的平均PSNR/SSIM优于大多数主流方法, 并在视觉效果方面展现出更高的质量和更好的细节保留能力.
2024, 33(6):161-168. DOI: 10.15888/j.cnki.csa.009544 CSTR:
摘要:优化交通信号的控制策略可以提高道路车辆通行效率, 缓解交通拥堵. 针对基于值函数的深度强化学习算法难以高效优化单路口信号控制策略的问题, 构建了一种基于样本优化的近端策略优化(MPPO)算法的单路口信号控制方法, 通过对传统PPO算法中代理目标函数进行最大化提取, 有效提高了模型选择样本的质量, 采用多维交通状态向量作为模型观测值的输入方法, 以及时跟踪并利用道路交通状态的动态变化过程. 为了验证MPPO算法模型的准确性和有效性, 在城市交通微观模拟软件(SUMO)上与值函数强化学习控制方法进行对比. 仿真实验表明, 相比于值函数强化学习控制方法, 该方法更贴近真实的交通场景, 显著加快了车辆累计等待时间的收敛速度, 车辆的平均队列长度和平均等待时间明显缩短, 有效提高了单路口车辆的通行效率.
2024, 33(6):169-176. DOI: 10.15888/j.cnki.csa.009524 CSTR:
摘要:针对原油集输管网的流量计测量数值偏差大, 模拟仿真软件人工校正繁琐、自适应差的问题, 提出一种自适应时空图卷积神经网络的产量计算方法, 实现原油集输管网产量的模拟计算. 以潜油电泵井为节点, 输油管道为边构建管网拓扑图. 使用图卷积神经网络提取井分布空间信息, 时间卷积神经网络获取产量数据的时间序列特征, 计算得到准确的产量模拟计算结果. 在某油田原油集输管网系统上进行了实验验证, 结果表明本文方法能够准确对管网系统内各电泵井的产量进行计算, 与其他基准网络模型相比, 各项误差指标均有下降, 平均绝对误差降至0.87, 平均绝对百分比误差降至4.45%, 均方误差降至0.84, 证明了提出方法的有效性和准确性.
2024, 33(6):177-184. DOI: 10.15888/j.cnki.csa.009549 CSTR:
摘要:在零件的工艺设计阶段, 加工工艺方案的生成强依赖于设计人员选择和应用的工艺知识. 而由于实际的生产环境与设计人员选择工艺知识存在着诸多偏差, 加工方案与实际的工艺过程不匹配成为当前零件制造领域关注的难题. 为解决上述问题, 本文提出了一种数据与知识双驱动的零件特征工艺决策方法. 本方法使用基于注意力机制的MLP深度学习算法, 从结构化工艺数据中挖掘工艺知识, 关联零件特征与特征工艺标签. 将其经过数据加工后, 用于训练神经网络模型. 经过验证, 该方法能够以零件特征的工艺数据为输入, 输出其对应的特征工艺标签的概率分布, 为零件工艺方案的选择提供决策支持.
2024, 33(6):185-191. DOI: 10.15888/j.cnki.csa.009546 CSTR:
摘要:针对来自相同地理空间的不同时刻遥感图像之间的季节性和光度变化(色差)等因素所引起的干扰, 提出了多时态-BIT遥感图像变化检测方法. 该方法引入了过去多个不同时刻的遥感图像, 融合当前遥感图像与过去时态遥感图像两两变化检测的结果, 该方法有助于排除季节性和光度变化引起的误报, 提高了变化检测的准确性; 并且利用过去多个不同时刻的遥感图像, 进一步消除非目标建筑变化的影响, 其变化点像素差值引入作为损失函数正则化项, 从而进一步提高变化检测的鲁棒性和可靠性. 本文以三时态(3个不同时刻的遥感图像)为例, 使用了遥感图像建筑物变化数据集进行了实验. 实验结果表明, 多时态-BIT方法相对于仅考虑两个时态的变化检测方法, 在遥感图像建筑物变化检测任务中表现出更好的效果.
2024, 33(6):192-200. DOI: 10.15888/j.cnki.csa.009520 CSTR:
摘要:视觉导航旨在通过环境中的视觉信息提供导航依据, 其中关键任务之一就是目标检测. 传统的目标检测方法需要大量的标注, 且只关注图像本身, 并未充分利用视觉导航任务中的数据相似性. 针对以上问题, 本文提出一种基于历史图像信息的自监督训练任务. 该方法聚合同一位置的多时刻图像, 通过信息熵区分前景与背景, 将图像增强后传入SimSiam自监督范式进行训练. 并改进SimSiam投影层和预测层中的MLP为卷积注意力模块和卷积模块, 改进损失函数为多维向量间损失, 以提取图像中的多维特征. 最后, 将自监督预训练所得模型用于下游任务的训练. 实验表明, 在处理后的nuScenes数据集上, 本文提出的方法有效提高了下游分类及检测任务的精度, 在下游分类任务上Top5准确率达到66.95%, 检测任务上mAP达到40.02%.
2024, 33(6):201-210. DOI: 10.15888/j.cnki.csa.009551 CSTR:
摘要:本研究针对目前跨度级别的方面情感三元组抽取模型忽视词性和句法知识的问题且存在三元组冲突的情况, 提出了语义和句法依赖增强的跨度级方面情感三元组抽取模型SSES-SPAN (semantic and syntactic enhanced span-based aspect sentiment triplet extraction). 首先, 在特征编码器中引入词性知识和句法依赖知识, 使模型能够更精准地区分文本中的方面词和观点词, 并且更深入地理解它们之间的关系. 具体而言, 对于词性信息, 采用了一种加权求和的方法, 将词性上下文表示与句子上下文表示融合得到语义增强表示, 以帮助模型准确提取方面词和观点词. 对于句法依赖信息, 采用注意力机制引导的图卷积网络捕捉句法依赖特征得到句法依赖增强表示, 以处理方面词和观点词之间的复杂关系. 此外, 鉴于跨度级别的输入缺乏互斥性的保证, 采用推理策略以消除冲突三元组. 在基准数据集上进行的大量实验表明, 我们提出的模型在效果和鲁棒性方面超过了最先进的方法.
2024, 33(6):211-222. DOI: 10.15888/j.cnki.csa.009563 CSTR:
摘要:由于井下微震信号有着更低的信噪比, 导致信号拾取精度降低. 现阶段基于小波阈值的信号降噪算法等在面对信噪比较低的信号时存在泛化性差, 阈值难以衡量等问题. 为解决这一问题, 本文研究了一种复小波变换全监督学习的微震波形降噪方法. 该方法首先利用复小波变换结合卷积自编器设计一个具有多个卷积和反卷积操作的编码-解码器完成图像的降噪过程. 为验证此方法的有效性, 首先在Stanford的Earthquake数据集上构建了Earthquake2023进行训练和测试, 并有着较好地拟合效果和训练结果. 同时基于该方法降噪后信号设计了一种震相拾取方法, 并达到了较高的拾取精度. 本文设计了多组对比实验, 结果表明此降噪方法能有效提高信号的峰值信噪比和均方根误差, 两者分别提高了16 dB和24%, P波、S波初至到时拾取的误差相较于STA/LTA减小了0.3 ms.
2024, 33(6):223-231. DOI: 10.15888/j.cnki.csa.009526 CSTR:
摘要:书法字文档图像在不良光照条件下的灰度值分布差异较大, 低光照区域图像对比度较低、笔画形态纹理特征出现退化, 传统方法通常仅考虑了局部信息的均值、平方差、熵等因素, 在形态纹理方面考虑较少, 从而对低对比度区域的特征信息不敏感. 针对此类问题, 本文提出了一种多维侧窗聚类分块的退化书法文档的二值化方法CS-SWF (clustering segmentation based SWF), 该方法首先利用SWF卷积核描述具有相似形态学特征的像素块, 之后提出多种修正规则利用下采样提取低纬度信息去修正特征区域. 最后, 对特征图中聚类块进行前后景分离, 得到二值化结果图. 本文使用FM、PSNR和DRD为指标, 将现有方法和本文方法进行对比, 实验结果表明, 在自建的100张手写退化文档图像数据集下, 本文方法在低对比度暗部区域的二值化效果较为稳定, 在精准度和鲁棒性上优于对比算法.
2024, 33(6):232-241. DOI: 10.15888/j.cnki.csa.009528 CSTR:
摘要:多器官医学图像分割有助于医生做出临床诊断. 针对CNN提取全局特征能力弱, Transformer提取局部特征能力弱, 以及Transformer具有二次方计算复杂度的问题, 提出了用于多器官医学图像分割的多级特征交互Transformer模型. 所提模型采用CNN提取局部特征, 局部特征经Swin Transformer输出全局特征; 通过下采样分别产生多级局部和全局特征, 每级局部和全局特征经过交互并增强; 每级增强后的特征经多级特征融合模块进行交叉融合; 再次融合后的特征经过上采样和分割头输出分割掩码. 所提模型在Synapse和ACDC数据集上进行实验, 平均DSC和平均HD95系数值为80.16%和19.20 mm, 均优于LGNet和RFE-UNet等代表性模型. 该模型对多器官医学图像分割是有效的.
2024, 33(6):242-250. DOI: 10.15888/j.cnki.csa.009550 CSTR:
摘要:在基于三副本策略的分布式存储系统中, 当存储节点上的硬盘出现故障时, 常见的处理方式是等待系统预设的时间. 如果该故障硬盘超时未恢复, 才开始恢复故障硬盘上的副本. 这种处理方式存在的问题是, 当三副本组中存在故障副本时, 如果该副本组再有一个副本所在的硬盘发生故障, 将导致系统无法继续提供服务, 且不能自动恢复. 本文提出一种基于日志副本的改进的Raft共识算法, 即LR-Raft (log replica based Raft), 日志副本没有完整状态机, 可以快速加入集群, 并参与投票与共识, 提升了存在故障硬盘时系统的可用性; 可以解决短时间内三副本中两个副本故障导致集群不可用和丢失数据的问题. 实验结果表明, 在副本组中引入日志副本后, 与原Raft相比, LR-Raft在不同的工作负载下读写时延均明显降低, 吞吐量显著提升.
2024, 33(6):251-258. DOI: 10.15888/j.cnki.csa.009527 CSTR:
摘要:为预防和减少WUI火灾的发生, 挖掘WUI火灾关键致灾因子, 厘清致灾因子间的作用机制. 本文首先基于本文挖掘技术从WUI火灾事故案例中得到致灾因子, 使用Apriori算法得到致灾因子之间的关联规则. 然后使用复杂网络理论构建WUI火灾致灾因子网络, 计算网络拓扑特征参数, 探析WUI火灾致灾因子网络特征. 最后引入WUI火灾致因链风险度指标, 挖掘出高风险连边, 并提出断链措施. 结果表明: WUI火灾致灾因子网络具有小世界特性, 高温、强风、干旱等对其他致灾因子影响较大. 燃烧废弃物、植物起火、应急响应速度、人为纵火、强风在不同致灾因子转换中具有重要作用, 应加强管控. 网络中风险度最高的边是燃烧废弃物→植物起火, 通过颁布禁止擅自燃烧废弃物等规定, 即可切断该风险链, 实现对WUI火灾的预防和主动控制.
2024, 33(6):259-267. DOI: 10.15888/j.cnki.csa.009539 CSTR:
摘要:针对现有基于填表的事件关系抽取方法填表数目过多、表格特征获取不充分的问题, 本文提出了结合Roberta和Bi-FLASH-SRU的中文事件因果关系抽取方法TF-ChineseERE. 该方法通过制定填表策略, 利用文本中已标记关系, 将其转化为带有标签的表格; 借助Roberta预训练模型和本文提出的双向内置闪电注意力简单循环单元(bidirectional built-in flash attention simple recurrent unit, Bi-FLASH-SRU)获取主客体事件特征, 再利用表格特征循环学习模块挖掘全局特征, 最后进行表格解码获得事件因果关系三元组. 实验采用金融领域两个公开数据集进行验证, 结果表明, 本文提出的方法F1值分别达到59.2%和62.5%, 且Bi-FLASH-SRU模型训练速度更快, 填表数目更少, 证明了该方法的有效性.