2026, 35(1):1-18. DOI: 10.15888/j.cnki.csa.010074 CSTR: 32024.14.csa.010074
摘要:多智能体路径规划(multi-agent path finding, MAPF)旨在为多个智能体规划无冲突路径以优化协同任务性能. 本文综述了MAPF的研究现状, 涵盖算法分类、应用场景和未来趋势, 并探讨了其在大规模动态环境中的挑战. 首先, 本文详细介绍了MAPF的定义; 接着, 分类总结了基于搜索、智能仿生、采样及强化学习的路径规划算法; 最后, 分析了各类算法的优缺点及适用场景. 本文旨在帮助研究者了解MAPF技术的发展现状及未来方向, 推动相关研究进展.
2026, 35(1):19-38. DOI: 10.15888/j.cnki.csa.010029 CSTR: 32024.14.csa.010029
摘要:乳腺癌是全球女性中最常见且致死率较高的恶性肿瘤之一, 其诊断和治疗高度依赖医学成像技术. 其中, 病灶分割在精准识别病理区域、辅助诊断及治疗规划方面发挥着关键作用. 近年来, 深度学习算法在乳腺癌病灶的自动分割任务中取得了显著进展, 为深度学习在这方面的研究奠定了基础. 系统梳理了近年来相关研究, 重点探讨深度学习技术在不同医学成像模式下分割方面的应用, 旨在为乳腺癌病灶分割的进一步研究提供参考. 首先, 简要介绍相关数据集和图像分割常用指标. 然后, 系统综述基于深度学习的乳腺癌影像分割方法, 归纳不同算法在不同成像模式下的应用情况. 最后, 总结当前技术存在的挑战, 并结合现有研究的局限性, 对未来发展方向进行展望.
2026, 35(1):39-51. DOI: 10.15888/j.cnki.csa.010055 CSTR: 32024.14.csa.010055
摘要:时间自动机(timed automata, TA)是描述实时系统时间约束行为的重要形式化工具, 广泛应用于嵌入式系统、通信协议等领域. 传统手动构建实时系统模型的方式耗时且易出错, 自动推断模型成为研究热点. 本文聚焦时间自动机主动学习算法, 按照数据存储结构以及等价查询方法进行梳理, 总结了当前时间自动机领域中主动学习算法的最新研究现状, 梳理其核心思想、技术框架, 同时分析当前研究面临的挑战. 通过对比各种方法的优势与局限性, 本文希望为研究者提供一个清晰的参考框架, 并提出未来可能的研究思路, 旨在推动TA自动化建模理论与实践发展.
2026, 35(1):52-63. DOI: 10.15888/j.cnki.csa.010043 CSTR: 32024.14.csa.010043
摘要:时间序列预测在气象预报、电力负荷预测与金融管理等领域具有广泛应用, 近年来深度学习方法在该任务中取得显著进展. 然而, 现有模型在应对非平稳性和异质模式建模方面仍存在局限, 主要表现为对趋势与季节分量的同质化建模与分解过程中的模态混叠问题. 本文提出一种名为DTFNet的时频协同分解网络, 通过设计时域-频域并行的异构结构, 在时域利用抗噪性强的MLP网络建模趋势项的长期演化特性, 在频域采用快速傅里叶变换提取周期性季节成分, 并通过多尺度卷积操作捕捉时频特征间的空间关联. 同时, 本文引入基于离散小波变换(DWT)的分解方法, 替代传统移动平均分解, 有效缓解边界效应与模态混叠问题. 在6个公开数据集上的实验结果表明, DTFNet在准确性和鲁棒性方面均优于现有主流模型. 消融实验结果表明, 本文提出的离散小波变换分解模块以及时频协同建模结构在提升时间序列预测精度方面具有显著效果. DTFNet具备良好的通用性, 能够应用于多种时间序列预测任务, 为电力负荷预测、天气预报等实际应用场景提供有力的支持.
2026, 35(1):64-75. DOI: 10.15888/j.cnki.csa.010080 CSTR: 32024.14.csa.010080
摘要:道路病害检测作为衡量路面损坏状况、维护道路养护的重要方式, 存在着病害极端长宽比、大小尺度不一以及难易病害数量分布不均匀等问题. 当前基于卷积的各种方法虽然获得了更大的感受野以增强感知, 但是牺牲了蕴含细小病害的高频分量, 不适合有细小病害的道路病害检测任务. 为此, 本文提出了一种基于频率增强和形类协同的道路病害检测算法FS-YOLO. 首先, 为实现感受野与高频信息的平衡, 我们引入了基于频率的增强卷积策略, 根据局部频率分量动态调整空间膨胀率, 为不同尺寸的病害分配合适的卷积参数. 其次, 面对不同类别病害几何形状位置各有特点, 我们引入了基于注意力机制的三维显式协同的动态检测头来实现空间几何信息与类别信息的显式协同, 使模型能够发挥病害类别与空间位置的内在潜能. 最后, 我们引入Slide loss损失函数来解决实际道路中难识别与容易识别的病害分布不平衡问题, 特别提升模型对难区分样本的处理能力. 实验结果表明, FS-YOLO在自建数据集和公开道路病害检测数据集RDD 2022、UAV-PDD上的精确率和召回率均显著优于基线模型, 且在高速公路和国省道的实际应用中也得到了有效验证, 显著提高了病害检测的准确率和效率.
2026, 35(1):76-87. DOI: 10.15888/j.cnki.csa.010040 CSTR: 32024.14.csa.010040
摘要:现有生成对抗网络压缩方法通常更侧重于网络架构和空间域的优化, 忽视了频谱域优化对蒸馏效果和模型性能的影响. 这种局限性导致轻量化模型在生成图像的高频细节时, 与教师模型之间存在一定的差异; 同时, 在图像转换任务中, 现有的特征提取方法通常会导致图像细节丢失. 针对这些问题, 提出了一种融合特征增强的频谱知识蒸馏(FESD-CycleGAN)方案. 在FESD-CycleGAN中, 首先通过对特征图的部分特征通道进行偏移, 扩大感受野, 增强特征多样性, 从而提升了生成图像的细节和整体表现. 其次基于对频谱域进行知识蒸馏能够使生成器捕捉图像的高频细节这一特性, 提出在对特征图进行特征增强的基础上, 将空间域与频谱域的知识蒸馏相结合, 从而增强了模型对生成图像细节的把控能力. 实验结果表明, 在horse2zebra、summer2winter和edges2shoes数据集上, FESD-CycleGAN与基线模型DCD相比, FID值分别降低了2.19、0.68和0.76, 达到54.98、73.41和27.45, 有效提升轻量化模型的生成性能.
2026, 35(1):88-101. DOI: 10.15888/j.cnki.csa.010049 CSTR: 32024.14.csa.010049
摘要:深度强化学习(deep reinforcement learning, DRL)在计算机集群调度任务中展现出了巨大潜力. 然而, 现有的基于深度强化学习的集群调度方法缺乏足够的泛化性, 导致其无法有效应对高度动态且变化频繁的集群环境. 为了应对这一挑战, 提出了一种改进元学习优化深度强化学习集群调度方法MRLScheduler. 该方法的核心在于对元学习的两项改进: 首先, 引入了基于扩散模型的数据生成模块, 该模块在元学习的初始化阶段生成多样化的合成数据, 用于扩充和优化多任务数据集. 然后, 引入了基于扩散模型的经验回放模块, 该模块在元学习跨任务训练中利用历史任务数据生成合成经验, 用于对历史经验的重用. 最后, 将改进后的元学习集成到深度强化学习的集群调度算法中, 对处于高度动态且变化频繁的集群环境中的智能体进行策略微调, 从而改善智能体的泛化能力. 实验结果表明, MRLScheduler优于其他基线算法, 有效地提升了深度强化学习集群调度算法的泛化能力.
2026, 35(1):102-116. DOI: 10.15888/j.cnki.csa.010054 CSTR: 32024.14.csa.010054
摘要:以ChatGPT为代表的大语言模型是当前人工智能领域最热门的研究课题, 被认为是推动传统行业实现革命性转型的关键技术手段, 为产业创新与升级提供了显著的驱动力. 医疗健康领域作为人工智能技术长期探索与应用的重点领域, 在当前面临着人口老龄化加剧、医疗资源供给不足以及医患关系紧张等背景下, 人工智能被视为最有希望缓解甚至彻底解决这一系列矛盾和问题, 尤其以ChatGPT为代表的大语言模型的出现, 让人们看到了曙光. 本文首先对自然语言处理技术的发展历程进行了简单介绍, 随后对GPT系列的大语言模型的历史发展背景及其技术演进轨迹进行了系统性的介绍. 结合医疗健康行业的现实需求与现状, 分类探讨了以ChatGPT为代表的大语言模型在该领域的应用场景和案例. 最后, 本文还深入分析讨论了大语言模型的内在局限, 以及在大规模部署实施和使用过程中所面临的挑战, 并针对性地给出了一些处理方法和解决思路.
2026, 35(1):117-128. DOI: 10.15888/j.cnki.csa.010051 CSTR: 32024.14.csa.010051
摘要:现有超分辨率网络(super-resolution, SR)通过简单堆叠多分支结构来捕捉多尺度特征, 导致网络推理速度缓慢, 且无法有效建模全局像素关联. 部分研究引入Transformer的自注意力机制来提升重建质量, 却导致计算复杂度大幅上升. 针对这些问题, 本文提出了一种结合多尺度边缘增强和轻量化Transformer的SR网络 (ECTL-SR). 具体而言, 提出一种轻量边缘导向卷积块有效捕捉并融合不同感受野下边缘细粒度特征, 同时引入结构重参数化技术来减少多分支冗余计算和内存开销. 此外, 将轻量型位置感知环形卷积嵌入改进的Transformer架构中来增强网络捕捉图像长距离依赖能力, 在低成本下实现感受野高效扩展. 实验结果表明, 该网络在性能与效率之间取得了良好平衡, 并在 Urban100等多个基准数据集上优于现有SR方法, 展现出更优的重建效果.
2026, 35(1):129-140. DOI: 10.15888/j.cnki.csa.010037 CSTR: 32024.14.csa.010037
摘要:RISC-V正处于蓬勃发展的阶段, 其软件生态的移植和构建工作也在持续推进. 由于操作系统本身的复杂性, 其性能评估通常仅停留在模块级别, 而难以在函数实现层面进行系统性的评估. 在软件适配过程中, 往往会借鉴ARM等成熟架构的优化策略. 本文提出了一种基于跨架构比较的细粒度内核性能评估与缺陷挖掘方法. 该方法通过跨架构上下文匹配和架构特定的性能异常检测, 使评估重点从模块级别转向函数级别. 本文将该方法应用于Linux 5.10内核的RISC-V与ARM之间的性能对比, 揭示了RISC-V在性能上的不足. 通过选定的测试套件进行实验, 在25个被识别为异常的上下文中, 检测出了9个RISC-V的性能问题, 其中80%被归类为高优先级问题, 这表明该方法的评估准确率达80%, 该方法能够在架构适配过程中快速、准确地识别潜在的性能问题.
2026, 35(1):141-151. DOI: 10.15888/j.cnki.csa.010087 CSTR: 32024.14.csa.010087
摘要:无监督域适应(unsupervised domain adaptation, UDA)旨在将源域中训练好的模型应用于仅有未标记数据的目标域. 当前的无监督域适应方法主要通过统计差异最小化或对抗学习来对齐源域和目标域特征空间, 从而学习域不变特征. 然而, 这些约束可能导致语义特征结构的扭曲和类可辨别性的丧失. 针对上述问题, 本文提出一种名为DAMPL的方法. 该方法利用CLIP模型注入文本描述信息, 深入挖掘图像语义内容, 采用针对领域特性的提示学习范式, 有效保留不同域的特有信息, 避免了信息丢失. 此外, 通过语义引导机制对目标域的伪标签进行校正, 以缩小域间差异, 增强模型的泛化能力. 最后还引入互信息最大化损失(mutual information maximization loss, IML), 以保留目标域的特征可区分性. 最终DAMPL方法在Office-Home、miniDomainNet和VisDA-2017数据集上分别达到83.8%、79.7%、89.8%的分类准确率, 展现了最佳的性能.
2026, 35(1):152-163. DOI: 10.15888/j.cnki.csa.010028 CSTR: 32024.14.csa.010028
摘要:远距复杂场景中的小目标检测任务因目标尺寸小、形态不规则、纹理信息弱且易被背景干扰, 长期面临检测精度低与鲁棒性差的挑战. 针对上述问题, 本文提出一种改进的检测算法ReF-YOLO (remote-enhanced fusion YOLO), 在YOLO11框架基础上从特征提取、特征融合与检测头设计这3方面进行系统优化. 具体而言, 引入融合通道注意与空间建模的C3k2DCASC模块, 增强主干网络对非规则目标的表达能力; 设计结合主干同尺度特征的L-Fuse结构与高效下采样模块SCDown, 提升语义与细节对齐效果; 并增设高分辨率P2检测分支, 有效提升极小目标的感知与定位能力. 在VisDrone2019典型小目标数据集上的实验表明, 所提方法的mAP@0.5相较于YOLO11n提升4.9%, 在小目标检测任务中表现出更优的准确性与稳定性, 验证了其在远距复杂场景下的实用性与泛化能力.
2026, 35(1):164-177. DOI: 10.15888/j.cnki.csa.010031 CSTR: 32024.14.csa.010031
摘要:预测性过程监控(predictive process monitoring, PPM)技术通过分析已有的事件日志对正在运行的业务流程中的某些关键指标进行预测. 目前的预测性过程监控方法在特征提取方面通常预设案例仅受自身属性的影响或仅通过提取资源案例间行为属性进行编码, 通常未涉及活动视角下的案例间行为信息. 本文提出了一种捕获活动案例间行为信息的方法IABC (inter-activity behaviour of case) , 该方法设计了一个三维特征构建框架涵盖时间窗口、活动粒度、行为状态这3大维度, 共构造36种活动案例间行为特征. 同时, 本文提出了两项关键算法: 影响力分布算法用于挖掘活动间的正/负影响传播; 批次行为检测算法用于识别潜在的批量操作行为. 最后在3个公开可用的事件日志上评估IABC方法的有效性, 结果表明集成了IABC方法的时间预测模型性能优于未使用该方法的基线模型和采用了资源案例间特征的模型.
2026, 35(1):178-187. DOI: 10.15888/j.cnki.csa.010050 CSTR: 32024.14.csa.010050
摘要:在皮肤病变图像分割任务中, U-Net在处理皮肤镜图像时存在多尺度适应性不足、跨层特征融合低效及计算冗余导致边缘信息丢失等问题. 本文提出层次化金字塔注意力网络HPANet (hierarchical pyramid attention network), 通过金字塔注意力模块和双路径特征融合机制, 实现了多尺度特征捕获和跨层特征传递的双重优化. 其中, 双路径自适应融合模块结合CNN与Transformer双分支特征, 通过通道注意力与压缩空间注意力增强互补特征的信息交互, 并利用双线性交互与残差连接缓解特征稀释问题. 金字塔注意力模块结合分层多核卷积、深度可分离下采样及分块空间通道注意力机制, 显著提升多尺度病变特征捕获能力. 实验结果表明, 本架构在ISIC 2017、ISIC 2018数据集中的表现均超越主流模型, 证实其在病变边界保留与小病灶检测方面的双重优势.
2026, 35(1):188-196. DOI: 10.15888/j.cnki.csa.010064 CSTR: 32024.14.csa.010064
摘要:针对夜间低照度场景下行人检测中存在的目标模糊、特征弱化以及小尺度目标漏检等问题, 本文提出了一种轻量化检测算法RABL-YOLOv8n. 首先, 设计一个轻量化RGCSPELAN模块, 通过优化特征提取过程, 显著增强了对小目标的捕捉能力, 同时有效减少不必要的计算和存储开销; 其次, 在骨干网络的第10层引入细粒度分类注意力(attention for fine-grained classification, AFGC)机制, 利用多分支局部感知策略提升行人服饰纹理等细粒度特征的可辨识性; 然后, 在特征融合层采用双向特征金字塔网络 (bidirectional feature pyramid network, BiFPN)结构, 并结合自适应特征加权策略, 进一步强化多尺度特征的交互能力; 最后, 用LSCD检测头替换原有检测头, 通过解耦定位与分类任务并引入轻量级上下文感知模块, 显著提升小目标检测的精度. 实验结果表明, 在自建NightPerson数据集上, 本算法相较于基线YOLOv8n模型, mAP@50提升了0.3%, 精确度仅下降0.013, 而召回率上升了0.009, 参数量和浮点计算量分别减少了58%和42%. 与YOLOv5n、YOLOv6n、YOLOv10n等模型对比, 该算法在检测精度与模型轻量化之间实现了较好的均衡.
2026, 35(1):197-208. DOI: 10.15888/j.cnki.csa.010053 CSTR: 32024.14.csa.010053
摘要:现代嵌入式系统普遍配置高速缓存, 硬件性能提升的同时系统软件研制变得复杂, 需预测实时任务高速缓存行为. 预测高速缓存行为常用到缓存分类, 实施精确缓存分类可能呈现NP (non-deterministic polynomial)特征, 消减精确缓存分类可能呈现的NP特征是研究难点. 针对先前工作不足, 本文提出强连通分量消除技术和扩展的反链技术来进一步消减精确缓存分类可能呈现的NP特征. 通过测试基准集中程序可知, 提出技术可使大部分分类时间开销下降, 且最大降量超4 h; 小部分分类时间开销略有上升, 且最大升量不超3 min. 这对设计高效缓存行为预测工具有帮助.
2026, 35(1):209-218. DOI: 10.15888/j.cnki.csa.010042 CSTR: 32024.14.csa.010042
摘要:现阶段卫星遥感图像尺寸较大, 检测目标大多较小且分布不均, 存在大量目标聚集在一起的现象, 且不同目标尺度差距较大, 背景较为复杂, 使得在土地利用和环境灾害检测方面面临相当大的挑战. 因此, 本文提出一种改进YOLO11的卫星遥感图像目标检测方法. 首先, 在YOLO11中的C3k2模块中引入注意力机制, 设计了C3k2_DAB模块, 在控制模型复杂度的同时提高模型在复杂背景影响下的检测性能. 其次, 在颈部网络后加入PKI模块, 促进了局部和全局上下文信息的自适应特征提取. 最后在检测端引入新的检测头PConv检测头, 在减少冗余计算和内存访问的前提下更快速地提取空间特征. 实验结果表明, 改进的YOLO11网络模型在遥感图像目标检测任务中取得了优异性能, 相较于原YOLO11模型mAP@0.5提高了2.4%, mAP@0.5:0.95提高了2.1%, 且优于其他主流目标检测模型, 为遥感目标检测算法的应用提供了新思路.
2026, 35(1):219-227. DOI: 10.15888/j.cnki.csa.010057 CSTR: 32024.14.csa.010057
摘要:本研究致力于提升深度学习在肺音分析领域的应用效率和准确性. 针对现有深度学习模型在肺音分析中表现出的鲁棒性不足和泛化能力有限的问题, 本研究提出了一种方法, 该方法通过整合卷积神经网络(convolutional neural network, CNN)、长短时记忆(long short-term memory, LSTM)网络和支持向量机(SVM), 实现了对肺音信号的高效和深入分析. 首先对肺音信号进行预处理, 提取出重构信号和其对应的希尔伯特谱图; 其次设计并构建了一个集成CNN、LSTM和SVM的深度学习网络模型; 最后将处理后的信号数据输入到CNN-LSTM-SVM的深度学习网络中, 以提取并融合肺音信号的时域和频域特征. 实验结果表明, 该方法在召回率、精确率和F1-score这3个关键性能指标上分别达到96.20%、96.56%和0.96的高水平. 这些结果证实了所提方法的高效性和可靠性, 为肺部疾病的早期诊断提供了一种技术途径, 并有潜力显著提升临床诊断的速度和准确性.
2026, 35(1):228-236. DOI: 10.15888/j.cnki.csa.010048 CSTR: 32024.14.csa.010048
摘要:为有效应对飞行轨迹预测中存在的复杂时空特性以及时域波动对预测精度带来的挑战, 提出融合时空双重提取与频域增强的飞行轨迹预测方法. 该方法结合时间卷积网络(TCN)与iTransformer模型旨在同时捕捉飞行轨迹序列中的局部时序特征与全局变量交互关系, 从而在不同层次和粒度上实现对数据特征的双重提取, 有效挖掘其潜在的时空关联性. 随后引入频域增强通道注意力机制(FECAM), 通过离散余弦变换将轨迹特征转化为频域, 并应用通道注意力机制强化转化后的频域信息, 以减少时域波动带来的影响. 实验基于三维飞行轨迹数据集, 在爬升、巡航及降落阶段, 该方法的平均绝对误差分别为1.15、0.15和0.82. 结果表明相较于现有方法, 所提方法在预测精度和稳定性方面均具有明显优势.
2026, 35(1):237-245. DOI: 10.15888/j.cnki.csa.010068 CSTR: 32024.14.csa.010068
摘要:当前基于深度学习的故障识别方法普遍面临高数据依赖性、高昂计算成本与时间开销, 以及模型泛化能力受限等挑战. 为此, 本研究提出一种融合MobileNetV3、选择性核网络(selective kernel network, SKNet)及堆叠长短期记忆网络(stacked long short-term memory network, Stacked LSTM)的轻量化高精度故障识别模型. 首先进行输入数据预处理, 将处理后的数据转换成适应卷积层的输入格式. 在特征提取阶段, 利用改进的MobileNetV3骨干网络进行深度特征挖掘, 其倒置残差模块在保留深度可分离卷积高效性的基础上, 策略性地嵌入SE (squeeze-and-excitation)与SK (selective kernel)双重注意力机制, 有效兼顾通道信息交互与多尺度特征自适应选择, 显著提升了特征表征能力并降低了计算复杂度. 随后, 堆叠LSTM捕获振动信号中的长距离时序依赖关系. 最终通过全连接层实现特征压缩与分类决策, 构建端到端识别系统. 实验结果显示, 本文模型识别准确率达到99.47%, 与传统的齿轮箱故障识别技术相比, 该方法在识别精准度和模型泛化能力方面均呈现出显著优势.
林雨浩,黎振龙,赵运强,邹鹏,奥列格·格纽申科,亚历山大·沃伊捷克
2026, 35(1):246-254. DOI: 10.15888/j.cnki.csa.010052 CSTR: 32024.14.csa.010052
摘要:针对TIG焊接过程中强弧光、烟尘、极端热辐射等复杂工况, 以及液态金属动态流动引起的熔池区域反射特性不稳定对熔池视觉特征提取造成干扰的问题, 本研究提出一种改进型熔池测量方法, 包括基于注意力机制与多尺度特征融合的轻量级网络熔池分割方法和基于分割结果的闭运算、连通区域标记和最小外接矩形图像处理方法. 结果表明, 改进后的网络在自建熔池分割数据集上取得性能提升, 平均交并比(MIoU)达95.44%, 平均像素精度 (mPA) 为98.27%, 单帧推理耗时仅为11.30 ms, 且有效提取所分割熔池的长度、宽度和面积.
2026, 35(1):255-262. DOI: 10.15888/j.cnki.csa.010079 CSTR: 32024.14.csa.010079
摘要:近年来, 随着软件开发领域代码规模持续扩大、功能需求与系统架构日趋复杂, 自动化工具已成为提升开发效率的核心支撑, 其中生成式大语言模型(large language model, LLM)在软件开发领域得到了广泛应用. 尽管LLM能显著缩短开发周期, 但研究表明, LLM生成的代码常存在安全漏洞, 可能引发系统风险. 已有研究发现LLM的输出结果会受提示语言差异的影响, 然而针对不同提示语言生成代码安全性的研究与评价仍较为匮乏. 本文旨在探究输入英文提示语言与中文提示语言对代码安全性的影响, 并对其进行系统性评估. 通过在LLM中分别使用英文和中文文本指示代码生成, 分析生成代码的安全性差异. 实验结果表明, 当以英文作为提示语言输入时, LLM生成的代码中出现的漏洞和bug数量相对较少; 而以中文作为提示语言输入时, 生成的代码则更容易出现安全漏洞.
2026, 35(1):263-275. DOI: 10.15888/j.cnki.csa.010056 CSTR: 32024.14.csa.010056
摘要:随着页岩油资源勘探开发的不断深入, 测井数据在储层评价中的重要性愈发突出. 然而, 由于测井设备故障、成本限制等因素, 常出现测井曲线缺失或异常的问题, 严重影响地质解释与资源开发的精度. 针对测井曲线缺失与异常问题, 通过引入Transformer编码器以增强全局特征表达, 并结合双向门控循环单元(bidirectional gated recurrent unit, BiGRU)的时序建模能力与Inception模块的多尺度特征提取能力, 设计了一种深度学习模型IBT (Inception-BiGRU-Transformer), 该模型通过多尺度特征提取与时序建模机制, 有效提升了测井曲线的重构精度与稳定性. 在大庆古龙页岩油区12口井的实测数据集上开展了单目标与多目标测井曲线重构实验. 实验结果表明, IBT模型在RMSE、MAE、MAPE和R2等多项评价指标上均优于现有主流模型, 具备更强的预测精度与泛化能力. 消融实验进一步验证了各个模块在提升预测性能方面的有效性.
2026, 35(1):276-287. DOI: 10.15888/j.cnki.csa.010044 CSTR: 32024.14.csa.010044
摘要:长文本中的信息压缩和语义连贯性一直是摘要生成模型的难点. 为此本文提出了一种融合内容引导与多尺度注意力的摘要生成模型. 该模型通过双分支结构实现对多粒度语义的联合建模, 并利用内容引导机制聚焦于摘要相关的关键信息区域. 模型在传统BERT-Transformer架构基础上引入双分支结构增强语义表达能力, 并通过MSAA-SAM融合机制设计, 进一步实现跨分支信息对齐与表达统一. 同时, 本文对指针生成网络进行了改进, 结合全局句向量引导机制提升生成控制能力, 从而增强对长文本中关键信息的提取与冗余内容的抑制. 在NLPCC 2017数据集和LCSTS数据集上的实验结果表明, 该模型在生成式摘要任务上均优于主流基线模型, 验证了其在语义建模、生成质量与控制能力方面的综合优势.

