2023, 32(6):1-11. DOI: 10.15888/j.cnki.csa.009116
摘要:针对目前大多数方面级情感分析方法存在着没有重点关注局部上下文中关键词特征的问题. 本文提出了一种基于局部上下文关键词特征提取及增强的方面级情感分析模型LCPM (local context pos mask). 首先提出了局部上下文词性掩码机制, 提取方面词周围重要词的特征, 减少噪声词的干扰. 其次对损失函数进行修改, 让模型重点关注与方面词有关的局部上下文关键词特征, 提升模型情感分类的表现. 最后设计了一种门控机制, 模型可以动态学习权重系数, 给局部上下文关键词特征和全局上下文特征分配不同的权重系数. 在4个公开数据集上的实验结果表明, 与现有的方面级情感分析模型相比, 准确率和MF1值都有提高, 验证了局部上下文关键词提取及增强的有效性, 在方面级情感分析任务上有较大的应用价值.
2023, 32(6):12-21. DOI: 10.15888/j.cnki.csa.009138
摘要:针对现有人脸图像翻译模型不能实现多个视觉属性之间的翻译及翻译后的人脸图像不清晰自然的问题, 提出了基于人脸识别方法的人脸多属性图像翻译模型. 模型主要由内容和风格编码器、AdaIN解码器以及人脸识别模块构成. 首先, 两个编码器提取内容和风格图像的潜在编码, 然后将编码送入到AdaIN层中仿射变换, 最后解码器还原翻译后的图像. 该方法设计并训练了一个准确率90.282%的人脸识别模型并提出了一种联合人脸属性损失函数, 增强了模型对风格人脸的属性的关注程度, 解决了模型不能准确提取到人脸的属性信息以及摒弃了无关信息, 使得模型能够生成清晰的、多属性的, 多样的人脸翻译图像. 该方法在公开的数据集CelebA-HQ实验并在定量和定性指标上都高于基线方法, 在不同的人脸朝向时也表现出良好的鲁棒性. 模型生成的图像还能应用于人脸图像生成领域, 解决数据集匮乏等问题.
2023, 32(6):22-31. DOI: 10.15888/j.cnki.csa.009118
摘要:目前很多处理图数据的图神经网络方法被提出, 然而大多数研究侧重于对特征聚合的卷积层的研究而不是进行下采样的池化层. 此外, 形成聚类簇的池化方式需要额外计算分配矩阵; 节点得分的池化方式排名方式单一. 为解决上述问题, 提高图分类任务的准确性, 本文提出了一种新的基于多维度信息的图池化算子MDPool. 该模型使用节点特征信息以及图拓扑结构信息, 获取不同维度下的节点得分. 使用注意力机制归纳不同维度下的得分权重, 生成更为健壮的节点排名, 基于节点排名自适应选择节点集合生成诱导子图. 提出的MDPool可以集成到多种的图神经网络结构, 将MDPool池化算子与图神经网络卷积层堆叠形成编码解码模型EDMDPool. 在4个公开数据集的图分类任务中, EDMDPool均高于现有基线模型.
2023, 32(6):32-41. DOI: 10.15888/j.cnki.csa.009137
摘要:价格预测对于大宗农产品市场的稳定具有重要意义, 但是大宗农产品价格与多种因素有着复杂的相关关系. 针对当前价格预测中对数据完整性依赖性强与单一模型难以全面利用多种数据特征等问题, 提出了一种将基于注意力机制的卷积双向长短期记忆神经网络(CNN-BiLSTM-Attention)、支持向量机回归(SVR)与LightGBM组合的增强式集成学习方法, 并分别在包含历史交易、天气、汇率、油价等多种特征数据的数据集上进行了实验. 实验以小麦和棉花价格预测为目标任务, 使用互信息法进行特征选择, 选择误差较低的CNN-BiLSTM-Attention模型作为基模型, 与机器学习模型通过线性回归进行增强式集成学习. 实验结果表明该集成学习方法在小麦及棉花数据集上预测结果的均方根误差(RMSE)值分别为12.812, 74.365, 较之3个基模型分别降低11.00%, 0.94%、4.44%, 1.99%与13.03%, 4.39%, 能够有效降低价格预测的误差.
2023, 32(6):42-50. DOI: 10.15888/j.cnki.csa.009114
摘要:针对增量式入侵检测算法由于对旧知识产生灾难性遗忘而导致对旧类别数据分类准确率不高的问题, 本文提出了一种基于非对称式多特征融合自动编码器(asymmetric multi-feature fusion auto-encoder, AMAE)和全连接分类神经网络(classification deep neural network, C-DNN)的增量式入侵检测算法(ImFace). 在增量学习阶段, ImFace会为每一批新的数据集训练一个AMAE模型和C-DNN模型. 同时, 本文通过使用变分自动编码器(variational auto-encoder, VAE)对数据进行过采样的方式来改善由于数据集不平衡而导致C-DNN对某些类别数据的检测能力不足的问题. 在检测阶段, ImFace将输入数据经过所有AMAE和C-DNN, 然后将AMAE的结果作为置信度来选择某一个C-DNN的输出结果作为最终结果. 本文使用CICIDS2017数据集来检验ImFace算法的有效性. 实验结果表明, ImFace算法不仅能够保留对旧类别的分类能力, 同时对新类别的数据也有很高的检测准确率.
2023, 32(6):51-59. DOI: 10.15888/j.cnki.csa.009156
摘要:跳板在海上平台作业现场扮演着重要角色. 未搭设跳板对作业现场造成了极大的安全隐患. 为消除此隐患, 提出一种靠船排场景下的跳板搭设检测方法. 本方法分为3个部分: 首先利用目标检测算法定位并标注目标; 之后对标注目标区域进行边缘检测, 提取其外接边缘; 最终制定特定安全措施判别算法识别作业现场违规动作. 本方法为解决小目标等检测问题, 对YOLOv5进行改进, 在特征提取以及特征融合时引入注意力模块, 将均值平均精度由53.1%提高至54.5%的同时模型更加轻量化; 为解决检测边缘粗犷问题, 对边缘检测网络PiDiNet损失函数进行改进, 相较于原网络, 误检率由8.9%下降至5.4%. 经过验证, 利用该方法可以在有效时间内, 检测出跳板是否正确搭设, 准确率为91.5%.
2023, 32(6):60-69. DOI: 10.15888/j.cnki.csa.009133
摘要:异常检测系统在网络空间安全中起着至关重要的作用, 为网络安全提供有效的保障. 对于复杂的网络流量信息, 传统的单一的分类器往往无法同时具备较高检测精确度和较强的泛化能力. 此外, 基于全特征的异常检测模型往往会受到冗余特征的干扰, 影响检测的效率和精度. 针对这些问题, 本文提出了一种基于平均特征重要性的特征选择和集成学习的模型, 选取决策树(DT)、随机森林(RF)、额外树(ET)作为基分类器, 建立投票集成模型, 并基于基尼系数计算基分类器的平均特征重要性进行特征选择. 在多个数据集上的实验评估结果表明, 本文提出的集成模型优于经典集成学习模型及其他著名异常检测集成模型. 且提出的基于平均特征重要性的特征选择方法可以使集成模型准确率平均进一步提升约0.13%, 训练时间平均节省约30%.
2023, 32(6):70-79. DOI: 10.15888/j.cnki.csa.009145
摘要:物联网服务作为信息世界软件服务通过物联网向现实世界的延伸, 其在物联网系统具有重要的作用. 然而, 不同于传统Web服务, 物联网服务具有现实感知、数据驱动、异构分布、时空相关等新特点, 使得现有的服务模型不足以对物联网服务有效刻画, 进而也不能满足物联网应用中的后续服务发现、服务卸载、服务组合等需求. 在凝练分析物联网服务建模需求和已有物联网服务模型的基础上, 提出了一种基于实体-数据的物联网服务建模框架, 该框架提出了服务、实体、数据三元信息融合的物联网服务模型概念及概念关系, 重点定义了服务、实体、数据的时空属性及时空依赖关系, 以支持基于时空相关性的物联网服务关联表示与分析, 并通过扩展OWL-S (ontology Web language for services)给出了基于实体-数据的物联网服务描述方式. 最后, 结合一个高速公路物联网应用案例对模型的使用方式和效果进行了讨论.
2023, 32(6):80-90. DOI: 10.15888/j.cnki.csa.009134
摘要:水下目标自动检测方法对海洋智能捕捞工作发挥着重要作用, 针对现有目标检测方法存在的对水下生物检测精度不高问题, 提出了一种GA-RetinaNet算法的水下目标检测方法. 首先, 针对水下图像存在密集目标的特点, 通过引入分组卷积替换普通卷积, 在不增加参数复杂度的基础上得到更多特征图, 提高模型的检测精度; 其次, 根据水下生物多为小目标生物的特点, 引入上下文特征金字塔模块(AC-FPN), 利用上下文提取模块保证高分辨率输入的同时获得多个感受野, 提取到更多上下文信息, 并通过上下文注意力模块和内容注意力模块从中捕获有用特征, 准确定位到目标位置. 实验结果显示, 选用URPC2021数据集进行实验, 改进的GA-RetinaNet算法比原算法检测精度提高了2.3%. 相比其他主流模型, 该算法对不同类型的水下目标均获得了较好的检测结果, 检测精度有较大提升.
2023, 32(6):91-98. DOI: 10.15888/j.cnki.csa.008950
摘要:针对手工测试成本高、时效性弱和传统的接口自动化测试工具扩展能力不足问题, 提出了一个支持用例集并行测试的接口测试平台(OLa). OLa采用分层架构模式将系统分为用户展示层、应用逻辑层、数据服务层和用例执行层. 其中, 用户展示层基于Vue框架开发, 结合Vue Router、Vuex等工具实现单页应用; 应用逻辑层基于Spring Boot框架开发; 数据服务层基于MyBatis-Plus框架和Spring Data框架开发; 用例执行层使用okhttp3、fastjson、jackson等工具实现接口测试. 此外, 基于系统技术架构、Java网络编程和面向抽象编程的思想, 创新性地提出了基于C/S模式的用例执行流程和基于参数识别的自动匹配校验方法, 解决了传统的自动化测试工具无法支持并行测试的问题. 实验结果表明本文设计与实现的OLa接口测试平台支持单用例测试、用例集的串行测试和并行测试, 能够自动识别用例参数并对接口响应内容进行校验, 提高了接口测试的灵活性和有效性, 降低了测试难度, 并能够在用例之间无相互依赖的情况下提高接口测试的效率.
2023, 32(6):99-106. DOI: 10.15888/j.cnki.csa.009122
摘要:用户画像是对用户形象的勾勒与描述, 现已广泛应用于睡眠会员唤醒, 用户到店预测, 个性化推荐等典型零售场景, 药品不同于普通商品, 包含较强的语义知识, 现有用户画像主要从消费属性和静态属性出发, 不能完全适用于药店销售和预测领域. 本文提出了一种针对药品领域的用户画像模型UPP (persona of pharmacy user), 在现有画像的基础上嵌入医药知识, 利用规则, 聚类, 统计, 实体识别等方法提取慢病、疾病、特殊病类、活动敏感度、用户价值、价格偏好等新标签. 将所有标签融入一种基于聚类的群体划分方法, 形成用户画像. 实验表明, 该模型相较于现有的用户画像模型, 在消费行为预测场景下精准率提高了13%, 更加适用于药店营销场景.
2023, 32(6):107-114. DOI: 10.15888/j.cnki.csa.009115
摘要:随着天气雷达新技术的发展, 传统单一封闭式的雷达产品生成系统已不能较好地适应新体制天气雷达系统快速的探测速率和多源的数据形式. 为了提高雷达产品生成系统的实时性和可扩展性, 本文提出一种基于消息调度的分布式雷达产品生成系统. 基于ActiveMQ消息中间件设计了分布式集群的任务调度策略, 采用Ceph分布式文件系统构建统一高效的存储服务, 并利用GPU实现了对气象算法的并行加速. 目前系统已在实际项目中交付使用, 取得了良好的运行效果, 具有一定的推广价值和应用意义.
2023, 32(6):115-120. DOI: 10.15888/j.cnki.csa.009140
摘要:现如今, 互联网中存在海量的医疗领域知识可以用于医疗病情诊断, 但传统的搜索引擎并无法根据病人的实际情况做出合理的判断, 无法满足使用需求. 因此, 本文主要开发基于知识图谱问答系统. 该系统面向医疗领域, 采用爬虫技术获取了大量医疗数据并将其存储在Neo4j图数据库构建医疗知识图谱中. 同时, 为了使系统能够进一步理解用户的医疗询问问句, 本文提出了基于BERT以及BERT-BiLSTM-CRF模型分别用于识别问句中的意图信息和实体信息的方法. 最后, 系统利用意图和实体信息在知识图谱中进行查询并为用户提供合适的回答, 完成了医疗问答系统的构建.
2023, 32(6):121-129. DOI: 10.15888/j.cnki.csa.009108
摘要:经典的人工蜂群(artificial bee colony, ABC)算法面临着收敛速度慢、易陷入局部最优等不足, 因此基于该算法来进行特征选择还存在很多问题. 对此, 提出了一种基于粒度粗糙熵与改进蜂群算法的特征选择方法FS_GREIABC. 首先, 将粗糙集中的知识粒度与粗糙熵有机地结合起来, 提出一种新的信息熵模型——粒度粗糙熵; 其次, 将粒度粗糙熵应用于ABC算法中, 提出一种基于粒度粗糙熵的适应度函数, 从而获得了一种新的适应度计算策略; 第三, 为了提高ABC算法的局部搜索能力, 将云模型引入到跟随蜂阶段. 在多个UCI数据集以及软件缺陷预测数据集上的实验表明, 相对于现有的特征选择算法, FS_GREIABC不仅能够选择较少的特征, 而且具有更好的分类性能.
2023, 32(6):130-139. DOI: 10.15888/j.cnki.csa.009069
摘要:经济全球化赋予了logo巨大的商业价值, 随着计算机视觉领域的发展, 为logo分类与识别提供了更广阔的应用领域. 本文针对logo图像的分类识别, 为了提高模型对logo图像分类的能力, 基于logo图像整体特征不显著且数量众多的特点, 提出了用细粒度图像分类的方法渐进式多粒度拼图训练(progressive multi-granularity training of jigsaw patches, PMG-Net)对logo图像数据集进行分类. 通过拼图生成器生成包含不同粒度信息的输入图像, 再引入渐进式多粒度训练模块融合不同粒度的特征, 融合后的特征更注重图像之间的细微差别, 使logo图像分类的效果有显著提高. 在提取输入图像特征时采用LeakyReLU (leaky rectified linear unit)激活函数保留图像中的负值特征信息, 并引入通道注意力机制, 调整特征通道的权重, 增强特征信息指导能力以改进模型的分类效果. 实验结果表明, 本文在logo图像数据集上的分类精确率优于传统的分类方法. 本文通过融合多粒度特征的渐进训练策略以及随机拼图生成器的方法实现了对logo图像的高效分类, 为解决logo图像分类中存在的问题提供了一种新的思路.
2023, 32(6):140-148. DOI: 10.15888/j.cnki.csa.009121
摘要:当前, 路由选择算法、计算机视觉图像切割以及机器学习领域的许多问题都可以归结为求解网络最大流. 为了提高基于分层网络最大流算法的效率, 提出了一种基于记忆化搜索策略的最大流算法, 针对传统Edmonds-Karp算法和Dinic算法重复搜索无效路径所导致的额外开销问题, 设计了一种能够记录搜索状态的记忆化搜索策略, 来避免重复搜索流网络中的无效部分. 实例分析表明了记忆化搜索策略的高效性与可行性. 最终实验结果表明, 基于记忆化搜索的最大流算法执行效率优于传统的Dinic算法.
2023, 32(6):149-158. DOI: 10.15888/j.cnki.csa.009136
摘要:本文基于判别尺度空间跟踪算法, 将位置纠正方法和卡尔曼滤波算法应用于行人跟踪中. 为解决行人因形变和环境变化导致的跟踪不准确的问题, 本文充分利用fhog特征在行人跟踪上的优势, 以判别尺度空间算法中的位置滤波器所计算的位置为中心, 再次提取行人的fhog特征并将其与位置滤波器模板做相关运算, 以此纠正行人位置. 其次, 利用卡尔曼滤波算法对纠正后的行人位置进行预测和再次纠正, 最终在双重纠正的位置上训练新的位置滤波器模板. 本文选取OTB-100中的行人数据集对该方法进行性能测试, 实验结果表明, 在原算法位置上, 再次提取fhog特征进行相关运算能够纠正行人的位置, 同时卡尔曼滤波对纠正位置进行预测和再次纠正, 可使行人的定位精度再次提升.
2023, 32(6):159-165. DOI: 10.15888/j.cnki.csa.009142
摘要:针对麻雀搜索算法容易因初始种群的多样性不足, 导致算法的搜索能力下降; 以及在搜索后期, 算法容易陷入到局部最优的问题, 提出一种多策略融合的麻雀搜索算法(multi-strategy fusion sparrow search algorithm, ISSA). 在算法初始化阶段, 引入高维Sine混沌映射来初始化种群, 提高初始种群的质量, 增强种群多样性; 其次, 引入衰减因子, 作用在发现者阶段, 衰减因子的自适应性, 平衡了前期全局搜索和后期局部寻优的性能; 最后引入柯西变异和变化选择策略, 让搜索个体可以跳出局部限制继续搜索, 增强局部搜索能力. 随机抽取6个benchmark测试函数, 实验结果验证了ISSA在寻找最优值等方面相比原算法得到了有效的提升.
2023, 32(6):166-172. DOI: 10.15888/j.cnki.csa.009126
摘要:域适应是一种在训练集和测试集不满足独立同分布条件时使用的迁移学习算法. 当两个领域间的分布差异较大时, 会降低域内可迁移性, 并且现有域适应算法需要获取大量的目标域数据, 这在一些实际应用中无法实现. 针对现有域适应方法的不足, 基于卷积神经网络提出小样本学习下的基于特征中心对齐的域适应算法, 寻找域不变特征的同时, 提高目标域特征的可区分度, 提高分类效果. 面向小样本条件下的office-31公共数据集识别和雷达工作模式识别的仿真实验结果表明, 所提方法对office-31数据集的平均识别精度比最大均值差异方法提升12.9%, 而对雷达工作模式识别精度达到91%, 比最大均值差异方法性能提升10%.
2023, 32(6):173-180. DOI: 10.15888/j.cnki.csa.009128
摘要:针对复杂环境下运动通信辐射源的无源定位, 闭式解方法对于时频差模型中的测量噪声敏感且存在定位均方根误差较大问题. 为了改善大观测误差下的定位性能, 本文提出一种加权最小二乘联合遗传算法的递推式混合TDOA/FDOA定位方法. 该方法首先利用已知站点观测大量时频差数据并建立误差模型, 基于模型对定位过程中的多组时频差序列进行数据处理; 其次通过加权最小二乘求解目标位置的初始值; 然后采用改进的遗传算法在初始值的基础上通过多组时频差序列不断迭代、递推求解, 修正位置坐标; 最后利用位置估计和频差模型完成对目标速度估计. 仿真结果表明, 本文定位算法相比于经典两步加权最小二乘法具有更低的均方根误差, 在大观测误差下能保持较高精度. 同时相比于其他混合定位算法收敛速度快, 可以有效减少计算量.
2023, 32(6):181-188. DOI: 10.15888/j.cnki.csa.009129
摘要:雷达在目标低仰角测高时存在严重的多径效应, 复杂阵地使多径回波产生无规律反射, 造成幅度与相位发生不同程度的畸变. 本文引入扰动多径模型, 解决经典多径模型与复杂阵地的多径回波反射不匹配问题, 研究基于扰动模型的合成导向矢量最大似然(synthesized vector maximum likelihood, SVML)测高方法. 该方法引入扰动参数表征复杂阵地的多径回波现象, 利用基于稀疏贝叶斯学习的扰动多径 (perturbational multipath sparse Bayesian learning, PSBL) 算法得到扰动参数, 应用于SVML算法, 提高了米波雷达在复杂阵地下的测高性能.
2023, 32(6):189-196. DOI: 10.15888/j.cnki.csa.009135
摘要:图的有损摘要问题如下: 给定图G=(V, E)和正整数k, 要求将图G中所有节点合并成为k个超节点, 满足由这些超节点组成的摘要图能够在一定误差范围内表示原图G. 这是一个基于图划分的组合优化问题, 一个主要求解思路是逐次地随机抽取节点对集并用启发式方法从中选取节点对进行合并. 本文提出一个有效的两阶段求解算法TS_LGS. 算法根据图G的平均点度特征设置阶段阈值: 当前超节点数大于阶段阈值为第1阶段, 期间算法在采样节点对中基于当前最佳合并分数批量选择节点对合并, 旨在有效减少迭代次数; 否则为第2阶段, 期间算法在加权采样的基础上优先挑选相邻的节点对, 旨在找到重构误差增量较小的节点对合并, 直至超节点的个数为k. 在典型的真实网络实例图上与现有最好算法SAA进行了实验对比, 结果表明, 算法TS_LGS以较低时间复杂度提取到的图摘要具有更低的重构误差和查询误差.
2023, 32(6):197-203. DOI: 10.15888/j.cnki.csa.009151
摘要:目前猴痘病毒在全球范围内传播, 这种病毒在临床上与其他皮肤疾病难以区分, 特别是天花病毒和水痘病毒. 在确定性聚合酶链式反应技术和其他生物检测技术还没有完全成熟的情况下, 通过计算机辅助诊断技术检测猴痘病毒皮肤病变是一种可行的方法, 因此提出了一种基于残差网络的猴痘病毒皮肤病变分类算法. 该算法以残差网络为基本框架, 结合深度可分离卷积和轻量化注意力, 在降低模型计算量与复杂度的同时, 也提高了模型的分类性能. 实验结果表明, 该算法对猴痘病毒皮肤病变表现出较好的分类性能, 对猴痘皮肤病变的分类准确率、召回率和精度分别为97.3%, 96.8%和97.2%, 且均优于实验中所对比的常见分类模型和其他研究方法.
2023, 32(6):204-211. DOI: 10.15888/j.cnki.csa.009149
摘要:针对水下图像模糊、颜色失真, 水下场景环境复杂、目标特征提取能力有限等导致的水下鱼类目标检测精确度低的问题, 提出一种基于YOLOv5的改进水下鱼类目标检测算法. 首先, 针对水下图像模糊、颜色失真的问题, 引入水下暗通道优先 (underwater dark channel prior, UDCP)算法对图像进行预处理, 有助于在不同环境下正确识别目标; 然后, 针对水下场景复杂、目标特征提取能力有限问题, 在YOLOv5网络中引入高效的相关性通道 (efficient channel attention, ECA), 增强对目标的特征提取能力; 最后, 对损失函数进行改进, 提高目标检测框的准确度. 通过实验证明改进后的YOLOv5在水下鱼类目标检测中精确度比原始的YOLOv5提高了2.95%, 平均检测精度(mAP@0.5:0.95)提高了5.52%.
2023, 32(6):212-220. DOI: 10.15888/j.cnki.csa.008936
摘要:教育是实现可持续发展目标的重要推动因素, 为了实现可持续发展目标, 人工智能(AI)是一项蓬勃发展的技术, 人们对理解学生行为和评估学生表现越来越感兴趣, 人工智能在改善教育方面有着巨大的潜力, 因为它已经开始在教育领域被开发出创新的教学方法, 以创造更好的学习. 介绍了一种基于人工智能的分析工具, 用于预测某所大学一年级信息技术课的学生表现, 建立了基于随机森林的分类模型, 预测第6周学生的学习成绩, 准确率为97.03%, 敏感性为95.26%, 特异性为98.8%, 精密度为98.86%, 马修斯相关系数为94%, 证明了这种方法在预测学生课程的早期表现, 非常有用. 在COVID-19疫情期间, 实验结果表明, 建议的预测模型满足预测虚拟教育系统中学生的学习行为要素所需的准确性、精确度和召回率.
2023, 32(6):221-230. DOI: 10.15888/j.cnki.csa.009113
摘要:针对现有的皮肤黑色素瘤病灶分割精度不高的问题, 结合现有卷积神经网络方法提出皮肤黑色素瘤图像分割方法MultiResUNet-SMIS.首先, 依据皮肤黑色素瘤成像特点, 引入不同空洞率的空洞卷积替换普通卷积, 在参数量相同的前提下扩大感受野, 使网络模型能够适用于多尺度病灶分割任务; 其次加入空间和通道注意力机制以重新分配特征权重, 扩大感兴趣特征影响, 抑制无关特征; 最后融合Focal loss与Dice loss提出一种新的loss函数FD loss用于计算回归损失, 解决前景背景像素不均衡问题, 进一步提高网络模型的分割精度. 实验结果表明, MultiResUNet-SMIS在ISIC-2018数据集上的Dice指数、IoU指数以及Acc准确率分别达到了89.47%、82.67%、96.13%, 与原MultiResUNet以及UNet、UNet++、DeepLab V3+等主流方法相比, MultiResUNet-SMIS在皮肤黑色素瘤图像分割中具有更好的效果.
2023, 32(6):231-240. DOI: 10.15888/j.cnki.csa.009143
摘要:在光伏板缺陷分类领域中, 传统的缺陷分类手段和新兴的机器学习方法都存在局限性, 不足以满足光伏板缺陷分类需求, 急需更可靠的解决方案. 近些年来小样本学习以其能在有限量数据下快速学习并泛化到新任务的特点, 逐渐在各领域兴起, 给缺陷技术的优化带来新的思路. 在这里, 以典型的小样本学习方法——原型网络方法为基础, 提出了基于改进的原型网络的光伏板缺陷分类方法. 该方法调整了训练模式, 通过改进模型主干网络和相似性度量标准来有效解决原型网络对复杂样本的特征嵌入能力较差和模型精度一般的问题, 方法在经典的光伏板缺陷数据集进行了多次对比实验. 结果表明: 改进方法的实验耗时大大缩短, 模型精度得到提高.
2023, 32(6):241-250. DOI: 10.15888/j.cnki.csa.009117
摘要:近年来基于anchor-free的检测方法相继被提出, 它们采取将目标转化为关键点, 并在全局高斯热图中进行正负样本的标签分配. 这种标签分配策略在一些场景中存在正负样本不平衡的问题, 而且在甲状旁腺检测中不能有效反映目标的形状和方向. 因此, 本文提出了一种新的甲状旁腺检测模型EllipseNet, 首先在GT中构建椭圆形状的高斯分布, 拟合GT中的真正目标, 使得正负样本的分配更加细粒度; 同时提出融入目标形状信息的损失函数对目标的位置进行约束, 进一步提高检测的精度. 此外, 模型中构建了多尺度预测, 能够更好地检测不同大小的目标, 解决甲状旁腺检测中目标尺度不平衡的问题. 本文在甲状旁腺数据集上进行实验, 结果表明, EllipseNet的AP50达到95%, 相比多种主流的检测算法, 其检测精度有较大的提升.
2023, 32(6):251-259. DOI: 10.15888/j.cnki.csa.009165
摘要:针对当前传统农作物病害语义分割方法精度不高、鲁棒性差等问题, 本文提出了基于注意力机制的改进UNet草莓病害语义分割模型. 首先, 在编码器中加入CNN-Transformer混合结构, 增强全局信息与局部细节信息的特征提取能力. 其次, 在解码器中将dual up-sample模块替换传统上采样, 提高特征提取能力与分割精度. 再使用hard-swish激活函数代替ReLU激活函数, 更加平滑的曲线有助于提高泛化性和非线性特征提取能力, 防止梯度消失. 最后, 通过使用结合交叉熵Dice损失函数, 加强模型对分割结果的约束, 进一步提升分割精度. 实验采用了由7种草莓病害2500张图像组成的数据集, 在复杂背景下对草莓病害进行分割, 语义分割像素精度达到92.56%, 平均交并比达到84.97%. 实验结果表明, 本文的改进UNet在草莓病害语义分割方面, 能实现更好的分割效果, 优于大多数分割模型.
2023, 32(6):260-268. DOI: 10.15888/j.cnki.csa.009080
摘要:在阿尔兹海默症分类问题中, 超图神经网络可以从被试间的超图关系中提取特征, 在表示学习复杂图结构方面具有很好的优势, 但大多数模型都直接或间接地将超图所表示的被试间的高阶复杂关系分解, 转化为简单的二元关系进行特征学习, 没有有效利用超边的高阶信息, 因此提出了基于线-超图神经网络(line-hypergraph neural network, L-HGNN)的阿尔兹海默症分类模型, 该模型利用稀疏线性回归表征被试间多元相关性, 借助超图和线图的转换在神经网络模型中实现节点的高阶邻域信息传递和超边整体结构特征学习, 同时, 结合注意力机制生成更具区分性的节点嵌入, 进而用于阿尔兹海默症的辅助诊断. 在ADNI数据上与常用的两种方法比较, 实验结果表明, 该方法能有效提高分类准确率, 在阿尔兹海默症早期诊断上具有重要的应用价值.
2023, 32(6):269-277. DOI: 10.15888/j.cnki.csa.009124
摘要:为最大程度地减少同步数据流语言编译过程中由编译器引入的错误, 需要利用形式化方法自动生成代码, 保证编译器产生的代码能够应用于核能仪控系统. 本研究使用定理证明工具Coq, 对同步数据流语言Lustre到Clight的主节点输入结构翻译阶段涉及的语法、语义及翻译算法进行了形式化定义, 并完成翻译算法的形式化证明. 研究表明这种经过形式化的编译器能够生成与源代码行为一致的可信目标代码, 同时生成的目标代码能够很好满足核能仪控系统的执行规范.
2023, 32(6):278-285. DOI: 10.15888/j.cnki.csa.009162
摘要:针对工业场景下设备资源有限的情况, 提出一种改进YOLOv5的轻量化带钢缺陷检测模型. 首先, 使用ShuffleNetv2代替主干特征提取网络, 优化模型参数量和运行速度; 其次, 采用轻量级上采样算子CARAFE (content-aware reassembly of features), 在增大感受野的同时进一步降低参数和计算量; 同时引入GSConv层, 在保证语义信息的同时平衡模型准确性与检测速度; 最后, 设计一种跨层级特征融合机制, 提高网络的检测精度. 实验结果表明, 改进后的模型的平均检测精度为78.5%, 相较于原始YOLOv5算法提升了1.4%; 模型计算量为10.9 GFLOPs, 参数量为5.88×106, 计算量和参数量分别降低31%和15.4%; 检测速度为49 f/s, 提升了3.5 f/s. 因此, 改进后的模型提高了检测精度和检测速度, 并且大幅降低了模型的计算量和参数量, 能够满足对带钢表面缺陷进行实时检测.
2023, 32(6):286-292. DOI: 10.15888/j.cnki.csa.009148
摘要:多标签图像分类是多标签数据分类问题中的研究热点. 针对目前多标签图像分类方法只学习图像的视觉表示特征, 忽略了图像标签之间的相关信息以及标签语义与图像特征的对应关系等问题, 提出了一种基于多头图注意力网络与图模型的多标签图像分类模型(ML-M-GAT). 该模型利用标签共现关系与标签属性信息构建图模型, 使用多头注意力机制学习标签的注意力权重, 并利用标签权重将标签语义特征与图像特征进行融合, 从而将标签相关性与标签语义信息融入到多标签图像分类模型中. 为验证本文所提模型的有效性, 在公开数据集VOC-2007和COCO-2014上进行实验, 实验结果表明, ML-M-GAT模型在两个数据集上的平均均值精度(mAP)分别为94%和82.2%, 均优于 CNN-RNN、ResNet101、MLIR、MIC-FLC 模型, 比ResNet101模型分别提高了4.2%和3.9%. 因此, 本文所提的ML-M-GAT模型能够利用图像标签信息提高多标签图像分类性能.
2023, 32(6):293-300. DOI: 10.15888/j.cnki.csa.009150
摘要:高质量的问答对有助于从文章中获取知识, 提高问答系统性能, 促进机器阅读理解, 在人类活动和人工智能领域中都起着较为重要的作用. 当前主要问答对生成方法依靠提供文章中的候选答案, 根据答案生成特定的问题. 然而一些候选答案可能会生成无法从文章中回答的问题, 或是生成问题的答案不再是候选答案, 造成问答对相关性差, 影响问答对的质量. 针对此问题, 本文提出了一个基于关键短语抽取与过滤生成问答对的方法. 该方法能够在输入文本中自动抽取适合生成问题的关键短语作为候选答案, 再根据候选答案在问题生成器和答案生成器中生成问答对, 并通过对比候选答案与生成答案的相似度过滤相关性低的问答对, 最终输出保证质量的问答对. 本方法在SQUAD1.1和NewsQA数据集上进行了实验验证, 并人工检验了生成的问答对的质量, 结果表明该方法可以有效提高生成的问答对的质量.
2023, 32(6):301-307. DOI: 10.15888/j.cnki.csa.009091
摘要:重污染天气是“十四五”时期大气污染治理的重点工作, 在重污染天气时期对风险源进行精准识别, 可以及时发出预警, 做好环境污染治理, 防止污染事件进一步加重. 基于网格化监测技术获取的数据, 本文提出一种结合残差网络(ResNet)、图卷积网络(GCN)和门控循环网络(GRU)的深度学习模型ResGCN-GRU, 该模型主要应用于重污染天气时期识别风险源. 重污染天气的风险源往往都是区域性的, 具有明显的时空特征, 因而本文先利用GCN网络提取监测点位之间的空间特征, 同时利用ResNet解决多层GCN带来的过平滑以及梯度消失问题; 再利用GRU提取风险源的时间特征, 最后将全连接层融合的时空特征输入到Softmax激活函数得到二分类概率值, 再根据概率值得到分类结果. 为验证本文提出的模型性能, 本文基于沈阳市72个监测点位的数据, 通过精确度、召回率以及综合评价指标对GCN、LSTM、GRU和GCN-GRU进行对比, 实验结果表明ResGCN-GRU模型分类效果的精确度分别要好16.9%、4.3%、3.1%、2.9%, 证明了本文提出的模型在大气风险源识别方面更加有效, 可以根据风险源数据的时空特征达到对风险源的精准识别.