2024年第0卷第11期文章目次

2024, 33(11):1-14. DOI: 10.15888/j.cnki.csa.009677

摘要 (274) HTML (247) PDF 3.76 M (1104) 评论 (0) 收藏

摘要:为了解决图像采集过程中眼图消失和头部姿态估计不准确的问题, 利用基于非接触式的眼部信息获取方法采集人脸图像, 从单个图像帧中确定飞行员当前的注视方向. 同时, 针对现有网络忽略头部运动对视线造成遮挡所导致的分类效果不佳问题, 结合人脸图像与头部姿态特征, 通过改进的MobileViT模型提出一种用于飞行员注视区域分类的多模态数据融合网络. 首先提出了多模态数据融合模块解决特征拼接过程中尺寸不平衡导致的过拟合问题, 其次提出一种基于并行分支SE机制的逆残差块, 充分利用网络浅层的空间和通道特征信息, 并结合Transformer的全局注意力机制捕捉多尺度特征. 最后, 重新设计了Mobile Block结构, 使用深度可分离卷积降低模型复杂度. 利用自制数据集FlyGaze对新模型和主流基线模型进行对比, 实验结果表明, PilotT模型对注视区域0、3、4、5的分类准确率均在92%以上, 且对人脸发生偏转的情况具有较强适应力. 研究结果对提升飞行训练质量以及飞行员意图识别和疲劳评估具有实际应用价值.

联合判别性外观和运动线索的行人多目标跟踪

王军，李迎春，程勇

2024, 33(11):15-26. DOI: 10.15888/j.cnki.csa.009681

摘要 (116) HTML (206) PDF 3.61 M (880) 评论 (0) 收藏

摘要:在多目标跟踪任务中, 外界噪声的干扰会导致传统方法的系统建模不可靠, 从而降低目标位置预测的准确性; 而密集人群引起的拥挤和遮挡问题则会严重影响目标外观的可靠性, 导致错误的身份关联. 为了解决这些问题, 本文提出一种多目标跟踪算法Ecsort. 该算法在传统运动预测的基础上, 引入噪声补偿模块, 降低噪声干扰引起的误差, 提高位置预测的准确性. 其次, 引入特征相似度匹配模块, 通过学习目标的判别性外观特征, 并结合运动线索和判别性外观特征的优势, 从而实现精确的身份关联. 通过在多目标跟踪基准数据集上进行的大量实验结果表明, 与基线模型相比, 该方法在MOT17测试集上的IDF1 (ID F1 score)、HOTA (higher order tracking accuracy)、AssA (association accuracy)、DetA (detection accuracy)分别提高了1.1%、0.5%、0.6%、0.3%, 在MOT20测试集上的IDF1、HOTA、AssA、DetA分别提高了2.3%、1.9%、3.4%、0.2%.

优化双线性ResNet34的人脸表情识别

吕军，苌婉婷，陈付龙，王志伟

2024, 33(11):27-37. DOI: 10.15888/j.cnki.csa.009682

摘要 (163) HTML (204) PDF 1.95 M (857) 评论 (0) 收藏

摘要:为了能够更准确且快速地识别人脸表情, 提出了一种优化的基于ResNet34网络的双线性结构(OBSR-Net)来进行人脸表情识别. OBSR-Net采用双线性网络结构作为整体框架, 主干网络使用ResNet34网络, 通过平移不变的方式对局部成对特征交互进行建模, 从而提取更加完整有效的特征, 同时采用迁移学习的策略来降低人脸表情小样本图像数据集对深度学习方法的限制. 此外, 在训练过程中使用一种新的通用优化技术, 即梯度集中. 该方法通过将梯度向量集中到零均值来直接对梯度进行操作, 可以看作是一种具有约束损失函数的投影梯度下降方法. OBSR-Net在Fer2013和CK+两个公开数据集上进行实验, 分别取得了77.65%和98.82%的识别准确率. 实验结果表明, 与其他先进的人脸表情识别方法相比, OBSR-Net表现出较强的竞争力.

边缘计算的安全挑战与解决方法综述

温木奇，温武少

2024, 33(11):38-47. DOI: 10.15888/j.cnki.csa.009702

摘要 (131) HTML (222) PDF 2.23 M (1064) 评论 (0) 收藏

摘要:相比集中式的云计算框架, 边缘计算在云中心和现场智能设备之间部署了额外的“边缘服务器”, 支持现场智能设备快速、高效地完成运算任务和事件处理. 边缘计算系统中, 现场智能设备数量庞大、边缘计算服务器繁杂, 它们存储的数据敏感和私密性要求高. 边缘计算系统的这些特点, 给网络安全防护带来困难. 解决边缘计算系统的信息和网络安全是边缘计算技术大规模产业化的关键. 而由于边缘服务器设备和现场智能设备的计算能力、网络能力和存储能力的局限, 传统的计算机网络安全技术不能完全满足要求. 分析适合边缘计算系统的联邦学习、轻量加密、混淆与虚拟位置信息、匿名身份认证等有效的敏感数据保护技术, 以及探讨人工智能和区块链等新技术在边缘计算防范恶意攻击的应用, 助力边缘计算的产业化发展.

S-UNet: 基于U-Net和LSTM的短临降水预报网络

许梦，杜景林，刘蕊

2024, 33(11):48-57. DOI: 10.15888/j.cnki.csa.009683

摘要 (117) HTML (197) PDF 1.76 M (843) 评论 (0) 收藏

摘要:随着深度学习技术的发展, 多数研究工作将短临降水预报视为雷达回波序列的预测任务. 由于降水复杂性的非线性时空变换, 现有的短临预报存在准确性低、外推时效短、难以应对复杂的非线性时空变换等缺点. 为解决以上问题, 本文基于U-Net和LSTM提出了S-UNet短临降水预报网络. 首先本文提出了S-UNet layer (SL)模块, 以帮助网络更好地提取雷达序列特征, 构建时空变化的整体趋势, 从而提高网络效率, 增加网络的外推时长. 其次, 为更好地应对雷达回波的变形、积累和消散的复杂性, 增强网络对复杂的空间关系的捕获能力和运动轨迹的模拟能力, 本文基于LSTM构建了雷达特征模块radar feature (RF). 最后, 将SL模块和RF模块与U-Net框架结合, 提出了S-UNet短临降水预报网络, 并在KNMI数据集上实现了先进的性能. 实验结果表明, 在KNMI的NL-50和NL-20数据集上, 本文所提的方法与主流方法相比, 海德克技能得分和关键成功指数分别提高了5.25% (6.57%)和2.17% (4.75%), 达到了0.30 (0.29)和0.72 (0.58); 准确率提高了2.10% (1.35%), 达到了0.80 (0.80); 假接受率降低了4.27% (1.80%), 达到了0.24 (0.38). 除此之外, 本文通过消融实验证明了所提出模块及结合方法的有效性.

多尺度融合的轻量级钢材表面缺陷检测

杨本臣，李世熙，金海波，康洁

2024, 33(11):58-67. DOI: 10.15888/j.cnki.csa.009678

摘要 (161) HTML (191) PDF 15.41 M (1062) 评论 (0) 收藏

摘要:钢材表面缺陷的检测质量直接影响工业生产安全性和机器性能质量, 现实工厂钢材质量把控受限于设备条件, 在实现高精度强实时的检测效果仍面临着挑战. 为了解决这一问题, 提出一种多尺度融合的轻量级YOLOv8n检测算法. 首先引入一种结合HGnetv2与RepConv的轻量级多尺度融合主干网络(RepHGnetv2), 提高Backbone的特征提取能力与泛化能力同时降低了模型的复杂度; 在Head部分, 利用ADown下采样模块替换原算法的普通卷积(Conv), 降低计算量并提高语义保留能力; 最后将原算法的Loss函数替换为SlideLoss, 改善样本之间不平衡的问题. 在NEU-DET数据集上进行消融与对比实验, 改进算法与原算法相比, mAP@0.5提升6.7%, Precision提升9.3%, 模型大小下降25.5%, 计算量下降了17.2%, FPS也有一定的提升; 并在VOC2012数据集上进行了通用性对比实验, 实验结果表明改进算法可以有效提高缺陷检测精度与效率, 同时具有较好的通用性.

基于MCGAN模型的降水临近预报

刘蕊，杜景林，许梦

2024, 33(11):68-78. DOI: 10.15888/j.cnki.csa.009673

摘要 (79) HTML (159) PDF 3.66 M (699) 评论 (0) 收藏

摘要:在降水临近预报领域中, 现有基于深度学习的雷达回波外推方法存在一些缺点. 在图像质量方面, 预测图像模糊并缺乏小尺度细节, 在预测精度方面, 降水结果不够准确. 本文提出了一个多尺度生成对抗(MCGAN)模型, 该模型由多尺度卷积生成器和全卷积的判别器组成. 生成器部分采用编码器-解码器架构, 主要包含了多尺度卷积块和下采样门控单元. MCGAN模型使用动态时空变异性损失函数在生成对抗网络(GAN)框架下训练, 以达到更精准和更清晰的回波强度和分布预测效果. 模型的性能在上海市公共雷达数据集上进行了验证, 与主流深度学习模型相比, 本文所提模型在图像质量评估中的MSE指标上下降了11.15%, 在SSIM指标和PSNR指标上分别增加了8.99%、2.95%; 在预测精度评估中, CSI指标、POD指标、HSS指标上平均提高了11.92%、15.89%、9.01%, FAR指标平均降低了14.81%. 此外, 本文通过消融实验证明了MCGAN模型每个部件的作用.

优化的协作多智能体强化学习架构

刘玮，程旭，李浩源

2024, 33(11):79-89. DOI: 10.15888/j.cnki.csa.009636

摘要 (83) HTML (175) PDF 3.03 M (610) 评论 (0) 收藏

摘要:在现实环境中, 许多任务需要多个智能体的协作来完成, 然而智能体之间通常存在着通信受限和观察不完整的问题. 深度多智能体强化学习(Deep-MARL)算法在解决这类具有挑战性的场景中表现出卓越的性能. 其中QTRAN和QTRAN++是能够学习一类广泛的联合动作-价值函数的代表性方法, 且同时具备强大的理论保证. 然而, 由于依赖于单一联合动作-价值估计量以及忽视了对智能体观察的预处理, 使得QTRAN和QTRAN++的性能受到了影响. 本文提出了一种称为OPTQTRAN的新算法, 其在QTRAN和QTRAN++的性能基础上取得了显著的提升. 首先, 本文引入了一种双联合动作-价值估计量的结构, 利用一个分解网络模块计算额外的联合动作-价值. 为了确保准确计算联合动作-价值, 本文设计了一个自适应网络模块, 有效促进了值函数学习. 此外, 本文引入了一个多元网络结构, 将智能体的观察分组到不同的单元中, 以有效估计各智能体的效用函数. 在广泛使用的StarCraft基准测试中进行的多场景实验表明, 与最先进的多智能体强化学习方法相比, 本文的方法表现出更卓越的性能.

基于扩散与时频注意力的时间序列插补方法

王槃，曾倩欣，杨欢

2024, 33(11):90-100. DOI: 10.15888/j.cnki.csa.009669

摘要 (121) HTML (170) PDF 1.79 M (605) 评论 (0) 收藏

摘要:时间序列插补旨在根据现有数据填补缺失值以恢复数据的完整性. 目前基于RNN的插补方法存在较大的误差, 并且增加网络层数容易出现梯度爆炸和消失问题, 而基于GAN和VAE的插补方法经常面临训练困难和模式崩溃的挑战. 为解决上述问题, 本文提出了一种基于扩散与时频注意力的时间序列插补模型DTFA (diffusion model and time-frequency attention), 通过反向扩散实现从高斯噪声中重建缺失数据. 具体而言, 本研究利用多尺度卷积模块与二维注意力机制捕获时域数据中的时间依赖性, 并利用MLP与二维注意力机制学习频域数据的实部与虚部信息. 此外, 本研究通过线性插补模块以对现有的观测数据进行初步的数据增强, 从而更好地指导模型的插补过程. 最后, 本研究通过最小化真实噪声与估计噪声的欧氏距离来训练噪声估计网络, 并利用反向扩散实现对时序数据的缺失插补. 本研究的实验结果表明, DTFA在ETTm1、WindPower和Electricity这3个公开数据集上的插补效果均优于近年主流的基线模型.

基于变形卷积和多重注意力的零售商品检测

王添，刘立波

2024, 33(11):101-110. DOI: 10.15888/j.cnki.csa.009695

摘要 (54) HTML (166) PDF 5.81 M (753) 评论 (0) 收藏

摘要:针对零售商品旋转和变形导致难以准确提取全局特征及无关特征干扰的问题, 提出一种基于改进YOLOv8s的零售商品检测算法. 首先, 利用归一化可变形卷积替代部分标准卷积, 通过充分捕获长距离依赖关系以及突出通道关键特征, 增强对全局特征的提取能力; 其次, 使用改进的动态检测头, 使用基于空间感知、尺度感知和任务感知的多重注意力机制来捕获更具区分性的商品局部特征, 以抑制无关特征干扰; 最后, 采用InnerEIoU损失函数替换CIoU, 以降低商品漏检率. 实验结果表明, 所提算法在RPC零售商品数据集上的mAP@0.5:0.95达到93.3%, 较原始算法提升了1.5%, 并优于其他主流检测算法; 同时模型参数量和计算量分别下降了10.0%和6.5%, 能够在存储和计算资源受限的实际场景中, 准确地进行零售商品检测.

基于注意力与量化感知的航拍红外目标检测

周进，裴晓芳

2024, 33(11):111-120. DOI: 10.15888/j.cnki.csa.009699

摘要 (55) HTML (151) PDF 2.43 M (627) 评论 (0) 收藏

摘要:针对航拍场景下红外目标对比度低、识别精度差、检测难度大等问题, 提出一种基于注意力与量化感知的航拍红外目标检测算法. 首先, 利用DCNv2替代ELAN模块中的3×3卷积, 构建了DC-ELAN模块, 有效提升了模型捕捉局部和全局特征的能力, 进而强化了网络的特征表达能力; 其次, 通过巧妙地将SE注意力机制融入SPPCSPC模块和ELAN模块中, 设计出了SE-SPPCSPC模块和SE-ELAN模块, 有助于增强特征图的空间自注意力, 模型能够更好地关注目标区域; 此外, 引入QARepVGG模块, 提升模型的量化感知能力并增强其对量化误差的鲁棒性; 最后, 引入DyHead模块, 该模块可以根据输入图像的不同动态调整检测头, 提高模型对不同大小、形状目标的检测能力, 从而进一步提高红外目标检测的准确性和鲁棒性. 实验结果表明, 相较于原模型, 改进后的YOLOv7-tiny模型在计算量未增长的情况下, mAP@0.5值提升了3.4%, mAP@0.5:0.95值提升了4.8%, 显著提高了模型检测精度.

基于改进Faster R-CNN的肺结核病原体检测

鞠瑞文，孙振，李庆党

2024, 33(11):121-130. DOI: 10.15888/j.cnki.csa.009679

摘要 (73) HTML (151) PDF 2.95 M (643) 评论 (0) 收藏

摘要:本文提出一种基于Faster R-CNN的肺结核病原体检测方法, 以更高的准确率和更低的漏检率检测肺结核. 首先, 通过Mosaic数据增强方法对数据集进行扩充, 提高模型泛化能力, 同时引入K-means聚类算法, 对所用数据集重新聚类来生成对的锚点初始候选框大小. 其次, 将Faster R-CNN中的原始特征提取网络替换为Res2Net, 并将其卷积核全部替换为空洞卷积, 在与原卷积相比参数量不变的情况下, 增大了感受野. 再者, 引入改进后的GC-FPN模块, 使模型在轻量化的同时更好的关注小目标信息. 最后, 引入ROI Align, 解决候选框和初始回归位置存在偏差的问题. 实验结果表明, 在公开数据集上, 改进的Faster R-CNN模型与原本的Faster R-CNN算法相比, 准确率提高了2.7%, 召回率提升了1.4%, 该算法不仅在结核图像数据集上得到了验证, 而且具有较高的准确率.

有监督多视图对比学习和两阶段双线性特征融合的人脸活体检测

孙文赟，李进，金忠

2024, 33(11):131-141. DOI: 10.15888/j.cnki.csa.009701

摘要 (76) HTML (152) PDF 2.47 M (636) 评论 (0) 收藏

摘要:本文提出了一种将多尺度频率特征和生成对抗网络(GAN)训练的深度图特征融合的多分支网络. 具体地, 高频特征中的边缘纹理信息有利于捕捉摩尔纹. 低频特征对色彩失真更为敏感. 作为辅助信息, 深度图在视觉层面上比 RGB 图像更具辨别力. 有监督多视图对比学习的应用进一步增强了多视图特征的学习. 此外, 还提出了两阶段双线性特征融合方法, 以融合来自不同视图的多分支特征. 为了评估该模型, 我们在4个广泛使用的公共数据集(CASIA-FASD、Replay-Attack、MSU-MFSD 和 OULU-NPU)上进行了消融实验, 特征融合对比实验, 单一数据集实验和跨数据集实验. 跨数据集实验结果表明, 本文模型在4种测试协议上的平均HTER比只使用RGB图转换为深度图(DFA)的方法好5% (20.3%减至15.0%).

多策略大规模多目标优化算法

裴倩如，邹锋，陈得宝

2024, 33(11):142-156. DOI: 10.15888/j.cnki.csa.009672

摘要 (116) HTML (158) PDF 2.76 M (696) 评论 (0) 收藏

摘要:在解决大规模多目标优化问题(LSMOP)时, 随着决策变量维数的增加会使得MOEA/D算法在决策空间扩展性差且容易收敛于局部最优. 针对这一问题, 提出了一种大规模多策略MOEA/D算法 (MSMOEA/D). MSMOEA/D算法在优化过程中引入了一种基于自动编码器的混合初始化策略, 以改善初始种群的覆盖程度, 从而促进全局搜索. 然后, 提出一种基于聚合函数值的邻域调整策略, 通过调整邻域大小, 能够在搜索过程中更精确地控制搜索范围, 避免因邻域过大或过小而导致的搜索效率低下. 此外, 在优化过程中采用了基于非支配排序的变异选择策略. 不同的子问题根据位于非支配排序第1层的个体数量选择变异策略, 避免种群陷入局部最优, 提高算法的整体性能. 最后, 使用LSMOP和DTLZ测试问题对MSMOEA/D算法和其他已有算法进行了评估. 实验结果证实了MSMOEA/D算法解决大规模多目标优化问题的有效性.

边缘增强结合多尺度信息融合的皮肤病变分割

齐向明，张志伟

2024, 33(11):157-166. DOI: 10.15888/j.cnki.csa.009676

摘要 (84) HTML (167) PDF 2.85 M (709) 评论 (0) 收藏

摘要:针对皮肤病灶大小不一、与周围皮肤对比度低、边界模糊不规则、存在伪影及毛发干扰等问题, 本文提出一种边缘增强结合多尺度信息融合的皮肤病变分割算法, 该算法由编码器、多尺度感知模块、边缘增强模块、轻量化解码器组成. 首先在编码器中构建Transformer模块以提取全局信息, 使用卷积操作以提取局部信息; 其次设计多尺度感知模块, 采用密集连接结构的门控空洞卷积金字塔模块来融合多尺度特征; 接着构建边缘增强模块, 利用深层特征促进对边缘特征的探索以更好的保留细节和边缘信息; 最后设计轻量化解码器, 采用CARAFE轻量化算子进行上采样, 在使用相对较少参数的情况下保持较高的分割精度. 在公开数据集ISIC2016和ISIC2018上做对比实验, 结果表明, 本文算法分割精度高于其他流行算法.

基于睡眠脑电信号的抑郁症诊断算法

杨家豪，张嘉慧，尧韶聪，邱谦，潘家辉

2024, 33(11):167-176. DOI: 10.15888/j.cnki.csa.009671

摘要 (453) HTML (168) PDF 1.68 M (724) 评论 (0) 收藏

摘要:抑郁症诊断是医学领域的重要研究方向. 而现有的抑郁症诊断方法存在高成本、低效率、准确率不高以及解释性不强等问题, 为解决该问题, 本文结合睡眠分期技术, 提出一种基于睡眠脑电信号的抑郁症自动诊断算法. 该方法首先通过卷积神经网络与双向长短时记忆神经网络结合, 能够提取睡眠信号的高级特征, 同时结合不同睡眠时期的关联性进行分析, 提升了睡眠分期的准确率与可解释性. 实验结果表明, 这种方法在Sleep-EDF公开数据集中准确率最高能够达到95.82%, 超越了大多数现有方法. 随后, 基于睡眠分期的结果, 结合卷积神经网络提出了DepNet2D (depression net 2 dimension)模型, 对REM期的脑电数据进行特征提取并分类. 该模型能够有效地学习睡眠脑电的时空依赖关系, 捕捉抑郁症患者大脑活动的特征模式, 提高了识别患者频谱特征的准确率. 实验结果表明, 在抑郁症诊断任务中, 本文提出的抑郁症筛查方法准确率达到了88.82%, 与传统抑郁症诊断模型相比, 具有更高的准确率. 该方法增强了抑郁症诊断的可解释性, 对现代抑郁症研究等分析研究具有一定的实用价值, 为精神健康领域的研究和临床实践提供了新的思路和方法.

改进YOLOv8的水下目标检测

周昕，李远禄，吴明轩，范小婷，王键翔

2024, 33(11):177-185. DOI: 10.15888/j.cnki.csa.009680

摘要 (116) HTML (177) PDF 3.39 M (696) 评论 (0) 收藏

摘要:针对水下目标检测中的尺度不一、重叠遮挡目标的漏检问题, 提出了一种改进的YOLOv8水下目标检测算法. 首先, 在主干网络中引入可变形卷积 (deformable convolution network, DCN), 通过卷积核自适应形变的机制, 提高模型对重叠遮挡目标的特征提取能力; 其次, 设计了一种空洞卷积空间金字塔模块(atrous spatial pyramid faster, ASPF), 扩大输出特征图的感受野, 提高模型对水下多尺度目标的感知能力; 最后, 对损失函数进行改进, 优化模型的训练过程并提高定位精度. 将改进算法在URPC数据集上进行实验, 结果表明改进算法的检测精度达到了87.3%, 相较于原始算法YOLOv8提高了3.4%, 同时能够精准检测水下多尺度、重叠遮挡目标.

融合注意力机制的SegFormer遥感影像道路识别

王晓杰，陈少康，闫皓炜，杨鹤猛，燕正亮，王森

2024, 33(11):186-193. DOI: 10.15888/j.cnki.csa.009641

摘要 (98) HTML (157) PDF 2.50 M (559) 评论 (0) 收藏

摘要:道路信息在遥感影像中具有重要意义和价值, 因此准确提取道路对于许多应用非常关键. 然而, 在进行道路识别时存在两个主要问题. 首先, 卫星影像的背景复杂多变, 而道路的形态也是复杂多样的, 这给道路的自动识别带来了挑战. 其次, 道路像素只占整个影像的很小一部分, 导致类别不平衡的问题. 为了解决上述问题, 本文提出了一种基于改进的SegFormer模型的卫星影像道路自动识别算法. 该算法采用了两个主要策略来改进识别效果. 第一, 在SegFormer编码器的各个阶段的输出端添加了空间注意力模块. 这个模块有助于减弱复杂背景的干扰, 同时增强对道路区域的关注. 通过引入空间注意力机制, 模型能够更好地捕捉到道路的特征, 从而提高识别准确性. 第二, 采用了一种混合损失函数, 结合了像素对比损失和交叉熵损失. 这样的损失函数能够更好地处理类别不平衡的问题, 使得模型更加关注道路类别的训练. 通过优化训练过程, 模型能够更好地学习到道路的特征表示, 从而提升识别准确率. 通过对比实验分析, 改进后的模型在测试集上的mIoU指标提升了约3.3%.

基于VE-GEP算法的PM_2.5浓度预测

王超学，邹飞

2024, 33(11):194-201. DOI: 10.15888/j.cnki.csa.009688

摘要 (52) HTML (145) PDF 1.37 M (600) 评论 (0) 收藏

摘要:准确预测PM_2.5浓度对于公众健康和环境保护具有重要意义, 但其非线性、多变性以及复杂性的特点导致难以准确预测. 基于此, 本文针对传统GEP存在的不足, 提出了一种基于病毒进化的基因表达式编程算法(VE-GEP)来预测PM_2.5浓度. 该算法在GEP的基础上引入了复活机制与诱变重启机制. 复活机制能去除种群中的劣质个体, 改善种群中个体的质量; 诱变重启机制通过引入优质基因和新的个体, 提高种群的多样性, 增强算法的寻优能力. 实验结果表明, VE-GEP算法相较于GEP、DSCE-GEP和CNN-LSTM在春季、夏季和秋季中的预测模型均有不同程度的提高, 拟合度分别提高1.28%/0.1%/0.13%、1.86%/1.29%/0.42%、0.57%/0.24%/0.29%, 为PM_2.5浓度预测研究提供了新的思路和方法.

基于改进YOLOv8n的轻量化柑橘成熟度检测

肖阳，项明宇，李熹

2024, 33(11):202-208. DOI: 10.15888/j.cnki.csa.009693

摘要 (76) HTML (184) PDF 3.20 M (663) 评论 (0) 收藏

摘要:为了实现柑橘采摘的智能化, 果园环境中对柑橘快速而精准的识别成为关键. 针对现有目标检测算法对环境的适应缺陷和效率低下的问题, 提出一种基于YOLOv8n模型的轻量化柑橘成熟度检测算法YOLOv8n-CMD (YOLOv8n citrus maturity detection). 首先, 优化backbone网络结构, 提高小目标检测能力; 其次, 添加CBAM注意力机制, 改善模型分类效果; 然后, 引入Ghost卷积, 将YOLOv8原模型中的颈部C2f模块与Ghost结合, 减少计算量和参数量; 最后使用SimSPPF模块代替原网络金字塔池化层, 提高模型检测效率. 实验结果表明: YOLOv8n-CMD算法相较于原模型的模型参数量和计算量分别减少了31.8%和7.4%, 精准度提高了3.0%, 更适合果园环境下的柑橘检测研究.

基于多模态融合的移动应用细粒度用户意图理解

张逸涵，洪赓，杨哲慜

2024, 33(11):209-223. DOI: 10.15888/j.cnki.csa.009653

摘要 (50) HTML (170) PDF 3.69 M (621) 评论 (0) 收藏

摘要:随着移动应用功能日益复杂, 现有基于用户意图的隐私泄露检测方法面临更大挑战. 一方面, 传统隐私泄露检测基于应用级别的用户意图, 只关注应用的隐私收集行为是否与应用的核心功能需求相符合, 不适用于现如今具有广泛功能和多元用户意图的移动应用安全检测, 亟需粒度更细的用户意图分类; 另一方面, 现行研究大多集中于评估图标等界面小部件触发的隐私收集行为是否与用户意图一致, 然而, 图标不当设计和滥用现象十分普遍, 这限制了仅依赖小部件用户意图进行隐私风险评估的有效性, 因此当前仍需要对整体用户界面的意图进行理解. 针对以上问题, 本文首先从中文隐私政策中提取总结出常见的、适用于隐私合规判断的细粒度用户意图列表; 之后结合移动应用界面设计特点, 设计并实现了多模态特征融合的多分类模型对整个移动界面反映的用户意图进行识别. 评估结果表明, 本文隐私政策意图提取工具精确率与召回率均达到83%, 用户意图识别工具精确率与召回率分别达到了80%与83%, 具有较好的检测效果与实际可用性.

小程序敏感数据收集行为检测

花楠，杨哲慜

2024, 33(11):224-236. DOI: 10.15888/j.cnki.csa.009642

摘要 (60) HTML (159) PDF 1.64 M (624) 评论 (0) 收藏

摘要:小程序近年来被广泛应用, 因承载了大量的敏感用户数据而引发了广泛的隐私安全担忧. 现有的面向传统移动应用的隐私安全分析方法无法直接应用于小程序中. 一方面, 现有方法难以有效分析小程序闭源框架行为带来的隐私流转以及JavaScript闭包特性带来的跨作用域隐私流转, 造成分析结果的缺失. 另一方面, 小程序动态加载子包的机制导致不完整的分析范围, 进一步造成分析结果的缺失. 为此本文提出了动静态混合的小程序隐私收集行为分析方法. 首先, 该方法为小程序中的不同单元边界构建了基于控制流或数据依赖关系的数据传播路径, 即小程序隐私传播流图. 进一步地, 该方法通过学习并迁移传统移动应用端界面设计知识, 并利用UI事件与页面转换行为之间的控制流关联作为指引, 有效地对小程序界面进行探索, 从而触发子包加载过程. 相应的子包代码经分析后与已有分析结果融合, 形成更为全面的小程序隐私传播流图. 本文基于小程序隐私传播流图实现了对小程序内敏感数据的追踪. 本文基于上述方法实现了小程序隐私收集行为分析工具MiniSafe. 评估结果表明, MiniSafe在精确率与召回率上分别达到了90.4%与87.4%, 均优于现有工作. 同时, MiniSafe平均在每个小程序中检测出7项敏感数据收集行为, 通过考虑小程序子包中的敏感数据收集行为使整体检测效果提升了42.9%, 具有较好的检测效果与实际可用性.

面向生物医学命名实体识别和规范化的多粒度特征融合

刘彤，石昌岭，倪维健

2024, 33(11):237-246. DOI: 10.15888/j.cnki.csa.009640

摘要 (63) HTML (146) PDF 2.00 M (560) 评论 (0) 收藏

摘要:为了从生物医学文献中提取丰富的实体信息及其规范化表达, 提出了一种面向生物医学命名实体和规范化的多粒度特征融合方法(multi-granularity feature fusion approach for biomedical named entity recognition and normalization, MGFFA). 通过整合字符级、词级、概念级的文本信息, 显著增强了模型的学习能力. 同时还包含一个用于存储和综合不同层次信息的记忆库, 以实现对实体及其规范化标签间复杂关系的深入理解. 通过预训练模型的配合使用, MGFFA不仅捕捉了文本的粗粒度语义表示, 还细致分析了构词层面的特征, 从而全面提升了对长跨度实体的识别准确率. 在NCBI和NC5CDR数据集上的实验结果显示, 该模型在总体上优于其他基线模型.

基于深度生存分析与SHAP的电梯风险预测

曾倩欣，王槃，杨欢，杨勇

2024, 33(11):247-256. DOI: 10.15888/j.cnki.csa.009685

摘要 (51) HTML (149) PDF 2.50 M (639) 评论 (0) 收藏

摘要:为解决低频、不规则时间周期的基于统计的电梯预测性维护问题, 本文提出了结合深度生存分析与数据切割、补偿的综合方案. 本文通过建立动态静态生存状态向量, 捕捉影响大型故障风险的因素; 此外, 针对记录型数据中存在的左删失问题, 本文采用数据补充的方式解决, 并探究不同补充方式与分割策略对深度生存模型精度的影响. 最后, 研究对电梯场景下的深度生存模型使用SHAP分析, 揭示各因素对故障风险的动态影响. 研究结果显示, 采用数据粗分割与Cox填充方式组合的模型具有强预测能力和准确性, DeepSurv模型在预测能力和稳定性上表现突出, 梯龄、提升高度对大型故障风险的贡献随特定条件的变化会发生转折.

基于迁移学习的车辆目标识别

李慧，王艳娥

2024, 33(11):257-263. DOI: 10.15888/j.cnki.csa.009667

摘要 (85) HTML (152) PDF 1.20 M (589) 评论 (0) 收藏

摘要:为提高车辆识别的准确率及识别的实时性能, 本文提出了一种基于迁移学习的车辆识别方法. 该方法通过卷积神经网络和支持向量机结合并做进一步优化, 提高车辆识别的准确率, 并减少模型训练时间和提高模型的鲁棒性. 该方法首先使用卷积神经网络在CIFAR-10数据集上训练好网络; 然后结合残差优化的思想, 使用更深的预训练网络结构提取细粒度特征; 在模型网络的参数迁移过程中, 只迁移预训练的卷积层参数, 并添加全连接层在车辆数据集上进行微调; 最后将提取的特征直接放入支持向量机中进行分类. 通过详细的模型实验与结果分析, 本方法能够最终达到的最高识别正确率为97.56%, 单张图片识别时间260 ms, 识别时间和正确率均得到了较好的优化.

微信公众号

网站二维码

>综述文章

当期目录

年份

刊期