• 2024年第33卷第1期文章目次
    全 选
    显示方式: |
    • 基于宽度网络架构的单模型主导联邦学习

      2024, 33(1):1-10. DOI: 10.15888/j.cnki.csa.009346 CSTR:

      摘要 (684) HTML (908) PDF 1.86 M (1925) 评论 (0) 收藏

      摘要:联邦学习是一种分布式机器学习方法, 它将数据保留在本地, 仅将计算结果上传到客户端, 从而提高了模型传递与聚合的效率和安全性. 然而, 联邦学习面临的一个重要挑战是, 上传的模型大小日益增加, 大量参数多次迭代, 给通信能力不足的小型设备带来了困难. 因此在本文中, 客户端和服务器被设置为仅一次的互相通信机会. 联邦学习中的另一个挑战是, 客户端之间的数据规模并不相同. 在不平衡数据场景下, 服务器的模型聚合将变得低效. 为了解决这些问题, 本文提出了一个仅需一轮通信的轻量级联邦学习框架, 在联邦宽度学习中设计了一种聚合策略算法, 即FBL-LD. 算法在单轮通信中收集可靠的模型并选出主导模型, 通过验证集合理地调整其他模型的参与权重来泛化联邦模型. FBL-LD利用有限的通信资源保持了高效的聚合. 实验结果表明, FBL-LD相比同类联邦宽度学习算法具有更小的开销和更高的精度, 并且对不平衡数据问题具有鲁棒性.

    • 加入跳跃连接的深度嵌入K-means聚类

      2024, 33(1):11-21. DOI: 10.15888/j.cnki.csa.009348 CSTR:

      摘要 (542) HTML (809) PDF 2.61 M (1693) 评论 (0) 收藏

      摘要:现有的深度聚类算法大多采用对称的自编码器来提取高维数据的低维特征, 但随着自编码器训练次数的不断增加, 数据的低维特征空间在一定程度上发生了扭曲, 这样得到的数据低维特征空间无法反映原始数据空间中潜在的聚类结构信息. 为了解决上述问题, 本文提出了一种新的深度嵌入K-means算法(SDEKC). 首先, 在低维特征提取阶段, 在对称的卷积自编码器中相对应的编码器与解码器之间以一定的权重加入两个跳跃连接, 以减弱解码器对编码器的编码要求同时突出卷积自编码器的编码能力, 这样可以更好地保留原始数据空间中蕴含的聚类结构信息; 其次, 在聚类阶段, 通过一个标准正交变换矩阵将低维数据空间转换为一个新的揭示聚类结构信息的空间; 最后, 本文以端到端的方式采用贪婪算法迭代优化数据的低维表示及其聚类, 在6个真实数据集上验证了本文提出新算法的有效性.

    • >综述文章
    • 基于图像的野生动物检测与识别综述

      2024, 33(1):22-36. DOI: 10.15888/j.cnki.csa.009369 CSTR:

      摘要 (1346) HTML (2529) PDF 3.21 M (4552) 评论 (0) 收藏

      摘要:野生动物监测对于野生动物保护和生态系统维护至关重要, 而野生动物的检测与识别是实现监测的核心技术. 近年来, 随着计算机视觉技术的迅速发展和广泛应用, 基于图像的非接触式方法在野生动物监测领域引起了广泛的关注, 研究人员提出了各种方法来解决该领域的不同问题. 然而, 野外环境的复杂性使得对野生动物进行精确检测和识别仍具有一定的挑战. 为了推动该领域的研究, 本文对现有的基于图像的野生动物监测方法进行了综述, 主要包括3个部分: 野生动物图像获取方法、野生动物影像预处理方法以及野生动物检测与识别算法. 文章按照图像数据集和野生动物检测与识别算法的不同处理机制对这些方法进行了探讨和分类. 最后, 本文对基于深度学习的野生动物监测研究热点与存在问题进行了分析和总结, 并对未来的研究重点提出了展望.

    • 过程模拟研究进展

      2024, 33(1):37-48. DOI: 10.15888/j.cnki.csa.009377 CSTR:

      摘要 (457) HTML (1682) PDF 1.86 M (2909) 评论 (0) 收藏

      摘要:随着计算机技术的不断发展, 过程模拟在各行各业中的应用越来越广泛. 过程模拟使用模拟模型来模仿业务流程行为, 它可以用于预测和优化系统的性能, 评估决策的影响并向管理者提供决策依据, 也可以用于减少实验成本和时间. 目前, 如何高效地去构建一个可以信任的仿真模型得到了广泛关注. 本文通过追踪、归纳和分析关于构建业务过程模拟模型方法的相关研究文献, 对基于过程模型、系统动力学和深度学习的3种仿真建模方法的流程、优缺点和研究进展进行了阐述, 并探讨了过程模拟面临的挑战和未来的发展方向, 以期为业务过程模拟未来的研究方向提供参考.

    • 基于非负矩阵分解的有向网络半监督社区检测

      2024, 33(1):49-57. DOI: 10.15888/j.cnki.csa.009360 CSTR:

      摘要 (561) HTML (653) PDF 1.56 M (1531) 评论 (0) 收藏

      摘要:有向网络上的社区检测是网络科学领域一个重要的课题. 针对这一问题, 本文提出了一种基于非负矩阵分解的有向网络半监督社区检测算法, 首先利用先验信息重构邻接矩阵, 然后使用先验信息对节点的社区隶属度进行惩罚, 并通过行归一化消除节点度异质性的影响, 最后运用交替迭代更新给出了目标函数的求解方法. 在真实网络数据上的对比实验验证了算法的有效性, 相对于基于非负矩阵分解的现有方法, 本文方法能显著提高社区发现的准确性.

    • 结合改进注意力的肠胃镜图像深度估计

      2024, 33(1):58-67. DOI: 10.15888/j.cnki.csa.009343 CSTR:

      摘要 (542) HTML (715) PDF 2.46 M (1576) 评论 (0) 收藏

      摘要:针对肠胃镜诊疗系统存在图像关键信息模糊和适应性差等问题, 提出一种结合改进注意力机制的循环生成对抗网络, 以实现对消化道深度信息的准确估计. 该网络以CycleGAN为基础网络, 结合双重注意力机制, 并引入残差门控机制和非局部模块来更全面地捕捉和理解输入数据的特征结构和全局相关性, 从而提高深度图像生成的质量和适应性; 同时采用双尺度特征融合网络作为判别器, 以提升其判别能力并平衡与生成器之间的工作性能. 实验结果表明, 在肠胃镜场景中预测效果良好, 相比其他无监督方法, 在胃道、小肠和结肠数据集上平均准确度分别提升了7.39%、10.17%和10.27%. 同时, 在实验室人体胃道器官模型上也能够准确地估计出相对深度信息, 并提供精确的边界信息.

    • 基于多模态的实验室科研工效分析系统

      2024, 33(1):68-75. DOI: 10.15888/j.cnki.csa.009372 CSTR:

      摘要 (516) HTML (623) PDF 2.74 M (1294) 评论 (0) 收藏

      摘要:为实现实验室科研管理过程中的成员工时和工效分析、任务分配的合理性评估等需求, 研究一种基于摄像头视频、考勤机记录、Web系统记录等的多模态工效分析系统MASRE. 该系统通过实验室科研人员工时及其玩手机行为导致的无效工时、工效实时对比与展示, 激励实验室成员投入更多的时间开展学术研究. 依据系统计算的工效变化趋势, 实验室负责人可分析科研任务分配的合理性, 科研人员也可分析影响其科研效率的因素. MASRE系统由负责工时工效统计的Web系统模块和支持无效工时自动识别的AI分析模块构成, 采用PyTorch、VUE 3、MySQL等技术实现. 以该系统研发及其研究报告撰写的工时工效分析为例进行实验分析, 结果表明MASRE系统可有效识别无效工时并进行工时统计与工效分析. 同时, 该系统已免费向实验室研究团队开放申请注册使用, 网址为https://icnc-fskd.fzu.edu.cn/htower/.

    • 交叉特征融合和RASPP驱动的场景分割方法

      2024, 33(1):76-86. DOI: 10.15888/j.cnki.csa.009358 CSTR:

      摘要 (433) HTML (641) PDF 1.78 M (1411) 评论 (0) 收藏

      摘要:本文针对场景中目标多样性和尺度不统一等现象造成的边缘分割错误、特征不连续问题, 提出了一种交叉特征融合和RASPP驱动的场景分割方法. 该方法以交叉特征融合的方式合并编码器输出的多尺度特征, 在融合高层语义信息时使用复合卷积注意力模块进行处理, 避免上采样操作造成的特征信息丢失以及引入噪声的影响, 细化目标边缘分割效果. 同时提出了深度可分离残差卷积, 在此基础上设计并实现了结合残差的金字塔池化模块——RASPP, 对交叉融合后的特征进行处理, 获得不同尺度的上下文信息, 增强特征语义表达. 最后, 将RASPP模块处理后的特征进行合并, 提升分割效果. 在Cityscapes和CamVid数据集上的实验结果表明, 本文提出方法相比现有方法具有更好的表现, 并且对场景中的目标边缘有更好的分割效果.

    • 基于场矩阵分解机和CNN的点击率预测模型

      2024, 33(1):87-98. DOI: 10.15888/j.cnki.csa.009353 CSTR:

      摘要 (377) HTML (605) PDF 1.83 M (1129) 评论 (0) 收藏

      摘要:点击率预测是在线广告和推荐系统的基本任务之一. 主流模型通常通过对高阶和低阶特征进行特征交互建模来提升性能和泛化能力. 然而, 许多模型往往仅学习每个特征的固定表示, 而忽视了特征在不同上下文中的重要性, 并且一些模型结构过于简单. 因此, 本文提出了特征细化卷积神经网络融合场矩阵分解机(FRCNN-F)模型, 以解决这些问题. 首先, 在特征细化网络(FRNet)中融合了卷积神经网络的特征生成模块, 利用其在局部模式下重新组合生成新特征的优势, 提升了重要特征选择能力. 其次, 设计了场矩阵分解机, 使模型能够感知上下文并通过不同场的交互进行显示建模, 从而增加了子模型的组合方式. 最后, 通过在 Frappe 和 MovieLens 两个公开数据集上对比实验, 实验结果表明, FRCNN-F模型相比基线FRNet在AUC得分分别提升了0.32%和0.40%, 交叉熵损失函数Logloss分别降低了1.50%和1.11%. 该研究对于实现广告的精准投放和个性化推荐具有实际应用的价值.

    • 基于并行双通道时空网络的流量数据修复技术

      2024, 33(1):99-109. DOI: 10.15888/j.cnki.csa.009366 CSTR:

      摘要 (395) HTML (688) PDF 3.30 M (1344) 评论 (0) 收藏

      摘要:流量数据丢失是网络系统中常见的问题, 通常由传感器故障、传输错误和存储丢失引起. 现有的数据修复方法无法学习流量数据的多维特征, 因此本文提出了一种结合双向长短期记忆网络与多尺度卷积网络的双通道并行架构(ST-MFCN)用于填补流量数据的缺失值, 同时设计了一种新的对抗性损失函数进一步提高预测精度, 该模型有效地学习流量数据的时间特征和动态空间特征. 本文在Web traffic time series数据集上对模型进行测试, 并与现有的修复方法进行对比, 实验结果表明, ST-MFCN能够减少数据恢复的误差, 提升了数据修复的精确度, 为网络系统中的流量数据修复提供了一种稳健高效的解决方案.

    • 基于双分支编码的闭环分割网络

      2024, 33(1):110-118. DOI: 10.15888/j.cnki.csa.009371 CSTR:

      摘要 (436) HTML (753) PDF 2.44 M (1657) 评论 (0) 收藏

      摘要:Transformer模型中, 卷积视觉转换器(CvT)具备同时提取图像的局部和全局特征的能力而受到关注. 对于腹部器官分割问题, 为了解决CNN模型分割目标边界轮廓模糊不清的问题, 提出了一种新颖的基于CvT和CNN的双分支闭环分割模型DBLNet. 模型利用形状先验和预测结果的分割轮廓显式监督并指导网络学习过程. 模型包括: 轮廓提取编码模块(CEE)、边界形状分割网络(BSSN)和闭环结构. CEE模块首次利用改造的3D CvT和3D门控卷积层(GCL)捕获多层级轮廓特征, 并辅助BSSN训练. BSSN模块设计形状特征融合模块(SFF)同时捕获目标区域和轮廓特征, 推动CEE训练拟合. 闭环结构使得双分支的分割结果互相反馈并辅助对方的训练. DBLNet在BTCV排行榜上测试, 平均Dice得分为0.878, 排名第13位; 在临床医院数据进行应用测试, 表现出强大的性能.

    • 跨模态融合的双注意力脑肿瘤分割算法

      2024, 33(1):119-126. DOI: 10.15888/j.cnki.csa.009361 CSTR:

      摘要 (570) HTML (629) PDF 1.78 M (1591) 评论 (0) 收藏

      摘要:针对脑肿瘤多模态信息融合不充分以及肿瘤区域细节信息丢失等问题, 提出了一种跨模态融合的双注意力脑肿瘤图像分割网络(CFDA-Net). 在编码器-解码器的基础结构上, 首先在编码器分支采用密集块与大内核注意力并行的新卷积块, 可以使全局和局部信息有效融合且可以防止反向传播时梯度消失的问题; 其次在编码器的第2、3和4层的左侧加入多模态深度融合模块, 有效地利用不同模态间的互补信息; 然后在解码器分支使用Shuffle Attention注意力将特征图分组处理后再聚合, 其中分组的子特征一分为二地获取空间与通道的重要注意特征. 最后使用二进制交叉熵(binary cross entropy, BCE)、Dice Loss与L2 Loss组成新的混合损失函数, 缓解了脑肿瘤数据的类别不平衡问题, 进一步提升分割性能. 在BraTS2019脑肿瘤数据集上的实验结果表明, 该模型在整体肿瘤区域、肿瘤核心区域和肿瘤增强区域的平均Dice系数值分别为0.887、0.892和0.815. 与其他先进的分割方法ADHDC-Net、SDS-MSA-Net等相比, 该模型在肿瘤核心区域和增强区域具有更好的分割效果.

    • UMTS-Mixer: 基于时间相关性和通道相关性的时间序列异常检测

      2024, 33(1):127-133. DOI: 10.15888/j.cnki.csa.009347 CSTR:

      摘要 (452) HTML (858) PDF 1.76 M (1625) 评论 (0) 收藏

      摘要:多变量时间序列的异常检测是一个具有挑战性的问题, 要求模型从复杂的时间动态中学习信息表示, 并推导出一个可区分的标准, 该标准能从大量正常时间点识别出少量的异常点. 但在时间序列分析中仍存在多变量时间序列复杂的时间相关性和高维度使得异常检测性能较差的问题, 针对上述问题, 本文提出了一种基于MLP (multi-layer perceptron)架构的模型(UMTS-Mixer), 由于MLP的线性结构对顺序敏感, 将其用来捕获时间相关性和跨通道相关性. 大量实验表明UMTS-Mixer能够有效地检测时间序列异常, 并在4个基准数据集上的表现更好, 同时, 在MSL和PSM两个数据集上取得了最高的F1, 分别为91.35%, 92.93%.

    • 基于YOLO的钢缆表面损坏检测

      2024, 33(1):134-140. DOI: 10.15888/j.cnki.csa.009364 CSTR:

      摘要 (713) HTML (746) PDF 1.54 M (1252) 评论 (0) 收藏

      摘要:为了解决检测钢缆表面损坏时检测设备资源有限、时间过长等问题, 将深度学习的先进技术以及卷积神经网络(CNN)应用于钢缆表面损坏检测. 提出了一种基于YOLO的缺陷检测网络模型, 将GhostNet融入主干网络, 并基于ShuffleNet及注意力机制提出了新的特征提取模块(ShuffleC3), 再对Head部分进行剪枝改进. 实验结果表明, 改进后网络相比基线YOLOv5s的平均精度提高1.1%, 参数量和计算量分别降低了43.4%和31%, 模型大小减少了42.3%. 可以在降低网络计算成本的同时, 保持较高的识别精确度, 更好地满足了对钢缆材料表面损坏检测的要求.

    • IUINet: 基于Shift的双流映射3D医学分割模型

      2024, 33(1):141-147. DOI: 10.15888/j.cnki.csa.009374 CSTR:

      摘要 (384) HTML (629) PDF 1.31 M (1131) 评论 (0) 收藏

      摘要:为了提高特征融合, 我们设计了动态全连接层(DyFC), 该方法重新定义了权重和偏置, 使用基向量来代表新的权重和偏置, 基向量的系数是根据每一个输入特征进行学习得到的, 权重和偏置不再是共享的, 而是特有的, 这对于每一个特征的表达更具有专向性. 在本文中, 我们提出了一种双流映射结构模型IUINet. IUINet是通过3DShift操作、空间可分离卷积的组合来实现医学图像分割任务, 同时保持精度和效率之间的平衡. 所提出来的IUINet遵循编码器-解码器结构, 其中编码器一部分包含Shift操作、逐点Conv1×1操作, 另一部分包含空间可分离卷积操作. IUINet运用了多尺度输入以及多尺度特征映射层, 提高反向传播速度, 降低反向传播的平均距离. 提高模型的精确度, 增加模型泛化能力, 减少过拟合.

    • 增强蒲公英算法优化乳腺癌图像多阈值分割

      2024, 33(1):148-156. DOI: 10.15888/j.cnki.csa.009357 CSTR:

      摘要 (486) HTML (718) PDF 2.20 M (1374) 评论 (0) 收藏

      摘要:针对显微镜下乳腺癌病理组织图像结构复杂, 细胞边界模糊等情况, 基于传统的阈值分割在乳腺癌图像的分割应用中不能很好地实现把病灶区准确分离开来的问题, 提出一种基于增强蒲公英优化算法(IDO)的乳腺癌图像多阈值分割方法. 该方法引入IDO计算类间方差的最大值(Otsu)作为目标函数寻找最佳阈值, IDO建立回守策略解决传统蒲公英算法(DO)无限制搜索, 超出像素范围的问题; 引入对立式学习(OBL)避免算法陷入局部最优. 实验结果表明, 与哈里斯鹰算法(HHO)、人工猩猩部队优化算法(GTO)、传统蒲公英优化算法(DO)、海洋捕食者算法(MPA)相比, 在相同阈值个数情况下IDO算法适应度值最大、收敛最快, 并且在峰值信噪比(PSNR)、结构相似度(FSIM)、特征相似度(SSIM)这3个性能指标上也比其他对比算法更具有优势.

    • 无人机辅助MEC系统中面向用户公平性的三维部署和卸载优化

      2024, 33(1):157-166. DOI: 10.15888/j.cnki.csa.009373 CSTR:

      摘要 (533) HTML (666) PDF 2.05 M (1593) 评论 (0) 收藏

      摘要:针对无人机辅助移动边缘计算系统存在的用户公平性不足问题, 本文提出了一种面向用户公平性的三维部署和卸载优化算法. 该算法综合考虑用户匹配、无人机三维部署、计算资源分配、卸载因子对系统总时延及用户公平性的影响, 建立了一个最小化系统总时延的多元优化问题, 并针对该问题提出了一种两阶段联合优化算法, 其中第1阶段使用带有平衡约束的聚类算法解决用户匹配和无人机的水平部署问题, 第2阶段使用凸优化算法迭代求解无人机高度部署, 资源分配和卸载因子优化问题. 实验结果表明, 与4种基准算法相比, 所提算法在系统总时延和用户公平性两方面具有更好的性能.

    • 大数据环境下多模态融合的大学生异常行为预警

      2024, 33(1):167-176. DOI: 10.15888/j.cnki.csa.009310 CSTR:

      摘要 (679) HTML (675) PDF 2.93 M (2130) 评论 (0) 收藏

      摘要:针对“校园大数据”累积的海量数据呈现出离散性、稀疏性等问题, 如何从基数大、活动广、个性强的校园学生群体中检测出潜在的、有异常行为的学生, 已成为学生异常行为分析亟需解决的问题. 本文提出了一种大数据环境下基于多模态融合的大学生异常行为预警方法(early warning method for abnormal behavior of college students based on multi-modal fusion in big data environment, EWMAB). 首先, 针对学生行为画像的表征不够丰富, 行为标签存在时效性、动态性等问题, 建立一种基于多模态特征深度学习的跨模态学生行为画像模型; 其次, 针对学生异常行为预测、预警的时效性和后置性问题, 在学生行为画像和学生行为分类预测基础上, 提出了一种基于多模态融合的学生异常行为预警方法, 通过长短期记忆神经网络(long and short term memory networks, LSTM), 结合学生行为多指标数据和文本信息来解决学生异常行为预警问题; 最后, 本文通过应用实例验证模型以学生学习成绩异常预警为例, 与其他预警算法相比, EWMAB方法可以提高预警的准确性, 实现学生异常行为预警的时效性和前置性, 从而使学生教育工作更具有针对性、个性化和预测性.

    • 基于自注意力机制的点云分类分割

      2024, 33(1):177-184. DOI: 10.15888/j.cnki.csa.009341 CSTR:

      摘要 (569) HTML (845) PDF 1.63 M (1702) 评论 (0) 收藏

      摘要:3D点云由于其无序性以及缺少拓扑信息使得点云的分类与分割仍具有挑战性. 针对上述问题, 我们设计了一种基于自注意力机制的3D点云分类算法, 可学习点云的特征信息, 用于目标分类与分割. 首先, 设计适用于点云的自注意力模块, 用于点云的特征提取. 通过构建领域图来加强输入嵌入, 使用自注意力机制进行局部特征的提取与聚合. 最后, 通过多层感知机以及解码器-编码器的方式将局部特征进行结合, 实现3D点云的分类与分割. 该方法考虑了输入嵌入时单个点在点云中的局部语境信息, 构建局部长距离下的网络结构, 最终得到的结果更具区分度. 在ShapeNetPart、RoofN3D等数据集上的实验证实所提方法的分类与分割性能较优.

    • 多维注意力机制改进燃气负荷预测

      2024, 33(1):185-191. DOI: 10.15888/j.cnki.csa.009365 CSTR:

      摘要 (435) HTML (618) PDF 1.35 M (1344) 评论 (0) 收藏

      摘要:燃气负荷预测是一项让城市安全经济地调配燃气的重要的工作. 目前, 基于注意力机制的Seq2Seq模型越来越多地应用于燃气数据预测, 是一种有效的燃气负荷预测方法. 然而, 针对燃气负荷数据这种突变频率高、幅度大的特点, 一般基于注意力机制的Seq2Seq模型难以提取数据中的多维时间模式信息与应对数据随机突变情况, 在处理影响因素复杂的燃气负荷的预测问题时仍然需要改进. 为此, 本文提出多维注意力机制Seq2Seq模型. 一方面设计研究了多层次时间注意力模块, 综合单时间步长、多时间步长的注意力计算提取数据中不同时间模式信息; 另一方面, 设计增加了局部历史注意力模块, 以改进模型中无法区分重要历史信息的缺陷, 使模型在预测时倾向于参考更为重要的历史信息. 本改进模型针对燃气负荷的独特特性, 具有较好的预测表现. 使用国内某市区的燃气消耗数据与2016年电工数学建模竞赛的电力负荷数据的实验结果表明, 本改进模型相对于一般注意力机制Seq2Seq模型, MAE分别降低了17%与9%.

    • 基于改进FPCC的实例分割算法

      2024, 33(1):192-198. DOI: 10.15888/j.cnki.csa.009367 CSTR:

      摘要 (362) HTML (683) PDF 1.78 M (1077) 评论 (0) 收藏

      摘要:3D点云实例分割是工业自动化中关键的预处理步骤. 然而, 在工业抓取场景中存在大量遮挡时, 3D点云的实例分割网络通常难以区分相似对象. 针对这一问题, 本文提出了一种基于FPCC的改进算法. 本算法有两个分支: 中心点分支, 用于推断实例的中心点, 以及嵌入式特征分支, 用于描述点的特征. 分割结果是使用聚类算法获得的. 特征增强(FEH)模块对中心点预测的准确性起着至关重要的作用. 该模块使用特征增强方法来提高预测的准确性, 并且进一步地针对中心点预测而进行了损失函数的修改. 实验结果表明, 改进后的算法相比于FPCC算法在Precision值和Recall值上分别提高了10%、15%.

    • 基于改进UNet3+的岩心图像颗粒提取算法

      2024, 33(1):199-205. DOI: 10.15888/j.cnki.csa.009375 CSTR:

      摘要 (414) HTML (835) PDF 1.61 M (1425) 评论 (0) 收藏

      摘要:在石油勘探过程中, 岩心颗粒是研究地质层序、评估油气含量以及认识地质构造的有效资料, 对岩心颗粒图像进行颗粒提取有利于地质研究人员后续的深入分析. 岩心颗粒图像通常存在颗粒边缘模糊、背景与颗粒色彩复杂的问题. 为了改善岩心颗粒提取的效果, 本文设计了一种基于改进UNet3+的岩心图像颗粒提取算法. 该算法在UNet3+的每个编码层后加入感受野模块(RFB)来扩大网络的感受野, 从而有效地解决网络因感受野受限而导致的分割精度低的问题, 并在RFB模块后嵌入了卷积块注意力模块(CBAM)使网络更加精确地聚焦于目标区域, 提高目标区域的特征权重. 实验结果表明, 改进后的算法在岩心颗粒图像上具有良好的分割效果, 相比原始UNet3+网络, 分别在mIoUmPAFWIoU上提升了5.43%、2.99%和5.34%.

    • 改进AOD-Net的道路交通图像去雾算法

      2024, 33(1):206-212. DOI: 10.15888/j.cnki.csa.009378 CSTR:

      摘要 (764) HTML (869) PDF 2.49 M (1629) 评论 (0) 收藏

      摘要:针对现有图像去雾算法在处理道路交通图像时无法同时兼顾去雾效果和实时性的问题, 本文以快速一体化网络去雾算法(AOD-Net)为基础进行改进. 首先, 在AOD-Net中添加SE通道注意力, 以自适应的方式分配通道权重, 关注重要特征; 其次, 引入金字塔池化模块, 扩大网络的感受野, 并融合不同尺度特征, 更好地捕捉图像信息; 最后, 使用复合损失函数同时关注图像像素信息和结构纹理信息. 实验结果表明, 改进后的AOD-Net算法对道路交通图像去雾后的峰值信噪比提升了2.52 dB, 结构相似度达到了91.2%, 算法复杂度和去雾耗时略微增加, 但仍满足实时要求.

    • 基于Delaunay三角网的克里金并行算法优化

      2024, 33(1):213-218. DOI: 10.15888/j.cnki.csa.009363 CSTR:

      摘要 (410) HTML (648) PDF 1.69 M (1245) 评论 (0) 收藏

      摘要:当采样点数据量较大时, 可以采用Delaunay三角剖分建立三角网来使用局部邻域采样点进行克里金插值. 但是该算法需要对每个插值点拟合半变异函数, 插值点规模大时造成巨大开销. 为此, 本文提出了一种以三角形为单位拟合半变异函数的克里金插值方法, 采用CPU-GPU负载均衡将部分计算优化, 充分考虑不均匀样本对克里金插值效果的影响. 结果表明, 本文算法能够保证不均匀样本集的插值效果, 提升了计算性能且能够保证较高的精度.

    • 面向RGB-D语义分割的多模态任意旋转自监督学习

      2024, 33(1):219-230. DOI: 10.15888/j.cnki.csa.009362 CSTR:

      摘要 (537) HTML (749) PDF 3.86 M (1243) 评论 (0) 收藏

      摘要:基于RGB-D数据的自监督学习受到广泛关注, 然而大多数方法侧重全局级别的表示学习, 会丢失对识别对象至关重要的局部细节信息. 由于RGB-D数据中图像和深度具有几何一致性, 因此这可以作为线索来指导RGB-D数据的自监督特征表示学习. 在本文中, 我们提出了ArbRot, 它可以无限制地旋转角度并为代理任务生成多个伪标签用于自监督学习, 而且还建立了全局和局部之间的上下文联系. 本文所提出的ArbRot可以与其他对比学习方法联合训练, 构建多模态多代理任务自监督学习框架, 以增强图像和深度视图的特征表示一致性, 从而为RGB-D语义分割任务提供有效的初始化. 在SUN RGB-D和NYU Depth Dataset V2数据集上的实验结果表明, 多模态任意旋转自监督学习得到的特征表示质量均高于基线模型. 开源代码: https://github.com/Physu/ArbRot.

    • 深度学习在糖尿病视网膜病变分级中的应用

      2024, 33(1):231-244. DOI: 10.15888/j.cnki.csa.009368 CSTR:

      摘要 (427) HTML (1154) PDF 2.34 M (1739) 评论 (0) 收藏

      摘要:近年来, 糖尿病视网膜病变(diabetic retinopathy, DR)成为全球失明人口增加的主要原因, 早期的DR严重程度分级对防止DR患者视力丧失尤为重要. 由于糖尿病患者数量的逐年上升, DR分级的需求量也不断增加, 然而传统的人工分级不能满足日益增长的需求, 且人工分级耗时费力. 深度学习技术的发展, 为DR检测和分级提供了高效率且更可靠的手段. 虽然, 目前的DR二元检测已经取得十分好的效果, 然而由于糖尿病视网膜病变的复杂性和病变程度之间的差距细微, DR严重程度分级仍然是一个具有挑战性的问题. 本文对近年来涌现的DR分级方法进行了研究和总结: 介绍了基于VGG、InceptionNet、ResNet、EfficientNet、DenseNet、CapsNet模型的6种深度学习分级方法; 并介绍了基于多网络融合的DR分级方法; 最后对基于深度学习的DR分级方法的研究趋势进行总结和展望.

    • 基于输入特征稀疏化的图神经网络训练加速

      2024, 33(1):245-253. DOI: 10.15888/j.cnki.csa.009283 CSTR:

      摘要 (502) HTML (846) PDF 1.57 M (1374) 评论 (0) 收藏

      摘要:图神经网络(graph neural network, GNN)是处理图数据的重要方法. 由于计算复杂、图数据容量大, 在大规模图上训练图神经网络依赖于CPU-GPU协作和图采样训练方法, 其中图结构和特征数据存储在CPU内存中, 而采样得到的子图及其特征则传输至GPU进行训练. 然而, 这种方法面临着严重的图特征数据加载瓶颈, 显著降低了端到端训练性能, 且图特征占用过多内存, 严重限制了可训练的图规模. 为了解决这些问题, 我们提出了基于输入特征稀疏化的数据加载方法, 显著减少CPU内存占用和跨PCIe总线传输的数据量, 大幅缩短数据加载时间, 加速GNN的训练, 使其可以充分利用GPU计算资源. 针对图特征和GNN计算特性, 我们提出了适用于图特征数据的稀疏化方法, 在压缩比和模型准确度之间达到平衡. 我们在3个常见GNN模型和3个不同规模的数据集上进行了实验评估, 包括最大的公开数据集之一MAG240M. 结果表明, 此方法将特征尺寸减小了一个数量级以上, 并实现1.6–6.7倍的端到端训练加速, 而模型准确度的降低不超过1%. 此外, 在仅使用4个GPU的情况下, 仅需40 min就可以在MAG240M上完成GraphSAGE模型的训练并达到目标准确度.

    • 基于加权多头并行注意力的局部遮挡面部表情识别

      2024, 33(1):254-262. DOI: 10.15888/j.cnki.csa.009352 CSTR:

      摘要 (465) HTML (613) PDF 1.58 M (1163) 评论 (0) 收藏

      摘要:面部表情识别在诸多领域具有广泛的应用价值, 但在识别过程中局部遮挡会导致面部难以提取有效的表情识别特征, 而局部遮挡的面部表情识别可能需要多个区域的表情特征, 单一的注意力机制无法同时关注面部多个区域特征. 针对这一问题, 本文提出了一种基于加权多头并行注意力的局部遮挡面部表情识别模型, 该模型通过并行多个通道-空间注意力提取局部未被遮挡的多个面部区域表情特征, 有效缓解了遮挡对表情识别的干扰, 大量的实验结果表明, 本文的方法相比于很多先进的方法取得了最优的性能, 在RAF-DB和FERPlus上的准确率分别为89.54%、89.13%, 在真实遮挡的数据集Occlusion-RAF-DB和Occlusion-FERPlus的准确率分别为87.47%、86.28%. 因此, 本文的方法具有很强的鲁棒性.

    • 高铁场景中基于DASH协议的流媒体自适应云协同传输方法

      2024, 33(1):263-271. DOI: 10.15888/j.cnki.csa.009382 CSTR:

      摘要 (348) HTML (666) PDF 1.53 M (1411) 评论 (0) 收藏

      摘要:高铁逐渐成为流行的出行选择, 高铁途中用户对流媒体服务有着较高的需求. 但是高速移动场景下用户带宽抖动严重、用户的媒体体验难以得到保障. 为此, 本文提出了一种基于DASH协议的跨层流媒体自适应云协同传输优化方法. 首先提出了一个基于DASH协议的跨层流媒体自适应云协同传输架构, 并提出一个高铁环境下用户的QoE模型. 在此基础上构建了基于DASH的跨层流媒体自适应云协同传输的优化模型, 并提出了基于DASH协议的跨层流媒体云协同自适应码率选取算法, 提升用户的媒体体验. 最后仿真实验结果表明, 本文提出的方法能很好地提高高铁用户的媒体体验, 有助于高速移动场景下流媒体优化传输的研究.

    • 基于动态加权选举的委托权益证明共识机制改进

      2024, 33(1):272-279. DOI: 10.15888/j.cnki.csa.009354 CSTR:

      摘要 (398) HTML (574) PDF 1.55 M (1031) 评论 (0) 收藏

      摘要:面向委托权益证明共识机制中用户节点缺乏积极性、节点窜谋、难以抑制恶意节点出现、中心化风险变高等缺陷, 提出了一种基于动态加权选举的委托权益证明共识机制改进方案. 首先, 针对用户节点建立奖惩机制以激励用户参与选举活动, 同时引入用户节点地址聚类算法以发现具有相似投票行为的用户节点, 限制用户节点的不良投票行为. 使用改进熵权法对每一轮候选节点的特征动态计算权值, 再利用优劣解距离算法结合用户节点的投票情况对候选节点进行排序, 使选举结果更为合理. 随后, 在区块生产过程中动态调整生产节点的生产顺序以避免中心化风险. 最终通过仿真模拟验证了所提改进方案的可行性与有效性, 结果表明, 所提方案能在激励用户节点的同时限制节点的不良行为, 有效降低恶意节点出现的概率并避免中心化风险.

    • 基于RoBERTa和T5的两阶段医学术语标准化

      2024, 33(1):280-288. DOI: 10.15888/j.cnki.csa.009370 CSTR:

      摘要 (533) HTML (643) PDF 1.36 M (1805) 评论 (0) 收藏

      摘要:医学术语标准化作为消除实体歧义性的重要手段, 被广泛应用于知识图谱的构建过程之中. 针对医学领域涉及大量的专业术语和复杂的表述方式, 传统匹配模型往往难以达到较高的准确率的问题, 提出语义召回加精准排序的两阶段模型来提升医学术语标准化效果. 首先在语义召回阶段基于改进的有监督对比学习和RoBERTa-wwm提出语义表征模型CL-BERT, 通过CL-BERT生成实体的语义表征向量, 根据向量之间的余弦相似度进行召回并得到标准词候选集, 其次在精准排序阶段使用T5结合prompt tuning构建语义精准匹配模型, 并将FGM对抗训练应用到模型训练中, 然后使用精准匹配模型对原词和标准词候选集分别进行精准排序得到最终标准词. 采用ccks2019公开数据集进行实验, F1值达到了0.9206, 实验结果表明所提出的两阶段模型具有较高的性能, 为实现医学术语标准化提供了新思路.

    • 基于知识图谱的双端知识感知图卷积推荐模型

      2024, 33(1):289-296. DOI: 10.15888/j.cnki.csa.009383 CSTR:

      摘要 (444) HTML (800) PDF 1.38 M (1253) 评论 (0) 收藏

      摘要:针对现有基于知识图谱的推荐模型仅从用户或项目一端进行特征提取, 从而缺乏对另一端的特征提取的问题, 提出一种基于知识图谱的双端知识感知图卷积推荐模型. 首先, 对于用户、项目及知识图谱中的实体进行随机初始化表征得到初始特征表示; 接着, 采用基于用户和项目的知识感知注意力机制同时从用户、项目两端在知识图谱中进行特征提取; 其次, 使用图卷积网络采用不同的聚合方式聚合知识图谱传播过程中的特征信息并预测点击率; 最后, 为了验证模型的有效性, 在Last.FM和Book-Crossing两个公开数据集上与4个基线模型进行对比实验. 在Last.FM数据集上, AUCF1分别比最优的基线模型提升了4.4%、3.8%, ACC提升了1.1%. 在Book-Crossing数据集上, AUCF1分别提升了1.5%、2.2%, ACC提升了1.4%. 实验结果表明, 本文的模型在AUCF1和ACC指标上比其他的基线模型具有更好的鲁棒性.

    • 基于深度可分离卷积和交叉注意力的水面污染识别

      2024, 33(1):297-303. DOI: 10.15888/j.cnki.csa.009381 CSTR:

      摘要 (436) HTML (673) PDF 1.56 M (1525) 评论 (0) 收藏

      摘要:水面污染严重影响水面景观和水体生态. 针对识别水面污染过程中水面场景复杂、小目标污染物特征难以提取等问题, 本文提出一种基于深度可分离卷积与交叉注意力算法模块(deep-wise convolution and cross attention, DCCA). 使用深度可分离卷积降低模型的参数量和计算量, 使用交叉注意力建立不同尺度特征图之间的关系, 使模型更好地理解上下文信息并提高识别复杂场景和小目标的能力. 实验结果表明, 添加DCCA模块后平均精确率提升了1.8%, 达到了88.7%. 并使用较少的显存占用提高了水面污染的检测效果.

当期目录


文章目录

过刊浏览

年份

刊期

联系方式
  • 《计算机系统应用》
  • 1992年创刊
  • 主办单位:中国科学院软件研究所
  • 邮编:100190
  • 电话:010-62661041
  • 电子邮箱:csa (a) iscas.ac.cn
  • 网址:http://www.c-s-a.org.cn/csa/home
  • 刊号:ISSN 1003-3254
  • CN 11-2854/TP
  • 国内定价:50元
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号