• 当期目录
  • 优先出版
  • 过刊浏览
  • 点击排行
  • 下载排行
  • 综述文章
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    2024,33(11):1-14, DOI: 10.15888/j.cnki.csa.009677, CSTR:
    摘要:
    为了解决图像采集过程中眼图消失和头部姿态估计不准确的问题, 利用基于非接触式的眼部信息获取方法采集人脸图像, 从单个图像帧中确定飞行员当前的注视方向. 同时, 针对现有网络忽略头部运动对视线造成遮挡所导致的分类效果不佳问题, 结合人脸图像与头部姿态特征, 通过改进的MobileViT模型提出一种用于飞行员注视区域分类的多模态数据融合网络. 首先提出了多模态数据融合模块解决特征拼接过程中尺寸不平衡导致的过拟合问题, 其次提出一种基于并行分支SE机制的逆残差块, 充分利用网络浅层的空间和通道特征信息, 并结合Transformer的全局注意力机制捕捉多尺度特征. 最后, 重新设计了Mobile Block结构, 使用深度可分离卷积降低模型复杂度. 利用自制数据集FlyGaze对新模型和主流基线模型进行对比, 实验结果表明, PilotT模型对注视区域0、3、4、5的分类准确率均在92%以上, 且对人脸发生偏转的情况具有较强适应力. 研究结果对提升飞行训练质量以及飞行员意图识别和疲劳评估具有实际应用价值.
    2024,33(11):15-26, DOI: 10.15888/j.cnki.csa.009681, CSTR:
    摘要:
    在多目标跟踪任务中, 外界噪声的干扰会导致传统方法的系统建模不可靠, 从而降低目标位置预测的准确性; 而密集人群引起的拥挤和遮挡问题则会严重影响目标外观的可靠性, 导致错误的身份关联. 为了解决这些问题, 本文提出一种多目标跟踪算法Ecsort. 该算法在传统运动预测的基础上, 引入噪声补偿模块, 降低噪声干扰引起的误差, 提高位置预测的准确性. 其次, 引入特征相似度匹配模块, 通过学习目标的判别性外观特征, 并结合运动线索和判别性外观特征的优势, 从而实现精确的身份关联. 通过在多目标跟踪基准数据集上进行的大量实验结果表明, 与基线模型相比, 该方法在MOT17测试集上的IDF1 (ID F1 score)、HOTA (higher order tracking accuracy)、AssA (association accuracy)、DetA (detection accuracy)分别提高了1.1%、0.5%、0.6%、0.3%, 在MOT20测试集上的IDF1、HOTA、AssA、DetA分别提高了2.3%、1.9%、3.4%、0.2%.
    2024,33(11):27-37, DOI: 10.15888/j.cnki.csa.009682, CSTR:
    摘要:
    为了能够更准确且快速地识别人脸表情, 提出了一种优化的基于ResNet34网络的双线性结构(OBSR-Net)来进行人脸表情识别. OBSR-Net采用双线性网络结构作为整体框架, 主干网络使用ResNet34网络, 通过平移不变的方式对局部成对特征交互进行建模, 从而提取更加完整有效的特征, 同时采用迁移学习的策略来降低人脸表情小样本图像数据集对深度学习方法的限制. 此外, 在训练过程中使用一种新的通用优化技术, 即梯度集中. 该方法通过将梯度向量集中到零均值来直接对梯度进行操作, 可以看作是一种具有约束损失函数的投影梯度下降方法. OBSR-Net在Fer2013和CK+两个公开数据集上进行实验, 分别取得了77.65%和98.82%的识别准确率. 实验结果表明, 与其他先进的人脸表情识别方法相比, OBSR-Net表现出较强的竞争力.
    2024,33(11):38-47, DOI: 10.15888/j.cnki.csa.009702, CSTR:
    摘要:
    相比集中式的云计算框架, 边缘计算在云中心和现场智能设备之间部署了额外的“边缘服务器”, 支持现场智能设备快速、高效地完成运算任务和事件处理. 边缘计算系统中, 现场智能设备数量庞大、边缘计算服务器繁杂, 它们存储的数据敏感和私密性要求高. 边缘计算系统的这些特点, 给网络安全防护带来困难. 解决边缘计算系统的信息和网络安全是边缘计算技术大规模产业化的关键. 而由于边缘服务器设备和现场智能设备的计算能力、网络能力和存储能力的局限, 传统的计算机网络安全技术不能完全满足要求. 分析适合边缘计算系统的联邦学习、轻量加密、混淆与虚拟位置信息、匿名身份认证等有效的敏感数据保护技术, 以及探讨人工智能和区块链等新技术在边缘计算防范恶意攻击的应用, 助力边缘计算的产业化发展.
    2024,33(11):48-57, DOI: 10.15888/j.cnki.csa.009683, CSTR:
    摘要:
    随着深度学习技术的发展, 多数研究工作将短临降水预报视为雷达回波序列的预测任务. 由于降水复杂性的非线性时空变换, 现有的短临预报存在准确性低、外推时效短、难以应对复杂的非线性时空变换等缺点. 为解决以上问题, 本文基于U-Net和LSTM提出了S-UNet短临降水预报网络. 首先本文提出了S-UNet layer (SL)模块, 以帮助网络更好地提取雷达序列特征, 构建时空变化的整体趋势, 从而提高网络效率, 增加网络的外推时长. 其次, 为更好地应对雷达回波的变形、积累和消散的复杂性, 增强网络对复杂的空间关系的捕获能力和运动轨迹的模拟能力, 本文基于LSTM构建了雷达特征模块radar feature (RF). 最后, 将SL模块和RF模块与U-Net框架结合, 提出了S-UNet短临降水预报网络, 并在KNMI数据集上实现了先进的性能. 实验结果表明, 在KNMI的NL-50和NL-20数据集上, 本文所提的方法与主流方法相比, 海德克技能得分和关键成功指数分别提高了5.25% (6.57%)和2.17% (4.75%), 达到了0.30 (0.29)和0.72 (0.58); 准确率提高了2.10% (1.35%), 达到了0.80 (0.80); 假接受率降低了4.27% (1.80%), 达到了0.24 (0.38). 除此之外, 本文通过消融实验证明了所提出模块及结合方法的有效性.
    2024,33(11):58-67, DOI: 10.15888/j.cnki.csa.009678, CSTR:
    摘要:
    钢材表面缺陷的检测质量直接影响工业生产安全性和机器性能质量, 现实工厂钢材质量把控受限于设备条件, 在实现高精度强实时的检测效果仍面临着挑战. 为了解决这一问题, 提出一种多尺度融合的轻量级YOLOv8n检测算法. 首先引入一种结合HGnetv2与RepConv的轻量级多尺度融合主干网络(RepHGnetv2), 提高Backbone的特征提取能力与泛化能力同时降低了模型的复杂度; 在Head部分, 利用ADown下采样模块替换原算法的普通卷积(Conv), 降低计算量并提高语义保留能力; 最后将原算法的Loss函数替换为SlideLoss, 改善样本之间不平衡的问题. 在NEU-DET数据集上进行消融与对比实验, 改进算法与原算法相比, mAP@0.5提升6.7%, Precision提升9.3%, 模型大小下降25.5%, 计算量下降了17.2%, FPS也有一定的提升; 并在VOC2012数据集上进行了通用性对比实验, 实验结果表明改进算法可以有效提高缺陷检测精度与效率, 同时具有较好的通用性.
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009687
    摘要:
    深度强化学习算法在无人机的航迹规划任务中的应用越来越广泛, 但是许多研究没有考虑随机变化的复杂场景, 针对以上问题, 本文提出一种基于TD3改进的PP-CMNTD3算法, 提出了一种简单有效的先验策略并且借鉴人工势场的思想设计了密集奖励, 能够更好地引导无人机有效避开障碍物并且快速接近目标点. 仿真结果表明, 算法的改进可以有效提高网络的训练效率以及在复杂场景中的航迹规划表现, 同时能够在不同初始电量的情况下都能够灵活调整策略, 做到在能耗和迅速抵达目的地之间的有效平衡.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009692
    摘要:
    目前超分辨率重建技术运用于诸多场景, 但对于数字高程模型(digital elevation model, DEM)的重建存在许多挑战, 针对无法充分利用DEM复杂地形特征导致的细节缺失和失真问题, 提出了深度残差频率自适应的DEM超分辨重建模型, 由多个高低频特征提取模块组成残差网络结构, 提升对DEM特征的整体感知能力, 并加入频率选择特征提取模块, 增强对复杂地形特征的识别和捕捉能力, 其次在模型中加入了空洞空间金字塔池化, 通过融合多尺度信息, 改善重建质量并充分保留地形特征的细节和结构, 最终在梯度域和高度域双重约束下完成超分辨率重建. 实验结果表明, 在以两种精度的陕西秦岭高程图作为实验数据下, 深度残差频率自适应DEM超分辨率模型相较于其他先进模型, 在各个指标上均取得了提升, 重建后的DEM细节更加丰富、纹理更加清晰.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009698
    摘要:
    群体行为识别是计算机视觉领域中备受关注的研究方向之一, 旨在通过多个个体动作与互动关系确定整体的行为. 然而, 由于确定个体互动关系、联系紧密程度以及活动关键人物三者的困难, 现有方法常关注于人物的个体特征, 忽略了与活动场景上下文的相互联系. 针对该问题, 提出一个基于全局-个体特征融合的群体行为识别推理模型GIFFNet (global-individual feature fusion network). 通过构建全局-个体特征融合(GIFF)模块, GIFFNet在聚焦关键信息的基础上, 有效整合了场景上下文与个体人物特征, 获取了更具表征能力的融合特征, 以弥补预测群体行为时场景信息缺失的问题. 随后, GIFFNet利用融合特征计算场景中人物之间的交互关系图, 并使用图卷积网络(GCN)进行训练和群体行为类别预测. 此外, 为解决数据集样本失衡的问题, GIFFNet采用动态分配权重的策略优化损失函数. 实验结果表明, GIFFNet在Volleyball、Collective Activity数据集上的多类分类准确度分别为93.8%、96.1%, 类平均精确度分别为93.9%、95.8%, 优于其他现有的深度学习方法. GIFFNet通过特征融合为行为分类提供了表征能力更加强大的特征, 有效地提升了行为识别的精确度.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009718
    摘要:
    基于自注意力机制的Transformer端到端模型在语音识别任务中表现出了卓越的性能. 然而, 该模型在浅层处理时对局部特征信息的捕捉能力存在一定的局限, 同时也没有充分考虑不同块之间的相互依赖性. 为了解决这些问题, 提出了一种改进的Conformer-SE端到端语音识别系统模型. 该模型首先采用了Conformer结构来替代Transformer中的编码器部分, 从而增强了模型对局部特征的提取能力. 接着, 通过引入SE注意力通道机制, 将每个块的输出以加权求和的形式整合到最终的输出中. 在Aishell-1这一公开数据集上的实验结果显示, 相较于原始的Transformer模型, Conformer-SE模型在字符错误率上相对降低了18.18%.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009720
    摘要:
    模型量化方法现已广泛应用于深度神经网络模型快速推理和部署中. 由于训练后量化重新训练所需时间少, 性能损失小而备受研究人员关注, 但现有训练后量化方法在量化过程中大多以理论假设或是固定分配网络层的比特位宽, 导致量化后的网络会出现显著的性能损失, 尤其是在低位情况下. 为了提升训练后量化网络模型的精度, 本文提出一种新颖的训练后混合精度量化方法(MSQ), 该方法通过在网络模型每一层后插入一个融合了金字塔池化模块和权值印记技术的任务预测器模块, 来对网络每一层进行准确度估计, 从而评估每一层网络的重要性, 根据重要性评估来确定每一层的量化比特位宽. 实验表明, 本文所提出的MSQ算法在多个流行的网络架构上都优于现有的一些混合精度量化方法, 量化后的网络模型在边缘硬件设备上测试性能更好, 延迟更低.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009714
    摘要:
    Hadoop系统作为大数据存储的分布式架构被广泛使用, 运行时生成大量日志数据来记录设备的异常情况, 这为定位和分析问题提供重要线索. 然而, 传统的日志异常检测模型通常在中心服务器上收集日志数据, 导致数据收集过程中存在敏感信息泄露的风险. 联邦学习作为一种新的机器学习范式, 通过在本地服务器上训练模型并仅在中心服务器上聚合模型参数, 有效解决了数据隐私问题. 本文提出了一种基于联邦学习的日志异常检测架构, 结合本地服务器和中心服务器进行检测任务, 避免了敏感信息在网络传输过程中的泄露风险. 此外, 本文采用树解析器实现日志模板标准化. 为了有效地捕获日志数据中的复杂模式和异常行为, 建立基于自注意力机制的BiLSTM模型作为本地服务器模型. 为了验证所提出方法的有效性, 本文使用公开的分布式系统架构数据集进行仿真实验. 结果表明, 该模型的综合评价指标稳定, 准确率保持在93%以上, 具有较高的适用性.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009715
    摘要:
    针对 QR 码图像检测过程中因环境复杂性和拍摄角度变化等因素导致 QR 码读取率低的问题, 本文提出一种基于改进YOLOv8n-Pose的形变QR码校正与识别算法. 首先, 在主干网络引入高效通道注意力机制(efficient channel attention, ECA)模块, 该模块通过不降维的方式实现跨通道交互, 有效提升网络的特征提取能力和检测精度. 其次, 采用Slim-neck架构重构颈部网络, 减少模型的复杂度, 提高对不同尺度QR码的检测能力. 最后, 通过模型检测到的QR码角点, 结合逆透视变换对QR码进行校正, 并使用ZBar算法进行读取. 实验结果表明, 在公开的QR码数据集上, 改进的算法相比原算法, mAP50和mAP50-95分别提升1.6%和1.1%, 模型参数量和模型计算量分别降低6.5%和9.5%, 在CPU和GPU上检测速度分别提升0.3 f/s和0.7 f/s, 达到14.2 f/s和59.6 f/s, 能够高效地满足QR码角点检测需求. 此外, 在自制的形变QR 码数据集上, 基于改进YOLOv8n-Pose的QR码识别方法相比单独使用ZBar算法的QR 码识别方法, QR 码读取率提高23.66%, 达到87.41%. 该方法仅需拍摄一张照片就可识别所有货物的信息, 能够有效提高货物管理的效率.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009728
    摘要:
    剩余时间预测能够帮助企业提升业务流程执行的质量和效率. 尽管现有的深度学习方法在剩余时间预测上有一定提升, 但在处理复杂业务流程时, 仍面临时间特征利用不足和局部特征挖掘能力有限的问题, 预测精度有待提高. 为此, 本研究提出了一种基于改进Transformer编码器模型的剩余时间预测方法. 针对已有方法忽略事件时间特征以及难以捕捉局部依赖的不足, 本研究在模型中引入了时间特征编码模块和局部依赖增强模块. 时间编码模块通过嵌入学习和多粒度拼接方式, 构建了富有语义且具判别力的事件时间表示. 局部依赖增强模块采用卷积神经网络, 在Transformer编码器之后提取轨迹前缀的局部细节特征. 实验表明, 融合时间特征和局部依赖增强可以提升复杂业务流程剩余时间的预测准确性.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009716
    摘要:
    岩屑识别是地质勘探录井工作中的重要手段, 为了解决传统人工岩性识别效率低下和常见深度学习网络推理速度慢计算量大等问题, 本文借助于表现较好的短时密集串联网络模型, 提出了一种实时岩屑图像语义分割网络DAF-STDC. 该网络使用空洞卷积在提取特征过程中保持分辨率, 利用注意力机制帮助模型获取特征图中全局信息, 从而细化岩屑颗粒边缘信息, 使用特征融合模块加强低阶细节特征与高阶语义特征的融合程度, 帮助特征表达. 经实验证明, 改进后的网络模型在精度方面有了大幅提升, 在岩屑录井工作中收集到的6类岩屑图像, 制成的数据集RC_Dataset上, 平均交并比达到83.12%, 在保持参数量的同时, 推理速度和分割精度有了明显提升, 为岩屑录井数字化提供了有效参考.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009726
    摘要:
    针对当前众包平台面临的订单类型多样性(外卖订单与快递订单)和配送骑手的同质化(单一外卖型与单一快递型)问题, 且现有众包配送机制较少兼顾商家和顾客满意度, 在派单模式下考虑骑手的异质性, 通过引入全能型骑手, 将骑手划分为单一外卖型、单一快递型和全能型3类, 根据各类骑手可服务的订单类型差异, 构建基于模糊时间窗的商家和顾客对于骑手到达取送货点时间的满意度成本函数, 将商家和顾客的满意度转化为时间惩罚函数, 建立了以时间惩罚成本、路径行驶成本、人员运营成本最小化为目标的模型, 针对模型的特点以及传统算法存在的问题, 设计将遗传算法与大规模领域搜索算法相结合的混合算法, 随后通过具体算例, 采用模拟退火算法、遗传算法和混合算法分别进行求解, 通过不同算法的优化结果对比分析, 验证模型和改进算法的可行性和有效性. 实验结果表明: 在众包配送过程中合理考虑骑手异质性以及商家和顾客的满意度不仅能够有效提升商家和顾客满意度, 也能够降低众包平台配送成本和提高配送效率, 对于众包平台制定配送策略具有一定的参考意义.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009727
    摘要:
    计算机断层扫描产生的肝部影像为医生进行肝部病灶区域发现提供了素材. 但肝部病灶的人工检测严重依赖于医生的专业技能, 且费时费力. 现有的肝部病灶区域检测算法对细微病灶的检测效果欠佳. 为此, 本文提出了一种基于频率感知图像恢复的自监督肝部病灶检测算法. 首先, 此算法设计了一个基于合成异常的自监督任务, 用于合成更加广泛且适宜的伪异常图像, 从而缓解算法模型训练时异常数据不足的问题. 其次, 为了抑制重建网络对合成肝部异常的敏感性, 设计了提取图像高频信息的模块, 通过从图像的高频成分中恢复图像, 以减轻重建网络对异常的不利泛化. 最后, 其采用权重衰减训练策略以训练分割子网络, 减少训练前期的琐碎解问题, 实现局部细微病灶的检测. 在真实公开数据集上进行的大量实验表明, 本文方法在肝部病灶检测任务中取得了领先的性能.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009705
    摘要:
    多智能体协同在强化学习研究领域占据重要地位, 旨在深入探讨智能体如何通过相互协作实现共同目标. 大部分协作多智能体算法注重合作的构建, 但忽略了个体策略的强化. 为解决上述问题, 本文提出一种BiTransformer记忆(BTM)在线强化学习模型, 该模型不仅考虑多智能体之间的协同, 还利用记忆模块辅助个体决策. BTM由双注意力编码器和双注意力解码器组成, 分别用于个体策略的增强和多智能体系统的协作. 在双注意力编码器中, 受人类的决策经验依赖的启发, 提出记忆注意力模块为当前决策提供历史决策经验. 与传统利用RNN的方法不同, BTM为每一个提供的是一个显式历史决策经验库, 而非隐藏单元. 此外, 提出融合注意力模块, 在历史决策经验的辅助下处理当下的局部观测信息, 从而获取环境中最具决策价值的信息, 进一步提高智能体个体的决策能力. 在双注意力解码器中, 本文提出了决策注意力模块和合作注意力模块两个模块, 通过综合考虑其他已经做出决策智能体与当前智能体的合作收益以及带有历史决策经验的局部观察, 从而促进历史决策辅助下的多智能体潜在合作的形成. 最终本文在星际争霸中的多个场景下对BTM进行了测试, 取得了93%的平均胜率.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009707
    摘要:
    航段和航路点对网络正常运行具有重要意义, 正确识别关键航段和关键航路点, 并分析各个指标对航段或航路点的重要程度的关联程度有利于针对性地提升航路网络的抗打击能力. 为改善航路网络对各种突发情况的弱“抵抗力”情况, 从静态指标和动态指标两个方面入手, 采用熵权法从数据本身的波动程度出发确定静态指标和动态指标的权重, 并采用优劣解距离法通过计算连边的最优和最劣解, 得到各个航段和航路点的综合得分. 并继续分析各个指标之间及指标与航段或航路点综合得分之间的关联度, 结果表明各个指标之间都相对独立, 但各个指标与航段或航路点得分的关联度较高, 该结论为航路网络结构优化提出改进依据.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009708
    摘要:
    皮肤癌是最常见和最致命的癌症类型之一, 患病数量在世界范围内急剧增加. 如果没有在早期阶段诊断出来, 它可能转移, 导致高死亡率. 结合近几年的相关文献就传统机器学习和深度学习两种学习方法在皮肤癌病变诊断中的应用作一系统综述, 为皮肤癌诊断的深入研究提供相应的参考价值, 首先对几个皮肤病公共可获取数据集进行整理, 其次分析和比较不同的学习算法在皮肤癌病变分类中的应用, 更好地了解它们在实际应用中的优势和局限性, 重点阐述在卷积神经网络领域的分类诊断. 在深入了解这些算法的基础上, 还将探讨它们在处理皮肤疾病时的性能差异、改进思路. 最终, 通过对当前挑战和未来发展方向的探讨, 将为进一步提升皮肤癌早期诊断系统的性能和可靠性提供有益的参考和建议.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009711
    摘要:
    在移动边缘计算(mobile edge computing, MEC)背景下, 不合理的任务卸载策略和资源分配以及多类型任务数量急剧增加导致边缘服务器间的负载不均衡. 针对上述问题, 本文基于多用户多MEC的边缘环境, 提出一种面向多类型任务的负载预测以及均衡分配方案(load prediction and balanced assignment scheme for multi-type tasks, LBMT). 该方案包括划分任务类型, 任务负载预测, 任务自适应映射3个部分. 首先, 考虑任务类型的多样性设计了任务类型模型, 利用该模型划分任务类型. 其次, 考虑不同任务对服务器造成的负载具有差异性提出了任务负载预测模型, 并在此基础上采用改进KNN (K-nearest neighbor)算法用于预测任务负载. 然后, 综合考虑MEC服务器异构性、资源有限等因素, 结合MEC服务器负载均衡模型设计了任务分配模型, 并提出基于自适应任务映射算法用于任务分配. 最后, LBMT针对MEC服务器资源利用率和任务处理率进行优化, 得到最优负载均衡任务卸载策略. LBMT与基于改进的min-min卸载方案、基于中间节点的卸载方案、基于加权二分图的卸载等方案进行仿真实验对比, 实验结果表明LBMT在资源利用率上提高了12.5%以上, 任务处理率提高了20.3%以上, 并显著降低了负载均衡标准差值, 更有效的实现了服务器之间的负载均衡.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009694
    摘要:
    针对变电站仪表背景复杂、多旋转角度图像导致读数识别准确率低的问题, 提出一种基于YOLOv8和改进UNet++的指针式仪表读数识别方法. 采用YOLOv8模型检测仪表区域, 并利用透视变换进行旋转校正; 采用极化自注意力模块改进的UNet++算法分割表盘图像提取刻度、指针区域; 经过提取指针直线后, 采用角度法计算仪表读数. 实验结果表明: 提出方法识别仪表读数的平均引用误差为1.82%, 具有较高的识别准确性, 将其应用于变电站指针式仪表智能化巡检中具有一定的可行性.
    优先出版日期:  2024-10-31 , DOI: 10.15888/j.cnki.csa.009597
    摘要:
    由于电动车的普及, 越来越多的电动车进行非法改装雨棚. 然而, 这种改装行为会增加一些安全隐患. 首先, 挡雨板会遮挡骑行者视野, 增加事故的风险. 其次当速度过快时, 挡雨板也会在不经意间擦伤行人, 带来极大地安全隐患, 给交通安全带来了严重威胁. 本文提出了一种改进的YOLOv7-tiny算法, 用于电动车非法改装检测. 首先在网络的结构上加入BiFormer注意力机制, 不仅可以捕获更多电动车细节的信息, 而且可以使得模型更加关注一些较小的目标信息. 其次将改进的特征金字塔结构和特征融合网络的张量拼接操作进行结合, 提升对中小型目标的检测能力. 最后对框架的ELAN模块和SPPCSPC模块进行改进和优化, 可以在不增加过多参数量的同时, 提升对中小目标的检测精度, 增强提取特征的效果.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009684
    摘要:
    水下目标检测技术在海洋探测中具有重要的现实意义. 针对水下场景复杂, 以及存在遮挡重叠导致目标特征提取有限的问题, 提出了一种适用于水下目标检测的FERT-DETR网络. 该模型首先提出了一种特征提取模块Faster-EMA, 用于替换RT-DETR中ResNet18的BasicBlock, 能够在有效降低模型的参数量和模型深度的同时, 显著提升对水下目标的特征提取能力; 其次在编码部分使用级联群体注意力模块AIFI-CGA, 减少多头注意力中的计算冗余, 提高注意力的多样性; 最后使用高水平筛选特征金字塔HS-FPN替换CCFM, 实现多层次融合, 提高检测的准确性和鲁棒性. 实验结果表明, 所提算法FERT-DETR在URPC2020数据集和DUO数据集上较RT-DETR检测准确率提高了3.1%和1.7%, 参数量压缩了14.7%, 计算量减少了9.2%, 能够有效改善水下复杂环境中不同尺寸目标漏检、误检的问题.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009696
    摘要:
    快速增长的安检需求推动了智能安检技术的发展, 由于X光图片的特殊性, 导致小目标违禁品检测难度大, 本文提出一种改进YOLOv8s的违禁品识别网络进行解决. 首先引入Focal L1 Loss函数改进CIoU, 优化预测框位置与长宽比, 以提高网络对于违禁品的标记能力. 将改进后的可变形卷积加入浅层主干网络中, 捕获不同方向上的违禁品特征信息. 在SPPF模块加入LSKA扩大网络感受野, 并使用Swin-CS模块捕获全局信息、补充维度交互, 最后使用3种注意力堆叠的注意力块进行处理, 提高了网络对小目标的敏感性. 改进后的网络在SIXray数据集上的平均精度均值达到96.1%, 相比原有的YOLOv8s提高5.4%, mAP50-95达到0.682, 提高4.5%. 实验结果表明, 提出的模型能够准确给出预测框, 应对复杂场景中的违禁品检测, 证明了算法的有效性.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009690
    摘要:
    本文提出一种名为E2E-DRNet的模型, 旨在解决当前人工DR诊断的分类性能差、耗时费力以及视网膜图像等级差异小、病灶不明显等问题. 该模型基于EfficientNetV2, 并结合了有效通道注意力模块. 通过对DR数据集进行处理和优化, 引入了Focal Loss损失函数以解决样本不均衡问题, 并将模型分为两个阶段以实现DR分类的细分. 实验结果表明, 该方法在公开数据集和临床数据集上表现良好, 提高了对眼底病变区域的可解释性, 有助于提高DR病变的筛查效率, 克服了人工诊断的局限性.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009691
    摘要:
    DNS作为互联网基础设施, 很少受到防火墙的深度监控, 导致黑客和APT组织通过DNS隐蔽隧道来窃取数据或控制网络, 对网络安全造成严重威胁. 针对现有检测方案容易被攻击者绕过以及泛化能力较弱的问题, 本研究改进了DNS流量的表征方法, 并提出了PFEC-Transformer (pcap features extraction CNN-Transformer)模型. 该模型以表征后的十进制数值序列作为输入, 在经过CNN模块进行局部特征提取后, 再通过Transformer分析局部特征间的长距离依赖模式并进行分类. 研究采集了互联网流量以及各类DNS隐蔽隧道工具生成的数据包构建数据集, 并使用包含未知隧道工具流量的公开数据集进行泛化能力测试. 实验结果表明, 该模型在测试数据集上取得了高达99.97%的准确率, 在泛化测试集上也达到了92.12%的准确率, 有效地证明了其在检测未知DNS隐蔽隧道方面的优异性能.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009713
    摘要:
    盲文转换技术可以推进盲人群体的信息无障碍化进程, 有着相当的重要性. 随着信息全球化发展, 盲人不可避免地接触到包含中英双语的信息. 现有中英盲文转换系统能较好完成中英文字符到盲文的转换, 但是对标点的转换效果不佳, 表现为对一符多用情况区分效果不好、未对中英标点混用情况进行纠错两方面. 若未能恰当处理一符多用及中英标点混用情况, 很可能会对盲人阅读造成影响甚至误解. 本文详细分析以上问题, 设计并实现一种具有标点区分和纠错能力的中英盲文转换系统. 基于BCC语料库构建测试语料, 对该系统开展一系列测试和评估. 实验结果表明, 与其他类型转换系统相比, 本系统能够结合语言类型和上下文结构, 有效区分标点转换中的一符多用情况, 并能纠正中英标点混用问题, 对我国信息无障碍化进程起到促进作用.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009710
    摘要:
    随着工业自动化的不断发展, 工件的三维重建技术在制造业中扮演着越来越重要的角色. 在实际的工作环境下, 工件普遍存在堆叠问题, 对后续的机器人识别抓取等工作存在较大影响. 目前三维重建技术对于一些具有弱纹理区域的工件重建, 仍存在图像特征点提取难度大、特征配准精度低的问题. 针对以上问题, 本文提出了一种基于多视图立体匹配深度学习的堆叠工件三维重建方法. 首先, 输入多张不同视角的图像经过融合DCNv2的特征金字塔网络, 进行特征提取; 然后, 进行单应性变换构建代价体, 再使用方差聚合为一个统一的代价体; 接着在代价体正则化部分, 引入SE通道注意力机制模块来提高网络的特征表达能力, 增强模型的性能和泛化能力; 此方法在DTU (Danish Technical University)数据集上具有较好的表现, 并且运用该方法生成的堆叠工件点云模型对以后的工业自动化开展具有重要意义.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009706
    摘要:
    针对目前大多数推荐模型在特征交互时, 存在忽视特征重要程度使得推荐模型准确率不高的问题, 为此本文提出融合特征选择和交叉网络的增强推荐模型. 该模型采用SENet网络在特征交互前过滤不重要的特征, 使其挖掘到更有价值的交互信息. 在此基础上, 进一步使用并行的交叉网络和深度神经网络, 以捕捉显式特征交互和隐式特征交互. 同时, 在交叉网络中引入低秩技术, 将权重向量改进为低秩矩阵, 在保证模型性能的同时, 降低模型的训练成本. 该模型在MovieLens-1M、Criteo数据集上与其他推荐模型进行了对比实验, 实验结果表明所提推荐模型在AUC指标上明显优于其他模型, 证明了所提推荐模型的有效性.
    优先出版日期:  2024-10-25 , DOI: 10.15888/j.cnki.csa.009704
    摘要:
    基于深度学习的人工智能诊断模型严重依赖于高质量地详尽注释数据进行算法训练, 但受到标签噪声信息的影响. 为了增强模型的鲁棒性并防止有噪声的标签记忆, 提出了一种标签噪声样本选择 (noise label sample selection, NLSS)模型来充分挖掘噪声样本的隐藏信息, 减轻模型过拟合问题. 首先, 通过将混合增强图像作为输入, 提取图像分布式特征表示; 其次, 引入对比损失函数以及比较样本预测标签分布与其真实标签分布的相似性来评估样本, 进行样本选择; 最后, 通过标签重分配模块的伪标签提升策略在样本选择的基础上重新纠正噪声标签的监督信息. 以非小细胞肺癌 (non-small cell lung cancer, NSCLC)患者的 PET/CT 数据集为例进行实验, 结果表明提出的模型均比对比模型有一定的提升, 可降低淋巴结转移状态诊断中标签噪声的干扰.
    优先出版日期:  2024-09-24 , DOI: 10.15888/j.cnki.csa.009675
    摘要:
    随着无人机应用需求不断拓展, 为了保证无人机能够按要求完成预定任务, 抗干扰控制器的设计受到了诸多关注. 目前广泛使用的传统控制算法稳定性较好但抗干扰能力较差. 针对上述问题, 提出了一种基于改进双延迟深度确定性策略梯度(TD3)算法的混合抗干扰控制器, 该方法使用非线性模型预测控制(NMPC)作为基础控制器, 并引入了一个基于改进TD3的干扰补偿器进行混合控制. 该方法结合了NMPC控制器的优点的同时解决了传统控制算法在抗干扰方面的不足. 本文将多头注意力机制(MA)以及长短期记忆网络(LSTM)引入TD3的Actor网络中, 提高了TD3对于空间管理信息以及时间关联信息的捕捉能力, 同时引入一种连续型对数奖励函数来提高训练稳定性和收敛速度, 并使用带随机干扰的随机任务场景进行训练以提高模型泛化性. 在实验中将NMPC-MALSTM-TD3架构与使用DDPG、SAC、TD3、PPO算法作为干扰补偿器的架构进行对比, 实验结果表明, NMPC-MALSTM-TD3架构的综合表现最好, 而且对NMPC的稳定性和实时性影响较小.
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2000,9(2):38-41, DOI:
    [摘要] (12700) [HTML] (0) [PDF ] (22109)
    摘要:
    本文详细讨论了VRML技术与其他数据访问技术相结合 ,实现对数据库实时交互的技术实现方法 ,并简要阐述了相关技术规范的语法结构和技术要求。所用技术手段安全可靠 ,具有良好的实际应用表现 ,便于系统移植。
    1993,2(8):41-42, DOI:
    [摘要] (9752) [HTML] (0) [PDF ] (31913)
    摘要:
    本文介绍了作者近年来应用工具软件NU清除磁盘引导区和硬盘主引导区病毒、修复引导区损坏磁盘的 经验,经实践检验,简便有效。
    1995,4(5):2-5, DOI:
    [摘要] (9284) [HTML] (0) [PDF ] (14139)
    摘要:
    本文简要介绍了海关EDI自动化通关系统的定义概况及重要意义,对该EDI应用系统下的业务运作模式所涉及的法律问题,采用EDIFACT国际标准问题、网络与软件技术问题,以及工程管理问题进行了结合实际的分析。
    2016,25(8):1-7, DOI: 10.15888/j.cnki.csa.005283
    [摘要] (8873) [HTML] () [PDF 1167952] (38767)
    摘要:
    从2006年开始,深度神经网络在图像/语音识别、自动驾驶等大数据处理和人工智能领域中都取得了巨大成功,其中无监督学习方法作为深度神经网络中的预训练方法为深度神经网络的成功起到了非常重要的作用. 为此,对深度学习中的无监督学习方法进行了介绍和分析,主要总结了两类常用的无监督学习方法,即确定型的自编码方法和基于概率型受限玻尔兹曼机的对比散度等学习方法,并介绍了这两类方法在深度学习系统中的应用,最后对无监督学习面临的问题和挑战进行了总结和展望.
    2008,17(5):122-126, DOI:
    [摘要] (7932) [HTML] (0) [PDF ] (48451)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
    2011,20(11):80-85, DOI:
    [摘要] (7670) [HTML] () [PDF 863160] (42732)
    摘要:
    在研究了目前主流的视频转码方案基础上,提出了一种分布式转码系统。系统采用HDFS(HadoopDistributed File System)进行视频存储,利用MapReduce 思想和FFMPEG 进行分布式转码。详细讨论了视频分布式存储时的分段策略,以及分段大小对存取时间的影响。同时,定义了视频存储和转换的元数据格式。提出了基于MapReduce 编程框架的分布式转码方案,即Mapper 端进行转码和Reducer 端进行视频合并。实验数据显示了转码时间随视频分段大小和转码机器数量不同而变化的趋势。结
    1999,8(7):43-46, DOI:
    [摘要] (7324) [HTML] (0) [PDF ] (23799)
    摘要:
    用较少的颜色来表示较大的色彩空间一直是人们研究的课题,本文详细讨论了半色调技术和抖动技术,并将它们扩展到实用的真彩色空间来讨论,并给出了实现的算法。
    2012,21(3):260-264, DOI:
    [摘要] (6547) [HTML] () [PDF 336300] (45062)
    摘要:
    开放平台的核心问题是用户验证和授权问题,OAuth 是目前国际通用的授权方式,它的特点是不需要用户在第三方应用输入用户名及密码,就可以申请访问该用户的受保护资源。OAuth 最新版本是OAuth2.0,其认证与授权的流程更简单、更安全。研究了OAuth2.0 的工作原理,分析了刷新访问令牌的工作流程,并给出了OAuth2.0 服务器端的设计方案和具体的应用实例。
    2007,16(9):22-25, DOI:
    [摘要] (6523) [HTML] (0) [PDF ] (6754)
    摘要:
    本文结合物流遗留系统的实际安全状态,分析了面向对象的编程思想在横切关注点和核心关注点处理上的不足,指出面向方面的编程思想解决方案对系统进行分离关注点处理的优势,并对面向方面的编程的一种具体实现AspectJ进行分析,提出了一种依据AspectJ对遗留物流系统进行IC卡安全进化的方法.
    2022,31(5):1-20, DOI: 10.15888/j.cnki.csa.008463
    [摘要] (6446) [HTML] (3829) [PDF 2584043] (5492)
    摘要:
    深度学习方法的提出使得机器学习研究领域得到了巨大突破, 但是却需要大量的人工标注数据来辅助完成. 在实际问题中, 受限于人力成本, 许多应用需要对从未见过的实例类别进行推理判断. 为此, 零样本学习(zero-shot learning, ZSL)应运而生. 图作为一种表示事物之间联系的自然数据结构, 目前在零样本学习中受到了越来越多的关注. 本文对零样本图学习方法进行了系统综述. 首先概述了零样本学习和图学习的定义, 并总结了零样本学习现有的解决方案思想. 然后依据图的不同利用方式对目前零样本图学习的方法体系进行了分类. 接下来讨论了零样本图学习所涉及到的评估准则和数据集. 最后指明了零样本图学习进一步研究中需要解决的问题以及未来可能的发展方向.
    2011,20(7):184-187,120, DOI:
    [摘要] (6391) [HTML] () [PDF 731903] (33511)
    摘要:
    针对智能家居、环境监测等的实际要求,设计了一种远距离通讯的无线传感器节点。该系统采用集射频与控制器于一体的第二代片上系统CC2530 为核心模块,外接CC2591 射频前端功放模块;软件上基于ZigBee2006 协议栈,在ZStack 通用模块基础上实现应用层各项功能。介绍了基于ZigBee 协议构建无线数据采集网络,给出了传感器节点、协调器节点的硬件设计原理图及软件流程图。实验证明节点性能良好、通讯可靠,通讯距离较TI 第一代产品有明显增大。
    (), DOI:
    [摘要] (6220) [HTML] (19) [PDF ] (14)
    摘要:
    2004,13(10):7-9, DOI:
    [摘要] (6058) [HTML] (0) [PDF ] (11842)
    摘要:
    本文介绍了车辆监控系统的组成,研究了如何应用Rockwell GPS OEM板和WISMOQUIKQ2406B模块进行移动单元的软硬件设计,以及监控中心 GIS软件的设计.重点介绍嵌入TCP/IP协议处理的Q2406B模块如何通过AT指令接入Internet以及如何和监控中心传输TCP数据.
    2019,28(6):1-12, DOI: 10.15888/j.cnki.csa.006915
    [摘要] (6030) [HTML] (18966) [PDF 672566] (23986)
    摘要:
    知识图谱是以图的形式表现客观世界中的概念和实体及其之间关系的知识库,是语义搜索、智能问答、决策支持等智能服务的基础技术之一.目前,知识图谱的内涵还不够清晰;且因建档不全,已有知识图谱的使用率和重用率不高.为此,本文给出知识图谱的定义,辨析其与本体等相关概念的关系.本体是知识图谱的模式层和逻辑基础,知识图谱是本体的实例化;本体研究成果可以作为知识图谱研究的基础,促进知识图谱的更快发展和更广应用.本文罗列分析了国内外已有的主要通用知识图谱和行业知识图谱及其构建、存储及检索方法,以提高其使用率和重用率.最后指出知识图谱未来的研究方向.
    2008,17(1):113-116, DOI:
    [摘要] (5985) [HTML] (0) [PDF ] (49950)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(8):87-89, DOI:
    [摘要] (5911) [HTML] (0) [PDF ] (42033)
    摘要:
    随着面向对象软件开发技术的广泛应用和软件测试自动化的要求,基于模型的软件测试逐渐得到了软件开发人员和软件测试人员的认可和接受。基于模型的软件测试是软件编码阶段的主要测试方法之一,具有测试效率高、排除逻辑复杂故障测试效果好等特点。但是误报、漏报和故障机理有待进一步研究。对主要的测试模型进行了分析和分类,同时,对故障密度等参数进行了初步的分析;最后,提出了一种基于模型的软件测试流程。
    2008,17(8):2-5, DOI:
    [摘要] (5790) [HTML] (0) [PDF ] (32696)
    摘要:
    本文介绍了一个企业信息门户中单点登录系统的设计与实现。系统实现了一个基于Java EE架构的结合凭证加密和Web Services的单点登录系统,对门户用户进行统一认证和访问控制。论文详细阐述了该系统的总体结构、设计思想、工作原理和具体实现方案,目前系统已在部分省市的广电行业信息门户平台中得到了良好的应用。
    2004,13(8):58-59, DOI:
    [摘要] (5739) [HTML] (0) [PDF ] (28199)
    摘要:
    本文介绍了Visual C++6.0在对话框的多个文本框之间,通过回车键转移焦点的几种方法,并提出了一个改进方法.
    2009,18(5):182-185, DOI:
    [摘要] (5711) [HTML] (0) [PDF ] (34370)
    摘要:
    DICOM 是医学图像存储和传输的国际标准,DCMTK 是免费开源的针对DICOM 标准的开发包。解读DICOM 文件格式并解决DICOM 医学图像显示问题是医学图像处理的基础,对医学影像技术的研究具有重要意义。解读了DICOM 文件格式并介绍了调窗处理的原理,利用VC++和DCMTK 实现医学图像显示和调窗功能。
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2007,16(10):48-51, DOI:
    [摘要] (4841) [HTML] (0) [PDF 0.00 Byte] (88573)
    摘要:
    论文对HDF数据格式和函数库进行研究,重点以栅格图像为例,详细论述如何利用VC++.net和VC#.net对光栅数据进行读取与处理,然后根据所得到的象素矩阵用描点法显示图像.论文是以国家气象中心开发Micaps3.0(气象信息综合分析处理系统)的课题研究为背景的.
    2002,11(12):67-68, DOI:
    [摘要] (4126) [HTML] (0) [PDF 0.00 Byte] (59622)
    摘要:
    本文介绍非实时操作系统Windows 2000下,利用VisualC++6.0开发实时数据采集的方法.所用到的数据采集卡是研华的PCL-818L.借助数据采集卡PCL-818L的DLLs中的API函数,提出三种实现高速实时数据采集的方法及优缺点.
    2008,17(1):113-116, DOI:
    [摘要] (5985) [HTML] (0) [PDF 0.00 Byte] (49949)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(5):122-126, DOI:
    [摘要] (7932) [HTML] (0) [PDF 0.00 Byte] (48451)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号