• 当期目录
  • 优先出版
  • 过刊浏览
  • 点击排行
  • 下载排行
  • 综述文章
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    2024,33(7):1-13, DOI: 10.15888/j.cnki.csa.009580
    摘要:
    长时目标跟踪相对于短时目标跟踪仍然是一个巨大的挑战. 然而现有的长时跟踪算法通常在面对目标频繁出现消失、目标外观发生剧变等挑战中表现不佳. 本文提出了一种基于局部搜索模块和全局搜索跟踪模块的全新、鲁棒且实时的长时跟踪框架. 局部搜索模块利用TransT短时跟踪器生成一系列候选框, 并通过置信度评分确定最佳候选框. 针对全局重新检测开发了一个新颖的全局搜索跟踪模块, 以Faster R-CNN为基础模型, 在RPN阶段与R-CNN阶段引入非局部操作和多级实例特征融合模块, 以充分挖掘目标实例级特征. 为了改进全局搜索跟踪模块的性能, 设计了双模板更新策略来提升跟踪器的鲁棒能力. 通过使用不同时间点上更新的模板能够更好地适应目标的变化. 根据局部或全局置信度分数判断目标是否存在, 并在下一帧中选择局部或全局搜索跟踪策略. 同时能够为局部搜索模块估计目标的位置和大小. 此外还为全局搜索跟踪器引入了排名损失函数, 隐式学习了区域提议与原始查询目标的相似度. 通过在多个跟踪数据集上进行大量实验对提出的跟踪框架进行了广泛评估. 结果一致表明, 本文提出的跟踪框架实现了令人满意的性能.
    2024,33(7):14-25, DOI: 10.15888/j.cnki.csa.009585
    摘要:
    神经网络的不确定性反映模型对自身预测结果的置信水平, 能在决策不可靠时促使及时的人工干预, 提升系统安全性. 然而, 现有度量方法常需要对模型或训练过程进行显著修改且实施复杂度高. 为此, 本文提出一种基于神经元统计建模分析的不确定性度量方法. 该方法充分利用模型单次前向传播过程中的激活值, 首先以改进的核密度估计技术构建神经元的激活分布, 模拟神经元的正常工作范围. 接着采用邻域加权密度估计方法计算异常因子, 用以量化测试样本与神经元激活分布的偏离程度. 最终通过统计方法综合各神经元的异常因子作为样本的异常统计量, 为模型不确定性的评估提供新的视角. 实验结果涵盖多个公开数据集和模型, 通过可视化特征图直观展示本文方法在区分域内外样本方面的显著效果. 此外, 本文方法在域外检测任务中表现出卓越性能, AUROC指标在多种实验设置下均超越其他现有方法, 验证提出方法的通用性和有效性.
    2024,33(7):26-38, DOI: 10.15888/j.cnki.csa.009547
    摘要:
    分层联邦学习(hierarchical federated learning, HFL)旨在通过多层架构的协作学习, 同时保护隐私和优化模型性能. 但其效果需依赖于针对参与各方的有效激励机制及应对信息不对称的策略. 为了解决上述问题, 本文提出一种保护终端设备、边缘服务器及云服务器隐私的分层激励机制. 在边端层, 边缘服务器作为中介应用多维合约理论设计不同类型的契约项, 促使终端设备在不泄露数据采集、模型训练以及模型传输成本的情况下, 使用本地数据参与HFL. 在云边层, 云服务器与边缘服务器间关于单位数据奖励和数据量的关系通过Stackelberg博弈进行建模, 在不泄露边缘服务器单位利润的情况下, 进一步将其转化为马尔可夫过程, 并采用保护隐私的多智能体深度强化学习(multi-agent deep reinforcement learning, MADRL)方法逐渐接近斯塔克伯格均衡(Stackelberg equilibrium, SE). 实验结果表明, 本文提出的分层激励机制在性能上优于基线方法, 云服务器的收益提升了接近11%, 单位成本获取增益提升接近18倍.
    2024,33(7):39-51, DOI: 10.15888/j.cnki.csa.009555
    摘要:
    目前基于深度学习的图像去噪算法无法综合考虑局部和全局的特征信息, 进而影响细节处的图像去噪效果, 针对该问题, 提出了融合CNN和Transformer的图像去噪网络(hybrid CNN and Transformer image denoising network, HCT-Net). 首先, 提出CNN和Transformer耦合模块(CNN and Transformer coupling block, CTB), 构造融合卷积和通道自注意力的双分支结构, 缓解单纯依赖Transformer造成的高额计算开销, 同时动态分配注意力权重使网络关注重要图像特征. 其次, 设计自注意力增强卷积模块(self-attention enhanced convolution module, SAConv), 采用递进式组合模块和非线性变换, 减弱噪声信号干扰, 提升在复杂噪声水平下识别局部特征的能力. 在6个基准数据集上的实验结果表明, HCT-Net相比当前一些先进的去噪方法具有更好的特征感知能力, 能够抑制高频的噪声信号从而恢复图像的边缘和细节信息.
    2024,33(7):52-62, DOI: 10.15888/j.cnki.csa.009523
    摘要:
    小目标检测作为目标检测中一项极具挑战性的项目, 广泛分布于日常生活中, 在视频监控场景中, 距离摄像头约20 m远处的行人人脸就可以被认为是小目标. 由于人脸可能相互遮挡并容易受到噪声和天气光照条件的影响, 现有的目标检测模型在这类小目标上的性能劣于中大型目标. 针对此类问题, 本文提出了改进后的YOLOv7模型, 添加了高分辨率检测头, 并基于GhostNetV2对骨干网络进行了改造; 同时基于BiFPN和SA注意力模块替换PANet结构, 增强多尺度特征融合能力; 结合Wasserstein距离改进了原来的CIoU损失函数, 降低了小目标对锚框位置偏移的敏感性. 本文在公开数据集VisDrone2019以及自制的视频监控数据集上进行了对比实验. 实验表明, 本文提出的改进方法mAP指标在VisDrone2019数据集上提高到了50.1%, 在自制视频监控数据集上高于现有方法1.6个百分点, 有效提高了小目标检测的能力, 并在GTX1080Ti上达到了较好的实时性.
    2024,33(7):63-73, DOI: 10.15888/j.cnki.csa.009588
    摘要:
    在语义分割任务中, 编码器的下采样过程会导致分辨率降低, 造成图像空间信息细节的丢失, 因此在物体边缘会出现分割不连续或者错误分割的现象, 进而对整体分割性能产生负面影响. 针对上述问题, 提出基于边缘特征和注意力机制的图像语义分割模型EASSNet. 首先, 使用边缘检测算子计算原始图像的边缘图, 通过池化下采样和卷积运算提取边缘特征. 接着, 将边缘特征融合到经过编码器提取的深层语义特征当中, 恢复经过下采样的特征图像的空间细节信息, 并且通过注意力机制来强化有意义的信息, 从而提高物体边缘分割的准确性, 进而提升语义分割的整体性能. 最后, EASSNet在PASCAL VOC 2012和Cityscapes数据集上的平均交并比分别达到85.9%和76.7%, 与当前流行的语义分割网络相比, 整体分割性能和物体边缘的分割效果都具有明显优势.
    快速检索
    过刊检索
    全选反选导出
    显示模式:
    优先出版日期:  2024-07-03 , DOI: 10.15888/j.cnki.csa.009591
    摘要:
    古汉语文本承载着丰富的历史和文化信息, 对这类文本进行实体关系抽取研究并构建相关知识图谱对于文化传承具有重要作用. 针对古汉语文本中存在大量生僻汉字、语义模糊和复义等问题, 提出了一种基于BERT古文预训练模型的实体关系联合抽取模型 (entity relation joint extraction model based on BERT-ancient-Chinese pre-trained model, JEBAC). 首先, 通过融合BiLSTM神经网络和注意力机制的BERT古文预训练模型 (BERT-ancient-Chinese pre-trained model integrated BiLSTM neural network and attention mechanism, BACBA), 识别出句中所有的subject实体和object实体, 为关系和object实体联合抽取提供依据. 接下来, 将subject实体的归一化编码向量与整个句子的嵌入向量相加, 以更好地理解句中subject实体的语义特征; 最后, 结合带有subject实体特征的句子向量和object实体的提示信息, 通过BACBA实现句中关系和object实体的联合抽取, 从而得到句中所有的三元组信息(subject实体, 关系, object实体). 在中文实体关系抽取DuIE2.0数据集和CCKS 2021的文言文实体关系抽取C-CLUE小样本数据集上, 与现有的方法进行了性能比较. 实验结果表明, 该方法在抽取性能上更加有效, F1值分别可达79.2%和55.5%.
    优先出版日期:  2024-07-03 , DOI: 10.15888/j.cnki.csa.009599
    摘要:
    随着GPS定位技术和移动互联网的发展, 各类LBS (location-based service)应用积累了大量带有位置和文本标记的空间文本数据, 这些数据广泛应用于市场营销、城市规划等设施选址决策中. 空间文本选址的目标是从候选位置集合中挖掘最佳地点新建设施, 以期影响最多空间文本对象, 如用户或车辆等, 其中空间距离越接近且文本越相似则影响力越大. 现有方案未考虑现实普遍存在的同行竞争, 也忽略了用户对设施的评价因素. 为更合理地在同行竞争环境结合用户评级进行选址决策, 本文提出新的空间文本竞争选址问题CoSTUR. 通过引入权衡影响的确定性和数量的阈值, 解决传统模型中对象只能被单一设施影响的局限, 建模了用户可能同时受多个设施影响的真实情况. 借鉴经典的竞争均分模型, 实现了不同评级设施间竞争量化. 为降低大规模数据导致的高昂计算代价, 构建了新型空间文本索引结构TaR-tree, 并结合阈值设计基于影响范围的两个剪枝策略, 实现基于分支定界思想的空间连接和范围查询两种方案. 在真实和合成数据集上的实验结果显示, 相比基线算法计算效率能够提升近一个量级, 说明提出方法的有效性.
    优先出版日期:  2024-07-03 , DOI: 10.15888/j.cnki.csa.009601
    摘要:
    稀疏移动群智感知是一种新兴的模式, 它从感知区域的子集收集数据, 然后推理其他区域的数据. 然而, 在实际应用中, 工人不足或分布不均的情况广泛存在. 因此, 在有限的预算下, 必须优先选择相对更重要的工人收集数据. 此外, 许多稀疏移动群智感知应用对数据的时效性要求较高. 因此我们将考虑数据的新鲜度, 并使用信息年龄作为新鲜度指标. 为了解决这些挑战, 我们提出了一种轻量级年龄敏感的数据感知和推理框架. 该框架旨在预算约束下, 选择合适的工人收集数据, 并通过准确捕捉感知数据时空关系进行数据推理, 以优化信息年龄和推理的准确性. 由于预算和工人有限, 可能会导致数据量较少的情况. 因此, 我们还提出了精简数据推理模型的方法, 以提高推理效率. 通过广泛的实验进一步论证了该框架在实际应用中的优越性.
    优先出版日期:  2024-07-03 , DOI: 10.15888/j.cnki.csa.009590
    摘要:
    知识追踪任务旨在通过对学生历史学习数据实时准确地追踪学生知识状态, 并预测学生未来的答题表现. 针对当前研究忽略了题目涵盖知识点中复杂的高阶关系的问题, 提出一种融合知识点关系的深度记忆网络知识追踪模型(deep memory network knowledge tracing model incorporating knowledge point relationships, HRGKT). 首先, HRGKT使用知识点关系图定义图中节点之间的关系信息, 表示知识点之间的丰富信息. 使用GAT获取两者之间的高阶关系. 然后, 学习过程中存在着遗忘, HRGKT综合考虑4个影响知识遗忘的因素来更准确地追踪学生知识状态. 最后, 根据真实在线教育数据集上的实验比较结果, 与当前知识追踪模型相比, HRGKT在追踪学生知识掌握状态方面表现更加准确, 并且具备更好的预测性能.
    优先出版日期:  2024-07-03 , DOI: 10.15888/j.cnki.csa.009606
    摘要:
    隐式反馈数据是推荐系统的重要数据来源, 但通常是稀疏的, 并且存在曝光偏差和从众偏差. 已知的去偏方法往往只针对其中一种偏差, 影响个性化推荐的效果, 或者需要一个昂贵的无偏数据集作为多重去偏的辅助信息. 为此, 本文提出了一个适用于稀疏隐式反馈数据, 同时对曝光偏差和从众偏差去偏的协同过滤推荐算法. 该算法通过我们提出的双重逆倾向加权方法和对比学习辅助任务去除输入双塔自编码器的隐式反馈数据中包含的两种偏差, 估计用户对物品的偏好概率. 实验显示, 本文的算法在公开无偏数据集Coat、Yahoo!R3上, 归一化折扣累积增益NDCG@K、均值平均精度MAP@K和召回率Recall@K优于对比的算法.
    优先出版日期:  2024-07-03 , DOI: 10.15888/j.cnki.csa.009613
    摘要:
    在计算机视觉分割任务中, 基于Transformer的图像分割模型需要大量的图像数据才能达到最好的性能, 医学图像相对于自然图像, 数据量非常稀少, 而卷积本身具有更高的感应偏差, 使得它更适合医学图像方面的应用. 为了将Transformer的远程表征学习与CNN的感应偏差相结合, 本文设计了残差ConvNeXt模块来模拟Transformer的设计结构, 采用深度卷积和逐点卷积组成的残差ConvNeXt模块来提取特征信息, 极大地降低了参数量. 并对感受野和特征通道进行了有效的缩放和扩展, 丰富了特征信息. 此外, 本文提出了一个非对称3D U型网络ASUNet用于脑肿瘤图像的分割. 在非对称U型结构中, 采用残差连接, 将最后两个编码器的输出特征进行连接来扩大通道数. 最后, 在上采样的过程中采用深度监督, 促进了上采样过程中语义信息的恢复. 在BraTS 2020和FeTS 2021数据集上的实验结果表明, ET、WT和TC的骰子分数分别达到了77.08%、90.83%、83.41%和75.63%、90.45%、84.21%. 并且通过对比实验, ASUNet在准确性方面完全可以与Transformer构建的模型竞争, 同时保持了标准卷积神经网络的简单性和高效性.
    优先出版日期:  2024-07-03 , DOI: 10.15888/j.cnki.csa.009629
    摘要:
    针对考虑缓冲区容量限制和机器加工档位的流水车间调度问题(FSSP_LBMPG), 建立了有限缓冲区绿色流水车间数学规划模型, 模型以最小化最大完工时间和最小化加工能量消耗为目标函数, 将缓冲区容量纳入约束, 通过合理选择机器的加工档位达到协调加工速度和加工能耗的效果. 针对问题模型特点, 提出了一种改进蒲公英优化算法(IDOA), 算法首先根据调度问题的特点设计了双层实数编码机制表示问题的解, 通过引入一种初始化机制, 提高初始解质量和求解效率. 算法迭代过程中, 设计了实数交叉策略和变邻域搜索策略, 弥补了原始蒲公英算法局部搜索能力较差的缺点, 提高了改进算法的开发能力. 最后通过设计案例上的对比实验, 表明所提改进措施能有效增强算法性能, 也验证了算法的有效性和鲁棒性.
    优先出版日期:  2024-07-03 , DOI: 10.15888/j.cnki.csa.009577
    摘要:
    近年来基于卷积神经网络(CNN)的图像分割应用已十分广泛, 在特征提取的部分取得了很大进展. 然而随着卷积层数越来越深, 感受野不断增大, 使模型丢失局部特征信息进而影响模型性能. 使用图卷积网络(GCN)处理图数据结构的信息, 能够在保留局部特征同时不随层数的加深而丢失局部信息. 本文主要研究将基于CNN结构的对称全卷积网络(U-Net)特征提取与基于GCN的图像分割结合, 提取全局与局部、浅层与深层的多尺度特征集应用于多模态脑胶质瘤核核磁共振(MR)序列图像分割, 可分为两个阶段: 第1阶段利用 U-Net 对多模态脑核磁共振胶质瘤MR序列图像进行特征提取, 通过多个池化层实现多尺度特征提取及上采样进行特征融合, 其中底层输出较低级别特征, 高层输出更加抽象的高级特征; 第2阶段通过膨胀邻域及稀疏化处理将 U-Net 获得的特征图数据转化为 GCN 所需的图结构数据, 将图像分割问题转化为图结点分类问题, 最后通过余弦相似度量对图结构数据进行分类. 在BraTS 2018公开数据库上的实验结果取得分割准确度0.996、灵敏度0.892的效果. 相比其他深度学习模型, 本方法通过多尺度特征融合, 利用GCN建立高低级别特征的拓扑连接, 确保局部信息不丢失以取得较好的分割效果, 能够胜任临床脑胶质瘤核磁共振图像的分析需求, 进而有效提高脑胶质瘤诊断精度.
    优先出版日期:  2024-07-03 , DOI: 10.15888/j.cnki.csa.009586
    摘要:
    虽然以ChatGPT为代表的自然语言生成(NLG)大语言模型在自然语言处理中的大多数任务中取得了良好的表现, 但其在序列识别任务, 如命名实体识别任务中的表现暂且不如基于BERT的深度学习模型. 针对这一点, 本文探究性的通过将现有的中文命名实体识别问题改造成机器阅读理解问题, 提出并设计了基于情境学习和模型微调的新方法, 使NLG语言模型在识别命名实体达到了更好的效果, 并且该方法不同于其他方法需要改变基层模型的预训练参数. 同时, 由于命名实体是模型生成的结果而不是对原始数据的分类, 不存在边界问题. 为了验证新框架在命名实体识别任务上的有效性, 我们在多个中文命名实体识别数据集上进行了实验. 其中, 在Resume和Weibo数据集上的F1分数分别达到了96.04%和67.87%, 相较于SOTA模型分别提高了0.4和2.7个百分点, 从而验证了新框架能有效利用NLG语言模型在文本生成上的优势完成命名实体识别任务.
    优先出版日期:  2024-07-03 , DOI: 10.15888/j.cnki.csa.009535
    摘要:
    针对同一地区邻近集装箱码头往往物流功能相似、货源腹地重叠、无序竞争突出和资源利用率较低等特点, 本文重点探讨了隶属于同一组织内且位置相邻多集装箱码头的泊位-堆场一体化计划调度(multiple container terminal tactical berth and yard incorporate integrative scheduling, MCT-TBY-IIS)问题. 基于计算物流, 利用多重多背包问题将MCT-TBY-IIS抽象和分解为考虑泊位水深约束和出口集装箱可转港作业的多码头动态连续泊位分配和多码头周期滚动堆场分配两个中度耦合子问题, 进而在计算物流面向问题探索的思想下, 提出了面向层次嵌套结构的二阶段改进帝国竞争算法(hierarchical nesting oriented two-stage improved imperialist competitive algorithm, HNO-TSI-ICA)对MCT-TBY-IIS进行求解优化. 最后, 面向我国东南沿海的典型多码头联合作业实例, 遴选出面向帝国兴替的双同化帝国竞争改进算法和面向0-1背包问题的二进制帝国竞争算法组合应用于HNO-TSI-ICA, 其在求解MCT-TBY-IIS时效果较好, 且堆场作业子系统目标成本的结构较稳定, 其不受计划期内港口负荷和计划周期长度的影响, 其中, 出口箱区集装箱水平运输成本的贡献度在堆场作业子目标成本的比重最大, 稳定在83%左右. 通过对MCT-TBY-IIS的建模与优化, 可以发现多码头协同作业模式有较好的潜力帮助同一组织内邻近的多码头降本增效和提高核心资源的利用率.
    优先出版日期:  2024-07-03 , DOI: 10.15888/j.cnki.csa.009558
    摘要:
    跨项目缺陷预测(cross-project defect prediction, CPDP)已经成为软件工程和数据挖掘领域的一个重要研究方向, 利用其他数据丰富项目的缺陷代码来建立预测模型, 解决了模型构建过程中的数据不足问题. 然而源项目和目标项目的代码文件之间存在的分布差异, 导致跨项目预测效果不佳. 大多数研究采用域适应方法来解决这一问题, 但是现有的方法一方面只考虑了条件分布或边缘分布对缺陷预测的影响, 忽视了其动态性; 另一方面没有选择合适的伪标签. 基于上述两个方面, 本文提出了一种基于动态分布对齐和伪标签学习的跨项目缺陷预测方法(DPLD). 具体来说, 我们通过对抗域适应方法分别在域对齐和类别对齐模块中减小项目间的边缘分布差异和条件分布差异, 并借助动态分布因子动态、定量地描述了两种分布的相对重要性. 此外, 本文也提出了一种伪标签学习方法, 通过数据间的几何相似性来增强伪标签作为真实标签的准确性. 本文在PROMISE数据集上进行了实验, F-measure和AUC的值分别提升了22.98%、15.21%, 表明了本文方法在减小项目间分布差异、提升跨项目缺陷预测性能上的有效性.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009571
    摘要:
    由于细粒度图像类间差异小, 类内差异大的特点, 因此细粒度图像分类任务关键在于寻找类别间细微差异. 最近, 基于Vision Transformer的网络大多侧重挖掘图像最显著判别区域特征. 这存在两个问题: 首先, 网络忽略从其他判别区域挖掘分类线索, 容易混淆相似类别; 其次, 忽略了图像的结构关系, 导致提取的类别特征不准确. 为解决上述问题, 本文提出动态自适应调制和结构关系学习两个模块, 通过动态自适应调制模块迫使网络寻找多个判别区域, 再利用结构关系学习模块构建判别区域间结构关系; 最后利用图卷积网络融合语义信息和结构信息得出预测分类结果. 所提出的方法在CUB-200-2011数据集和NA-Birds数据集上测试准确率分别达到92.9%和93.0%, 优于现有最先进网络.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009572
    摘要:
    针对人工鱼群算法存在的全局搜索能力欠缺, 鲁棒性差及易陷入局部极值等不足, 提出一种自适应差分变异的人工鱼群算法(ADMAFSA). 首先, 该算法采用自适应视野和步长策略, 改善种群个体在较优区域的精细搜索能力, 提升算法的寻优精度. 其次, 在人工鱼群的随机行为中引入反向学习机制, 通过发掘潜在的寻优空间, 提高算法的全局搜索性能, 避免算法早熟收敛. 最后, 借鉴差分进化算法对质量较差的人工鱼进行变异操作, 从而增加鱼群的多样性, 降低算法陷入局部极值的可能性. 为验证改进算法的性能, 本文对6个基准测试函数和8个CEC2019函数进行仿真, 与其他AFSA变体、新型智能算法进行对比, 实验结果表明, ADMAFSA在寻优精度和鲁棒性方面均有所提高. 最后, 在齿轮系设计问题上, 进一步证明了改进算法具有较好的优化效果.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009573
    摘要:
    格子玻尔兹曼方法(lattice Boltzmann method, LBM)是一种基于分子运动理论计算流体力学(computational fluid dynamics, CFD)的方法, 提高LBM的并行计算能力是高性能计算领域的一项重要的研究内容. 本文基于SW26010Pro处理器, 通过区域分解、数据重构、双缓冲、向量化等优化方法, 实现了LBM的多级并行. 基于以上优化方案, 测试了5 600万网格规模, 实现结果显示, 相比于MPI进行级并行, 碰撞过程的平均加速倍数达到61.737、迁移过程的平均加速倍数达到17.3, 同时对方腔流案例做了强扩展测试, 网格规模为1200×1200×1200, 以6.2万计算核心为基准, 百万核心的并行效率超过60.5%.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009574
    摘要:
    随着点云采集技术的发展和三维应用需求的增加, 实际场景要求针对流动数据持续动态地更新点云分析网络. 对此, 提出了双重特征增强的三维点云类增量学习方法, 通过增量学习使点云目标分类技术能够适应新数据中不断出现新类别目标的场景. 该方法通过对点云数据特性和旧类信息的研究分别提出了差异性局部增强模块和知识注入网络, 以缓解类增量学习中的新类偏好问题. 具体而言, 差异性局部增强模块通过感知丰富的局部语义, 表征出三维点云物体中不同的局部结构特性. 随后, 根据目标中每个局部结构的全局信息获得各个局部的重要性权重, 强化对差异性局部特征的感知, 从而提高新旧类特征差异性. 另外, 知识注入网络将旧模型中的旧知识注入新模型的特征学习过程中, 增强后的混合特征能够更有效缓解旧类信息不足导致的新类偏好加剧现象. 在三维点云数据集ModelNet40, ScanObjectNN, ScanNet, ShapeNet上的实验表明, 该方法与现有最优方法相比, 在4个数据集上的平均增量准确率有2.03%、2.18%、1.65%、1.28% 提升.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009575
    摘要:
    固体氧化物燃料电池(SOFC)表面缺陷的图像分割, 对单片SOFC质量检测具有重要意义. 针对单片SOFC表面缺陷图像边缘模糊、背景复杂等问题, 提出一种融合自注意力的SOFC表面缺陷图像分割方法. 首先, 提出多通道自注意力模块, 以增强多通道间关联和提升通道表示; 其次, 利用多尺度注意力融合模块, 进一步提升网络对不同尺度缺陷特征的提取能力; 最后, 提出三元联合损失函数对训练过程进行监督. 实验表明, 提出方法在提升网络分割性能的同时可有效提取单片SOFC表面缺陷.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009589
    摘要:
    本文旨在解决共享医疗数据场景下的群组用户授权管理与完整性验证问题. 首先, 为防止群组用户越权操作, 引入授权标识符, 医疗数据持有者凭授权标识符, 结合用户身份完成权限分配; 而授权标识符的数学构造可有效保证其不可伪造性. 其次, 为记录撤销用户并剥夺其访问权限, 引入基于跳表设计的撤销用户表; 跳表的快速查找和插入的特性, 使方案撤销用户的开销仅为${\mathrm{O}}(\log n)$. 随后, 完善了共享数据完整性验证的具体流程与数学设计. 最后通过安全性分析和仿真实验证明了方案的安全性和高效性.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009582
    摘要:
    基于最小生成树的聚类算法(MST)能够识别具有任意形状的簇, 该算法在如何有效构建最小生成树和识别无效边方面存在不足, 而且易受到噪声点影响. 本文利用密度峰值聚类算法思想的优点来寻找局部密度峰, 局部密度峰在保留原始数据集分布结构的同时, 排除了噪声点, 因此, 我们将局部密度峰与最小生成树聚类算法相结合, 采用标签传播, 提出了基于局部密度峰和标签传播的最小生成树聚类算法(DPMST). 该算法采用了局部密度峰之间基于共享邻的距离, 利用局部密度峰之间的邻域信息, 有效构造最小生成树和识别无效边, 使算法能够发现具有复杂结构的簇. 标签传播增强强标签, 削弱弱标签, 以细化错误的标签, 特别是对于边界点以及揭示复杂流形, 能够提高聚类结果的质量. 人工和真实数据集上的实验结果表明, 与经典聚类算法DPC、MST、K-means、DBSCAN、AP、SC和BIRCH比较, DPMST算法表现优异.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009593
    摘要:
    遥感影像语义分割在环境监测、土地覆盖分类和城市规划等领域发挥着至关重要的作用. 卷积神经网络及其改进模型是遥感影像语义分割的主流方法, 但此类方法更加关注局部上下文特征的学习, 无法有效建模不同物体之间的全局分布关系, 进而制约了模型的分割性能. 为了解决该问题, 本文在卷积神经网络的基础上, 构建了全局语义关系学习模块, 充分学习不同物体之间的共生关系, 有效地增强了模型的表征能力. 此外, 考虑到同一场景中, 待分割物体的尺度存在差异性, 构建了多尺度学习模块, 以融合不同尺度的全局语义关系. 为了评估模型的性能, 本文在Vaihingen和Potsdam两个常用的遥感影像数据集上进行了充分的实验. 实验结果表明, 本文方法能够获得比已有的基于卷积神经网络的模型更高的分割性能.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009594
    摘要:
    实体肿瘤学中, 利用荧光原位杂交(FISH)技术处理后的间期细胞核荧光显微图像上, DNA扩增往往呈现为衍射极限斑点, 成像条件限制了图像质量, 导致图像信噪比较低、背景干扰严重且存在非斑点结构干扰. 设计适用的斑点检测方法, 提供客观且定量的数据, 有助于医生对于癌症病情的诊断. 算法首先采用3层小波多尺度求和对荧光图像去噪, 随后利用多尺度高斯拉普拉斯算子增强斑点区域, 最后通过4个方向的单边二阶高斯核抑制非斑点区域, 完成斑点检测. 实验结果表明, 对于自建数据库中83张图像, 算法平均F分数达到0.96, 平均运行时间0.5 s以下.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009596
    摘要:
    云及其阴影的有效分割是遥感图像处理领域中重要的问题, 它对于地表特征提取、气候检测、大气校正等有很大帮助. 然而云和云影遥感图像特征复杂, 云分布多样不规则, 且边界信息模糊易受背景干扰等特点, 导致其特征难以准确提取, 也少有专门为其设计的网络. 针对以上问题, 本文提出一种ViT (vision Transformer)和D-UNet双路网络. 本文网络分为两个分支: 一路是基于卷积的局部特征提取模块, 在D-UNet的膨胀卷积模块基础上, 引入深度可分离卷积, 提取多尺度特征的同时, 减少参数; 另一路通过ViT在全局上理解上下文语义, 加深对整体特征提取. 两支路间存在信息交互, 完善提取的特征信息. 最后通过独特设计的融合特征解码器, 进行上采样, 减少信息丢失. 模型在自建的云和云影数据集以及HRC_WHU公开数据集上取得优越的性能, 在MIoU指标上分别领先次优模型0.52%和0.44%, 达到了92.05%和85.37%.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009602
    摘要:
    在三维人体姿态估计任务当中, 人体关节之间的连接关系形成了一种复杂的拓扑结构, 利用图卷积网络对该结构进行建模, 可以有效捕捉局部关节间的联系; 尽管不相邻关节之间没有直接的物理连接, 但由于人体的运动和姿态受到生物力学约束以及人体关节之间的协同作用, 利用Transformer编码器建立关节之间的上下文关系, 可以更好地推断出人体姿态; 在大模型的背景下, 如何在保证模型性能的同时, 降低参数量, 也显得尤为重要. 针对上述问题, 设计了一个基于图卷积和Transformer的多层空间特征融合网络模型(MLSFFN), 在使用相对少量的参数基础上, 有效地融合了局部和全局空间特征. 实验结果表明, 本文提出的方法在仅需2.1M参数量的情况下, 在Human3.6M数据集上达到了49.9 mm的平均每关节误差(MPJPE). 此外, 模型在MPI-INF-3DHP数据集上也展示出了较强的泛化能力.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009621
    摘要:
    甘肃彩陶在中国各类彩陶文化中拥有最为完整的时空序列, 然而尚未有专门针对甘肃彩陶的风格迁移研究. 为弘扬中华优秀传统文化, 首次构建了甘肃彩陶数据集, 提出了一种新的几何风格迁移方法. 该方法生成了一个神经扭曲场, 将甘肃彩陶变形为目标对象的几何风格, 并保持了彩陶的纹理. 网络结构方面加入了位置嵌入和特征增强模块, 提高特征编码的质量. 损失函数方面引入了形状一致性损失和平滑正则化项, 防止彩陶的细节发生突变, 提高变形效果. 实验结果表明, 该模型能够在甘肃彩陶与不同类的对象间进行大规模的几何风格迁移, 同时可以保持良好的彩陶细节, 产生新的视觉体验.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009627
    摘要:
    针对传统降水预测方法的局限性, 提出了一种融合多源数据的深度学习短时降水预测模型MSF-Net. 在GPM历史降水数据的基础上融合了ERA5气象数据、雷达数据和DEM数据. 利用气象特征提取模块学习多源数据的气象特征, 通过注意力融合预测模块进行特征融合并实现短时降水预测. 将MSF-Net的降水预测结果与多种人工智能方法进行对比, 实验结果表明, MSF-Net模型的风险评分TS和偏差评分Bias最优, 表明其可以在6 h的预测时效内提升数据驱动降水预测的效果.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009595
    摘要:
    伪装目标检测是一项在复杂场景中定位和识别伪装目标的任务. 目前基于深度神经网络的方法已初步运用, 但在复杂场景下遇到干扰时, 许多方法无法充分利用目标的多级特征来提取丰富的语义信息, 仅依靠固定尺寸特征识别伪装目标. 为解决这一问题, 本文提出了一种基于多尺度特征融合交互的伪装目标检测网络. 该网络包含两个创新设计: 多尺度特征感知模块和双阶段邻级交互模块. 前者旨在通过结合多尺度特征的方式充分捕获复杂场景中丰富的局部-全局场景对比信息. 后者则是整合来自相邻层的特征以利用跨层相关性将有价值的上下文信息从编码器传输到解码器网络. 本文在CHAMELEON、CAMO-Test、COD10K-Test这3个公共数据集上对提出的方法进行了评测并与当前的主流方法对比. 实验结果表明, 本文方法的性能超越了当前的主流方法, 在各项指标上达到了优异的性能水平.
    优先出版日期:  2024-06-28 , DOI: 10.15888/j.cnki.csa.009521
    摘要:
    合成孔径雷达(synthetic aperture radar, SAR)与光学图像融合旨在利用卫星传感器的成像互补性, 生成更全面的地貌信息. 然而, 由于各单一卫星传感器数据分布的异质性和成像物理机制的差异, 现有网络模型在融合过程中往往存在成像精度低的问题. 为了解决上述问题, 本文提出DNAP-Fusion, 一种新的结合双非局部注意力感知的SAR和光学图像金字塔细节融合网络(dual non-local-aware-based pyramid fusion net). 该方法利用双非局部注意力模块, 在空间尺度逐渐减小的多级图像金字塔中提取SAR图像的结构信息和光学图像的纹理细节. 然后在空间和通道维度上融合它们的互补特征. 然后, 通过图像重构将融合特征注入上采样光学图像中, 得到最终的融合结果. 此外, 在网络训练之前, 采用图像封装决策来增强同一场景中SAR和光学图像中目标之间的共性关系. 定性和定量的实验结果表明, 提出的方法优于现有融合方法, 其中客观评价指标中的相关系数(correlation coefficient, CC)为0.990 6, 峰值信噪比(peak signal to noise ratio, PSNR)为32.156 0 dB. 此外, 所提方法有效地融合了SAR图像和可见光图像的互补特征, 为提高遥感图像融合的精度和有效性提供了一种有价值的思路和方法.
    优先出版日期:  2024-05-31 , DOI: 10.15888/j.cnki.csa.009562
    摘要:
    人脸识别技术的恶意运用可能会导致个人信息泄露, 对个人隐私安全构成巨大威胁, 通过通用对抗攻击保护人脸隐私具有重要的研究意义. 然而, 现有的通用对抗攻击算法多数专注于图像分类任务, 应用于人脸识别模型时, 常面临攻击成功率低和生成扰动明显等问题. 为解决这一挑战, 研究提出了一种基于共性梯度的人脸识别通用对抗攻击方法. 该方法通过多张人脸图像的对抗扰动的共性梯度优化通用对抗扰动, 并利用主导型特征损失提升扰动的攻击能力, 结合多阶段训练策略, 实现了攻击效果与视觉质量的均衡. 在公开数据集上的实验证明, 该方法在人脸识别模型上的攻击性能优于Cos-UAP、SGA等方法, 并且生成的对抗样本具有更好的视觉效果, 表明了所提方法的有效性.
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2000,9(2):38-41, DOI:
    [摘要] (12579) [HTML] (0) [PDF ] (20347)
    摘要:
    本文详细讨论了VRML技术与其他数据访问技术相结合 ,实现对数据库实时交互的技术实现方法 ,并简要阐述了相关技术规范的语法结构和技术要求。所用技术手段安全可靠 ,具有良好的实际应用表现 ,便于系统移植。
    1993,2(8):41-42, DOI:
    [摘要] (9405) [HTML] (0) [PDF ] (30046)
    摘要:
    本文介绍了作者近年来应用工具软件NU清除磁盘引导区和硬盘主引导区病毒、修复引导区损坏磁盘的 经验,经实践检验,简便有效。
    1995,4(5):2-5, DOI:
    [摘要] (9147) [HTML] (0) [PDF ] (12278)
    摘要:
    本文简要介绍了海关EDI自动化通关系统的定义概况及重要意义,对该EDI应用系统下的业务运作模式所涉及的法律问题,采用EDIFACT国际标准问题、网络与软件技术问题,以及工程管理问题进行了结合实际的分析。
    2016,25(8):1-7, DOI: 10.15888/j.cnki.csa.005283
    [摘要] (8604) [HTML] () [PDF 1167952] (36274)
    摘要:
    从2006年开始,深度神经网络在图像/语音识别、自动驾驶等大数据处理和人工智能领域中都取得了巨大成功,其中无监督学习方法作为深度神经网络中的预训练方法为深度神经网络的成功起到了非常重要的作用. 为此,对深度学习中的无监督学习方法进行了介绍和分析,主要总结了两类常用的无监督学习方法,即确定型的自编码方法和基于概率型受限玻尔兹曼机的对比散度等学习方法,并介绍了这两类方法在深度学习系统中的应用,最后对无监督学习面临的问题和挑战进行了总结和展望.
    2008,17(5):122-126, DOI:
    [摘要] (7665) [HTML] (0) [PDF ] (46255)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
    2011,20(11):80-85, DOI:
    [摘要] (7562) [HTML] () [PDF 863160] (40600)
    摘要:
    在研究了目前主流的视频转码方案基础上,提出了一种分布式转码系统。系统采用HDFS(HadoopDistributed File System)进行视频存储,利用MapReduce 思想和FFMPEG 进行分布式转码。详细讨论了视频分布式存储时的分段策略,以及分段大小对存取时间的影响。同时,定义了视频存储和转换的元数据格式。提出了基于MapReduce 编程框架的分布式转码方案,即Mapper 端进行转码和Reducer 端进行视频合并。实验数据显示了转码时间随视频分段大小和转码机器数量不同而变化的趋势。结
    1999,8(7):43-46, DOI:
    [摘要] (7187) [HTML] (0) [PDF ] (21976)
    摘要:
    用较少的颜色来表示较大的色彩空间一直是人们研究的课题,本文详细讨论了半色调技术和抖动技术,并将它们扩展到实用的真彩色空间来讨论,并给出了实现的算法。
    2007,16(9):22-25, DOI:
    [摘要] (6435) [HTML] (0) [PDF ] (5027)
    摘要:
    本文结合物流遗留系统的实际安全状态,分析了面向对象的编程思想在横切关注点和核心关注点处理上的不足,指出面向方面的编程思想解决方案对系统进行分离关注点处理的优势,并对面向方面的编程的一种具体实现AspectJ进行分析,提出了一种依据AspectJ对遗留物流系统进行IC卡安全进化的方法.
    2012,21(3):260-264, DOI:
    [摘要] (6390) [HTML] () [PDF 336300] (43113)
    摘要:
    开放平台的核心问题是用户验证和授权问题,OAuth 是目前国际通用的授权方式,它的特点是不需要用户在第三方应用输入用户名及密码,就可以申请访问该用户的受保护资源。OAuth 最新版本是OAuth2.0,其认证与授权的流程更简单、更安全。研究了OAuth2.0 的工作原理,分析了刷新访问令牌的工作流程,并给出了OAuth2.0 服务器端的设计方案和具体的应用实例。
    2011,20(7):184-187,120, DOI:
    [摘要] (6235) [HTML] () [PDF 731903] (31320)
    摘要:
    针对智能家居、环境监测等的实际要求,设计了一种远距离通讯的无线传感器节点。该系统采用集射频与控制器于一体的第二代片上系统CC2530 为核心模块,外接CC2591 射频前端功放模块;软件上基于ZigBee2006 协议栈,在ZStack 通用模块基础上实现应用层各项功能。介绍了基于ZigBee 协议构建无线数据采集网络,给出了传感器节点、协调器节点的硬件设计原理图及软件流程图。实验证明节点性能良好、通讯可靠,通讯距离较TI 第一代产品有明显增大。
    2004,13(10):7-9, DOI:
    [摘要] (5935) [HTML] (0) [PDF ] (9950)
    摘要:
    本文介绍了车辆监控系统的组成,研究了如何应用Rockwell GPS OEM板和WISMOQUIKQ2406B模块进行移动单元的软硬件设计,以及监控中心 GIS软件的设计.重点介绍嵌入TCP/IP协议处理的Q2406B模块如何通过AT指令接入Internet以及如何和监控中心传输TCP数据.
    2008,17(1):113-116, DOI:
    [摘要] (5863) [HTML] (0) [PDF ] (47923)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(8):87-89, DOI:
    [摘要] (5790) [HTML] (0) [PDF ] (39895)
    摘要:
    随着面向对象软件开发技术的广泛应用和软件测试自动化的要求,基于模型的软件测试逐渐得到了软件开发人员和软件测试人员的认可和接受。基于模型的软件测试是软件编码阶段的主要测试方法之一,具有测试效率高、排除逻辑复杂故障测试效果好等特点。但是误报、漏报和故障机理有待进一步研究。对主要的测试模型进行了分析和分类,同时,对故障密度等参数进行了初步的分析;最后,提出了一种基于模型的软件测试流程。
    2008,17(8):2-5, DOI:
    [摘要] (5703) [HTML] (0) [PDF ] (30731)
    摘要:
    本文介绍了一个企业信息门户中单点登录系统的设计与实现。系统实现了一个基于Java EE架构的结合凭证加密和Web Services的单点登录系统,对门户用户进行统一认证和访问控制。论文详细阐述了该系统的总体结构、设计思想、工作原理和具体实现方案,目前系统已在部分省市的广电行业信息门户平台中得到了良好的应用。
    2019,28(6):1-12, DOI: 10.15888/j.cnki.csa.006915
    [摘要] (5697) [HTML] (17028) [PDF 672566] (16352)
    摘要:
    知识图谱是以图的形式表现客观世界中的概念和实体及其之间关系的知识库,是语义搜索、智能问答、决策支持等智能服务的基础技术之一.目前,知识图谱的内涵还不够清晰;且因建档不全,已有知识图谱的使用率和重用率不高.为此,本文给出知识图谱的定义,辨析其与本体等相关概念的关系.本体是知识图谱的模式层和逻辑基础,知识图谱是本体的实例化;本体研究成果可以作为知识图谱研究的基础,促进知识图谱的更快发展和更广应用.本文罗列分析了国内外已有的主要通用知识图谱和行业知识图谱及其构建、存储及检索方法,以提高其使用率和重用率.最后指出知识图谱未来的研究方向.
    2004,13(8):58-59, DOI:
    [摘要] (5632) [HTML] (0) [PDF ] (26418)
    摘要:
    本文介绍了Visual C++6.0在对话框的多个文本框之间,通过回车键转移焦点的几种方法,并提出了一个改进方法.
    2009,18(5):182-185, DOI:
    [摘要] (5578) [HTML] (0) [PDF ] (31867)
    摘要:
    DICOM 是医学图像存储和传输的国际标准,DCMTK 是免费开源的针对DICOM 标准的开发包。解读DICOM 文件格式并解决DICOM 医学图像显示问题是医学图像处理的基础,对医学影像技术的研究具有重要意义。解读了DICOM 文件格式并介绍了调窗处理的原理,利用VC++和DCMTK 实现医学图像显示和调窗功能。
    2009,18(3):164-167, DOI:
    [摘要] (5573) [HTML] (0) [PDF ] (27557)
    摘要:
    介绍了一种基于DWGDirectX在不依赖于AutoCAD平台的情况下实现DWG文件的显示、操作、添加的简单的实体的方法,并对该方法进行了分析和实现。
    (), DOI:
    [摘要] (5518) [HTML] (19) [PDF ] (14)
    摘要:
  • 全文下载排行(总排行年度排行各期排行)
    摘要点击排行(总排行年度排行各期排行)

  • 快速检索
    过刊检索
    全选反选导出
    显示模式:
    2007,16(10):48-51, DOI:
    [摘要] (4744) [HTML] (0) [PDF 0.00 Byte] (86503)
    摘要:
    论文对HDF数据格式和函数库进行研究,重点以栅格图像为例,详细论述如何利用VC++.net和VC#.net对光栅数据进行读取与处理,然后根据所得到的象素矩阵用描点法显示图像.论文是以国家气象中心开发Micaps3.0(气象信息综合分析处理系统)的课题研究为背景的.
    2002,11(12):67-68, DOI:
    [摘要] (3903) [HTML] (0) [PDF 0.00 Byte] (57844)
    摘要:
    本文介绍非实时操作系统Windows 2000下,利用VisualC++6.0开发实时数据采集的方法.所用到的数据采集卡是研华的PCL-818L.借助数据采集卡PCL-818L的DLLs中的API函数,提出三种实现高速实时数据采集的方法及优缺点.
    2008,17(1):113-116, DOI:
    [摘要] (5862) [HTML] (0) [PDF 0.00 Byte] (47916)
    摘要:
    排序是计算机程序设计中一种重要操作,本文论述了C语言中快速排序算法的改进,即快速排序与直接插入排序算法相结合的实现过程。在C语言程序设计中,实现大量的内部排序应用时,所寻求的目的就是找到一个简单、有效、快捷的算法。本文着重阐述快速排序的改进与提高过程,从基本的性能特征到基本的算法改进,通过不断的分析,实验,最后得出最佳的改进算法。
    2008,17(5):122-126, DOI:
    [摘要] (7665) [HTML] (0) [PDF 0.00 Byte] (46254)
    摘要:
    随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号