2023, 32(10):1-9. DOI: 10.15888/j.cnki.csa.009247 CSTR:
摘要:基于热力图的方法是当前医学影像标志点定位算法中的主流方法, 然而, 现有方法几乎都使用预定义的热力图作为标签, 不能很好地表示真实的标志点位置分布, 从而限制了模型的性能. 为此, 本文提出基于不确定性估计的医学影像标志点定位算法, 同时预测标志点位置及其分布. 模型利用多分支空洞卷积提取多尺度的上下文信息, 同时使用自注意力机制强化重要特征, 从而在预测分布的同时提高算法的定位能力. 在公开数据集上的结果表明, 本文提出的算法整体上提升了标志点定位的性能, 在大部分指标上优于现有算法, 并且其预测出的标志点分布与真实标注下的标志点分布相符.
2023, 32(10):10-21. DOI: 10.15888/j.cnki.csa.009262 CSTR:
摘要:棉花价格受多种因素影响而复杂多变, 通过选择合适的数据特征和预测模型可提高棉花价格预测精度. 本文以棉花日现货价格数据为研究目标, 采集了供需关系、国际市场、宏观经济、产业链这4个方面的9项影响因素作为特征, 使用极限梯度提升(XGBoost)算法对棉花价格影响因素进行特征评估筛选, 选取其中5项特征后, 采用引入注意力机制(Attention)的时间卷积网络(TCN) TCN-Attention、TCN、LSTM、GRU等模型对棉花价格进行预测. 通过消融实验和对比实验, 结果表明: (1)经过XGBoost特征筛选后, TCN-Attention价格预测的平均绝对误差(MAE)和均方根误差(RMSE)为41.47和58.76, 与未筛选相比分别降低了77.57%和76.49%. (2)与TCN、LSTM、GRU相比, 本文提出的TCN-Attention模型预测结果更准确, MAE和RMSE均降低50%以上, 运行时间较LSTM、GRU缩短60%.
2023, 32(10):22-33. DOI: 10.15888/j.cnki.csa.009291 CSTR:
摘要:手部姿态估计在人机交互、手功能评估、虚拟现实和增强现实等应用中发挥着重要作用, 为此本文提出了一种新的手部姿态估计方法, 以解决手部区域在大多数图像中占比较小和已有单视图关键点检测算法无法应对遮挡情况的问题. 所提方法首先通过引入Bayesian卷积网络的语义分割模型提取手部目标区域, 在此基础上针对手部定位结果, 利用所提基于注意力机制和级联引导策略的新模型以获得较为准确的手部二维关键点检测结果.然后提出了一种利用立体视觉算法计算关键点深度信息的深度网络, 并在深度估计中提供视角自学习的功能. 该方式以三角测量为基础, 利用RANSAC算法对测量结果进行校准. 最后经过多任务学习和重投影训练对手部关键点的3D检测结果进行优化, 最终提取手部关键点的三维姿态信息. 实验结果表明: 相比于已有的一些代表性人手区域检测算法, 本文方法在人手区域检测上的平均检测精度和运算时间上有一定的改善. 此外, 从本文所提姿态估计方法与已有其他方法的平均端点误差(EPE_mean)和PCK曲线下方面积(AUC)这些指标的对比结果来看, 本文方法的关键点检测性能更优, 因而能获得更好的手部姿态估计结果.
2023, 32(10):34-44. DOI: 10.15888/j.cnki.csa.009253 CSTR:
摘要:HyperLedger Fabric是受关注度较高的开源联盟区块链. 针对现有区块链分片方法不适用于Fabric三阶段交易模型的问题和分片粒度过粗导致存在热点访问的问题, 提出一种基于Fabric实现的细粒度键值状态分片方法. 首先, 详细设计了Fabric在键值状态分片下的跨片交易处理, 引入跨分片排序节点和两阶段提交处理流程, 高效保证跨片交易的一致性和原子性. 然后, 针对细粒度分片可能导致交易跨片概率上升进而影响性能的问题, 提出启发式的交易提案路由表, 旨在减少预执行阶段交易的跨片读数据请求, 降低计算资源和网络资源的消耗. 最后, 在Fabric仿真系统上实现改进的分片方案并进行性能测试. 实验结果表明, 该方法在提升Fabric性能的基础上, 有效解决了热点访问问题和高跨片交易占比下的性能下降问题.
2023, 32(10):45-53. DOI: 10.15888/j.cnki.csa.009245 CSTR:
摘要:在图像分割识别领域, 现有的深度学习方法大多使用高精度语义分割方法来实现, 存在着网络推理速度慢、计算量大、难以实际应用等问题. 借助于表现较好的BiSeNetV1实时网络模型, 通过扩展的空间路径卷积结构、空间金字塔注意力机制(SPARM)和简化的注意力特征融合模块(S-iAFF)等改进策略, 设计一种用于岩屑图像分割领域的BiSeNet_SPARM_S-iAFF实时网络. 扩展的空间路径卷积结构可以获取更丰富的岩屑图像空间特征, 上下文路径使用优化的空间金字塔注意力机制(SPARM)进一步细化高层语义特征提取, 在特征融合阶段使用简化注意力特征融合(S-iAFF)加强低层空间与高层语义特征的融合程度. 实验结果表明, BiSeNet_SPARM_S-iAFF网络在RockCuttings_Oil岩屑数据集上的平均交并比(mIoU)为64.91%, 相较于BiSeNetV1网络提高了2.68%; 另外改进后的网络在精度上接近大部分高精度语义分割方法, 同时参数量大幅度减少、推理速度有着明显的提升.
2023, 32(10):54-64. DOI: 10.15888/j.cnki.csa.009266 CSTR:
摘要:股指预测是金融领域中一个重要课题. 随着计算能力和技术的发展, 从在线新闻中识别和量化有价值的信息为提高股指预测表现创造了机会. 本文为将关于股票指数预测框架的计量经济学文献扩展到高维文本数据提出了一种基于生成语言模型的股票指数预测框架. 该预测框架可以分为两个步骤. 首先, 使用有监督生成语言模型快速过滤噪声词语, 并将剩余文本聚合成可以充分解释股指变动的新闻指数. 其次, 将该新闻指数和历史股指数据共同作为时变参数预测模型的自变量来预测股指未来价值. 该框架不仅丰富了股票指数预测的影响因素并且揭示了这些因素与股票指数价值之间的时变动态关系. 实证研究展示了该预测框架解释能力和样本外预测能力. 在预测的6个行业股指中, 本文提出的预测框架得到的均方误差普遍小于传统时间序列和机器学习方法. 与没有考虑新闻信息的时变参数预测模型和长短期记忆网络相比该预测框架也表现了更好的预测性能.
2023, 32(10):65-74. DOI: 10.15888/j.cnki.csa.009274 CSTR:
摘要:属性图是一种流行的图数据模型, 在各种图系统中得到了广泛应用. 然而, 面向事务型负载的图数据库系统在执行图分析任务的场景下面临着高延迟等挑战. 传统的图分析系统往往是基于简单图模型, 而且大多不支持图的事务型负载. 因此, 迫切需要一个能够在属性图上高效处理事务型负载和图分析任务的图存储系统. 持久性内存的问世, 使得我们有机会重新设计图存储系统, 以充分发挥这种设备的特点. 为此, 本文提出了一种基于持久性内存的属性图存储系统, 名为TAG. TAG采用了一种新颖的混合架构的图存储方式, 以充分发挥持久性内存和主存的优势. 其次, 通过拓扑和索引结合的方式, 将图的拓扑嵌入到系统的索引中以加速图的拓扑查询. 最后, TAG通过基于标签的方式来组织图的属性数据, 进一步优化图的属性访问. 实验结果表明, TAG显著优于其他图数据库系统, 与图分析系统相比, TAG也有着相近的性能表现.
2023, 32(10):75-84. DOI: 10.15888/j.cnki.csa.009265 CSTR:
摘要:在面向对象的软件开发过程中, 统一建模语言 (unified modeling language, UML)的用例图用于捕获用户的需求. 传统描述用例的方法一般是开发者根据自己的经验, 从需求中人工获取用例. 然而, 如何自动生成准确的用例仍然是一个待解决的问题. 本文提出了一种通过用UML活动图半自动生成用例的方法. 首先通过引入形式化模型——统一结构来描述用例图与活动图, 其次给出分解活动图的算法, 然后根据分解活动图得到的依赖链生成对应的用例的事件流, 从而得到用例模型, 最后通过所开发的原型CASE工具进行案例的演示, 验证了本文所提出的方法的可行性
2023, 32(10):85-95. DOI: 10.15888/j.cnki.csa.009272 CSTR:
摘要:针对频谱图对于音乐特征挖掘较弱、深度学习分类模型复杂且训练时间长的问题, 设计了一种基于频谱增强和卷积宽度学习(CNNBLS)的音乐流派分类模型. 该模型首先通过SpecAugment中随机屏蔽部分频率信道的方法增强梅尔频谱图, 再将切割后的梅尔频谱图作为CNNBLS的输入, 同时将指数线性单元函数(ELU)融合进CNNBLS的卷积层, 以增强其分类精度. 相较于其他机器学习网络框架, CNNBLS能用少量的训练时间获得较高的分类精度. 此外, CNNBLS可以对增量数据进行快速学习. 实验结果表明: 无增量模型CNNBLS在训练400首音乐数据可获得90.06%的分类准确率, 增量模型Incremental-CNNBLS在增加400首训练数据后可达91.53%的分类准确率.
2023, 32(10):96-105. DOI: 10.15888/j.cnki.csa.009260 CSTR:
摘要:脑卒中患者通常会出现偏瘫步态, 而视觉式步态分析可以用于检测这些变化. 然而, 当前公开的病理步态数据集规模较小、缺乏对偏瘫严重程度的详细分级, 并且传统的视觉式深度学习步态分析方法通常需要较高计算量和较大参数量, 不适用于小规模病理步态数据集. 本文设计了一款轻量级偏瘫步态评估系统. 系统使用一种轻量级卷积神经网络(convolutional neural networks, CNN)来评估偏瘫步态表现. 通过线性拼接不同尺度的分组卷积, 低成本地获得高效率特征. 系统引入多维度混合的轻量级注意力模块来帮助CNN关注空间和通道维度上的显著特征, 从而更好地平衡系统有效性与模型参数量. 此外, 本文还构建了一个专门用于步态识别的偏瘫模拟步态数据集, 为模型训练和测试提供数据支撑. 实验结果表明, 系统的神经网络仅使用VGG-19 1/53的参数量, 将步态识别准确率提高至96.91%, 高于预训练后的VGG-19, 与其他轻量化SOTA方法相比同样具有精度优势. 系统的开发成本低, 可部署于移动设备, 并支持实时检测, 为家庭式病理步态分析提供了一种可行的方案.
2023, 32(10):106-114. DOI: 10.15888/j.cnki.csa.009241 CSTR:
摘要:等离子体控制仿真模拟功能库 (SPACE) 是一款基于开源软件Python开发的用于磁约束核聚变托卡马克装置等离子体控制仿真模拟的函数库. 其主要功能是在托卡马克装置模型、等离子体物理模型和控制系统模型基础上, 利用计算机数值仿真技术, 对托卡马克等离子体控制进行分析、设计、预测和仿真实验. 针对SPACE各功能模块可视化运行需求, 本文采用Python和PySide2开发了适用于EAST超导托卡马克的等离子体控制仿真模拟可视化运行系统. 该系统可使实验人员以图形交互的方式进行等离子体控制仿真模拟的相关操作, 显著提升等离子体控制仿真模拟的效率.
2023, 32(10):115-122. DOI: 10.15888/j.cnki.csa.009242 CSTR:
摘要:等离子体控制系统是聚变实验中重要的系统之一, 用于对等离子体的各项参数进行实时的反馈控制. 目前自主研发的等离子体控制系统基于组件模型开发, 其核心控制功能通过算法组件执行各种等离子体控制算法来实现, 需要提供图形界面编辑算法的预设参数, 并对参数进行管理, 因此基于PyQt5实现图形界面, 并开发参数配置组件负责参数存储回调, 通过发布订阅通讯机制完成两者的数据传输. 采用可扩展标记语言定义控制算法预设参数信息使得用户界面与控制算法解耦, 通过接口描述语言统一定义参数数据结构, 设计MySQL数据库存储历史参数数据, 并基于发布/订阅通讯机制完成数据通讯.
2023, 32(10):123-131. DOI: 10.15888/j.cnki.csa.009271 CSTR:
摘要:实现对固定目标物的注册跟踪方法中, 目前最常使用预制标识物的方法, 或者需要使用集成深度摄像头等配件的专业AR设备, 成本较高. 针对现有方法的缺陷, 提出一种融合目标检测和空间投影算法的简单协作式混合跟踪注册技术, 先通过深度学习算法进行目标检测得到目标物类型, 再利用传感器位姿信息通过空间投影算法确定目标物ID, 从而提高了虚拟信息叠加在真实场景中的匹配度和准确性. 基于此算法实现了智慧物联基础设施维护的增强现实应用, 并对灯杆、垃圾桶等目标物进行了实验. 实验结果表明, 本方法可以在普通智能手机及AR眼镜上运行, 取得了预期效果, 也避免了预制标识物, 降低了对硬件资源的要求.
2023, 32(10):132-139. DOI: 10.15888/j.cnki.csa.009256 CSTR:
摘要:汉盲翻译是一种将中文文本自动翻译为对应的盲文数据的过程. 在嵌入式环境下, 汉盲翻译的速度较慢, 难以达到复杂环境下的实时性需求. 为此设计出专用的汉盲翻译IP核, 通过实现逆向最大匹配分词算法、汉盲转换, 最终得到准确的盲文数据. 为了验证设计的合理性, 以Cortex-M3为微处理器构建SoC, 搭载串口、LCD驱动和汉盲翻译IP核, 并使用FPGA实验平台进行功能验证和性能测试. 测试结果表明, 该SoC可准确进行汉盲翻译, 翻译速度达5 079.37 B/s.
2023, 32(10):140-146. DOI: 10.15888/j.cnki.csa.009258 CSTR:
摘要:声学场景分类技术可以通过在公共区域中录制的音频分析出它的录制环境, 在日常生活中发挥着重要的作用. 与传统分类问题类与类之间没有关系不同, 声学场景分类的类别间存在着层次结构关系(父类与子类), 如机场和购物中心的父类为室内. 而现有的方法在设计时并未考虑声学场景分类任务的这一特性, 忽略了父类和子类间的依赖关系. 因此, 本文利用声学场景类别间的层次结构关系, 提出了一种基于层次信息融合的声学场景分类方法. 该方法为父类和子类分别设计了单独的分类器, 在子类分类的过程中融合了父类的信息, 并设计了层次依赖损失来对预测的父类和子类不匹配的情况进行惩罚. 在TAU城市声学场景2020移动开发数据集上的实验结果表明, 基于层次信息融合的方法有效地提升了声学场景分类模型的性能, 分类准确率提升了1.1%.
2023, 32(10):147-156. DOI: 10.15888/j.cnki.csa.009263 CSTR:
摘要:边界剥离聚类算法(BP)是一种基于密度的聚类算法, 它通过逐渐剥离边界点来揭示聚类的潜在核心, 已经被证明是一种十分有效的聚类手段. 然而, BP算法仍存在一些不足之处: 一方面, 数据点的局部密度仅考虑了距离特征, 使得边界点的确定不够合理; 另一方面, BP算法中的关联策略容易误判异常值, 并且在分配边界点时容易产生连带错误. 为此, 本文提出了一种基于共享近邻和优化关联策略的边界剥离聚类算法(SOBP). 该算法使用了基于共享近邻的局部密度函数来更好地探索数据点之间的相似性, 同时优化了BP算法中的关联策略, 使得每次迭代中边界点不再仅与一个非边界点进行关联, 并进一步采用了边界点与非边界点、已剥离边界点之间的双重关联准则. 在一些数据集上的测试表明, 相较于其他6种经典算法, 该算法在评估指标上表现更佳.
2023, 32(10):157-165. DOI: 10.15888/j.cnki.csa.009227 CSTR:
摘要:自动驾驶技术的快速发展, 导致对交通标志检测技术的要求日益提高. 为解决YOLOv7算法在识别小目标时误检、漏检等问题, 本文提出一种基于注意力机制的交通标志检测模型YOLOv7-PC. 首先通过K-means++聚类算法对交通标志数据集进行聚类, 获得适用于检测交通标志的锚框; 其次在YOLOv7主干特征提取网络中引入坐标注意力机制, 将交通标志的横向和纵向信息嵌入到通道中, 使生成的特征信息具有交通标志的坐标信息, 加强有效特征的提取; 最后在加强特征提取网络中引入空洞空间金字塔池化, 捕获交通标志多尺度上下文信息, 在保证交通标志小目标分辨率的同时, 进一步扩大卷积的感受野. 在中国交通标志检测数据集(CCTSDB)上的实验表明, 本文算法增强了识别小目标的能力, 相较于YOLOv7模型, 本文算法的mAP、召回率平均分别提高了5.22%、9.01%, 是一种有效的交通标志检测算法.
2023, 32(10):166-174. DOI: 10.15888/j.cnki.csa.009255 CSTR:
摘要:移动群智感知是智慧城市数字化建设的核心基础技术之一, 是移动计算领域的热点研究课题. 近年来, 移动群智感知虽然已有许多代表性的研究成果, 但从整体上看距离大规模的普及应用仍有不少距离, 在实际推广应用中仍面临着用户参与度不高的问题. 为此, 引入社交网络IM (影响最大化)传播模型, 考虑到现实情况下概率信息的缺失, 通过在线学习的方式, 在进行影响力活动的同时学习影响力概率, 即根据用户反馈不断更新影响力模型信息, 从而提出新的基于该模型的任务扩散方案. 通过使用真实的社交网络数据集进行实验, 结果表明提出的方法在传播范围方面比传统的IM方法更有效, 为移动群智感知系统的实际推广应用做出贡献.
2023, 32(10):175-183. DOI: 10.15888/j.cnki.csa.009275 CSTR:
摘要:ZD码(ZigZag-decodable codes)是基于之字形解码算法设计生成的一类纠删码, 它仅需要少量的计算即可修复存储系统中的故障数据, 但需要存储相对其他纠删码更多的冗余数据以保证系统的高可靠性. 为了降低ZD码产生的存储开销, 本文通过分析当前在存储系统中使用的之字形解码的思想, 提出了一种优化的之字形解码算法. 新的解码算法能够更充分利用校验数据中的信息来完成数据修复. 基于新的解码算法, 本文相应的提出了一种新的ZD码编码方案, 由于新算法更高的信息利用率, 新的编码方案能够用更少的存储开销来满足存储系统的高可靠性. 实验结果表明, 本文提出的ZD码编码方案具有最优的存储开销, 且编解码性能远高于目前广泛使用的RS码.
2023, 32(10):184-191. DOI: 10.15888/j.cnki.csa.009268 CSTR:
摘要:疾病风险预测能够筛查易患人群, 并在早期进行预防干预措施以降低疾病的发生率及死亡率. 随着机器学习技术的快速发展, 基于机器学习的疾病风险预测得到了广泛应用. 然而, 机器学习十分依赖于高质量的标注信息, 医疗数据中存在的标签噪声会给构建高性能的疾病风险预测算法带来严峻挑战. 针对这一问题, 本文提出了一种基于深度神经网络和动态截断损失函数的噪声鲁棒学习方法用于疾病风险预测. 该方法引入动态截断损失函数, 融合了传统交叉熵函数的隐式加权特性和均方差损失函数的标签噪声鲁棒性; 通过构造训练损失下界, 并引入样本动态加权机制减小可疑样本的梯度, 限制可能的带噪样本在训练过程中的权重, 进一步增强模型的鲁棒性. 以脑卒中筛查数据集为例进行实验, 结果表明本文算法在各个标签噪声比例下均能取得良好的预测性能, 可降低疾病风险预测中标签噪声的负面影响, 实现了带有标签噪声数据的鲁棒学习.
2023, 32(10):192-200. DOI: 10.15888/j.cnki.csa.009246 CSTR:
摘要:针对无线可充电传感器网络下的多无人机充电规划, 仅考虑无人机的飞行距离为成本目标规划出最优充电路径显得单一片面, 现把无人机的飞行距离、能量消耗、时间成本和无人机搭配成本组合成新的成本目标模型, 为了减少飞行停留点次数, 还加入了正六边形充电模型, 并提出了一种改进的海洋捕食者算法(BMPA)应用到此场景中. 改进之处在于: 一方面, 在海洋捕食者算法中引入了天牛须搜索算法寻找全局气味值最大的点的操作, 改善了最优解的质量; 另一方面, 在海洋捕食者算法中加入了新的自适应的非线性移动步长的参数, 进一步改善勘探与开发的平衡, 提高了全局搜索能力, 促进局部研究的快速收敛. 仿真实验结果表明, 提出的算法不仅有效地减少了飞行次数, 而且降低了飞行距离和算力消耗, 与BAS、MPA和PreWBAS算法相比, 在求解新的成本目标函数值上减少了50.90%、4.85%和14.38%, 证明了改进后的算法的有效性.
2023, 32(10):201-207. DOI: 10.15888/j.cnki.csa.009223 CSTR:
摘要:成像设备在雨天拍摄图像时由于雨雾和雨条纹的存在会导致图像质量严重退化, 对后续图像处理性能造成极大影响. 因此, 图像的去雨算法研究引起了广泛关注, 其中针对单幅图像的去雨算法由于没有先验知识的支持, 面临较大挑战. 近年来, 深度学习因其高特征表示能力被应用在图像去雨算法研究中. 本文基于小波变换, 采取了一种深度学习与数字图像形态学处理相结合的算法来实现单幅图像去雨, 具有训练参数少、训练时间短和去雨效果好等优点. 首先对含雨图像进行小波变换, 分为低频分量、水平高频分量、垂直高频分量和对角高频分量, 然后对这4个分量分别构造深度学习神经网络, 并在神经网络架构中根据雨的特征加入图像膨胀、腐蚀等形态学处理来进行去雨操作, 大大简化了模型架构, 并能取得较好的结果.
2023, 32(10):208-214. DOI: 10.15888/j.cnki.csa.009232 CSTR:
摘要:由于成像设备存在的缺陷, 容易引起成像色彩的偏移, 影响图像算法的下游任务, 因此需要采用颜色恒常性算法实现图像色彩的矫正, 保证图像颜色与人眼看到的色彩保持一致. 传统颜色恒常性算法的效果依赖于特定的光源环境, 为了提升算法的适用范围和使用效率, 提出了一种基于SqueezeNet框架的颜色恒常性计算模型, 通过卷积图像网络感知图像光源, 并引入了注意力机制和残差连接, 提升网络对图像的理解和计算性能. 网络同时预测输入图像各区域的光照颜色, 再通过设计3种不同池化方式汇聚, 输出图像的全局估计光源, 最后利用估计光源矫正图像. 实验结果表明, 提出的光源估计算法能够有效地估计图像光照颜色, 矫正图像色彩.
2023, 32(10):215-221. DOI: 10.15888/j.cnki.csa.009257 CSTR:
摘要:为解决当前基于生成对抗网络的深度学习网络模型在面对较复杂的特征时存在伪影、纹理细节退化等现象, 造成视觉上的欠缺问题, 提出了连贯语义注意力机制与生成对抗网络相结合的图像修复改进算法. 首先, 生成器使用两阶段修复方法, 用门控卷积替代生成对抗网络的普通卷积, 引入残差块解决梯度消失问题, 同时引入连贯语义注意力机制提升生成器对图像中重要信息和结构的关注度; 其次, 判别器使用马尔可夫判别器, 强化网络的判别效果, 将生成器输出结果进行反卷积操作得到最终修复后的图片. 通过修复结果以及图像质量评价指标与基线算法进行对比, 实验结果表明, 该算法对缺失部分进行了更好地预测, 修复效果有了更好的提升.
2023, 32(10):222-228. DOI: 10.15888/j.cnki.csa.009093 CSTR:
摘要:精确干扰是电子战领域中广受关注的新概念, 旨在避免电子干扰过程中对友方设备造成的电磁误伤, 其核心思想是实现干扰能量在空域上的精准控制. 然而, 目前用于精确干扰的波形设计算法存在计算复杂度较高的问题, 极易延误电子作战时机. 针对这一问题, 本文提出一种用于精确干扰的波形设计快速算法. 根据精确干扰空间模型建立优化问题, 采用Majorization-Minimization框架推导了目标函数的上界, 通过迭代求解具有闭式解的子问题, 从而得到了精确干扰的可用波形. 仿真实验表明, 本文算法在精确干扰指标上具有良好性能, 并具有计算复杂度更低的优势.
2023, 32(10):229-234. DOI: 10.15888/j.cnki.csa.009097 CSTR:
摘要:事件抽取是信息抽取领域的重点研究方向. 为了提升事件抽取效果, 解决通用事件抽取方法无法充分利用文本特征信息的问题, 提出了融合触发词特征的事件抽取方法. 通过构建远程触发词库, 为事件类型分类模型提供额外特征信息, 增强事件触发词的发掘能力, 再融合事件类型与触发词距离特征, 提升事件要素抽取模型的表示学习能力, 最后, 将事件类型分类模型与事件要素抽取模型串联, 提升事件抽取效果. 在DuEE数据集上进行实验, 与其他模型相比, 本模型提升了准确率、召回率、F1值, 证明了本模型的有效性.
2023, 32(10):235-241. DOI: 10.15888/j.cnki.csa.009276 CSTR:
摘要:知识蒸馏被广泛应用于语义分割以减少计算量. 以往的语义分割知识提取方法侧重于像素级的特征对齐和类内特征变化提取, 忽略了对语义分割非常重要的类间距离知识的传递. 为了解决这个问题, 本文提出了一种类间距离提取方法, 将特征空间中的类间距离从教师网络转移到学生网络. 此外, 语义分割是一个位置相关的任务, 因此本文开发了一个位置信息提取模块来帮助学生网络编码更多的位置信息. 在Cityscapes、Pascal VOC和ADE20K这3个流行的语义分割数据集上的大量实验表明, 该方法有助于提高语义分割模型的精度, 取得了较好的性能.
2023, 32(10):242-254. DOI: 10.15888/j.cnki.csa.009094 CSTR:
摘要:以实际作战体系为研究对象, 以复杂网络理论和现代作战循环理论为理论基础对作战体系的建模和评估方法进行研究, 首先提出一种基于功能作战模型的IDFCS (investigation, decision, fire, communication, and support)作战体系建模方法及该模型的生成算法, 从更贴近实际、更为精细的角度对体系节点的能力和作战体系规律进行定量描述; 其次根据作战环理论提出基于IDFCS模型的体系效能评估方法和节点重要度评估方法, 充分利用节点能力属性对作战体系效能进行定量分析; 最后利用提出的模型生成算法生成不同规模的作战体系样本网络, 并对其进行效能评估, 为针对体系作战的进一步深入研究提供理论支撑.
2023, 32(10):255-264. DOI: 10.15888/j.cnki.csa.009096 CSTR:
摘要:流程建模是分析指挥控制流程, 取得作战胜利的关键步骤. 当前的建模方法不能很好地应对联合作战中指挥控制流程多域联合、松耦合关联等特征. 为了解决上述问题, 本文提出一种面向对象的流程建模语言, 构建的模型描述了指挥控制流程的数据视角、行为视角以及二者间的复杂交互关系, 并基于该模型采用流程挖掘技术进行指挥控制流程还原, 为优化指挥控制流程、提高流程效能提供了一种有效手段.
2023, 32(10):265-274. DOI: 10.15888/j.cnki.csa.009254 CSTR:
摘要:社区发现与链路预测任务是网络数据研究中的热点问题, 兼顾网络传递性与区块结构有助于捕捉个体之间的有效关联、探测数据中蕴含的内在规律, 帮助研究者挖掘更多数据价值进而做出决策. 当前的算法与模型多侧重于网络传递性或区块结构单一层面的分析, 且依赖一定的假设条件. 本文提出网络嵌入随机块模型(NE-SBM)用于社区发现与链路预测. 搭建贝叶斯框架完成模型参数的正则化, 利用Metropolis Hasting-Gibbs算法获得节点嵌入表示的隐位置与社区隶属关系, 基于多维尺度变换算法解决隐位置可识别性问题. 本方法可解决传统启发式算法中过分依赖判断准则或评价函数的问题, 对各类型的数据都具有更好的适应性. 人工数据及真实数据的实验结果进一步验证了该方法在社区发现与链路预测中有更优的表现.
2023, 32(10):275-283. DOI: 10.15888/j.cnki.csa.009270 CSTR:
摘要:正未标记学习仅使用无标签样本和正样本训练一个二分类器, 而生成式对抗网络(generative adversarial networks, GAN)中通过对抗性训练得到一个图像生成器. 为将GAN的对抗训练方法迁移到正未标记学习中以提升正未标记学习的效果, 可将GAN中的生成器替换为分类器C, 在无标签数据集中挑选样本以欺骗判别器D, 对C与D进行迭代优化. 本文提出基于以Jensen-Shannon散度(JS散度)为目标函数的JS-PAN模型. 最后, 结合数据分布特点及现状需求, 说明了PAN模型在医疗诊断图像二分类应用的合理性及高性能. 在MNIST, CIFAR-10数据集上的实验结果显示: KL-PAN模型与同类正未标记学习模型对比有更高的精确度(ACC)及F1-score; 对称化改进后, JS-PAN模型在两个指标上均有所提升, 因此JS-PAN模型的提出更具有合理性. 在Med-MNIST的3个子图像数据集上的实验显示: KL-PAN模型与4个benchmark有监督模型有几乎相同的ACC, JS-PAN也有更高表现. 因此, 综合PAN模型的出色分类效果及医疗诊断数据的分布特征, PAN作为半监督学习方法可获得更快、更好的效果, 在医学图像的二分类的任务上具有更高的性能.
2023, 32(10):284-292. DOI: 10.15888/j.cnki.csa.009264 CSTR:
摘要:情感计算是现代人机交互中的关键问题, 随着人工智能的发展, 基于脑电信号(electroencephalogram, EEG)的情绪识别已经成为重要的研究方向. 为了提高情绪识别的分类精度, 本研究引入堆叠自动编码器(stacked auto-encoder, SAE)对EEG多通道信号进行深度特征提取, 并提出一种基于广义正态分布优化的支持向量机(generalized normal distribution optimization based support vector machine, GNDO-SVM)情绪识别模型. 实验结果表明, 与基于遗传算法、粒子群算法和麻雀搜索算法优化的支持向量机模型相比, 所提出的GNDO-SVM模型具有更优的分类性能, 基于SAE深度特征的情感识别准确率达到了90.94%, 表明SAE能够有效地挖掘EEG信号不同通道间的深度相关性信息. 因此, 利用SAE深度特征结合GNDO-SVM模型可以有效地实现EEG信号的情绪识别.
2023, 32(10):293-300. DOI: 10.15888/j.cnki.csa.009259 CSTR:
摘要:当前的英文语法纠错模型往往忽略了有利于语法纠错的文本句法知识, 从而使得英语语法纠错模型的纠错能力受到影响. 针对上述问题, 提出一种基于差分融合句法特征的英语语法纠错模型. 首先, 本文提出的句法编码器不仅可以直接从文本中无监督地生成依存关系图和成分句法树信息, 而且还能将上述两种异构的句法结构进行特征融合, 编码成高维的句法表征. 其次, 为了同时利用文本中的语义和句法信息, 差分融合模块先使用差分正则化加强语义编码器捕获句法编码器未能生成的语义特征, 然后采用协同注意力将句法表征和语义表征进一步融合, 作为Transformer编码端的输出特征, 最终输入到解码端, 从而生成语法正确的文本. 在CoNLL-2014 英文纠错任务数据集上进行对比实验, 结果表明, 该方法的准确率和F0.5值优于基于Copy-Augmented Transformer的语法纠错模型, 其F0.5值提升了5.2个百分点, 并且句法知识避免了标注数据过少问题, 具有更优的文本纠错效果.
2023, 32(10):301-307. DOI: 10.15888/j.cnki.csa.009243 CSTR:
摘要:为抵抗量子计算攻击, 降低代理签名中用户私钥泄露的风险, 构造了一个格上基于身份的代理签名方案. 方案的设计基于安全高效的GPV签名框架, 结合用户身份信息生成验证公钥, 使用格基委派技术生成用户签名私钥, 并使用盆景树代理委托算法提升签名效率. 方案的安全性可规约至格上最小整数解问题, 满足基于身份代理签名的安全属性, 且在随机谕言和量子随机谕言下均具有存在性不可伪造性.