2022, 31(6):1-9. DOI: 10.15888/j.cnki.csa.008541 CSTR:
摘要:语音可懂度增强是一种在嘈杂环境中再现清晰语音的感知增强技术. 许多研究通过说话风格转换(SSC)来增强语音可懂度, 这种方法仅依靠伦巴第效应, 因此在强噪声干扰下效果不佳. SSC还利用简单的线性变换对基频(F0)的转换进行建模, 并且只映射很少维的梅尔倒谱系数(MCEPs). 因为F0和MCEPs是语音的两个重要特征, 对这些特征进行充分的建模是非常必要的. 因此本文进行了一个创新性研究即通过连续小波变换(CWT)将F0分解为10维来描述不同时间尺度的语音, 以实现F0的有效转换, 而且使用20维表示MCEPs实现MCEPs的转换. 除此之外, 还利用iMetricGAN网络来优化强噪声中的语音可懂度指标. 实验结果表明, 提出的基于CycleGAN使用CWT和iMetricGAN的非平行语音风格转换方法(NS-CiC)在客观和主观评价上均显著提高了强噪声环境下的语音可懂度.
2022, 31(6):10-18. DOI: 10.15888/j.cnki.csa.008568 CSTR:
摘要:计算机学科评估需要对学科整体信息进行汇总, 过于依赖专家经验且历届学科评估信息复用程度低. 针对此问题, 该文提出了一种计算机学科评估知识图谱构建方法. 该方法基于CIR模型建模知识图谱, 设计了针对文本数据的基于依存句法分析的无监督命名实体关系抽取方法和针对表格的数据流组合模型抽取知识, 并借助Neo4j图数据库实现知识图谱可视化, 为更多学科知识图谱的构建提供思路和借鉴.
2022, 31(6):19-28. DOI: 10.15888/j.cnki.csa.008540 CSTR:
摘要:网约车是一种广泛应用的共享移动应用, 其核心问题是将出租车请求分配给具有不同目标的司机, 尽管对网约车的任务分配进行了广泛的研究, 但在很大程度上忽视了司机之间收入的公平性, 由于优化视角的短视和分配技术的耗时, 先行者对网约车公平任务分配的研究在公平性、效用性方面还存在不足. 在本文中, 提出了公平分配学习(LAF)方法, 它既优化了效用又优化了公平性的高效任务分配方案, 采用强化学习以整体的方式进行分配, 并提出一套加速技术, 以实现大规模数据的快速公平分配. 实验结果表明, 公平分配学习方法在公平性、效用性和效率方面分别比现有水平高出86.7%、29.1%和797%.
2022, 31(6):29-37. DOI: 10.15888/j.cnki.csa.008551 CSTR:
摘要:本文在传统神经网络(NN)、循环神经网络(RNN)、长短时记忆网络(LSTM)与门控循环单元(GRU)等神经网络时间预测模型基础上, 进一步构建集成学习(EL)时间序列预测模型, 研究神经网络类模型、集成学习模型和传统时间序列模型在股票指数预测上的表现. 本文以16只A股和国际股票市场指数为样本, 比较模型在不同预测期间和不同国家和地区股票市场上的表现.本文主要结论如下: 第一, 神经网络类时间序列预测模型和神经网络集成学习时间序列预测模型在表现上显著稳健优于传统金融时间序列预测模型, 预测性能提高大约35%; 第二, 神经网络类模型和神经网络集成学习模型在中国和美国股票市场上的表现优于其他发达国家和地区的股票市场.
2022, 31(6):38-47. DOI: 10.15888/j.cnki.csa.008506 CSTR:
摘要:建立水质模型预测水质变化是保障饮用水安全、人类健康和维持生态平衡的关键. 本文提出了基于小波分解去噪和LSTM的双层双向Seq2Seq混合模型(W-Bi2Seq2Seq)来预测水质的变化. 使用Daubechies5 (db5)小波将数据集分解为低频序列和高频序列, 高频序列作为噪声去除, 仅保留低频信号用作所提出模型的输入. 选取了烟台市门楼水库的4项水质指标数据(pH、氨氮、电导率和浊度)用于模型的训练, 验证和测试. 所提出的小波双层双向模型(Bi2)与小波单层单向模型(Uni1)、小波单层双向模型(Bi1)、小波双层单向模型(Uni2)、传统的LSTM模型以及基于小波分解的LSTM模型(W-LSTM), 进行比较实验. 其实验结果显示, 在训练过程中, 4个Seq2Seq模型都具有很好的性能, 都能够很好拟合4项水质指标的历史数据集. 然而, 测试结果表明, Bi2在预测精度和泛化能力方面优于其他5个模型, 并且显著提高复杂度较高的水质数据的预测精度.
2022, 31(6):48-55. DOI: 10.15888/j.cnki.csa.008584 CSTR:
摘要:为实现在海量网格事件库中快速、准确地检索事件, 本文提出一种基于关键词生成的网格事件相似度并行计算方法. 该方法通过双向LSTM网络的编码器和单向LSTM网络的解码器构建指针生成网络生成事件关键词, 使用记忆网络作为指针生成网络的序列信息存储单元, 并将注意力机制用在输入序列上以将更重要的信息输入至解码器, 同时引入覆盖机制来解决生成重复文本问题. 在生成事件关键词后, 基于结构相似度和情境相似度计算事件总体相似度, 并利用GPU对LSTM网络和相似度计算进行加速. 实验结果表明: 相比基于机器学习的计算方法, 该方法在事件相似度计算性能上更好, 最高获得了4.04倍的加速比.
2022, 31(6):56-64. DOI: 10.15888/j.cnki.csa.008508 CSTR:
摘要:由于5G通信场景具有大带宽、低延迟、海量流量和多样性等特征, 5G业务由传统基站承载转向数据中心部署已成为趋势. 为给出5G应用在数据中心的部署建议, 以开源OpenLTE作为其代表性benchmark进行分析, 由于开源的OpenLTE性能很差, 在性能分析时不能反映真实场景和行为特征, 因此首先根据通用处理器的特点对其代码进行了优化, 取得了2.5倍性能加速比; 在此基础上结合处理器特征分析应用执行行为, 其主要特点为: 5G下行过程物理层处理流程是计算密集的, 最高端口利用率90%, 访存不密集, 程序响应时间极短; 最后结合通用处理器独特参数(多核、SMT和Turbo Boost等)分析应用在并发场景下的行为表现, 并以提升数据中心资源率为目的给出部署建议, 5G应用的强实时性使其只能以独占机器方式运行, 其内部并发体之间对共享缓存和访存带宽竞争小而对执行部件竞争激烈, 可采用并发量不多于处理器核数方式部署, 同时TurboBoost的影响不可忽视.
2022, 31(6):65-74. DOI: 10.15888/j.cnki.csa.008505 CSTR:
摘要:为实现蜡染图案的快速定制, 提高蜡染图案创新设计效率, 研究一种基于OpenCV计算机视觉库相关函数和Python语言的蜡染图案快速定制系统. 该方法通过对蜡染图像进行形态学预处理, 然后使用canny算子实现蜡染图案轮廓提取; 随后用户手动选取子图案进行编码提取构型; 通过Hu矩匹配自动获取纹样空间位置, 结合拓扑学中的邻接图方法建立蜡染图案构型规则; 提出构型规则重用方法, 在已提取的构型规则上进行纹样嵌入, 使用基于标识矩阵法的图案嵌入法避免轮廓重叠. 该方法能够使设计结果更加丰富, 有效提高了设计效率. 最后通过蜡染图案设计原型系统进行蜡染图案创新设计, 验证该方法的可行性.
2022, 31(6):75-85. DOI: 10.15888/j.cnki.csa.008517 CSTR:
摘要:当前我国的抽样检测平台信息化智能化程度较低导致抽检工作效率低下, 且中心化平台导致了数据可篡改与来源不可信问题. 针对这些问题, 提出了一种面向抽样检测的区块链技术方案, 利用区块链中联盟链多中心化、不可篡改、隐私保护等特点, 结合物联网终端设备对过程的智能感知, 实现了数据安全可信, 过程可追溯可监控的抽样检测平台, 提高了抽样检测的效率与检测结果的可信性, 保障了数据的安全性.
2022, 31(6):86-92. DOI: 10.15888/j.cnki.csa.008499 CSTR:
摘要:随着多云存储市场的快速发展, 越来越多的用户选择将数据存储在云上, 随之而来的是云环境中的重复数据也呈爆炸式增长. 由于云服务代理是相互独立的, 因此传统的数据去重只能消除代理本身管理的几个云服务器上的冗余数据. 为了进一步提高云环境中数据去重的力度, 本文提出了一种多代理联合去重方案. 通过区块链技术促成云服务代理间的合作, 并构建代理联盟, 将数据去重的范围从单个代理管理的云扩大到多代理管理的多云. 同时, 能够为用户、云服务代理和云服务提供商带来利益上的共赢. 实验表明, 多代理联合去重方案可以显著提高数据去重效果、节约网络带宽.
2022, 31(6):93-99. DOI: 10.15888/j.cnki.csa.008533 CSTR:
摘要:面向企业客户的大型云网监控系统在多云/多网环境下为用户提供包括云网监控、应用性能监控等监控服务, 为企业提供一体化的监控运维管理, 对于监控的灵敏度有着很高的要求. 影响云网监控系统的灵敏度的因素存在于数据采集、数据处理、数据存储、数据展现、数据缓存、消息队列等多个环节中, 本文着重对云网监控系统逐层架构进行分析, 通过数据分析、应对方案设计提升系统整体监控灵敏度.
2022, 31(6):100-108. DOI: 10.15888/j.cnki.csa.008519 CSTR:
摘要:目前推出的V2X通信技术相关标准中存在技术要求细节不够明确等问题, 导致车联网通信终端产品存在差异, 通信协议栈之间不能实现全面互联互通. 针对这一问题, 通过分析LTE-V2X协议栈的性能要求及总体分层, 提出了LTE-V2X协议栈的软硬件解决方案并完善协议栈各层设计细节, 完成消息数据填充与编解码、构建各层数据帧并设计逐层封装机制. 在此基础上, 基于真实道路场景对协议栈进行通信性能测试, 测试结果显示该协议栈满足设计要求, 符合协议栈顶层应用规范.
2022, 31(6):109-116. DOI: 10.15888/j.cnki.csa.008509 CSTR:
摘要:随着交通智能化的发展, 高速公路监控视频加密上云逐渐成为交通发展的主要趋势之一. 交通数据深度挖掘, 尤其是行人检测问题, 则是该趋势中亟待解决问题之一. 本文针对多种道路环境的行人检测问题, 提出了一种基于鲲鹏云的全天候行人监测解决方案. 首先, 将监控相机中的视频流通过流媒体服务转发至鲲鹏云; 然后鲲鹏云进行视频流解码与行人检测, 同时保存行人历史信息; 最后进行行人事件分析和上报. 本系统采用嵌入式神经网络处理器(NPU)代替传统图形处理器(GPU)平台加速YOLOv4行人检测模块的推理, 一方面取得了较快的检测速度并可实时处理22路视频流, 另一方面, 该解决方案针对不同道路场景下高速道路上的行人也可取得较好的监测效果.
2022, 31(6):117-124. DOI: 10.15888/j.cnki.csa.008537 CSTR:
摘要:研究一种基于ESP32传感器的乒乓球动作实时识别系统, 适用于乒乓球爱好者在进行乒乓球运动时的动作识别. 该系统能够采集用户运动时的三轴加速度信号并实时传输至计算机端. 在计算机端对原始加速度信号进行数据预处理, 包括滤波降噪和加窗分割, 提取预处理后加速度信号的时域特征, 利用PCA算法实现特征降维, 最后用决策树(decision tree)算法构建最优的学习模型实现对运动的分类和显示. 实验结果表明: 该系统可实时显示乒乓球4种动作的识别与计数, 识别准确率达97.32%.
2022, 31(6):125-131. DOI: 10.15888/j.cnki.csa.008552 CSTR:
摘要:针对独居老人室内行为及异常行为监测, 开发出一款基于方位感知的老人居家行为监测系统, 并将该系统应用于生活场景. 该系统首先以舵机为原点, 建立室内方位坐标系, 将室内划分为不同的兴趣区域; 然后通过WiFi连接树莓派、摄像头、舵机, 编写Python程序实现摄像头自动目标搜索以及人脸识别、定位功能; 同时, 根据人脸识别结果, 记录舵机方位、视频以及老人驻留热点区域的时间; 最后根据上述监测方位和时间信息, 分析老人的室内行为, 进行异常行为判断, 并发送提醒邮件. 实测结果结果表明, 监测系统能够实时采集目标的视频和方位信息, 分析老人行为状态, 并对异常行为发送邮件预警. 此外, 该系统便于实现, 能够提供丰富的历史数据, 具有实际的应用价值和良好的应用前景.
2022, 31(6):132-140. DOI: 10.15888/j.cnki.csa.008529 CSTR:
摘要:预测进阀温度的变化趋势对阀冷系统中设备运行的安全可靠性具有重要的参考价值. 针对传统方法特征提取困难、预测精度低等问题, 提出了一种用于预测进阀温度的T2VNN (Time2Vec neural network)模型, 该模型首先通过时间序列表示学习方法Time2Vec对进阀温度进行特征提取, 然后结合TCN和双向LSTM的优势, 并且使用分位数回归来实现概率预测. 最后设计了不同时间步和分位数在多个典型模型上的对比实验, 实验结果验证了T2VNN模型具有更高的预测性能, 并且通过消融实验证明了模型中各个组成部分的有效性.
2022, 31(6):141-148. DOI: 10.15888/j.cnki.csa.008500 CSTR:
摘要:立足于新时代后勤管理机制与服务保障模式实际需求, 为打造具有业务集约化、应用智能化、数据融合化特征的智慧后勤, 推进后勤工作提质增效, 强化后勤精益管理水平, 实现后勤管理和服务的信息化、数字化、智能化转型升级, 本文基于微服务的实现技术Spring Cloud开发了企业级智慧后勤保障平台. 此平台通过整合各类后勤资源, 涵盖后勤管理中心、服务保障中心、物业监控中心3大中心, 面向企业后勤管理人员、物业人员、员工提供智慧食堂、便捷出入、物业管理等全方位后勤保障服务, 打破传统单体式后勤业务应用系统间壁垒, 实现各类后勤业务应用系统数据贯通, 进一步提升后勤保障能力和管理效率.
2022, 31(6):149-157. DOI: 10.15888/j.cnki.csa.008497 CSTR:
摘要:人工智能的发展为传统的标书评估方法的优化和改进提供了新的方法, 针对标书评估中人工评标效率低和难以有效识别围标、串标行为的问题, 本文提出了一种基于文本分析的标书综合评估模型, 包含文本评估模型和文本评级模型, 模型为更客观、科学、智能化地进行工程建设项目的评标和防范围标、串标提供支持. 首先, 构建文本评估模型, 在传统的评标指标中加入基于Shingling算法计算的投标文件的重复率, 并将投标文件要求的模板目录与真实目录进行匹配对比计算投标文件的响应程度, 利用层次分析法计算文本评估指标的权重. 然后, 构建文本评级模型, 基于权重改进的Simhash算法计算投标文件相似度, 采用企业关联度、资质与报价的一致性、价格上(下)浮率、企业关联度、异常行为等评级指标, 通过综合评级获得投标文件的评级结果, 协助评标专家识别围标、串标行为. 最后, 通过文本评估模型定量计算得到标书得分排序, 通过文本评级模型定性分析得到标书识别围标、串标的结果, 两者共同实现了对标书的综合评估.
2022, 31(6):158-166. DOI: 10.15888/j.cnki.csa.008496 CSTR:
摘要:文本表示学习作为自然语言处理的一项重要基础性工作, 在经历了向量空间模型、词向量模型以及上下文分布式表示的一系列发展后, 其语义表示能力已经取得了较大突破, 并直接促进模型在机器阅读、文本检索等下游任务上的表现不断提升. 然而, 预训练语言模型作为当前最先进的文本表示学习方法, 在训练阶段和预测阶段的时空复杂度较高, 造成了较高的使用门槛. 为此, 本文提出了一种基于深度哈希和预训练的新的文本表示学习方法, 旨在以更低的计算量实现尽可能高的文本表示能力. 实验结果表明, 在牺牲有限性能的情况下, 本文所提出的方法可以大幅降低模型在预测阶段的计算复杂度, 在很大程度上提升了模型在预测阶段的使用效率.
2022, 31(6):167-174. DOI: 10.15888/j.cnki.csa.008488 CSTR:
摘要:多标签文本分类问题是多标签分类的重要分支之一, 现有的方法往往忽视了标签之间的关系, 难以有效利用标签之间存在着的相关性, 从而影响分类效果. 基于此, 本文提出一种融合BERT和图注意力网络的模型HBGA (hybrid BERT and graph attention): 首先, 利用BERT获得输入文本的上下文向量表示, 然后用Bi-LSTM和胶囊网络分别提取文本全局特征和局部特征, 通过特征融合方法构建文本特征向量, 同时, 通过图来建模标签之间的相关性, 用图中的节点表示标签的词嵌入, 通过图注意力网络将这些标签向量映射到一组相互依赖的分类器中, 最后, 将分类器应用到特征提取模块获得的文本特征进行端到端的训练, 综合分类器和特征信息得到最终的预测结果. 在Reuters-21578和AAPD两个数据集上面进行了对比实验, 实验结果表明, 本文模型在多标签文本分类任务上得到了有效的提升.
2022, 31(6):175-181. DOI: 10.15888/j.cnki.csa.008498 CSTR:
摘要:以K-means为代表的聚类算法被广泛地应用在许多领域, 但是K-means不能直接处理不完整数据集. km-means是一种处理不完整数据集的聚类算法, 通过调整局部距离计算方式, 减少不完整数据对聚类过程的影响. 然而km-means初始化阶段选取的聚类中心存在较大的不可靠性, 容易陷入局部最优解. 针对此问题, 本文引入可信度, 提出了结合可信度的km-means聚类算法, 通过可信度调整距离计算, 增大初始化过程中选取聚类中心的可靠性, 提高聚类算法的准确度. 最后, 通过UCI和UCR数据集验证算法的有效性.
2022, 31(6):182-191. DOI: 10.15888/j.cnki.csa.008490 CSTR:
摘要:针对传统目标检测算法在环境多变、背景复杂、目标聚集、小目标过多的航空遥感影像目标检测上效果不理想的问题, 本文提出了一种基于注意力机制及生成对抗网络的遥感影像目标检测模型Attention-GAN-Mask R-CNN. 该模型将注意力、生成对抗网络和Mask R-CNN结合起来, 用以解决遥感影像目标检测中存在的问题. 实验结果表明, 在复杂的遥感影像数据集中, 该方法提升了目标检测的效率和准确率.
2022, 31(6):192-201. DOI: 10.15888/j.cnki.csa.008539 CSTR:
摘要:行人重识别技术在实际应用中易受行人姿态变化的干扰, 由于行人姿态的变化不仅丢失部分行人信息, 而且还会引起大于身份差异的外观变化, 导致现有工作难以学到鲁棒的行人特征. 为了解决上述问题, 本文提出一种基于变分对抗与强化学习的生成式对抗网络(RL-VGAN)用于多姿态行人重识别任务. 该方法的核心思想是在不受姿态变化干扰的情况下通过外观编码器和姿态编码器将行人属性分解为外观特征和姿态特征, 用以学习鲁棒的身份视觉特征. 首先, 设计的变分生成网络利用Kullback-Leibler散度损失促进外观编码器推断与身份信息相关的连续隐变量. 其次, 为了使生成式对抗网络逐步收敛到稳定状态, 采用强化学习策略平衡变分生成网络和判别网络的性能. 此外, 针对基于姿态引导图像生成任务, 提出一种新的Inception Score损失用于规范变分生成网络生成图像质量的过程. 实验结果证明, 所提出的RL-VGAN方法在多个基准数据集上优于其他方法.
2022, 31(6):202-209. DOI: 10.15888/j.cnki.csa.008512 CSTR:
摘要:由于采用的监控图像尺寸较小、分辨率低等原因, 行人属性识别一直是一个极具挑战性的任务, 而低分辨率的图像往往又导致数据集存在识别行人主体区域不突出、背景噪音干扰严重等问题. 之前的方法大多将未作处理的原始图像作为输入, 使得属性识别效果一直不够理想, 并且, 属性识别的主流数据集通常存在正负样本不平衡的问题, 例如, 许多行人的服装属性分布有着季节性或习俗性的偏差. 因此, 本文提出一个新的深度学习网络——图像增强与样本平衡优化模型IEBO (image enhancement and sample balance optimization). 该模型通过色彩增强与提取行人主体区域的噪音抑制方法, 在突出行人核心特征的同时消除无用背景信息, 防止其对属性识别造成干扰. 另外模型通过权重调节针对样本不平衡的属性进行优化, 提高不平衡属性的识别能力. 实验最终表明, 新的行人属性识别模型在Market-1501-attribute数据集中取得了较好的性能.
2022, 31(6):210-216. DOI: 10.15888/j.cnki.csa.008525 CSTR:
摘要:在电力生产的过程中, 往往会产生大量电力相关的文本数据, 但这些数据大多是非结构化数据且体量庞大繁杂, 实现对电力相关数据有效的组织管理可以促进电力企业实现数字资产商品化, 以此为电力企业发掘新的利润增长点. 本文针对将电力行业中的相关规章制度文本进行结构化处理这一问题, 提出了基于字符和二元词组特征的命名实体识别的模型. 在该模型中, 通过使用融合多特征的BERT预训练语言模型得到词嵌入表示, 并使用引入相对位置编码的Transformer模型和条件随机场作为编码层和解码层, 本文提出的模型在实体类型识别的准确率为92.64%, 取得了有效的识别效果.
2022, 31(6):217-223. DOI: 10.15888/j.cnki.csa.008521 CSTR:
摘要:近年来, 空气质量监测微子站监测逐渐成为了空气质量监测网络的重要组成部分. 随着经济的不断发展, 城市化进程的不断加快, 站点的冗余以及代表性降低的问题逐渐显现. 由于空气质量监测微子站抵抗突发环境因素能力较弱, 极易导致监测数据缺失, 不仅会大大增加数据分析的复杂性与难度, 还会导致优化布点结果的偏差. 本文针对以上问题, 提出了一种将BiLSTM神经网络结合聚类的点位优化方法, 在应用BiLSTM神经网络补全缺失数据的基础上, 应用凝聚层次聚类法对修复后的数据进行聚类. 在实现用尽可能少而准确的点位反馈空气质量水平的基础上, 大大提升聚类准确度. 最后, 本文使用沈阳市位于浑南区的18个空气质量监测微子站的监测数据进行实验验证. 结果表明, 相比于一般的聚类算法, 本文提出的算法性能有一定提升, 为空气质量监测点位优化提供了一种新方法.
2022, 31(6):224-230. DOI: 10.15888/j.cnki.csa.008526 CSTR:
摘要:针对WiFi信号在室内复杂环境下不稳定以及建筑物对地磁场的扭曲作用造成单一定位源定位精度不高的问题, 本文采用多源信息融合定位技术, 有效利用WiFi和地磁场的指纹数据来进行定位, 提出了一种改进的自适应差分进化算法来优化BP神经网络(improved differential evolution BP, IDEBP). 该方法通过改进差分进化算法的变异、交叉和选择操作来优化BP神经网络的权值和偏差, 有助于BP模型更好地学习WiFi和地磁场指纹数据的特征. 仿真结果表明, IDEBP算法能大大提高室内指纹定位的精度.
2022, 31(6):231-237. DOI: 10.15888/j.cnki.csa.008538 CSTR:
摘要:为了克服因风速信号固有的震动性、非线性特性引起的预测精度不高的问题, 本文提出了使用集合经验模态分解算法和门控循环单元两种方法相结合的组合模型对风速进行预测. 该模型首先对数据进行归一化处理, 使用孤立森林算法, 剔除异常点, 然后用EEMD (ensemble empirical mode decomposition)方法, 将风速拆分成不同尺度的信号, 消除数据的非平稳性, 将分解得到的相对平稳的分量信号分别送入GRU (gated recurrent unit)模型进行训练, 获得各自的预测结果, 最终风速由所有分量各自预测的结果累加得到. 实验中采用实地采集数据进行实验, 结果证实, EEMD-GRU方法相较于目前主流的EEMD-LSTM、EMD-LSTM等方法, 预测精度有明显提升.
2022, 31(6):238-244. DOI: 10.15888/j.cnki.csa.008528 CSTR:
摘要:关系抽取作为信息抽取领域的重要研究课题, 其主要目的是抽取句子中已标记实体对之间的语义关系, 对句子语义理解及知识库构建有着重要作用. 针对现有抽取方法中未能充分利用单词位置信息和实体间的交互信息导致重要特征丢失的问题, 本工作提出一种基于位置编码与实体交互信息的关系抽取方法(BPI-BERT). 首先将新型位置编码融入BERT预训练语言模型生成的词向量中后使用平均池化技术得到实体和句子向量, 再利用哈达玛乘积构造实体交互信息, 最后将实体向量、句子向量及交互信息向量拼接得到关系向量并输入到Softmax分类器进行关系分类. 实验结果表明BPI-BERT在精准率和 F1上较现有方法有提高, 证明了BPI-BERT的有效性.
2022, 31(6):245-251. DOI: 10.15888/j.cnki.csa.008520 CSTR:
摘要:为提高变电站设备缺陷的检测精度, 保障变电站运行安全, 提出一种基于改进YOLOv4的缺陷检测算法. 不同于原始YOLOv4, 该算法使用一维卷积替代全连接来优化CBAM卷积注意力模块, 然后将其嵌入主干网络中以增强特征提取能力; 同时, 在特征融合中应用空洞卷积扩大感受野, 聚合更广的语义信息. 该算法在现场拍摄的样本集上进行测试, mAP可达到86.97%, 相比原始YOLOv4提高了2.78%. 实验结果表明, 本文提出的YOLOv4改进算法能够提升网络性能, 更好地应用于变电站设备缺陷检测任务.
2022, 31(6):252-258. DOI: 10.15888/j.cnki.csa.008489 CSTR:
摘要:在推荐时引入知识图谱中的实体及关系信息是有效缓解冷启动问题的方法. HAN模型首次将基于注意力机制的图神经网络用于异构图, 但是并没有充分利用节点的高阶邻居信息. 为了解决该问题, 提出了一种融合协同知识图谱高阶邻居特征的推荐模型CKG-HAN. 该模型用元路径来连接项目节点, 将协同知识图谱分成多个子图, 模型的节点注意力层用于聚合子图中每个节点的高阶邻居特征, 关系注意力层给不同元路径下的节点特征分配不同的权重, 最终得到充分融合语义信息的节点嵌入表示. 在MovieLens-1M数据集上进行了Top-K推荐, 结果表明本文提出的模型能够有效提高推荐结果的准确性.
2022, 31(6):259-264. DOI: 10.15888/j.cnki.csa.008535 CSTR:
摘要:随着社会经济的发展, 糖尿病视网膜病变患者越来越多, 为了减少患者的致盲率, 早期诊断至关重要. 其中眼底硬性渗出物的检测是诊断的重要环节, 传统的检测方法受到主观因素的影响, 准确度不高且效率较低, 为了辅助医生进行检测, 本文提出了一种基于IHBMO-RF算法的眼底硬性渗出物的检测算法, 通过引入佳点集原理对蜂群进行初始化, 不但能保持蜂群的多样性, 而且还能加快蜂群的收敛速度, 解决了机器学习中面临的局部最优的困境. 在公开的眼底数据库DiaretDB1下进行实验显示, 本文使用的算法准确率达到了95.4%, 与现有研究对比, 取得了较好的效果, 对辅助检测眼底硬性渗出物具有一定的意义.
2022, 31(6):265-270. DOI: 10.15888/j.cnki.csa.008502 CSTR:
摘要:现如今智慧社区正在快速发展, 各种公共设施及建筑的建设使得社区内环境复杂, 影响着居民中弱势群体的安全. 故实时的居民定位便格外重要. 智慧定位作为精准化智慧服务之一, 主要通过RFID技术实现社区内老幼等人群的轨迹跟踪, 以进行安全保障. 除此之外还可分析居民聚集场所趋势, 为社区建设公共设施提出建议. 本文针对RFID阅读器传播数据时被各种噪声影响导致的定位精度差、定位结果偏差等传统问题, 引用了Kalman滤波消除信号传递过程中的过程噪声和观测噪声, 在该算法中插入改进的密度聚类算法以消除环境噪声影响, 设计了基于改进密度聚类算法的Kalman滤波轨迹定位方法(Kalman filter for improved density peak clustering, K-IDPC). 经实验验证, 相对于Kalman滤波, K-IDPC的定位精度在0.565 m左右, 准确度大幅提高.
2022, 31(6):271-278. DOI: 10.15888/j.cnki.csa.008543 CSTR:
摘要:为了有效解决二次误差测度算法(quadric error metrics, QEM)容易产生异常三角面、失去局部特征、几何结构异常等问题, 提出一种结合边分割的改进二次误差测度算法(quadric error mactrics with edge splitting, ESQEM). 该算法添加顶点高斯曲率作为边折叠代价之一, 通过参数调节模型特征保留情况; 添加边长查询机制, 对细长三角面进行边分割操作. ESQEM算法能有效维护网格模型高曲率区域特征、保持网格几何结构、消除狭长三角面, 简化后的模型有更好的视觉效果, 高简化率下的简化精度更高.
2022, 31(6):279-286. DOI: 10.15888/j.cnki.csa.008570 CSTR:
摘要:单边侧入式大尺寸导光板存在网点分布不均、缺陷大小与形态不一、背景纹理复杂等特点, 而人工选取特征的传统机器视觉方法泛化能力不强. 基于此, 本文提出一种基于改进YOLOv3的大尺寸导光板缺陷检测方法. 首先, 在网络浅层特征层引入改进多分支RFB模块, 增大网络感受野, 丰富目标语义信息, 加强特征提取能力; 其次, 利用深度可分离卷积替换标准卷积, 缩减模型大小和计算量; 进而, 改进K-means算法, 对聚类出的锚框进行线性缩放, 使之更加贴近真实框; 最后, 利用在生产现场采集的大尺寸导光板缺陷图片进行了大量的实验研究. 实验结果表明, 本文提出的检测算法平均精度达到98.92%. 与YOLOv3相比, 平均准确率、F1值分别提升了8.55%、10.76%, 检测速度达到71.6 fps, 可满足工业生产检测要求.
2022, 31(6):287-293. DOI: 10.15888/j.cnki.csa.008548 CSTR:
摘要:过度捕捞和非法捕捞给海洋生态造成严重破坏, 随着船舶自动识别系统(AIS)的发展, 国内外学者基于AIS轨迹数据提出了许多算法进行渔船作业类型识别, 但是这些算法忽视了轨迹的时域特征. 因此, 本文提出了一种基于滑动窗口和LSTM自动编码器的识别算法, 该算法首先使用滑动窗口提取轨迹特征, 再通过LSTM自动编码器去学习轨迹的时域特征和潜在的高级特征, 最后在LSTM自动编码器中嵌入Softmax分类器, 联合优化损失函数, 使分类效果达到最优. 在浙江海域的渔船AIS轨迹数据上进行了实验, 结果表明所提方法的准确率为95.82%, 证明了本方法的有效性和可靠性, 算法可用于辅助拖网、围网作业类型的判断.
2022, 31(6):294-299. DOI: 10.15888/j.cnki.csa.008518 CSTR:
摘要:为了提高无线传感器网络定位精度的准确性, 对质心定位算法进行优化. 在测距阶段, 采用均值滤波和中值滤波相结合的方式对RSSI值进行预处理; 在定位阶段, 使用距离倒数的指数幂对质心加权; 同时引入迭代的思想, 解决了定位中锚节点密度不高的情况下, 节点无法定位的问题. 实验结果表明, 本文改进的算法与质心定位算法和距离加权的质心定位算法相比, 能够有效地提高无线传感器网络的定位精度.
2022, 31(6):300-306. DOI: 10.15888/j.cnki.csa.008366 CSTR:
摘要:为解决油田作业现场烟火预警依赖人工巡检、不能及时发现等问题, 本文提出了改进的YOLOv4烟火检测算法. 具体针对摄像头距离远导致的烟火目标小、不易被识别的问题, 改进了网络特征融合部分, 并添加金字塔卷积PyConv, 增强细节提取能力、增大局部感受野. 针对油田作业现场的复杂背景干扰问题, 加入注意力机制, 用于加强网络对重要特征的权重计算, 同时减少非关键数据的计算量. 最后通过聚类算法对目标样本锚定框优化, 利用自建烟火数据集进行实验, 实验结果证明, 改进后的算法模型具有相当高的性能, MAP达到90%以上, 能够在复杂背景下对较小烟火目标保持较高的识别率, 说明改进后的算法在油田作业现场烟火识别中具有较高实用价值.
2022, 31(6):307-314. DOI: 10.15888/j.cnki.csa.008553 CSTR:
摘要:针对学生课堂行为状态识别准确率较低的问题, 提出一种基于YOLOv4的改进模型. 通过建立学生课堂行为状态数据集, 调整YOLOv4算法训练模型的参数, 修改卷积块激活函数为ELU函数以优化模型, 同时提出将DIoU-Soft-NMS作为非极大值抑制机制, 识别分析教室中学生课堂行为状态; 根据各状态持续时长及状态变化频率计算学生听课有效时长, 并参考山东高考赋分原则, 建立学生课堂注意力量化评价准则, 同时建立教师课堂授课效果量化评价标准. 实验结果表明, 以同一评价指标衡量模型, 该模型在学生课堂行为检测速率不变的情况下, 平均精度均值(mAP)达到98.8%, 比原YOLOv4模型提升了3.53%, 学生服课堂注意力量化评价准则, 有较高的契合度.
2022, 31(6):315-323. DOI: 10.15888/j.cnki.csa.008510 CSTR:
摘要:随着网络剧近年来的飞速发展, 对播放量的研究也逐渐受到关注. 网络剧播放量反映了网络剧的口碑和受欢迎程度, 这与制作方和投资方的收益密切相关. 但目前的研究尚未考虑观众评论的情感态度对播放量的影响, 并且预测模型也较为简单, 预测精度有待进一步提高. 本文在对用户评论进行情感分析的基础上, 构建Stacking集成学习模型对我国网络剧的播放量进行预测. 首先基于SO-PMI算法构建网络剧领域情感词典, 并结合基础情感词典以及点赞数权重计算出评论情感得分, 加入预测指标体系中; 接着以随机森林(random forest, RF), GBDT, XGBoost以及LightGBM为基学习器, MLR为元学习器, 构建Stacking网络剧播放量分阶段的预测模型, 使用当前数据对下一周的播放量进行预测; 最后进行模型比较分析, 并得出预测变量的重要性分值. 实验结果显示, 本文所构建的模型判定系数R方值达到了0.89, 高于基学习器单独的模型预测R方值 (最高0.84)以及未加入情感得分变量的Stacking模型预测R方值 (0.81). 可以得出加入情感得分变量后, 本文构建的Stacking集成学习模型在一定程度上可以提高网络剧播放量的预测精度.
2022, 31(6):324-330. DOI: 10.15888/j.cnki.csa.008481 CSTR:
摘要:该文主要对Zero-DCE (zero-reference deep curve estimation)图像增强网络进行改进. 针对图像在每层卷积过后, 图像内容细节随之丢失和噪声问题. 提出改进网络结构, 卷积层保留图像的主要内容, 增加反卷积层则用来补偿细节信息. 另外通过传递卷积层的特征图到反卷积层, 有助于解码器拥有更多的图像细节信息, 从而得到更好的干净图像. 此外引进残差网络, 对输入噪声图像和输出干净图像做差用于学习一个残差, 在降噪的同时也提升了图像清晰度. 最后通过图像质量评估方法PSNR (peak signal to noise ratio)和SSIM (structural similarity index)以及傅里叶变换进行测试分析, 结果表明提出的改进结构可以增加图像的细节信息并达到降噪效果.
2022, 31(6):331-338. DOI: 10.15888/j.cnki.csa.008507 CSTR:
摘要:由于风浪数据的随机性, 复杂性, 影响因素多, 多为时间序列的特点, 造成了传统预测模型预测难度大, 精确率低, 构建了基于随机森林的注意力机制与双向长短期记忆神经网络相结合的海浪预测模型. 该模型对输入进行优化, 可以使用过去和未来的数据信息进行预测, 提高了海浪波高的预测精度. 该模型利用随机森林对输入变量筛选优化, 降低网络复杂度, 然后将注意力机制与双向长短期记忆神经网络相结合建立预测模型, 并利用实际数据进行验证. 结果显示, 和BP, LSTM, BiLSTM模型比较, RF-BiLSTM模型的预测精度更高, 拟合程度更好, 在海浪数值的预测预报中有重要意义.
2022, 31(6):339-346. DOI: 10.15888/j.cnki.csa.008546 CSTR:
摘要:通用深度学习算法提取的医学手骨图像特征不能很好地区分相近年龄图像的差异, 这导致骨龄分类器的预测精度较低. 根据基于深度学习的轻量级神经网络MobileNet设计了一种改进的骨龄分类器RIL-MobileNetV3 Large, 通过改进LBP处理层得到了具有细致纹理特征的手骨数据集并引入注意力机制进行自动定位, 通过学习处理层处理后的手骨X光片中的深层区域特征完成识别和骨龄的分类, 在公共数据集上进行实验并对该分类器进行多次训练调优, 结果表明改进设计的分类器在骨龄预测中具有高达94.204%的准确率和0.350岁的均值误差, 而且改进的轻量级网络为可移动智能便携预测骨龄奠定基础.
2022, 31(6):347-353. DOI: 10.15888/j.cnki.csa.008547 CSTR:
摘要:随着人脸识别技术的不断进步以及人脸卡口的大范围且密集的部署, 本文针对团伙犯罪案件侦察这一应用场景, 对人脸卡口数据进行深入挖掘, 探究其中行人间的共现关系, 获取所关注的嫌疑人的现实社交网络, 锁定团伙其余人员. 经过实验比对和论证, 本文使用Chinese Whispers聚类算法对行人节点进行识别, 通过Faiss加速邻接边的构建, 加速图的初始化步骤, 解决其聚类效率低下的问题. 在此基础上, 使用共现频次和Apriori算法中的置信度挖掘行人间的共现关系, 构建行人共现关系图谱.
2022, 31(6):354-360. DOI: 10.15888/j.cnki.csa.008527 CSTR:
摘要:为了减少电厂污染物的排放, 如何准确估计燃气轮机氮氧化物(NOx)排放值并识别其关键影响因素, 对有效采取优化设计是至关重要的. 由于燃气轮机的运作过程存在变工况等情况, 单一模型的准确度与泛化性能难以达到工业应用的要求. 将偏最小二乘法(PLS)和互信息(MI)组合建模保证了NOx特征变量选取的有效性与精确性. 利用PLS确定影响燃气轮机NOx的特征变量数目, 避免了选择变量的主观因素并降低维数. 再用互信息(MI)选择出最优的特征变量, 通过不同的预测模型进行仿真分析, 并把单一和组合特征选择进行对比. 结果表明, 对燃气轮机NOx排放影响因素的研究中, PLS-MI组合模型选取的特征变量更具代表性, 并能够保证预测模型的泛化精度, 降低模型复杂度, 为电厂优化控制提供了理论依据, 具有一定的应用前景.
2022, 31(6):361-367. DOI: 10.15888/j.cnki.csa.008536 CSTR:
摘要:针对信用卡欺诈检测中样本数据规模大, 计算复杂程度高, 数据分布极度不平衡等问题, 提出卷积神经网络(CNN)结合大规模信用卡交易数据进行欺诈检测, 同时为了解决交易数据的极端不平衡性问题, 使用K-means算法进行聚类, 结合支持向量机合成少数类过采样技术(SVMSMOTE)增加少数类样本数量, 最终构建一个KM-SVMSMOTE-CNN的信用卡交易欺诈预测模型. 选取Kaggle平台上发布的信用卡欺诈数据进行验证, 实验结果表明, 基于KM-SVMSMOTE-CNN的融合模型从整体上大大提高了信用卡欺诈检测的识别率.
2022, 31(6):368-375. DOI: 10.15888/j.cnki.csa.008491 CSTR:
摘要:为解决西装定制企业中用户定制款式信息未充分利用这一问题, 结合关联规则FP-growth算法对多维大型数据集进行挖掘时, 存在内存资源消耗较大以及执行效率不高的问题, 本文提出一种改进FP-growth融合K-means算法的西装定制搭配挖掘方法, 对FP-growth算法从使用哈希表建立项头表、有序FP-tree代替传统FP-tree建树过程和新增不平衡比评价指标3个角度对其进行改进. 实验结果表明, 与其他关联规则算法对比, 改进FP-growth算法的内存资源使用减少了约6.7%、执行效率提高了15%左右; 通过人工审核实验结果得出, 该算法将挖掘出用户感兴趣且有意义的关联规则, 验证该算法提出的可行性.
2022, 31(6):376-380. DOI: 10.15888/j.cnki.csa.008501 CSTR:
摘要:为了提高疾控中心进行大规模数据交换的处理效率, 基于线程池与消息中间件技术设计并实现了一个数据交换处理模型, 该模型在调用数据接口并记录接口反馈信息的基础上自动构造数据交换任务, 使用消息中间件快速保存反馈信息, 使用线程池并通过合理设置线程池的参数实现了数据交换任务的并发控制. 仿真实验结果表明, 相对于传统的数据交换处理方式, 该模型在保证数据交换稳定性的同时极大提高了数据交换任务的处理效率.
2022, 31(6):381-387. DOI: 10.15888/j.cnki.csa.008511 CSTR:
摘要:针对服装图像分类模型的参数量过大, 时间复杂度过高和服装分类准确度不高等问题. 提出了一种利用网络剪枝方法和网络稀疏约束, 减少卷积神经网络Xception中从卷积层到全连接层的冗余参数, 增加网络的稀疏性和随机性, 减轻过拟合现象, 在保证不影响精度的前提下尽可能降低模型的时间复杂度和计算复杂度. 此外在卷积层引入了注意力机制SE-Net模块, 提升了服装图像分类的准确率. 在DeepFashion数据集上的实验结果表明, 使用网络剪枝方法缩减的网络模型在空间复杂度上和时间复杂度上均有所降低, 服装图像分类准确率和运行效率与VGG-16, ResNet-50和Xception模型相比均有所提升, 使得模型对设备的要求更低, 深度卷积神经网络在移动端、嵌入式设备中使用成为可能, 在实际服装领域的电商平台的应用中有比较高的使用价值.
2022, 31(6):388-393. DOI: 10.15888/j.cnki.csa.008530 CSTR:
摘要:针对文本和图像模态在高维空间中相互映射的困难问题, 提出以全局句子向量为输入, 以堆叠式结构为基础的生成对抗网络(GAN), 应用于文本生成图像任务. 该网络融入双重注意力机制, 在空间和通道两大维度上寻求特征融合的更大化, 同时增加真实度损失判别器作为约束. 所提方法在加利福尼亚理工学院的CUB鸟类数据集上实验验证, 用Inception Score和SSIM作为评估指标. 结果表明, 生成图像具有更真实的细节纹理, 视觉效果更加接近于真实图像.
2022, 31(6):394-399. DOI: 10.15888/j.cnki.csa.008569 CSTR:
摘要:溯源可以辨别产品的真伪也可对流动人员的行动轨迹进行监控, 但由于数据存储时的安全问题很容易导致查询到虚假信息. 为了确保数据的真实性和可靠性, 我们提出了基于区块链对溯源数据的多方共享系统. 所提出的架构采用星际文件系统与区块链存储相结合的方式处理溯源数据量大的问题, 这样不仅可以大大缓解数据的存储压力还可以对链上数据施加另一层保护. 在安全问题上, 采用区块链和安全多方计算协议相结合的方法, 处理系统对外非法侵、对内横向渗透和隐私泄露的问题.