2021, 30(2):1-11. DOI: 10.15888/j.cnki.csa.007777
摘要:基于多模态生理数据的连续情绪识别技术在多个领域有重要用途, 但碍于被试数据的缺乏和情绪的主观性, 情绪识别模型的训练仍需更多的生理模态数据, 且依赖于同源被试数据. 本文基于人脸图像和脑电提出了多种连续情绪识别方法. 在人脸图像模态, 为解决人脸图像数据集少而造成的过拟合问题, 本文提出了利用迁移学习技术训练的多任务卷积神经网络模型. 在脑电信号模态, 本文提出了两种情绪识别模型: 第一个是基于支持向量机的被试依赖型模型, 当测试数据与训练数据同源时有较高准确率; 第二个是为降低脑电信号的个体差异性和非平稳特性对情绪识别的影响而提出的跨被试型模型, 该模型基于长短时记忆网络, 在测试数据和训练数据不同源的情况下也具有稳定的情绪识别性能. 为提高对同源数据的情绪识别准确率, 本文提出两种融合多模态决策层情绪信息的方法: 枚举权重方法和自适应增强方法. 实验表明: 当测试数据与训练数据同源时, 在最佳情况下, 双模态情绪识别模型在情绪唤醒度维度和效价维度的平均准确率分别达74.23%和80.30%; 而当测试数据与训练数据不同源时, 长短时记忆网络跨被试型模型在情绪唤醒度维度和效价维度的准确率分别为58.65%和51.70%.
2021, 30(2):12-19. DOI: 10.15888/j.cnki.csa.007520
摘要:随着信息技术在工业控制系统(Industrial Control System, ICS)的广泛应用, 工业控制系统从封闭系统逐步转化为开放互联系统, 进而使工业控制系统面临信息技术带来的网络安全挑战. 首先, 本文借用ICS安全事件详细阐述了工业控制系统信息安全的现状; 其次, 重点介绍了工业控制系统架构和ICS信息安全与传统信息安全的差异; 再次, 从学术研究的角度, 对2018年第五届ICS-CSR会议论文进行细致研究, 从系统架构和通信协议两个方面对提出的安全解决方案进行分类和详细的分析. 最后, 根据会议中的安全解决方案和实际的安全需求, 文章提出3个重点研究方向, 分别为网络攻击模型、ICS仿真平台和非技术型人机界面.
2021, 30(2):20-27. DOI: 10.15888/j.cnki.csa.007748
摘要:针对人工提取特征的单一性及卷积神经网络提取特征的遗漏性问题, 提出了一种基于多特征加权融合的静态手势识别方法. 首先, 提取分割后的手势图像的傅里叶和Hu矩等形状特征, 将两者融合作为手势图像的局部特征; 设计双通道卷积神经网络提取手势图像的深层次特征, 采用主成分分析方法对提取的特征进行降维; 然后, 将提取的局部特征和深层次特征进行加权融合作为手势识别的有效特征描述; 最后, 使用Softmax分类器进行手势图像分类. 实验结果验证了提出方法的有效性, 在手势图像数据集上的识别准确率达到了99%以上.
2021, 30(2):28-34. DOI: 10.15888/j.cnki.csa.007601
摘要:针对爬壁机器人建模不准确及容易受外部扰动的影响造成位置及姿态误差的问题, 提出了一种基于改进型非线性干扰观测器的轨迹跟踪控制方案. 首先通过反演控制设计了一个运动学控制器为机器人动力学控制提供参考质心速度与角速度. 其次应用改进型非线性扰动观测器作为前馈控制对建模误差及外部扰动进行估计, 并保证扰动误差以指数形式收敛. 最后针对引入干扰观测器的动力学模型设计了滑模控制器. 该方案对外界干扰进行了快速补偿, 并通过Lyapunov定理证明了其稳定性. 仿真结果表明该控制方法对于克服建模误差及外界干扰具有较好的效果.
2021, 30(2):35-42. DOI: 10.15888/j.cnki.csa.007769
摘要:为获得比较理想的图像压缩比和清晰的压缩后图像, 使用了奇异值分解作为数据矩阵的压缩原理. 详细解析了奇异值分解的原理及用奇异值分解压缩图像的原理. 提出了按特征值个数占比阈值、按特征值之和占比阈值两种取特征值个数的方法. 实验表明, 特征值个数占比阈值在0.1时, 图像清晰且压缩比达到5.99; 特征值之和占比阈值在0.85时, 图像清晰, 对PNG格式图像压缩比达到7.89, 对JPG格式图像压缩比达到5.92. 从实验的个例来看, 前1%的特征值表征了较多份量的数据特征, 在征值个数占比阈值确定时, 对PNG格式和对JPG格式图像压缩比相同; 在特征值之和占比阈值确定时, 对PNG格式相对比对JPG格式图像压缩比要高. 认为按特征值之和占比阈值取特征值个数这种压缩方法更具普适性, 可适用于Alpha通道冗余的情况, 并可为大规模数量的图像压缩设定统一的特征值之和占比阈值.
2021, 30(2):43-51. DOI: 10.15888/j.cnki.csa.007798
摘要:在全球化时代, 随着人员流动频率的增加, 疫病的传播途径种类和速度都大大超过以往. 阐述了建立基于区块链技术的人员流动信息监管系统的基本原理和方法, 在重大传染病疫情发生时, 对来自疫区的人员以及确诊或疑似患者的人员流动信息实时监控, 查询人员流动历史, 寻找密切接触者, 搜索感染源, 以采取隔离等措施进行疫情防控工作.
许思特,黄子硕,马振凯,吴斌,刘佳兴,盛韬,戴瑞明,罗力,张天天
2021, 30(2):52-62. DOI: 10.15888/j.cnki.csa.007791
摘要:为客观评估医保定点零售药店的履约情况, 为医保经办部门的监管工作提供信息化的管理手段, 本研究研发了一种医保定点零售药店履约考核系统. 根据医保定点零售药店设置标准, 基于Node.js与REST风格, 采用Vue.js与Django Rest Framework框架, 构建评估系统. 所建系统完成上海市881家医保定点零售药店履约考核, 完成全市定点药店履约数据库的构建, 并出具定制化的考核结果报告. 本系统使零售药店考核相关管理工作变得简单便捷, 全市考核周期由4周缩至1周, 减少行政人力128人月/年. 为药店管理者、专家考核组和行政监管者提供了工作辅助与决策依据, 满足各方信息化需要, 助力医保服务更好惠民利民.
2021, 30(2):63-69. DOI: 10.15888/j.cnki.csa.007639
摘要:针对在法院立案-审判-执行全流程阶段, 多起案件中存在的当事人或者案件事实相同的情况, 即“一人多案”, 造成了司法资源浪费与不合理使用, 设计实现了基于深度学习的“一人多案”风险预警系统. 该系统基于深度学习技术和海量裁判文书数据, 通过对案件文本的向量表示建模, 提出了面向法律文书的案由识别和相似度量方法, 结合法律业务规则进行“一人多案”关联识别, 并给出风险预警报告. 该系统能够为司法资源统筹提供技术支持, 为法院公正、高效地审理案件提供保障.
2021, 30(2):70-76. DOI: 10.15888/j.cnki.csa.007731
摘要:工业巡检中人员的行为与生产安全息息相关, 有关巡检监测方法的设计成为了研究热点. 针对目前巡检监控分析依赖于人工判断且精度低的问题, 本文提出了一种基于机器视觉的工业现场巡检过程监控分析系统. 首先利用YOLOv3网络对将视频流中的人员进行检测, 根据检测结果, 使用人员行为分析方法, 剔除场景内干扰并获取巡检人员真实的行为信息, 最后根据人员行为信息对巡检过程进行评估, 将评估结果存储至数据库同时发布至网页. 本文使用多个监控视角的视频进行实验, 实验结果表明, 本文所提系统在复杂环境下, 能够准确检测巡检人员并分析其行为, 同时满足实时处理的需求. 本文可以为工业巡检的智能化监测提供参考.
2021, 30(2):77-82. DOI: 10.15888/j.cnki.csa.007778
摘要:FPGA因具有较好的并行处理能力和灵活性, 使其在卷积神经网络硬件加速计算中得到广泛的应用, 但是传统的FPGA图像卷积实现中存在模块化设计以及空间开销较大的问题. 本文提出了一种面向硬件加速的通用图像卷积开发平台. 通过模块化设计, 极大提高针对不同卷积核实现图像卷积开发的灵活性; 另外通过图像批次处理技术, 充分利用数据重复性实现内存共享, 较好地降低了存储空间的开销. 实验结果表明, 本文设计的平台在模块化设计方面提供了更好的可重配置架构, 非常适于实验教学应用; 在存储空间需求方面, 当并行度提高时, BRAM的复杂度只是线性增加, 这对于功耗的降低具有优势.
2021, 30(2):83-88. DOI: 10.15888/j.cnki.csa.007818
摘要:纺织工业是我国的支柱型产业. 在布匹生产过程中, 布匹瑕疵是影响布匹质量的关键因素. 目前纺织服装生产企业主要通过传统的人工肉眼检测布匹瑕疵, 成本高、效率低, 且漏检率与误检率高. 本研究针对布匹数据集中类别数量不均匀的特点, 对数据进行增强. 在布匹瑕疵类别识别上, 采用Faster RCNN模型, 并针对布匹数据集中瑕疵目标小的特点, 对Faster RCNN模型中的RPN网络进行改进. 另外, 本研究基于模型开发一款纺织布匹瑕疵识别系统, 将通过模型识别出的布匹瑕疵类别结果通过可视化平台展现, 同时准确标识疵点的位置. 通过实验结果对比, 本文的方法平均检测准确率为79.3%, 相比Fast RCNN提高了5.75%.
2021, 30(2):89-96. DOI: 10.15888/j.cnki.csa.007795
摘要:针对大坝监控数据存在的安全性与可靠性隐患问题, 本文提出了一种基于区块链(BC)的由传感器云和无人机云组成的系统架构, 以用于监控大坝和确保数据的安全性与可靠性. 其中传感器云提供各种感测数据, 无人机(UAV)云则收集这些数据并将其传送到大坝监控中心(DMC), 区块链技术用于保证数据的完整性、真实性、安全性和可追溯性. 分析表明, 所提出的系统具有很好的伸缩性, 并可以有效保证大坝监测数据来源的可靠性, 数据传输的安全性以及预防潜在的数据攻击. 最后, 本文通过评估数据传递延迟率来评估工作绩效, 仿真结果表明, 所设计系统的延迟率与生成事件概率、重访时间成正相关, 与警报间隔时间成负相关, 且具有更高的支付成功率.
2021, 30(2):97-102. DOI: 10.15888/j.cnki.csa.007796
摘要:当前, 电网中含有海量的多源信息数据, 但是由于数据体量大、种类多、维度高, 难以实现高效有效的数据检索. 因此本文根据实际电力运行系统的数据结构及多源数据库样本分析, 提出了一种基于互信息的改进决策树算法作为数据挖掘内核, 并提出适用于电力系统的并行处理架构, 可实现多源数据的快速、有效信息检索, 并有效处理实时数据. 在搜索时根据代表性特征子集直接从多源信息原始数据提取信息, 判断索引信息量并排序形成决策树模型, 通过Spark MapReduce Python数据分解并行检索实现多源数据同时提取, 缩短检索时间. 本文以某区域电网数据库为算例进行模拟验证, 结果表明: 该方法可以实现配电网的多源异构信息提取, 有效避免重复数据, 满足在线工程决策要求.
2021, 30(2):103-109. DOI: 10.15888/j.cnki.csa.007773
摘要:植被、地形以及人工建构筑物是三维虚拟地理场景可视化表达的基本内容, 树木是植被的主要组成部分. 由于树木自然形态的复杂性, 其真实感表达非常困难. 基于几何模型的树木表达可以产生逼真的细节, 但场景实时渲染具有巨大的计算负担, 而基于纹理的简化模型在真实感表达上有所欠缺, 但具有更好的渲染性能. 如何兼顾场景渲染效率与视觉真实感受一直是树木三维可视化表达的研究热点. 本文提出一种基于自适应布告板的三维树木表达方法, 该方法在通常的平面布告板方法基础上, 根据视点与布告板的相对位置关系, 从预先获得的多张树木影像中选取最符合视点与树木相对位置关系的影像作为树木纹理渲染于该布告板上, 实现了布告板纹理的动态调整, 使得不同视点下的树木渲染效果尽量接近真实, 同时也具有布告板的渲染性能优势. 本文基于WebGL在浏览器中构建了一个三维场景, 其中包含若干树木模型. 实验结果表明本方法在表达树林时, 在浏览器这样的低渲染计算能力环境下也能取得可接受的渲染性能与表达效果.
2021, 30(2):110-116. DOI: 10.15888/j.cnki.csa.007633
摘要:针对无人机倾斜摄影技术在复杂地形条件下三维实景建模的可行性及其精度是否满足实际大比例尺测量要求的问题, 本文以福州市马尾区阳光学院校园为例, 采用大疆经纬系列无人机搭载云眼系列五镜头相机的方式完成测区倾斜影像数据的采集. 采用实时动态(Real-Time Kinematic, RTK)连接千寻CORS账号的量测方式完成测区控制点的采集. 利用Bentley公司的实景建模软件ContextCapture对外业采集的数据进行内业处理, 得到了该校园的高分辨率的三维实景模型、数字表面模型(DSM)和真正射影像(TDOM), 并对三维模型进行精度分析. 为了保证模型的精度, 实验过程中通过布设较多控制点, 分块航测, 提高航向和旁向重叠度来提高模型精度. 实验结果表明, 与地面实测数据相比, 采用上述技术所建立的校园三维实景模型的平面位置中误差和高程中误差均小于5 cm, 满足实际大比例尺测量的要求, 可为后期校园三维实景模型的二次开发提供重要的数据支持.
2021, 30(2):117-124. DOI: 10.15888/j.cnki.csa.007768
摘要:目前, 车载自组网(VANET)在汽车行业和研究领域都得到了极大的关注, 尤其是在用户的隐私保护方面. 雾计算是云计算的延伸, 它能够有效的减小网络延迟, 其反应性更强. 相较云计算, 使用雾计算减少了发送到云端和从云端发送的数据量, 安全风险也得到了进一步的降低. 由于基于密文策略的加密(CP-ABE)适用于存储在云上的数据的细粒度的访问控制以及基于关键字的可搜索加密可以使用户快速查找存储在云服务器上的感兴趣数据和不泄露任何搜索关键字的信息. 因此, 本文提出了基于属性的可搜索加密和属性更新, 它是将基于属性的加密方案和关键字搜索加密方案相结合. 该方案支持用户属性更新, 不合法车辆用户不会对存储的数据有访问权限, 从而实现对不合法车辆用户的撤销. 同时它也实现了车-雾-云三者之间的通信, 在通信过程中其将部分加密和解密计算外包给雾节点, 减少了用户的计算代价. 此外, 通过性能分析表明了所提方案在功能性和计算复杂度两方面都具有较好的优势.
2021, 30(2):125-131. DOI: 10.15888/j.cnki.csa.007530
摘要:目前大部分已经存在的多标记学习算法在模型训练过程中所采用的共同策略是基于相同的标记属性特征集合预测所有标记类别. 但这种思路并未对每个标记所独有的标记特征进行考虑. 在标记空间中, 这种标记特定的属性特征对于区分其它类别标记和描述自身特性是非常有帮助的信息. 针对这一问题, 本文提出了基于标记特定特征和相关性的ML-KNN改进算法MLF-KNN. 不同于之前的多标记算法直接在原始训练数据集上进行操作, 而是首先对训练数据集进行预处理, 为每一种标记类别构造其特征属性, 在得到的标记属性空间上进一步构造L1-范数并进行优化从而引入标记之间的相关性, 最后使用改进后的ML-KNN算法进行预测分类. 实验结果表明, 在公开数据集image和yeast上, 本文提出的算法MLF-KNN分类性能优于ML-KNN, 同时与其它另外3种多标记学习算法相比也表现出一定的优越性.
2021, 30(2):132-139. DOI: 10.15888/j.cnki.csa.007821
摘要:LTE-V可以为车辆提供可靠、高效的通信能力. 在LTE-V中, 车辆用户(Vehicle User Equipment, VUE)有集中式(Mode 3)和分布式(Mode 4)两种通信模式. 针对密集场景中两种模式由于VUE数目过多产生的数据包碰撞问题, 本文依据通信时延、距离等指标对车联网应用进行划分, 提出一种车辆自主调度算法, 使不同应用按自身性能要求选择合适的通信模式进行通信, 以减轻密集场景下的车联网资源分配压力. 通过搭建Matlab仿真平台验证算法性能, 结果表明, VUE使用车辆自主调度算法在密集场景下的数据包投递率(Packet Delivery Ratio, PDR)能够保持在0.6以上, 优于单一通信模式下的主流资源调度算法.
2021, 30(2):140-146. DOI: 10.15888/j.cnki.csa.007762
摘要:传统的协同过滤算法没有充分考虑用户和商品的交互信息, 且面临数据稀疏、冷启动等问题, 造成了推荐系统的结果不准确. 在本文中提出了一种新的推荐算法, 即基于融合元路径的图神经网络协同过滤算法. 该算法首先由二部图嵌入用户和商品的历史互动, 并通过多层神经网络传播获取用户和商品的高阶特征; 然后基于元路径的随机游走来获取异质信息网络中的潜在语义信息; 最后将用户和商品的高阶特征和潜在特征融合并做评分预测. 实验结果表明, 基于融合元路径的图神经网络协同过滤算法比传统的推荐算法有明显提升.
2021, 30(2):147-153. DOI: 10.15888/j.cnki.csa.007770
摘要:在作业现场的安全管理中, 对于非施工人员围栏跨越的监管一直是必不可少的. 但目前施工场地普遍存在作业面广、施工人员管理困难等问题, 导致人工监察的方式效率低下. 而基于视频的人体行为检测技术作为计算机视觉领域重要的研究热点, 在公共安全监控方面有着广泛应用. 因此针对传统人工监察的不足, 结合当前计算机视觉技术, 提出一种智能化的围栏跨越违规检测与识别方法. 该方法通过监控不断获取视频帧, 以视频帧组成的剪辑作为输入, 使用三维卷积和二维卷积分别提取时序和空间特征, 将两部分特征融合后进行分类和边界框回归. 最后通过设置对比试验以验证此方法效果, 实验结果表明, 该方法具有一定的泛化性.
2021, 30(2):154-159. DOI: 10.15888/j.cnki.csa.007698
摘要:参与式感知系统中, 由于感知数据质量可能受参与者影响, 提出了基于用户累积行为的信誉计算模型以帮助选择可信赖用户. 针对感知环境中用户群体的广泛性及核心用户的不确定性, 该模型采用OPTICS聚类算法定义用户场景并划分行为数据集, 建立用户累积行为信誉计算模型, 同时引入时间戳标记信息抛弃部分旧行为以更新用户信誉. 实验表明, 该信誉模型能够结合新旧行为较好地计算并调整用户信誉, 在感知环境用户信誉评价中具有良好的应用前景.
2021, 30(2):160-164. DOI: 10.15888/j.cnki.csa.007801
摘要:为了实现单目视觉系统的快速、精确的手眼标定, 本文提出了一种新的两步式手眼标定方法, 将手眼标定分为求解旋转关系和平移关系两步. 首先机器人携带标定板进行两次平移运动求解旋转关系, 然后机器人工具坐标系执行若干次旋转运动求解平移关系. 该方法简单快速, 不需要昂贵的外部设备, 通过实验最终验证了该方法的可行性.
2021, 30(2):165-170. DOI: 10.15888/j.cnki.csa.007761
摘要:针对采机场跑道异物FOD (Foreign Object Debris)检测问题, 本文设计了一套基于智能车载3D相机采集路面信息并进行异物检测的系统. 此系统通过深度图像的深度量化值分布差异初步筛除正常路面, 再经过点云异常值过滤与不均匀降样算法对参数进行纠正和数据量缩减, 精简后的点云通过对路面数据适应性改进的网络进行异物检测. 此网络采用PointCNN网络中的X卷积通过4次卷积提取点云数据进行空间特征, 尽可能的保留了异物目标的空间信息, 提高检测准确度. 通过对采集的数据进行测试实验, 本文设计的方法能够准确地识别出异物与非平整路面, 准确率接近90%.
2021, 30(2):171-175. DOI: 10.15888/j.cnki.csa.007779
摘要:自然场景下的文本检测任务是图像处理领域中的难点之一. EAST (Efficient and Accurate Scene Text detector)算法是近年来比较出色的文本检测算法, 但是增加后置处理之后的AdvancedEAST算法仍存在由于激活像素的头尾边界丢失导致的漏检情况, 对密集文本的检测效果也不是很理想. 因此提出了Dilated-Corner Attention EAST (DCA_EAST)改进算法, 对网络结构加入空洞卷积模块以及角点注意力模块, 改善了漏检情况. 针对损失函数, 加入类别权重因子和样本难度权重因子, 有效提升了密集文本的检测效果. 实验结果表明, 该算法在ICDAR2019的ReCTS数据集上准确率为93.02%, 召回率为76.69%, F-measured值为84.07%, 优于AdvancedEAST算法.
2021, 30(2):176-181. DOI: 10.15888/j.cnki.csa.007775
摘要:视频监控、军事目标识别以及消费型摄影等众多领域对图像清晰度有很高的要求. 近年来, 深度神经网络在视觉和定量评估的应用研究中取得较大进展, 但是其结果一般缺乏图像纹理的细节, 边缘过度平滑, 给人一种模糊的视觉体验. 本文提出了一种基于生成对抗网络的图像清晰度提升方法. 为了更好的传递图像的细节信息, 采用改进的残差块和跳跃连接作为生成网络的主体架构, 生成器损失函数除了对抗损失, 还包括内容损失、感知损失和纹理损失. 在DIV2K数据集上的实验表明, 该方法在提升图像清晰度方面有较好的视觉体验和定量评估.
2021, 30(2):182-187. DOI: 10.15888/j.cnki.csa.007780
摘要:本文提出一种基于无监督域自适应的行人重识别方法. 给定有标签的源域训练集和无标签的目标域训练集, 探索如何提升行人重识别模型在目标域测试集上的泛化能力. 以此为目的, 在模型的训练过程中, 将源域和目标域训练集同时输入到模型中进行训练, 提取全局特征的同时, 提取局部特征进行行人图像描述以学到更加细粒度的特征. 提出将长短时记忆网络(LSTM)以端到端的方式应用于行人的建模, 将其视为从头到脚的身体部分序列. 本文方法主要分为两个步骤: (1)利用StarGAN对无标签目标域图片进行数据增强; (2)源域和目标域数据集同时输入到全局分支和基于LSTM的局部分支共同训练. 在Market-1501和DukeMTMC-reID数据集上, 本文提出的模型都取得了较好的性能, 充分体现了其有效性.
2021, 30(2):188-193. DOI: 10.15888/j.cnki.csa.007782
摘要:特征选择是用机器学习方法提高转发预测精度和效率的关键步骤, 其前提是特征提取. 目前, 特征选择中常用的方法有信息增益(Information Gain, IG)、互信息和卡方检验(CHI-square test, CHI)等, 传统特征选择方法中出现低频词引起的信息增益和卡方检验的负相关、干扰计算等问题, 导致分类准确率不高. 本文首先针对低频词引起的信息增益和卡方检验的负相关、干扰计算等问题进行研究, 分别引入平衡因子和词频因子来提高算法的准确率; 其次, 根据微博信息传播的特点, 结合改进的IG算法和CHI算法, 提出了一种基于BIG-WFCHI (Balance Information Gain-Word Frequency CHI-square test) 的特征选择方法. 实验分析中, 本文采用基于最大熵模型、支持向量机、朴素贝叶斯分类器、KNN和多层感知器5种分类器对两个异构数据集进行了测试. 实验结果表明, 本文提出的方法能有效消除无关特征和冗余特征, 提高分类精度, 并减少运算时间.
2021, 30(2):194-200. DOI: 10.15888/j.cnki.csa.007783
摘要:针对现有模糊聚类分割算法对噪声的鲁棒性差且提取的图像特征不充分等问题, 本文提出了一种结合形态学重建和超像素的多特征模糊 C-均值(FCM)分割算法. 首先, 利用形态学闭合重建处理原图像, 提高了算法的鲁棒性和细节保护能力. 其次, 采用Mean-Shift方法预分割重建图像, 获得一组超像素区域. 再次, 提取重建图像各像素的颜色特征、纹理特征和梯度特征, 利用平均策略定义各超像素的颜色特征、纹理特征和梯度特征, 组成多维特征向量. 最后, 运用最大熵正则化的加权模糊 C-均值算法(EWFCM)的框架, 以超像素为单位, 以核诱导距离作为距离度量来聚类多维特征向量. 选取BSDS300数据集中的6幅图像完成实验对比. 结果表明, 本文算法具有更高的分割精度.
2021, 30(2):201-206. DOI: 10.15888/j.cnki.csa.007789
摘要:为提高CART (Classification And Regression Tree)决策树回归算法的准确性, 提出一种基于ELM (Extreme Learning Machine)的改进CART决策树回归算法——ELM-CART算法. 所提算法主要是在CART回归树创建过程中, 在每个叶节点使用极限学习机建模, 可以得到真正意义上的回归预测值, 提高泛化能力, 弥补CART决策树回归算法本身的容易过拟合以及预测输出为定值等缺点. 实验结果表明, 所提算法能够有效提高回归分析中目标数据的预测准确性, 其准确性优于所对比算法.
2021, 30(2):207-212. DOI: 10.15888/j.cnki.csa.007785
摘要:随着5G时代的来临, 诸如工业区, 校园网等开放性园区网络中存在大量的物联网(Internet of Things, IoT)终端, IoT终端由于其数据流量巨大, 伪造IoT终端进行网络攻击的问题日益严重. 现有IoT终端识别技术在面对海量数据时计算资源的成本逐渐提高. 针对以上问题, 提出了基于文件分时索引的大规模流量实时IoT终端识别算法. 首先, 建立内存分时索引元数据; 其次, 使用文件的分时索引来存储构建会话的中间数据; 最后, 控制内存分时索引元数据触发从少量文件中提取特征并进行IoT终端识别. 实验中, 在不损失IoT终端识别算法精度条件下, 仅消耗少量磁盘, 可将内存消耗降低92%. 实验结果表明, 该技术能够用于实时IoT终端识别框架中.
2021, 30(2):213-218. DOI: 10.15888/j.cnki.csa.007819
摘要:为解决因手写书法作品种类繁多而识别困难的问题, 降低人们观赏书法的门槛, 本文提出了基于深度学习的手写书法字体识别算法. 识别过程中首先使用投影法等图像处理方法对书法作品图像中的汉字进行定位和分割, 然后分别利用GoogLeNet Inception-v3模型和ResNet-50残差网络进行书体风格识别和字形识别. 实验结果表明, 本文算法能实现对整幅书法作品中楷书和篆书的书体风格以及字形的识别, 对楷书和篆书单字的识别率分别为91.57%和81.70%, 达到了实用的需求.
2021, 30(2):219-225. DOI: 10.15888/j.cnki.csa.007792
摘要:基于MapReduce的程序被越来越多地应用于大型数据分析的应用中. Apache Hadoop是最常用的开源MapReduce模型之一. 程序运行时间的缩短对于MapReduce程序以及所有数据处理应用而言至关重要, 而能够准确估算MapReduce程序的执行时间是优化程序的重要环节. 本文定义了一个在Hadoop2.x版本中能够准确估算MapReduce作业负载执行时间的性能模型. 该模型包括一个优先级树模型与一个排队网络模型, 分别用于展示一个MapReduce作业中不同任务之间的依赖关系及MapReduce作业内的同步约束. 最后, 实验证明了该模型的可用性.
2021, 30(2):226-230. DOI: 10.15888/j.cnki.csa.007793
摘要:针对分布式存储系统部分重复(Fractional Repetition, FR)码大都是同构的问题, 提出了基于Hadamard矩阵和基于[7, 3, 4]简单图形构造异构的FR码的两种新型构造设计算法, 构造方法更加简洁. 其中基于Hadamard矩阵构造存储容量异构的FR码可实现由同构经过简单变换为异构的编码方式; 基于[7, 3, 4]简单图形构造可扩展异构FR码可实现扩展延伸. 经过与RS码理论分析对比发现, 设计的两种异构FR码的修复局部性、修复带宽开销进一步降低, 且可以实现故障节点精确无编码修复, 修复复杂度较低, 修复效率较高, 减少了修复故障节点的时间.
2021, 30(2):231-236. DOI: 10.15888/j.cnki.csa.007788
摘要:针对新冠肺炎防控期间肉眼识别判断行人是否佩戴口罩效率低且存在较大风险的问题, 提出一种改进检测目标边框损失的自然场景下行人是否佩戴口罩的检测算法. 该算法对YOLOv3损失函数进行改进, 应用GIoU计算目标边界框损失, 完成自然场景下行人是否佩戴口罩的检测. 算法在开源的WIDER FACE数据集和MAFA数据集上训练, 采集自然场景图片进行测试, 行人是否佩戴口罩的mAP (mean Average Precision)达到了88.4%, 取得了较高的检测准确率, 在自然场景视频检测中平均每秒传输帧数达到38.69, 满足实时检测的要求.
2021, 30(2):237-242. DOI: 10.15888/j.cnki.csa.007797
摘要:研究社会化营销中的信息传播对提出合理策略建议、提升企业竞争力有重要意义. 信息传播是一个存在个体交互的复杂过程, 多数信息传播模型中对现实情况做了较多的简化, 没有考虑个体的异质属性对信息传播的影响, 也无法体现个体间的交互, 本文从复杂系统的角度研究信息传播过程, 运用多Agent方法建立信息传播模型, 并基于改进的Deffaunt模型建立多Agent交互机制, 通过模拟仿真分析了不同因素对信息传播的影响, 发现个体的异质属性、个体间的相互影响力以及外界环境的因素对信息传播的速度和范围均有一定的影响..
2021, 30(2):243-249. DOI: 10.15888/j.cnki.csa.007557
摘要:电力客服工单数据以文本形式记录电力用户的需求信息, 合理的工单分类方法有利于准确定位用户需求, 提升电力系统的运行效率. 针对工单数据特征稀疏、依赖性强等问题, 本文对基于字符级嵌入的长短时记忆网络(Bidirectional Long Short-Term Memory network, BiLSTM)和卷积神经网络(Convolution Neural Network, CNN)组合的结构模型进行优化. 该模型首先对Word2Vec模型训练的词向量进行降噪处理, 得到文本的特征表示; 其次, 利用BiLSTM网络递归地学习文本的时序信息, 提取句子特征信息; 再输入到双通道池化的CNN网络中, 进行局部的特征提取. 通过在真实客服工单数据集上的测试实验, 验证了该模型在客服工单分类任务上的具有较好的精确性和鲁棒性.
2021, 30(2):250-254. DOI: 10.15888/j.cnki.csa.007763
摘要:随着大数据与人工智能技术的飞速发展, 高性能, 实时性的流式计算系统逐渐取代传统基于数据仓库的批量计算系统. Apache storm作为一款开源, 高容错, 实时处理的分布式大数据流式计算平台, 支持任务平均分配策略, 单机任务指定策略等多种任务分配方案. 当任务拓扑结构中存在多个任务时, 且集群中只有某些机器支持某一任务执行时, 传统的任务调度方法只能实现将单一的任务分配给单一指定的机器, 使得整个集群的资源没有充分的利用. 通过调整任务调度策略, 获得满足条件的机器队列, 查看机器队列中可用工作节点, 将指定任务均匀分配给可用工作节点, 其他任务仍通过默认策略分配给集群中的剩余机器, 实现多任务的分组调度策略.
2021, 30(2):255-259. DOI: 10.15888/j.cnki.csa.007772
摘要:近年来, 物流行业的飞速发展, 运输是物流的重要环节之一, 根据数据显示, 运输的成本占据整个物流成本的50%以上. 无人机的使用有效的控制了运输成本, 合理规划物流无人机的飞行路线, 也起着至关重要的作用. 在物流无人机的航迹规划中, 必须保证无人机飞行过程中能够准确避开禁飞区. 本文基于A*算法, 结合多种类型的禁飞区, 设计出一种改进算法, 能够找到任意两客户点间无人机避障飞行的最优路线. 仿真结果表明, 本文所设计的算法能够有效解决多类型禁飞区并存的无人机避障路径规划问题.
2021, 30(2):260-264. DOI: 10.15888/j.cnki.csa.007790
摘要:电子商务是伴随互联网技术快速兴起的一种规模大、潜力大的新型商业模式, 对产品进行短期销量预测能够帮助电商企业对市场变化采取更加迅速的反应和措施. 本文通过电商销量历史数据和门户商品链接点击量建立了一种应用于电子商务会计系统的短期销量预测模型. 借助AdaBoost思想集合多个传统的BP神经网络的预测结果, 使其具备更高的预测准确率, 根据电商短期销量变化的特点规划时间窗口的时序设计, 建立考虑周末效应的以日为单位的销量预测模型. 实验证明, 该预测模型的预测误差可以控制在20%以内.
2021, 30(2):265-267. DOI: 10.15888/j.cnki.csa.007781
摘要:朴素Bayes分类器是一种简单有效的机器学习工具. 本文用朴素Bayes分类器的原理推导出“朴素Bayes组合”公式, 并构造相应的分类器. 经过测试, 该分类器有较好的分类性能和实用性, 克服了朴素Bayes分类器精确度差的缺点, 并且比其他分类器更加快速而不会显著丧失精确度.