2019, 28(8):1-9. DOI: 10.15888/j.cnki.csa.007018 CSTR:
摘要:长期以来Android系统一直是黑客攻击的主要目标之一,自发布以来一直面临着root、镜像篡改、恶意程序等安全风险,框架层是在系统安全中容易被忽视但又能产生极高的安全风险.本文分析了Android系统中框架层的表现形式和框架层的使用方式,针对框架层特点提出了一种框架层完整性度量方法(FIMM),以此保障Android系统框架层代码完整性和运行时的完整性.对于Android系统针对框架层组件完整性保护的缺失,该方法能提供框架层组件在加载时的完整性度量和完整性校验.而对于Android的系统服务,我们考虑到其较长的运行周期的特征,于是研究了系统服务的调用过程并为其提供了较为细粒度的动态度量,在每次系统服务调用时确认系统服务进程代码段的完整性.最后我们给出了基于Android模拟器的原型系统的实现,并分析了FIMM的安全性和性能损耗,认为FIMM能完全达到我们的安全预期,并且只会造成少量的性能损耗.
2019, 28(8):10-16. DOI: 10.15888/j.cnki.csa.007016 CSTR:
摘要:鸟击事件是威胁航空安全以及导致航空事故发生的最主要原因之一.鸟类生态调查研究和鸟击风险防控是机场必要的日常业务.为了使机场鸟击防范工作更有针对性,对存在于三维空间中抽象的鸟击风险评估结果进行可视化具有重要应用价值.本文提出一种基于游戏引擎的鸟击风险三维可视化方法,并以厦门翔安国际机场为例,开发了一套鸟击风险可视化系统来实现该方法.构建了机场周边10×40平方公里上空的三维地理场景及鸟击风险三维标量场,叠加机场净空区三维模型,根据鸟情观测数据,模拟鸟类飞行路径,最后通过摄像头漫游与飞机飞行模拟的方式实现了风险场场景的沉浸式动态展示.该系统可为机场飞行安全管控提供辅助决策支持.
2019, 28(8):17-23. DOI: 10.15888/j.cnki.csa.007023 CSTR:
摘要:针对DTW算法在手势身份认证中存在的问题,提出了一种基于约束多维DTW算法(Constraints Multi-dimension Dynamic Time Wrapping,CM-DTW)的智能手机动态手势身份认证方法.该方法利用手机内置传感器获取代表用户生物行为特征的手势数据,通过Sakoe-Chiba窗约束下的DTW算法选择合法用户的候选模板集,采用线性升降采样归一化候选模板得到一个标准模板.该方法与DTW算法相比,不仅提高了身份认证的时间效率,并且保证了用户身份认证的准确率.
2019, 28(8):24-29. DOI: 10.15888/j.cnki.csa.006959 CSTR:
摘要:情感是音乐最重要的语义信息,音乐情感分类广泛应用于音乐检索,音乐推荐和音乐治疗等领域.传统的音乐情感分类大都是基于音频的,但基于现在的技术水平,很难从音频中提取出语义相关的音频特征.歌词文本中蕴含着一些情感信息,结合歌词进行音乐情感分类可以进一步提高分类性能.本文将面向中文歌词进行研究,构建一部合理的音乐情感词典是歌词情感分析的前提和基础,因此基于Word2Vec构建音乐领域的中文情感词典,并基于情感词加权和词性进行中文音乐情感分析.本文首先以VA情感模型为基础构建情感词表,采用Word2Vec中词语相似度计算的思想扩展情感词表,构建中文音乐情感词典,词典中包含每个词的情感类别和情感权值.然后,依照该词典获取情感词权值,构建基于TF-IDF (Term Frequency-Inverse Document Frequency)和词性的歌词文本的特征向量,最终实现音乐情感分类.实验结果表明所构建的音乐情感词典更适用于音乐领域,同时在构造特征向量时考虑词性的影响也可以提高准确率.
2019, 28(8):30-38. DOI: 10.15888/j.cnki.csa.007010 CSTR:
摘要:近年深度学习方法在金融领域受到广泛应用,尤其推动了股票价格预测的发展.本文针对一般股票价格预测中的单变量长短期记忆网络存在的准确率与鲁棒性不佳的问题,将经济学领域的量化选股策略中的多因子模型思想引入到股票价格预测中,计算股票的多因子并以其作为预测模型的输入特征.同时为了使模型适应多因子输入,因此在单变量长短期记忆网络的基础上建立了一个多变量长短期记忆网络股票价格预测模型.实验结果表明,随着多因子模型的引入,不仅提升了长短期记忆网络股票价格预测的准确率,同时在一定程度上也带来了更好的模型鲁棒性.
2019, 28(8):39-45. DOI: 10.15888/j.cnki.csa.006994 CSTR:
摘要:本文从局部能量的角度提出了一种有效的图像边缘检测方法.在以一个像素点为中心的对称区域中,计算区域内所有像素的灰度值与中心像素的灰度值之间的差值,将差值平方的总和作为中心点所对应的局部能量.该局部能量可以有效地用于检测图像的边缘,因为边缘点的局部能量要比对应光滑区域内的像素点大得多.根据本文所构造的局部能量函数可以有效地找到边缘点.本文使用Baddeley误差度量(BEM)方法来评估本文方法检测结果的准确性.实验结果表明本文方法检测效果比较好.
2019, 28(8):46-52. DOI: 10.15888/j.cnki.csa.006979 CSTR:
摘要:针对传统的电力网络流量检测安全预警系统在面对海量高维度数据时,其在精度、实时性、扩展性以及效率上都无法满足需求的问题,建立出一种基于Spark的电网工控系统流量异常检测平台.该平台以Spark为计算框架,主要由数据采集与网络流量深度包检测协议解析模块,实时计算数据分析处理模块,安全预警预测模块和数据存储模块组成,为流量异常检测提出了一套完整的流程.实验结果表明,该平台能够有效地检测出异常流量,做出安全预警,方便工作人员及时做出决策,这充分说明该平台非常适用于电力控制系统,能够应对海量高维复杂数据做出实时分析以及安全预警,极大地提高了电网工控系统的安全性能.
2019, 28(8):53-62. DOI: 10.15888/j.cnki.csa.007028 CSTR:
摘要:针对我国重要产品追溯系统的复用性及实用性,分析了当前追溯系统模型构建、追溯编码和追溯依据存在问题的根源,以提高追溯信息的完整性、追溯系统的适应性、系统与业务的吻合度为目标,研究了追溯过程模型、追溯码编码方法、追溯领域模型和追溯数据集成方法等组成的追溯领域模型,该模型已在多个重要产品追溯体系建设示范工程规划设计中应用,结果表明该模型在复用性和实用性上优势明显.
2019, 28(8):63-70. DOI: 10.15888/j.cnki.csa.007017 CSTR:
摘要:随着Jupyter Notebook在数据科学领域应用规模的不断扩大,对于多用户管理和集群计算资源调度的功能需求越趋增加.本文从Jupyter相关基本概念入手,阐述了Jupyter对于科研成果交流传播的作用影响,总结了目前国外科研机构、高等院校等组织在研究Jupyter分布式架构方面的现状;详细分析了Jupyter体系架构特点,运用微服务的方式重构Jupyter,并通过Kubernetes的资源调度分配算法,实现了基于容器技术的高弹性分布式微服务架构.测试结果数据表明,本文提出的架构在访问负载性能上得到了一定程度的提升,在用户运行数量方面达到了集群上负载均衡的目标.
2019, 28(8):71-77. DOI: 10.15888/j.cnki.csa.007053 CSTR:
摘要:本文主要研究深度学习在抗菌药物使用方法分类及数据挖掘应用,在现有的疾病和电子病历抗菌药物使用方法的文本数据挖掘过程中,利用基于注意力机制的长短期记忆网络模型训练抗菌药物语料数据,通过自我学习特征的方式表示和理解问题,避免人工特征的提取误差,使分类的准确率最大值较传统数据挖掘方法提高至89.97%,从而更好地为不同疾病患者提供相应的抗菌药物治疗方案.根据实验结果,该方法在不需要人工制定特征规则的条件下,可以自主学习生成治疗方案知识库,从而为医生治疗患者提供最佳的辅助决策支持.
2019, 28(8):78-86. DOI: 10.15888/j.cnki.csa.006970 CSTR:
摘要:工业互联网数据管理平台能够对通过网络流动的工业数据进行便捷而又高效的管理和分析,是工业互联网建设中的重要一环,但也正因为它提供了便捷的数据管理通道,才使得它具有更高的数据泄露风险和安全需求.针对这一问题,本文基于中国移动OneNET平台,设计了一套工业互联网数据管理平台,通过对数据信息进行分类保护,对用户进行分级限制数据交互的方法,在能够满足管理需求的情况下尽量降低数据信息的泄露和破坏风险,在一定程度上提高了工业互联网数据信息的安全性.
2019, 28(8):87-94. DOI: 10.15888/j.cnki.csa.007042 CSTR:
摘要:鉴于谐波对电力系统的安全、经济、运行都存在严重危害,本文从可视化建模、仿真计算、以及电力大数据与谐波仿真系统的结合方面探讨并提出一种基于电力大数据的谐波仿真系统.系统基于GEF和JavaFX技术实现电网图的可视化绘制和计算结果的图形化呈现.系统扩展openDSS谐波计算引擎实现多种传统和新型的仿真模型.系统还以电力大数据作为输入,不仅降低了人工输入数据的工作量和错误率,还具有更好的仿真效果.案例分析表明该系统能够有效支撑谐波仿真计算,具有直观,易于操作和易于扩展的特性,且是电力大数据与谐波仿真系统相结合的新尝试.
2019, 28(8):95-100. DOI: 10.15888/j.cnki.csa.007022 CSTR:
摘要:信息化、智能化的时代迫切需要功能更强大、更灵活的工业监控,自主研发的组态软件能够提升码头监控系统的运作效率、满足集团公司的定制化需求、提升振华重工软件研发的核心实力.文章研究了振华重工新一代组态软件的整体设计架构、关键实现技术和实施效果,新架构的组态软件具有良好的系统交互式界面设计,通过虚拟化的Web及移动应用,实现集中部署,便于随时随地掌握生产运营、设备状态信息,首创多屏多画面映射技术,实现了屏幕与画面的动态配置,能够一机全景展示码头监控中的关键内容.新架构基础上的组态软件能够显著提高实时监控系统的效率,优化用户体验,对国内组态软件的研发与设计具有非常重要的借鉴价值.
2019, 28(8):101-108. DOI: 10.15888/j.cnki.csa.007032 CSTR:
摘要:随着龙芯、飞腾、申威等国产处理器的诞生,目前涌现出了一批支持国产处理器的国产操作系统,如JARI-Works、中标麒麟等.但是,与国产软硬平台配套的调试工具发展却相对滞后,严重制约着国产平台下的软件调试效率.本文针对国产软硬平台,设计了一种基于Eclipse平台的智能调试方案.通过在Eclipse平台下集成面向国产平台的工具链和智能跟踪调试插件,自动启动并智能跟踪调试流程,从而实现调试功能的图形化和智能化,进而构建出一套界面友好、使用便捷、自主可控的集成开发环境.通过实验表明,该调试方案能够有效简化调试流程,提高国产平台下的软件调试效率.
2019, 28(8):109-114. DOI: 10.15888/j.cnki.csa.007020 CSTR:
摘要:随着生活水平的提高和物联网的发展,社会对家居的智能化需求越来越迫切,本文阐述了基于树莓派的智能家居系统的设计与实现,通过采用树莓派为主要模块,搭建一款满足大众需要的智能家居系统.本系统以树莓派为主要开发平台,并基于Ubuntu操作系统进行开发的一种智能家居解决方案,其包含了语音合成、语音识别、图像识别、数据采集、AI对话、视频监控、语音控制、语音日志等功能.可通过语音、手机微信、APP与机器人和传感器进行交互,并能登录Web界面查看相应底层数据并对传感器进行相应控制.系统传感器部分采用ZigBee通信协议,与服务器通信采用MQTT通信协议,两种通讯协议低成本,低功耗,节约网络资源.
2019, 28(8):115-119. DOI: 10.15888/j.cnki.csa.007007 CSTR:
摘要:证券市场是完整的市场体系的重要组成部分,对整个经济的运行具有重要影响.证券交易系统的安全稳定运行是证券业界非常关注的课题.本文设计一个可以快速实时响应、灵活监控证券公司各个交易系统的网络连通和业务功能运行情况的监控系统(RSCMS),以提高部门的实时监控效率,并为系统的运行情况提供数据评估的依据.本文研究了监控系统关键技术的解决方法,并提供了在证券公司运行的成功案例
2019, 28(8):120-128. DOI: 10.15888/j.cnki.csa.006987 CSTR:
摘要:不平衡数据在分类时往往会偏向"多数",传统过采样生成的样本不能较好的表达原始数据集分布特征.改进的变分自编码器结合数据预处理方法,通过少数类样本训练,使用变分自编码器的生成器生成样本,用于以均衡训练数据集,从而解决传统采样导致的不平衡数据引起分类过拟合问题.我们在UCI四个常用的数据集上进行了实验,结果表明该算法在保证准确率的同时提高了F_measure和G_mean.
2019, 28(8):129-135. DOI: 10.15888/j.cnki.csa.007015 CSTR:
摘要:对于在可见光范围拍摄的图像中混入近红外光引起的图像偏色问题,传统监控系统采用机械切换的红外截止滤镜来实现日夜拍摄模式的切换,但这容易产生机械故障,影响成像.本文在不改变原来CCD或CMOS传感器的基础上,采用可见光加850 nm双峰滤镜替代传统机械切换滤镜,但仍存在850 nm红外串扰问题.为解决红外干扰,本文抛弃传统的红外干扰图像偏色校正分析方法,从传感器受近红外光的影响分析入手,通过岭回归的彩色定标方法对相机自身的光谱特性进行校正.这个过程即拟合了摄像头拍摄三带图像时启用红外截止滤镜的状态.首先在实验室黑暗环境中,使用D65标准光源箱,并用850 nm的近红外光源直射已经移除红外截止滤镜的摄像头,在棚中拍摄潘通色卡的四带图像(RGB三带与IR近红外带);随后关闭近红外光源,同机位拍摄潘通色卡的三带图像.根据岭回归算法进行彩色定标,获取三带图像与四带图像之间的校正矩阵,用于四带图像色彩校正,获得色彩自然的图像.
2019, 28(8):136-141. DOI: 10.15888/j.cnki.csa.006966 CSTR:
摘要:为解决电子商务冲击下线下销售萎靡及互联网"信息爆炸"下用户挑选商品时耗时耗力等问题,本文引入商圈位置区域模型,即基于圆形过滤方法与改进的基于分区的DBSCAN密度聚类算法对浙江省某一行业全域范围下25万商户订单数据进行地理位置特征分析,并结合时间衰减参数进行传统推荐算法改进,提出了面向商圈流行度的商品推荐算法与面向商圈相似度的协同过滤算法.实验结果表明,算法在推荐准确率上明显优于传统推荐算法,且一定程度上缓解了冷启动和推荐商品惊喜度不足的问题,有其实用价值与研究意义.
吴盼红 , 段培永 , 丁绪东 , 尹春杰 , 姬晓娃 , 邱钟
2019, 28(8):142-147. DOI: 10.15888/j.cnki.csa.006952 CSTR:
摘要:随着能源供应与经济快速发展的矛盾日益加剧,建筑节能成为可持续发展战略的一个关键环节,研究一种快速、精准的建筑用电量预测方法是实现建筑节能优化控制的重要前提.本文将遗传算法与蚁群聚类算法相融合,对基于聚类的IHCMAC (Improvement Hyperball CMAC)神经网络的网络节点进行改进,将GIHCMAC (Genetic Algorithm Ant Colony Clustering Algorithm based on IHCMAC)作为建筑电力负荷预测模型,对潍坊某一办公建筑用电负荷进行预测.研究结果表明,该预测模型迭代次数最小、准确度较高,其迭代次数、训练误差、泛化误差分别为9、0.0045、0.0014,较IHCMAC、KHCMAC (K-means Hyperball CMAC)、IKHCMAC (Improvement K-means Hyperball CMAC)模型的收敛速度更快,精度更高,泛化能力更强.
2019, 28(8):148-154. DOI: 10.15888/j.cnki.csa.007012 CSTR:
摘要:针对信息系统中静态数据列表开发效率低下和不能满足用户定制化需求的问题,提出基于XML配置的动态数据查询技术.首先通过Apache Digester解析表单的XML结构化配置,将实例化的配置信息交由动态查询引擎处理,动态查询引擎结合配置信息通过SQL、HQL、接口查询获取数据.最后将配置和数据以JSON格式传给客户端处理,以二次封装改进的dhtmlxGrid表格控件展示,形成动态数据列表.该动态查询技术已在多个系统中应用,应用效果证明,其显著提高了软件研发效率,能够满足组合查询定制、数据列自定义、数据列渲染、数据范围控制等各种定制需求.
2019, 28(8):155-161. DOI: 10.15888/j.cnki.csa.007019 CSTR:
摘要:随着网络的飞速发展,微博逐渐成为社交网络中信息传播及信息收集的重要平台,微博转发是微博信息传播的重要途径,研究微博转发问题对微博信息传播、微博营销、舆情监控有着极其重要的意义.影响微博转发的主要因素有:粉丝兴趣与微博文本的相似度,微博营销策略及用户粉丝数量的变化.以往的预测模型没有综合考虑这两方面因素,基于此,提出了一种基于循环神经网络的方法来对微博转发量级进行预测,首先利用SIM-LSTM模型构建微博转发趋势度,然后再利用TF-IDF构建粉丝兴趣和微博文本的相似度,最后通过神经网络模型来预测粉丝是否会转发该微博.实验结果表明本文提出的算法相对于其他预测算法F1评估值提高了近5%.
2019, 28(8):162-169. DOI: 10.15888/j.cnki.csa.007009 CSTR:
摘要:针对传统K近邻分类器在大规模数据集中存在时间和空间复杂度过高的问题,可采取原型选择的方法进行处理,即从原始数据集中挑选出代表原型(样例)进行K近邻分类而不降低其分类准确率.本文在CURE聚类算法的基础上,针对CURE的噪声点不易确定及代表点分散性差的特点,利用共享邻居密度度量给出了一种去噪方法和使用最大最小距离选取代表点进行改进,从而提出了一种新的原型选择算法PSCURE (improved prototype selection algorithm based on CURE algorithm).基于UCI数据集进行实验,结果表明:提出的PSCURE原型选择算法与相关原型算法相比,不仅能筛选出较少的原型,而且可获得较高的分类准确率.
2019, 28(8):170-175. DOI: 10.15888/j.cnki.csa.007008 CSTR:
摘要:随着网络上服装图片数量的快速增长,对于大量的服装进行分类的需求与日俱增.传统的使用手工进行服装图像的语义属性标注并不能完全的表达服装图像中的丰富信息,并且传统的手工设计的特征已经不能满足现实的精度和速度的需求.近年来,深度学习已经应用到计算机视觉方方面面,为基于深度学习的服装分类识别技术奠定了坚实的基础.本文根据已有的数据集DeepFashion构建了三个新的子数据集,进行分类训练的deepfashionkid数据集和进行Faster R-CNN训练的deepfashionVoc数据集和进行Mask R-CNN训练的deepfashionMask数据集.使用deepfashionkid数据集在VGG16上进行预训练得到clothNet模型,进而改进Faster R-CNN的损失函数.并且各自对比了这两种算法使用clothNet预训练的模型与不使用的区别.另外,本文了采用一种新的类似嫁接学习的预训练策略.实验表明,这些训练技巧对于检测精度的提高具有一定的帮助.
2019, 28(8):176-182. DOI: 10.15888/j.cnki.csa.007031 CSTR:
摘要:针对混合储能微电网调度优化问题,建立并网状态下经济收益、污染处理费用的混合储能微电网多目标优化模型.以基本烟花算法为框架,结合灰熵并行分析理论,提出一种多目标灰熵烟花算法.所提算法通过分配给模型的两个目标不同的熵值权重,有效处理不同目标间的冲突性.以灰熵并行关联度作为烟花算法的适应度选择优秀烟花个体,引导其向更优区域进化搜索.仿真结果表明,所提多目标灰熵烟花算法的性能要优于基于随机权重和基于Pareto支配的烟花算法,且优于经典的NSGA-Ⅱ多目标算法,验证了所建多目标模型及所提多目标算法的有效性.
2019, 28(8):183-189. DOI: 10.15888/j.cnki.csa.007013 CSTR:
摘要:近些年,利用计算机对极化SAR图像进行分类逐渐成为遥感领域的一个研究热点.本文采用全极化SAR数据,利用不同的特征提取算法提取特征,并基于随机森林模型最终实现对江苏沿海滩涂的分类.首先采用H/α和Freeman两种分解算法提取极化特征参数,采用灰度共生矩阵提取纹理特征参数;然后将提取的所有特征进行不同的组合,构成不同的特征集;最后采用随机森林模型对不同特征集合进行分类和精度评估.结果表明仅用纹理特征对沿海滩涂进行分类时效果较差;利用极化分解提取出的散射特征进行分类的结果要优于矩阵元素特征的分类结果;综合了极化散射特征和纹理特征的组合方式在沿海滩涂的分类中可以取得最优的分类结果,总体精度和Kappa系数可以达到94.44%和0.9305,表明极化SAR图像中蕴含的不同方面的特征在分类中具有一定的互补性.
2019, 28(8):190-196. DOI: 10.15888/j.cnki.csa.007002 CSTR:
摘要:协同过滤算法是目前在电商系统中应用最广的推荐技术.为了缓解传统基于用户的协同过滤算法在冷启动、推荐准确性和数据稀疏性方面的缺点,本文提出基于用户特征的协同过滤推荐算法.此算法利用注册信息提取属性特征,并对已有的评分信息提取兴趣特征和信任度,综合以上各特征融合特征相似性进一步产生推荐.实验结果表明,与传统的基于用户的协同过滤算法做对比,基于用户特征的协同过滤算法对推荐的精度有大幅的提高.
2019, 28(8):197-203. DOI: 10.15888/j.cnki.csa.007034 CSTR:
摘要:临床决策支持系统中,通常使用电子病历中的病人描述作为查询检索,进而辅助医生做决策分析.我们提出了一个基于注意力机制的网络扩展查询方法以提高检索效果.由于医学文本注释的难度和成本很高,并受到了迁移学习理念的启发,我们选择了非医学领域数据集学习句子与实体的关系,迁移到医学领域数据集,模型用LSTM获得句子表征并用注意力机制来获得实体表示.我们提出的方法可以动态选择相关实体作为查询扩展,同时我们不仅考虑单个实体作为扩展的影响,也考虑了实体组合作为扩展的影响,解决了选择固定数目实体的问题.我们在TREC Clinical Decision Support Track三个标准数据集上进行实验,实验表明本文提出的方法在实验结果上有显著的提升.
2019, 28(8):204-209. DOI: 10.15888/j.cnki.csa.007033 CSTR:
摘要:胎儿心率检测是围产期常规检测,是评估孕妇和胎儿健康的主要生理指标.相对现有的接触式胎心检测技术,本文提出一种更为便捷,成本低廉的非接触式胎儿心率提取算法.首先基于欧拉视频颜色放大技术,对视频中颜色信号放大.其次,利用光电容积脉搏波描记法提取血液容积脉冲信号,并对母体噪声进行分离,计算功率谱密度提取.将采集到的胎心率,与医院专用胎心设备检测的结果进行定量分析,数据表明可以达到96%的准确度.
2019, 28(8):210-216. DOI: 10.15888/j.cnki.csa.007035 CSTR:
摘要:为了缓解大城市中日益突出的停车困难,现如今中国各大城市级停车诱导系统的研究开发势在必行.在停车诱导系统中,作为帮助用户找到最合适的停车场的重要因素,对未来停车位的预测是一个非常重要的智能技术手段.目前主流预测方法如果没有了实时数据,大部分会出现误差累积现象,从而影响预测准确性.然而,在停车诱导系统平台的建设早期,我们很难做到将城市所有停车场实时的数据流搜集起来.因此,文中以具有周期特性的非平稳停车位历史数据为研究对象,首先根据中心极限定理和大数定理对停车位进行统计分析,然后结合LSTM (Long Short-Term Memory),提出混合预测模型SAL (non-stationary Stochastic And Long short-term memory)来对未来某个时间段的停车位作有效预测.实验数据证明,相比于单独使用LSTM和Lyapunov指数法作长期预测,SAL的计算复杂度更低,预测效果相对更加精确,并且有效解决了在失去实时数据支撑情况下多步长期预测导致的误差累积问题.
2019, 28(8):217-221. DOI: 10.15888/j.cnki.csa.006990 CSTR:
摘要:高速公路多义路径问题是指如何在具有多条可选路径的高速公路网中确定车辆的一条驶经路径.目前普遍采用的基于识别点的多义路径识别方法在某些情况下(如设备故障、环境亮度或透明度不够等)存在识别率低的问题,导致一些时段存在车辆多义路径难以识别.针对以上情况,本文提出一种基于历史数据的多义路径概率识别方法,通过基于路段的聚类方法计算各路段概率值,然后结合贪心算法找出车辆的驶经路径,用来在识别设备故障时辅助识别多义路径.该方法可以有效的在识别设备故障时识别多义路径,提高了该方法的准确度.
祝海栋 , 李瑞琳 , 何小雨 , 赵丹 , 韩鑫胤 , 牛北方
2019, 28(8):222-228. DOI: 10.15888/j.cnki.csa.007024 CSTR:
摘要:野生小麦是异源六倍体,基因组规模较大(约14 GB),且包含大量重复序列.为了培育具有优良性状的新品种,首先要定位控制目标性状的基因,因此建立一个完整准确的基因组注释软件流程至关重要.传统的基因组注释方法基于数据库比对,具有三个明显的缺点:一是比对速度慢;二是难以发现新基因;三是软件选择没有统一标准.本文提出了一种新的生物信息学注释流程,结合了基因数据库比对、转录组高通量测序数据分析、全长转录组单分子测序数据分析等多种技术手段,实现了六倍体小麦科农9204基因组完整准确的注释,为揭示小麦生长发育规律和培育新品种提供了重要参考和软件技术支撑.
2019, 28(8):229-234. DOI: 10.15888/j.cnki.csa.007014 CSTR:
摘要:本论文提出了一种能快速、精准用于人脸检测的特征即分开Haar特征(Separate Haar,简称Sep-Haar).本文研究过程中有3个关键贡献,第一是提出"分开Haar特征",即在Haar特征矩形之间添加了一个不关心的区域,可通过这个算法得到一些更有效的特征.第二是为这个不关心区域选择最好宽度的算法,这个算法用于减少学习特征的总数量,以减少内存的使用.第三是同样通过Adaboost算法应用,采用Sep-Haar特征能使用较少量的特征而得到最好的误报率.基于此研究结果,本文也提出了一种新分类器,每个阶段都有较小的误报率,实验结果表明使用该特征能够在减少检测时间情况下提高命中率.
2019, 28(8):235-240. DOI: 10.15888/j.cnki.csa.006951 CSTR:
摘要:基于深度学习和深度摄像机的人体动作识别方法,受其应用场景所限,均不能对视频中快变场景和静态图像中的人体动作进行识别.本文中定义了人体肢体角度空间,使用基于深度学习的人体骨骼识别框架的骨骼数据,构建8个4层BP回归神经网络.对人体的骨骼数据提取和预处理后,再对训练数据进行增维处理,通过回归神经网络进行拟合,实验和测试结果表明,该方法可以有效的对人体角度进行回归,为快变场景和静态图像中的人的动作识别提供可靠依据.
2019, 28(8):241-245. DOI: 10.15888/j.cnki.csa.007011 CSTR:
摘要:由于支持向量机的主要参数的选择能够在很大程度上影响分类性能和效果,并且目前参数优化缺乏理论指导,提出一种粒子群优化算法以优化支持向量机参数的方法.该方法通过引入非线性递减惯性权值和异步线性变化的学习因子策略来改善标准粒子群算法的后期收敛速度慢、易陷入局部最优的缺陷.实验结果表明,相对于标准粒子群算法,本方法在参数优化方面具有良好的鲁棒性、快速收敛和全局搜索能力,具有更高的分类精确度和效率.
2019, 28(8):246-250. DOI: 10.15888/j.cnki.csa.007021 CSTR:
摘要:红外遥控是目前无线通讯中使用较为广泛的一种,具有协议简单、功耗低、适应性强的优点.基于红外遥控的通信协议,提出一种基于嵌入式系统的红外通讯方法,将波形采集和数据分析解码工作各自独立,具有波形采集完整、兼容性高和移植性强等优点.
2019, 28(8):251-255. DOI: 10.15888/j.cnki.csa.007029 CSTR:
摘要:针对当前多区域物流中心选址需建立配送中心个数不定、位置、覆盖范围不明的问题,本文提出了一种改进的k-means聚类算法,以城市经济引力模型为基础,将城市运输距离与居民消费能力的指标相结合,重新定义对象之间相似性度量的距离因子.并将密度思想引入k-means算法,提出类内差分均值的概念确定最优聚类数.实现分区后,分别在这些区域中利用重心法对配送中心进行最终的确定.最后实例分析了在西部地区37个城市创建物流配送中心的选址过程,并通过和传统的k-means聚类的选址结果对比,说明改进后的算法不仅可以节省配送时间,而且大大降低了运输成本,有很好的经济利用价值.
2019, 28(8):256-261. DOI: 10.15888/j.cnki.csa.007030 CSTR:
摘要:以微博为代表的社交平台是信息时代人们必不可少的交流工具.挖掘微博文本数据中的信息对自动问答、舆情分析等应用研究都具有重要意义.短文本数据的分类研究是短文本数据挖掘的基础.基于神经网络的Word2vec模型能很好的解决传统的文本分类方法无法解决的高维稀疏和语义鸿沟的问题.本文首先基于Word2vec模型得到词向量,然后将类别因素引入传统权重计算方法TF-IDF (Term Frequency-Inverse Document Frequency)设计词向量权重,进而用加权求和的方法得到短文本向量,最后用SVM分类器对短文本做分类训练并且通过微博数据实验验证了该方法的有效性.
2019, 28(8):262-267. DOI: 10.15888/j.cnki.csa.007052 CSTR:
摘要:海量中文信息处理是大数据处理的一个分支,而利用大数据技术进行中文信息处理一定离不开中文分词,所以中文分词技术是大数据中文信息处理的基础性技术.中文分词技术自本世纪以来,一直在性能与精确度两个方向在推进;在性能方面主要以改进分词扫瞄算法,改进词库存储技术与查询方式来提高性能.在精确度上主要是对未登录词与歧义词的甄别与处理方法进行改进.本文摒弃了通过词库索引查询的思想,提出一种基于字符树的词库存储结构.它的分词速度是普通折半法的35倍,占用内存只是它的1/5.它将为大数据技术在处理中文信息时在性能上推进了一大步.
2019, 28(8):268-271. DOI: 10.15888/j.cnki.csa.007004 CSTR:
摘要:在临时会议等室内场合需要迅速建立临时讨论群以及准确定位各个人员的坐标,实现相关人员有目的的进行点对点讨论.设计与实现了一种利用UWB超宽带定位技术实现室内人员精确定位的即时通讯软件系统.该系统分为定位模块和即时通讯模块,实现了在局域网内的群聊、查找室内附近人员、与附近人员进行文本、图像交流等功能.该系统结构简单,易于实现;适用于研讨会、产品推广会等场所,有较好的应用前景.