2019, 28(1):1-9. DOI: 10.15888/j.cnki.csa.006720
摘要:深度学习理论在计算机视觉中的应用日趋广泛,在目标分类、检测领域取得了令人瞩目的成果,但是深度学习理论在目标跟踪领域的早期应用中,由于存在跟踪时只有目标为正样本,缺乏数据支持,对位置信息依赖程度高等问题,因而应用效果并不理想,传统方法仍占据主流地位.近年来,随着技术的不断发展,深度学习在目标跟踪方向取得了长足的进步.本文首先介绍了目标跟踪技术的基本概念和主要方法,然后针对深度学习在目标跟踪领域的发展现状,从基于深度特征的目标跟踪和基于深度网络的目标跟踪两方面重点阐述了深度学习在该领域的应用方法,并对近期较为流行的基于孪生网络的目标跟踪进行了详细介绍.最后对近年来深度学习在目标跟踪领域取得的成果,以及未来的发展方向作了总结和展望.
2019, 28(1):10-16. DOI: 10.15888/j.cnki.csa.006707
摘要:近年来,电子数据取证对案件侦破起着重要的作用,由于电子数据具有易失性、易破坏性等特点,需要取证人员具备专业的电子取证技术和方法,才能最后分析出有用的证据,保证案件的真实性和客观性,详细分析三种取证技术和方法:基于Windows的电子取证、基于智能手机的电子取证,基于网络的电子取证,其中基于智能手机的电子取证包括Android手机和iPhone手机,并提出电子取证技术未来的发展方向.
2019, 28(1):17-24. DOI: 10.15888/j.cnki.csa.006714
摘要:模糊测试是当前检测程序错误的最主流、最有效的手段之一.模糊测试工具首先对种子文件进行变异,生成大量新输入文件,然后挑选新输入来执行目标程序,以触发程序中潜在的漏洞.当前对模糊测试的研究多着眼于改进变异算法,提高生成的新文件对目标程序代码的覆盖,忽略了备用种子文件的筛选策略对提高模糊测试覆盖率与测试效率的的贡献.针对该问题,我们提出了基于覆盖频率的种子文件筛选策略,在每次执行目标程序时,我们记录程序执行中覆盖过的路径边;根据边被执行次数的多少,我们将这些边分为低频边和高频边;对于包含了更多低频边且执行效率高的种子文件,我们给予更高的优先级.我们在模糊测试工具American Fuzzy Lop (AFL)实现了对应的算法,实验表明我们的算法有效提高了模糊测试的效率和代码覆盖率.
2019, 28(1):25-31. DOI: 10.15888/j.cnki.csa.006758
摘要:为了对DDoS攻防行为进行有效评估以防御DDoS攻击,本文首先对DDoS攻防评估研究现状进行了分析,然后基于随机Petri网建立了DDoS攻防行为对抗网,提出了以攻防稳态概率作为攻防行为评估的依据,紧接着基于攻防博弈提出了攻防博弈策略求解方法,最后对本文所建立的DDoS攻防行为对抗网进行稳态分析并综合考虑攻防行为收益和攻防行为强度两方面因素进行了仿真评估,评估结果表明本文方法更具合理性和针对性.
2019, 28(1):32-37. DOI: 10.15888/j.cnki.csa.006751
摘要:针对实际应用场景中如何在大批量图像文件中快速找到中文印刷体文本图像文件进行OCR (Optical Character Recognition)识别的问题,本文在笔画宽度变换算法(SWT)的基础上,设计了针对中文文本固有特点的启发式规则,并将水平投影技术与离散傅里叶变换相结合,提出了一种适合倾斜角度在-90至90°之间的中文印刷体文本图像文件识别技术.实验结果显示,在1606张测试集图像文件的识别中,本文算法针对文本图像文件整体识别F值(F-Measure)为0.95,平均识别耗时为0.65 s.
2019, 28(1):38-46. DOI: 10.15888/j.cnki.csa.006695
摘要:二值网络在速度、能耗、内存占用等方面优势明显,但会对深度网络模型造成较大的精度损失.为了解决上述问题,本文提出了二值网络的"分阶段残差二值化"优化算法,以得到精度更好的二值神经网络模型.本文将随机量化的方法与XNOR-net相结合,提出了两种改进算法"带有近似因子的随机权重二值化"和"确定权重二值化",以及一种全新的"分阶段残差二值化"的BNN训练优化算法,以得到接近全精度神经网络的识别准确率.实验表明,本文提出的"分阶段残差二值化"算法能够有效提升二值模型的训练精度,而且不会增加相关网络在测试过程中的计算量,从而保持了二值网络速度快、空间小、能耗低的优势.
2019, 28(1):47-52. DOI: 10.15888/j.cnki.csa.006734
摘要:本文基于目前对气象和水文共享站点的筛选,根据云分布式存储技术和气象数据处理技术,详细阐述在"一张图"目标实现过程中,系统总体设计的主要思路、功能结构及产品应用,同时梳理了降水资料的实时汇集流程,设计数据处理业务系统以及数据产品制作和共享系统,实现气象与水文部门长江流域雨量观测数据一张图的目标,实现了与水文部门数据的高效交换与共享应用.
2019, 28(1):53-60. DOI: 10.15888/j.cnki.csa.006746
摘要:IPoIB是一种在InfiniBand网络上支持IP的协议,使IP应用程序可以运行在InfiniBand网络上.我们在国产并行系统上实现了IPoIB,通过乱序处理、内存拷贝优化、网络参数调优和避免应答延迟的优化手段,实现了IPoIB在国产并行系统上的性能提升.实验结果表明,IPoIB在国产并行系统上正确运行,网络带宽与优化前相比提高近6倍,与10GbE万兆以太网相比,IPoIB更具优势,乱序处理机制减少乱序效果明显.
2019, 28(1):61-68. DOI: 10.15888/j.cnki.csa.006745
摘要:我国的保险市场正在经历快速发展时期,客户、保险主体和产品的多样性使得产品推荐成为一个热点问题.然而,精准的产品推荐面临着隐私保护问题和可信问题带来的技术挑战.本文首先对客户与保险公司的需求匹配问题进行了分析,然后基于区块链技术提出了一个新的保险产品推荐模型,客户和保险公司可以将对方需要的隐私信息安全地提交给推荐模型进行需求匹配,从而实现了更为精准的产品推荐.实验表明该模型可以在保护隐私的同时,实现产品推荐过程的安全可信和透明公正.
2019, 28(1):69-74. DOI: 10.15888/j.cnki.csa.006728
摘要:近年来,随着互联网技术的不断发展,以及手机、平板电脑等移动终端的普及,网络直播逐渐兴起并壮大.国内众多直播平台基本都有送礼机制,允许观众购买平台提供的虚拟礼物来打赏主播.观众的打赏对于主播和平台来说都是主要的收入来源之一,所以理解观众的行为以挖掘观众的用户价值,提升用户的变现能力就显得尤为重要.本文以斗鱼直播平台为例,聚焦于直播平台上的高消费群体,通过构建观众特征,采用聚类方法分析高消费群体的行为.实验结果表明,高消费观众可被分为特征有明显差异的三类群体.对这三类观众的特征,本文进一步进行详细分析,为直播平台面向用户的差异化产品服务提供依据.
2019, 28(1):75-80. DOI: 10.15888/j.cnki.csa.006770
摘要:拟态Web服务器中表决器通过计算并比较异构执行体响应网页的相似性来判断响应是否为合法输出,达到网页防篡改的目的.目前表决器中将网页整体作为字符串输入,采用字符串编辑距离方法计算网页的相似性,存在计算量大忽略网页原有结构信息等问题.本文采用改进简单树匹配方法,通过对网页DOM树匹配判别得到网页的相似性,DOM树节点匹配程度由节点字符串的编辑距离决定.将本文算法应用于拟态Web服务器上,进行网页篡改实验验证,与现使用算法相比,本文所采用算法在适应执行体异构性的基础上,提高了表决器的计算效率和准确性.
2019, 28(1):81-86. DOI: 10.15888/j.cnki.csa.006743
摘要:为了改进传统的LED显示屏内容更新方式以及数据传输范围限制,本文采用将腾讯QQ物联平台与LED点阵显示屏相结合的方法,设计出一款创新型的LED显示屏.用户可以通过手机QQ客户端发送图文消息,然后经过QQ客户端软件、QQ物联云、QQ物联板以及LED控制板一系列的信息处理与通信,最终将信息显示到LED屏幕.通过调试与测试最终实现随时随地发布LED显示屏消息.本文的设计内容是当前先进物联技术的典型应用,对智能硬件的设计有参考价值.
2019, 28(1):87-93. DOI: 10.15888/j.cnki.csa.006750
摘要:为了解决桥梁管理部门对桥梁实时安全程度的监测及预期安全程度预测的问题,基于TMS320C6748激光光斑中心定位的实现,设计一种基于Android的桥梁挠度监测及预测系统.监测系统采用模块化的设计思想,由Socket服务器模块、Web服务器模块和Android模块组成.结合来自Socket服务器模块接收的实时桥梁挠度数据,建立数据库连接及操作,运用移动终端与Web服务器相结合的信息化环境,实现基于百度地图API的桥梁信息标注、搜素、挠度信息显示的功能.预测系统通过对比分析综合评分法和优化的马尔可夫链,对桥梁短期状态变化进行预测.经过多次对模拟桥梁的模拟运行检测,算法预测结果和实际情况相符合,且整套软件运行时间控制在4至6 s,实现了对实时性的要求.结果表明,该系统具有很强的实用性、实时性和准确性.为桥梁管理者监管桥梁,及时制定桥梁具体养护计划提供了便捷准确的途径.
2019, 28(1):94-99. DOI: 10.15888/j.cnki.csa.006748
摘要:目标检测是机器人技术领域中重要的技术环节,而作为机器人开发领域中最受欢迎的平台之一,ROS (Robot Operating System)平台实现快速准确的目标检测功能是非常必要的.目前深度学习方法是实现目标检测功能的核心技术,但当前ROS平台自带的目标检测数据包实现原理仍是基于传统的局部图像特征描述方法,目标检测鲁棒性差,泛化能力弱.本文就将针对以上问题,提出一种基于SSD_MobileNet框架,结合独立制作的图像数据集训练定制的目标检测模型,并将模型集成到ROS平台实现快速准确的目标检测功能.
2019, 28(1):100-106. DOI: 10.15888/j.cnki.csa.006741
摘要:在野外地质勘测工作中,使用记录纸记录测量数据具有一定的局限性,不仅工作量大、容易出错,而且测量仪器携带也不方便,从而极大地限制了土木工程师的勘测效率.为此,本文充分考虑到智能手机所集成的先进技术和便携的优势,采用Java语言设计一款基于Android平台的土木工程地质测量电子手簿APP系统.首先利用SQLite数据库保存项目获取的相关数据,然后集成百度地图采集工点的定位信息,并借助陀螺仪测量岩石面的倾向和倾角,最后采用Socket技术连接硬件测试设备,同时采集岩体电荷载的实验数据.通过实验测试结果证明,该电子手簿能够实现多模测量数据的自动记录和校正,从而提高土木工程师野外勘测的工作效率.
2019, 28(1):107-112. DOI: 10.15888/j.cnki.csa.006755
摘要:近年来,深度学习方法被广泛用来解决车辆检测问题并取得了显著的成果,然而,当车辆尺寸较小时,当前深度学习算法的检测丢失率仍然很高.为了解决这个问题,本文提出了一种基于组合目标框提取结构的扩张全卷积神经网络(Dilated Fully Convolutional Network with Grouped Proposals,DFCN-GP).具体提出了一种结合低层特征和高层特征的组合网络模型用于生成目标框,其中低层特征对小目标更加敏感.此外,为保留更多的细节信息,基于扩张卷积思想,增加了网络最后一层卷积层的大小和感受野,用于目标框的提取和车辆检测.通过控制变量的对比试验,对基于组合方式的目标框提取网络和扩张卷积层的有效性进行了验证.本文提出的算法模型在公开数据集UA-DETRAC上性能优异.
2019, 28(1):113-118. DOI: 10.15888/j.cnki.csa.006754
摘要:为了降低由于不良换道行为所造成的事故发生几率,需要在车辆实际驾驶过程中识别出其换道行为.本文借助IOS智能设备采集数据,建立相应的特征向量,提出基于支持向量机的车辆换道行为识别模型,其中针对连续换道行为的识别进一步提出一种改进的N-δ滑动窗口截取算法,用于对包含多个行为的数据进行快速划分,最后利用样本数据验证了N-δ滑动窗口截取算法的可行性和分类器的有效性.
2019, 28(1):119-126. DOI: 10.15888/j.cnki.csa.006733
摘要:针对机器资源和加工路线可选择情况下的柔性车间调度,以最小最大完工时间和时间惩罚成本为目标建立柔性车间E/T调度模型.根据问题特点,提出一种改进的萤火虫算法(GSO),算法设计了一种具有贪婪思想的编码策略,一个萤火虫个体表示工序加工顺序和工序加工位置;采用自适应选择策略,使步长自适应,提高算法精度;引入POX交叉、邻域交换和反序排序方法提高算法局部和全局寻优能力,并利用贪婪思想,提高算法的收敛速度.通过经典算例和实例验证算法性能,实验结果表明改进的萤火虫算法求解柔性车间调度问题的有效性.
2019, 28(1):127-133. DOI: 10.15888/j.cnki.csa.006731
摘要:行人重识别旨在大规模的分布式监控系统中进行行人目标匹配,紧凑且具有鲁棒性的特征表达对其至关重要,为此,本文提出了一种基于特征融合网络的特征提取方法.首先,利用STEL算法增强了LOMO特征对背景噪声的抗噪性能,利用KPCA算法降低维度以便于后续融合.随后,本文探索了手工特征和CNN特征的互补性,将改进LOMO特征融入至卷积神经网络之中,得到了区分度更高的融合特征.在VIPeR和CUHK01数据集上的测试结果表明,本文融合特征的区分度明显高于单一特征和级联特征,Rank-1较级联特征分别提高了3.73%和2.36%.
2019, 28(1):134-139. DOI: 10.15888/j.cnki.csa.006718
摘要:针对现有PM2.5浓度预测误差较大的问题,提出一种基于改进萤火虫寻优支持向量机的预测模型(IFA-SVM).该模型引入邻域搜索和可变步长策略改进萤火虫算法,利用改进FA对SVM的参数C、ε和γ寻优,用最优参数SVM模型预测太原市PM2.5值.其中邻域搜索策略能为参数优化提供更多更精确的候选解;可变步长可动态调整算法搜索步长,加速收敛,平衡FA的全局和局部搜索能力.将IFA-SVM预测值与萤火虫算法-支持向量机(FA-SVM)、遗传算法-支持向量机(GA-SVM)、粒子群算法-支持向量机(PSO-SVM)相比较.结果表明较其他方法,IFA-SVM模型对太原市未来一天和三天的PM2.5值都取得了更精确的预测性能.
2019, 28(1):140-146. DOI: 10.15888/j.cnki.csa.006706
摘要:针对在建建筑区域具有与周围非在建建筑颜色特征不同、与周围自然环境纹理特征不同的特点,提出了一种基于在建建筑颜色和纹理特征的高空影像中在建建筑区域识别方法.首先对只包含在建建筑图像数据集中的图像进行颜色和纹理特征提取,由这些特征矢量构建图像特征索引库;然后将待检测图像分块,对其颜色聚类屏蔽绿色植被区域并计算特征矢量,将其与特征索引库做相似性度量,判定该图像块在整个待检测图中的位置,对检测到的在建建筑用红色矩形框和唯一的标识符框选出来.实验结果显示,利用本文提出的在建建筑区域识别方法,能够有效地识别城市高空影像中的在建建筑区域,基于本文算法的系统可以运用于城市规划.
2019, 28(1):147-155. DOI: 10.15888/j.cnki.csa.006716
摘要:随着深度学习的发展,语义分割任务中许多复杂的问题得以解决,为图像理解奠定了坚实的基础.本文算法突出表现在两个方面,其一是利用反卷积网络,对卷积网络中不同深度的卷积层提取到的多尺度特征进行融合,之后再次通过反卷积操作对融合后的特征图进行上采样,将其放大到原图像的大小,最后对每个像素进行语义类别的预测.其二为了提升本文网络结构的性能,提出一种新的数据处理方式,批次中心化算法.经过实验验证,本文算法在SIFT-Flow数据集上语义分割的平均准确率达到45.2%,几何分割的准确率达到96.8%,在PASCAL VOC2012数据集上语义分割的平均准确率达到73.5%.
陈建平 , 陈其强 , 胡文 , 陆悠 , 吴宏杰 , 傅启明
2019, 28(1):156-162. DOI: 10.15888/j.cnki.csa.006752
摘要:提出一种基于Q-learning算法的建筑能耗预测方法.通过将建筑能耗预测问题建模为一个标准的马尔科夫决策过程,利用深度置信网对建筑能耗进行状态建模,结合Q-learning算法,实现对建筑能耗的实时预测.通过美国巴尔的摩燃气和电力公司公开的建筑能耗数据进行测试实验,结果表明,基于本文所提出的模型,利用Q-learning算法可以实现对建筑能耗的有效预测,并在此基础上,基于深度置信网的Q-learning算法具有更高的预测精度.此外,实验部分还进一步验证了算法中相关参数对实验性能的影响.
2019, 28(1):163-168. DOI: 10.15888/j.cnki.csa.006723
摘要:情感倾向性分类是自然语言处理领域中的热门话题,它的一个重要应用是挖掘线上评论中的重要信息,掌握网络舆论走向,因此本文提出一种基于GDBN网络的文本情感倾向性分类算法.该算法通过引入遗传算法来改进深度置信网络模型中的隐层,使模型自行对隐单元个数寻优,取得当前模型的适宜值,并以此模型进行深层建模与特征提取.最后通过反向传播网络对提取到的特征进行情感倾向性分类.在多个文本数据集上进行实验验证,验证结果表明了本文算法的有效性.
2019, 28(1):169-175. DOI: 10.15888/j.cnki.csa.006742
摘要:针对当用户评分较少时,推荐系统由于数据稀疏推荐性能显著降低这一问题,介绍了协同深度学习算法(Collaborative In Deep Learning,CIDL).本算法首先对大量数据进行深度学习,然后对数据文本进行挖掘提取词汇表,最后对评级(反馈)矩阵进行协同过滤,从而得出对用户的推荐项目.本文使用真实的电影数据进行实验,与另外四种优秀算法进行对比,证明该算法可以真实有效得解决由于数据稀疏使得性能降低的问题,并提高推荐的准确度.
2019, 28(1):176-181. DOI: 10.15888/j.cnki.csa.006736
摘要:在用爬虫爬取到大型商品网站的大规模网页数据集后,要将网页数据集作进一步筛选以得到目标数据集,筛选之前要做的一项准备工作就是删除网页中多余的标签.为此,用递归算法的思想给出了标签删除的算法,提出了标签删除功能的软件设计思想,对设计进行了2次设计改进及性能优化,最终采用了1个缓冲区维系线程1个标签删除线程的双线程设计思想.实验表明,优化后的标签删除功能在单机上每1000个网页的平均处理时间只需19.7 s,处理20万个网页只需1.1小时.
2019, 28(1):182-187. DOI: 10.15888/j.cnki.csa.006726
摘要:针对电视产品信息资源量过载导致用户选择困难的问题,本文主要研究了基于物品的协同过滤算法在电视产品推荐系统中的改进及应用,将个性化推荐技术和电视产品系统有机结合来满足用户和运营商的需求.在推荐过程中,首先收集用户的偏好建立数据模型,以用户观看电视产品的时长作为用户偏好的显式特征,然后在传统的协同过滤算法中引入点播金额权重进行改进,并采用欧几里德距离法计算物品相似度,最后根据邻居集合预测目标用户对电视产品的观看时长,得到推荐结果.实验表明,通过引入点播金额权重这一改进能够提高推荐的准确性.
2019, 28(1):188-193. DOI: 10.15888/j.cnki.csa.006701
摘要:软件测试是生产可靠软件的重要保障,对测试所发现缺陷的解决可以分为缺陷定位和缺陷修改两个步骤[1],其中的缺陷定位是最耗时的.通常情况下,测试套件中成功执行的测试用例都占绝大多数,对基于程序频谱的缺陷定位方法,应该具备自主调节成功测试用例覆盖比重的能力,以提高方法的可用性.即,随着语句被成功测试用例覆盖的次数增多,该语句的覆盖次数对怀疑率的贡献度应逐渐减小,成功测试用例数的有效处理能提高缺陷定位方法的效果.基于此,本文提出EPStar(EP*)缺陷定位方法,该方法可以有效调整成功执行用例数的影响,以避免成功用例数量对缺陷定位效果的过度影响,从而提高缺陷定位的准确性,通过实验对比,说明了EP*方法比现有的几种缺陷定位方法具有更高的缺陷定位精度.
2019, 28(1):194-199. DOI: 10.15888/j.cnki.csa.006704
摘要:使用词向量表示方法能够很好的捕捉词语的语法和语义信息,为了能够提高词向量语义信息表示的准确性,本文通过分析GloVe模型共现矩阵的特点,利用分布式假设,提出了一种基于GloVe词向量训练模型的改进方法.该方法主要通过对维基百科统计词频分析,总结出过滤共现矩阵中无关词和噪声词的一般规律,最后给出了词向量在词语类比数据集和词语相关性数据集的评估结果.实验表明,在相同的实验环境中,本文的方法能够有效的缩短词向量的训练时间,并且在词语语义类比实验中准确率得到提高.
2019, 28(1):200-206. DOI: 10.15888/j.cnki.csa.006722
摘要:针对基于位置的社交网络(Location-Based Social Network,LBSN)中用户签到数据的高稀疏性问题及用户隐私问题,提出了一种混合推荐模型(SoGeoCat).首先,通过用户潜在兴趣点数据模型,学习用户的潜在兴趣点;其次,将用户的潜在兴趣点纳入融合类别信息的矩阵分解模型中并优化;最后,根据用户特征矩阵、兴趣点特征矩阵,提出推荐策略.基于Foursquare真实数据集,实验结果表明:(1)相比于其他几个推荐模型,该算法将用户的潜在兴趣点填充至用户-兴趣点矩阵中,可以有效地缓解数据稀疏性的影响;(2)该算法可保护用户家庭信息;(3)在推荐模型中纳入类别信息的影响能提高推荐效果.
2019, 28(1):207-211. DOI: 10.15888/j.cnki.csa.006687
摘要:针对大规模语料手动标注困难的问题,提出利用概率潜在语义分析(PLSA)模型的新闻评论自动标注方法.利用PLSA计算获得语料集的"文档-主题"和"词语-主题"概率矩阵;基于情感本体库和"词语-主题"概率矩阵,认为某一类情绪词汇出现的概率最高的主题与词汇的情绪类别相同,对主题进行情绪类别标注;最后,基于"文档-主题"概率矩阵,认为出现在某一主题概率最高的文档与主题的情绪类别相同,通过"词汇-主题-文档"三者的关系,达到自动标注的效果.实验结果表明,本文提出的方法准确率可达到90%以上.
2019, 28(1):212-215. DOI: 10.15888/j.cnki.csa.006708
摘要:为实现工业现场对轴承防尘盖的自动检测,对机器视觉检测的关键技术进行了研究,提出一套基于机器视觉对轴承防尘盖的检测,针对轴承图像的特点,采用了一种最小二乘法进行圆拟合圆检测算法,完成了轴承防尘盖区域的提取,对连通区域的特征进行了分析,再进行量化处理和判断.实验结果表明,该方法实时性好,准确率高,可以满足工业检测需求.
2019, 28(1):216-221. DOI: 10.15888/j.cnki.csa.006712
摘要:随着社会的发展和文明的进步,人类对车辆智能化水平、便捷性和安全性的要求越来越高,针对停车场车位少、停车难的问题,在A*算法的基础上,增加了时间因素,将等待时间加入启发函数,综合路径距离和等待时间两个因素进而规划出入库和出库任务的最佳路径,设计了三维A*智能泊车算法,在结构化环境下,根据给定的停车场地图,预留出最优车位,规划出多辆同时工作的自动导引车(Automated Guided Vehicle,AGV)最优路径,安排AGV运载车辆到指定车位或完成出库过程,尽量减少客户在停车和取车中的等待时间,并使总成本最小,呈现真正"互联网化"的智能停车体验.
2019, 28(1):222-227. DOI: 10.15888/j.cnki.csa.006724
摘要:随着互联网的发展,网络口碑以用户评论真实客观的优点逐渐替代了传统的口碑,本文利用文本挖掘的方法研究用户满意度.首先,利用LDA模型建立用户满意度结构模型;然后,基于依存句法抽取语句情感标签,将HowNet情感词典与语义相似度算法相结合来识别语句情感倾向;最后,利用模糊综合评价法分析用户满意度.以摩拜为例,研究表明:从整体看,"摩拜"单车的用户满意度较高.但是,单车所需支付押金高、押金退还不及时,故障车多、软件定位精确度低等现象影响"摩拜"用户满意度的提升.
2019, 28(1):228-232. DOI: 10.15888/j.cnki.csa.006729
摘要:过去十几年来,心脏病发病率在全球一直呈上升趋势且居高不下.所以,如果可以通过计算机手段提取人体相关的体检指标,且通过机器学习的方式来分析不同特征及其权值对于心脏病的影响,对于预测和预防心脏病将起到很关键的作用.因此本文提出一个基于聚类和XGboost算法的预测方法.通过对数据的预处理,区分特征,再通过聚类算法如K-means对数据集聚类分块.最后用XGboost算法进行预测分析.实验结果表明,所提出的基于聚类和XGboost算法的预测方法的可行性和有效性,为就医推荐等应用提供了精准有效的帮助.
2019, 28(1):233-238. DOI: 10.15888/j.cnki.csa.006725
摘要:为解决网络安全专用产品网闸的性能测试问题,研究了针对网闸产品性能的测试方法,设计了包括使用iPerf软件和IXIA硬件的两种测试方式,两种测试方式均能够适用于对网闸性能的测试.同时,还分析了国家标准中对网闸性能要求的测试方法,并与网络安全专用产品的性能要求做了对比说明,最后通过实验的方式,测试了网络安全专用产品中网闸的吞吐量和系统延时性能指标,给出了14款网闸产品的性能结果分布.
2019, 28(1):239-244. DOI: 10.15888/j.cnki.csa.006730
摘要:图像语义分割是计算机视觉领域重要研究方向之一,其中基于深度学习的语义分割相较于传统分割算法更为高效可靠,可应用于交通监控、自动驾驶等领域的场景理解阶段.但复杂的分割网络在嵌入式平台上的推理速度较低,难以进行实际应用.因此针对交通监控、无人驾驶等应用背景,在嵌入式平台NVIDIA Jetson TX2上,采用基于深度卷积编解码器结构的图像分割网络,对道路场景进行语义分割,并基于NVIDIA的推理加速器TensorRT2,完成网络模型简化、网络自定义层添加与CUDA并行优化,实现了对网络推理阶段的加速.实验结果表明,加速引擎在TX2上的推理速度约为原模型的10倍,为复杂分割网络在嵌入式平台上的应用提供了支持.
周晓磊 , 赵薛蛟 , 刘堂亮 , 宗子潇 , 王其乐 , 里剑桥
2019, 28(1):245-250. DOI: 10.15888/j.cnki.csa.006703
摘要:裁判文书中的命名实体识别是自动化审判的关键一步,如何能够有效的分辨出案件的关键命名实体是本文的研究重点.因此本文针对财产纠纷审判案件,提出了一种基于SVM-BiLSTM-CRF的神经网络模型.首先利用SVM筛选出包含关键命名实体的句子,然后将正确包含此类实体的句子转化为字符级向量作为输入,构建适合财产纠纷裁判文书命名实体识别的BiLSTM-CRF深层神经网络模型.通过构建训练数据进行验证和对比,该模型比其他相关模型表现出更高的召回率和准确率.
2019, 28(1):251-255. DOI: 10.15888/j.cnki.csa.006727
摘要:及时发现和干预潜在的糖尿病视网膜病变患者,对帮助提升糖尿病患者的整体视觉质量和降低医疗成本具有十分积极的意义.由于糖尿病视网膜病变临床前期和正常人的眼底荧光图像在视觉感观基本上没有差别,为此本文通过目前应用较广的纹理特征算法和支持向量机对这两组图像进行了模式识别.通过将185张眼底荧光图片十折交叉检验发现,LBP算法对其具有很好的识别效果.等价模式下的59维LBP算子的十折交叉准确率达到了91.89%,同时在测试集和训练集以1:1随机划分的情况下,由训练集数据所生成的模型对测试集中92张眼底荧光图像的识别准确率达到了88.12%,AUC值为0.943.
2019, 28(1):256-261. DOI: 10.15888/j.cnki.csa.006715
摘要:Android操作系统提供了唤醒锁机制用于避免系统进入休眠状态.但若存在唤醒锁的误用,将导致设备能耗的加剧并严重影响用户体验.本文分析总结了常见的唤醒锁误用类型及原因,并实现了一款安卓应用,用以检测当前系统中持有唤醒锁的进程,并根据某些策略释放误用的唤醒锁.结合具体实机测试数据,本文提出的检测机制及功耗优化方法,可有效降低功耗,提高用户体验.
2019, 28(1):262-268. DOI: 10.15888/j.cnki.csa.006705
摘要:贝叶斯网络通过确定变量结点网络结构和参数学习来进行网络模型的概率推理,在样本数据不是过大的条件下能得到较精确的预测结果.从高校统一标准化的各数据平台中选取学生行为数据作为训练样本构建贝叶斯网络并进行参数学习得到推理模型,进而对高校学生的贫困程度进行预测,可以得出预测结果与实际样本对比没有显著差异,实现用数据分析精确判定高校学生的贫困程度水平.
2019, 28(1):269-274. DOI: 10.15888/j.cnki.csa.006749
摘要:通过分析移动群智感知的协作过程,即感知节点的携带-存储-转发过程,发现该过程忽略了对节点携带信息的内容筛选.而对于有目的的数据获取而言,这种先收集后筛选的方法导致在后续对数据的分析与筛选过程中会耗费更多的时间,同时获取的有效数据占比不高.考虑到这个因素,本文结合遗传算法设计了一种在移动群智感知环境下基于情感文本数据筛选的节点选择机制.该节点选择机制主要通过对节点携带数据类型的筛选来选择感知节点,从而获取感知环境下移动用户的情感文本数据.通过实验验证表明,使用此方法在数据处理的效率上最大提高了27.6%,在有效的数据占比上最大提高了21%,因此该方法能够有效的提高对整体数据处理的效率.
2019, 28(1):275-278. DOI: 10.15888/j.cnki.csa.006700
摘要:NLTK是Python中用于自然语言处理的第三方模块,但处理中文文本具有一定局限性.利用NLTK对中文文本中的信息内容进行抽取与挖掘,采用同语境词提取、双连词搭配提取、概率统计以及篇章分析等方法,得到一个适用于中文文本的NLTK文本内容抽取框架,及其具体的实现方法.经实证分析表明,在抽取结果中可以找到反映文本特点的语料内容,得到抽取结果与文本主题具有较强相关性的结论.
2019, 28(1):279-283. DOI: 10.15888/j.cnki.csa.006702
摘要:深度学习是当前人工智能领域广泛使用的一种机器学习方法.深度学习对数据的高度依赖性使得数据需要处理的维度剧增,极大地影响了计算效率和数据分类性能.本文以数据降维为研究目标,对深度学习中的各种数据降维方法进行分析.在此基础上,以Caltech 101图像数据集为实验对象,采用VGG-16深度卷积神经网络进行图像的特征提取,以PCA主成分分析方法为例来实现高维图像特征数据的降维处理.在实验阶段,采用欧氏距离作为相似性度量来检验经过降维处理后的精度指标.实验证明:当提取VGG-16神经网络fc3层的4096维特征后,使用PCA法将数据维度降至64维,依然能够保持较高的特征信息.