• 2019年第28卷第10期文章目次
    全 选
    显示方式: |
    • 基于深层声学特征的端到端语音分离

      2019, 28(10):1-7. DOI: 10.15888/j.cnki.csa.007093

      摘要 (1590) HTML (2097) PDF 1.17 M (3141) 评论 (0) 收藏

      摘要:提出基于深层声学特征的端到端单声道语音分离算法,传统声学特征提取方法需要经过傅里叶变换、离散余弦变换等操作,会造成语音能量损失以及长时间延迟.为了改善这些问题,提出了以语音信号的原始波形作为深度神经网络的输入,通过网络模型来学习语音信号的更深层次的声学特征,实现端到端的语音分离.客观评价实验说明,本文提出的分离算法不仅有效地提升了语音分离的性能,也减少了语音分离算法的时间延迟.

    • 目标检测数据集半自动生成技术研究

      2019, 28(10):8-14. DOI: 10.15888/j.cnki.csa.007101

      摘要 (1385) HTML (1301) PDF 1.19 M (2847) 评论 (0) 收藏

      摘要:目标检测广泛使用于计算机视觉领域.在不同的场景中,我们需要使用不同的数据集训练模型.但是,人工生成数据集标签非常耗时.本文提出一种半自动的方法生成数据集标签,然后按照图像相似度设置的阈值自动筛选,最后保留符合要求的图像和对应的标签作为最终的数据集.实验表明,该方法可以提高数据集生成标签的速度,同时确保了准确率.

    • 基于GoogLeNet和ResNet的深度融合神经网络在脉搏波识别中的应用

      2019, 28(10):15-26. DOI: 10.15888/j.cnki.csa.007110

      摘要 (1867) HTML (1400) PDF 2.08 M (3578) 评论 (0) 收藏

      摘要:为了提高脉搏波识别的准确率,提出改进的深度融合神经网络MIRNet2.首先,经过主波提取、划分周期和制作hdf5数据集等,获得Caffe可处理的数据集.其次,提出由Inception模块和残差模块构成的融合网络Inception-ResNet (IRNet),包含IRNet1、IRNet2和IRNet3.在此基础上,改进Inception模块、残差模块和池化模块,构造Modified Inception-ResNet (MIRNet),包含MIRNet1和MIRNet2.与本文其它神经网络相比,MIRNet2的分类性能最好,特异性、灵敏度和准确率分别达到87.85%、88.05%和87.84%,参数量和运算量也少于IRNet3.

    • 基于深度学习的卫星图像识别分类方法

      2019, 28(10):27-34. DOI: 10.15888/j.cnki.csa.007081

      摘要 (1791) HTML (3915) PDF 1.57 M (3303) 评论 (0) 收藏

      摘要:卫星遥感技术是一种非常重要的地球空间监测技术.卫星遥感图像经过处理后具有数据量大和数据类型复杂多样的特点,传统方法进行识别分类耗费大量人力物力.为了降低工作量,并为后续处理提供便利,本文将深度学习算法应用于卫星图像的识别分类中,设计了一种基于VGGNet的识别分类方法,利用除雾算法对训练数据进行数据增强处理,并添加岭回归正则化层,利用标签之间的相关性进行预测,使得方法达到90%以上的F2 score,并在实验部分进行了对比验证.最后利用此方法搭建了一个基于Django的在线识别分类展示系统.

    • 基于配对函数调用场景的设备驱动漏洞检测

      2019, 28(10):35-44. DOI: 10.15888/j.cnki.csa.007099

      摘要 (1183) HTML (977) PDF 1.43 M (1941) 评论 (0) 收藏

      摘要:由于Linux系统的设备驱动工作在内核模式中,在这种特定的工作场景下,由设备驱动引发的漏洞问题极易影响操作系统的稳定性和安全性.当前在各类设备驱动漏洞中所占比例较高的当属资源操作类漏洞,针对这种情况,我们提出了一种基于配对函数调用场景的设备驱动漏洞检测方法.首先引入配对函数的概念,据此对特定的驱动程序做配对函数的自动提取与优化;随后结合手工分析结果构建配对函数在资源申请与释放过程中的执行路径;最后基于相应的函数调用场景进行配对检查,检测并验证设备驱动程序中内存资源的申请和释放是否为完全层次性匹配.为验证该方法的有效性,实验分别选取不同的设备驱动应用该漏洞检测方法,记录相应的漏报率、误报率及覆盖度.实验结果表明,该设备驱动漏洞检测方法精确率较高,检测速度快.并且该方法不依赖于实时编译以及硬件设备等条件.

    • 结合实时推荐与离线推荐的推荐系统

      2019, 28(10):45-52. DOI: 10.15888/j.cnki.csa.007087

      摘要 (1679) HTML (4605) PDF 1.17 M (2567) 评论 (0) 收藏

      摘要:推荐系统是从大量信息中主动查找用户可能感兴趣的信息的工具.如何更好地贴近用户偏好,满足用户长期固有偏好的同时又能考虑到用户短期的兴趣焦点变化,是推荐系统长期研究的一个问题.此外,在对推荐系统进行设计时,为了提高推荐性能,除了专注于用户建模优化、推荐对象建模优化或推荐算法优化外,还需要将推荐系统作为一个整体进行系统性的研究,关注如系统流畅性、可伸缩能力等.针对这些问题,本文设计了一种实时推荐与离线推荐相结合的推荐系统,提出了采用待推荐池的方法保证系统的流畅性;在分析实时数据与历史数据的基础上,提供实时推荐与离线推荐,在贴合用户长期固有偏好的同时也能适应用户短时间内的兴趣焦点变化;采用控制模块对不同推荐结果数据进行控制调节,提高系统的可伸缩能力.基于该推荐系统,本文进行了对于微信文章的推荐实验,通过对待推荐池内数据进行分析来评价推荐效果,结果表明,推荐数据能够逐步贴近用户兴趣偏好.

    • 面向消化内科辅助诊疗的生成式对话系统

      2019, 28(10):53-60. DOI: 10.15888/j.cnki.csa.007128

      摘要 (1226) HTML (1007) PDF 1.23 M (2131) 评论 (0) 收藏

      摘要:社会的高速发展带给群众的压力越来越大,由于工作压力和自身问题,越来越多的人饮食不规律且不健康,导致患有消化系统疾病的人群日益扩大,而在身体刚出现异样时,大部分人会首先选择在网上寻找信息帮助,由于传统搜索引擎的局限性,过程耗时,且因为消化内科疾病的多样性,用户很难准确获取相关信息.针对这一问题,考虑到对话系统作为一种较为高级的信息检索系统,能够根据用户的输入及时返回相关有效信息,本文探索了一种适用于消化科领域的生成式对话系统,通过支持向量机分类与主动学习相结合,在多个医学网站获取消化内科的专业问诊对话语料,人工与统计相结合构建消化内科疾病、药品和症状专业词典,改善传统分词工具在消化内科领域分词效果,在提高分词效果的基础上,使用Encoder与Decoder多层结构和门控循环单元GRU结合的方式,加入注意力机制,提出结合颠倒输入、键值对向量和Word2Vec向量的模型加强训练法,从而获得最终的消化内科生成式问答系统.实验结果表明,分词的准确率比传统方式高,且得出的对话模型能够有效的生成与问句相关的答句,提高对话系统的回答准确率.

    • 基于微信的数据安全自毁服务平台

      2019, 28(10):61-67. DOI: 10.15888/j.cnki.csa.007131

      摘要 (1812) HTML (1850) PDF 1.18 M (2749) 评论 (0) 收藏

      摘要:针对社交软件中数据信息易泄露的现状,展开了社交软件数据安全自毁服务平台的研究.利用微信,结合TLS协议,一种基于网络的数据自毁方法以及微信的第三方网页授权OAuth2.0机制构建了基于微信的数据安全自毁服务平台,以微信作为基础推广平台,用TLS协议保障客户端和服务器之间的数据传输的安全,核心为改进后的一种基于网络的数据自毁方法作为服务器端的数据安全自毁方案,最后使用微信的第三方网页授权OAuth2.0机制为基础完成对用户身份的识别.通过结合实例与理论分析,验证了设计方案的可行性和安全性.

    • 基于B/S架构的建筑能耗系统

      2019, 28(10):68-73. DOI: 10.15888/j.cnki.csa.007092

      摘要 (1501) HTML (1039) PDF 1.08 M (2334) 评论 (0) 收藏

      摘要:随着我国经济的发展,办公建筑和大型公共建筑面积的日益增加,建筑所带来的高耗能的问题日益突出.主要体现在用电、用水、用气等能耗中,本系统主要使用B/S架构Webx框架技术实现能耗管理的统计分析功能.采集程序以Go语言技术通过网络通信与串口服务器获取数据,串口服务器再与终端设备以RS485串行接口连接,以modbus或opc等协议采集数据.数据存储方面使用MySQL集群部署.以现代信息化技术手段实时了解当前办公楼的能耗使用情况.此系统在参考以往的系统设计方案同时,再进一步从技术选型、大数据存储、采集系统模块化、硬件性能的提升等各个方面进行升级改造,增加系统的易维护、易扩展、分布式部署等提升系统负载能力.从技术选型上选择目前最流行稳定的架构方案,数据库存储选择开源免费的MySQL集群方式来替代价格昂贵的Oracle数据库.

    • 基于Kafka和Storm的车辆套牌实时分析存储系统

      2019, 28(10):74-79. DOI: 10.15888/j.cnki.csa.007094

      摘要 (1442) HTML (1393) PDF 1.14 M (2006) 评论 (0) 收藏

      摘要:城市机动车数量、出行量的增加,使得车辆套牌现象屡禁不止.交管部门为了解决套牌监测的难题,采用传统的识别方式(如基于人工识别、基于牌照识别、基于射频识别等).然而面对海量的日志记录,这些方式普遍存在效率低、实时性差的问题.为此引入大数据技术,提出一个基于Kafka和Storm的车辆套牌实时分析存储系统.Kafka可以作为中间件进行缓存,提高数据采集和数据分析的同步性,还能避免数据丢失;Storm框架可以实现日志信息的实时计算,然后将套牌车辆信息存入指定文档中.整个系统具有实时、分布式存储、稳定、可扩展等特性.

    • 基于加盐BCrypt算法的电商安全模块设计及实现

      2019, 28(10):80-85. DOI: 10.15888/j.cnki.csa.007108

      摘要 (1263) HTML (1342) PDF 1.09 M (2762) 评论 (0) 收藏

      摘要:随着大数据时代的来临,密码泄露的情况时有发生,数据安全已成为我们日益关心的问题.本文运用springmvc+spring+mybatis框架技术,通过模型分析、数据库表设计、时序图逻辑跳转的方式,详细地阐述了加盐BCrypt算法在电商安全模块中的应用,有效地解决了MD5加密算法的弊端,极大地提高了信息的安全性.

    • 基于Spark并行化改进混合地点推荐

      2019, 28(10):86-91. DOI: 10.15888/j.cnki.csa.007118

      摘要 (1322) HTML (907) PDF 1.04 M (1919) 评论 (0) 收藏

      摘要:推荐算法是数据挖掘中最重要的算法之一.地点推荐是推荐系统的重要研究内容.针对目前地点推荐面临的数据稀疏、冷启动、个性化程度低等问题,设计并实现了基于Spark并行化处理的改进混合地点推荐模型.该算法融合了基于内容的推荐和基于协同过滤的推荐,结合了用户当前的偏好和其他用户的意见.使用基于用户-地点属性偏好的矩阵填充方式,以此改善数据稀疏性问题;同时,对于海量数据,系统采用Spark分布式集群实现并行计算,缩短了模型训练时间.实验结果表明,与其他推荐算法相比,该算法能有效改善数据稀疏性、提升推荐效果.

    • 虚拟手术中肝脏形变仿真系统

      2019, 28(10):92-97. DOI: 10.15888/j.cnki.csa.007105

      摘要 (1807) HTML (1794) PDF 965.94 K (2381) 评论 (0) 收藏

      摘要:由于肝脏具有复杂的生物力学特性,因此在进行形变仿真时,计算量大而难以达到实时性要求;同时在对肝脏形变实时仿真时却很难达到真实感.为了解决这一矛盾,需要研究一种可以自动依据手术器械操控区域及施力大小而动态转换的混合模型,通过理论分析提出了一种肝脏网格与无网格混合模型的构建方法.实验结果表明,该算法具有较高的计算效率且形变具有较好效果,能够满足虚拟肝脏手术仿真的真实感与实时性要求,对虚拟肝脏软组织手术研究具有一定的指导意义.

    • 面向网络隔离架构的业务流行为控制高可信交互框架

      2019, 28(10):98-102. DOI: 10.15888/j.cnki.csa.007083

      摘要 (1476) HTML (942) PDF 875.15 K (2323) 评论 (0) 收藏

      摘要:本文提出一种面向网络隔离架构的业务流行为控制的高可信交互框架,解决了企业互联网移动应用难以访问复杂安全架构下的高安全区业务数据的问题,确保了业务系统关键数据的安全.在网络安全防护要求下,引入移动接入网关,分解业务数据跨安全区交互过程,通过特殊的访问转换与通信方法,实现了业务数据通过各型隔离装置的安全、可信传输和业务流行为控制.该框架目前已在员工报销、考勤打卡、电力系统配网抢修、移动巡检等多个业务领域得到广泛应用.

    • 基于应力分布的3D打印壳模型构造与优化

      2019, 28(10):103-111. DOI: 10.15888/j.cnki.csa.007120

      摘要 (1503) HTML (966) PDF 1.71 M (2587) 评论 (0) 收藏

      摘要:近年来,愈发成熟的3D打印技术拉近了模型设计与产品制造的距离.但高昂的材料费用仍是制约其发展的重要因素.因此,如何在不改变模型外观的情况下进行模型结构的优化,以此来减少模型的打印体积、降低打印成本是亟待解决的问题.针对该问题,本文提出一种基于应力分布的壳模型构造和优化算法.该算法首先基于模型的体素化表示构造距离场,提取出初始的均匀厚度壳模型.然后基于顶点的von Mises应力,自适应的向外扩张内表面,调整各部位厚度,直到达到相关约束条件.优化得到的内表面与输入的外表面围成最终的优化模型.实验结果表明,在满足外观不变、力学稳定等约束的同时,优化得到的壳模型体积为输入模型体积的17.2%~24.4%,大幅减少了模型的打印体积,有效降低了打印成本.

    • 基于环境监测的两级数据融合模型与算法

      2019, 28(10):112-119. DOI: 10.15888/j.cnki.csa.007073

      摘要 (1782) HTML (1588) PDF 1.64 M (2734) 评论 (0) 收藏

      摘要:利用多源传感器采集的数据不仅存在大量冗余,而且会影响最终监测结果.为了提高监测的准确度,本文提出一种面向草原环境监测的两级数据融合模型.在一级数据融合中,首先采用自适应加权平均法对各区域内的同类传感器进行融合,然后利用BP神经网络对该区域内的异类传感器进行训练和融合,从而得到对各区域环境状况的初步判断.由于经BP神经网络融合的结果具有不确定性,因此,二级融合利用D-S证据理论对一级融合结果进行综合分析,从而得到对草原环境的决策判断.最后对模型及算法进行了有效性验证与分析,实验结果表明本文的方法能够较准确地监测草原环境状况,同时对草原环境的高效管理和科学养护等提供一些有价值的指导和决策依据.

    • 基于结构信息的图像拼接算法

      2019, 28(10):120-129. DOI: 10.15888/j.cnki.csa.007098

      摘要 (1733) HTML (1258) PDF 1.79 M (2150) 评论 (0) 收藏

      摘要:研究了纹理较多、噪声较大的两幅或多幅的图像拼接问题.两幅图像拼接时,提取图像特征点的好坏对图像拼接结果有很大影响.经典的SIFT算法是一种较好的局部特征点提取算法.而对于纹理较多,噪声较大的图像中,SIFT算法会提取数量较大的特征点,影响匹配的准确性和速度.本文提出基于结构信息的图像拼接算法(SKM,Structual Keypoint Matching),利用RTV算法提取图像的信息结构,有效地去除图像中的纹理噪声.去噪后,利用SIFT算法提取特征点进行匹配,最后利用RANSAC算法对匹配点对进行筛选,提高准确度.通过由SKM算法得到的变换矩阵H作用于原始图像,完成图像的拼接.

    • 基于多尺度卷积神经网络的人脸润饰检测算法

      2019, 28(10):130-137. DOI: 10.15888/j.cnki.csa.007072

      摘要 (1968) HTML (1089) PDF 1.36 M (2106) 评论 (0) 收藏

      摘要:针对目前人脸润饰检测算法特征提取复杂、识别率低的问题,提出了一种基于多尺度卷积神经网络的人脸润饰检测算法.不同于传统的卷积神经网络,本文的网络增加了图像预处理,利用基于方向梯度直方图(Histograms of Oriented Gradient,HOG)特征的人脸提取算法从原始图像中提取出人脸部分;在第一个池化层后连接局部归一化(Local Response Normalization,LRN)层,加速模型的收敛;提出了多尺度卷积层,将大小为1×1,3×3和5×5的卷积核进行级联,提高模型分类效果.实验结果表明,本文算法的检测精度在人脸润饰数据集LFW和ND-ⅢTD分别达到99.5%和92.9%,相比于主流网络结构和最新人脸润饰检测算法,检测精度有显著提高.

    • 基于PRAM并行模型最大值查找的方法与改进

      2019, 28(10):138-144. DOI: 10.15888/j.cnki.csa.007119

      摘要 (1347) HTML (1012) PDF 1.26 M (2227) 评论 (0) 收藏

      摘要:随着多处理器的出现,并行技术受到了广泛的关注,成为了加速处理问题速度的重要技术.但是使用并行技术在加速计算的同时也带来了对处理器数量需求的急剧提升,并行成本的显著增加.针对这一问题,通过研究基于PRAM (Parallel Random Access Machine)下的3种最大值查找并行算法中的不足,提出了一种比平衡树算法,快速查找法,双对数深度树方法并行成本(cost)更优的基于数据划分方法的最大值查找并行算法.基于数据划分方法的最大值查找算法有效的解决了现有并行方法中处理器工作量分配不均,对处理器需求过大,实现条件苛刻等问题.为此后类似并行算法降低并行成本提供一个方向.

    • 基于支持向量机的改进分类算法

      2019, 28(10):145-151. DOI: 10.15888/j.cnki.csa.007080

      摘要 (2254) HTML (2306) PDF 1.24 M (2176) 评论 (0) 收藏

      摘要:为了进一步提高支持向量机分类的准确性和泛化能力,提出一种基于支持向量机的改进二叉树分类算法.首先介绍支持向量机的基本原理,总结了常见的多分类器分类算法及其特点,结合现有分类算法的优点,为分类器引入了不同的权值,提出二叉树改进分类算法,有效避免了常用分类算法不足.通过仿真实验,与典型的多类分类算法对比,验证该算法的有效性,为多类分类预测研究提供了一条有效的途径.

    • 基于LSTM-BP组合模型的短时交通流预测

      2019, 28(10):152-156. DOI: 10.15888/j.cnki.csa.007077

      摘要 (2555) HTML (1261) PDF 1.32 M (4332) 评论 (0) 收藏

      摘要:为减轻日益严重的交通拥堵问题,实现智能交通管控,给交通流诱导和交通出行提供准确实时的交通流预测数据,设计了基于长短时记忆神经网络(LSTM)和BP神经网络结合的LSTM-BP组合模型算法.挖掘已知交通流数据的特征因子,建立时间序列预测模型框架,借助Matlab完成从数据的处理到模型的仿真,实现基于LSTM-BP的短时交通流精确预测.通过与LSTM\BP\WNN三种预测网络模型的对比,结果表明LSTM-BP预测的时间序列具有较高的精度和稳定性.该模型的搭建,可对交通分布的预测、交通方式的划分、实时交通流的分配提供依据和参考.

    • 基于改进全卷积神经网络的医疗数据表面重建算法

      2019, 28(10):157-163. DOI: 10.15888/j.cnki.csa.007095

      摘要 (1166) HTML (1104) PDF 1.25 M (1907) 评论 (0) 收藏

      摘要:为了实现对医疗数据的快速检测和分类识别,需要对医疗数据进行表面重建设计,首先,提出一种基于改进全卷积神经网络的医疗数据表面重建算法.采用无线射频识别技术进行医疗数据的大数据采样,对RFID采集的医疗数据进行信息融合处理,采用多元回归分析方法提取医疗数据的相关性统计特征量,然后,针对医疗数据中的冗余特征采用匹配滤波检测器进行冗余滤波处理,对提纯后的医疗数据采用相空间重构技术实现医疗数据重构,最后,对重构数据采用改进全卷积神经网络分类器进行分类识别,实现医疗数据的表面重建和自动识别.仿真结果表明,所提方法的医疗数据冗余特征处理效果较好,数据分类精度可高达90%以上,且医疗数据重建误差小,耗时少.

    • 基于U-Net的胸片肋骨影像抑制算法

      2019, 28(10):164-169. DOI: 10.15888/j.cnki.csa.007100

      摘要 (1995) HTML (1202) PDF 1.21 M (2349) 评论 (0) 收藏

      摘要:由于X光图像只有二维信息,骨骼结构会和人体器官在图像中重叠,对医生和肺结节智能检测系统造成不利影响,抑制图像中的肋骨结构可以一定程度上改善上述情形.我们将肋骨视为图像中的噪声信息,使用图像去噪的方法来完成肋骨抑制的任务.本文采用深度卷积网络作为基础模型,分析并尝试多种策略来提升模型性能,最终我们采用Unet网络结构,通过跳跃连接以及残差学习策略增强网络细节表现能力.实验证明,我们的方法能够有效抑制肋骨结构在X光图片中的不利影响,对肺结节检测任务的性能有一定的提升.

    • 基于非下采样剪切波变换和特征合成的医学图像融合算法

      2019, 28(10):170-177. DOI: 10.15888/j.cnki.csa.007109

      摘要 (1785) HTML (1510) PDF 2.18 M (2346) 评论 (0) 收藏

      摘要:针对融合后的医学图像时常存在细节纹理不够清晰的问题,本文提出一种新的基于非下采样剪切波变换(Non-Subsampled Shearlet Transform,NSST)的医学图像融合算法,对多模态医学影像进行融合,增强细节结构提取的能力,提高图像融合质量,为医疗诊断提供依据.首先,将已配准的源图像进行NSST分解,得到低频子带和一系列高频子带;其次,对于低频子带系数,提出利用局域平均能量与局域标准差的合成值进行子带之间选择的融合策略,有利于完整保存基础信息,对于高频子带系数,利用改进的拉普拉斯能量和(New Sum of Modified Laplacian,NSML)的方法进行融合;接着,将融合过后的低、高频子带进行NSST的逆过程变换,从而得到融合之后的图像;最后,在灰度和彩色医学多模态图像上进行大量的实验,并选择信息熵(IE),空间频率(SF),标准差(SD)和平均梯度(AG)对融合后的图像进行质量评价.仿真结果表明,本文算法在主观视觉效果以及客观评价指标上均取得较大改善.与其他算法相比,信息熵,标准差,空间频率和平均梯度的平均值分别提高了2.99%,4.06%,1.78%和1.37%,融合后的图像包含更丰富的细节纹理信息,视觉效果更好.

    • 基于MQTT的数据加密传输算法

      2019, 28(10):178-182. DOI: 10.15888/j.cnki.csa.007124

      摘要 (2615) HTML (4538) PDF 795.74 K (7006) 评论 (0) 收藏

      摘要:提出了一种改进MQTT协议的数据传输加密算法MQTT-EA (MQTT Encryption Algorithms).该算法中,物联网设备端与服务器端随机生成自己的私钥,然后相互通知对方自己的私钥并通过算法组合成最终的会话主密钥,通过DES加密、解密,传输安全数据.模拟了敌手A、B对数据传输过程进行攻击,验证了在会话密钥生成算法没有泄露的前提下MQTT-EA是安全的.

    • 基于突破性局部搜索的集装箱班列同步转运作业调度优化

      2019, 28(10):183-189. DOI: 10.15888/j.cnki.csa.007096

      摘要 (1231) HTML (872) PDF 1.01 M (2020) 评论 (0) 收藏

      摘要:铁路集装箱中心站作为内陆腹地运输网络中的重要节点.转运作为主要的站内作业活动,对其开展调度研究,能够有效缩短不同运输方式之间的转运周期,从而保证铁路集装箱多式联运的整体运作效率.为了快速制定堆场作业计划,现有铁路集装箱站场转运作业均要求班列间的集装箱转运须经堆场方可实现.在该模式下,必然发生两次装卸和一次暂存作业.为了避免暂存中转作业,采用集装箱班列同步转运作业模式构建了以同步转运集装箱箱数最大化为目标的数学规划模型,提出突破性局部搜索框架实现对大规模问题的求解.最后通过算例分析验证了所提出的启发式算法效率.

    • 基于神经网络与注意力机制的中文文本校对方法

      2019, 28(10):190-195. DOI: 10.15888/j.cnki.csa.007097

      摘要 (1511) HTML (1542) PDF 1.15 M (2267) 评论 (0) 收藏

      摘要:中文文本校对是中文自然语言处理方面的关键任务之一,人工校对方式难以满足日常工作的数据量需求,而基于统计的文本校对方法不能灵活的处理语义方面的错误.针对上述问题,提出了一种基于神经网络与注意力机制的中文文本校对方法.利用双向门控循环神经网络层获取文本信息并进行特征提取,并引入注意力机制层增强词间语义逻辑关系的捕获能力.在基于Keras深度学习框架下对模型进行实现,实验结果表明,该方法能够对含语义错误的文本进行校对.

    • 差异工件并行批调度问题中遗传算法研究

      2019, 28(10):196-200. DOI: 10.15888/j.cnki.csa.007117

      摘要 (1084) HTML (891) PDF 1011.04 K (1975) 评论 (0) 收藏

      摘要:本文考虑了遗传算法在包含差异工件的并行批处理机调度中的应用问题.工件具有不同的尺寸和到达时间.首先基于问题假设提出了一个数学规划模型,并采用BF、ERT-LPT实现工件的分批排序调度.然后考虑到这是一个NP-Hard问题,设计了新的选择、交叉、变异操作并结合遗传算法进行求解.最后通过仿真实验对比,验证了算法的有效性.

    • 基于生成对抗网络的数据增强方法

      2019, 28(10):201-206. DOI: 10.15888/j.cnki.csa.007107

      摘要 (3361) HTML (8726) PDF 1.07 M (5242) 评论 (0) 收藏

      摘要:深度学习在分类任务上取得了革命性的突破,但是需要大量的有标签数据作为支撑.当数据匮乏的时候,神经网络极易出现过拟合的问题,这种现象在小规模数据集上尤为明显.针对这一难题,本文提出了一种基于生成对抗网络的数据增强方法,并将其应用于解决由于数据匮乏,神经网络难以训练的问题.实验结果表明,合成的数据和真实的数据相比既具有语义上的相似性,同时又能呈现出文本上的多样性;加入合成的数据后,神经网络能够更加稳定地训练,而且分类的准确度也有了进一步的提高.将提出的算法和其他一些数据增强的技术对比,我们的方法结果最好,从而证明了这种技术的可行性和有效性.

    • 基于D-S证据理论的特征融合车标识别方法

      2019, 28(10):207-212. DOI: 10.15888/j.cnki.csa.006757

      摘要 (1253) HTML (1593) PDF 1.08 M (1917) 评论 (0) 收藏

      摘要:在针对现有的智能交通对车辆多维信息识别存在识别精度不高的情况,特别是对于车标识别,很大程度上识别结果依赖于高分辨和高质量的图像.提出了一种新的车标识别方法,用于识别卡口捕获的低质量车标图像,该方法是基于D-S证据理论的特征融合方法,提取Hu不变矩和HOG特征,采用不同的分类器构造基本概率分配(BPA),采用改进D-S证据理论进行融合,根据判别规则给出最终的识别结果.通过实验证明在低分辨的情况下仍能保持较高的准确率,分类准确率达94.29%,相比单一的特征识别,具有更强的鲁棒性.

    • 基于Kubernetes应用的弹性伸缩策略

      2019, 28(10):213-218. DOI: 10.15888/j.cnki.csa.007106

      摘要 (1297) HTML (1763) PDF 974.34 K (2347) 评论 (0) 收藏

      摘要:弹性伸缩是云计算的关键特征,它可以根据应用程序工作负载及时扩展计算资源以实现在高并发请求下应用的负载均衡.基于容器的微服务更应具有弹性伸缩功能从而在不同的工作负载条件下稳定运行.目前广泛使用的容器编排工具Kubernetes的弹性伸缩算法灵活性差,应对突发流量Pod会频繁进行扩展,并且扩展程度不能满足当前负载要求,会造成系统不稳定.针对这一问题,本文提出了一种自动缩放机制,将响应式扩展与弹性伸缩容忍度相结合,确保了系统的可靠性,大大提高了系统的灵活性,并具有很强的应用负载能力.实验测试表明,当系统面临大流量、高并发请求时,通过本文的方法实施弹性伸缩以后,失败请求率下降97.83%,保证了系统稳定性,能够很好的实现应用的负载均衡.

    • 基于Mycat的拟态数据库中间件研究

      2019, 28(10):219-225. DOI: 10.15888/j.cnki.csa.007079

      摘要 (2045) HTML (888) PDF 1.49 M (2592) 评论 (0) 收藏

      摘要:数据库系统的安全不仅依赖于数据库本身的安全,还受网络环境和操作系统的安全性影响,拟态防御是邬江兴院士首次提出的基于动态异构冗余体系架构,协同实现数据库所依赖环境,使数据库安全由被动防御变为主动防御.本文通过Mycat作为数据库中间件,通过对数据库的读写分离,集群的高可用,分布式事务处理,对指纹化SQL识别,以减轻单一数据库的数据存取和处理压力.Mycat将数据库模块变为异构动态冗余模式,实现数据库拟态化,使数据高效,快速,安全的存取和切分.

    • 基于XGBoost和LSTM加权组合模型在销售预测的应用

      2019, 28(10):226-232. DOI: 10.15888/j.cnki.csa.007091

      摘要 (2727) HTML (6035) PDF 1.19 M (3735) 评论 (0) 收藏

      摘要:针对多变量的商品销售预测问题,为了提高预测的精度,提出了一种ARIMA-XGBoost-LSTM加权组合方法,对具有多个影响因素的商品销售序列进行预测,本文采用ARIMA做单变量预测,将预测值作为新变量同其他变量一起放入XGBoost模型中进行不同属性的挖掘,并将XGBoost的预测值合并到多变量序列中,然后通过将新的多维数据转换为监督学习序列后利用LSTM模型进行预测,将3种模型预测结果进行加权组合,通过多次实验得出最佳组合的权值,以此计算出最终的预测值.数据结果表明,基于XGBoost和LSTM的加权组合的多变量预测方法比单一的预测方法所得到的预测值更为精准.

    • 虚拟行人仿真最低能耗动态避障

      2019, 28(10):233-238. DOI: 10.15888/j.cnki.csa.007076

      摘要 (1810) HTML (1114) PDF 1.37 M (2236) 评论 (0) 收藏

      摘要:虚拟行人仿真动态避障算法设计直接影响了仿真效果的真实性与科学性.大部分基于速度障碍的动态避障方法假定场景中的所有个体按照相同的避碰策略调整速度大小和方向.为提升虚拟行人仿真中局部动态避碰的真实性,本文对经典的底层分布式动态障算法ORCA中使用调节系数以区分不同行人的避障策略,同时引入行人瞬间能耗的概念,讨论行人在局部避碰过程中的能量消耗与速度变化之间的关系,在改进ORCA算法得到的可行速度域基础上使用线性规划的高效解法得到虚拟行人仿真的最低能耗避障速度.实验结果表明本文方法可以提升动态避障的仿真效率,计算性能也满足实时仿真的要求.

    • 系统日志模板提取方法研究

      2019, 28(10):239-244. DOI: 10.15888/j.cnki.csa.007112

      摘要 (1613) HTML (2778) PDF 993.69 K (2656) 评论 (0) 收藏

      摘要:提取日志模板是处理海量系统日志十分有效的方法.本文以Web系统日志为切入点,采用基于标签识别树的模板提取方法提取日志模板,并在其基础上,研究并完善了其日志预处理和模板表达式生成方法.针对于系统日志普遍存在的结构复杂问题,具体采用了基于文本相似度的预处理方法,实现了日志消息分类;采用模板最大匹配的方法,解决了由于日志格式不统一和切词导致的模板匹配度低的问题.最后,对本次日志模板提取方法的实验进行了评估,结果证明该方法的准确率达到96.4%,且模板匹配度大幅上升.

    • 基于词向量的中文新词情感倾向性分析

      2019, 28(10):245-250. DOI: 10.15888/j.cnki.csa.006879

      摘要 (1404) HTML (1097) PDF 939.22 K (2160) 评论 (0) 收藏

      摘要:为更具体表义社会新词的情感含义及其倾向性,该文提出了一种基于词向量的新词情感倾向性分析方法.在信息时代不断发展变化中,由于语言应用场景不断发展变化以及扩展语义表达的丰富性,网络上不断出现很多表达情感的新词,但是这些新词的表达虽有丰富的含义但缺乏准确的定义,因此对其情感倾向性分析具有一定困难.该文在分析了新词发现方法和词向量训练工具Word2Vec的基础上,研究了基于Word2Vec的情感词新词倾向性分析方法的可行性和架构设计,并面向微博语料进行实验,结果显示新词可以从与其相近的词中分析其情感倾向.

    • ZigBee网络路由算法研究与优化

      2019, 28(10):251-256. DOI: 10.15888/j.cnki.csa.007047

      摘要 (1374) HTML (1793) PDF 1.28 M (2968) 评论 (0) 收藏

      摘要:本文先研究分析了当前ZigBee网络支持的3种路由算法,并针对目前最常用的ZBR路由算法在路由发现过程中会产生大量无用RREQ分组且能量消耗快的缺点,本文提出了一种改进的分层能量控制算法.本文从控制节点能量阈值、限制RREQ分组的传播范围、限制网络深度入手对其进行优化,优化后的算法丢弃了不需要的RREQ分组包、降低了网络的能耗.最后通过NS-2进行仿真,实验结果证明,改进后的算法在保证网络传输稳定性的同时降低了时延和能量消耗,使得网络生存时间最大化.

    • 基于电子病历的肺癌诊断决策树算法

      2019, 28(10):257-263. DOI: 10.15888/j.cnki.csa.007111

      摘要 (3625) HTML (1197) PDF 1.16 M (2138) 评论 (0) 收藏

      摘要:随着人民生活水平的不断提高,肿瘤疾病的人数在不断增多,其中肺癌是21世纪严重危害人类健康的重大疾病.为此提出一种基于电子病历的肺癌诊断决策树方法.首先分析肺癌电子病历的特点以及决策树存在结构不稳定、过拟合等现象,运用主成分分析法结合C5.0算法构建的优化决策树模型.首先,建立主成分特征根大于1以及主成分累计贡献率大于85%的特征降维两种方法,然后通过C5.0算法建立决策树模型和剪枝操作,最后给出数据预处理过程及模型的执行流程和测试结果.实验结果分析,改进的算法有较好的准确率以及良好的可扩展性,从而验证了改进后的算法对于辅助肺癌临床实验具有重要的意义.

当期目录


文章目录

过刊浏览

年份

刊期

联系方式
  • 《计算机系统应用》
  • 1992年创刊
  • 主办单位:中国科学院软件研究所
  • 邮编:100190
  • 电话:010-62661041
  • 电子邮箱:csa (a) iscas.ac.cn
  • 网址:https://www.c-s-a.org.cn/csa/home
  • 刊号:ISSN 1003-3254
  • CN 11-2854/TP
  • 国内定价:50元
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号