2024, 33(3):34-42.DOI: 10.15888/j.cnki.csa.009420CSTR: 32024.14.csa.009420
摘要:在大型和高维数据上进行有效检测, 在实际应用中具有重要意义. 异常点检测是指识别出偏离一般数据分布的数据点, 其核心是密度估计. 尽管像深度自编码高斯混合模型通过先降低维度, 再进行密度估计已经取得了重大进展, 但是它对低维潜在空间引入噪声, 并且在对密度估计模块优化时存在一些限制, 例如需要保证协方差是正定矩阵. 为解决这些限制, 本文提出一种用于无监督异常检测的深度自编码标准化流(deep autoencoder normalizing flow, DANF). 该模型利用深度自编码器为每个输入样本生成低维潜在空间表示和重构误差, 进而将其输入标准化流(normalizing flow, NF), 最终映射成高斯分布. 在多个公开的基准数据集上的实验结果表明, 深度自编码标准化流模型显著优于最先进的异常检测技术, 在评估指标F1-score上最高提升26.43%.
2024, 33(3):195-205.DOI: 10.15888/j.cnki.csa.009441CSTR: 32024.14.csa.009441
摘要:数据在机器学习、人工智能等领域的研究和开发工作中占据了极其重要的地位. 然而现实中存在的一些因素导致数据需求者无法获得符合工作要求的真实数据集, 例如隐私问题、数据稀缺和数据质量较差等. 针对此现状, 在 SI (sampling-iteration) technique的基础上改进出一种非正态数据合成算法(KMSI). 该算法使用混合类型相关系数矩阵以减小SI technique在目标设定、控制循环等步骤中的度量误差, 通过替换Bootstrap采样法为核密度估计采样法以避免使用真实数据. 实验结果表明, KMSI相较SI technique能够应对复杂分布和混合类型的数据集, 且在合成结果中不包含真实数据; 相较于其他改进方法, KMSI在合成数据集样本量上能够给予使用者更大的自定义空间.
2022, 31(10):329-334.DOI: 10.15888/j.cnki.csa.008732
摘要:在针对将核主元分析(kernel principal components analysis, KPCA)与基于高斯分布的控制限(control limits, CLS)相结合会降低其性能的问题, 提出了一种基于核主元分析与核密度估计(kernel principal components analysis-kernel density estimation, KPCA-KDE)相结合的非线性过程故障监测与识别方法. 该方法采用核密度估计(kernel density estimation, KDE)技术来估计基于KPCA的非线性过程监控的CLS. 通过研究KPCA和KPCA-KDE所有20个故障的检出率发现, 与相应的基于高斯分布的方法进行比较, KDE具有较高的故障检出率; 此外, 基于KDE的检测延迟等于或低于其他方法. 通过改变带宽和保留的主元数量进行故障检测, KPCA记录的FAR值较高, 相反, KPCA-KDE方法仍然没有记录任何假报警. 在田纳西伊斯曼过程(Tennessee Eastman, TE)上的应用表明, KPCA-KDE比基于高斯假设的CLS的KPCA在灵敏度和检测时间上都具有更好的监控性能.
2021, 30(4):271-276.DOI: 10.15888/j.cnki.csa.007915
摘要:为了解决在复杂背景以及人流密集且互相遮挡的场景下, 对人流密度进行估计精度低的问题, 提出了基于YOLOv3增强模型融合的方法进行人流密度估计. 首先将数据集分别进行头部标注和身体标注, 生成头部集和身体集. 然后用这两个数据集分别训练两个YOLOv3增强模型YOLO-body和YOLO-head, 最后使用这两个模型在相同的测试数据集上推理, 将其输出结果进行极大值融合. 结果表明基于YOLOv3增强模型融合的方法, 与原始目标检测方法和密度图回归的方法相比精度提高了4%, 且具有较好的鲁棒性.
2019, 28(6):38-44.DOI: 10.15888/j.cnki.csa.006948
摘要:朴素贝叶斯分类器可以应用于岩性识别.该算法常使用高斯分布来拟合连续属性的概率分布,但是对于复杂的测井数据,高斯分布的拟合效果欠佳.针对该问题,提出基于EM算法的混合高斯概率密度估计.实验选取苏东41-33区块下古气井的测井数据作为训练样本,并选取44-45号井数据作为测试样本.实验采用基于EM算法的混合高斯模型来对测井数据变量进行概率密度估计,并将其应用到朴素贝叶斯分类器中进行岩性识别,最后用高斯分布函数的拟合效果作为对比.结果表明混合高斯模型具有更好的拟合效果,对于朴素贝叶斯分类器进行岩性识别的性能有不错的提升.
2016, 25(2):146-151.
摘要:传统统计分析方法忽略了变量间作用关系,而传递熵可以有效地表达变量间作用关系,因此提出了一种基于传递熵的MPCA间歇过程监测方法.利用传递熵表达变量间的作用关系,在计算传递熵时采用非参数核密度估计法,利用该方法不依赖于数据先验分布知识的特点来处理非高斯分布的过程数据,通过构建传递熵矩阵,结合滑动窗,实现对间歇过程变量间信息传递的动态表达,最后对传递熵矩阵进行多向主元分析方法(MPCA)建模,实现间歇过程监测.通过青霉素发酵的仿真,结果表明与传统多变量统计过程控制(MSPC)方法作对比,本文监测方法能更及时准确地监测到过程异常.
2010, 19(5):163-166.
摘要:针对头部目标跟踪的应用背景,在Mean Shift的框架下提出一种基于特征匹配滤波的自适应模板更新策略。该方法根据被跟踪目标在不同状态下所呈现出颜色的统计特征信息,采用颜色空间核密度估计匹配滤波的方法,对模板中局部区域像素的更新作出决策。实验结果表明,该算法有效解决了因头部旋转以及物体遮挡而导致模板不匹配的问题,实现了头部的连续跟踪,取得了很好的跟踪效果,提高了跟踪算法的整体稳定性和鲁棒性。