﻿ 基于降噪自编码器降维的汽车行驶工况分析
 计算机系统应用  2021, Vol. 30 Issue (1): 38-44 PDF

Analysis of Vehicle Driving Condition Based on De-Noise Autoencoder
GU Min, SHI Hua-Jun
East China Institute of Computing Technology, Shanghai 201808, China
Abstract: In recent years, with the continuous improvement of environmental governance requirements, automobile exhaust becomes one of the main sources of pollution. The automobile industry is the focus of attention in China nowadays, and the driving conditions of automobiles are considered as reflections in the automobile industry. Therefore, the study of working conditions has become one of the urgently needed research projects. Based on various industry parameters of automobile driving conditions, this study develops a general method for reflecting automobile driving conditions in different regions of China. At the same time, we use the dimensionality reduction method of the de-noise encoder used in deep learning when reducing dimensionality of complex data, and has achieved good and practical experimental results. The data in this paper is derived from the automobile experiment in Jiading District, Shanghai. After processing the data, the construction of the general working condition map has been realized through different means and methods such as EMD, feature extraction, dynamic time planning, wavelet decomposition, etc., providing a reference for the construction of the general working conditions map of the city and the overall.
Key words: vehicle driving conditions     de-noise encoder     dynamic time warping     eigenmode analysis     wavelet decomposition     approximate entropy

 图 1 实验总体流程图

1 数据预处理阶段

(1)线性插值法, 即在两个片段之间按照两个区间边界的情况进行插值, 呈现出一条线性递增或递减的曲线.

(2)拉格朗日插值法, 即在已知的连续片段下, 按照过这n+1个点, 且次数不超过n的多项式 $y = {P_n}\left( X \right)$ , 要估计任何一点 $\xi ,\;\xi \ne {{{X}}_{{{i}},}},\;{{i = 0}},\;{\rm{1,2}},\; \cdots ,\;n$ , 用该多项式计算结果进行插值. 在这种情况下, 插值曲线呈现出类抛物线的形式.

2 运动学片段的提取

 图 2 运动学片段的部分展示

3 降维分析及讨论

 图 3 协方差矩阵

T-SNE是一种常用的非线性降维度方法, 首先对这些明显的线性相关项直接去除, 并插入这些项的TSNE压缩项, 主要是利用T分布和随机近邻嵌入的思想, 随机近邻嵌入通过将高维空间映射到低维空间转化为概率来实现, 采用传统的欧氏距离, 将距离关系通过概率的相似性来表示. 如高维空间的两个数据点xixj, xi以条件概率Pj|i选择xj作为它的邻近点. 考虑到xi为中心点的高斯分布, 若xj越靠近xi, 则Pj|i越大. 定义Pj|i如下:

 ${p_{j|i}} = \frac{{\exp \left( { - {{\left\| {{x_i} - {x_j}} \right\|}^2}/2{\sigma _i}^2} \right)}}{{\displaystyle\sum\nolimits_{k \ne i} {\exp \left( { - {{\left\| {{x_i} - {x_k}} \right\|}^2}/2{\sigma _i}^2} \right)} }}$ (1)

 $\mathop {\max }\limits_w \frac{1}{{m - 1}}{\sum\limits_{i = 1}^m {\left( {{w^{\rm {T}}}\left( {{x_i} - \overline x } \right)} \right)} ^2}$ (2)

 $\mathop {\max }\limits_w {\rm {tr}}\left( {{W^{\rm {T}}}AW} \right),\;\;{\rm {s.t.}}{W^{\rm {T}}}W = 1$ (3)

 $A = \frac{1}{{m - 1}}\sum\limits_{i = 1}^m {{{\left( {{x_i} - \overline x } \right)}^{\rm {T}}}({x_i} - \overline x )}$ (4)

 图 4 标准化归一化结果

4 降维实验流程

 图 5 主成分分析结果

 图 6 主成分分析结果

5 聚类实验流程

(1)初始阶段, 将每个分段序列单独视为一个簇, 同时计算每个分段序列之间的DTW距离, 将得到一个初始距离矩阵;

(2)对距离按升序方式进行排序, 将升序后数组中按索引存入二维数组中;

(3)将数组中第1个值(最小值)对应的子序列合并到一个新簇中;

(4)从数组第2个值开始, 先判断其对应的两个子序列有无合并. 若未合并, 则将两个序列合并为一簇; 若其中一个已合并, 则将另一个子序列合并到该簇; 若两个子序列分别合并到不同簇中, 则将两个粗合并为一个簇. 每次合并时簇的个数减1;

(5)取数组下一个值, 并将簇的个数减1;

(6)重复步骤(4)和步骤(5), 直至数组中所有元素均处理完.

 图 7 聚类过程

6 EMD本征模态分解

 图 8 本征模态分解

7 结论与展望

 图 9 工况构建图

 [1] 姜平, 石琴, 陈无畏, 等. 基于小波分析的城市道路行驶工况构建的研究. 汽车工程, 2011, 33(1): 70-73, 51. [2] 王矗, 韩秀坤, 葛蕴珊, 等. 北京市公交车典型行驶工况的构建. 汽车工程, 2010, 32(8): 703-706. [3] 杜爱民, 步曦. 上海市公交车行驶工况的调查和研究. 同济大学学报(自然科学版), 2006, 34(7): 943-946, 959. DOI:10.3321/j.issn:0253-374X.2006.07.019 [4] 丁一峰, 李君, 盖洪超, 等. 小波变换在行驶工况构建用车速数据处理中的应用. 科学技术与工程, 2017, 17(28): 274-279. DOI:10.3969/j.issn.1671-1815.2017.28.048 [5] 吴云波, 王惠中, 刘军, 等. 南京市轻型车行驶工况的研究. 汽车实用技术, 2011, 5: 61-64. [6] 王海鲲, 陈长虹, 黄成, 等. 上海市城区典型道路行驶特征研究. 交通环保, 2005, 26(3): 35-39. [7] 曾安, 张艺楠, 潘丹, 等. 基于稀疏降噪自编码器的深度置信网络. 计算机应用, 2017, 37(9): 2585-2589. DOI:10.11772/j.issn.1001-9081.2017.09.2585 [8] 李友文, 石琴, 姜平. 基于马尔科夫过程的行驶工况构建中数据处理与分析. 合肥工业大学学报(自然科学版), 2010, 33(4): 491-494. [9] 马志雄, 朱西产, 李孟良, 等. 动态聚类法在车辆实际行驶工况开发中的应用. 武汉理工大学学报, 2005, 27(11): 69-71, 81. DOI:10.3321/j.issn:1671-4431.2005.11.021