情感识别已逐渐成为脑电信号识别研究的重点[1–3], Petrantonakis等[4]利用高阶交叉和混合滤波的方法对前额区脑电信号用以进行情感识别研究, 数据包含气愤、高兴、惊讶、恐惧、厌恶、悲伤6种情感, 识别率为84.72%. Khosrowabadi等[5]利用自组织映射的方法对4种情感进行情感识别, 获得较好的结果. Hosseini等[6]提取脑电信号的近似熵特征, 并以支持向量机(Support Vector Machine, SVM)进行识别, 正确率达到73.25%. 李昕等[7]提出了基于PCA特征融合近似熵、小波变换特征、Hurst指数特征方法并以SVM识别, 在8种情感识别平均准确率在85%左右.
自回归模型(Auto-Regressive, AR)是一种经典的分析脑电信号方法. Zhang等[8]从脑电信号中提取自回归模型系数和样本熵值作为特征向量, 基于SVM进行情感识别, 结果反映自回归模型可以有效地提高脑电信号的分类性能. Pham等[9]利用功率谱密度和自回归模型从脑电信号提取特征并识别, 最高分类识别准确率为77.38%. Hatamikia等[10]从脑电信号中提取自回归模型系数作为特征向量进行情感识别, 最高识别率为74.20%. 与上述文献仅使用AR模型从原始脑电信号提取AR系数不同, 本文提出了基于小波变换的AR模型提取脑电信号特征方法, 不仅使用AR模型从原始脑电差分信号提取系数, 并从小波分量及一阶差分小波分量中提取系数. 小波分量反映了脑电信号在不同频段下的时频信息, AR模型能用较少的系数反映序列丰富的谱信息, 两者之间的结合能够结合两种方法的优势. PCA在数据分析中通常作用是压缩数据维数, 而李昕等[7]使用PCA对脑电信号的多特征起到融合作用, 本文则使用PCA过滤AR系数中拟合误差数据. 在模式识别方面中泛化性能比较好的分类器使用较多[11–15], 如SVM[6,7], 本文使用与SVM一样拥有较强泛化能力的梯度提升分类树以实现情感识别.
1 方法本文算法基于小波变换、自回归模型这两种脑电信号分析方法提取出每种情感的脑电特征. 小波变换是一种经典时频域脑电信号分析方法, 自回归模型能够近似拟合真实的脑电信号, 可用较少的参数反映更多的谱信息[16]. 本文算法从这二个不同特征提取角度出发, 先是利用小波变换获取脑电信号的时频信息, 后在原始脑电信号与小波分量中使用自回归模型, 以用较少的AR系数反映信号的谱信息以及时频信息, 最终使用PCA对系数进行过滤. 具体算法流程如图1所示.
1.1 离散小波变换小波变换在众多脑电信号分析方法中是一种经典的时频分析方法. 其定义为:
$WT(\alpha , \tau ) = \dfrac{1}{\alpha }\int_{ - \infty }^\infty {f(t)} *\Psi \left(\dfrac{{t - \tau }}{\alpha }\right)dt$ | (1) |
本文使用基于db4小波函数的四阶离散小波变换. 信号经离散四阶小波变换后可得:
$\begin{split} S(t)&=cA_i+\sum\nolimits_{j=1}^{i}cD_j\\ &=cA_4+cD_4+cD_3+cD_2+cD_1 \end{split}$ |
式中,
1.2 AR模型的系数估计
$ {X_t} = {\alpha _1}{X_{t - 1}} + {\alpha _2}{X_{t - 2}} + \cdots { { + }}{\alpha _{\rm{p}}}{X_{t - {\rm{p}}}}{{ + }}{\delta _t} $ |
其中
首先设
$\left\{ \begin{gathered} {\alpha _1} + {\alpha _2}y(1) + \cdots {{ + }}{\alpha _p}y(p - 1) = y(1) \hfill \\ {\alpha _1}y(1) + {\alpha _2}{{ + }} \cdots {{ + }}{\alpha _p}y(p - 2) = y(2) \hfill \\ \cdots \hfill \\ {\alpha _1}y(p - 1) + {\alpha _2}y(p - 2)+ \cdots +{\alpha _p} = y(p) \hfill \\ \end{gathered} \right.$ | (2) |
在工程实际应用中, 用样本自相关函数
$\left\{ \begin{gathered} {\alpha _1} + {\alpha _2}r(1) + \cdots {{ + }}{\alpha _p}r(p - 1) = r(1) \hfill \\ {\alpha _1}r(1) + {\alpha _2}{{ + }} \cdots {{ + }}{\alpha _p}r(p - 2) = r(2) \hfill \\ \cdots\hfill \\ {\alpha _1}r(p - 1) + {\alpha _2}r(p - 2)+ \cdots +{\alpha _p} = r(p) \hfill \\ \end{gathered} \right.$ | (3) |
式(3)中,
$ r(k) = \frac{1}{{{s^2}(p - k)}}\sum\nolimits_{t = 1}^{p - k} {{X_t}} {X_{t + k}}, k = 1, 2, \cdots, p $ |
其中,
使用Yule-Walker估计AR系数, 步骤如下:
(1)设每个通道的原始脑电信号为
(2)
(3) cD4、cD3、
(4)对
使用PCA对AR系数特征进行特征变换.
(1) 假设n×m的原始特征矩阵为M, 对矩阵M去中心化处理, 得到矩阵
(2)求
(3)求解协方差矩阵
$ C = UA{U^{\rm{T}}} $ | (5) |
(5)式中, 协方差矩阵
(4)求解投影矩阵
$CR(j) = \dfrac{{{\lambda _j}}}{{\displaystyle\sum\nolimits_{i = 1}^p {{\lambda _i}} }}, j = 1, 2, \cdots, p$ | (6) |
则前
$C{R_{\rm{total}}} = \dfrac{{\displaystyle\sum\nolimits_{j = 1}^k {{\lambda _j}} }}{{\displaystyle\sum\nolimits_{i = 1}^p {{\lambda _i}} }}$ | (7) |
根据累积贡献率的大小来确定主成分的投影矩阵
(6) 依据矩阵M与投影矩阵
$F = M*W.$ |
利用PCA方法对1890维AR系数特征进行特征变换, 保留累积贡献率在85%以上的主成分, 所得主成分的累积贡献率和特征根如图2所示(以前15个特征量为例).
图2中的上图对应主成分的累积贡献率, 可以看出, 第一主成分的累积贡献率是93.40%, 但第三主成分的累积贡献率已为98.61%. 下图是对应主成分的特征根, 可看出前三个主成分的特征根之间相差较大, 相对之前的主成分而言, 后面主成分的特征根很小并且之间的相差很小. 一般而言, 在保留累积贡献率在85%以上的主成分的基础上, 结合PCA特征变换后的新特征量选取依据是选择特征根之间相差较大的主成分[7]. 本文在不同情感分类时, 皆保留前三个主成分, 即经变换后特征数据总计三维.
为探究PCA在本文算法中起到的作用, 以有无使用PCA的识别平均结果作为推断依据, 结果如表1所示. 由表1可知, 未使用PCA的识别结果仅有50.89%, 而使用后准确率有明显提高. 因为AR模型是对脑电信号序列进行拟合, 由于模型拟合具有一定的误差, 14个通道的信号拟合误差的叠加将会导致AR系数特征数据中含有较多的冗余及错误信息, 将会导致分类精度的下降. PCA通常作用是能够压缩数据维数, 而在本算法中PCA起到过滤AR系数特征中的冗余及错误信息的作用.
2 结果与分析 2.1 数据说明
采用由Koelstra等[17]提出的分析人类情感状态的多模态数据库DEAP. 该数据库记录了32位健康受测试者观看40个时长为1分钟的不同音乐视频(MV)时的脑电信号和外周生理信号. 受试者的平均年龄为26.9岁, 男女各半. 每位观看MV的受测试者所采集到的脑电信号数据格式为40×40×8064, 采样频率为128 Hz, 其中第一个40代表MV编号, 第二个40代表采集脑电信号的常用通道, 8064是指每通道脑电信号所含数据点数量. 按照国际标准10-20系统, 分别提取前额区(FP1、FP2)、额区(F3、F4、F7、F8)、中央(C3、C4)、颞区(T7、T8)、顶区(P3、P4)和枕区(O1、O2)的通道数据. 本文从数据库中选取8种常见的情感: 高兴、激动、欢乐、喜爱、憎恨、抑郁、难过、恐惧[5], 所选取的脑电信号数据截取时间长度为24 s, 即3072个数据点, 则每种情感有32个数据段, 即32个样本.
2.2 数据选取位置的影响为了防止因为数据选取位置不同而造成的偶然结果. 本文随机选取8段不同位置的数据, 评估任务为八种情感两两分类, 得到平均分类精度以及平均标准差, 其结果如表2所示. 结果反映了不同位置的数据的识别结果具有差异, 原因是不同位置数据段所含有情感的信息量不同. 在8次识别结果中, 最低平均准确率为91.93%, 最高96.13%, 总体平均准确率为94.44%, 其结果表明在数据选取方面上本算法泛化能力良好. 下文以对于识别的详细结果以及分析使用7号数据段作为讨论对象以及本实验仿真使用的平台是Anconda3-5.0.1.
2.3 详细结果
以八种情绪两两之间的分类任务, 用10折交叉验证法的平均准确率作为算法评估, 如表3所示; 取10折交叉验证所得的平均标准差作为模型的泛化能力评估, 如表4所示. 从表3中可知, 最低分类精度为82.50%, 最高分类精度为98.75%, 平均分类精度为95.76%. 从表4中可以看出, 最高标准差为11.90%, 最低标准差为3.75%. 平均标准差为6.82%. 结合表3与表4数据, 发现较多情感分类任务不仅识别结果较好, 且标准差低, 反映模型在分类任务的泛化能力良好. 因为与文献[7]的使用相同的情感数据库DEAP, 且情感选取类别及分类任务相同, 因此本文选取文献[7]进行算法横向对比. 文献[7]使用了基于PCA方法融合近似熵、小波变换特征和Hurst指数三种特征算法. 结果如表5所示. 文献[7]结果中最低分类精度为77.45%, 最高分类精度为91.47%. 平均分类精度为85%左右. 对比表3和表5数据, 本文的算法的总体分类精度高于文献[7]算法, 识别结果提高10.76%.
3 结束语
本文算法虽使用了PCA、离散小波变换与AR模型这些经典脑电信号分析方法提取情感脑电信号特征, 但本文利用AR模型将小波分量和脑电信号的变化情况作为特征提取重点, 而不仅仅从原始脑电信号提取系数; PCA在本文方法中作用亦不是压缩数据维数, 而是与AR模型搭配, 从而过滤特征中的冗余及信息. 脑电信号与小波分量的差分序列反应不同尺度下的情绪剧烈程度, 而AR模型因为其拟合误差的原因, 如果能够将系数中的错误信息过滤, 则系数能够有效的从脑电信号与小波分量的差分序列中提取特征. 结果表明PCA能够过滤系数中的拟合误差信息, 使得AR模型能够作为有效提取情感脑电信号特征的一种方法.
[1] |
Bortoletto M, Veniero D, Thut G, et al. The contribution of TMS-EEG coregistration in the exploration of the human cortical connectome. Neuroscience & Biobehavioral Reviews, 2015, 49: 114-124. |
[2] |
Li YJ, Cao D, Wei L, et al. Abnormal functional connectivity of EEG Gamma band in patients with depression during emotional face processing. Clinical Neurophysiology, 2015, 126(11): 2078-2089. DOI:10.1016/j.clinph.2014.12.026 |
[3] |
Mohammadi Z, Frounchi J, Amiri M. Wavelet-based emotion recognition system using EEG signal. Neural Computing and Applications, 2017, 28(8): 1985-1990. DOI:10.1007/00521-015-2149-8 |
[4] |
Petrantonakis PC, Hadjileontiadis LJ. EEG-based emotion recognition using hybrid filtering and higher order crossings. Proceedings of the 3rd International Conference on Affective Computing and Intelligent Interaction and Workshops. Amsterdam, The Netherlands. 2009. 1–6.
|
[5] |
Khosrowabadi R, Quek HC, Wahab A, et al. EEG-Based emotion recognition using self-organizing map for boundary detection. Proceedings of the 20th International Conference on Pattern Recognition. Istanbul, Turkey. 2010. 4242–4245.
|
[6] |
Hosseini SA, Naghibi-Sistani MB. Emotion recognition method using entropy analysis of EEG signals. International Journal of Image, Graphics and Signal Processing (IJIGSP), 2011, 3(5): 30-36. DOI:10.5815/ijigsp |
[7] |
李昕, 蔡二娟, 田彦秀, 等. 一种改进脑电特征提取算法及其在情感识别中的应用. 生物医学工程学杂志, 2017, 34(4): 510-517, 528. |
[8] |
Zhang Y, Ji XM, Liu B, et al. Combined feature extraction method for classification of EEG signals. Neural Computing and Applications, 2017, 28(11): 3153-3161. DOI:10.1007/s00521-016-2230-y |
[9] |
Pham TD, Tran D, Ma WL, et al. Enhancing performance of EEG-based emotion recognition systems using feature smoothing. Arik S, Huang TW, Lai WK, et al. Neural Information Processing. Cham: Springer, 2015. 95–102.
|
[10] |
Hatamikia S, Maghooli K, Nasrabadi AM. The emotion recognition system based on autoregressive model and sequential forward feature selection of electroencephalogram signals. Journal of Medical Signals and Sensors, 2014, 4(3): 194-201. |
[11] |
李红红. 脑电数据分析方法及其在压力情感状态评估中的应用[硕士学位论文]. 秦皇岛: 燕山大学, 2014.
|
[12] |
聂聃, 王晓韡, 段若男, 等. 基于脑电的情绪识别研究综述. 中国生物医学工程学报, 2012, 31(4): 595-606. DOI:10.3969/j.issn.0258-8021.2012.04.018 |
[13] |
赵龙莲, 梁作清, 伍文清, 等. 生物反馈训练后癫痫患者脑电相关维数变化的分析. 中国生物医学工程学报, 2010, 29(1): 71-76, 85. DOI:10.3969/j.issn.0258-8021.2010.01.012 |
[14] |
李立. 基于脑电信号样本熵的情感识别[硕士学位论文]. 太原: 太原理工大学, 2014.
|
[15] |
段若男. 基于脑电信号的视频诱发情绪识别[硕士学位论文]. 上海: 上海交通大学, 2014.
|
[16] |
张子杰, 张晖, 高淑荣. 平稳自回归模型的系数估计与应用. 武汉理工大学学报, 2009, 21(15): 135-137. DOI:10.3963/j.issn.1671-4431.2009.15.036 |
[17] |
Koelstra S, Muhl C, Soleymani M, et al. DEAP: A database for emotion analysis; using physiological signals. IEEE Transactions on Affective Computing, 2012, 3(1): 18-31. DOI:10.1109/T-AFFC.2011.15 |