随着信息技术的发展, 个人身份信息认证已经涉及到了社会生活的各方面, 从银行账户到个人的社交网络账户都离不开身份信息认证技术. 传统的身份认证主要是采用加密口令、账户密码、短信验证码等形式, 这些方法普遍存在着安全性较低、易暴露, 易遗忘等问题. 因此, 生物特征识别技术作为目前最为方便与安全的识别技术, 近年来得到了广泛关注, 比如支付宝公司推出了基于个人声纹和人脸识别的认证支付技术. 生物识别技术主要是指利用个体的生物特征进行生身份认证的一种技术, 目前主要的研究是针对个体的虹膜、指纹、掌纹、人脸等生物特征展开工作. 相比之下, 对于人体静脉纹的研究相对较少, 而静脉纹在特征稳定性、独特性和持久度方面具有一定的优势.
掌静脉识别技术中, 掌静脉图像质量对后续特征提取与匹配有着直接的影响, 从而影响最终的识别率. 因此掌静脉增强成为了掌静脉识别中重要的研究内容. 掌静脉图像增强基本上可以分为两大类, 频域增强与空域增强. 频域增强是将图像看成一种两维信号, 基于二维傅里叶变换, 进行相应的滤波处理. 空域增强是指直接对图像像素点进行处理, 通过直接改变图像像素值的分布状况来改善图像质量. 近年来, 广大学者们针对静脉增强这一课题做了大量的研究. 文献[1]提出了一种基于中值滤波的手指静脉图像增强方法, 使用中值滤波和高通滤波进行增强处理, 改善了静脉整体对比度. 文献[2]中使用自适应滤波Retinex静脉增强算法, 增强静脉的同时对图像灰度进行了均衡化处理, 使手背静脉得到明显增强. 文献[3]提出了一种对比度受限的直方图均衡化和top-hat变换相结合的手背静脉增强算法. 文献[4]提出了基于边缘检测加权引导滤波的指静脉图像增强算法. 文献[5]提出了一种改进的方法, 采用定向分解和Frangi滤波, 以增强手指静脉. 文献[6]提出了一种基于多通道Gabor滤波器的手指静脉增强方法. 文献[7]提出一种新的手掌静脉增强算法, 将受约束的局部直方图均衡算法(CLAHE)和非下采样的Contourlet变换(NSCT)相结合进行图像增强. 文献[8]提出了一种基于灰度分组(GLG)圆形Gabor滤波器(CGF)结合的手指静脉图像增强方法. 文献[9]反锐化掩模算法实现图像增强. 文献[10]中Miura提出了一种计算静脉图像横截面轮廓中局部最大曲率的方法, 通过提取手指静脉网络来增强静脉.
通过以往学者的研究发现, 对于静脉图像增强处理, 传统直方图均衡, Retinex算法以及引导滤波等算法虽然算法简单易行, 但是对于采集到的静脉图像质量要求较高, 而对于质量较低的静脉图像算法适用性较差. 基于Gabor滤波器的算法[11], 具有优良的频率和方向选择特性, 可以有效去除噪声, 保持静脉纹理信息, 但其运行时间长, 时效性差, 不利于广泛应用. 本文针对以往掌静脉增强方法中所存在增强效果差以及算法耗时大的问题, 提出一种Gabor滤波的快速增强算法, 该算法具有较好增强效果且具有更低的计算复杂度, 使其更符合在实际应用中对于设备处理时效性的要求.
1 Gabor滤波器 1.1 Gabor滤波器简介Gabor滤波器是一种线性滤波器, 适合图像处理中纹理的分析与检测, 以 Dennis Gabor命名. Gabor滤波器对于方向和角度的表达类似于人类视觉系统对于方向和角度的表达. Gabor变换是在傅里叶变换的基础上发展而来的, 因此, Gabor变换和傅里叶变换一样具有频域频谱特性. 与傅里叶变换不同的是, Gabor变换同时具有时域和频域的局部分析特性. 除此之外, Gabor滤波器对于光照变化不敏感, 对光照变化有良好的适应性; 对于图像的旋转与变形具有一定的容忍性[12–14]. 由于Gabor滤波器具有这一系列优良特性, 故被广泛应用于图像分析领域.
1.2 Gabor滤波器的原理及实现过程由上可知, Gabor变换是一种特殊的傅里叶变换, Gabor变换又叫做短时傅里叶变换和加窗傅里叶变换, 在空域, 一个二维的Gabor滤波器可以表示为一个正弦平面波和高斯核函数的积[15].
${{G}}\left( {x,y} \right){\rm{ = exp}}\left( {{\rm{ - }}\frac{{x_1^2{\rm{ + }}{\gamma ^{\rm{2}}}y_1^2}}{{2{\sigma ^2}}}} \right){\rm{exp}}\left( {\frac{{2\pi {x_1}}}{\lambda }} \right)$ | (1) |
${{G}}\left( {x,y} \right){\rm{ = exp}}\left( {{\rm{ - }}\frac{{x_1^2{\rm{ + }}{\gamma ^{\rm{2}}}y_1^2}}{{2{\sigma ^2}}}} \right)\cos \left( {\frac{{2\pi {x_1}}}{\lambda }} \right)$ | (2) |
${x_1} = x\cos \theta + y\sin \theta $ | (3) |
${y_1} = - x\sin \theta + y\cos \theta $ | (4) |
式(1)为二维Gabor函数在空域的数学表达. 其中, λ表示波长, 它的值通常大于等于2, 以像素为单位, 不能大于输入图像尺寸的五分之一. θ表示方向, 取值为0到360度, 指定了Gabor函数并行条纹的方向. γ表示长宽比(空间纵横比), 决定了Gabor函数曲线形状的椭圆率, 通常该值为0.5; 当γ=1时, 曲线形状是圆的; 当γ<1时, 其形状沿着平行条纹方向不断拉伸.σ表示高斯部分的标准差, 其值不能直接给定, 受到滤波器中心频率的制约. x, y表示图像像素点的空间位置坐标.
Gabor滤波器的参数众多, 经过学者们的研究总结, 当前关于Gabor滤波器的参数设置主要体现在尺度和角度上的设计, 本文主要针对这些参数进行滤波器的设计.
实际应用中, 式(2)为Gabor滤波器的实部, 也叫做偶对称Gabor滤波器. 研究发现[6], Gabor滤波器的实部特别适合图像中脊线的检测, 本文就是利用Gabor滤波器的实部对静脉滤波处理. 对图像的Gabor特征可以表示为灰度图像与Gabor函数的卷积, 可以描述为式(5):
${G_{\rm{out}}}\left( {x,y} \right) = I\left( {x,y} \right) * G\left( {x,y} \right)$ | (5) |
其中,
图1为Gabor滤波器4个方向的示意图. 不同方向滤波器用来提取对应方向的纹理.
2 二维FFT算法 2.1 快速傅里叶变换FFT简介
快速傅里叶变换FFT是离散傅里叶变换DFT的快速算法, 由于FFT在计算时的高效性特点, 具有极高的研究价值和工程应用价值. 二维快速傅里叶变换(2D-FFT)被广泛应用于图像处理领域, 在图像处理中常作为频域的计算工具, 用于图像的频谱分析以及卷积计算等. 在工程应用中, 使用二维傅里叶变换处理图像时往往计算量特别大, 使得硬件实施的难度加大, 限制了实际工程中的应用. 利用二维快速傅里叶变换可以大大减小计算量, 减小傅里叶变换在实际应用中的计算量.
2.2 二维离散快速傅里叶变换图像是在空域和频域均为离散二维信号, 对于图像的傅里叶变换, 我们使用的是二维离散傅里叶变换(DFT). 假设f(x,y)为一张大小为M×N的图像, f (x, y)的DFT可以定义为:
$F\left( {U,V} \right) = \frac{1}{{MN}}\sum\limits_{x = 0}^{M - 1} {f\left( {x,y} \right)} {e^{ - j2\pi ux/M}}\sum\limits_{y = 0}^{N - 1} {f\left( {x,y} \right)} {e^{ - j2\pi vy/N}}$ | (6) |
其中, x=0, 1, 2,…, M–1;y=0, 1, 2, …, N–1;
同样, 二维离散傅里叶反变换可以定义为:
$f\left( {x,y} \right) = \sum\limits_{u = 0}^{M - 1} {F\left( {U,{\rm{V}}} \right)} {e^{j2\pi ux/M}}\sum\limits_{{\rm{v}} = 0}^{N - 1} {F\left( {U,{\rm{V}}} \right)} {e^{j2\pi vy/N}}$ | (7) |
其中, (x,y)为图像在空间域坐标, x=0, 1, 2, …, M–1, y=0, 1, 2, …, N–1. (u,v)为图像在频率域坐标.
二维离散快速傅里叶变换(2D-FFT)是二维离散傅里叶变换的一种改进算法, 是对变换式进行一次次分解, 使其成为若干小点数的组合, 从而减少运算量. FFT的算法可以分为两类, 按时间抽取法和按频率抽取法[16]. 二维离散快速傅里叶变换具有可分离性, 通过对二维傅里叶变换进行两次的一维傅里叶变换来实现.
3 Gabor滤波器组实现掌静脉快速增强的步骤对于手掌静脉增强方法的选择, 要根据手掌静脉图像特点而定. 手掌静脉图像对比度较低, 静脉纹路不清晰, 图片质量较差. 故本文在进行Gabor方向滤波之前, 使用直方图均衡化进行初步处理. 初步处理后的静脉图像的对比度得到了一定的提升, 再使用Gabor滤波器对图像进行方向滤波, 不同于传统Gabor滤波器空域卷积滤波, 本文分别对静脉图像和Gabor滤波核进行二维快速傅里叶变换(2D-FFT), 将空域卷积滤波转换为频域相乘滤波, 最后将方向滤波后的图片进行重建, 得到最终增强的静脉图片. 本文方法对掌静脉增强的流程图如图2所示.
3.1 图像低通滤波去噪
在对图像进行增强之前, 我们必须对采集到的原始图像进行去噪. 在图像采集过程之中, 由于手掌表皮皮肤的组织特性, 以及在采集图片时手掌张开时只能保证表皮组织整体平整, 但存在很多小部分不平整, 在红外光照射手掌时容易发生散射. 因此, 采集的掌静脉图像上存在部分掌纹信息. 掌纹与掌静脉是两种不同的纹理信息, 有着不同的灰度与频率. 本文采用简单的高斯低通滤波器滤除掌纹, 使用Matlab自带的高斯滤波函数, 设置滤波窗口为3×3, 参数σ通为0.5, 通过后期处理结果图, 我们发现滤波过后的增强图像中的冗余信息减少. 如图3所示, 我们说这种简单的处理方法同时也是有效的.
3.2 图像直方图均衡化处理
在采集手掌静脉图像的过程中, 当红外光遇到手掌中不同的组织与结构时会产生能量和方向的改变, 导致最后形成的图像存在灰度分布不均、静脉图像的对比度比较差等问题. 在本文中, 针对对比度较差的问题, 对掌静脉图像进行直方图均衡化处理. 直方图均衡化是常见的图像对比度增强方法之一, 直方图均衡化处理的基本思想是将原图像灰度直方图的区间扩大, 使得变换后图像的灰度在全部灰度范围均匀分布. 直方图均衡化图像的处理过程是以掌静脉图像累计分布函数为依据的图像直方图修正法. 将计算得到累计分布函数作为映射函数, 将原图像的灰度值通过映射变为均匀分布的形式, 进而增加像素值的动态范围, 从而提高整幅图像的对比度, 增强了图像的质量.
3.3 Gabor滤波实现增强 3.3.1 Gabor滤波器的参数选择基于前人的经验可知, 当滤波器的方向角个数k超过8个时, 对静脉的增强效果很差. 故在选择方向个数的时候, 通常会选择4个或8个方向. 一般来说, 利用Gabor滤波器的多个方向可以挖掘出更多的静脉信息. 然而, 在我们的实验中发现, 选择8个方向时会产生更多的冗余信息, 如图3所示, 这会大大降低Gabor滤波器的性能. 此外, 由于多增加了4个方向, 时间的开销增加了一倍多. 因此, 基于算法的有效性与时效性的综合考虑, 本文中选择方向数为4的Gabor滤波器.
确定方向个数之后, 选择合适的角度同样也很重要, 静脉脊线都是具有方向的, 只有设置合适的滤波器方向才能得到掌静脉脊的一系列子图. 通常, 滤波器角度θ的选取方法有手动选取和自动选取两种. 手动选取是指通过滤波输出的实验结果的比较选择出最合适的角度. 这种方法的优点是操作比较简单, 但是适用性比较差, 只适用于同一种类型的纹理滤波.
自动选取是指用算法实现滤波器参数的选择, 这种方法优点是适用性强, 能够根据不同纹理的特征选取适合的参数, 缺点是算法往往比较复杂, 在进行图像滤波时增大了时间的开销, 不适合时效性要求较高的场合.
鉴于本文的增强算法是应用于嵌入式系统上的, 且只是对掌静脉纹理图像这一类纹理进行处理, 综合考虑时效性与图像增强效果, 故本文选择手动调参的方法. 根据Gabor滤波器的结构特点可知, 当静脉纹路与滤波器的角度呈现垂直时, 能够较好的滤出静脉, 故本文选择的四个滤波方向角度分别为pi/8, pi×3/8,pi×5/8, pi×7/8.
滤波器的方向个数k与方向角θ大小是滤波器的重要参数, 另外一个重要参数是滤波的频率
实验中, 我们发现图像中静脉的宽度范围大约为3到5个像素. 因此, 我们选取多个中心频率来设计滤波器, 结果如图4所示. 图5(a)为原始灰度图像; 图5(b)为由一个中心频率0.167重建后的结果图; 由两个中心频率0.167和0.125重建后的结果图; 由3个中心频率0.167, 0.125和0.1重建后的结果图. 通过比较发现, 3幅图增强效果相差不大, 但选择一个频率来重建图像的处理方式可以大大减少计算的复杂度. 同样基于嵌入式设备对于时效性需求的考虑, 本文对于中心频率的设置采用的单频率, 取f0=0.167.
3.3.2 快速傅里叶变换实现Gabor频域滤波
传统Gabor滤波器对图像进行滤波时都是使用滤波器生成的卷积核与待滤波图像在空域进行卷积. 这种滤波方式存在一个很大的问题: 计算复杂度比较高, 限制了Gabor滤波器在实时系统中的应用范围. 为了进一步减少Gabor滤波器在实际应用中的时耗, 本文提出了一种Gabor频域加速滤波算法. 将空域滤波转换为频域滤波. 由卷积定理可知, 图像在空域的卷积可以转换成频域上的相乘. 基于这一思想, 本文分别将静脉图f(x,y)和卷积核g(x,y)各进行一次二维快速傅里叶变换(2D-FFT), 得到F(w1,w2)和G(w1,w2), 然后将其乘积F(w1,w2)×G(w1,w2)进行一次傅里叶反变换, 得到滤波子图. 流程图如图6所示.
3.3.3 图片的重建
综上所述, 确定了滤波器的一系列参数过后, 将滤波器与静脉与图像进行卷积滤波, 生成4幅子图, 如图7. 从左至右依次分别为方向角为pi/8, pi×3/8, pi×5/8,pi*7/8的滤波器的4个方向的滤波子图.
本实验中, 通过取4幅图中的像素最小值来代表最终的重建图像的像素值, 及最终增强图像. 其规则为:
$A = \left\{ {{r_1}\left( {x,y} \right),{r_2}\left( {x,y} \right),{r_3}\left( {x,y} \right),{r_4}\left( {x,y} \right)} \right\}$ | (8) |
$R\left( {x,y} \right) = Min\left( A \right)$ | (9) |
本文的图像数据库选择的是中科大的掌静脉数据库(CASIA). 采取的是手动截取ROI, 图像分辨率为182×182.
由于人手掌中的骨骼和肌肉组织构造不尽相同, 所采集的手掌静脉图像质量是不同的. 为了测试所提出方法的性能, 这里使用一些低对比度的图像, 如图10(a).
本实验对传统的直方图均衡化增强、Retinex增强, 本文提出的Gabor滤波增强算法进行比较, 对比分析3种增强方法的结果. 如图10所示.
(1) 图像增强质量定量评价
图像质量评价是图像增强过后的重要环节. 图像质量评价标准可以分为全参考评价标准、半参考评价标准与无参考评价标准. 根据采集的手掌静脉图像质量较低的特点, 本文综合使用有参考与无参考质量标准相结合的评价方式.
常见有参考评价指标有峰值信噪比(PSNR)、结构相似性理论(SSIM)等, 无参考的评价指标有图像灰度标准差、图像清晰度等. 根据众多实验结果显示, 因为人眼的视觉对于误差的敏感度并不是绝对的, 其感知结果会受到许多因素的影响而产生变化, PSNR的分数无法和人眼看到的视觉感受完全一致也, 所以存在PSNR较高者看起来反而比PSNR较低者差. 因此在本文中我们选择结构相似性(SSIM)、图像清晰度(NRSS)、图像灰度标准差为图像质量评价指标.
① 结构相似性(SSIM): 数值越大与原图相似性越高.
② 图像清晰度(NRSS): 数值越大图像静脉纹路越清晰.
③ 图像灰度标准差: 数值越大静脉纹路越丰富.
从表1中可以看出, 相比较于CLAHE, Retinex这2种增强方法, Gabor滤波增强后的图像的灰度标准差最大, 表示图像增强后的静脉纹路最丰富; 同时结构相似度和图像清晰度也是最高的, 说明增强过后的图像在结构上失真度最小, 图像也是最清晰的.
(2) 图像增强质量定性评价
增强结果如图10(d)所示, 增强过后的静脉以暗脊的形式呈现出来, 我们可以通过使用Matlab的mesh函数生成图像的3D灰度分布图来刻画静脉脊的丰富度. 其中, 3D图中的谷对应于平面静脉图中的暗脊, 灰度图中谷越多则表示平面图像中静脉脊越丰富. 如图11所示为图像的3D灰度分布图, 通过比较4幅图像, 发现使用Gabor滤波法增强图像的3D灰度图中的谷最丰富, 即图像的静脉脊信息最丰富.
4.2 算法复杂度分析与评价传统Gabor滤波器是在空域卷积实现滤波, 卷积过程图像矩阵和Gabor卷积核矩阵进行若干次乘加运算, 一般来说, 对于大小为X×X输入图像和大小为K×K的卷积核, 一次滤波计算复杂度为:
${T_1} = {\rm{O}}\left( {{M^2}{N^2}} \right)$ | (10) |
$M = \frac{{X - K + 2P}}{{S + 1}}$ | (11) |
其中, X代表输入图像矩阵边长, K代表卷积核矩阵边长, P指的是卷积的边界补充padding, S代表卷积的步长stride, M是输出图像矩阵边长.
使用快速傅里叶变换(FFT)可以实现图像在频域的快速滤波, 对于一幅X×X输入图像进行一次2D-Gabor滤波总共需要
${T_2} = {\rm{O}}\left( {4{{\left( {X + K - 1} \right)}^2}{{\log }_2}\left( {X + K - 1} \right)} \right)$ | (12) |
为了降低Gabor滤波时由卷积运算带来的巨大运算量, 本文通过精简滤波器参数, 以及使用快速傅里. 叶变换进行Gabor频域滤波来对掌静脉图像进行增强处理. 本文处理的图像X大小为182×182, 使用的滤波模板K大小为10×10, 输出的特征图M大小为173×173, 由式(10) 可知, 进行一次空域卷积的计算量约为2 924 100. 由式(12) 可知, 进行一次2D-Gabor滤波总共需要计算量约为1 105 728.72, 通过比较发现用2D-FFT快速滤波的计算量约减少了42%, 实验运行结果如表2所示.
5 结语
本文提出了一种基于2D-FFT的掌静脉Gabor滤波快速增强法. 首先, 对于采集到的掌静脉图像做初步的去噪处理, 本文采用的方法是低通滤波器去噪, 以滤除掌纹等信息防止对静脉增强产生干扰. 其次, 采用直方图均衡化的方法对去噪后的图像进行对比度提升. 最后, 在此基础上使用单尺度4个方向的Gabor滤波器并结合快速傅里叶变换对图像进行频域滤波处理, 在将生成的4个子图进行融合重建, 获得最后的增强图像. 将本文方法增强的图像与自适应直方图均衡化、Retinex算法等传统方法比较后发现, 本文方法的增强效果更为显著, 对比传统Gabor滤波增强方法则具有更低的计算复杂度, 更符合嵌入式设备对处理时效性要求. 说明本文的方法是有效的.
后续将考虑如何进一步减小算法的时耗, 并提高图像的增强效果.
[1] |
栾孟杰. 基于中值滤波的手指静脉图像增强. 沈阳大学学报(自然科学版), 2012, 24(4): 33-35. DOI:10.3969/j.issn.1008-9225.2012.04.008 |
[2] |
胡学友. 手背静脉图像增强和分割方法. 电脑知识与技术, 2014(21): 5080-5082. |
[3] |
赵建军, 熊馨, 张磊, 等. 基于CLAHE和top—hat变换的手背静脉图像增强算法. 激光与红外, 2009, 39(2): 220-222. DOI:10.3969/j.issn.1001-5078.2009.02.028 |
[4] |
曹伟, 王华彬, 石军, 等. 基于边缘检测加权引导滤波的指静脉图像增强算法. 激光与光电子学进展, 2017, 54(2): 021007. |
[5] |
Yang JF, Yan MF. An improved method for finger-vein image enhancement. Proceedings of the IEEE 10th International Conference on Signal Processing. Beijing, China. 2010. 1706–1709.
|
[6] |
Yang JF, Yang JL. Multi-channel gabor filter design for finger-vein image enhancement. 2009 Fifth International Conference on Image and Graphics. Xi’an, China. 2009. 87–91
|
[7] |
黎蔚, 李继杰, 陈家新, 等. 手掌静脉图像增强算法研究. 微电子学与计算机, 2010, 27(7): 237-241. |
[8] |
Zhang J, Yang JF. Finger-vein image enhancement based on combination of gray-level grouping and circular Gabor filter. 2009 International Conference on Information Engineering and Computer Science. Wuhan, China. 2009. 1–4.
|
[9] |
岳林, 万新军, 张晨皓, 等. 复杂背景下红外静脉图像的分割与增强. 电子科技, 2017, 30(3): 118-120. |
[10] |
Miura N, Nagasaka A, Miyatake T. Extraction of finger-vein patterns using maximum curvature points in image profiles. Transactions on Information and Systems. Oxford, UK. 2007. 185–1194.
|
[11] |
Lee TS. Image representation using 2D Gabor wavelets. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1996, 18(10): 959-971. DOI:10.1109/34.541406 |
[12] |
徐红侠. 基于Gabor和局域二值模式的人脸表情识别[硕士学位论文]. 南京: 南京理工大学, 2008.
|
[13] |
李建美, 路长厚, 李国平. 基于Gabor变换的凹凸字符图像特征抽取新方法. 系统仿真学报, 2008, 20(8): 2133-2136. |
[14] |
曾姝彦, 张广军, 李秀智. 基于Gabor滤波器的图像目标识别方法. 北京航空航天大学学报, 2006, 32(8): 954-957. DOI:10.3969/j.issn.1001-5965.2006.08.019 |
[15] |
Daugman JG. Uncertainty relation for resolution in space, spatial frequency, and orientation optimized by two-dimensional visual cortical filters. Journal of the Optical Society of America A, 1985, 2(7): 1160-1169. DOI:10.1364/JOSAA.2.001160 |
[16] |
孙继龙. 在纺织图像中傅里叶变换的研究. 现代电子技术, 2011, 34(9): 97-98, 104. DOI:10.3969/j.issn.1004-373X.2011.09.029 |