2. 福建师范大学 医学光电科学与技术教育部重点实验室, 福州 350007;
3. 福建师范大学 福建省光电传感应用工程技术研究中心, 福州 350007
2. Key Laboratory of Optoelectronic Science and Technology for Medicine of Ministry of Education, Fujian Normal University, Fuzhou 350007, China;
3. Fujian Provincial Engineering Technology Research Center of Photoelectric Sensing Application, Fujian Normal University, Fuzhou 350007, China
随着多媒体技术的发展, 图像成为信息交流和传递的重要载体, 因此对其清晰度的要求越来越高. 图像在采集、压缩、传输、重建等各阶段都可能发生失真, 模糊是最常见的一种图像失真类型[1]. 因此对模糊图像进行有效的质量评估尤为重要.
图像质量评价方法分成主观评价和客观评价. 主观评价法[2]直接利用人的主观感知评估图像质量, 受主观性强, 工作量大等因素的影响, 该方法在实际应用中并不可取. 客观评价法[3]通过提取图像特征和人眼视觉特性来模拟人眼感知图像. 根据对理想参考图像的依赖程度, 客观评价法又可分为有参考评价法和无参考评价法[3]. 有参考图像评价方法是指在选择理想图像作为参考图像的情况下, 通过比较待测图像和参考图像之间的差异来分析待测图像的失真程度. 而无参考图像则是一种完全脱离了对理想参考图像依赖的图像质量评价方法. 由于在工业应用中通常难以获得理想的参考图像, 因此仅使用待测图像进行质量评估的无参考方法具有更好的实用价值.
客观的图像质量评价依赖于有效的视觉特征[4]. 视觉系统对图像的轮廓和纹理等对比度信息更为敏感. 受此启发, 本文采用视网膜感知图像机制获取图像中的细节信息. 此外, 由于图像中的任何变化都会对奇异值向量产生明显影响, 因此利用奇异值向量来衡量图像的内部结构变化. 最后, 比较待测图像和其再模糊图像之间的细节和奇异值变化作为评估图像质量的特征向量, 利用SVR训练回归模型, 根据回归模型预测出待测图像的质量得分.
1 模糊图像质量评价模型本文提出的评价模型流程图如图1所示.
1.1 基于视网膜模型的细节信息提取
视网膜细胞相互连接, 形成外丛状层(OPL)和内丛状层(IPL), 每一层都可用特定的滤波器建模[5]. OPL的输出原理近似高斯差分(DoG): 双极细胞分别接受由光感受器细胞和水平细胞输出的信号, 双极细胞接收来自光感受器输出的信号时, 能够激发双极细胞的感受野中心, 使其表现为兴奋的状态. 当双极细胞接收由水平细胞传送的信号时, 水平细胞能对光感受器进行抑制反馈, 削弱了光感受器输出的信号, 这时双极细胞表现为抑制状态. 双极细胞接收到两个状态相反的信号, 因而它的感受野呈现为中心-周边拮抗形式,可由DoG滤波器近似表示:
$ DoG = {G_{\sigma 1}} - {G_{\sigma 2}} $ | (1) |
式中,
${G_\sigma } = \frac{1}{{2\pi {\sigma ^2}}}{{\rm{e}}^{ - \textstyle\frac{{\left( {{x^2} + {y^2}} \right)}}{{2{\sigma ^2}}}}}$ | (2) |
提取图像细节信息的视网膜模型如图2所示.
图2中,
$C(p) = \frac{{R(p)}}{{R(p) + {R_0}(p)}} \cdot {V_{\rm max}} + {R_0}(p)$ | (3) |
其中,
${R_0} = {V_0}L(p) + {V_{\rm max}}(1 - {V_0})$ | (4) |
式中,
将亮度
$Bi{p_{\rm on}} = B{P_{ph}} - B{P_h}$ | (5) |
$Bi{p_{\rm off}} = - B{P_{ph}} + B{P_h}$ | (6) |
将
$D = \sqrt {\left| {Bi{p_{\rm on}} - Bi{p_{\rm off}}} \right|} $ | (7) |
通过比较待测图像与其再模糊图像之间的细节相似度得到图像的相似特征向量. 再模糊图像由待测图像经高斯低通滤波器后获得:
${\hat I}(x,y) = I(x,y)\otimes{G_\sigma }$ | (8) |
式中,
按模糊程度由小到大构造了待测图像的4个不同模糊度的再模糊图像. 图3展示待测图像和其4个再模糊图像经视网膜模型后提取的细节信息图. 可以看出, 当图像越模糊, 其所包含的细节信息越少.
计算待测图像和其4个再模糊图像之间的细节相似度, 将其作为细节相似特征:
$ {f}_{i}=\frac{1}{MN}{\displaystyle \sum _{x=1}^{M}{\displaystyle \sum _{y=1}^{N}\frac{2{D}_{i}(x,y){D}_{0}(x,y)}{{D}_{i}{(x,y)}^{2}+{D}_{0}{(x,y)}^{2}}}}$ | (9) |
式中,
图像结构随图像质量的变化而发生改变, 而奇异值向量的变化能够很好的反映出这种图像结构的变化[6]. 因此将奇异值向量之间的相似度作为评估图像的另一特征向量. 一个大小为
比较待测图像和4个再模糊图像之间奇异值向量的相似度:
${f_{{j}}} = \frac{{2{s_j}{s_0}}}{{{s_j}^2 + {s_0}^2}},j = 1,2,3,4$ | (10) |
式中,
图4展示了两张不同模糊度的图像. 其中, 灯塔图和帽子图的DMOS值分别为21.65和40.80, DMOS值越小, 图像越清晰. 图5给出了这两幅图像和其各个再模糊图像之间细节相似度和奇异值相似度的变化情况. 由图5可见, 不管是细节相似度还是奇异值向量相似度, 待测图像越清晰相似度变化越明显. 此外对于同一幅图像, 随着模糊程度的加深, 相似度曲线的变化开始变缓.
2 SVR训练与预测
由于支持向量回归模型SVR能有效的处理多维数据, 因此可以利用SVR将特征映射成一个总体质量分数. 本文分别计算待测图像与其4个再模糊图像之间的细节相似度和奇异值相似度, 并将它们作为度量图像质量的特征. 每幅图像可提取8维特征, 将提取的8维特征作为SVR的输入数据, 将待测图像的MOS值或DMOS值作为对应的SVR输出值, 对SVR进行训练. 对于SVR回归模型可以表示为:
$\mathop {\min }\limits_{\omega ,b} \frac{1}{2}{\left\| \omega \right\|^2} + C\sum\limits_{i = 1}^m {{l_i}(f({x_i};\omega ,b) - {y_i})} $ | (11) |
我们将8维相似度特征作为输入向量
本文使用libSVM[7]实现了SVR. 由于径向基函数具有快速收敛性, 且近似于非线性函数, 因此选择径向基函数作为SVR的核.
3 实验结果与分析 3.1 图像质量评价数据库本文选用了4种常用的图像质量评价数据库: LIVE数据集[8], CSIQ数据集[9], TID2008数据集[10]和TID2013数据集[11]来比较本文提出的方法与其它无参考模糊图像质量评价方法的性能. LIVE和CSIQ提供图像的平均主观得分差(DMOS)值. TID2008和TID2013则提供图像的平均主观得分(MOS)值. DMOS值越小表示图像质量越好, MOS值则相反.
3.2 图像质量评价指标本文采用Pearson线性相关系数(PLCC), Spearman秩相关系数(SROCC)和均方根误差(RMSE)作为算法性能的评价指标[12]. PLCC用来描述图像主观得分和客观算法评价值之间的相关性, 其定义为:
$PLCC = \frac{{\displaystyle\sum\limits_{i=1}^N {({x_i} - \bar x)({y_i} - \bar y)} }}{{\sqrt {\displaystyle\sum\limits_{i=1}^N{{({x_i} - \bar x)}^2}\cdot \displaystyle\sum\limits_{i=1}^N{{({y_i} - \bar y)}^2}} }}$ | (12) |
式中,
$SROCC = 1 - \frac{6}{{N({N^2} - 1)}}\sum\limits_{i = 1}^N {d_i^2} $ | (13) |
式中,
$RMSE = \sqrt {\frac{1}{N}\displaystyle\sum\limits_{i=1}^N {{{({x_i} - {y_i})}^2}} } $ | (14) |
式中, N是数据集中的图像总数,
由于客观算法评价值和图像的主观得分之间具有一定的非线性. 为了消除这种非线性, 需要在主观和客观得分之间提供一个非线性的逻辑映射函数:
$f(x) = {\beta _1}\left( {\frac{1}{2} - \frac{1}{{\exp ({\beta _2}(x - {\beta _3}))}}} \right) + {\beta _4}x + {\beta _5}$ | (15) |
式中,
为了验证算法是否符合人类视觉系统特性, 本文使用了两种类型的统计分析方法: 一是用SROCC评估预测的单调性; 二是用PLCC和RMSE评估预测的精确度.SROCC和PLCC值越接近于1, RMSE值越小则表示越接近于人类的主观感知.
表1列出本文算法和其他8种评价模型Marziliano[13], JNB[14], CPBD[15], S3[16], LPC[17], MLV[18], BIBLE[19]和RISE[20]在4个数据集上的3种性能指标. 在本次实验随机选取LIVE数据库中80%的图像训练模型, 剩余的图像用于测试. 由表1可知, 本文方法在TID系列数据集上的测试结果低于RISE算法. 除此外, 本文算法在预测精度和单调性上都优于其他方法.
4 结语本文通过视网膜模型和奇异值向量提取图像中有效的视觉特征, 并用它们训练支持向量回归模型, 根据得到的回归模型预测待测图像的客观评价值. 与其他常用的评价模型在4个图像数据集上的比较显示, 本文提出的算法能够获得与主观评价更加一致的评价值. 下一步研究的重心将放在如何进一步提高图像质量预测结果上.
[1] |
杨芳. 基于二次失真的图像模糊度评价技术研究[硕士学位论文]. 西安: 西安电子科技大学, 2014.
|
[2] |
林岚, 杨帆, 宋翔. 图像质量评价技术分析. 中小企业管理与科技, 2014(1): 310. DOI:10.3969/j.issn.1673-1069.2014.01.209 |
[3] |
邵丽蓉. 无参考模糊图像质量评价算法研究[硕士学位论文]. 徐州: 中国矿业大学, 2019.
|
[4] |
林翔宇. 无参考视频质量评价方法研究[博士学位论文]. 杭州: 浙江大学, 2012.
|
[5] |
Benoit A, Caplier R, Durette R, et al. Using human visual system modeling for bio-inspired low level image processing. Computer Vision and Image Understanding, 2010, 114(7): 758-773. DOI:10.1016/j.cviu.2010.01.011 |
[6] |
Narwaria M, Lin WS. SVD-based quality metric for image and video using machine learning. IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), 2012, 42(2): 347-364. DOI:10.1109/TSMCB.2011.2163391 |
[7] |
Chang CC, Lin CJ. LIBSVM: A library for support vector machines. ACM Transactions on Intelligent Systems and Technology, 2011, 2(3): 1-27. |
[8] |
Sheikh HR. LIVE image quality assessment database. http://live.ece.utexas.edu/research/quality, 2007.
|
[9] |
Larson EC, Chandler DM. Most apparent distortion: full-reference image quality assessment and the role of strategy. Journal of Electronic Imaging, 2010, 19(1): 011006. DOI:10.1117/1.3267105 |
[10] |
Ponomarenko N, Lukin V, Zelensky A, et al. TID2008-A database for evaluation of full-reference visual quality assessment metrics. Advances of Modern Radioelectronics, 2009, 10(4): 30-45. |
[11] |
Ponomarenko N, Ieremeiev O, Lukin V, et al. Color image database TID2013: Peculiarities and preliminary results. Proceedings of European Workshop on Visual Information Processing. Paris, France. 2013. 106–111.
|
[12] |
文继李, 丁立新, 万润泽. 基于非下采样轮廓波变换的模糊图像质量评价. 计算机工程与设计, 2019, 39(4): 1078-1081. |
[13] |
Marziliano P, Dufaux F, Winkler S, et al. Perceptual blur and ringing metrics: Application to JPEG2000. Signal Processing: Image Communication, 2004, 19(2): 163-172. DOI:10.1016/j.image.2003.08.003 |
[14] |
Ferzli R, Karam LJ. A no-reference objective image sharpness metric based on the notion of just noticeable blur (JNB). IEEE Transactions on Image Processing, 2009, 18(4): 717-728. DOI:10.1109/TIP.2008.2011760 |
[15] |
Narvekar ND, Karam LJ. A no-reference image blur metric based on the cumulative probability of blur detection (CPBD). IEEE Transactions on Image Processing, 2011, 20(9): 2678-2683. DOI:10.1109/TIP.2011.2131660 |
[16] |
Vu CT, Phan TD, Chandler DM. S3: A spectral and spatial measure of local perceived sharpness in natural images
. IEEE Transactions on Image Processing, 2012, 21(3): 934-945. DOI:10.1109/TIP.2011.2169974 |
[17] |
Hassen R, Wang Z, Salama MMA. Image sharpness assessment based on local phase coherence. IEEE Transactions on Image Processing, 2013, 22(7): 2798-2810. DOI:10.1109/TIP.2013.2251643 |
[18] |
Bahrami K, Kot AC. A fast approach for no-reference image sharpness assessment based on maximum local variation. IEEE Signal Processing Letters, 2014, 21(6): 751-755. DOI:10.1109/LSP.2014.2314487 |
[19] |
Li LD, Lin WS, Wang XS, et al. No-reference image blur assessment based on discrete orthogonal moments. IEEE Transactions on Cybernetics, 2016, 46(1): 39-50. DOI:10.1109/TCYB.2015.2392129 |
[20] |
Li LD, Xia WH, Lin WS, et al. No-reference and robust image sharpness evaluation based on multiscale spatial and spectral features. IEEE Transactions on Multimedia, 2017, 19(5): 1030-1040. DOI:10.1109/TMM.2016.2640762 |