搜索

x

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于图像内容对比感知的图像质量客观评价

姚军财 申静

基于图像内容对比感知的图像质量客观评价

姚军财, 申静
PDF
HTML
导出引用
导出核心图
  • 为了提出性能优异的图像质量评价(IQA)模型, 本文基于人类视觉感知特性和图像的灰度梯度、局部对比度和清晰度特征, 提出了一种基于图像内容对比感知的IQA方法. 在该方法中, 首先结合视觉感知特性, 基于物理学中对比度定义, 提出一种图像质量定义及其值计算方法; 之后, 基于灰度梯度共生矩阵, 提出一种图像灰度梯度熵的概念及其值的计算方法, 并基于图像灰度梯度熵、局部对比度和清晰度, 提出一种图像内容及其视觉感知的描述方法; 最后, 基于图像内容特征和图像质量定义, 综合分析, 提出IQA方法及其数学模型. 并且采用5个开源图像数据库中的119幅参考图像和6395幅失真图像对其进行了仿真测试, 同时分析和探讨了52种失真类型对IQA的影响; 另外, 为了说明所提IQA模型的优势, 将其与现有的7个典型IQA模型, 从精度、复杂性和泛化性能上进行了对比分析. 实验结果表明, 所提IQA模型的精度PLCC值在5个数据库中最低可以实现0.8616, 最高可达到0.9622, 其性能综合效益优于7个现有IQA模型. 研究结果表明, 所提IQA方法是有效的、可行的, 所提IQA模型是一个性能优异的IQA模型.
      通信作者: 姚军财, sxhzyjc@sina.com
    • 基金项目: 国家级-人眼对比度敏感视觉特性的测量及其在图像压缩中的应用研究(61301237)
    [1]

    Nightingale J, Salva P, Alcarazcalero J M, Wang Q 2018 IEEE Trans. Broadcast. 64 621

    [2]

    丰卉, 孙彪, 马书根 2017 物理学报 66 180202

    Feng H, Sun B, Ma S G 2017 Acta Phys. Sin. 66 180202

    [3]

    Yao J C, Liu G Z 2019 IEEE Trans. Broadcast. 65 546

    [4]

    Chandler D M, Hemami S S 2007 IEEE Trans. Image Process. 16 2284

    [5]

    Wang Z, Bovik A C, Sheikh H R, Simoncelli E P 2004 IEEE Trans. Image Process. 13 600

    [6]

    Zhang L, Zhang L, Mou X, Zhang D 2011 IEEE Trans. Image Process. 20 2378

    [7]

    Xue W, Zhang L, Mou X, Bovik A C 2014 IEEE Trans. Image Process. 23 684

    [8]

    Zhang L, Shen Y, Li H 2014 IEEE Trans. Image Process. 23 4270

    [9]

    Larson E C, Chandler D M 2010 J. Electron. Imaging 19 011006

    [10]

    Fang Y M, Yan J B, Li L D, Wu J J, Lin W S 2018 IEEE Trans. Image Process. 27 1600

    [11]

    方志明, 崔荣一, 金璟璇 2017 物理学报 66 109501

    Fang Z M, Cui R Y, Jin J X 2017 Acta Phys. Sin. 66 109501

    [12]

    Qi H, Jiao S H, Lin W S, Tang L, Shen W H 2014 Electron. Lett. 50 1435

    [13]

    Zheng L, Shen L, Chen J, An P, Luo J 2019 IEEE Trans. Multimedia 21 2057

    [14]

    Yang X, Wang T, Ji G 2020 IET Image Proc. 14 384

    [15]

    Ahar A, Barri A, Schelkens P 2018 IEEE Trans. Image Process. 27 879

    [16]

    Zhou W J, Yu L, Zhou Y, Qiu W W, Wu M W 2018 IEEE Trans. Image Process. 27 2086

    [17]

    Yao J C, Liu G Z 2018 IET Image Proc. 12 872

    [18]

    Wang X, Meng F, Huang X Y 2018 Proceeding of the 11 th International Congress on Image and Signal Processing, BioMedical Engineering and Informatics (CISP-BMEI) Beijing, China, October 13—15, 2018 p1

    [19]

    Ginesu G, Massidda F, Giusto D D 2006 Signal Process. Image Commun. 21 316

    [20]

    Nadenau M 2000 Ph. D Dissertation (Lausanne: École Polytechnique Fédérale de Lausanne)

    [21]

    Niu Y Z, Zhang H F, Guo W Z, Ji R R 2018 IEEE Trans. Circuits Syst. Video Technol. 28 849

    [22]

    王鸿南, 钟文, 汪静, 夏德深 2004 中国图象图形学报 9 828

    Wang H N, Zhong W, Wang J, Xia D S 2004 J. Image Graph. 9 828

    [23]

    Sheikh H R, Wang Z, Cormack L LIVE Image Quality Assessment Database Release 2 Available: http://live.ece. utexas.edu/research/quality [2019-12-20]

    [24]

    Larson E C, Chandler D M The CSIQ image database http://vision.okstate.edu/?loc=csiq [2019-12-20]

    [25]

    Ponomarenko N, Lukin V, Zelensky A, Egiazarian K, Carli M, Battisti F Tampere Image Database 2008 TID2008, version 1.0 http://www.ponomarenko.info/tid2008.htm [2019-12-20]

    [26]

    Ponomarenko N, Jin L, Ieremeiev O, Lukin V, Egiazarian K, Astola J, Vozel B, Chehdi K, Carli M, Battisti F, Kuo C C J 2015 Signal Process. Image Commun. 30 57

    [27]

    Athar S, Wang Z 2019 IEEE Access 7 140030

    [28]

    Callet L, Patrick A F Subjective quality assessment IRCCyN /IVC database http://www2.irccyn.ec-nantes.fr/ivcdb/ [2019-12-20]

    [29]

    Yi Z, Chandler D M 2018 IEEE Trans. Image Process. 27 5433

    [30]

    Dai T, Gu K, Niu L, et al. 2018 Neurocomputing 290 185

    [31]

    Zhang C, Cheng W, Hirakawa K 2019 IEEE Trans. Image Process. 28 1732

  • 图 1  所提IQA方法的流程图

    Fig. 1.  The architecture of the proposed IQA method.

    图 2  4个数据库中的图像主客观IQA结果之间的散点图 (a) LIVE; (b) CSIQ; (c) TID2008; (d) TID2013

    Fig. 2.  Scatter plots between the subjective and objective IQA results of images in four databases: (a) LIVE; (b) CSIQ; (c) TID2008; (d) TID2013

    图 3  所提模型对IVC数据库中灰度和单色图像评价结果

    Fig. 3.  IQA results of the gray and monochrome images in IVC database by the proposed model.

    图 4  基于TID2008数据库中的图像IQA结果比较所提模型与现有7个模型的精度 (a) PSNR-TID2008; (b) VSNR-TID2008; (c) SSIM-TID2008; (d) FSIMc-TID2008; (e) VSI-TID2008; (f) GMSD-TID2008; (g) MAD-TID2008; (h) MPCC-TID2008

    Fig. 4.  Comparing the accuracy of the proposed model with those of the existing 7 models based on the IQA results in TID2008 database: (a) PSNR-TID2008; (b) VSNR-TID2008; (c) SSIM-TID2008; (d) FSIMc-TID2008; (e) VSI-TID2008; (f) GMSD-TID2008; (g) MAD-TID2008; (h) MPCC-TID2008.

    图 5  基于平均每10幅图像的评价运行时间比较8个IQA模型的复杂性

    Fig. 5.  Comparison of the complexity of 8 IQA models based on the IQA running time per 10 images.

    图 6  基于3个数据库中28类失真图像评价结果的PLCC值以8个IQA模型的精度对比 (a) CSIQ; (b) LIVE; (c) TID2008

    Fig. 6.  Accuracy comparisons among 8 IQA metrics based on PLCC of IQA results from 28 types of distortion images in three databases: (a) CSIQ; (b) LIVE; (c) TID2008.

    图 7  所提IQA模型对CSIQ库中6种失真类型的失真图像评价结果的散点图 (a) awgn; (b) jpeg; (c) jpeg2k; (d) fnoise; (e) blur; (f) contrast

    Fig. 7.  Scatter plots of the IQA results of 6 kinds of distorted images in CSIQ database evaluating by the proposed IQA model: (a) awgn; (b) jpeg; (c) jpeg2k; (d) fnoise; (e) blur; (f) contrast.

    图 10  所提IQA模型对TID2013库中24种失真类型的失真图像评价结果的散点图 (a) AGN; (b) NCC; (c) SCN; (d) MN; (e) HFN; (f) IN; (g) QN; (h) GB; (i) ID; (j) JPEG; (k) JPEG2k; (l) JPEGtrans; (m) JPEG2ktrans; (n) NEPN; (o) LBWD; (p) MS; (q) CC; (r) CCS; (s) MGN; (t) CN; (u) LCN; (v) CQWD; (w) CA; (x) SSR

    Fig. 10.  Scatter plots of the IQA results of 24 kinds of distorted images in TID2013 database evaluating by the proposed IQA model: (a) AGN; (b) NCC; (c) SCN; (d) MN; (e) HFN; (f) IN; (g) QN; (h) GB; (i) ID; (j) JPEG; (k) JPEG2k; (l) JPEGtrans; (m) JPEG2ktrans; (n) NEPN; (o) LBWD; (p) MS; (q) CC; (r) CCS; (s) MGN; (t) CN; (u) LCN; (v) CQWD; (w) CA; (x) SSR.

    图 8  所提IQA模型对LIVE库中5种失真类型的失真图像评价结果的散点图 (a) jpeg2k; (b) jpeg; (c) WN; (d) gblur; (e) fastfading

    Fig. 8.  Scatter plots of the IQA results of 5 kinds of distorted images in LIVE database evaluating by the proposed IQA model: (a) jpeg2k; (b) jpeg; (c) WN; (d) gblur; (e) fastfading.

    图 9  所提IQA模型对TID2008库中17种失真类型的失真图像评价结果的散点图 (a) AGN; (b) ANCC; (c) SCN; (d) MN; (e) HFN; (f) IN; (g) QN; (h) GB; (i) ID; (j) JPEG; (k) JPEG2k; (l) JPEGtrans; (m) JPEG2ktrans; (n) NEPN; (o) LBWD; (p) MS; (q) CC

    Fig. 9.  Scatter plots of the IQA results of 17 kinds of distorted images in TID2008 database evaluating by the proposed IQA model: (a) AGN; (b) ANCC; (c) SCN; (d) MN; (e) HFN; (f) IN; (g) QN; (h) GB; (i) ID; (j) JPEG; (k) JPEG2k; (l) JPEGtrans; (m) JPEG2ktrans; (n) NEPN; (o) LBWD; (p) MS; (q) CC.

    表 1  4个数据库中的图像主客观IQA分数之间的相关性参数计算结果

    Table 1.  Calculated 4 correlation parameters between the subjective and objective IQA scores of images in 4 databases.

    数据库LIVE(779)CSIQ(866)TID2008(1700)TID2013(3000)加权
    PLCC0.96220.95860.87780.86160.8915
    SROCC0.96600.95690.88310.84520.8854
    RMSE7.43970.07470.64270.6293
    OR0.15310.26900.12870.1198
    下载: 导出CSV

    表 2  基于CSIQ, LIVE和TID2013数据库中的图像IQA结果比较所提模型与现有7个模型的精度

    Table 2.  Comparing the accuracy of the proposed model with those of the existing 7 models based on the IQA results in CSIQ, LIVE, and TID2013 databases.

    数据库参数PSNRVSNRSSIMFSIMcVSIGMSDMADMPCC
    CSIQPLCC0.80000.80020.86130.91920.92790.95410.95020.9587
    SROCC0.80580.81060.87560.93100.94230.95700.94660.9569
    RMSE0.15750.15750.13340.10340.09790.07860.08180.0748
    OR0.42200.38320.35350.30410.28730.27420.28290.2738
    LIVEPLCC0.87230.92310.94490.96130.94820.96030.96750.9620
    SROCC0.87560.92740.94790.96450.95240.96030.96690.9660
    RMSE13.359710.50598.94557.52968.68167.62146.90737.4598
    OR0.21790.21510.18650.16270.18530.16430.15290.1606
    TID2013PLCC0.70620.74020.78950.87690.90000.85530.82670.8648
    SROCC0.69170.73160.74170.85100.89650.80440.78070.8452
    RMSE0.88870.83920.76080.59590.54040.64230.69750.6224
    OR0.16360.15520.14270.11320.10450.12420.13230.1179
    下载: 导出CSV

    表 3  基于TID2013库中24类失真图像评价结果的PLCC值以8个IQA模型的精度对比

    Table 3.  Accuracy comparisons among 8 IQA metrics based on PLCC of IQA results from 24 types of distortion images in TID2013 database.

    失真类别PSNRVSNRSSIMFSIMcVSIGMSDMADMPCC
    1 Additive Gaussian noise(AGN)0.95520.83190.86850.91520.95270.95030.88970.8706
    2 Noise in color comp. (NCC)0.92560.78140.80500.88730.91720.91180.84380.8324
    3 Spatially correl. noise (SCN)0.95250.81050.86210.89890.94720.93910.90080.7457
    4 Masked noise (MN)0.87070.77150.82190.84920.82030.75470.80090.6943
    5 High frequency noise (HFN)0.97310.90610.90810.94750.96550.95670.92330.9090
    6 Impulse noise (IN)0.88870.74420.74150.81710.86350.75720.32060.7408
    7 Quantization noise (QN)0.88800.83840.87020.87940.87470.91100.85710.8122
    8 Gaussian blur (GB)0.91690.94370.96340.95440.95510.90990.93570.9252
    9 Image denoising (ID)0.96400.94630.95890.96520.97070.97590.96450.9594
    10 JPEG compression (JPEG)0.91670.93860.95510.97540.98580.98430.96380.9509
    11 JPEG2000 compression (JPEG2 K)0.91700.95130.96580.97540.98450.98120.97400.9452
    12 JPEG transm. errors (JPEG trans.)0.81040.85970.91810.91760.94570.90790.90010.8805
    13 JPEG2000 transm. errors (JPEG2K trans)0.90020.84350.88010.89290.91920.90850.88380.8699
    14 Non ecc. patt. noise (NEPN)0.67460.67740.77730.80680.81620.81330.86080.8132
    15 Local block-wise dist. (LBWD)0.24100.36320.60220.55420.49840.65200.41870.6845
    16 Mean shift (MS)0.80560.51600.80190.78690.80210.77070.69340.7720
    17 Contrast change (CC)0.58110.42510.60260.72660.69740.71110.31990.8108
    18 Change of color saturation (CSS)0.32940.41840.45900.82280.80520.42340.28460.7583
    19 Multipl. Gauss. noise (MGN)0.92040.77300.78960.86600.91360.89110.85290.8759
    20 Comfort noise (CN)0.87020.90160.90220.94630.95460.95620.94440.8476
    21 Lossy compr. of noisy (LCN)0.94290.89600.91740.95640.96360.97030.95620.7889
    22 Image color quant. w. dither (CQWD)0.93080.87730.86190.89110.89630.91920.87790.8721
    23 Chromatic aberrations (CA)0.95560.95920.97700.97940.97480.97370.96960.9473
    24 Sparse sampl. and reconstr. (SSR)0.92960.94770.96670.97760.98080.98490.97660.9349
    Max0.97310.95920.97700.97940.98580.98490.97660.9594
    Min0.24100.36320.45900.55420.49840.42340.28460.6845
    波动范围宽度0.73210.59590.51810.42520.48730.56140.69200.2750
    所有整体精度0.70620.74020.78950.87690.90000.85530.82670.8648
    下载: 导出CSV
  • [1]

    Nightingale J, Salva P, Alcarazcalero J M, Wang Q 2018 IEEE Trans. Broadcast. 64 621

    [2]

    丰卉, 孙彪, 马书根 2017 物理学报 66 180202

    Feng H, Sun B, Ma S G 2017 Acta Phys. Sin. 66 180202

    [3]

    Yao J C, Liu G Z 2019 IEEE Trans. Broadcast. 65 546

    [4]

    Chandler D M, Hemami S S 2007 IEEE Trans. Image Process. 16 2284

    [5]

    Wang Z, Bovik A C, Sheikh H R, Simoncelli E P 2004 IEEE Trans. Image Process. 13 600

    [6]

    Zhang L, Zhang L, Mou X, Zhang D 2011 IEEE Trans. Image Process. 20 2378

    [7]

    Xue W, Zhang L, Mou X, Bovik A C 2014 IEEE Trans. Image Process. 23 684

    [8]

    Zhang L, Shen Y, Li H 2014 IEEE Trans. Image Process. 23 4270

    [9]

    Larson E C, Chandler D M 2010 J. Electron. Imaging 19 011006

    [10]

    Fang Y M, Yan J B, Li L D, Wu J J, Lin W S 2018 IEEE Trans. Image Process. 27 1600

    [11]

    方志明, 崔荣一, 金璟璇 2017 物理学报 66 109501

    Fang Z M, Cui R Y, Jin J X 2017 Acta Phys. Sin. 66 109501

    [12]

    Qi H, Jiao S H, Lin W S, Tang L, Shen W H 2014 Electron. Lett. 50 1435

    [13]

    Zheng L, Shen L, Chen J, An P, Luo J 2019 IEEE Trans. Multimedia 21 2057

    [14]

    Yang X, Wang T, Ji G 2020 IET Image Proc. 14 384

    [15]

    Ahar A, Barri A, Schelkens P 2018 IEEE Trans. Image Process. 27 879

    [16]

    Zhou W J, Yu L, Zhou Y, Qiu W W, Wu M W 2018 IEEE Trans. Image Process. 27 2086

    [17]

    Yao J C, Liu G Z 2018 IET Image Proc. 12 872

    [18]

    Wang X, Meng F, Huang X Y 2018 Proceeding of the 11 th International Congress on Image and Signal Processing, BioMedical Engineering and Informatics (CISP-BMEI) Beijing, China, October 13—15, 2018 p1

    [19]

    Ginesu G, Massidda F, Giusto D D 2006 Signal Process. Image Commun. 21 316

    [20]

    Nadenau M 2000 Ph. D Dissertation (Lausanne: École Polytechnique Fédérale de Lausanne)

    [21]

    Niu Y Z, Zhang H F, Guo W Z, Ji R R 2018 IEEE Trans. Circuits Syst. Video Technol. 28 849

    [22]

    王鸿南, 钟文, 汪静, 夏德深 2004 中国图象图形学报 9 828

    Wang H N, Zhong W, Wang J, Xia D S 2004 J. Image Graph. 9 828

    [23]

    Sheikh H R, Wang Z, Cormack L LIVE Image Quality Assessment Database Release 2 Available: http://live.ece. utexas.edu/research/quality [2019-12-20]

    [24]

    Larson E C, Chandler D M The CSIQ image database http://vision.okstate.edu/?loc=csiq [2019-12-20]

    [25]

    Ponomarenko N, Lukin V, Zelensky A, Egiazarian K, Carli M, Battisti F Tampere Image Database 2008 TID2008, version 1.0 http://www.ponomarenko.info/tid2008.htm [2019-12-20]

    [26]

    Ponomarenko N, Jin L, Ieremeiev O, Lukin V, Egiazarian K, Astola J, Vozel B, Chehdi K, Carli M, Battisti F, Kuo C C J 2015 Signal Process. Image Commun. 30 57

    [27]

    Athar S, Wang Z 2019 IEEE Access 7 140030

    [28]

    Callet L, Patrick A F Subjective quality assessment IRCCyN /IVC database http://www2.irccyn.ec-nantes.fr/ivcdb/ [2019-12-20]

    [29]

    Yi Z, Chandler D M 2018 IEEE Trans. Image Process. 27 5433

    [30]

    Dai T, Gu K, Niu L, et al. 2018 Neurocomputing 290 185

    [31]

    Zhang C, Cheng W, Hirakawa K 2019 IEEE Trans. Image Process. 28 1732

  • [1] 姚军财, 刘贵忠. 基于图像内容视觉感知的图像质量客观评价方法. 物理学报, 2018, 67(10): 108702. doi: 10.7498/aps.67.20180168
    [2] 田恒, 朱京平, 张云尧, 管今哥, 侯洵. 浑浊介质中图像对比度与成像方式的关系. 物理学报, 2016, 65(8): 084201. doi: 10.7498/aps.65.084201
    [3] 周丽萍, 李培, 潘聪, 郭立, 丁志华, 李鹏. 高灵敏、高对比度无标记三维光学微血管造影系统与脑科学应用研究. 物理学报, 2016, 65(15): 154201. doi: 10.7498/aps.65.154201
    [4] 张 斌, 刘言军, 徐克璹. 全息聚合物弥散液晶器件电光特性的研究. 物理学报, 2004, 53(6): 1850-1855. doi: 10.7498/aps.53.1850
    [5] 宋洪胜, 庄桥, 刘桂媛, 秦希峰, 程传福. 菲涅耳深区散斑强度统计特性及演化. 物理学报, 2014, 63(9): 094201. doi: 10.7498/aps.63.094201
    [6] 张宁玉, 任晓荣, 滕树云, 徐至展, 宋洪胜, 程传福. 强散射体产生的像面散斑对比度与随机表面及成像系统关系的研究. 物理学报, 2005, 54(2): 669-676. doi: 10.7498/aps.54.669
    [7] 刘雪峰, 姚旭日, 李明飞, 俞文凯, 陈希浩, 孙志斌, 吴令安, 翟光杰. 强度涨落在热光鬼成像中的作用. 物理学报, 2013, 62(18): 184205. doi: 10.7498/aps.62.184205
    [8] 郑驰超, 彭虎, 韩志会. 互相关自适应加权的医学超声成像算法研究. 物理学报, 2014, 63(14): 148702. doi: 10.7498/aps.63.148702
    [9] 鲁昌兵, 许鹏, 鲍杰, 王朝辉, 张凯, 任杰, 刘艳芬. 快中子照相模拟分析与实验验证. 物理学报, 2015, 64(19): 198702. doi: 10.7498/aps.64.198702
    [10] 史晨阳, 林燕丹. 基于图像色貌和梯度特征的图像质量客观评价. 物理学报, 2020, (): . doi: 10.7498/aps.69.20200753
    [11] 侯旺, 梅风华, 陈国军, 邓喜文. 基于背景最佳滤波尺度的红外图像复杂度评价准则. 物理学报, 2015, 64(23): 234202. doi: 10.7498/aps.64.234202
    [12] 易煦农, 胡 巍, 罗海陆, 朱 静. 用高阶对比度研究光束的小尺度自聚焦. 物理学报, 2005, 54(2): 749-754. doi: 10.7498/aps.54.749
    [13] 常宏, 杨福桂, 董磊, 王安廷, 谢建平, 明海. 激光光斑形状和尺寸对扫描显示中散斑对比度的影响. 物理学报, 2010, 59(7): 4634-4639. doi: 10.7498/aps.59.4634
    [14] 范启蒙, 尹成友. 高对比度目标的电磁逆散射超分辨成像. 物理学报, 2018, 67(14): 144101. doi: 10.7498/aps.67.20180266
    [15] 吴元庆, 王洋, 张延涛, 张宇峰, 刘春梅. 对比度阈值函数修正对于NVThermIP模型的影响. 物理学报, 2018, 67(21): 210702. doi: 10.7498/aps.67.20180493
    [16] 马原, 吕群波, 刘扬阳, 钱路路, 裴琳琳. 基于主成分变换的图像稀疏度估计方法. 物理学报, 2013, 62(20): 204202. doi: 10.7498/aps.62.204202
    [17] 梁艳梅, 翟宏琛, 常胜江, 张思远. 基于最大隶属度原则的彩色图像分割方法. 物理学报, 2003, 52(11): 2655-2659. doi: 10.7498/aps.52.2655
    [18] 周博睿, 谈宜东, 沈学举, 朱开毅, 鲍丽萍. 微泡造影剂增强超声调制激光回馈成像对比度的机理研究. 物理学报, 2019, 68(21): 214304. doi: 10.7498/aps.68.20190770
    [19] 章法强, 杨建伦, 李正宏, 叶凡, 徐荣昆. 厚闪烁体内次级中子对快中子图像质量的影响研究. 物理学报, 2009, 58(2): 1316-1320. doi: 10.7498/aps.58.1316
    [20] 张祥志, 许子健, 甄香君, 王勇, 郭智, 严睿, 常睿, 周冉冉, 邰仁忠. 基于软X射线谱学显微双能衬度图像的元素空间分布研究. 物理学报, 2010, 59(7): 4535-4541. doi: 10.7498/aps.59.4535
  • 引用本文:
    Citation:
计量
  • 文章访问数:  269
  • PDF下载量:  25
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-03-04
  • 修回日期:  2020-04-27
  • 上网日期:  2020-05-08
  • 刊出日期:  2020-07-01

基于图像内容对比感知的图像质量客观评价

  • 1. 南京工程学院计算机工程学院, 南京 211167
  • 2. 陕西理工大学物理与电信工程学院, 汉中 723000
  • 3. 西安交通大学信息与通信工程学院, 西安 710049
  • 通信作者: 姚军财, sxhzyjc@sina.com
    基金项目: 国家级-人眼对比度敏感视觉特性的测量及其在图像压缩中的应用研究(61301237)

摘要: 为了提出性能优异的图像质量评价(IQA)模型, 本文基于人类视觉感知特性和图像的灰度梯度、局部对比度和清晰度特征, 提出了一种基于图像内容对比感知的IQA方法. 在该方法中, 首先结合视觉感知特性, 基于物理学中对比度定义, 提出一种图像质量定义及其值计算方法; 之后, 基于灰度梯度共生矩阵, 提出一种图像灰度梯度熵的概念及其值的计算方法, 并基于图像灰度梯度熵、局部对比度和清晰度, 提出一种图像内容及其视觉感知的描述方法; 最后, 基于图像内容特征和图像质量定义, 综合分析, 提出IQA方法及其数学模型. 并且采用5个开源图像数据库中的119幅参考图像和6395幅失真图像对其进行了仿真测试, 同时分析和探讨了52种失真类型对IQA的影响; 另外, 为了说明所提IQA模型的优势, 将其与现有的7个典型IQA模型, 从精度、复杂性和泛化性能上进行了对比分析. 实验结果表明, 所提IQA模型的精度PLCC值在5个数据库中最低可以实现0.8616, 最高可达到0.9622, 其性能综合效益优于7个现有IQA模型. 研究结果表明, 所提IQA方法是有效的、可行的, 所提IQA模型是一个性能优异的IQA模型.

English Abstract

    • 近些年, 随着图像、光电和电信技术的飞速发展和广泛应用, 各行各业对图像质量的要求也变得越来越高. 但随之而来的通信带宽限制要求更高的图像压缩技术和传输技术, 以实现在更低比特的条件下获得更高的图像视觉质量[1,2]. 因此, 近些年对图像的压缩和传输技术进行了大量研究, 提出了较多方案, 诸如LTE, 4G和5G等. 相应的图像质量主要考虑外在因素, 即由于压缩和传输而产生的失真, 如模糊、块效应及振铃效应等[2,3], 并以这些类型的失真作为主要特征来构建图像质量评价(image quality assessment, IQA)模型, 以评价图像的质量. 其中典型的IQA模型有PSNR (peak signal to noise ratio)[4], VSNR (visual signal-to-noise ratio)[4], SSIM (structural similarity)[5], FSIMc (features similarity index)[6], GMSD (gradient magnitude similarity deviation)[7], VSI(visual saliency-based index)[8]和MAD(most apparent distortion algorithm)[9]等. 其中, PSNR是最早用于IQA的模型, 是基于失真图像与原始图像之间对应像素点的差值而构建的一种IQA模型, 该模型非常简单, 但精度不高, 在不同开源数据库中测试, 其主客观IQA分数之间的线性相关性参数一般为0.6左右; VSNR是主要针对自然图像提出的一种基于小波变换的视觉信噪比的IQA模型[4], 其精度高于PSNR, 但算法比较复杂; SSIM是一种从图像亮度、对比度和结构三个方面入手, 基于结构相似性而构建的IQA模型[5], 精度明显高于PSNR和VSNR, 由于其相对较高的精度和较低的计算复杂性, 目前被普遍接收; FSIMc是一种基于低层视觉特性相似的全参考IQA方法[6], MAD是一种基于最明显失真统计的IQA模型[9], 两模型的精度均较高, 但复杂性均是其致命弱点; GMSD是一种基于梯度幅值相似偏差的IQA模型[7], VSI是主要依据视觉注意机制和掩蔽特性而提出的IQA测度[8], GMSD和VSI模型精度均较高且简单, 但泛化性能稍欠佳. 对于这些IQA模型, 在实际应用中发现, 不同的图像经过相同的压缩或传输而产生的失真度, 其模型的客观IQA分数相差无几, 但人眼感知的主观IQA分数却常常大相径庭, 表现为主客观IQA分数之间的一致性比较差. 而目前均以人类感知的主观IQA分数为标准IQA分数[5], 即MOS(mean opinion scores), 所以仍需要对IQA进行大量研究, 提出性能更好的模型. 通过对现有IQA模型的分析和研究, 发现不足主要表现在以下几个方面.

      1) IQA模型中没有考虑图像内容. 现有的大部分IQA模型主要是依据压缩或传输等外在图像损伤因素引起的失真特征而构建的, 往往忽略图像内容对IQA的贡献, 包括上述的7个IQA模型. 而在实际生活中, 人类对图像的感知, 包括图像质量, 第一印象仍然是图像本身内容, 如图像画面中的人物、场景和具有特征的目标(感兴趣区域)等, 若图像的整体失真度较大, 但其中的主要场景、人物及特征等重点关注的图像内容没有产生较大失真, 当采用PSNR, SSIM和MAD等模型评价时, 客观IQA分数相对较低, 但人眼评估的主观IQA分数仍然比较高, 二者存在明显的差异. 因此图像内容对IQA具有重要的贡献, 如若不考虑, 则很难获得真正意义上的主客观IQA结果的一致性, 所以, 构建IQA模型时需要重点考虑图像内容[10-12]. 这方面的工作, 近两年也引起了国内外极大的关注[13,14], 本文亦是主要基于图像内容特征来研究IQA方法.

      2)人眼复杂的感知特性因素. 就人类视觉系统(human visual system, HVS)而言, 人眼主观评价得出的IQA结果与较多因素有关, 对图像的内在画面(即图像内容), 人眼的评判标准、角度和结果往往存在较大的差异, 例如相同的压缩比特率不同的图像, PSNR, SSIM, MAD等IQA模型评价得出的分数可能完全一样, 但主观IQA结果可能差异较大[12,15], 所以需要结合视觉特性.

      3)构建模型的方法对IQA的影响. 在目前的IQA研究中, 往往采用数学建模和机器学习的方法, 而且由于机器学习方法的优点, 目前结合机器学习方法构建IQA模型的提案不在少数, 虽然其精度比较高, 但存在4个致命的性能缺陷, 即没有相关的物理意义解释、泛化性能较差、复杂性较高及训练样本有限[16]. 而基于数学建模构建的IQA模型, 虽然精度稍差, 但可以解决机器学习方法构建模型的不足, 即可以较好地解释相应的物理意义、提升泛化性能和降低模型算法复杂性. 所以, 基于综合性能, 目前在实际应用中仍然采用数学建模方法构建的IQA模型[17], 如PSNR和SSIM. 但其模型的精度、复杂性和泛化性能仍然不能满足实际需求, 需要在构建模型的方法上进行大量研究, 而且需要结合更相关的物理意义和生理、心理特征[16-18].

      4) HVS特性及其模型的结合. 目前, 为了提高IQA模型的精度, 一个有效的手段即是结合HVS及其模型, 如FSIMc和VSI模型. 但是, 当前存在两个问题, 一是在构建IQA模型时, HVS特性的引入在很大程度上增加了IQA模型的算法复杂性, 如何巧妙地结合HVS特性及其模型, 使得所提IQA模型简单而有效, 是目前的困境; 二是目前人类认知的HVS特性及其数学模型比较有限, 如何最大化且有效地利用它们同样是一个很大的难题[18,19].

      5) IQA模型的算法复杂性和泛化性能. 目前IQA模型构建的基本途径为: 通过提取一定数量的图像特征, 构建特征与图像质量之间的函数关系. 其中, 构建模型的性能主要取决于所提图像特征的数量和有效性. 为了提高模型精度, 一般需要提取更多的图像特征. 然而, 提取的特征越多, 模型的参数也越多, 模型也越复杂, 致使模型的泛化性能明显下降, 表现为模型精度、泛化性能和算法复杂性很难有效平衡[3,16,17], MAD为典型的此类模型. 所以, IQA建模时, 需要综合考虑选取少量但有效的图像特征, 以实现模型性能的综合效益最大化.

      基于以上对图像内容特征的重要性、HVS特性结合、模型构建方法、复杂性和泛化性能等方面的分析, 本文结合HVS特性, 利用图像亮度色度、纹理、局部对比度及清晰度等图像内容特征, 基于心理物理学中对比度的定义, 提出一种基于图像内容对比感知的IQA方法, 并构建其模型. 同时采用5个数据库中的6395幅失真图像对其进行了仿真测试, 且与7个现有的典型IQA模型进行了对比分析, 来探讨图像内容和HVS特征对IQA的影响.

    • 目前, 人类获取信息的90%来自于视觉感知. 对于一幅图像, 人眼主要从4个方面感知其信息, 即图像的亮度和色度信息、画面(内部对象)信息、画面模糊程度、以及局部对比效果[3,20]. 基于此, 可以将图像的内容表征为图像的亮度和色度信息、图像画面信息、图像清晰度、图像局部对比信息及其视觉感知结果之和, 用这些量共同描述.

    • 在人类感知图像时, 感知到的最主要信息即是图像的亮度和色度信息, 其信息一般采用亮度色度的灰度强弱来描述[3,20], 而其强弱则可通过图像的灰度值及其分布来描述[20]. 基于此, 可以采用图像的灰度值大小及其分布来表征图像亮度和色度信息.

      就视觉感知特性而言, 图像的画面信息主要体现在图像内的场景、人物、目标对象等人眼感兴趣的信息, 即图像中纹理复杂的信息[20]. 因此可以通过图像的纹理特征来表征图像的画面信息. 目前描述图像纹理特征的典型方法是梯度[21], 因此可以采用图像的梯度大小及其分布来表征图像的画面信息.

      基于以上两个方面的说明, 可以采取图像的灰度和梯度大小及其分布来描述图像的亮度和色度信息以及画面信息. 对于图像的灰度和梯度分布, 采用统计学中图像的灰度和梯度共生矩阵来计算, 但其结果只能说明灰度梯度的分布情况, 不能反映其强度值大小. 由此, 基于共生矩阵, 提出一个灰度梯度熵的概念, 其值用以表征图像的亮度色度信息、画面信息(即纹理复杂性)及其感知效果. 计算方法为: 首先计算图像的灰度梯度共生矩阵, 得到图像的亮度色度强度和梯度分布概率; 然后将所有梯度乘以共生矩阵中的对应概率值; 最后, 类似于霍夫曼编码中求熵的思想, 对所有值求和, 求和的结果称之为灰度梯度熵, 记为IE (the entropy of the gray-gradient perception of image), 计算公式可表示为

      ${I_{\rm{E}}}=\sum\limits_{i = 0,~j = 0}^{i = 255,~j = 32} {\left\| {{\rm{gra}}{{\rm{d}}_j}} \right\| \cdot \frac{{{{H}}({\rm{gra}}{{\rm{y}}_i},{\rm{gra}}{{\rm{d}}_j})}}{{m \times n}}} ,$

      其中, H是梯度和灰度共生矩阵, m × n是每幅图像的像素数, 梯度分为32个级别. IE的取值范围为[0, 32], 可作为表征图像内容的特征参数之一.

    • 在人类感知图像时, 人眼对图像的模糊程度非常敏感, 因此在IQA时, 图像画面的清晰度起到举足轻重的作用. 为此将计算的图像清晰度作为表征图像内容特征的第二个参数, 记为ID (image definition), 其计算方法如下.

      通过统计图像某一边缘方向的灰度变化来度量图像的清晰程度, 采用改进的点锐度算法[22]来描述, 计算式为

      ${I_{\rm{D}}}=\frac1{{m \times n}}{{\sum\limits_{i = 1}^{m \times n} {\sum\limits_{N{\rm{p}} = 1}^8 {\left| {\frac{{{\rm{d}}I}}{{{\rm{d}}x}}} \right|} } }} ,$

      式中, dx表示距离增量(像素间), dI表示灰度变化幅值, Np为最邻近的像素点数目. 其中, 由于像素一般以方格形式采样, 像元各向异性, 因此要求依据距离对方格上8邻域的灰度变化进行加权. 对于相邻的像元, 权值取法为: 0°和90°方向上, 权值为1; 对角45°和135°方向上, 权值为${1 / {\sqrt 2 }}$. 则图像清晰度的计算可描述为: 以每个点自身为中心, 分别求其与最邻近8个点之灰度差, 以不同方向上确定的权值为各差值的权重因子而加权求和, 再对图像上的所有像素点求和, 并按总像素数(m × n)求平均[22]. 对于计算结果, ID的取值范围为[0, 1], 其值越大, 表明点扩散程度越剧烈, 图像越清晰.

    • 局部对比感知是人类识别和分辨图像的关键因素. 所提算法采用图像中每一点与其周围最邻近的8个点的对比度的平均值作为该点受局部环境影响的对比度, 然后再计算子块内所有像素点对比度的平均值, 并乘以对应中心的归一化亮度值, 其值可以表明人眼在该对比度下亮度的敏感结果, 记为IC (local contrast of image), 计算表达式为:

      ${I_{\rm{C}}}=\frac{1}{{m \times n}}\sum\limits_{i = 1,j = 1}^{m,n} {\frac{{\rm{1}}}{{\rm{8}}}\left\{ {\sum\limits_{ {L_1} = - 1,0,1\atop {L_2} = - 1,0,1 }{\frac{{I(i,j) - I(i - {L_1},j - {L_2})}}{{[I(i,j){{ + }}I(i - {L_1},j - {L_2})]}}} } \right\}} \cdot \frac{{I(i,j)}}{{255}},$

      其中, I(i, j)为图像的灰度. IC的取值范围为[0, 1], 其值越大, 表明图像局部对比及其视觉感知效果越好. 以此作为图像内容表征的第三个参数.

      基于以上3个方面的说明和计算方法, 图像内容Icontent可以表征为3个特征参数之和, 计算式为

      ${I_{{\rm{content}}}}={a_1}{I_{\rm{E}}} + {a_2}{I_{\rm{D}}} + {a_3}{I_{\rm{C}}},$

      式中, a1, a2a3为参数, 依据主观实验分析人眼对图像的亮度色度、局部对比度、清晰度的感知对IQA的贡献(或重要性)、以及通过样本遍历测试分析得出, 其值分别取0.4, 0.3和0.3时所提IQA模型效果最佳. 另外, 由于不同的图像特征量, 其物理意义不同, 参数值范围也不一致, 则(4)式中特征参数值在合并之前需要进行归一化处理.

    • 在目前的IQA方法中, 普遍的方法是采用失真图像与原始图像之间的某些特征参数之差来度量图像质量, 如目前普遍使用的PSNR是采用二者图像的灰度之差来描述, SSIM[5]采用结构相似特征参数之差来描述, FSIM[6]采用特征结构相似度之差来表征等. 采用特征之差来描述图像质量固然是一个比较好的方法, 但人眼判断图像的质量时, 不仅是判断其差值, 更多的是通过对比的方式得出图像质量, 而且由于对比是人类分辨事物的最佳判据[17,20], 则分辨图像质量的优劣, 最好是将原始图像和失真图像按照子块一一对比, 最后综合所有子块的结果, 即为图像的质量, 即采用对比的形式来定义图像的质量. 目前, 目标对比的经典定义为物理学中明暗亮度光栅条纹的对比度定义, 在人眼对比敏感视觉特性的测量中亦采用该定义[20], 其表达如(5)式. 基于此, 依据(5)式的对比度定义, 分别将原始图像和失真图像各子块的特征值代入其中的ImaxImin, 如(6)式, 从而一一将两图像的子块特征进行对比, 得出各个子块的质量分数. 而且由于各个子块的质量分数存在差异, 人眼对差异的存在同样非常敏感, 为此, 对所有子块的质量分数采用池化(pooling)的形式进行综合处理, 计算如(7)式, 从而得到整个图像的质量.

      $C=\frac{{\left| {{I_{\max }} - {I_{\min }}} \right|}}{{{I_{\max }} + {I_{\min }}}},$

      其中ImaxImin为光栅中明暗亮度条纹的亮度值.

      ${S_{{\rm{C}}\text{-} {\rm{block}}}}=\frac{{\left| {{\rm{Featur}}{{\rm{e}}_{{\rm{distorted }}- {\rm{image}}}} - {\rm{Featur}}{{\rm{e}}_{{\rm{original}}\;{\rm{image}}}}} \right|}}{{{\rm{Featur}}{{\rm{e}}_{{\rm{distorted}} \text{-} {\rm{image}}}} + {\rm{Featur}}{{\rm{e}}_{{\rm{original}}\; {\rm{image}}}}}},$

      其中, Featuredistorted-image和Featureoriginal-image是为了IQA而提取的失真图像和原始图像的特征参数值, 在文中所提的方法中, 即为图像的灰度梯度熵、清晰度和局部对比度.

      $ {\rm{Scores}} = \sqrt {\dfrac1{{{N_{{\rm{block}}}}}}{{\sum\limits_{i = 1}^{{N_{{\rm{block}}}}} {{{\left( {{{\rm{S}}_{{\rm{C}} \text{-} {{\rm{block}}}}}{{(}}i{{) }} - \overline {{{\rm{S}}_{{\rm{C}} \text{-} {{\rm{block}}}}}} } \right)}^2}} }}} , $

      其中Nblock为图像子块的数量.

      依据以上图像质量定义方法, 则度量规则为: 图像质量分数取[0, 1]之间的数值, 取0时, 表示两图像之间的对比差异最小, 失真图像与原始图像一样, 质量最好; 取1时, 两图像的对比差异最大, 表明失真图像的损伤非常严重, 质量最差; 取0—1之间的数值时, 其值越大, 表明失真图像与原始图像相比, 差异越大, 质量越差, 其值越小, 表明失真图像与原始图像越相近, 质量越好.

    • 基于提出的图像内容表征方法和图像质量定义, 所提IQA方法的基本框架和流程如图1.

      图  1  所提IQA方法的流程图

      Figure 1.  The architecture of the proposed IQA method.

      该IQA方法的基本思想为: 首先计算失真图像和原始图像的灰度梯度熵、清晰度和局部对比度, 以其作为图像内容的特征参数; 接着以上述提出的图像质量定义, 即采用失真图像和原始图像之间的内容特征对比度来定义图像的质量, 计算3个特征对比度, 并综合, 从而得出各子块的质量分数; 最后采用池化的方法进行综合处理, 得到整个图像的质量分数. 具体的方法和模型构建过程说明如下.

      1) 子块划分

      为了增加IQA模型的实时性和可操作性, 将原始图像和失真图像的R, G, B三分量图, 分别按照16像素 × 16像素大小进行子块划分, 并按照划分时的顺序进行排列.

      2) 特征计算

      结合上述灰度梯度熵、清晰度、局部对比度的理论和(1)式—(3)式的计算方法, 分别计算原始图像和失真图像的R, G, B三分量图的所有子块的灰度梯度熵IE (即图1中的IEr-o, IEg-o, IEb-oIEr-d, IEg-d, IEb-d), 和所有子块的图像清晰度ID(即图1中的IDr-o, IDg-o, IDb-oIDr-d, IDg-d, IDb-d), 以及所有子块的局部对比度IC (即图1中的ICr-o, ICg-o, ICb-oICr-d, ICg-d, ICb-d).

      3) 子块内容特征对比

      ① 将计算的原始图像和失真图像对应子块的灰度梯度熵, 即(IEr-o, IEr-d), (IEg-o, IEg-d)和(IEb-o, IEb-d)分别成对代入(6)式中, 实现对应子块熵的一一对比, 从而得到由灰度梯度熵的特征对比而贡献的图像质量, 对于R, G, B三分量图的子块, 其分数分别记为SCEr-block, SCEg-block, SCEb-block. ② 同样方法, 计算得出由清晰度的图像内容特征对比而贡献的图像质量, 即将计算的清晰度按子块对应, 即(IDr-o, IDr-d), (IDg-o, IDg-d)和(IDb-o, IDb-d)分别成对代入(6)式中, 计算得出的分数分别记为SCDr-block, SCDg-block, SCDb-block. ③ 按相同方法, 将计算的原始图像和失真图像对应子块的局部对比度, 按子块对应, 即(ICr-o, ICr-d), (ICg-o, ICg-d)和(ICb-o, ICb-d)分别成对代入(6)式中, 计算得出由局部对比度的图像特征对比而贡献的图像质量, 其分数分别记为SCCr-block, SCCg-block, SCCb-block.

      4) 子块的三分量图的图像质量

      对每个子块的R, G, B三分量图的灰度梯度熵、清晰度、局部对比度对质量的贡献进行综合, 综合方法为将计算的R, G, B三分量的三个贡献分数分别代入(4)式中进行计算, 得到每个子块的三分量图的图像质量分数SCr-block, SCg-blockSCb-block, 计算公式为:

      $ \begin{split} &{S_{{\rm{Cr}} \text{-} {\rm{block}}}}={a_1}{S_{{\rm{CEr}} \text{-} {\rm{block}}}} + {a_2}{S_{{\rm{CDr}} \text{-} {\rm{block}}}} + {a_3}{S_{{\rm{CCr}} \text{-} {\rm{block}}}},\\ &{S_{{\rm{Cg}} \text{-} {\rm{block}}}}={a_1}{S_{{\rm{CEg}} \text{-} {\rm{block}}}} + {a_2}{S_{{\rm{CDg}} \text{-} {\rm{block}}}} + {a_3}{S_{{\rm{CCg}} \text{-} {\rm{block}}}},\\ &{S_{{\rm{Cb}} \text{-} {\rm{block}}}}={a_1}{S_{{\rm{CEb}} \text{-} {\rm{block}}}} + {a_2}{S_{{\rm{CDb}} \text{-} {\rm{block}}}} + {a_3}{S_{{\rm{CCb}} \text{-} {\rm{block}}}}, \end{split} $

      其中3个质量贡献值代入(4)式综合之前, 需要进行归一化处理.

      5) 子块图像质量

      按照RGB图中R, G, B颜色混合系数, 对三分量图的三子块的图像质量分数SCr-block, SCg-blockSCb-block进行组合, 得到每个子块的质量评价分数SC-block, 计算式为

      ${S_{{\rm{C}} - {\rm{block}}}}={k_1}{S_{{\rm{Cr}} \text{-} {\rm{block}}}} + {k_2}{S_{{\rm{Cg}} \text{-} {\rm{block}}}} + {k_3}{S_{{\rm{Cb}} \text{-} {\rm{block}}}}.$

      6) 图像质量

      最后将所有子块的图像质量分数SC-block代入(7)式中, 进行池化处理, 得到整个图像的客观IQA评价分数Scores.

      记上述IQA方法的对应数学模型为MPCC (IQA model based on the perception of the contrast of image contents). 采用该模型评价图像得出的质量分数Scores记为MPCC, 其描述图像质量为: MPCC值越大, 表明失真图像与原始图像之间对比差异越大, 则失真图像的质量越差; 其值越小, 越接近于零, 表明失真图像与原图像的对比差异越接近于零, 则图像质量越好. 对于灰度图, 则只需按照(8)式中的一个表达式计算即可.

    • 为了检验以上所提的IQA方法, 采用开源数据库LIVE[23], CSIQ[24], TID2008[25]和TID2013[26]中的共109幅参考图像和6345幅不同类型的失真图像进行仿真测试, 采用所提方法分别对其进行评价, 得出IQA分数MPCC. 同时, 为了更好地验证所提模型, 基于相关性参数和散点图, 将所提模型评价得出的客观IQA分数MPCC与数据库中提供的主观IQA分数MOS(或DMOS)进行相关性分析, 以说明模型的性能.

      对于主客观IQA分数的相关性分析, 根据ITU质量评价专家组VQEG (video quality experts group)的建议, 一般包括主客观IQA分数之间的散点图, 以及4个相关性参数PLCC (Pearson linear correlation coefficient), SROCC (Spearman rank order correlation coefficient), RMSE (root mean squared error)和OR (outlier ratio)[23,27]. 其中, 散点图可以直观地说明主客观IQA分数之间的离散程度、单调性和一致性; 对于相关性参数, PLCC和SROCC从两个IQA分数之间的一致性和单调性上直接定量说明所提模型的精度, 其值越大, 效果越好, 模型精度越高; RMSE和OR值从两分数之间的偏差和离散程度上定量描述模型精度, 在评估时, 一般配合直观散点图效果, 可以很好地描述所提模型的精度, 其值越小, 模型精度越高[3,23,27]. 其中, OR采用(10)式的定义进行计算. 对于4个图像数据库, 均提供了每幅失真图像的主观IQA分数, 结合计算的客观IQA分数MPCC, 计算4个相关性参数和得出散点图, 结果如表1图2. 其中, 图2中的曲线采用最小二乘法(least square method, LMS)拟合而成.

      数据库LIVE(779)CSIQ(866)TID2008(1700)TID2013(3000)加权
      PLCC0.96220.95860.87780.86160.8915
      SROCC0.96600.95690.88310.84520.8854
      RMSE7.43970.07470.64270.6293
      OR0.15310.26900.12870.1198

      表 1  4个数据库中的图像主客观IQA分数之间的相关性参数计算结果

      Table 1.  Calculated 4 correlation parameters between the subjective and objective IQA scores of images in 4 databases.

      图  2  4个数据库中的图像主客观IQA结果之间的散点图 (a) LIVE; (b) CSIQ; (c) TID2008; (d) TID2013

      Figure 2.  Scatter plots between the subjective and objective IQA results of images in four databases: (a) LIVE; (b) CSIQ; (c) TID2008; (d) TID2013

      ${\rm{OR}} = \frac{1}{{{N_{{\rm{img}}}}}}\sum\limits_{i = 1}^{{N_{\rm img}}} {\frac{{\left| {{s_i} - {p_i}} \right|}}{{{p_i}}}} ,$

      式中, Nimg为被评价的失真图像数目, si为第i个失真图像的主观IQA分数, pi为经拟合后预测的第i个失真图像的客观IQA分数.

      表1图2的实验结果可得: 在4个图像数据库中, 无论从散点图的离散程度上, 还是从数值的定量结果上, 对于每个图像库, 所提IQA模型的IQA评价结果精度均较高, PLCC和SROCC值均在0.8452以上; 从模型对4个数据库的评价结果的加权来看, 精度上PLCC和SROCC值分别可达0.8915和0.8854; 对即使是24种失真类型、25幅不同内容的参考图像下TID2013数据库中的评价, 模型仍表现出较好的效果, 精度仍可达PLCC为0.8616. 实验结果表明所提模型既具有较高的评价精度, 又具有较好的泛化性能.

    • 对于单色和灰度图像的质量评价, 只需要采用(8)式中的一个分式即可, 为了说明其有效性, 采用IVC数据库[28]中的10幅参考图像、单色和灰度图像各25幅进行仿真实验, 结果如图3.

      图  3  所提模型对IVC数据库中灰度和单色图像评价结果

      Figure 3.  IQA results of the gray and monochrome images in IVC database by the proposed model.

      图3所示的实验结果表明, 所提IQA模型对单色和灰度图像的质量评价效果同样具有较高的精度, 其PLCC和SROCC值均在0.95以上.

    • 对于IQA模型, 最重要的属性为模型精度、泛化性和复杂性[3,27]. 因此, 下面从此3个方面来分析和探讨所提模型的性能. 同时, 为了体现所提IQA方法的优势, 从此3个模型属性出发, 将其与7个典型IQA模型进行对比, 该7个模型为PSNR, VSNR, SSIM, FSIMc, GMSD, MAD和VSI[4-9].

      1) 模型精度和泛化性能对比. 对于IQA模型来说, 泛化性非常重要, 在不同的数据库中评价时均要求其有较高的精度. 其对比方法为: 采用上述实验测试中的4个开源数据库中的图像(即109幅参考图像和6345幅失真图像)作为评价对象, 采用此7个现有IQA模型对其进行质量评价, 得出其客观IQA分数; 同时基于数据库中提供的主观IQA分数, 进行主客观IQA分数相关性分析, 计算4个相关性参数, 并得出散点图. 将所得结果与所提模型的IQA结果进行对比, 见图4表2. 其中, 图4是针对TID2008数据库中的图像的评价结果, 图中的曲线采用logistic函数拟合而成; 表2是针对CSIQ, LIVE和TID2013数据库中的图像的评价结果, 表中的PLCC, RMSE和OR的计算均采用了logistic函数拟合后的预测值.

      数据库参数PSNRVSNRSSIMFSIMcVSIGMSDMADMPCC
      CSIQPLCC0.80000.80020.86130.91920.92790.95410.95020.9587
      SROCC0.80580.81060.87560.93100.94230.95700.94660.9569
      RMSE0.15750.15750.13340.10340.09790.07860.08180.0748
      OR0.42200.38320.35350.30410.28730.27420.28290.2738
      LIVEPLCC0.87230.92310.94490.96130.94820.96030.96750.9620
      SROCC0.87560.92740.94790.96450.95240.96030.96690.9660
      RMSE13.359710.50598.94557.52968.68167.62146.90737.4598
      OR0.21790.21510.18650.16270.18530.16430.15290.1606
      TID2013PLCC0.70620.74020.78950.87690.90000.85530.82670.8648
      SROCC0.69170.73160.74170.85100.89650.80440.78070.8452
      RMSE0.88870.83920.76080.59590.54040.64230.69750.6224
      OR0.16360.15520.14270.11320.10450.12420.13230.1179

      表 2  基于CSIQ, LIVE和TID2013数据库中的图像IQA结果比较所提模型与现有7个模型的精度

      Table 2.  Comparing the accuracy of the proposed model with those of the existing 7 models based on the IQA results in CSIQ, LIVE, and TID2013 databases.

      图  4  基于TID2008数据库中的图像IQA结果比较所提模型与现有7个模型的精度 (a) PSNR-TID2008; (b) VSNR-TID2008; (c) SSIM-TID2008; (d) FSIMc-TID2008; (e) VSI-TID2008; (f) GMSD-TID2008; (g) MAD-TID2008; (h) MPCC-TID2008

      Figure 4.  Comparing the accuracy of the proposed model with those of the existing 7 models based on the IQA results in TID2008 database: (a) PSNR-TID2008; (b) VSNR-TID2008; (c) SSIM-TID2008; (d) FSIMc-TID2008; (e) VSI-TID2008; (f) GMSD-TID2008; (g) MAD-TID2008; (h) MPCC-TID2008.

      对比分析图4中的散点图及表2中4个相关性参数可得: ① 从散点图进行直观分析, 并配合RMSE, OR数值可以看出, 在TID2008数据库中, 所提模型评价结果的散点图中点的离散程度均比较小, 效果明显好于7个现有IQA模型的结果; ② 从4个相关性参数来说, 所提模型的PLCC和SROCC值在4个数据库中均可以达到该8个模型中的最大或次大, RMSE和OR达到最小或次小, 而且所提模型对所有数据库的评价结果的PLCC和SROCC值均超过了0.8452. 表明所提模型既具有较高的精度, 又具有较好的泛化性能.

      分析原因主要有: 所提模型主要结合了HVS特性, 考虑了图像的亮度色度、纹理、清晰度、局部对比度等特征来构建IQA模型, 相对于7个现有IQA模型而言, 其更好地表征了图像, 而且特征参量相对比较少而有效, 所以其精度和泛化性能较好; 目前, 在图像失真的外在因素方面, 主要体现在图像的亮度色度失真、对比度失真、压缩失真和噪声失真等方面. 对于4个图像库中的图像失真基本亦是如此, 虽然4个数据库中有52种失真类型, 但基本是上述4个方面失真中的某一形式, 各失真类型之间有一定的相关度. 而所提模型在构建时, 基本将其失真因素悉数考虑在列, 即所提模型考虑失真因素较为宽泛, 所以所提模型的质量评价精度高, 散点图上点的离散程度较低, 而且泛化性能较好.

      2) IQA模型算法复杂性对比. 算法复杂性问题关系到所提模型是否能实际应用, 所以同样非常重要. 在IQA模型研究中, 一般采用IQA模型评价图像的平均运算时间来定量描述其算法复杂性[3,7,23]. 为此, 在仿真实验中, 采用所提模型和7个现有模型对4个数据库中的图像进行评价, 记录其算法运算时间, 并且将不同大小的图像的算法运算时间按照像素个数换算至512 × 512像素大小的图像评价时算法的运算时间, 最后计算其平均值, 从而比较各IQA模型的算法复杂性. 实验中, 采用处理器为Intel(R) Core(TM) i7-8550U cpu@1.80GHz 1.99GHz, 64位操作系统的笔记本电脑, MATLAB2018a编程环境进行仿真评价, 为了得到便于比较的结果, 其时间为平均每10幅图像的运行时间. 结果比较如图5所示.

      图  5  基于平均每10幅图像的评价运行时间比较8个IQA模型的复杂性

      Figure 5.  Comparison of the complexity of 8 IQA models based on the IQA running time per 10 images.

      通过图5的算法运算时间的比较可以得出, 所提IQA模型的算法运算时间明显少于MAD, VSNR, VSI和FSIMc的算法运算时间, 而高于PSNR, SSIM和GMSD的算法运算时间; SSIM模型是目前国际上普遍接受和应用的典型IQA模型, 虽然所提模型的复杂性略高于SSIM模型, 但能与之相比拟, 而且从精度上, 所提模型较之高; 对于对灰度或单色图像的质量评价, 由于不考虑三分量图的原因, 其算法运算时间明显减少, 而且与SSIM的算法运算时间相接近. 综合复杂性和精度两方面可以看出, 所提模型是一个性能较好的IQA模型.

      所提模型具有较低复杂性的主要原因为: 所提模型考虑了4个方面的图像特征, 其提取算法本身均不复杂, 且所提特征数量相对较少但有效; 另外, 不需要对图像进行任何相关的时空变换, 并且算法不需要反复循环运算, 所以其算法复杂性较低.

    • 在目前的IQA研究中, 由于采取统计的方式测试IQA模型, 模型对大量图像的整体评价效果可能比较好, 但往往对不同失真类型的图像的质量评价效果有较大差异, 表现为较差的泛化性能, 以致在应用上存在较大的不确定性[29-31]. 为此, 不仅需要探讨图像库中所有图像整体的质量评价效果, 而且需要分析各种失真类型的图像质量评价效果. 基于此, 对4个数据库中的每类失真类型的失真图像进行质量评价, 分析不同失真类型下质量评价效果. TID2013, TID2008, CSIQ和LIVE数据库中的所有图像分别采用了24, 17, 6和5种类型的失真. 探讨IQA模型对不同失真类型的泛化性能的方法为: 对每个数据库中的每一类失真类型的图像均采用上述现有的7个IQA模型和所提模型进行质量评价, 并计算其主客观质量评价分数之间的相关性参数, 并得出散点图, 基于相关性参数和散点图对各模型的精度和泛化性能进行对比和分析.

    • 相关性参数PLCC值能够较好地反映主客观IQA分数之间的一致性. 按照上述方法, 采用8个模型, 对4个数据库中的52种失真类型的所有失真图像进行评价, 计算每一类失真图像的客观IQA分数, 以及其与主观IQA分数之间的相关性参数PLCC; 基于PLCC值, 比较8个IQA模型对不同失真类型的失真图像的评价精度及其泛化性能, 结果见表3图6.

      失真类别PSNRVSNRSSIMFSIMcVSIGMSDMADMPCC
      1 Additive Gaussian noise(AGN)0.95520.83190.86850.91520.95270.95030.88970.8706
      2 Noise in color comp. (NCC)0.92560.78140.80500.88730.91720.91180.84380.8324
      3 Spatially correl. noise (SCN)0.95250.81050.86210.89890.94720.93910.90080.7457
      4 Masked noise (MN)0.87070.77150.82190.84920.82030.75470.80090.6943
      5 High frequency noise (HFN)0.97310.90610.90810.94750.96550.95670.92330.9090
      6 Impulse noise (IN)0.88870.74420.74150.81710.86350.75720.32060.7408
      7 Quantization noise (QN)0.88800.83840.87020.87940.87470.91100.85710.8122
      8 Gaussian blur (GB)0.91690.94370.96340.95440.95510.90990.93570.9252
      9 Image denoising (ID)0.96400.94630.95890.96520.97070.97590.96450.9594
      10 JPEG compression (JPEG)0.91670.93860.95510.97540.98580.98430.96380.9509
      11 JPEG2000 compression (JPEG2 K)0.91700.95130.96580.97540.98450.98120.97400.9452
      12 JPEG transm. errors (JPEG trans.)0.81040.85970.91810.91760.94570.90790.90010.8805
      13 JPEG2000 transm. errors (JPEG2K trans)0.90020.84350.88010.89290.91920.90850.88380.8699
      14 Non ecc. patt. noise (NEPN)0.67460.67740.77730.80680.81620.81330.86080.8132
      15 Local block-wise dist. (LBWD)0.24100.36320.60220.55420.49840.65200.41870.6845
      16 Mean shift (MS)0.80560.51600.80190.78690.80210.77070.69340.7720
      17 Contrast change (CC)0.58110.42510.60260.72660.69740.71110.31990.8108
      18 Change of color saturation (CSS)0.32940.41840.45900.82280.80520.42340.28460.7583
      19 Multipl. Gauss. noise (MGN)0.92040.77300.78960.86600.91360.89110.85290.8759
      20 Comfort noise (CN)0.87020.90160.90220.94630.95460.95620.94440.8476
      21 Lossy compr. of noisy (LCN)0.94290.89600.91740.95640.96360.97030.95620.7889
      22 Image color quant. w. dither (CQWD)0.93080.87730.86190.89110.89630.91920.87790.8721
      23 Chromatic aberrations (CA)0.95560.95920.97700.97940.97480.97370.96960.9473
      24 Sparse sampl. and reconstr. (SSR)0.92960.94770.96670.97760.98080.98490.97660.9349
      Max0.97310.95920.97700.97940.98580.98490.97660.9594
      Min0.24100.36320.45900.55420.49840.42340.28460.6845
      波动范围宽度0.73210.59590.51810.42520.48730.56140.69200.2750
      所有整体精度0.70620.74020.78950.87690.90000.85530.82670.8648

      表 3  基于TID2013库中24类失真图像评价结果的PLCC值以8个IQA模型的精度对比

      Table 3.  Accuracy comparisons among 8 IQA metrics based on PLCC of IQA results from 24 types of distortion images in TID2013 database.

      图  6  基于3个数据库中28类失真图像评价结果的PLCC值以8个IQA模型的精度对比 (a) CSIQ; (b) LIVE; (c) TID2008

      Figure 6.  Accuracy comparisons among 8 IQA metrics based on PLCC of IQA results from 28 types of distortion images in three databases: (a) CSIQ; (b) LIVE; (c) TID2008.

      对比分析表3图6中所提模型和7个现有IQA模型对4个数据库中52种失真类型的失真图像的质量评价结果, 可得: 从PLCC数值来看, 对于52种失真类型中的大部分类型, 所提模型的IQA精度均处在8个方法中的前一半; 从表3图6中的最大和最小PLCC值及其波动范围可得, 52种失真类型中, 所提模型和7个现有模型的最高精度PLCC值均能达到0.95以上, 但精度最小值差别较大, 所提模型的最小精度PLCC值可达到0.6573, 而现有的7个IQA模型PSNR, VSNR, SSIM, FSIMc, VSI, GMSD和MAD的最小精度依次只有0.2410, 0.3632, 0.4590, 0.5542, 0.4984, 0.4234和0.1753, 波动较大, 表现了较大的不稳定性, 说明其对不同失真类型具有较差的泛化性能; 对52种失真类型, 7个现有IQA模型的评价效果各有优劣, 性能不一, 即在52种失真类型的IQA中, 7个模型和所提模型的精度PLCC值低于0.5的依次有2, 6, 1, 1, 1, 1, 6和0种类型, 这表明, 对不同失真类型, 所提模型具有较好的泛化性能, 而VSNR和MAD的泛化性能相对较差; 对于7个现有IQA模型, 在52种失真类型的IQA中, 对TID2013中的LBWD, CC和CCS失真类型, 以及TID2008中的NEPN, LBWD, MS, CC失真类型的评价效果均较差, 大部分的PLCC值在0.65以下. 但所提IQA模型对此7类失真类型的评价PLCC值均在0.65以上, 表明所提模型对这些类型的失真图像的评价效果有较好的提升. 5)从模型对数据库中所有图像的整体评价精度上看, 在4个数据库中, 所提模型的精度均能实现8个IQA模型中的最高或次高, 且精度对不同失真类型的波动较小, 表明所提模型不仅对不同失真类型具有较好的泛化性能, 而且还能兼顾不同失真类型间的差异, 使得整体评价精度同样较高.

    • 散点图上点的离散程度能够地直观地反映出所提IQA模型的精度, 其点的变化趋势能够较好地反映主客观IQA分数之间的单调性和一致性, 而且通过分析点的离散程度, IQA模型对不同失真类型的兼容性(即泛化性能)同样能较好地得到直观说明[30]. 基于此, 为了说明所提模型对不同失真类型的泛化性能, 采用散点图来分析所提模型, 评价对每一类失真图像的评价性能, 即采用所提模型对4个数据库中的52种失真类型的图像进行评价, 得出其主客观IQA分数之间的散点图, 结果如图7图10所示, 图中曲线采用最小二乘法LMS拟合而成.

      图  7  所提IQA模型对CSIQ库中6种失真类型的失真图像评价结果的散点图 (a) awgn; (b) jpeg; (c) jpeg2k; (d) fnoise; (e) blur; (f) contrast

      Figure 7.  Scatter plots of the IQA results of 6 kinds of distorted images in CSIQ database evaluating by the proposed IQA model: (a) awgn; (b) jpeg; (c) jpeg2k; (d) fnoise; (e) blur; (f) contrast.

      图  10  所提IQA模型对TID2013库中24种失真类型的失真图像评价结果的散点图 (a) AGN; (b) NCC; (c) SCN; (d) MN; (e) HFN; (f) IN; (g) QN; (h) GB; (i) ID; (j) JPEG; (k) JPEG2k; (l) JPEGtrans; (m) JPEG2ktrans; (n) NEPN; (o) LBWD; (p) MS; (q) CC; (r) CCS; (s) MGN; (t) CN; (u) LCN; (v) CQWD; (w) CA; (x) SSR

      Figure 10.  Scatter plots of the IQA results of 24 kinds of distorted images in TID2013 database evaluating by the proposed IQA model: (a) AGN; (b) NCC; (c) SCN; (d) MN; (e) HFN; (f) IN; (g) QN; (h) GB; (i) ID; (j) JPEG; (k) JPEG2k; (l) JPEGtrans; (m) JPEG2ktrans; (n) NEPN; (o) LBWD; (p) MS; (q) CC; (r) CCS; (s) MGN; (t) CN; (u) LCN; (v) CQWD; (w) CA; (x) SSR.

      图  8  所提IQA模型对LIVE库中5种失真类型的失真图像评价结果的散点图 (a) jpeg2k; (b) jpeg; (c) WN; (d) gblur; (e) fastfading

      Figure 8.  Scatter plots of the IQA results of 5 kinds of distorted images in LIVE database evaluating by the proposed IQA model: (a) jpeg2k; (b) jpeg; (c) WN; (d) gblur; (e) fastfading.

      图  9  所提IQA模型对TID2008库中17种失真类型的失真图像评价结果的散点图 (a) AGN; (b) ANCC; (c) SCN; (d) MN; (e) HFN; (f) IN; (g) QN; (h) GB; (i) ID; (j) JPEG; (k) JPEG2k; (l) JPEGtrans; (m) JPEG2ktrans; (n) NEPN; (o) LBWD; (p) MS; (q) CC

      Figure 9.  Scatter plots of the IQA results of 17 kinds of distorted images in TID2008 database evaluating by the proposed IQA model: (a) AGN; (b) ANCC; (c) SCN; (d) MN; (e) HFN; (f) IN; (g) QN; (h) GB; (i) ID; (j) JPEG; (k) JPEG2k; (l) JPEGtrans; (m) JPEG2ktrans; (n) NEPN; (o) LBWD; (p) MS; (q) CC.

      通过直观上分析图7图10可得, 所提模型对CSIQ和LIVE中的11类失真图像的质量评价效果均比较好, 散点图上点的离散程度均较低; 对于TID2008数据库, 相对来说, 所提模型对HFN, GB, ID, JPEG, JPEG2k, JPEG trans.和NEPN类型的失真图像的评价效果较好, 散点图上点的离散程度较低, 对MS和CC类型的失真图像的质量评价效果稍差, 但其PLCC值仍然超过0.65; 对于TID2013数据库, 所提模型对其库中每一类失真图像的质量评价效果均较好, PLCC值均超过0.7, 对HFN, GB, ID, JPEG, JPEG2k, CA和SSR类型的失真图像质量评价效果更好, 散点图上点的离散程度较低, PLCC值均超过0.9. 结合在4个数据库中的整体评价精度和每类失真类型图像的评价精度(即表2,表3图6中的PLCC值)及其散点图(图4), 连同图7图10, 对比分析7个现有模型, 可以得出, 对于7个现有模型, 它们对单独某一类或几类的失真图像的质量评价效果可能非常好, PLCC值达0.95以上, 但也有不少失真类型的失真图像的IQA精度非常低, 导致数据库中所有图像的整体评价精度受到影响, 如PSNR, VSNR和MAD; 对于数据库中现有失真类型, 每类的IQA效果均比较好, 但总体评价精度不高, 如CSIQ数据库中PSNR和VSNR的结果.

      分析以上实验结果的原因, 主要有: 所提模型在构建时, 考虑了图像的亮度色度及其视觉感知、纹理特性及其视觉感知、图像清晰度、以及图像的局部对比的影响, 在4个方面较好地囊括了图像内容及其视觉感知效果, 所以无论是每一类失真图像, 还是所有图像的整体评价, 其效果均表现出不错的性能; 而现有7个模型中, 提取的特征不能更有效地反映图像本身, 以致对部分失真类型无法涉及到, 所以其评价精度不高, 如在TID2013库中, PSNR, VSNR和MAD模型对MS, CC和CSS类型的失真图像的评价, 其评价的分数常常出现无穷大的情况, 这表明这些IQA模型中考虑该方面的因素较少; IQA模型单独对每一类失真的IQA效果均比较好, 但各类失真之间关联度较小, 各类失真图像评价的IQA分数之间离散程度较大, 如在TID2008库中, PSNR, VSNR和SSIM对各类失真的图像评价精度均较高, 但从散点图上可以明显看到, 各个类型的评价分数之间分散程度高, 从而导致整体评价精度不高; 而对于所提模型, 从图4图7图10中可以得到, 对每个类型的失真图像的IQA分数, 相互之间均表现为离散程度较低的效果.

      以上对不同类型失真的图像质量评价精度、以及每个库中图像整体评价精度的对比分析, 表明所提模型无论在不同数据库之间, 还是对于不同失真类型之间, 均具有较好的泛化性能.

    • 本文基于人类视觉感知特性和图像的灰度梯度、局部对比度和清晰度特征, 提出了一种基于图像内容对比感知的图像质量评价方法及其IQA模型. 在该方法中, 首先结合HVS特性, 采用对比度的定义描述两图像之间的差异, 从而提出一种图像质量定义方法; 再基于图像灰度梯度熵、局部对比度和清晰度, 提出了一种图像内容及其视觉感知的描述方法; 最后, 利用此两方法, 基于图像内容和图像质量定义, 提出了一种图像质量评价方法及其IQA模型. 同时采用CSIQ, LIVE, TID2008, TID2013和IVC共5个图像数据库中的119幅参考图像和6395幅失真图像进行了测试, 且探讨了52种失真类型对IQA的影响, 并与7个现有典型的IQA模型, 从精度、算法复杂性和泛化性能上进行了对比分析. 实验结果表明, 所提IQA模型的精度PLCC值在5个数据库中最低可以实现0.8616, 最高可达到0.9622, 其综合效益优于7个现有IQA模型. 通过综合分析和对比各模型的精度、泛化性能和复杂性, 表明所提模型是一个性能优异的IQA模型.

参考文献 (31)

目录

    /

    返回文章
    返回