webp/extras/get_disto.c

*b2055c35SXin Li// Copyright 2016 Google Inc. All Rights Reserved.
*b2055c35SXin Li//
*b2055c35SXin Li// Use of this source code is governed by a BSD-style license
*b2055c35SXin Li// that can be found in the COPYING file in the root of the source
*b2055c35SXin Li// tree. An additional intellectual property rights grant can be found
*b2055c35SXin Li// in the file PATENTS. All contributing project authors may
*b2055c35SXin Li// be found in the AUTHORS file in the root of the source tree.
*b2055c35SXin Li// -----------------------------------------------------------------------------
*b2055c35SXin Li//
*b2055c35SXin Li// Simple tool to load two webp/png/jpg/tiff files and compute PSNR/SSIM.
*b2055c35SXin Li// This is mostly a wrapper around WebPPictureDistortion().
*b2055c35SXin Li//
*b2055c35SXin Li/*
*b2055c35SXin Li gcc -o get_disto get_disto.c -O3 -I../ -L../examples -L../imageio \
*b2055c35SXin Li    -lexample_util -limageio_util -limagedec -lwebp -L/opt/local/lib \
*b2055c35SXin Li    -lpng -lz -ljpeg -ltiff -lm -lpthread
*b2055c35SXin Li*/
*b2055c35SXin Li//
*b2055c35SXin Li// Author: Skal ([email protected])
*b2055c35SXin Li
*b2055c35SXin Li#include <assert.h>
*b2055c35SXin Li#include <stdio.h>
*b2055c35SXin Li#include <stdlib.h>
*b2055c35SXin Li#include <string.h>
*b2055c35SXin Li
*b2055c35SXin Li#include "webp/encode.h"
*b2055c35SXin Li#include "imageio/image_dec.h"
*b2055c35SXin Li#include "imageio/imageio_util.h"
*b2055c35SXin Li#include "../examples/unicode.h"
*b2055c35SXin Li
*b2055c35SXin Listatic size_t ReadPicture(const char* const filename, WebPPicture* const pic,
*b2055c35SXin Li                          int keep_alpha) {
*b2055c35SXin Li  const uint8_t* data = NULL;
*b2055c35SXin Li  size_t data_size = 0;
*b2055c35SXin Li  WebPImageReader reader = NULL;
*b2055c35SXin Li  int ok = ImgIoUtilReadFile(filename, &data, &data_size);
*b2055c35SXin Li  if (!ok) goto End;
*b2055c35SXin Li
*b2055c35SXin Li  pic->use_argb = 1;  // force ARGB
*b2055c35SXin Li
*b2055c35SXin Li#ifdef HAVE_WINCODEC_H
*b2055c35SXin Li  // Try to decode the file using WIC falling back to the other readers for
*b2055c35SXin Li  // e.g., WebP.
*b2055c35SXin Li  ok = ReadPictureWithWIC(filename, pic, keep_alpha, NULL);
*b2055c35SXin Li  if (ok) goto End;
*b2055c35SXin Li#endif
*b2055c35SXin Li  reader = WebPGuessImageReader(data, data_size);
*b2055c35SXin Li  ok = reader(data, data_size, pic, keep_alpha, NULL);
*b2055c35SXin Li
*b2055c35SXin Li End:
*b2055c35SXin Li  if (!ok) {
*b2055c35SXin Li    WFPRINTF(stderr, "Error! Could not process file %s\n",
*b2055c35SXin Li             (const W_CHAR*)filename);
*b2055c35SXin Li  }
*b2055c35SXin Li  free((void*)data);
*b2055c35SXin Li  return ok ? data_size : 0;
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Listatic void RescalePlane(uint8_t* plane, int width, int height,
*b2055c35SXin Li                         int x_stride, int y_stride, int max) {
*b2055c35SXin Li  const uint32_t factor = (max > 0) ? (255u << 16) / max : 0;
*b2055c35SXin Li  int x, y;
*b2055c35SXin Li  for (y = 0; y < height; ++y) {
*b2055c35SXin Li    uint8_t* const ptr = plane + y * y_stride;
*b2055c35SXin Li    for (x = 0; x < width * x_stride; x += x_stride) {
*b2055c35SXin Li      const uint32_t diff = (ptr[x] * factor + (1 << 15)) >> 16;
*b2055c35SXin Li      ptr[x] = diff;
*b2055c35SXin Li    }
*b2055c35SXin Li  }
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li// Return the max absolute difference.
*b2055c35SXin Listatic int DiffScaleChannel(uint8_t* src1, int stride1,
*b2055c35SXin Li                            const uint8_t* src2, int stride2,
*b2055c35SXin Li                            int x_stride, int w, int h, int do_scaling) {
*b2055c35SXin Li  int x, y;
*b2055c35SXin Li  int max = 0;
*b2055c35SXin Li  for (y = 0; y < h; ++y) {
*b2055c35SXin Li    uint8_t* const ptr1 = src1 + y * stride1;
*b2055c35SXin Li    const uint8_t* const ptr2 = src2 + y * stride2;
*b2055c35SXin Li    for (x = 0; x < w * x_stride; x += x_stride) {
*b2055c35SXin Li      const int diff = abs(ptr1[x] - ptr2[x]);
*b2055c35SXin Li      if (diff > max) max = diff;
*b2055c35SXin Li      ptr1[x] = diff;
*b2055c35SXin Li    }
*b2055c35SXin Li  }
*b2055c35SXin Li
*b2055c35SXin Li  if (do_scaling) RescalePlane(src1, w, h, x_stride, stride1, max);
*b2055c35SXin Li  return max;
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li//------------------------------------------------------------------------------
*b2055c35SXin Li// SSIM calculation. We re-implement these functions here, out of dsp/, to avoid
*b2055c35SXin Li// breaking the library's hidden visibility. This code duplication avoids the
*b2055c35SXin Li// bigger annoyance of having to open up internal details of libdsp...
*b2055c35SXin Li
*b2055c35SXin Li#define SSIM_KERNEL 3   // total size of the kernel: 2 * SSIM_KERNEL + 1
*b2055c35SXin Li
*b2055c35SXin Li// struct for accumulating statistical moments
*b2055c35SXin Litypedef struct {
*b2055c35SXin Li  uint32_t w;              // sum(w_i) : sum of weights
*b2055c35SXin Li  uint32_t xm, ym;         // sum(w_i * x_i), sum(w_i * y_i)
*b2055c35SXin Li  uint32_t xxm, xym, yym;  // sum(w_i * x_i * x_i), etc.
*b2055c35SXin Li} DistoStats;
*b2055c35SXin Li
*b2055c35SXin Li// hat-shaped filter. Sum of coefficients is equal to 16.
*b2055c35SXin Listatic const uint32_t kWeight[2 * SSIM_KERNEL + 1] = { 1, 2, 3, 4, 3, 2, 1 };
*b2055c35SXin Li
*b2055c35SXin Listatic WEBP_INLINE double SSIMCalculation(const DistoStats* const stats) {
*b2055c35SXin Li  const uint32_t N = stats->w;
*b2055c35SXin Li  const uint32_t w2 =  N * N;
*b2055c35SXin Li  const uint32_t C1 = 20 * w2;
*b2055c35SXin Li  const uint32_t C2 = 60 * w2;
*b2055c35SXin Li  const uint32_t C3 = 8 * 8 * w2;   // 'dark' limit ~= 6
*b2055c35SXin Li  const uint64_t xmxm = (uint64_t)stats->xm * stats->xm;
*b2055c35SXin Li  const uint64_t ymym = (uint64_t)stats->ym * stats->ym;
*b2055c35SXin Li  if (xmxm + ymym >= C3) {
*b2055c35SXin Li    const int64_t xmym = (int64_t)stats->xm * stats->ym;
*b2055c35SXin Li    const int64_t sxy = (int64_t)stats->xym * N - xmym;    // can be negative
*b2055c35SXin Li    const uint64_t sxx = (uint64_t)stats->xxm * N - xmxm;
*b2055c35SXin Li    const uint64_t syy = (uint64_t)stats->yym * N - ymym;
*b2055c35SXin Li    // we descale by 8 to prevent overflow during the fnum/fden multiply.
*b2055c35SXin Li    const uint64_t num_S = (2 * (uint64_t)(sxy < 0 ? 0 : sxy) + C2) >> 8;
*b2055c35SXin Li    const uint64_t den_S = (sxx + syy + C2) >> 8;
*b2055c35SXin Li    const uint64_t fnum = (2 * xmym + C1) * num_S;
*b2055c35SXin Li    const uint64_t fden = (xmxm + ymym + C1) * den_S;
*b2055c35SXin Li    const double r = (double)fnum / fden;
*b2055c35SXin Li    assert(r >= 0. && r <= 1.0);
*b2055c35SXin Li    return r;
*b2055c35SXin Li  }
*b2055c35SXin Li  return 1.;   // area is too dark to contribute meaningfully
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Listatic double SSIMGetClipped(const uint8_t* src1, int stride1,
*b2055c35SXin Li                             const uint8_t* src2, int stride2,
*b2055c35SXin Li                             int xo, int yo, int W, int H) {
*b2055c35SXin Li  DistoStats stats = { 0, 0, 0, 0, 0, 0 };
*b2055c35SXin Li  const int ymin = (yo - SSIM_KERNEL < 0) ? 0 : yo - SSIM_KERNEL;
*b2055c35SXin Li  const int ymax = (yo + SSIM_KERNEL > H - 1) ? H - 1 : yo + SSIM_KERNEL;
*b2055c35SXin Li  const int xmin = (xo - SSIM_KERNEL < 0) ? 0 : xo - SSIM_KERNEL;
*b2055c35SXin Li  const int xmax = (xo + SSIM_KERNEL > W - 1) ? W - 1 : xo + SSIM_KERNEL;
*b2055c35SXin Li  int x, y;
*b2055c35SXin Li  src1 += ymin * stride1;
*b2055c35SXin Li  src2 += ymin * stride2;
*b2055c35SXin Li  for (y = ymin; y <= ymax; ++y, src1 += stride1, src2 += stride2) {
*b2055c35SXin Li    for (x = xmin; x <= xmax; ++x) {
*b2055c35SXin Li      const uint32_t w = kWeight[SSIM_KERNEL + x - xo]
*b2055c35SXin Li                       * kWeight[SSIM_KERNEL + y - yo];
*b2055c35SXin Li      const uint32_t s1 = src1[x];
*b2055c35SXin Li      const uint32_t s2 = src2[x];
*b2055c35SXin Li      stats.w   += w;
*b2055c35SXin Li      stats.xm  += w * s1;
*b2055c35SXin Li      stats.ym  += w * s2;
*b2055c35SXin Li      stats.xxm += w * s1 * s1;
*b2055c35SXin Li      stats.xym += w * s1 * s2;
*b2055c35SXin Li      stats.yym += w * s2 * s2;
*b2055c35SXin Li    }
*b2055c35SXin Li  }
*b2055c35SXin Li  return SSIMCalculation(&stats);
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li// Compute SSIM-score map. Return -1 in case of error, max diff otherwise.
*b2055c35SXin Listatic int SSIMScaleChannel(uint8_t* src1, int stride1,
*b2055c35SXin Li                            const uint8_t* src2, int stride2,
*b2055c35SXin Li                            int x_stride, int w, int h, int do_scaling) {
*b2055c35SXin Li  int x, y;
*b2055c35SXin Li  int max = 0;
*b2055c35SXin Li  uint8_t* const plane1 = (uint8_t*)malloc(2 * w * h * sizeof(*plane1));
*b2055c35SXin Li  uint8_t* const plane2 = plane1 + w * h;
*b2055c35SXin Li  if (plane1 == NULL) return -1;
*b2055c35SXin Li
*b2055c35SXin Li  // extract plane
*b2055c35SXin Li  for (y = 0; y < h; ++y) {
*b2055c35SXin Li    for (x = 0; x < w; ++x) {
*b2055c35SXin Li      plane1[x + y * w] = src1[x * x_stride + y * stride1];
*b2055c35SXin Li      plane2[x + y * w] = src2[x * x_stride + y * stride2];
*b2055c35SXin Li    }
*b2055c35SXin Li  }
*b2055c35SXin Li  for (y = 0; y < h; ++y) {
*b2055c35SXin Li    for (x = 0; x < w; ++x) {
*b2055c35SXin Li      const double ssim = SSIMGetClipped(plane1, w, plane2, w, x, y, w, h);
*b2055c35SXin Li      int diff = (int)(255 * (1. - ssim));
*b2055c35SXin Li      if (diff < 0) {
*b2055c35SXin Li        diff = 0;
*b2055c35SXin Li      } else if (diff > max) {
*b2055c35SXin Li        max = diff;
*b2055c35SXin Li      }
*b2055c35SXin Li      src1[x * x_stride + y * stride1] = (diff > 255) ? 255u : (uint8_t)diff;
*b2055c35SXin Li    }
*b2055c35SXin Li  }
*b2055c35SXin Li  free(plane1);
*b2055c35SXin Li
*b2055c35SXin Li  if (do_scaling) RescalePlane(src1, w, h, x_stride, stride1, max);
*b2055c35SXin Li  return max;
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li// Convert an argb picture to luminance.
*b2055c35SXin Listatic void ConvertToGray(WebPPicture* const pic) {
*b2055c35SXin Li  int x, y;
*b2055c35SXin Li  assert(pic != NULL);
*b2055c35SXin Li  assert(pic->use_argb);
*b2055c35SXin Li  for (y = 0; y < pic->height; ++y) {
*b2055c35SXin Li    uint32_t* const row = &pic->argb[y * pic->argb_stride];
*b2055c35SXin Li    for (x = 0; x < pic->width; ++x) {
*b2055c35SXin Li      const uint32_t argb = row[x];
*b2055c35SXin Li      const uint32_t r = (argb >> 16) & 0xff;
*b2055c35SXin Li      const uint32_t g = (argb >>  8) & 0xff;
*b2055c35SXin Li      const uint32_t b = (argb >>  0) & 0xff;
*b2055c35SXin Li      // We use BT.709 for converting to luminance.
*b2055c35SXin Li      const uint32_t Y = (uint32_t)(0.2126 * r + 0.7152 * g + 0.0722 * b + .5);
*b2055c35SXin Li      row[x] = (argb & 0xff000000u) | (Y * 0x010101u);
*b2055c35SXin Li    }
*b2055c35SXin Li  }
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Listatic void Help(void) {
*b2055c35SXin Li  fprintf(stderr,
*b2055c35SXin Li          "Usage: get_disto [-ssim][-psnr][-alpha] compressed.webp orig.webp\n"
*b2055c35SXin Li          "  -ssim ..... print SSIM distortion\n"
*b2055c35SXin Li          "  -psnr ..... print PSNR distortion (default)\n"
*b2055c35SXin Li          "  -alpha .... preserve alpha plane\n"
*b2055c35SXin Li          "  -h ........ this message\n"
*b2055c35SXin Li          "  -o <file> . save the diff map as a WebP lossless file\n"
*b2055c35SXin Li          "  -scale .... scale the difference map to fit [0..255] range\n"
*b2055c35SXin Li          "  -gray ..... use grayscale for difference map (-scale)\n"
*b2055c35SXin Li          "\nSupported input formats:\n  %s\n",
*b2055c35SXin Li          WebPGetEnabledInputFileFormats());
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Liint main(int argc, const char* argv[]) {
*b2055c35SXin Li  WebPPicture pic1, pic2;
*b2055c35SXin Li  size_t size1 = 0, size2 = 0;
*b2055c35SXin Li  int ret = 1;
*b2055c35SXin Li  float disto[5];
*b2055c35SXin Li  int type = 0;
*b2055c35SXin Li  int c;
*b2055c35SXin Li  int help = 0;
*b2055c35SXin Li  int keep_alpha = 0;
*b2055c35SXin Li  int scale = 0;
*b2055c35SXin Li  int use_gray = 0;
*b2055c35SXin Li  const char* name1 = NULL;
*b2055c35SXin Li  const char* name2 = NULL;
*b2055c35SXin Li  const char* output = NULL;
*b2055c35SXin Li
*b2055c35SXin Li  INIT_WARGV(argc, argv);
*b2055c35SXin Li
*b2055c35SXin Li  if (!WebPPictureInit(&pic1) || !WebPPictureInit(&pic2)) {
*b2055c35SXin Li    fprintf(stderr, "Can't init pictures\n");
*b2055c35SXin Li    FREE_WARGV_AND_RETURN(1);
*b2055c35SXin Li  }
*b2055c35SXin Li
*b2055c35SXin Li  for (c = 1; c < argc; ++c) {
*b2055c35SXin Li    if (!strcmp(argv[c], "-ssim")) {
*b2055c35SXin Li      type = 1;
*b2055c35SXin Li    } else if (!strcmp(argv[c], "-psnr")) {
*b2055c35SXin Li      type = 0;
*b2055c35SXin Li    } else if (!strcmp(argv[c], "-alpha")) {
*b2055c35SXin Li      keep_alpha = 1;
*b2055c35SXin Li    } else if (!strcmp(argv[c], "-scale")) {
*b2055c35SXin Li      scale = 1;
*b2055c35SXin Li    } else if (!strcmp(argv[c], "-gray")) {
*b2055c35SXin Li      use_gray = 1;
*b2055c35SXin Li    } else if (!strcmp(argv[c], "-h")) {
*b2055c35SXin Li      help = 1;
*b2055c35SXin Li      ret = 0;
*b2055c35SXin Li    } else if (!strcmp(argv[c], "-o")) {
*b2055c35SXin Li      if (++c == argc) {
*b2055c35SXin Li        fprintf(stderr, "missing file name after %s option.\n", argv[c - 1]);
*b2055c35SXin Li        goto End;
*b2055c35SXin Li      }
*b2055c35SXin Li      output = (const char*)GET_WARGV(argv, c);
*b2055c35SXin Li    } else if (name1 == NULL) {
*b2055c35SXin Li      name1 = (const char*)GET_WARGV(argv, c);
*b2055c35SXin Li    } else {
*b2055c35SXin Li      name2 = (const char*)GET_WARGV(argv, c);
*b2055c35SXin Li    }
*b2055c35SXin Li  }
*b2055c35SXin Li  if (help || name1 == NULL || name2 == NULL) {
*b2055c35SXin Li    if (!help) {
*b2055c35SXin Li      fprintf(stderr, "Error: missing arguments.\n");
*b2055c35SXin Li    }
*b2055c35SXin Li    Help();
*b2055c35SXin Li    goto End;
*b2055c35SXin Li  }
*b2055c35SXin Li  size1 = ReadPicture(name1, &pic1, 1);
*b2055c35SXin Li  size2 = ReadPicture(name2, &pic2, 1);
*b2055c35SXin Li  if (size1 == 0 || size2 == 0) goto End;
*b2055c35SXin Li
*b2055c35SXin Li  if (!keep_alpha) {
*b2055c35SXin Li    WebPBlendAlpha(&pic1, 0x00000000);
*b2055c35SXin Li    WebPBlendAlpha(&pic2, 0x00000000);
*b2055c35SXin Li  }
*b2055c35SXin Li
*b2055c35SXin Li  if (!WebPPictureDistortion(&pic1, &pic2, type, disto)) {
*b2055c35SXin Li    fprintf(stderr, "Error while computing the distortion.\n");
*b2055c35SXin Li    goto End;
*b2055c35SXin Li  }
*b2055c35SXin Li  printf("%u %.2f    %.2f %.2f %.2f %.2f [ %.2f bpp ]\n",
*b2055c35SXin Li         (unsigned int)size1,
*b2055c35SXin Li         disto[4], disto[0], disto[1], disto[2], disto[3],
*b2055c35SXin Li         8.f * size1 / pic1.width / pic1.height);
*b2055c35SXin Li
*b2055c35SXin Li  if (output != NULL) {
*b2055c35SXin Li    uint8_t* data = NULL;
*b2055c35SXin Li    size_t data_size = 0;
*b2055c35SXin Li    if (pic1.use_argb != pic2.use_argb) {
*b2055c35SXin Li      fprintf(stderr, "Pictures are not in the same argb format. "
*b2055c35SXin Li                      "Can't save the difference map.\n");
*b2055c35SXin Li      goto End;
*b2055c35SXin Li    }
*b2055c35SXin Li    if (pic1.use_argb) {
*b2055c35SXin Li      int n;
*b2055c35SXin Li      fprintf(stderr, "max differences per channel: ");
*b2055c35SXin Li      for (n = 0; n < 3; ++n) {    // skip the alpha channel
*b2055c35SXin Li        const int range = (type == 1) ?
*b2055c35SXin Li          SSIMScaleChannel((uint8_t*)pic1.argb + n, pic1.argb_stride * 4,
*b2055c35SXin Li                           (const uint8_t*)pic2.argb + n, pic2.argb_stride * 4,
*b2055c35SXin Li                           4, pic1.width, pic1.height, scale) :
*b2055c35SXin Li          DiffScaleChannel((uint8_t*)pic1.argb + n, pic1.argb_stride * 4,
*b2055c35SXin Li                           (const uint8_t*)pic2.argb + n, pic2.argb_stride * 4,
*b2055c35SXin Li                           4, pic1.width, pic1.height, scale);
*b2055c35SXin Li        if (range < 0) fprintf(stderr, "\nError computing diff map\n");
*b2055c35SXin Li        fprintf(stderr, "[%d]", range);
*b2055c35SXin Li      }
*b2055c35SXin Li      fprintf(stderr, "\n");
*b2055c35SXin Li      if (use_gray) ConvertToGray(&pic1);
*b2055c35SXin Li    } else {
*b2055c35SXin Li      fprintf(stderr, "Can only compute the difference map in ARGB format.\n");
*b2055c35SXin Li      goto End;
*b2055c35SXin Li    }
*b2055c35SXin Li#if !defined(WEBP_REDUCE_CSP)
*b2055c35SXin Li    data_size = WebPEncodeLosslessBGRA((const uint8_t*)pic1.argb,
*b2055c35SXin Li                                       pic1.width, pic1.height,
*b2055c35SXin Li                                       pic1.argb_stride * 4,
*b2055c35SXin Li                                       &data);
*b2055c35SXin Li    if (data_size == 0) {
*b2055c35SXin Li      fprintf(stderr, "Error during lossless encoding.\n");
*b2055c35SXin Li      goto End;
*b2055c35SXin Li    }
*b2055c35SXin Li    ret = ImgIoUtilWriteFile(output, data, data_size) ? 0 : 1;
*b2055c35SXin Li    WebPFree(data);
*b2055c35SXin Li    if (ret) goto End;
*b2055c35SXin Li#else
*b2055c35SXin Li    (void)data;
*b2055c35SXin Li    (void)data_size;
*b2055c35SXin Li    fprintf(stderr, "Cannot save the difference map. Please recompile "
*b2055c35SXin Li                    "without the WEBP_REDUCE_CSP flag.\n");
*b2055c35SXin Li#endif  // WEBP_REDUCE_CSP
*b2055c35SXin Li  }
*b2055c35SXin Li  ret = 0;
*b2055c35SXin Li
*b2055c35SXin Li End:
*b2055c35SXin Li  WebPPictureFree(&pic1);
*b2055c35SXin Li  WebPPictureFree(&pic2);
*b2055c35SXin Li  FREE_WARGV_AND_RETURN(ret);
*b2055c35SXin Li}