src/dsp/lossless_common.h

*b2055c35SXin Li// Copyright 2012 Google Inc. All Rights Reserved.
*b2055c35SXin Li//
*b2055c35SXin Li// Use of this source code is governed by a BSD-style license
*b2055c35SXin Li// that can be found in the COPYING file in the root of the source
*b2055c35SXin Li// tree. An additional intellectual property rights grant can be found
*b2055c35SXin Li// in the file PATENTS. All contributing project authors may
*b2055c35SXin Li// be found in the AUTHORS file in the root of the source tree.
*b2055c35SXin Li// -----------------------------------------------------------------------------
*b2055c35SXin Li//
*b2055c35SXin Li// Image transforms and color space conversion methods for lossless decoder.
*b2055c35SXin Li//
*b2055c35SXin Li// Authors: Vikas Arora ([email protected])
*b2055c35SXin Li//          Jyrki Alakuijala ([email protected])
*b2055c35SXin Li//          Vincent Rabaud ([email protected])
*b2055c35SXin Li
*b2055c35SXin Li#ifndef WEBP_DSP_LOSSLESS_COMMON_H_
*b2055c35SXin Li#define WEBP_DSP_LOSSLESS_COMMON_H_
*b2055c35SXin Li
*b2055c35SXin Li#include "src/dsp/cpu.h"
*b2055c35SXin Li#include "src/utils/utils.h"
*b2055c35SXin Li#include "src/webp/types.h"
*b2055c35SXin Li
*b2055c35SXin Li#ifdef __cplusplus
*b2055c35SXin Liextern "C" {
*b2055c35SXin Li#endif
*b2055c35SXin Li
*b2055c35SXin Li//------------------------------------------------------------------------------
*b2055c35SXin Li// Decoding
*b2055c35SXin Li
*b2055c35SXin Li// color mapping related functions.
*b2055c35SXin Listatic WEBP_INLINE uint32_t VP8GetARGBIndex(uint32_t idx) {
*b2055c35SXin Li  return (idx >> 8) & 0xff;
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Listatic WEBP_INLINE uint8_t VP8GetAlphaIndex(uint8_t idx) {
*b2055c35SXin Li  return idx;
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Listatic WEBP_INLINE uint32_t VP8GetARGBValue(uint32_t val) {
*b2055c35SXin Li  return val;
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Listatic WEBP_INLINE uint8_t VP8GetAlphaValue(uint32_t val) {
*b2055c35SXin Li  return (val >> 8) & 0xff;
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li//------------------------------------------------------------------------------
*b2055c35SXin Li// Misc methods.
*b2055c35SXin Li
*b2055c35SXin Li// Computes sampled size of 'size' when sampling using 'sampling bits'.
*b2055c35SXin Listatic WEBP_INLINE uint32_t VP8LSubSampleSize(uint32_t size,
*b2055c35SXin Li                                              uint32_t sampling_bits) {
*b2055c35SXin Li  return (size + (1 << sampling_bits) - 1) >> sampling_bits;
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li// Converts near lossless quality into max number of bits shaved off.
*b2055c35SXin Listatic WEBP_INLINE int VP8LNearLosslessBits(int near_lossless_quality) {
*b2055c35SXin Li  //    100 -> 0
*b2055c35SXin Li  // 80..99 -> 1
*b2055c35SXin Li  // 60..79 -> 2
*b2055c35SXin Li  // 40..59 -> 3
*b2055c35SXin Li  // 20..39 -> 4
*b2055c35SXin Li  //  0..19 -> 5
*b2055c35SXin Li  return 5 - near_lossless_quality / 20;
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li// -----------------------------------------------------------------------------
*b2055c35SXin Li// Faster logarithm for integers. Small values use a look-up table.
*b2055c35SXin Li
*b2055c35SXin Li// The threshold till approximate version of log_2 can be used.
*b2055c35SXin Li// Practically, we can get rid of the call to log() as the two values match to
*b2055c35SXin Li// very high degree (the ratio of these two is 0.99999x).
*b2055c35SXin Li// Keeping a high threshold for now.
*b2055c35SXin Li#define APPROX_LOG_WITH_CORRECTION_MAX  65536
*b2055c35SXin Li#define APPROX_LOG_MAX                   4096
*b2055c35SXin Li#define LOG_2_RECIPROCAL 1.44269504088896338700465094007086
*b2055c35SXin Li#define LOG_LOOKUP_IDX_MAX 256
*b2055c35SXin Liextern const float kLog2Table[LOG_LOOKUP_IDX_MAX];
*b2055c35SXin Liextern const float kSLog2Table[LOG_LOOKUP_IDX_MAX];
*b2055c35SXin Litypedef float (*VP8LFastLog2SlowFunc)(uint32_t v);
*b2055c35SXin Li
*b2055c35SXin Liextern VP8LFastLog2SlowFunc VP8LFastLog2Slow;
*b2055c35SXin Liextern VP8LFastLog2SlowFunc VP8LFastSLog2Slow;
*b2055c35SXin Li
*b2055c35SXin Listatic WEBP_INLINE float VP8LFastLog2(uint32_t v) {
*b2055c35SXin Li  return (v < LOG_LOOKUP_IDX_MAX) ? kLog2Table[v] : VP8LFastLog2Slow(v);
*b2055c35SXin Li}
*b2055c35SXin Li// Fast calculation of v * log2(v) for integer input.
*b2055c35SXin Listatic WEBP_INLINE float VP8LFastSLog2(uint32_t v) {
*b2055c35SXin Li  return (v < LOG_LOOKUP_IDX_MAX) ? kSLog2Table[v] : VP8LFastSLog2Slow(v);
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li// -----------------------------------------------------------------------------
*b2055c35SXin Li// PrefixEncode()
*b2055c35SXin Li
*b2055c35SXin Li// Splitting of distance and length codes into prefixes and
*b2055c35SXin Li// extra bits. The prefixes are encoded with an entropy code
*b2055c35SXin Li// while the extra bits are stored just as normal bits.
*b2055c35SXin Listatic WEBP_INLINE void VP8LPrefixEncodeBitsNoLUT(int distance, int* const code,
*b2055c35SXin Li                                                  int* const extra_bits) {
*b2055c35SXin Li  const int highest_bit = BitsLog2Floor(--distance);
*b2055c35SXin Li  const int second_highest_bit = (distance >> (highest_bit - 1)) & 1;
*b2055c35SXin Li  *extra_bits = highest_bit - 1;
*b2055c35SXin Li  *code = 2 * highest_bit + second_highest_bit;
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Listatic WEBP_INLINE void VP8LPrefixEncodeNoLUT(int distance, int* const code,
*b2055c35SXin Li                                              int* const extra_bits,
*b2055c35SXin Li                                              int* const extra_bits_value) {
*b2055c35SXin Li  const int highest_bit = BitsLog2Floor(--distance);
*b2055c35SXin Li  const int second_highest_bit = (distance >> (highest_bit - 1)) & 1;
*b2055c35SXin Li  *extra_bits = highest_bit - 1;
*b2055c35SXin Li  *extra_bits_value = distance & ((1 << *extra_bits) - 1);
*b2055c35SXin Li  *code = 2 * highest_bit + second_highest_bit;
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li#define PREFIX_LOOKUP_IDX_MAX   512
*b2055c35SXin Litypedef struct {
*b2055c35SXin Li  int8_t code_;
*b2055c35SXin Li  int8_t extra_bits_;
*b2055c35SXin Li} VP8LPrefixCode;
*b2055c35SXin Li
*b2055c35SXin Li// These tables are derived using VP8LPrefixEncodeNoLUT.
*b2055c35SXin Liextern const VP8LPrefixCode kPrefixEncodeCode[PREFIX_LOOKUP_IDX_MAX];
*b2055c35SXin Liextern const uint8_t kPrefixEncodeExtraBitsValue[PREFIX_LOOKUP_IDX_MAX];
*b2055c35SXin Listatic WEBP_INLINE void VP8LPrefixEncodeBits(int distance, int* const code,
*b2055c35SXin Li                                             int* const extra_bits) {
*b2055c35SXin Li  if (distance < PREFIX_LOOKUP_IDX_MAX) {
*b2055c35SXin Li    const VP8LPrefixCode prefix_code = kPrefixEncodeCode[distance];
*b2055c35SXin Li    *code = prefix_code.code_;
*b2055c35SXin Li    *extra_bits = prefix_code.extra_bits_;
*b2055c35SXin Li  } else {
*b2055c35SXin Li    VP8LPrefixEncodeBitsNoLUT(distance, code, extra_bits);
*b2055c35SXin Li  }
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Listatic WEBP_INLINE void VP8LPrefixEncode(int distance, int* const code,
*b2055c35SXin Li                                         int* const extra_bits,
*b2055c35SXin Li                                         int* const extra_bits_value) {
*b2055c35SXin Li  if (distance < PREFIX_LOOKUP_IDX_MAX) {
*b2055c35SXin Li    const VP8LPrefixCode prefix_code = kPrefixEncodeCode[distance];
*b2055c35SXin Li    *code = prefix_code.code_;
*b2055c35SXin Li    *extra_bits = prefix_code.extra_bits_;
*b2055c35SXin Li    *extra_bits_value = kPrefixEncodeExtraBitsValue[distance];
*b2055c35SXin Li  } else {
*b2055c35SXin Li    VP8LPrefixEncodeNoLUT(distance, code, extra_bits, extra_bits_value);
*b2055c35SXin Li  }
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li// Sum of each component, mod 256.
*b2055c35SXin Listatic WEBP_UBSAN_IGNORE_UNSIGNED_OVERFLOW WEBP_INLINE
*b2055c35SXin Liuint32_t VP8LAddPixels(uint32_t a, uint32_t b) {
*b2055c35SXin Li  const uint32_t alpha_and_green = (a & 0xff00ff00u) + (b & 0xff00ff00u);
*b2055c35SXin Li  const uint32_t red_and_blue = (a & 0x00ff00ffu) + (b & 0x00ff00ffu);
*b2055c35SXin Li  return (alpha_and_green & 0xff00ff00u) | (red_and_blue & 0x00ff00ffu);
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li// Difference of each component, mod 256.
*b2055c35SXin Listatic WEBP_UBSAN_IGNORE_UNSIGNED_OVERFLOW WEBP_INLINE
*b2055c35SXin Liuint32_t VP8LSubPixels(uint32_t a, uint32_t b) {
*b2055c35SXin Li  const uint32_t alpha_and_green =
*b2055c35SXin Li      0x00ff00ffu + (a & 0xff00ff00u) - (b & 0xff00ff00u);
*b2055c35SXin Li  const uint32_t red_and_blue =
*b2055c35SXin Li      0xff00ff00u + (a & 0x00ff00ffu) - (b & 0x00ff00ffu);
*b2055c35SXin Li  return (alpha_and_green & 0xff00ff00u) | (red_and_blue & 0x00ff00ffu);
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li//------------------------------------------------------------------------------
*b2055c35SXin Li// Transform-related functions used in both encoding and decoding.
*b2055c35SXin Li
*b2055c35SXin Li// Macros used to create a batch predictor that iteratively uses a
*b2055c35SXin Li// one-pixel predictor.
*b2055c35SXin Li
*b2055c35SXin Li// The predictor is added to the output pixel (which
*b2055c35SXin Li// is therefore considered as a residual) to get the final prediction.
*b2055c35SXin Li#define GENERATE_PREDICTOR_ADD(PREDICTOR, PREDICTOR_ADD)             \
*b2055c35SXin Listatic void PREDICTOR_ADD(const uint32_t* in, const uint32_t* upper, \
*b2055c35SXin Li                          int num_pixels, uint32_t* out) {           \
*b2055c35SXin Li  int x;                                                             \
*b2055c35SXin Li  assert(upper != NULL);                                             \
*b2055c35SXin Li  for (x = 0; x < num_pixels; ++x) {                                 \
*b2055c35SXin Li    const uint32_t pred = (PREDICTOR)(&out[x - 1], upper + x);       \
*b2055c35SXin Li    out[x] = VP8LAddPixels(in[x], pred);                             \
*b2055c35SXin Li  }                                                                  \
*b2055c35SXin Li}
*b2055c35SXin Li
*b2055c35SXin Li#ifdef __cplusplus
*b2055c35SXin Li}    // extern "C"
*b2055c35SXin Li#endif
*b2055c35SXin Li
*b2055c35SXin Li#endif  // WEBP_DSP_LOSSLESS_COMMON_H_