libopus/celt/mathops.h

*a58d3d2aSXin Li/* Copyright (c) 2002-2008 Jean-Marc Valin
*a58d3d2aSXin Li   Copyright (c) 2007-2008 CSIRO
*a58d3d2aSXin Li   Copyright (c) 2007-2009 Xiph.Org Foundation
*a58d3d2aSXin Li   Written by Jean-Marc Valin */
*a58d3d2aSXin Li/**
*a58d3d2aSXin Li   @file mathops.h
*a58d3d2aSXin Li   @brief Various math functions
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li/*
*a58d3d2aSXin Li   Redistribution and use in source and binary forms, with or without
*a58d3d2aSXin Li   modification, are permitted provided that the following conditions
*a58d3d2aSXin Li   are met:
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions of source code must retain the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Li   documentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*a58d3d2aSXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*a58d3d2aSXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*a58d3d2aSXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER
*a58d3d2aSXin Li   OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*a58d3d2aSXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*a58d3d2aSXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*a58d3d2aSXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*a58d3d2aSXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*a58d3d2aSXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*a58d3d2aSXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef MATHOPS_H
*a58d3d2aSXin Li#define MATHOPS_H
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include "arch.h"
*a58d3d2aSXin Li#include "entcode.h"
*a58d3d2aSXin Li#include "os_support.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define PI 3.141592653f
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Multiplies two 16-bit fractional values. Bit-exactness of this macro is important */
*a58d3d2aSXin Li#define FRAC_MUL16(a,b) ((16384+((opus_int32)(opus_int16)(a)*(opus_int16)(b)))>>15)
*a58d3d2aSXin Li
*a58d3d2aSXin Liunsigned isqrt32(opus_uint32 _val);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* CELT doesn't need it for fixed-point, by analysis.c does. */
*a58d3d2aSXin Li#if !defined(FIXED_POINT) || defined(ANALYSIS_C)
*a58d3d2aSXin Li#define cA 0.43157974f
*a58d3d2aSXin Li#define cB 0.67848403f
*a58d3d2aSXin Li#define cC 0.08595542f
*a58d3d2aSXin Li#define cE ((float)PI/2)
*a58d3d2aSXin Listatic OPUS_INLINE float fast_atan2f(float y, float x) {
*a58d3d2aSXin Li   float x2, y2;
*a58d3d2aSXin Li   x2 = x*x;
*a58d3d2aSXin Li   y2 = y*y;
*a58d3d2aSXin Li   /* For very small values, we don't care about the answer, so
*a58d3d2aSXin Li      we can just return 0. */
*a58d3d2aSXin Li   if (x2 + y2 < 1e-18f)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      return 0;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   if(x2<y2){
*a58d3d2aSXin Li      float den = (y2 + cB*x2) * (y2 + cC*x2);
*a58d3d2aSXin Li      return -x*y*(y2 + cA*x2) / den + (y<0 ? -cE : cE);
*a58d3d2aSXin Li   }else{
*a58d3d2aSXin Li      float den = (x2 + cB*y2) * (x2 + cC*y2);
*a58d3d2aSXin Li      return  x*y*(x2 + cA*y2) / den + (y<0 ? -cE : cE) - (x*y<0 ? -cE : cE);
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#undef cA
*a58d3d2aSXin Li#undef cB
*a58d3d2aSXin Li#undef cC
*a58d3d2aSXin Li#undef cE
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef OVERRIDE_CELT_MAXABS16
*a58d3d2aSXin Listatic OPUS_INLINE opus_val32 celt_maxabs16(const opus_val16 *x, int len)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   opus_val16 maxval = 0;
*a58d3d2aSXin Li   opus_val16 minval = 0;
*a58d3d2aSXin Li   for (i=0;i<len;i++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      maxval = MAX16(maxval, x[i]);
*a58d3d2aSXin Li      minval = MIN16(minval, x[i]);
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   return MAX32(EXTEND32(maxval),-EXTEND32(minval));
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef OVERRIDE_CELT_MAXABS32
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Listatic OPUS_INLINE opus_val32 celt_maxabs32(const opus_val32 *x, int len)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   opus_val32 maxval = 0;
*a58d3d2aSXin Li   opus_val32 minval = 0;
*a58d3d2aSXin Li   for (i=0;i<len;i++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      maxval = MAX32(maxval, x[i]);
*a58d3d2aSXin Li      minval = MIN32(minval, x[i]);
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   return MAX32(maxval, -minval);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define celt_maxabs32(x,len) celt_maxabs16(x,len)
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef FIXED_POINT
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define celt_sqrt(x) ((float)sqrt(x))
*a58d3d2aSXin Li#define celt_rsqrt(x) (1.f/celt_sqrt(x))
*a58d3d2aSXin Li#define celt_rsqrt_norm(x) (celt_rsqrt(x))
*a58d3d2aSXin Li#define celt_cos_norm(x) ((float)cos((.5f*PI)*(x)))
*a58d3d2aSXin Li#define celt_rcp(x) (1.f/(x))
*a58d3d2aSXin Li#define celt_div(a,b) ((a)/(b))
*a58d3d2aSXin Li#define frac_div32(a,b) ((float)(a)/(b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef FLOAT_APPROX
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Note: This assumes radix-2 floating point with the exponent at bits 23..30 and an offset of 127
*a58d3d2aSXin Li         denorm, +/- inf and NaN are *not* handled */
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Base-2 log approximation (log2(x)). */
*a58d3d2aSXin Listatic OPUS_INLINE float celt_log2(float x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int integer;
*a58d3d2aSXin Li   float frac;
*a58d3d2aSXin Li   union {
*a58d3d2aSXin Li      float f;
*a58d3d2aSXin Li      opus_uint32 i;
*a58d3d2aSXin Li   } in;
*a58d3d2aSXin Li   in.f = x;
*a58d3d2aSXin Li   integer = (in.i>>23)-127;
*a58d3d2aSXin Li   in.i -= (opus_uint32)integer<<23;
*a58d3d2aSXin Li   frac = in.f - 1.5f;
*a58d3d2aSXin Li   frac = -0.41445418f + frac*(0.95909232f
*a58d3d2aSXin Li          + frac*(-0.33951290f + frac*0.16541097f));
*a58d3d2aSXin Li   return 1+integer+frac;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Base-2 exponential approximation (2^x). */
*a58d3d2aSXin Listatic OPUS_INLINE float celt_exp2(float x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int integer;
*a58d3d2aSXin Li   float frac;
*a58d3d2aSXin Li   union {
*a58d3d2aSXin Li      float f;
*a58d3d2aSXin Li      opus_uint32 i;
*a58d3d2aSXin Li   } res;
*a58d3d2aSXin Li   integer = (int)floor(x);
*a58d3d2aSXin Li   if (integer < -50)
*a58d3d2aSXin Li      return 0;
*a58d3d2aSXin Li   frac = x-integer;
*a58d3d2aSXin Li   /* K0 = 1, K1 = log(2), K2 = 3-4*log(2), K3 = 3*log(2) - 2 */
*a58d3d2aSXin Li   res.f = 0.99992522f + frac * (0.69583354f
*a58d3d2aSXin Li           + frac * (0.22606716f + 0.078024523f*frac));
*a58d3d2aSXin Li   res.i = (res.i + ((opus_uint32)integer<<23)) & 0x7fffffff;
*a58d3d2aSXin Li   return res.f;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define celt_log2(x) ((float)(1.442695040888963387*log(x)))
*a58d3d2aSXin Li#define celt_exp2(x) ((float)exp(0.6931471805599453094*(x)))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include "os_support.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef OVERRIDE_CELT_ILOG2
*a58d3d2aSXin Li/** Integer log in base2. Undefined for zero and negative numbers */
*a58d3d2aSXin Listatic OPUS_INLINE opus_int16 celt_ilog2(opus_int32 x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   celt_sig_assert(x>0);
*a58d3d2aSXin Li   return EC_ILOG(x)-1;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Integer log in base2. Defined for zero, but not for negative numbers */
*a58d3d2aSXin Listatic OPUS_INLINE opus_int16 celt_zlog2(opus_val32 x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   return x <= 0 ? 0 : celt_ilog2(x);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_val16 celt_rsqrt_norm(opus_val32 x);
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_val32 celt_sqrt(opus_val32 x);
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_val16 celt_cos_norm(opus_val32 x);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Base-2 logarithm approximation (log2(x)). (Q14 input, Q10 output) */
*a58d3d2aSXin Listatic OPUS_INLINE opus_val16 celt_log2(opus_val32 x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   opus_val16 n, frac;
*a58d3d2aSXin Li   /* -0.41509302963303146, 0.9609890551383969, -0.31836011537636605,
*a58d3d2aSXin Li       0.15530808010959576, -0.08556153059057618 */
*a58d3d2aSXin Li   static const opus_val16 C[5] = {-6801+(1<<(13-DB_SHIFT)), 15746, -5217, 2545, -1401};
*a58d3d2aSXin Li   if (x==0)
*a58d3d2aSXin Li      return -32767;
*a58d3d2aSXin Li   i = celt_ilog2(x);
*a58d3d2aSXin Li   n = VSHR32(x,i-15)-32768-16384;
*a58d3d2aSXin Li   frac = ADD16(C[0], MULT16_16_Q15(n, ADD16(C[1], MULT16_16_Q15(n, ADD16(C[2], MULT16_16_Q15(n, ADD16(C[3], MULT16_16_Q15(n, C[4]))))))));
*a58d3d2aSXin Li   return SHL16(i-13,DB_SHIFT)+SHR16(frac,14-DB_SHIFT);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/*
*a58d3d2aSXin Li K0 = 1
*a58d3d2aSXin Li K1 = log(2)
*a58d3d2aSXin Li K2 = 3-4*log(2)
*a58d3d2aSXin Li K3 = 3*log(2) - 2
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li#define D0 16383
*a58d3d2aSXin Li#define D1 22804
*a58d3d2aSXin Li#define D2 14819
*a58d3d2aSXin Li#define D3 10204
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic OPUS_INLINE opus_val32 celt_exp2_frac(opus_val16 x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   opus_val16 frac;
*a58d3d2aSXin Li   frac = SHL16(x, 4);
*a58d3d2aSXin Li   return ADD16(D0, MULT16_16_Q15(frac, ADD16(D1, MULT16_16_Q15(frac, ADD16(D2 , MULT16_16_Q15(D3,frac))))));
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#undef D0
*a58d3d2aSXin Li#undef D1
*a58d3d2aSXin Li#undef D2
*a58d3d2aSXin Li#undef D3
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Base-2 exponential approximation (2^x). (Q10 input, Q16 output) */
*a58d3d2aSXin Listatic OPUS_INLINE opus_val32 celt_exp2(opus_val16 x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int integer;
*a58d3d2aSXin Li   opus_val16 frac;
*a58d3d2aSXin Li   integer = SHR16(x,10);
*a58d3d2aSXin Li   if (integer>14)
*a58d3d2aSXin Li      return 0x7f000000;
*a58d3d2aSXin Li   else if (integer < -15)
*a58d3d2aSXin Li      return 0;
*a58d3d2aSXin Li   frac = celt_exp2_frac(x-SHL16(integer,10));
*a58d3d2aSXin Li   return VSHR32(EXTEND32(frac), -integer-2);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_val32 celt_rcp(opus_val32 x);
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define celt_div(a,b) MULT32_32_Q31((opus_val32)(a),celt_rcp(b))
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_val32 frac_div32(opus_val32 a, opus_val32 b);
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define M1 32767
*a58d3d2aSXin Li#define M2 -21
*a58d3d2aSXin Li#define M3 -11943
*a58d3d2aSXin Li#define M4 4936
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Atan approximation using a 4th order polynomial. Input is in Q15 format
*a58d3d2aSXin Li   and normalized by pi/4. Output is in Q15 format */
*a58d3d2aSXin Listatic OPUS_INLINE opus_val16 celt_atan01(opus_val16 x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   return MULT16_16_P15(x, ADD32(M1, MULT16_16_P15(x, ADD32(M2, MULT16_16_P15(x, ADD32(M3, MULT16_16_P15(M4, x)))))));
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#undef M1
*a58d3d2aSXin Li#undef M2
*a58d3d2aSXin Li#undef M3
*a58d3d2aSXin Li#undef M4
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* atan2() approximation valid for positive input values */
*a58d3d2aSXin Listatic OPUS_INLINE opus_val16 celt_atan2p(opus_val16 y, opus_val16 x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   if (y < x)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      opus_val32 arg;
*a58d3d2aSXin Li      arg = celt_div(SHL32(EXTEND32(y),15),x);
*a58d3d2aSXin Li      if (arg >= 32767)
*a58d3d2aSXin Li         arg = 32767;
*a58d3d2aSXin Li      return SHR16(celt_atan01(EXTRACT16(arg)),1);
*a58d3d2aSXin Li   } else {
*a58d3d2aSXin Li      opus_val32 arg;
*a58d3d2aSXin Li      arg = celt_div(SHL32(EXTEND32(x),15),y);
*a58d3d2aSXin Li      if (arg >= 32767)
*a58d3d2aSXin Li         arg = 32767;
*a58d3d2aSXin Li      return 25736-SHR16(celt_atan01(EXTRACT16(arg)),1);
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#endif /* FIXED_POINT */
*a58d3d2aSXin Li#endif /* MATHOPS_H */