libopus/celt/fixed_generic.h

*a58d3d2aSXin Li/* Copyright (C) 2007-2009 Xiph.Org Foundation
*a58d3d2aSXin Li   Copyright (C) 2003-2008 Jean-Marc Valin
*a58d3d2aSXin Li   Copyright (C) 2007-2008 CSIRO */
*a58d3d2aSXin Li/**
*a58d3d2aSXin Li   @file fixed_generic.h
*a58d3d2aSXin Li   @brief Generic fixed-point operations
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li/*
*a58d3d2aSXin Li   Redistribution and use in source and binary forms, with or without
*a58d3d2aSXin Li   modification, are permitted provided that the following conditions
*a58d3d2aSXin Li   are met:
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions of source code must retain the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Li   documentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*a58d3d2aSXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*a58d3d2aSXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*a58d3d2aSXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER
*a58d3d2aSXin Li   OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*a58d3d2aSXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*a58d3d2aSXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*a58d3d2aSXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*a58d3d2aSXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*a58d3d2aSXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*a58d3d2aSXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef FIXED_GENERIC_H
*a58d3d2aSXin Li#define FIXED_GENERIC_H
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Multiply a 16-bit signed value by a 16-bit unsigned value. The result is a 32-bit signed value */
*a58d3d2aSXin Li#define MULT16_16SU(a,b) ((opus_val32)(opus_val16)(a)*(opus_val32)(opus_uint16)(b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** 16x32 multiplication, followed by a 16-bit shift right. Results fits in 32 bits */
*a58d3d2aSXin Li#if OPUS_FAST_INT64
*a58d3d2aSXin Li#define MULT16_32_Q16(a,b) ((opus_val32)SHR((opus_int64)((opus_val16)(a))*(b),16))
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define MULT16_32_Q16(a,b) ADD32(MULT16_16((a),SHR((b),16)), SHR(MULT16_16SU((a),((b)&0x0000ffff)),16))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** 16x32 multiplication, followed by a 16-bit shift right (round-to-nearest). Results fits in 32 bits */
*a58d3d2aSXin Li#if OPUS_FAST_INT64
*a58d3d2aSXin Li#define MULT16_32_P16(a,b) ((opus_val32)PSHR((opus_int64)((opus_val16)(a))*(b),16))
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define MULT16_32_P16(a,b) ADD32(MULT16_16((a),SHR((b),16)), PSHR(MULT16_16SU((a),((b)&0x0000ffff)),16))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** 16x32 multiplication, followed by a 15-bit shift right. Results fits in 32 bits */
*a58d3d2aSXin Li#if OPUS_FAST_INT64
*a58d3d2aSXin Li#define MULT16_32_Q15(a,b) ((opus_val32)SHR((opus_int64)((opus_val16)(a))*(b),15))
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define MULT16_32_Q15(a,b) ADD32(SHL(MULT16_16((a),SHR((b),16)),1), SHR(MULT16_16SU((a),((b)&0x0000ffff)),15))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** 32x32 multiplication, followed by a 16-bit shift right. Results fits in 32 bits */
*a58d3d2aSXin Li#if OPUS_FAST_INT64
*a58d3d2aSXin Li#define MULT32_32_Q16(a,b) ((opus_val32)SHR((opus_int64)(a)*(opus_int64)(b),16))
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define MULT32_32_Q16(a,b) (ADD32(ADD32(ADD32((opus_val32)(SHR32(((opus_uint32)((a)&0x0000ffff)*(opus_uint32)((b)&0x0000ffff)),16)), MULT16_16SU(SHR32(a,16),((b)&0x0000ffff))), MULT16_16SU(SHR32(b,16),((a)&0x0000ffff))), SHL32(MULT16_16(SHR32(a,16),SHR32(b,16)),16)))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** 32x32 multiplication, followed by a 31-bit shift right. Results fits in 32 bits */
*a58d3d2aSXin Li#if OPUS_FAST_INT64
*a58d3d2aSXin Li#define MULT32_32_Q31(a,b) ((opus_val32)SHR((opus_int64)(a)*(opus_int64)(b),31))
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define MULT32_32_Q31(a,b) ADD32(ADD32(SHL(MULT16_16(SHR((a),16),SHR((b),16)),1), SHR(MULT16_16SU(SHR((a),16),((b)&0x0000ffff)),15)), SHR(MULT16_16SU(SHR((b),16),((a)&0x0000ffff)),15))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Compile-time conversion of float constant to 16-bit value */
*a58d3d2aSXin Li#define QCONST16(x,bits) ((opus_val16)(.5+(x)*(((opus_val32)1)<<(bits))))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Compile-time conversion of float constant to 32-bit value */
*a58d3d2aSXin Li#define QCONST32(x,bits) ((opus_val32)(.5+(x)*(((opus_val32)1)<<(bits))))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Negate a 16-bit value */
*a58d3d2aSXin Li#define NEG16(x) (-(x))
*a58d3d2aSXin Li/** Negate a 32-bit value */
*a58d3d2aSXin Li#define NEG32(x) (-(x))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Change a 32-bit value into a 16-bit value. The value is assumed to fit in 16-bit, otherwise the result is undefined */
*a58d3d2aSXin Li#define EXTRACT16(x) ((opus_val16)(x))
*a58d3d2aSXin Li/** Change a 16-bit value into a 32-bit value */
*a58d3d2aSXin Li#define EXTEND32(x) ((opus_val32)(x))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Arithmetic shift-right of a 16-bit value */
*a58d3d2aSXin Li#define SHR16(a,shift) ((a) >> (shift))
*a58d3d2aSXin Li/** Arithmetic shift-left of a 16-bit value */
*a58d3d2aSXin Li#define SHL16(a,shift) ((opus_int16)((opus_uint16)(a)<<(shift)))
*a58d3d2aSXin Li/** Arithmetic shift-right of a 32-bit value */
*a58d3d2aSXin Li#define SHR32(a,shift) ((a) >> (shift))
*a58d3d2aSXin Li/** Arithmetic shift-left of a 32-bit value */
*a58d3d2aSXin Li#define SHL32(a,shift) ((opus_int32)((opus_uint32)(a)<<(shift)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** 32-bit arithmetic shift right with rounding-to-nearest instead of rounding down */
*a58d3d2aSXin Li#define PSHR32(a,shift) (SHR32((a)+((EXTEND32(1)<<((shift))>>1)),shift))
*a58d3d2aSXin Li/** 32-bit arithmetic shift right where the argument can be negative */
*a58d3d2aSXin Li#define VSHR32(a, shift) (((shift)>0) ? SHR32(a, shift) : SHL32(a, -(shift)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** "RAW" macros, should not be used outside of this header file */
*a58d3d2aSXin Li#define SHR(a,shift) ((a) >> (shift))
*a58d3d2aSXin Li#define SHL(a,shift) SHL32(a,shift)
*a58d3d2aSXin Li#define PSHR(a,shift) (SHR((a)+((EXTEND32(1)<<((shift))>>1)),shift))
*a58d3d2aSXin Li#define SATURATE(x,a) (((x)>(a) ? (a) : (x)<-(a) ? -(a) : (x)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define SATURATE16(x) (EXTRACT16((x)>32767 ? 32767 : (x)<-32768 ? -32768 : (x)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Shift by a and round-to-nearest 32-bit value. Result is a 16-bit value */
*a58d3d2aSXin Li#define ROUND16(x,a) (EXTRACT16(PSHR32((x),(a))))
*a58d3d2aSXin Li/** Shift by a and round-to-nearest 32-bit value. Result is a saturated 16-bit value */
*a58d3d2aSXin Li#define SROUND16(x,a) EXTRACT16(SATURATE(PSHR32(x,a), 32767));
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Divide by two */
*a58d3d2aSXin Li#define HALF16(x)  (SHR16(x,1))
*a58d3d2aSXin Li#define HALF32(x)  (SHR32(x,1))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Add two 16-bit values */
*a58d3d2aSXin Li#define ADD16(a,b) ((opus_val16)((opus_val16)(a)+(opus_val16)(b)))
*a58d3d2aSXin Li/** Subtract two 16-bit values */
*a58d3d2aSXin Li#define SUB16(a,b) ((opus_val16)(a)-(opus_val16)(b))
*a58d3d2aSXin Li/** Add two 32-bit values */
*a58d3d2aSXin Li#define ADD32(a,b) ((opus_val32)(a)+(opus_val32)(b))
*a58d3d2aSXin Li/** Subtract two 32-bit values */
*a58d3d2aSXin Li#define SUB32(a,b) ((opus_val32)(a)-(opus_val32)(b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Add two 32-bit values, ignore any overflows */
*a58d3d2aSXin Li#define ADD32_ovflw(a,b) ((opus_val32)((opus_uint32)(a)+(opus_uint32)(b)))
*a58d3d2aSXin Li/** Subtract two 32-bit values, ignore any overflows */
*a58d3d2aSXin Li#define SUB32_ovflw(a,b) ((opus_val32)((opus_uint32)(a)-(opus_uint32)(b)))
*a58d3d2aSXin Li/* Avoid MSVC warning C4146: unary minus operator applied to unsigned type */
*a58d3d2aSXin Li/** Negate 32-bit value, ignore any overflows */
*a58d3d2aSXin Li#define NEG32_ovflw(a) ((opus_val32)(0-(opus_uint32)(a)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** 16x16 multiplication where the result fits in 16 bits */
*a58d3d2aSXin Li#define MULT16_16_16(a,b)     ((((opus_val16)(a))*((opus_val16)(b))))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** 32x32 multiplication where the result fits in 32 bits */
*a58d3d2aSXin Li#define MULT32_32_32(a,b)     ((((opus_val32)(a))*((opus_val32)(b))))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* (opus_val32)(opus_val16) gives TI compiler a hint that it's 16x16->32 multiply */
*a58d3d2aSXin Li/** 16x16 multiplication where the result fits in 32 bits */
*a58d3d2aSXin Li#define MULT16_16(a,b)     (((opus_val32)(opus_val16)(a))*((opus_val32)(opus_val16)(b)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** 16x16 multiply-add where the result fits in 32 bits */
*a58d3d2aSXin Li#define MAC16_16(c,a,b) (ADD32((c),MULT16_16((a),(b))))
*a58d3d2aSXin Li/** 16x32 multiply, followed by a 15-bit shift right and 32-bit add.
*a58d3d2aSXin Li    b must fit in 31 bits.
*a58d3d2aSXin Li    Result fits in 32 bits. */
*a58d3d2aSXin Li#define MAC16_32_Q15(c,a,b) ADD32((c),ADD32(MULT16_16((a),SHR((b),15)), SHR(MULT16_16((a),((b)&0x00007fff)),15)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** 16x32 multiplication, followed by a 16-bit shift right and 32-bit add.
*a58d3d2aSXin Li    Results fits in 32 bits */
*a58d3d2aSXin Li#define MAC16_32_Q16(c,a,b) ADD32((c),ADD32(MULT16_16((a),SHR((b),16)), SHR(MULT16_16SU((a),((b)&0x0000ffff)),16)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define MULT16_16_Q11_32(a,b) (SHR(MULT16_16((a),(b)),11))
*a58d3d2aSXin Li#define MULT16_16_Q11(a,b) (SHR(MULT16_16((a),(b)),11))
*a58d3d2aSXin Li#define MULT16_16_Q13(a,b) (SHR(MULT16_16((a),(b)),13))
*a58d3d2aSXin Li#define MULT16_16_Q14(a,b) (SHR(MULT16_16((a),(b)),14))
*a58d3d2aSXin Li#define MULT16_16_Q15(a,b) (SHR(MULT16_16((a),(b)),15))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define MULT16_16_P13(a,b) (SHR(ADD32(4096,MULT16_16((a),(b))),13))
*a58d3d2aSXin Li#define MULT16_16_P14(a,b) (SHR(ADD32(8192,MULT16_16((a),(b))),14))
*a58d3d2aSXin Li#define MULT16_16_P15(a,b) (SHR(ADD32(16384,MULT16_16((a),(b))),15))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Divide a 32-bit value by a 16-bit value. Result fits in 16 bits */
*a58d3d2aSXin Li#define DIV32_16(a,b) ((opus_val16)(((opus_val32)(a))/((opus_val16)(b))))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/** Divide a 32-bit value by a 32-bit value. Result fits in 32 bits */
*a58d3d2aSXin Li#define DIV32(a,b) (((opus_val32)(a))/((opus_val32)(b)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if defined(MIPSr1_ASM)
*a58d3d2aSXin Li#include "mips/fixed_generic_mipsr1.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic OPUS_INLINE opus_val16 SIG2WORD16_generic(celt_sig x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   x = PSHR32(x, SIG_SHIFT);
*a58d3d2aSXin Li   x = MAX32(x, -32768);
*a58d3d2aSXin Li   x = MIN32(x, 32767);
*a58d3d2aSXin Li   return EXTRACT16(x);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#define SIG2WORD16(x) (SIG2WORD16_generic(x))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#endif