arm-optimized-routines/math/sincosf.c

*412f47f9SXin Li/*
*412f47f9SXin Li * Single-precision sin/cos function.
*412f47f9SXin Li *
*412f47f9SXin Li * Copyright (c) 2018-2021, Arm Limited.
*412f47f9SXin Li * SPDX-License-Identifier: MIT OR Apache-2.0 WITH LLVM-exception
*412f47f9SXin Li */
*412f47f9SXin Li
*412f47f9SXin Li#include <stdint.h>
*412f47f9SXin Li#include <math.h>
*412f47f9SXin Li#include "math_config.h"
*412f47f9SXin Li#include "sincosf.h"
*412f47f9SXin Li
*412f47f9SXin Li/* Fast sincosf implementation.  Worst-case ULP is 0.5607, maximum relative
*412f47f9SXin Li   error is 0.5303 * 2^-23.  A single-step range reduction is used for
*412f47f9SXin Li   small values.  Large inputs have their range reduced using fast integer
*412f47f9SXin Li   arithmetic.  */
*412f47f9SXin Livoid
*412f47f9SXin Lisincosf (float y, float *sinp, float *cosp)
*412f47f9SXin Li{
*412f47f9SXin Li  double x = y;
*412f47f9SXin Li  double s;
*412f47f9SXin Li  int n;
*412f47f9SXin Li  const sincos_t *p = &__sincosf_table[0];
*412f47f9SXin Li
*412f47f9SXin Li  if (abstop12 (y) < abstop12 (pio4f))
*412f47f9SXin Li    {
*412f47f9SXin Li      double x2 = x * x;
*412f47f9SXin Li
*412f47f9SXin Li      if (unlikely (abstop12 (y) < abstop12 (0x1p-12f)))
*412f47f9SXin Li	{
*412f47f9SXin Li	  if (unlikely (abstop12 (y) < abstop12 (0x1p-126f)))
*412f47f9SXin Li	    /* Force underflow for tiny y.  */
*412f47f9SXin Li	    force_eval_float (x2);
*412f47f9SXin Li	  *sinp = y;
*412f47f9SXin Li	  *cosp = 1.0f;
*412f47f9SXin Li	  return;
*412f47f9SXin Li	}
*412f47f9SXin Li
*412f47f9SXin Li      sincosf_poly (x, x2, p, 0, sinp, cosp);
*412f47f9SXin Li    }
*412f47f9SXin Li  else if (abstop12 (y) < abstop12 (120.0f))
*412f47f9SXin Li    {
*412f47f9SXin Li      x = reduce_fast (x, p, &n);
*412f47f9SXin Li
*412f47f9SXin Li      /* Setup the signs for sin and cos.  */
*412f47f9SXin Li      s = p->sign[n & 3];
*412f47f9SXin Li
*412f47f9SXin Li      if (n & 2)
*412f47f9SXin Li	p = &__sincosf_table[1];
*412f47f9SXin Li
*412f47f9SXin Li      sincosf_poly (x * s, x * x, p, n, sinp, cosp);
*412f47f9SXin Li    }
*412f47f9SXin Li  else if (likely (abstop12 (y) < abstop12 (INFINITY)))
*412f47f9SXin Li    {
*412f47f9SXin Li      uint32_t xi = asuint (y);
*412f47f9SXin Li      int sign = xi >> 31;
*412f47f9SXin Li
*412f47f9SXin Li      x = reduce_large (xi, &n);
*412f47f9SXin Li
*412f47f9SXin Li      /* Setup signs for sin and cos - include original sign.  */
*412f47f9SXin Li      s = p->sign[(n + sign) & 3];
*412f47f9SXin Li
*412f47f9SXin Li      if ((n + sign) & 2)
*412f47f9SXin Li	p = &__sincosf_table[1];
*412f47f9SXin Li
*412f47f9SXin Li      sincosf_poly (x * s, x * x, p, n, sinp, cosp);
*412f47f9SXin Li    }
*412f47f9SXin Li  else
*412f47f9SXin Li    {
*412f47f9SXin Li      /* Return NaN if Inf or NaN for both sin and cos.  */
*412f47f9SXin Li      *sinp = *cosp = y - y;
*412f47f9SXin Li#if WANT_ERRNO
*412f47f9SXin Li      /* Needed to set errno for +-Inf, the add is a hack to work
*412f47f9SXin Li	 around a gcc register allocation issue: just passing y
*412f47f9SXin Li	 affects code generation in the fast path.  */
*412f47f9SXin Li      __math_invalidf (y + y);
*412f47f9SXin Li#endif
*412f47f9SXin Li    }
*412f47f9SXin Li}