pl/math/sinpi_3u.c

*412f47f9SXin Li/*
*412f47f9SXin Li * Double-precision scalar sinpi function.
*412f47f9SXin Li *
*412f47f9SXin Li * Copyright (c) 2023, Arm Limited.
*412f47f9SXin Li * SPDX-License-Identifier: MIT OR Apache-2.0 WITH LLVM-exception
*412f47f9SXin Li */
*412f47f9SXin Li
*412f47f9SXin Li#define _GNU_SOURCE
*412f47f9SXin Li#include <math.h>
*412f47f9SXin Li#include "mathlib.h"
*412f47f9SXin Li#include "math_config.h"
*412f47f9SXin Li#include "pl_sig.h"
*412f47f9SXin Li#include "pl_test.h"
*412f47f9SXin Li#include "poly_scalar_f64.h"
*412f47f9SXin Li
*412f47f9SXin Li/* Taylor series coefficents for sin(pi * x).
*412f47f9SXin Li   C2 coefficient (orginally ~=5.16771278) has been split into two parts:
*412f47f9SXin Li   C2_hi = 4, C2_lo = C2 - C2_hi (~=1.16771278)
*412f47f9SXin Li   This change in magnitude reduces floating point rounding errors.
*412f47f9SXin Li   C2_hi is then reintroduced after the polynomial approxmation.  */
*412f47f9SXin Listatic const double poly[]
*412f47f9SXin Li    = { 0x1.921fb54442d184p1,  -0x1.2aef39896f94bp0,   0x1.466bc6775ab16p1,
*412f47f9SXin Li	-0x1.32d2cce62dc33p-1, 0x1.507834891188ep-4,   -0x1.e30750a28c88ep-8,
*412f47f9SXin Li	0x1.e8f48308acda4p-12, -0x1.6fc0032b3c29fp-16, 0x1.af86ae521260bp-21,
*412f47f9SXin Li	-0x1.012a9870eeb7dp-25 };
*412f47f9SXin Li
*412f47f9SXin Li#define Shift 0x1.8p+52
*412f47f9SXin Li
*412f47f9SXin Li/* Approximation for scalar double-precision sinpi(x).
*412f47f9SXin Li   Maximum error: 3.03 ULP:
*412f47f9SXin Li   sinpi(0x1.a90da2818f8b5p+7) got 0x1.fe358f255a4b3p-1
*412f47f9SXin Li			      want 0x1.fe358f255a4b6p-1.  */
*412f47f9SXin Lidouble
*412f47f9SXin Lisinpi (double x)
*412f47f9SXin Li{
*412f47f9SXin Li  if (isinf (x))
*412f47f9SXin Li    return __math_invalid (x);
*412f47f9SXin Li
*412f47f9SXin Li  double r = asdouble (asuint64 (x) & ~0x8000000000000000);
*412f47f9SXin Li  uint64_t sign = asuint64 (x) & 0x8000000000000000;
*412f47f9SXin Li
*412f47f9SXin Li  /* Edge cases for when sinpif should be exactly 0. (Integers)
*412f47f9SXin Li     0x1p53 is the limit for single precision to store any decimal places.  */
*412f47f9SXin Li  if (r >= 0x1p53)
*412f47f9SXin Li    return 0;
*412f47f9SXin Li
*412f47f9SXin Li  /* If x is an integer, return 0.  */
*412f47f9SXin Li  uint64_t m = (uint64_t) r;
*412f47f9SXin Li  if (r == m)
*412f47f9SXin Li    return 0;
*412f47f9SXin Li
*412f47f9SXin Li  /* For very small inputs, squaring r causes underflow.
*412f47f9SXin Li     Values below this threshold can be approximated via sinpi(x) ≈ pi*x.  */
*412f47f9SXin Li  if (r < 0x1p-63)
*412f47f9SXin Li    return M_PI * x;
*412f47f9SXin Li
*412f47f9SXin Li  /* Any non-integer values >= 0x1x51 will be int + 0.5.
*412f47f9SXin Li     These values should return exactly 1 or -1.  */
*412f47f9SXin Li  if (r >= 0x1p51)
*412f47f9SXin Li    {
*412f47f9SXin Li      uint64_t iy = ((m & 1) << 63) ^ asuint64 (1.0);
*412f47f9SXin Li      return asdouble (sign ^ iy);
*412f47f9SXin Li    }
*412f47f9SXin Li
*412f47f9SXin Li  /* n = rint(|x|).  */
*412f47f9SXin Li  double n = r + Shift;
*412f47f9SXin Li  sign ^= (asuint64 (n) << 63);
*412f47f9SXin Li  n = n - Shift;
*412f47f9SXin Li
*412f47f9SXin Li  /* r = |x| - n (range reduction into -1/2 .. 1/2).  */
*412f47f9SXin Li  r = r - n;
*412f47f9SXin Li
*412f47f9SXin Li  /* y = sin(r).  */
*412f47f9SXin Li  double r2 = r * r;
*412f47f9SXin Li  double y = horner_9_f64 (r2, poly);
*412f47f9SXin Li  y = y * r;
*412f47f9SXin Li
*412f47f9SXin Li  /* Reintroduce C2_hi.  */
*412f47f9SXin Li  y = fma (-4 * r2, r, y);
*412f47f9SXin Li
*412f47f9SXin Li  /* Copy sign of x to sin(|x|).  */
*412f47f9SXin Li  return asdouble (asuint64 (y) ^ sign);
*412f47f9SXin Li}
*412f47f9SXin Li
*412f47f9SXin LiPL_SIG (S, D, 1, sinpi, -0.9, 0.9)
*412f47f9SXin LiPL_TEST_ULP (sinpi, 2.53)
*412f47f9SXin LiPL_TEST_SYM_INTERVAL (sinpi, 0, 0x1p-63, 5000)
*412f47f9SXin LiPL_TEST_SYM_INTERVAL (sinpi, 0x1p-63, 0.5, 10000)
*412f47f9SXin LiPL_TEST_SYM_INTERVAL (sinpi, 0.5, 0x1p51, 10000)
*412f47f9SXin LiPL_TEST_SYM_INTERVAL (sinpi, 0x1p51, inf, 10000)