eigen/test/bfloat16_float.cpp

*bf2c3715SXin Li// This file is part of Eigen, a lightweight C++ template library
*bf2c3715SXin Li// for linear algebra.
*bf2c3715SXin Li//
*bf2c3715SXin Li// This Source Code Form is subject to the terms of the Mozilla
*bf2c3715SXin Li// Public License v. 2.0. If a copy of the MPL was not distributed
*bf2c3715SXin Li// with this file, You can obtain one at http://mozilla.org/MPL/2.0/.
*bf2c3715SXin Li
*bf2c3715SXin Li#include <sstream>
*bf2c3715SXin Li#include <memory>
*bf2c3715SXin Li#include <math.h>
*bf2c3715SXin Li
*bf2c3715SXin Li#include "main.h"
*bf2c3715SXin Li
*bf2c3715SXin Li#include <Eigen/src/Core/arch/Default/BFloat16.h>
*bf2c3715SXin Li
*bf2c3715SXin Li#define VERIFY_BFLOAT16_BITS_EQUAL(h, bits) \
*bf2c3715SXin Li  VERIFY_IS_EQUAL((numext::bit_cast<numext::uint16_t>(h)), (static_cast<numext::uint16_t>(bits)))
*bf2c3715SXin Li
*bf2c3715SXin Li// Make sure it's possible to forward declare Eigen::bfloat16
*bf2c3715SXin Linamespace Eigen {
*bf2c3715SXin Listruct bfloat16;
*bf2c3715SXin Li}
*bf2c3715SXin Li
*bf2c3715SXin Liusing Eigen::bfloat16;
*bf2c3715SXin Li
*bf2c3715SXin Lifloat BinaryToFloat(uint32_t sign, uint32_t exponent, uint32_t high_mantissa,
*bf2c3715SXin Li                    uint32_t low_mantissa) {
*bf2c3715SXin Li  float dest;
*bf2c3715SXin Li  uint32_t src = (sign << 31) + (exponent << 23) + (high_mantissa << 16) + low_mantissa;
*bf2c3715SXin Li  memcpy(static_cast<void*>(&dest),
*bf2c3715SXin Li         static_cast<const void*>(&src), sizeof(dest));
*bf2c3715SXin Li  return dest;
*bf2c3715SXin Li}
*bf2c3715SXin Li
*bf2c3715SXin Litemplate<typename T>
*bf2c3715SXin Li void test_roundtrip() {
*bf2c3715SXin Li  // Representable T round trip via bfloat16
*bf2c3715SXin Li  VERIFY_IS_EQUAL((internal::cast<bfloat16,T>(internal::cast<T,bfloat16>(-std::numeric_limits<T>::infinity()))), -std::numeric_limits<T>::infinity());
*bf2c3715SXin Li  VERIFY_IS_EQUAL((internal::cast<bfloat16,T>(internal::cast<T,bfloat16>(std::numeric_limits<T>::infinity()))), std::numeric_limits<T>::infinity());
*bf2c3715SXin Li  VERIFY_IS_EQUAL((internal::cast<bfloat16,T>(internal::cast<T,bfloat16>(T(-1.0)))), T(-1.0));
*bf2c3715SXin Li  VERIFY_IS_EQUAL((internal::cast<bfloat16,T>(internal::cast<T,bfloat16>(T(-0.5)))), T(-0.5));
*bf2c3715SXin Li  VERIFY_IS_EQUAL((internal::cast<bfloat16,T>(internal::cast<T,bfloat16>(T(-0.0)))), T(-0.0));
*bf2c3715SXin Li  VERIFY_IS_EQUAL((internal::cast<bfloat16,T>(internal::cast<T,bfloat16>(T(1.0)))), T(1.0));
*bf2c3715SXin Li  VERIFY_IS_EQUAL((internal::cast<bfloat16,T>(internal::cast<T,bfloat16>(T(0.5)))), T(0.5));
*bf2c3715SXin Li  VERIFY_IS_EQUAL((internal::cast<bfloat16,T>(internal::cast<T,bfloat16>(T(0.0)))), T(0.0));
*bf2c3715SXin Li}
*bf2c3715SXin Li
*bf2c3715SXin Livoid test_conversion()
*bf2c3715SXin Li{
*bf2c3715SXin Li  using Eigen::bfloat16_impl::__bfloat16_raw;
*bf2c3715SXin Li
*bf2c3715SXin Li  // Round-trip casts
*bf2c3715SXin Li  VERIFY_IS_EQUAL(
*bf2c3715SXin Li    numext::bit_cast<bfloat16>(numext::bit_cast<numext::uint16_t>(bfloat16(1.0f))),
*bf2c3715SXin Li    bfloat16(1.0f));
*bf2c3715SXin Li  VERIFY_IS_EQUAL(
*bf2c3715SXin Li    numext::bit_cast<bfloat16>(numext::bit_cast<numext::uint16_t>(bfloat16(0.5f))),
*bf2c3715SXin Li    bfloat16(0.5f));
*bf2c3715SXin Li  VERIFY_IS_EQUAL(
*bf2c3715SXin Li    numext::bit_cast<bfloat16>(numext::bit_cast<numext::uint16_t>(bfloat16(-0.33333f))),
*bf2c3715SXin Li    bfloat16(-0.33333f));
*bf2c3715SXin Li   VERIFY_IS_EQUAL(
*bf2c3715SXin Li    numext::bit_cast<bfloat16>(numext::bit_cast<numext::uint16_t>(bfloat16(0.0f))),
*bf2c3715SXin Li    bfloat16(0.0f));
*bf2c3715SXin Li
*bf2c3715SXin Li  // Conversion from float.
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(1.0f), 0x3f80);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(0.5f), 0x3f00);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(0.33333f), 0x3eab);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(3.38e38f), 0x7f7e);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(3.40e38f), 0x7f80);  // Becomes infinity.
*bf2c3715SXin Li
*bf2c3715SXin Li  // Verify round-to-nearest-even behavior.
*bf2c3715SXin Li  float val1 = static_cast<float>(bfloat16(__bfloat16_raw(0x3c00)));
*bf2c3715SXin Li  float val2 = static_cast<float>(bfloat16(__bfloat16_raw(0x3c01)));
*bf2c3715SXin Li  float val3 = static_cast<float>(bfloat16(__bfloat16_raw(0x3c02)));
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(0.5f * (val1 + val2)), 0x3c00);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(0.5f * (val2 + val3)), 0x3c02);
*bf2c3715SXin Li
*bf2c3715SXin Li  // Conversion from int.
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(-1), 0xbf80);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(0), 0x0000);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(1), 0x3f80);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(2), 0x4000);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(3), 0x4040);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(12), 0x4140);
*bf2c3715SXin Li
*bf2c3715SXin Li  // Conversion from bool.
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(false), 0x0000);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(true), 0x3f80);
*bf2c3715SXin Li
*bf2c3715SXin Li  // Conversion to bool
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<bool>(bfloat16(3)), true);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<bool>(bfloat16(0.33333f)), true);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(bfloat16(-0.0), false);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<bool>(bfloat16(0.0)), false);
*bf2c3715SXin Li
*bf2c3715SXin Li  // Explicit conversion to float.
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(bfloat16(__bfloat16_raw(0x0000))), 0.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(bfloat16(__bfloat16_raw(0x3f80))), 1.0f);
*bf2c3715SXin Li
*bf2c3715SXin Li  // Implicit conversion to float
*bf2c3715SXin Li  VERIFY_IS_EQUAL(bfloat16(__bfloat16_raw(0x0000)), 0.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(bfloat16(__bfloat16_raw(0x3f80)), 1.0f);
*bf2c3715SXin Li
*bf2c3715SXin Li  // Zero representations
*bf2c3715SXin Li  VERIFY_IS_EQUAL(bfloat16(0.0f), bfloat16(0.0f));
*bf2c3715SXin Li  VERIFY_IS_EQUAL(bfloat16(-0.0f), bfloat16(0.0f));
*bf2c3715SXin Li  VERIFY_IS_EQUAL(bfloat16(-0.0f), bfloat16(-0.0f));
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(0.0f), 0x0000);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(-0.0f), 0x8000);
*bf2c3715SXin Li
*bf2c3715SXin Li  // Default is zero
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(bfloat16()), 0.0f);
*bf2c3715SXin Li
*bf2c3715SXin Li  // Representable floats round trip via bfloat16
*bf2c3715SXin Li  test_roundtrip<float>();
*bf2c3715SXin Li  test_roundtrip<double>();
*bf2c3715SXin Li  test_roundtrip<std::complex<float> >();
*bf2c3715SXin Li  test_roundtrip<std::complex<double> >();
*bf2c3715SXin Li
*bf2c3715SXin Li  // Conversion
*bf2c3715SXin Li  Array<float,1,100> a;
*bf2c3715SXin Li  for (int i = 0; i < 100; i++) a(i) = i + 1.25;
*bf2c3715SXin Li  Array<bfloat16,1,100> b = a.cast<bfloat16>();
*bf2c3715SXin Li  Array<float,1,100> c = b.cast<float>();
*bf2c3715SXin Li  for (int i = 0; i < 100; ++i) {
*bf2c3715SXin Li    VERIFY_LE(numext::abs(c(i) - a(i)), a(i) / 128);
*bf2c3715SXin Li  }
*bf2c3715SXin Li
*bf2c3715SXin Li  // Epsilon
*bf2c3715SXin Li  VERIFY_LE(1.0f, static_cast<float>((std::numeric_limits<bfloat16>::epsilon)() + bfloat16(1.0f)));
*bf2c3715SXin Li  VERIFY_IS_EQUAL(1.0f, static_cast<float>((std::numeric_limits<bfloat16>::epsilon)() / bfloat16(2.0f) + bfloat16(1.0f)));
*bf2c3715SXin Li
*bf2c3715SXin Li  // Negate
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(-bfloat16(3.0f)), -3.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(-bfloat16(-4.5f)), 4.5f);
*bf2c3715SXin Li
*bf2c3715SXin Li
*bf2c3715SXin Li#if !EIGEN_COMP_MSVC
*bf2c3715SXin Li  // Visual Studio errors out on divisions by 0
*bf2c3715SXin Li  VERIFY((numext::isnan)(static_cast<float>(bfloat16(0.0 / 0.0))));
*bf2c3715SXin Li  VERIFY((numext::isinf)(static_cast<float>(bfloat16(1.0 / 0.0))));
*bf2c3715SXin Li  VERIFY((numext::isinf)(static_cast<float>(bfloat16(-1.0 / 0.0))));
*bf2c3715SXin Li
*bf2c3715SXin Li  // Visual Studio errors out on divisions by 0
*bf2c3715SXin Li  VERIFY((numext::isnan)(bfloat16(0.0 / 0.0)));
*bf2c3715SXin Li  VERIFY((numext::isinf)(bfloat16(1.0 / 0.0)));
*bf2c3715SXin Li  VERIFY((numext::isinf)(bfloat16(-1.0 / 0.0)));
*bf2c3715SXin Li#endif
*bf2c3715SXin Li
*bf2c3715SXin Li  // NaNs and infinities.
*bf2c3715SXin Li  VERIFY(!(numext::isinf)(static_cast<float>(bfloat16(3.38e38f))));  // Largest finite number.
*bf2c3715SXin Li  VERIFY(!(numext::isnan)(static_cast<float>(bfloat16(0.0f))));
*bf2c3715SXin Li  VERIFY((numext::isinf)(static_cast<float>(bfloat16(__bfloat16_raw(0xff80)))));
*bf2c3715SXin Li  VERIFY((numext::isnan)(static_cast<float>(bfloat16(__bfloat16_raw(0xffc0)))));
*bf2c3715SXin Li  VERIFY((numext::isinf)(static_cast<float>(bfloat16(__bfloat16_raw(0x7f80)))));
*bf2c3715SXin Li  VERIFY((numext::isnan)(static_cast<float>(bfloat16(__bfloat16_raw(0x7fc0)))));
*bf2c3715SXin Li
*bf2c3715SXin Li  // Exactly same checks as above, just directly on the bfloat16 representation.
*bf2c3715SXin Li  VERIFY(!(numext::isinf)(bfloat16(__bfloat16_raw(0x7bff))));
*bf2c3715SXin Li  VERIFY(!(numext::isnan)(bfloat16(__bfloat16_raw(0x0000))));
*bf2c3715SXin Li  VERIFY((numext::isinf)(bfloat16(__bfloat16_raw(0xff80))));
*bf2c3715SXin Li  VERIFY((numext::isnan)(bfloat16(__bfloat16_raw(0xffc0))));
*bf2c3715SXin Li  VERIFY((numext::isinf)(bfloat16(__bfloat16_raw(0x7f80))));
*bf2c3715SXin Li  VERIFY((numext::isnan)(bfloat16(__bfloat16_raw(0x7fc0))));
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(BinaryToFloat(0x0, 0xff, 0x40, 0x0)), 0x7fc0);
*bf2c3715SXin Li  VERIFY_BFLOAT16_BITS_EQUAL(bfloat16(BinaryToFloat(0x1, 0xff, 0x40, 0x0)), 0xffc0);
*bf2c3715SXin Li}
*bf2c3715SXin Li
*bf2c3715SXin Livoid test_numtraits()
*bf2c3715SXin Li{
*bf2c3715SXin Li  std::cout << "epsilon       = " << NumTraits<bfloat16>::epsilon() << "  (0x" << std::hex << numext::bit_cast<numext::uint16_t>(NumTraits<bfloat16>::epsilon()) << ")" << std::endl;
*bf2c3715SXin Li  std::cout << "highest       = " << NumTraits<bfloat16>::highest() << "  (0x" << std::hex << numext::bit_cast<numext::uint16_t>(NumTraits<bfloat16>::highest()) << ")" << std::endl;
*bf2c3715SXin Li  std::cout << "lowest        = " << NumTraits<bfloat16>::lowest() << "  (0x" << std::hex << numext::bit_cast<numext::uint16_t>(NumTraits<bfloat16>::lowest()) << ")" << std::endl;
*bf2c3715SXin Li  std::cout << "min           = " << (std::numeric_limits<bfloat16>::min)() << "  (0x" << std::hex << numext::bit_cast<numext::uint16_t>((std::numeric_limits<bfloat16>::min)()) << ")" << std::endl;
*bf2c3715SXin Li  std::cout << "denorm min    = " << (std::numeric_limits<bfloat16>::denorm_min)() << "  (0x" << std::hex << numext::bit_cast<numext::uint16_t>((std::numeric_limits<bfloat16>::denorm_min)()) << ")" << std::endl;
*bf2c3715SXin Li  std::cout << "infinity      = " << NumTraits<bfloat16>::infinity() << "  (0x" << std::hex << numext::bit_cast<numext::uint16_t>(NumTraits<bfloat16>::infinity()) << ")" << std::endl;
*bf2c3715SXin Li  std::cout << "quiet nan     = " << NumTraits<bfloat16>::quiet_NaN() << "  (0x" << std::hex << numext::bit_cast<numext::uint16_t>(NumTraits<bfloat16>::quiet_NaN()) << ")" << std::endl;
*bf2c3715SXin Li  std::cout << "signaling nan = " << std::numeric_limits<bfloat16>::signaling_NaN() << "  (0x" << std::hex << numext::bit_cast<numext::uint16_t>(std::numeric_limits<bfloat16>::signaling_NaN()) << ")" << std::endl;
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY(NumTraits<bfloat16>::IsSigned);
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY_IS_EQUAL(
*bf2c3715SXin Li    numext::bit_cast<numext::uint16_t>(std::numeric_limits<bfloat16>::infinity()),
*bf2c3715SXin Li    numext::bit_cast<numext::uint16_t>(bfloat16(std::numeric_limits<float>::infinity())) );
*bf2c3715SXin Li  // There is no guarantee that casting a 32-bit NaN to bfloat16 has a precise
*bf2c3715SXin Li  // bit pattern.  We test that it is in fact a NaN, then test the signaling
*bf2c3715SXin Li  // bit (msb of significand is 1 for quiet, 0 for signaling).
*bf2c3715SXin Li  const numext::uint16_t BFLOAT16_QUIET_BIT = 0x0040;
*bf2c3715SXin Li  VERIFY(
*bf2c3715SXin Li    (numext::isnan)(std::numeric_limits<bfloat16>::quiet_NaN())
*bf2c3715SXin Li    && (numext::isnan)(bfloat16(std::numeric_limits<float>::quiet_NaN()))
*bf2c3715SXin Li    && ((numext::bit_cast<numext::uint16_t>(std::numeric_limits<bfloat16>::quiet_NaN()) & BFLOAT16_QUIET_BIT) > 0)
*bf2c3715SXin Li    && ((numext::bit_cast<numext::uint16_t>(bfloat16(std::numeric_limits<float>::quiet_NaN())) & BFLOAT16_QUIET_BIT) > 0) );
*bf2c3715SXin Li  // After a cast to bfloat16, a signaling NaN may become non-signaling. Thus,
*bf2c3715SXin Li  // we check that both are NaN, and that only the `numeric_limits` version is
*bf2c3715SXin Li  // signaling.
*bf2c3715SXin Li  VERIFY(
*bf2c3715SXin Li    (numext::isnan)(std::numeric_limits<bfloat16>::signaling_NaN())
*bf2c3715SXin Li    && (numext::isnan)(bfloat16(std::numeric_limits<float>::signaling_NaN()))
*bf2c3715SXin Li    && ((numext::bit_cast<numext::uint16_t>(std::numeric_limits<bfloat16>::signaling_NaN()) & BFLOAT16_QUIET_BIT) == 0) );
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY( (std::numeric_limits<bfloat16>::min)() > bfloat16(0.f) );
*bf2c3715SXin Li  VERIFY( (std::numeric_limits<bfloat16>::denorm_min)() > bfloat16(0.f) );
*bf2c3715SXin Li  VERIFY_IS_EQUAL( (std::numeric_limits<bfloat16>::denorm_min)()/bfloat16(2), bfloat16(0.f) );
*bf2c3715SXin Li}
*bf2c3715SXin Li
*bf2c3715SXin Livoid test_arithmetic()
*bf2c3715SXin Li{
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(bfloat16(2) + bfloat16(2)), 4);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(bfloat16(2) + bfloat16(-2)), 0);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(bfloat16(0.33333f) + bfloat16(0.66667f)), 1.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(bfloat16(2.0f) * bfloat16(-5.5f)), -11.0f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(bfloat16(1.0f) / bfloat16(3.0f)), 0.3339f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(-bfloat16(4096.0f)), -4096.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(-bfloat16(-4096.0f)), 4096.0f);
*bf2c3715SXin Li}
*bf2c3715SXin Li
*bf2c3715SXin Livoid test_comparison()
*bf2c3715SXin Li{
*bf2c3715SXin Li  VERIFY(bfloat16(1.0f) > bfloat16(0.5f));
*bf2c3715SXin Li  VERIFY(bfloat16(0.5f) < bfloat16(1.0f));
*bf2c3715SXin Li  VERIFY(!(bfloat16(1.0f) < bfloat16(0.5f)));
*bf2c3715SXin Li  VERIFY(!(bfloat16(0.5f) > bfloat16(1.0f)));
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY(!(bfloat16(4.0f) > bfloat16(4.0f)));
*bf2c3715SXin Li  VERIFY(!(bfloat16(4.0f) < bfloat16(4.0f)));
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY(!(bfloat16(0.0f) < bfloat16(-0.0f)));
*bf2c3715SXin Li  VERIFY(!(bfloat16(-0.0f) < bfloat16(0.0f)));
*bf2c3715SXin Li  VERIFY(!(bfloat16(0.0f) > bfloat16(-0.0f)));
*bf2c3715SXin Li  VERIFY(!(bfloat16(-0.0f) > bfloat16(0.0f)));
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY(bfloat16(0.2f) > bfloat16(-1.0f));
*bf2c3715SXin Li  VERIFY(bfloat16(-1.0f) < bfloat16(0.2f));
*bf2c3715SXin Li  VERIFY(bfloat16(-16.0f) < bfloat16(-15.0f));
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY(bfloat16(1.0f) == bfloat16(1.0f));
*bf2c3715SXin Li  VERIFY(bfloat16(1.0f) != bfloat16(2.0f));
*bf2c3715SXin Li
*bf2c3715SXin Li  // Comparisons with NaNs and infinities.
*bf2c3715SXin Li#if !EIGEN_COMP_MSVC
*bf2c3715SXin Li  // Visual Studio errors out on divisions by 0
*bf2c3715SXin Li  VERIFY(!(bfloat16(0.0 / 0.0) == bfloat16(0.0 / 0.0)));
*bf2c3715SXin Li  VERIFY(bfloat16(0.0 / 0.0) != bfloat16(0.0 / 0.0));
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY(!(bfloat16(1.0) == bfloat16(0.0 / 0.0)));
*bf2c3715SXin Li  VERIFY(!(bfloat16(1.0) < bfloat16(0.0 / 0.0)));
*bf2c3715SXin Li  VERIFY(!(bfloat16(1.0) > bfloat16(0.0 / 0.0)));
*bf2c3715SXin Li  VERIFY(bfloat16(1.0) != bfloat16(0.0 / 0.0));
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY(bfloat16(1.0) < bfloat16(1.0 / 0.0));
*bf2c3715SXin Li  VERIFY(bfloat16(1.0) > bfloat16(-1.0 / 0.0));
*bf2c3715SXin Li#endif
*bf2c3715SXin Li}
*bf2c3715SXin Li
*bf2c3715SXin Livoid test_basic_functions()
*bf2c3715SXin Li{
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(numext::abs(bfloat16(3.5f))), 3.5f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(abs(bfloat16(3.5f))), 3.5f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(numext::abs(bfloat16(-3.5f))), 3.5f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(abs(bfloat16(-3.5f))), 3.5f);
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(numext::floor(bfloat16(3.5f))), 3.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(floor(bfloat16(3.5f))), 3.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(numext::floor(bfloat16(-3.5f))), -4.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(floor(bfloat16(-3.5f))), -4.0f);
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(numext::ceil(bfloat16(3.5f))), 4.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(ceil(bfloat16(3.5f))), 4.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(numext::ceil(bfloat16(-3.5f))), -3.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(ceil(bfloat16(-3.5f))), -3.0f);
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(numext::sqrt(bfloat16(0.0f))), 0.0f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(sqrt(bfloat16(0.0f))), 0.0f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(numext::sqrt(bfloat16(4.0f))), 2.0f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(sqrt(bfloat16(4.0f))), 2.0f);
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(numext::pow(bfloat16(0.0f), bfloat16(1.0f))), 0.0f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(pow(bfloat16(0.0f), bfloat16(1.0f))), 0.0f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(numext::pow(bfloat16(2.0f), bfloat16(2.0f))), 4.0f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(pow(bfloat16(2.0f), bfloat16(2.0f))), 4.0f);
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(numext::exp(bfloat16(0.0f))), 1.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(exp(bfloat16(0.0f))), 1.0f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(numext::exp(bfloat16(EIGEN_PI))), 20.f + static_cast<float>(EIGEN_PI));
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(exp(bfloat16(EIGEN_PI))), 20.f + static_cast<float>(EIGEN_PI));
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(numext::expm1(bfloat16(0.0f))), 0.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(expm1(bfloat16(0.0f))), 0.0f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(numext::expm1(bfloat16(2.0f))), 6.375f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(expm1(bfloat16(2.0f))), 6.375f);
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(numext::log(bfloat16(1.0f))), 0.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(log(bfloat16(1.0f))), 0.0f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(numext::log(bfloat16(10.0f))), 2.296875f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(log(bfloat16(10.0f))), 2.296875f);
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(numext::log1p(bfloat16(0.0f))), 0.0f);
*bf2c3715SXin Li  VERIFY_IS_EQUAL(static_cast<float>(log1p(bfloat16(0.0f))), 0.0f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(numext::log1p(bfloat16(10.0f))), 2.390625f);
*bf2c3715SXin Li  VERIFY_IS_APPROX(static_cast<float>(log1p(bfloat16(10.0f))), 2.390625f);
*bf2c3715SXin Li}
*bf2c3715SXin Li
*bf2c3715SXin Livoid test_trigonometric_functions()
*bf2c3715SXin Li{
*bf2c3715SXin Li  VERIFY_IS_APPROX(numext::cos(bfloat16(0.0f)), bfloat16(cosf(0.0f)));
*bf2c3715SXin Li  VERIFY_IS_APPROX(cos(bfloat16(0.0f)), bfloat16(cosf(0.0f)));
*bf2c3715SXin Li  VERIFY_IS_APPROX(numext::cos(bfloat16(EIGEN_PI)), bfloat16(cosf(EIGEN_PI)));
*bf2c3715SXin Li  // VERIFY_IS_APPROX(numext::cos(bfloat16(EIGEN_PI/2)), bfloat16(cosf(EIGEN_PI/2)));
*bf2c3715SXin Li  // VERIFY_IS_APPROX(numext::cos(bfloat16(3*EIGEN_PI/2)), bfloat16(cosf(3*EIGEN_PI/2)));
*bf2c3715SXin Li  VERIFY_IS_APPROX(numext::cos(bfloat16(3.5f)), bfloat16(cosf(3.5f)));
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY_IS_APPROX(numext::sin(bfloat16(0.0f)), bfloat16(sinf(0.0f)));
*bf2c3715SXin Li  VERIFY_IS_APPROX(sin(bfloat16(0.0f)), bfloat16(sinf(0.0f)));
*bf2c3715SXin Li  // VERIFY_IS_APPROX(numext::sin(bfloat16(EIGEN_PI)), bfloat16(sinf(EIGEN_PI)));
*bf2c3715SXin Li  VERIFY_IS_APPROX(numext::sin(bfloat16(EIGEN_PI/2)), bfloat16(sinf(EIGEN_PI/2)));
*bf2c3715SXin Li  VERIFY_IS_APPROX(numext::sin(bfloat16(3*EIGEN_PI/2)), bfloat16(sinf(3*EIGEN_PI/2)));
*bf2c3715SXin Li  VERIFY_IS_APPROX(numext::sin(bfloat16(3.5f)), bfloat16(sinf(3.5f)));
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY_IS_APPROX(numext::tan(bfloat16(0.0f)), bfloat16(tanf(0.0f)));
*bf2c3715SXin Li  VERIFY_IS_APPROX(tan(bfloat16(0.0f)), bfloat16(tanf(0.0f)));
*bf2c3715SXin Li  // VERIFY_IS_APPROX(numext::tan(bfloat16(EIGEN_PI)), bfloat16(tanf(EIGEN_PI)));
*bf2c3715SXin Li  // VERIFY_IS_APPROX(numext::tan(bfloat16(EIGEN_PI/2)), bfloat16(tanf(EIGEN_PI/2)));
*bf2c3715SXin Li  // VERIFY_IS_APPROX(numext::tan(bfloat16(3*EIGEN_PI/2)), bfloat16(tanf(3*EIGEN_PI/2)));
*bf2c3715SXin Li  VERIFY_IS_APPROX(numext::tan(bfloat16(3.5f)), bfloat16(tanf(3.5f)));
*bf2c3715SXin Li}
*bf2c3715SXin Li
*bf2c3715SXin Livoid test_array()
*bf2c3715SXin Li{
*bf2c3715SXin Li  typedef Array<bfloat16,1,Dynamic> ArrayXh;
*bf2c3715SXin Li  Index size = internal::random<Index>(1,10);
*bf2c3715SXin Li  Index i = internal::random<Index>(0,size-1);
*bf2c3715SXin Li  ArrayXh a1 = ArrayXh::Random(size), a2 = ArrayXh::Random(size);
*bf2c3715SXin Li  VERIFY_IS_APPROX( a1+a1, bfloat16(2)*a1 );
*bf2c3715SXin Li  VERIFY( (a1.abs() >= bfloat16(0)).all() );
*bf2c3715SXin Li  VERIFY_IS_APPROX( (a1*a1).sqrt(), a1.abs() );
*bf2c3715SXin Li
*bf2c3715SXin Li  VERIFY( ((a1.min)(a2) <= (a1.max)(a2)).all() );
*bf2c3715SXin Li  a1(i) = bfloat16(-10.);
*bf2c3715SXin Li  VERIFY_IS_EQUAL( a1.minCoeff(), bfloat16(-10.) );
*bf2c3715SXin Li  a1(i) = bfloat16(10.);
*bf2c3715SXin Li  VERIFY_IS_EQUAL( a1.maxCoeff(), bfloat16(10.) );
*bf2c3715SXin Li
*bf2c3715SXin Li  std::stringstream ss;
*bf2c3715SXin Li  ss << a1;
*bf2c3715SXin Li}
*bf2c3715SXin Li
*bf2c3715SXin Livoid test_product()
*bf2c3715SXin Li{
*bf2c3715SXin Li  typedef Matrix<bfloat16,Dynamic,Dynamic> MatrixXh;
*bf2c3715SXin Li  Index rows  = internal::random<Index>(1,EIGEN_TEST_MAX_SIZE);
*bf2c3715SXin Li  Index cols  = internal::random<Index>(1,EIGEN_TEST_MAX_SIZE);
*bf2c3715SXin Li  Index depth = internal::random<Index>(1,EIGEN_TEST_MAX_SIZE);
*bf2c3715SXin Li  MatrixXh Ah = MatrixXh::Random(rows,depth);
*bf2c3715SXin Li  MatrixXh Bh = MatrixXh::Random(depth,cols);
*bf2c3715SXin Li  MatrixXh Ch = MatrixXh::Random(rows,cols);
*bf2c3715SXin Li  MatrixXf Af = Ah.cast<float>();
*bf2c3715SXin Li  MatrixXf Bf = Bh.cast<float>();
*bf2c3715SXin Li  MatrixXf Cf = Ch.cast<float>();
*bf2c3715SXin Li  VERIFY_IS_APPROX(Ch.noalias()+=Ah*Bh, (Cf.noalias()+=Af*Bf).cast<bfloat16>());
*bf2c3715SXin Li}
*bf2c3715SXin Li
*bf2c3715SXin LiEIGEN_DECLARE_TEST(bfloat16_float)
*bf2c3715SXin Li{
*bf2c3715SXin Li  CALL_SUBTEST(test_numtraits());
*bf2c3715SXin Li  for(int i = 0; i < g_repeat; i++) {
*bf2c3715SXin Li    CALL_SUBTEST(test_conversion());
*bf2c3715SXin Li    CALL_SUBTEST(test_arithmetic());
*bf2c3715SXin Li    CALL_SUBTEST(test_comparison());
*bf2c3715SXin Li    CALL_SUBTEST(test_basic_functions());
*bf2c3715SXin Li    CALL_SUBTEST(test_trigonometric_functions());
*bf2c3715SXin Li    CALL_SUBTEST(test_array());
*bf2c3715SXin Li    CALL_SUBTEST(test_product());
*bf2c3715SXin Li  }
*bf2c3715SXin Li}