pytorch/test/test_reductions.py

*da0073e9SAndroid Build Coastguard Worker# Owner(s): ["module: tests"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport contextlib
*da0073e9SAndroid Build Coastguard Workerimport torch
*da0073e9SAndroid Build Coastguard Workerimport numpy as np
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport math
*da0073e9SAndroid Build Coastguard Workerfrom typing import Dict, List, Sequence
*da0073e9SAndroid Build Coastguard Workerimport random
*da0073e9SAndroid Build Coastguard Workerfrom functools import partial
*da0073e9SAndroid Build Coastguard Workerfrom itertools import product, combinations, permutations
*da0073e9SAndroid Build Coastguard Workerimport warnings
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerfrom torch import inf, nan
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing import make_tensor
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_dtype import (
*da0073e9SAndroid Build Coastguard Worker    all_types_and_complex_and, get_all_math_dtypes, integral_types, complex_types, floating_types_and,
*da0073e9SAndroid Build Coastguard Worker    integral_types_and, floating_and_complex_types_and, all_types_and, all_types,
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_utils import (
*da0073e9SAndroid Build Coastguard Worker    TestCase, run_tests, skipIfNoSciPy, slowTest, torch_to_numpy_dtype_dict,
*da0073e9SAndroid Build Coastguard Worker    parametrize,
*da0073e9SAndroid Build Coastguard Worker    IS_WINDOWS)
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_device_type import (
*da0073e9SAndroid Build Coastguard Worker    OpDTypes, expectedFailureMeta, instantiate_device_type_tests, onlyCPU, dtypes, dtypesIfCUDA, dtypesIfCPU,
*da0073e9SAndroid Build Coastguard Worker    onlyNativeDeviceTypes, onlyCUDA, largeTensorTest, ops, precisionOverride)
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_methods_invocations import (
*da0073e9SAndroid Build Coastguard Worker    ReductionOpInfo, ReductionPythonRefInfo, reduction_ops, reference_masked_ops)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# TODO: replace with make_tensor
*da0073e9SAndroid Build Coastguard Workerdef _generate_input(shape, dtype, device, with_extremal):
*da0073e9SAndroid Build Coastguard Worker    if shape == ():
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        if dtype.is_floating_point or dtype.is_complex:
*da0073e9SAndroid Build Coastguard Worker            # work around torch.randn not being implemented for bfloat16
*da0073e9SAndroid Build Coastguard Worker            if dtype == torch.bfloat16:
*da0073e9SAndroid Build Coastguard Worker                x = torch.randn(*shape, device=device) * random.randint(30, 100)
*da0073e9SAndroid Build Coastguard Worker                x = x.to(torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                x = torch.randn(*shape, dtype=dtype, device=device) * random.randint(30, 100)
*da0073e9SAndroid Build Coastguard Worker            x[torch.randn(*shape) > 0.5] = 0
*da0073e9SAndroid Build Coastguard Worker            if with_extremal and dtype.is_floating_point:
*da0073e9SAndroid Build Coastguard Worker                # Use extremal values
*da0073e9SAndroid Build Coastguard Worker                x[torch.randn(*shape) > 0.5] = float('nan')
*da0073e9SAndroid Build Coastguard Worker                x[torch.randn(*shape) > 0.5] = float('inf')
*da0073e9SAndroid Build Coastguard Worker                x[torch.randn(*shape) > 0.5] = float('-inf')
*da0073e9SAndroid Build Coastguard Worker            elif with_extremal and dtype.is_complex:
*da0073e9SAndroid Build Coastguard Worker                x[torch.randn(*shape) > 0.5] = complex('nan')
*da0073e9SAndroid Build Coastguard Worker                x[torch.randn(*shape) > 0.5] = complex('inf')
*da0073e9SAndroid Build Coastguard Worker                x[torch.randn(*shape) > 0.5] = complex('-inf')
*da0073e9SAndroid Build Coastguard Worker        elif dtype == torch.bool:
*da0073e9SAndroid Build Coastguard Worker            x = torch.zeros(shape, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            x[torch.randn(*shape) > 0.5] = True
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            x = torch.randint(15, 100, shape, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# TODO: replace with make_tensor
*da0073e9SAndroid Build Coastguard Workerdef _rand_shape(dim, min_size, max_size):
*da0073e9SAndroid Build Coastguard Worker    shape = []
*da0073e9SAndroid Build Coastguard Worker    for i in range(dim):
*da0073e9SAndroid Build Coastguard Worker        shape.append(random.randint(min_size, max_size))
*da0073e9SAndroid Build Coastguard Worker    return tuple(shape)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _reduced_shape(shape, dim=None, keepdim=False):
*da0073e9SAndroid Build Coastguard Worker    """Computes the expected reduced shape given dim and keepdim
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        shape: The shape to reduce
*da0073e9SAndroid Build Coastguard Worker        dim : The dimensions to reduce
*da0073e9SAndroid Build Coastguard Worker        keepdim: If true, reduced dimensions have size 1 in the reduced shape,
*da0073e9SAndroid Build Coastguard Worker            otherwise they are removed from the reduced shape.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Returns:
*da0073e9SAndroid Build Coastguard Worker        The reduced shape
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    if dim is None:
*da0073e9SAndroid Build Coastguard Worker        return [1] * len(shape) if keepdim else []
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Wrap negative dims
*da0073e9SAndroid Build Coastguard Worker    dim = dim if isinstance(dim, Sequence) else [dim]
*da0073e9SAndroid Build Coastguard Worker    dim = {i if i >= 0 else len(shape) + i for i in dim}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    result = []
*da0073e9SAndroid Build Coastguard Worker    for i, size in enumerate(shape):
*da0073e9SAndroid Build Coastguard Worker        if i not in dim:
*da0073e9SAndroid Build Coastguard Worker            result.append(size)
*da0073e9SAndroid Build Coastguard Worker        elif keepdim:
*da0073e9SAndroid Build Coastguard Worker            result.append(1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return result
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestReductions(TestCase):
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    ###########################################################################
*da0073e9SAndroid Build Coastguard Worker    # ReductionOpInfo unit tests
*da0073e9SAndroid Build Coastguard Worker    ###########################################################################
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_dim_keepdim(self, op: ReductionOpInfo, device, *, ndim, **dim_keepdim):
*da0073e9SAndroid Build Coastguard Worker        """Tests output shape for input with ndim and dim and keepdim kwargs"""
*da0073e9SAndroid Build Coastguard Worker        shape = torch.randint(2, 5, (ndim,)).tolist()
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor(shape, dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker        args, kwargs = next(op.generate_args_kwargs(t, **dim_keepdim))
*da0073e9SAndroid Build Coastguard Worker        result = op(t, *args, **dim_keepdim, **kwargs)
*da0073e9SAndroid Build Coastguard Worker        expected_shape = _reduced_shape(shape, **dim_keepdim)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(result.shape, expected_shape, f"""
*da0073e9SAndroid Build Coastguard Worker        expected output shape to be {expected_shape} but got {list(result.shape)}
*da0073e9SAndroid Build Coastguard Worker        for input shape {shape} and {dim_keepdim}
*da0073e9SAndroid Build Coastguard Worker        """)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO(@heitorschueroff) combine cases with and without keepdim once
*da0073e9SAndroid Build Coastguard Worker    # there's support for a @parametrize decorator.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops, dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_default(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that the default dim reduces all dimensions."""
*da0073e9SAndroid Build Coastguard Worker        for ndim in range(3):
*da0073e9SAndroid Build Coastguard Worker            self._test_dim_keepdim(op, device, ndim=ndim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops, dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_default_keepdim(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that the default dim, when keepdim=True, reduces all dimensions to size 1."""
*da0073e9SAndroid Build Coastguard Worker        for ndim in range(3):
*da0073e9SAndroid Build Coastguard Worker            self._test_dim_keepdim(op, device, ndim=ndim, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops, dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_none(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that dim=None reduces all dimensions."""
*da0073e9SAndroid Build Coastguard Worker        for ndim in range(3):
*da0073e9SAndroid Build Coastguard Worker            self._test_dim_keepdim(op, device, ndim=ndim, dim=None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops, dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_none_keepdim(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that dim=None, when keepdim=True, reduces all dimensions to size 1."""
*da0073e9SAndroid Build Coastguard Worker        for ndim in range(3):
*da0073e9SAndroid Build Coastguard Worker            self._test_dim_keepdim(op, device, ndim=ndim, dim=None, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops, dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_single(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that dim=i reduces dimension i."""
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=0, dim=0)
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=1, dim=0)
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=2, dim=-1)
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=3, dim=1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops, dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_single_keepdim(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that dim=i, when keepdim=True, reduces dimension i to size 1."""
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=0, dim=0, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=1, dim=0, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=2, dim=-1, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=3, dim=1, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.supports_multiple_dims, reduction_ops), dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_empty(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that dim=[] is a no-op"""
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=0, dim=[])
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=2, dim=[])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.supports_multiple_dims, reduction_ops), dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_empty_keepdim(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that dim=[], when keepdim=True, is a no-op"""
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=0, dim=[], keepdim=True)
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=2, dim=[], keepdim=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.supports_multiple_dims, reduction_ops), dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_multi(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that dim=[i, j, ...] reduces dimensions i, j, ...."""
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=1, dim=[0])
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=3, dim=[0, 2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.supports_multiple_dims, reduction_ops), dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_multi_keepdim(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that dim=[i, j, ...], when keepdim=True, reduces dimensions i, j, .... to size 1."""
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=1, dim=[0], keepdim=True)
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=3, dim=[0, 2], keepdim=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.supports_multiple_dims, reduction_ops), dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_multi_unsorted(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that operator correctly handles unsorted dim list."""
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=4, dim=[3, 0, 2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.supports_multiple_dims, reduction_ops), dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_multi_unsorted_keepdim(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that operator correctly handles unsorted dim list when keepdim=True."""
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_keepdim(op, device, ndim=4, dim=[3, 0, 2], keepdim=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.supports_multiple_dims, reduction_ops), dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_multi_duplicate(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that an error is raised if dim has duplicate entries."""
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker            self._test_dim_keepdim(op, device, ndim=3, dim=[0, 1, 1, 2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: not op.supports_multiple_dims, reduction_ops), dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_multi_unsupported(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that ops claiming to not support multi dim actually don't."""
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(TypeError):
*da0073e9SAndroid Build Coastguard Worker            self._test_dim_keepdim(op, device, ndim=3, dim=[0, 2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops, dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_offbounds(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that passing an off-bounds dim throws"""
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(IndexError):
*da0073e9SAndroid Build Coastguard Worker            self._test_dim_keepdim(op, device, ndim=2, dim=2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops, dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_ndim_limit(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that an exception is raised when reducing a tensor with more
*da0073e9SAndroid Build Coastguard Worker        than 64 dims along some specific dimensions. dim=None is ok"""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor([1] * 65, dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "only tensors with up to 64 dims are supported"):
*da0073e9SAndroid Build Coastguard Worker            op(t, dim=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.identity is not None, reduction_ops), dtypes=OpDTypes.supported)
*da0073e9SAndroid Build Coastguard Worker    def test_identity(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that the identity value is an identity for the operator"""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((10,), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        t[1::2] = op.identity
*da0073e9SAndroid Build Coastguard Worker        args, kwargs = next(op.generate_args_kwargs(t))
*da0073e9SAndroid Build Coastguard Worker        result = op(t[::2], *args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker        result_with_identity = op(t, *args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(result, result_with_identity, """
*da0073e9SAndroid Build Coastguard Worker        Adding identity value to the input tensor should not change the result.
*da0073e9SAndroid Build Coastguard Worker        """)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO(@heitorschueroff) Update these to use the nan_policy kwarg once
*da0073e9SAndroid Build Coastguard Worker    # it is added to reduction operators.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.nan_policy == 'propagate', reduction_ops), dtypes=OpDTypes.supported,
*da0073e9SAndroid Build Coastguard Worker         allowed_dtypes=floating_and_complex_types_and(torch.bfloat16, torch.float16))
*da0073e9SAndroid Build Coastguard Worker    def test_nan_policy_propagate(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that nan is propagated to the output by default"""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((5,), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        t[2] = torch.nan
*da0073e9SAndroid Build Coastguard Worker        args, kwargs = next(op.generate_args_kwargs(t))
*da0073e9SAndroid Build Coastguard Worker        result = op(t, *args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(result.isnan())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.nan_policy == 'omit', reduction_ops), dtypes=OpDTypes.supported,
*da0073e9SAndroid Build Coastguard Worker         allowed_dtypes=floating_and_complex_types_and(torch.bfloat16, torch.float16))
*da0073e9SAndroid Build Coastguard Worker    def test_nan_policy_omit(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that NaN values do not affect the result."""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((10,), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        t[1::2] = torch.nan
*da0073e9SAndroid Build Coastguard Worker        args, kwargs = next(op.generate_args_kwargs(t))
*da0073e9SAndroid Build Coastguard Worker        result = op(t[::2], *args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker        result_with_nan = op(t, *args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(result, result_with_nan)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops, dtypes=OpDTypes.supported)
*da0073e9SAndroid Build Coastguard Worker    def test_result_dtype(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that the result has the correct dtype"""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((5,), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        args, kwargs = next(op.generate_args_kwargs(t))
*da0073e9SAndroid Build Coastguard Worker        result: torch.Tensor = op(t, *args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker        is_integral = dtype in integral_types_and(torch.bool)
*da0073e9SAndroid Build Coastguard Worker        if op.promotes_int_to_float and is_integral:
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(torch.is_floating_point(result))
*da0073e9SAndroid Build Coastguard Worker        elif op.promotes_int_to_int64 and is_integral:
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(result.dtype, torch.int64)
*da0073e9SAndroid Build Coastguard Worker        elif op.result_dtype is not None:
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(result.dtype, op.result_dtype)
*da0073e9SAndroid Build Coastguard Worker        elif op.complex_to_real:
*da0073e9SAndroid Build Coastguard Worker            _complex_to_real_dtype_map = {
*da0073e9SAndroid Build Coastguard Worker                torch.complex128: torch.float64,
*da0073e9SAndroid Build Coastguard Worker                torch.complex64: torch.float32,
*da0073e9SAndroid Build Coastguard Worker                torch.complex32: torch.float16,
*da0073e9SAndroid Build Coastguard Worker            }
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(result.dtype, _complex_to_real_dtype_map.get(dtype, dtype))
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(result.dtype, dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops, dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_empty_tensor_empty_slice(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests for consistent behavior when reducing over an empty slice.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        The rules for reducing over an empty slice are as follows:
*da0073e9SAndroid Build Coastguard Worker            - Return the identity value if the operator has one
*da0073e9SAndroid Build Coastguard Worker            - Otherwise, return NaN if the operator promotes integral dtype to
*da0073e9SAndroid Build Coastguard Worker              floating point dtypes.
*da0073e9SAndroid Build Coastguard Worker            - Otherwise, raise an error
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        See discussion here https://github.com/pytorch/pytorch/issues/61901
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((0, 2, 3), dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker        for dim in [0] + [[0, 2]] if op.supports_multiple_dims else []:
*da0073e9SAndroid Build Coastguard Worker            args, kwargs = next(op.generate_args_kwargs(t, dim=dim))
*da0073e9SAndroid Build Coastguard Worker            if op.identity is not None:
*da0073e9SAndroid Build Coastguard Worker                # Reducing along empty slice should return identity
*da0073e9SAndroid Build Coastguard Worker                result = op(t, *args, dim=dim, **kwargs)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(result, torch.full_like(result, op.identity))
*da0073e9SAndroid Build Coastguard Worker            elif op.promotes_int_to_float:
*da0073e9SAndroid Build Coastguard Worker                # Reducing along empty slice should return NaN
*da0073e9SAndroid Build Coastguard Worker                result = op(t, *args, dim=dim, **kwargs)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(result, torch.full_like(result, torch.nan))
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                # Reducing along empty slice should raise an error
*da0073e9SAndroid Build Coastguard Worker                if isinstance(op, ReductionPythonRefInfo):
*da0073e9SAndroid Build Coastguard Worker                    # ref reductions throw RuntimeError for this
*da0073e9SAndroid Build Coastguard Worker                    with self.assertRaises(RuntimeError):
*da0073e9SAndroid Build Coastguard Worker                        op(t, *args, dim=dim, **kwargs)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    with self.assertRaises(IndexError):
*da0073e9SAndroid Build Coastguard Worker                        op(t, *args, dim=dim, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops, dtypes=OpDTypes.none)
*da0073e9SAndroid Build Coastguard Worker    def test_empty_tensor_nonempty_slice(self, device, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests that reducing a nonempty slice of an empty tensor returns an
*da0073e9SAndroid Build Coastguard Worker        empty tensor with the dimensions reduced."""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((0, 2, 3), dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker        for dim in [1] + [[1, 2]] if op.supports_multiple_dims else []:
*da0073e9SAndroid Build Coastguard Worker            args, kwargs = next(op.generate_args_kwargs(t, dim=dim))
*da0073e9SAndroid Build Coastguard Worker            result = op(t, *args, dim=dim, **kwargs)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(result.shape, _reduced_shape(t.shape, dim))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_noncontiguous(self, op: ReductionOpInfo, t: torch.Tensor, **reduction_kwargs):
*da0073e9SAndroid Build Coastguard Worker        """Helper method to test noncontiguous input tensors."""
*da0073e9SAndroid Build Coastguard Worker        assert not t.is_contiguous()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        t_contig = t.contiguous()
*da0073e9SAndroid Build Coastguard Worker        for args, kwargs in op.generate_args_kwargs(t_contig, **reduction_kwargs):
*da0073e9SAndroid Build Coastguard Worker            kwargs.update(reduction_kwargs)
*da0073e9SAndroid Build Coastguard Worker            result = op(t, *args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker            expected = op(t_contig, *args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(result, expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops)
*da0073e9SAndroid Build Coastguard Worker    def test_noncontiguous_innermost(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests reducing along noncontiguous innermost dimension."""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((10, 10), dtype=dtype, device=device, low=-1, high=1)
*da0073e9SAndroid Build Coastguard Worker        self._test_noncontiguous(op, t[:, ::2], dim=1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops)
*da0073e9SAndroid Build Coastguard Worker    def test_noncontiguous_outermost(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests reducing along noncontiguous outermost dimension."""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((10, 10), dtype=dtype, device=device, low=-1, high=1)
*da0073e9SAndroid Build Coastguard Worker        self._test_noncontiguous(op, t[::2, :], dim=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops)
*da0073e9SAndroid Build Coastguard Worker    def test_noncontiguous_all(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests reducing all dimensions of a noncontiguous tensor."""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((5, 5, 5), dtype=dtype, device=device, low=-1, high=1)
*da0073e9SAndroid Build Coastguard Worker        self._test_noncontiguous(op, t[::2, ::3, 1:-1:2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops)
*da0073e9SAndroid Build Coastguard Worker    def test_noncontiguous_transposed(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests reducing a transposed tensor."""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((5, 5), dtype=dtype, device=device, low=-1, high=1)
*da0073e9SAndroid Build Coastguard Worker        self._test_noncontiguous(op, t.T)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reduction_ops)
*da0073e9SAndroid Build Coastguard Worker    def test_noncontiguous_expanded(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Tests reducing a tensor with expanded singleton dimensions."""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((2, 3), dtype=dtype, device=device, low=-1, high=1)
*da0073e9SAndroid Build Coastguard Worker        self._test_noncontiguous(op, t.unsqueeze(1).expand(-1, 5, -1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # NumPy does not support BFloat16 so we don't test that against reference
*da0073e9SAndroid Build Coastguard Worker    # implementations. We also don't compare dtypes or test for different
*da0073e9SAndroid Build Coastguard Worker    # keepdim because we already have other tests covering those.
*da0073e9SAndroid Build Coastguard Worker    # The test_reference_testing in test_ops.py only uses the samples from
*da0073e9SAndroid Build Coastguard Worker    # sample_inputs_func which do not test as exhaustively as these tests.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_ref(self, op: ReductionOpInfo, t: torch.Tensor, **reduction_kwargs):
*da0073e9SAndroid Build Coastguard Worker        """Compares op against op.ref for the given input and reduction kwargs"""
*da0073e9SAndroid Build Coastguard Worker        for args, kwargs in op.generate_args_kwargs(t, **reduction_kwargs):
*da0073e9SAndroid Build Coastguard Worker            kwargs.update(reduction_kwargs)
*da0073e9SAndroid Build Coastguard Worker            result = op(t, *args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker            expected = op.ref(t.detach().cpu().numpy(), *args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(result, expected, exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.ref is not None, reduction_ops),
*da0073e9SAndroid Build Coastguard Worker         allowed_dtypes=all_types_and_complex_and(torch.half, torch.bool))
*da0073e9SAndroid Build Coastguard Worker    def test_ref_scalar_input(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Compares op against reference for scalar input tensors"""
*da0073e9SAndroid Build Coastguard Worker        self._test_ref(op, make_tensor([], dtype=dtype, device=device))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.ref is not None, reduction_ops),
*da0073e9SAndroid Build Coastguard Worker         allowed_dtypes=all_types_and_complex_and(torch.half, torch.bool))
*da0073e9SAndroid Build Coastguard Worker    def test_ref_small_input(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Compares op against reference for small input tensors"""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((5, 3, 4, 2), dtype=dtype, device=device, low=-2, high=2, exclude_zero=True)
*da0073e9SAndroid Build Coastguard Worker        self._test_ref(op, t)
*da0073e9SAndroid Build Coastguard Worker        for dim in [0, 1, 3] + ([[0, 2], [1, 3]] if op.supports_multiple_dims else []):
*da0073e9SAndroid Build Coastguard Worker            self._test_ref(op, t, dim=dim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.ref is not None, reduction_ops),
*da0073e9SAndroid Build Coastguard Worker         allowed_dtypes=[torch.float64])
*da0073e9SAndroid Build Coastguard Worker    def test_ref_large_input_1D(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Compares op against reference for a large 1D input tensor to check stability"""
*da0073e9SAndroid Build Coastguard Worker        self._test_ref(op, make_tensor((2 ** 20,), dtype=dtype, device=device, low=-1, high=1, exclude_zero=True))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.ref is not None, reduction_ops),
*da0073e9SAndroid Build Coastguard Worker         allowed_dtypes=[torch.float64])
*da0073e9SAndroid Build Coastguard Worker    def test_ref_large_input_2D(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Compares op against reference for a large 2D input tensor to test parallelism"""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((32, 2 ** 16), dtype=dtype, device=device, low=-1, high=1, exclude_zero=True)
*da0073e9SAndroid Build Coastguard Worker        self._test_ref(op, t, dim=1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @largeTensorTest("8gb")
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.ref is not None, reduction_ops),
*da0073e9SAndroid Build Coastguard Worker         allowed_dtypes=[torch.float64])
*da0073e9SAndroid Build Coastguard Worker    def test_ref_large_input_64bit_indexing(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Compares op against reference for a very large input tensor that requires 64 bit indexing"""
*da0073e9SAndroid Build Coastguard Worker        self._test_ref(op, make_tensor((275000000,), dtype=dtype, device=device, low=-1, high=1, exclude_zero=True))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.ref is not None, reduction_ops),
*da0073e9SAndroid Build Coastguard Worker         allowed_dtypes=all_types_and_complex_and(torch.half, torch.bool))
*da0073e9SAndroid Build Coastguard Worker    def test_ref_duplicate_values(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Compares op against reference for input tensors with duplicate values"""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((4, 4), dtype=dtype, device=device, low=-2, high=2, exclude_zero=True)
*da0073e9SAndroid Build Coastguard Worker        t[::2, ::2] = t[1::2, 1::2]
*da0073e9SAndroid Build Coastguard Worker        self._test_ref(op, t)
*da0073e9SAndroid Build Coastguard Worker        self._test_ref(op, t, dim=0)
*da0073e9SAndroid Build Coastguard Worker        self._test_ref(op, t, dim=1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(filter(lambda op: op.ref is not None, reduction_ops),
*da0073e9SAndroid Build Coastguard Worker         allowed_dtypes=[torch.float32, torch.complex64])
*da0073e9SAndroid Build Coastguard Worker    def test_ref_extremal_values(self, device, dtype, op: ReductionOpInfo):
*da0073e9SAndroid Build Coastguard Worker        """Compares op against reference for input tensors with extremal values"""
*da0073e9SAndroid Build Coastguard Worker        t = make_tensor((5,), dtype=dtype, device=device, exclude_zero=True)
*da0073e9SAndroid Build Coastguard Worker        extremals = [0, 1, nan, inf, -inf]
*da0073e9SAndroid Build Coastguard Worker        for extremal in extremals:
*da0073e9SAndroid Build Coastguard Worker            t[2] = extremal
*da0073e9SAndroid Build Coastguard Worker            self._test_ref(op, t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    ###########################################################################
*da0073e9SAndroid Build Coastguard Worker    # TODO: Legacy tests - port to ReductionOpInfo
*da0073e9SAndroid Build Coastguard Worker    ###########################################################################
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_var_unbiased(self, device):
*da0073e9SAndroid Build Coastguard Worker        tensor = torch.randn(100, device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.var(0), tensor.var(0, unbiased=True))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.var(), tensor.var(unbiased=True))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.var(unbiased=False), tensor.var(0, unbiased=False))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tensor = torch.tensor([1.0, 2.0], device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.var(unbiased=True), 0.5)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.var(unbiased=False), 0.25)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tensor = torch.tensor([1.0, 2.0, 3.0], device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.var(unbiased=True), 1.0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.var(unbiased=False), 2.0 / 3.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tensor = torch.randn(100, device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.std(0), tensor.std(0, unbiased=True))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.std(), tensor.std(unbiased=True))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.std(unbiased=False), tensor.std(0, unbiased=False))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_var_stability(self, device):
*da0073e9SAndroid Build Coastguard Worker        tensor = torch.tensor([2281.5, 2281.25], device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.var(dim=0), 0.03125)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.var(), 0.03125)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_sum_dim_reduction_uint8_overflow(self, device):
*da0073e9SAndroid Build Coastguard Worker        example = [[-1, 2, 1], [5, 3, 6]]
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(example, dtype=torch.uint8, device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.sum(dtype=torch.uint8).item(), 16)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.sum(0, dtype=torch.uint8), torch.tensor([4, 5, 7], dtype=torch.uint8, device=device))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.sum(1, dtype=torch.uint8), torch.tensor([2, 14], dtype=torch.uint8, device=device))
*da0073e9SAndroid Build Coastguard Worker        y = torch.tensor(example, dtype=torch.uint8, device=device)
*da0073e9SAndroid Build Coastguard Worker        torch.sum(x, 0, out=y)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.sum(0, dtype=torch.uint8), y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_dim_reduction_less_than_64(self, device):
*da0073e9SAndroid Build Coastguard Worker        sizes = [1] * 65
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(sizes, device=device)
*da0073e9SAndroid Build Coastguard Worker        ops = [torch.mean, torch.sum, torch.nansum, torch.std, torch.logsumexp, torch.std, torch.var,
*da0073e9SAndroid Build Coastguard Worker               torch.norm]
*da0073e9SAndroid Build Coastguard Worker        for op in ops:
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "only tensors with up to 64 dims are supported"):
*da0073e9SAndroid Build Coastguard Worker                op(x, dim=64)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, "only tensors with up to 64 dims are supported"):
*da0073e9SAndroid Build Coastguard Worker                op(x, dim=-1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker    def test_dim_reduction_lastdim(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(3, 5, 40, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        x = x[:, :, 0:40:2]
*da0073e9SAndroid Build Coastguard Worker        x2 = x.contiguous()
*da0073e9SAndroid Build Coastguard Worker        ops = [torch.norm, torch.argmax, torch.argmin]
*da0073e9SAndroid Build Coastguard Worker        for op in ops:
*da0073e9SAndroid Build Coastguard Worker            y = op(x, dim=-1)
*da0073e9SAndroid Build Coastguard Worker            y2 = op(x2, dim=-1)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(y, y2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfNoSciPy
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float32, torch.double, torch.complex64, torch.complex128)
*da0073e9SAndroid Build Coastguard Worker    def test_logsumexp(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        from scipy.special import logsumexp
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(5, 4, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        # torch.exp(complex(inf, 0)) yields inf+nan*j instead of inf+0*j on CPU which disagrees with CUDA, C++ std::exp,
*da0073e9SAndroid Build Coastguard Worker        # numpy and scipy. Skip inf testing on CPU. Related to https://github.com/pytorch/pytorch/issues/95740
*da0073e9SAndroid Build Coastguard Worker        if torch.device(device) != torch.device('cpu'):
*da0073e9SAndroid Build Coastguard Worker            a[0, 0] = inf
*da0073e9SAndroid Build Coastguard Worker        a[1, :] = -inf
*da0073e9SAndroid Build Coastguard Worker        actual = a.logsumexp(1)
*da0073e9SAndroid Build Coastguard Worker        expected = logsumexp(a.cpu().numpy(), 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected.shape, actual.shape)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected, actual)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check that out is actually inplace
*da0073e9SAndroid Build Coastguard Worker        b = torch.zeros(5, 2, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        c = b[:, 0]
*da0073e9SAndroid Build Coastguard Worker        torch.logsumexp(a, 1, out=c)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected, b[:, 0])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfNoSciPy
*da0073e9SAndroid Build Coastguard Worker    def test_logsumexp_integral_promotion(self, device):
*da0073e9SAndroid Build Coastguard Worker        from scipy.special import logsumexp
*da0073e9SAndroid Build Coastguard Worker        # check integral inputs is promoted to floating point
*da0073e9SAndroid Build Coastguard Worker        e = torch.randint(-100, 100, [5, 4], device=device)
*da0073e9SAndroid Build Coastguard Worker        actual = e.logsumexp(1).to(torch.float64)
*da0073e9SAndroid Build Coastguard Worker        expected = logsumexp(e.cpu().numpy(), 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected.shape, actual.shape)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected, actual)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfNoSciPy
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.complex64, torch.complex128)
*da0073e9SAndroid Build Coastguard Worker    def test_logcumsumexp_complex(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        # logcumsumexp is a more precise way to compute than ``log(cumsum(exp(a)))``
*da0073e9SAndroid Build Coastguard Worker        # and faster than ``[log(sum(exp(a[:i]))) for i in range(a.shape[0])]``
*da0073e9SAndroid Build Coastguard Worker        # the for-loop above should produce similar precision as logcumsumexp (it's just slower),
*da0073e9SAndroid Build Coastguard Worker        # so it can be used as the expected values to check our computation
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # using logsumexp from scipy because by the time of writing this test code,
*da0073e9SAndroid Build Coastguard Worker        # torch.logsumexp has not been implemented for complex numbers
*da0073e9SAndroid Build Coastguard Worker        from scipy.special import logsumexp
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def zero_out_neg_inf(t):
*da0073e9SAndroid Build Coastguard Worker            t = t.clone()
*da0073e9SAndroid Build Coastguard Worker            idx = torch.logical_and(~(torch.isfinite(t)), torch.real(t) < 0)
*da0073e9SAndroid Build Coastguard Worker            t[idx] = torch.real(t[idx]).to(t.dtype)
*da0073e9SAndroid Build Coastguard Worker            return t
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def standardize_phase(t):
*da0073e9SAndroid Build Coastguard Worker            t = torch.real(t) + 1j * (torch.imag(t) % (2 * np.pi))
*da0073e9SAndroid Build Coastguard Worker            return t
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def logcumsumexp_slow(a, dim):
*da0073e9SAndroid Build Coastguard Worker            res_lst = []
*da0073e9SAndroid Build Coastguard Worker            for i in range(a.size(dim)):
*da0073e9SAndroid Build Coastguard Worker                index = [slice(None, None, None) for _ in range(a.ndim)]
*da0073e9SAndroid Build Coastguard Worker                index[dim] = slice(None, i + 1, None)
*da0073e9SAndroid Build Coastguard Worker                a_inp = a[tuple(index)]
*da0073e9SAndroid Build Coastguard Worker                res_lst.append(logsumexp(a_inp.cpu().numpy(), axis=dim, keepdims=True))
*da0073e9SAndroid Build Coastguard Worker            res = np.concatenate(res_lst, axis=dim)
*da0073e9SAndroid Build Coastguard Worker            return torch.as_tensor(res)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def compare_logcumsumexp(a, expected=None):
*da0073e9SAndroid Build Coastguard Worker            for i in range(a.ndim):
*da0073e9SAndroid Build Coastguard Worker                actual = torch.logcumsumexp(a, dim=i)
*da0073e9SAndroid Build Coastguard Worker                # if the expected is not given, then revert to scipy's logsumexp
*da0073e9SAndroid Build Coastguard Worker                if expected is None:
*da0073e9SAndroid Build Coastguard Worker                    expected2 = logcumsumexp_slow(a, dim=i)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    expected2 = expected
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # move the imaginary values to (0, 2 * pi)
*da0073e9SAndroid Build Coastguard Worker                actual = standardize_phase(actual)
*da0073e9SAndroid Build Coastguard Worker                expected2 = standardize_phase(expected2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # zeroing the imaginary part of the element if the real part is -inf
*da0073e9SAndroid Build Coastguard Worker                # as the imaginary part cannot be determined exactly and it does not
*da0073e9SAndroid Build Coastguard Worker                # really matter if we take the exp of the output
*da0073e9SAndroid Build Coastguard Worker                actual = zero_out_neg_inf(actual)
*da0073e9SAndroid Build Coastguard Worker                expected2 = zero_out_neg_inf(expected2)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(expected2.shape, actual.shape)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(expected2, actual)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # randomly specified values
*da0073e9SAndroid Build Coastguard Worker        # in this case, scipy.logsumexp should be enough
*da0073e9SAndroid Build Coastguard Worker        a1 = torch.randn((5, 10), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        compare_logcumsumexp(a1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test with some non-normal values
*da0073e9SAndroid Build Coastguard Worker        a2 = torch.tensor([1e3 + 0j, 1e-18 + 1e4j, 1e2 + 1e-8j], dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        compare_logcumsumexp(a2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # handle special case involving infinites and nans
*da0073e9SAndroid Build Coastguard Worker        # here we don't use scipy.logsumexp as it gives confusing answer on
*da0073e9SAndroid Build Coastguard Worker        # some inf cases
*da0073e9SAndroid Build Coastguard Worker        # see here:
*da0073e9SAndroid Build Coastguard Worker        inf = float('inf')
*da0073e9SAndroid Build Coastguard Worker        nan = float('nan')
*da0073e9SAndroid Build Coastguard Worker        a3_input = torch.tensor([
*da0073e9SAndroid Build Coastguard Worker            -inf + 4j,
*da0073e9SAndroid Build Coastguard Worker            -inf + 1j,
*da0073e9SAndroid Build Coastguard Worker            1.2 + 2.1j,
*da0073e9SAndroid Build Coastguard Worker            1e10 + 1e20j,
*da0073e9SAndroid Build Coastguard Worker            inf + 0j,
*da0073e9SAndroid Build Coastguard Worker            inf + 1j,
*da0073e9SAndroid Build Coastguard Worker            inf + 3j,
*da0073e9SAndroid Build Coastguard Worker            nan + 2j,
*da0073e9SAndroid Build Coastguard Worker        ])
*da0073e9SAndroid Build Coastguard Worker        a3_expected = torch.tensor([
*da0073e9SAndroid Build Coastguard Worker            -inf + 0j,
*da0073e9SAndroid Build Coastguard Worker            -inf + 0j,
*da0073e9SAndroid Build Coastguard Worker            1.2 + 2.1j,
*da0073e9SAndroid Build Coastguard Worker            1e10 + 1e20j,
*da0073e9SAndroid Build Coastguard Worker            inf + 0j,  # scipy's logsumexp gives (inf + 0.7853982j) here, unclear why
*da0073e9SAndroid Build Coastguard Worker            inf + (np.pi / 4) * 1j,  # the imaginary part thanks to some weird behaviour of log(inf + infj)
*da0073e9SAndroid Build Coastguard Worker            complex(inf, nan),
*da0073e9SAndroid Build Coastguard Worker            complex(nan, nan),
*da0073e9SAndroid Build Coastguard Worker        ])
*da0073e9SAndroid Build Coastguard Worker        # windows give strange results on the second-to-last results where it gives inf + pi/4 j
*da0073e9SAndroid Build Coastguard Worker        # instead of inf + nan j
*da0073e9SAndroid Build Coastguard Worker        if not IS_WINDOWS:
*da0073e9SAndroid Build Coastguard Worker            compare_logcumsumexp(a3_input, a3_expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a4_input = torch.tensor([
*da0073e9SAndroid Build Coastguard Worker            complex(-inf, inf),
*da0073e9SAndroid Build Coastguard Worker            complex(-inf, inf),
*da0073e9SAndroid Build Coastguard Worker            -inf + 1j,
*da0073e9SAndroid Build Coastguard Worker            1.2 + 2.1j,
*da0073e9SAndroid Build Coastguard Worker            complex(2.4, inf),
*da0073e9SAndroid Build Coastguard Worker        ])
*da0073e9SAndroid Build Coastguard Worker        a4_expected = torch.tensor([
*da0073e9SAndroid Build Coastguard Worker            -inf + 0j,
*da0073e9SAndroid Build Coastguard Worker            -inf + 0j,
*da0073e9SAndroid Build Coastguard Worker            -inf + 0j,
*da0073e9SAndroid Build Coastguard Worker            1.2 + 2.1j,
*da0073e9SAndroid Build Coastguard Worker            complex(nan, nan),
*da0073e9SAndroid Build Coastguard Worker        ])
*da0073e9SAndroid Build Coastguard Worker        if not IS_WINDOWS:
*da0073e9SAndroid Build Coastguard Worker            compare_logcumsumexp(a4_input, a4_expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_sum_parallel(self, device):
*da0073e9SAndroid Build Coastguard Worker        # To use parallel branches we'll need to compare on tensors
*da0073e9SAndroid Build Coastguard Worker        # that are relatively large. Even if this is run on a single
*da0073e9SAndroid Build Coastguard Worker        # core machine these tests will still give you signal on
*da0073e9SAndroid Build Coastguard Worker        # the correctness
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def _run_test(size):
*da0073e9SAndroid Build Coastguard Worker            for dim in range(len(size) + 1):
*da0073e9SAndroid Build Coastguard Worker                nv = np.round(np.random.rand(*size))  # 0s and 1s
*da0073e9SAndroid Build Coastguard Worker                tv = torch.from_numpy(nv)
*da0073e9SAndroid Build Coastguard Worker                # Parallelisim is only used if numel is
*da0073e9SAndroid Build Coastguard Worker                # larger than grainsize defined in Parallel.h
*da0073e9SAndroid Build Coastguard Worker                self.assertTrue(tv.numel() > 32768)
*da0073e9SAndroid Build Coastguard Worker                if dim == len(size):
*da0073e9SAndroid Build Coastguard Worker                    nvs = nv.sum()
*da0073e9SAndroid Build Coastguard Worker                    tvs = tv.sum()
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    nvs = nv.sum(dim)
*da0073e9SAndroid Build Coastguard Worker                    tvs = tv.sum(dim)
*da0073e9SAndroid Build Coastguard Worker                diff = np.abs(nvs - tvs.numpy()).sum()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(diff, 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        _run_test([2, 3, 3, 3, 3, 2, 2, 3, 2, 3, 2, 3, 3])
*da0073e9SAndroid Build Coastguard Worker        _run_test([4, 4, 4, 4, 4, 4, 4, 4, 4, 4])
*da0073e9SAndroid Build Coastguard Worker        _run_test([1, 32 * 8 * 32 * 8])
*da0073e9SAndroid Build Coastguard Worker        _run_test([1, 32770])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: kill map2_ (and similar) uses and update to compare with NumPy
*da0073e9SAndroid Build Coastguard Worker    # only works on CPU since this uses map2_, which is only supported on CPU
*da0073e9SAndroid Build Coastguard Worker    def _testCSelection(self, torchfn, mathfn):
*da0073e9SAndroid Build Coastguard Worker        # Two tensors
*da0073e9SAndroid Build Coastguard Worker        size = (100, 100)
*da0073e9SAndroid Build Coastguard Worker        a = torch.rand(*size)
*da0073e9SAndroid Build Coastguard Worker        b = torch.rand(*size)
*da0073e9SAndroid Build Coastguard Worker        c = torchfn(a, b)
*da0073e9SAndroid Build Coastguard Worker        expected_c = torch.zeros(*size)
*da0073e9SAndroid Build Coastguard Worker        expected_c.map2_(a, b, lambda _, a, b: mathfn(a, b))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_c, c, atol=0, rtol=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_max_elementwise(self, device):
*da0073e9SAndroid Build Coastguard Worker        self._testCSelection(torch.max, max)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_min_elementwise(self, device):
*da0073e9SAndroid Build Coastguard Worker        self._testCSelection(torch.min, min)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_all_any(self, device):
*da0073e9SAndroid Build Coastguard Worker        def test(size):
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(*size, device=device).byte()
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(x.all())
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(x.any())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x[3] = 0
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(x.all())
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(x.any())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x.zero_()
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(x.all())
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(x.any())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x.fill_(2)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(x.all())
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(x.any())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(*size, device=device).bool()
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(x.all())
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(x.any())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x[3] = False
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(x.all())
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(x.any())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test((10,))
*da0073e9SAndroid Build Coastguard Worker        test((5, 5))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_all_any_with_dim(self, device):
*da0073e9SAndroid Build Coastguard Worker        def test(x):
*da0073e9SAndroid Build Coastguard Worker            r1 = x.prod(dim=0, keepdim=False).byte()
*da0073e9SAndroid Build Coastguard Worker            r2 = x.all(dim=0, keepdim=False)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(r1.shape, r2.shape)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue((r1 == r2).all())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            r3 = x.sum(dim=1, keepdim=True).clamp(0, 1).byte()
*da0073e9SAndroid Build Coastguard Worker            r4 = x.any(dim=1, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(r3.shape, r4.shape)
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue((r3 == r4).all())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test(torch.tensor([[0, 0, 0],
*da0073e9SAndroid Build Coastguard Worker                           [0, 0, 1],
*da0073e9SAndroid Build Coastguard Worker                           [0, 1, 1],
*da0073e9SAndroid Build Coastguard Worker                           [1, 1, 1]], device=device, dtype=torch.uint8))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_numpy_named_args(self, device):
*da0073e9SAndroid Build Coastguard Worker        x1 = torch.randn(10, device=device)
*da0073e9SAndroid Build Coastguard Worker        x2 = torch.randn(10, device=device)
*da0073e9SAndroid Build Coastguard Worker        res1 = torch.add(input=x1, other=x2)
*da0073e9SAndroid Build Coastguard Worker        res2 = torch.add(x1=x1, x2=x2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1, res2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x1 = torch.randn(10, 10, 10, device=device)
*da0073e9SAndroid Build Coastguard Worker        res1 = x1.sum(dim=(0, 2), keepdim=True)
*da0073e9SAndroid Build Coastguard Worker        res2 = x1.sum(axis=(0, 2), keepdims=True)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1, res2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: kill this ane replace with common creation ops
*da0073e9SAndroid Build Coastguard Worker    def _make_tensors(self, shape, val_range=(-100, 100), use_floating=True, use_integral=True,
*da0073e9SAndroid Build Coastguard Worker                      use_complex=False) -> Dict[str, List[torch.Tensor]]:
*da0073e9SAndroid Build Coastguard Worker        float_types = [torch.double,
*da0073e9SAndroid Build Coastguard Worker                       torch.float]
*da0073e9SAndroid Build Coastguard Worker        int_types = [torch.int64,
*da0073e9SAndroid Build Coastguard Worker                     torch.int32,
*da0073e9SAndroid Build Coastguard Worker                     torch.int16]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        complex_types = [torch.complex64,
*da0073e9SAndroid Build Coastguard Worker                         torch.complex128]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def make_contiguous(shape, dtype) -> torch.Tensor:
*da0073e9SAndroid Build Coastguard Worker            if dtype in float_types:
*da0073e9SAndroid Build Coastguard Worker                val = torch.randn(shape, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker                val = val * ((val_range[1] - val_range[0]) / (math.pi * 2.0))
*da0073e9SAndroid Build Coastguard Worker                val = val + ((val_range[1] - val_range[0]) / 2.0)
*da0073e9SAndroid Build Coastguard Worker                val = torch.clamp(val, min=val_range[0], max=val_range[1])
*da0073e9SAndroid Build Coastguard Worker                return val
*da0073e9SAndroid Build Coastguard Worker            result = torch.zeros(shape, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            result.apply_(lambda x: random.randint(val_range[0], val_range[1]))
*da0073e9SAndroid Build Coastguard Worker            return result
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def make_non_contiguous(shape, dtype) -> torch.Tensor:
*da0073e9SAndroid Build Coastguard Worker            contig = make_contiguous(shape, dtype)
*da0073e9SAndroid Build Coastguard Worker            non_contig = torch.empty(shape + (2, 2), dtype=dtype)[..., 0]
*da0073e9SAndroid Build Coastguard Worker            non_contig = non_contig.select(-1, -1)
*da0073e9SAndroid Build Coastguard Worker            non_contig.copy_(contig)
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(non_contig.is_contiguous())
*da0073e9SAndroid Build Coastguard Worker            return non_contig
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def make_contiguous_slice(size, dtype) -> torch.Tensor:
*da0073e9SAndroid Build Coastguard Worker            contig = make_contiguous((1, size), dtype)
*da0073e9SAndroid Build Coastguard Worker            non_contig = contig[:1, 1:size - 1]
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(non_contig.is_contiguous())
*da0073e9SAndroid Build Coastguard Worker            return contig
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        types = []
*da0073e9SAndroid Build Coastguard Worker        if use_floating:
*da0073e9SAndroid Build Coastguard Worker            types += float_types
*da0073e9SAndroid Build Coastguard Worker        if use_integral:
*da0073e9SAndroid Build Coastguard Worker            types += int_types
*da0073e9SAndroid Build Coastguard Worker        if use_complex:
*da0073e9SAndroid Build Coastguard Worker            types += complex_types
*da0073e9SAndroid Build Coastguard Worker        tensors: Dict[str, List[torch.Tensor]] = {"cont": [], "noncont": [], "slice": []}
*da0073e9SAndroid Build Coastguard Worker        for dtype in types:
*da0073e9SAndroid Build Coastguard Worker            tensors["cont"].append(make_contiguous(shape, dtype))
*da0073e9SAndroid Build Coastguard Worker            tensors["noncont"].append(make_non_contiguous(shape, dtype))
*da0073e9SAndroid Build Coastguard Worker            tensors["slice"].append(make_contiguous_slice(sum(list(shape)), dtype))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        return tensors
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: refactor this to use comparators from common_utils
*da0073e9SAndroid Build Coastguard Worker    def _assert_matches_numpy(self, t, n):
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(n.shape, t.shape)
*da0073e9SAndroid Build Coastguard Worker        if t.dtype == torch.float:
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(n, t, rtol=1e-03, atol=1e-05, equal_nan=True)
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(n, t, equal_nan=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: update this and tests that use it to use the device argument properly
*da0073e9SAndroid Build Coastguard Worker    def _test_dim_ops(self, pytorch_op, numpy_op,
*da0073e9SAndroid Build Coastguard Worker                      use_floating=True, use_integral=True, use_complex=False):
*da0073e9SAndroid Build Coastguard Worker        def do_one(tensors_dict, dim):
*da0073e9SAndroid Build Coastguard Worker            for category, tensors in tensors_dict.items():
*da0073e9SAndroid Build Coastguard Worker                if category == "slice":
*da0073e9SAndroid Build Coastguard Worker                    dim = 0
*da0073e9SAndroid Build Coastguard Worker                for tensor in tensors:
*da0073e9SAndroid Build Coastguard Worker                    # we have no control over NumPy warnings...
*da0073e9SAndroid Build Coastguard Worker                    with warnings.catch_warnings():
*da0073e9SAndroid Build Coastguard Worker                        warnings.simplefilter("ignore")
*da0073e9SAndroid Build Coastguard Worker                        expected = numpy_op(tensor.cpu().numpy(), dim)
*da0073e9SAndroid Build Coastguard Worker                    actual = pytorch_op(tensor, dim)
*da0073e9SAndroid Build Coastguard Worker                    self._assert_matches_numpy(actual, expected)
*da0073e9SAndroid Build Coastguard Worker                    if torch.cuda.is_available():
*da0073e9SAndroid Build Coastguard Worker                        self._assert_matches_numpy(pytorch_op(tensor.cuda(), dim).cpu(), expected)
*da0073e9SAndroid Build Coastguard Worker        do_one(self._make_tensors((5, 400000), use_floating=use_floating,
*da0073e9SAndroid Build Coastguard Worker                                  use_integral=use_integral, use_complex=use_complex), 1)
*da0073e9SAndroid Build Coastguard Worker        do_one(self._make_tensors((3, 5, 7), use_floating=use_floating,
*da0073e9SAndroid Build Coastguard Worker                                  use_integral=use_integral, use_complex=use_complex), 0)
*da0073e9SAndroid Build Coastguard Worker        do_one(self._make_tensors((3, 5, 7), use_floating=use_floating,
*da0073e9SAndroid Build Coastguard Worker                                  use_integral=use_integral, use_complex=use_complex), 1)
*da0073e9SAndroid Build Coastguard Worker        do_one(self._make_tensors((3, 5, 7), use_floating=use_floating,
*da0073e9SAndroid Build Coastguard Worker                                  use_integral=use_integral, use_complex=use_complex), 2)
*da0073e9SAndroid Build Coastguard Worker        do_one(self._make_tensors((100000, ), use_floating=use_floating,
*da0073e9SAndroid Build Coastguard Worker                                  use_integral=use_integral, use_complex=use_complex), -1)
*da0073e9SAndroid Build Coastguard Worker        do_one(self._make_tensors((50, 50, 50), use_floating=use_floating,
*da0073e9SAndroid Build Coastguard Worker                                  use_integral=use_integral, use_complex=use_complex), 0)
*da0073e9SAndroid Build Coastguard Worker        do_one(self._make_tensors((50, 50, 50), use_floating=use_floating,
*da0073e9SAndroid Build Coastguard Worker                                  use_integral=use_integral, use_complex=use_complex), 1)
*da0073e9SAndroid Build Coastguard Worker        do_one(self._make_tensors((50, 50, 50), use_floating=use_floating,
*da0073e9SAndroid Build Coastguard Worker                                  use_integral=use_integral, use_complex=use_complex), 2)
*da0073e9SAndroid Build Coastguard Worker        do_one(self._make_tensors((50, 50, 50), use_floating=use_floating,
*da0073e9SAndroid Build Coastguard Worker                                  use_integral=use_integral, use_complex=use_complex), (1, 2))
*da0073e9SAndroid Build Coastguard Worker        do_one(self._make_tensors((50, 50, 50), use_floating=use_floating,
*da0073e9SAndroid Build Coastguard Worker                                  use_integral=use_integral, use_complex=use_complex), (1, -1))
*da0073e9SAndroid Build Coastguard Worker        do_one(self._make_tensors((50, 50, 50), use_floating=use_floating,
*da0073e9SAndroid Build Coastguard Worker                                  use_integral=use_integral, use_complex=use_complex), (0, 2))
*da0073e9SAndroid Build Coastguard Worker        do_one(self._make_tensors((50, 50, 50), use_floating=use_floating,
*da0073e9SAndroid Build Coastguard Worker                                  use_integral=use_integral, use_complex=use_complex), (0, 2, 1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @slowTest
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_sum_dim(self, device):
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_ops(
*da0073e9SAndroid Build Coastguard Worker            lambda t, d: t.sum(d),
*da0073e9SAndroid Build Coastguard Worker            lambda n, d: n.sum(d),
*da0073e9SAndroid Build Coastguard Worker            use_floating=True, use_integral=True, use_complex=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_mean_dim(self, device):
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_ops(
*da0073e9SAndroid Build Coastguard Worker            lambda t, d: t.mean(d),
*da0073e9SAndroid Build Coastguard Worker            lambda n, d: n.mean(d),
*da0073e9SAndroid Build Coastguard Worker            use_integral=False,
*da0073e9SAndroid Build Coastguard Worker            use_complex=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_std_dim(self, device):
*da0073e9SAndroid Build Coastguard Worker        for unbiased in [False, True]:
*da0073e9SAndroid Build Coastguard Worker            self._test_dim_ops(
*da0073e9SAndroid Build Coastguard Worker                lambda t, d: t.std(d, unbiased=unbiased),
*da0073e9SAndroid Build Coastguard Worker                lambda n, d: n.std(d, ddof=1 if unbiased else 0),
*da0073e9SAndroid Build Coastguard Worker                use_integral=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_var_dim(self, device):
*da0073e9SAndroid Build Coastguard Worker        for unbiased in [False, True]:
*da0073e9SAndroid Build Coastguard Worker            self._test_dim_ops(
*da0073e9SAndroid Build Coastguard Worker                lambda t, d: t.var(d, unbiased=unbiased),
*da0073e9SAndroid Build Coastguard Worker                lambda n, d: n.var(d, ddof=1 if unbiased else 0),
*da0073e9SAndroid Build Coastguard Worker                use_integral=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    @skipIfNoSciPy
*da0073e9SAndroid Build Coastguard Worker    def test_logsumexp_dim(self, device):
*da0073e9SAndroid Build Coastguard Worker        from scipy.special import logsumexp
*da0073e9SAndroid Build Coastguard Worker        self._test_dim_ops(
*da0073e9SAndroid Build Coastguard Worker            lambda t, d: t.logsumexp(d),
*da0073e9SAndroid Build Coastguard Worker            lambda n, d: logsumexp(n, d),
*da0073e9SAndroid Build Coastguard Worker            use_integral=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_mean_int_with_optdtype(self, device):
*da0073e9SAndroid Build Coastguard Worker        a = make_tensor((3, 4, 5), dtype=torch.int64, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # If the optional desired output type is given, the input
*da0073e9SAndroid Build Coastguard Worker        # is internally cast.
*da0073e9SAndroid Build Coastguard Worker        a_float = a.to(torch.float32)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a_float.mean(), a.mean(dtype=torch.float32))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: update this and tests that use it to handle device properly
*da0073e9SAndroid Build Coastguard Worker    def _test_reduce_integer_upcast(self, fn, has_out=True, test_complex=True):
*da0073e9SAndroid Build Coastguard Worker        shape = (3, 4, 5)
*da0073e9SAndroid Build Coastguard Worker        reduced_shape = fn(torch.ones(shape)).shape
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def _test_out(dtype, other_dtype):
*da0073e9SAndroid Build Coastguard Worker            out = torch.ones(reduced_shape, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            result = fn(x, out=out)
*da0073e9SAndroid Build Coastguard Worker            self.assertIs(out.dtype, result.dtype)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fn(x.to(dtype)), result, exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker            result = fn(x, out=out, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            self.assertIs(out.dtype, result.dtype)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fn(x.to(dtype)), result, exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker            # 'out' is favored over dtype, check error
*da0073e9SAndroid Build Coastguard Worker            self.assertRaises(RuntimeError, lambda: fn(x, out=out, dtype=other_dtype))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for dtype in [dtype for dtype in get_all_math_dtypes('cpu') if dtype != torch.float16]:
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(shape, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            expected_dtype = dtype if dtype.is_floating_point or dtype.is_complex else torch.int64
*da0073e9SAndroid Build Coastguard Worker            self.assertIs(expected_dtype, fn(x).dtype)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fn(x.to(expected_dtype)), fn(x))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if dtype.is_floating_point:
*da0073e9SAndroid Build Coastguard Worker                other_dtype = torch.float32 if dtype == torch.float64 else torch.float64
*da0073e9SAndroid Build Coastguard Worker            elif dtype.is_complex:
*da0073e9SAndroid Build Coastguard Worker                other_dtype = torch.complex64 if dtype == torch.complex128 else torch.complex128
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                other_dtype = torch.int32 if dtype != torch.int32 else torch.int16
*da0073e9SAndroid Build Coastguard Worker            self.assertIs(other_dtype, fn(x, dtype=other_dtype).dtype)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fn(x.to(other_dtype)), fn(x, dtype=other_dtype), exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # test mixed int/float/complex
*da0073e9SAndroid Build Coastguard Worker            if dtype.is_floating_point:
*da0073e9SAndroid Build Coastguard Worker                mixed_dtypes = [torch.int32, torch.complex64]
*da0073e9SAndroid Build Coastguard Worker            elif dtype.is_complex:
*da0073e9SAndroid Build Coastguard Worker                mixed_dtypes = [torch.int32, torch.float32]
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                mixed_dtypes = [torch.float32, torch.complex64]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            for mixed_dtype in mixed_dtypes:
*da0073e9SAndroid Build Coastguard Worker                self.assertIs(mixed_dtype, fn(x, dtype=mixed_dtype).dtype)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(fn(x.to(mixed_dtype)), fn(x, dtype=mixed_dtype), exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                if has_out:
*da0073e9SAndroid Build Coastguard Worker                    _test_out(dtype, other_dtype)
*da0073e9SAndroid Build Coastguard Worker                    _test_out(dtype, mixed_dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_sum_integer_upcast(self, device):
*da0073e9SAndroid Build Coastguard Worker        self._test_reduce_integer_upcast(lambda x, **kwargs: torch.sum(x, **kwargs), False)
*da0073e9SAndroid Build Coastguard Worker        self._test_reduce_integer_upcast(lambda x, **kwargs: torch.sum(x, 0, **kwargs))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_prod_integer_upcast(self, device):
*da0073e9SAndroid Build Coastguard Worker        self._test_reduce_integer_upcast(lambda x, **kwargs: torch.prod(x, **kwargs), False)
*da0073e9SAndroid Build Coastguard Worker        self._test_reduce_integer_upcast(lambda x, **kwargs: torch.prod(x, 0, **kwargs))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_cumsum_integer_upcast(self, device):
*da0073e9SAndroid Build Coastguard Worker        self._test_reduce_integer_upcast(lambda x, **kwargs: torch.cumsum(x, 0, **kwargs))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_cumprod_integer_upcast(self, device):
*da0073e9SAndroid Build Coastguard Worker        self._test_reduce_integer_upcast(lambda x, **kwargs: torch.cumprod(x, 0, **kwargs))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*all_types())
*da0073e9SAndroid Build Coastguard Worker    def test_mode(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        SIZE = 10
*da0073e9SAndroid Build Coastguard Worker        x = torch.arange(1., SIZE * SIZE + 1, device=device, dtype=dtype).clone().resize_(SIZE, SIZE)
*da0073e9SAndroid Build Coastguard Worker        x[:2] = 1
*da0073e9SAndroid Build Coastguard Worker        x[:, :2] = 1
*da0073e9SAndroid Build Coastguard Worker        x0 = x.clone()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Pre-calculated results.
*da0073e9SAndroid Build Coastguard Worker        res1val = torch.ones(SIZE, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        # The indices are the position of the last appearance of the mode element.
*da0073e9SAndroid Build Coastguard Worker        res1ind = torch.ones(SIZE, device=device, dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker        res1ind[0] = SIZE - 1
*da0073e9SAndroid Build Coastguard Worker        res1ind[1] = SIZE - 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        res2val, res2ind = torch.mode(x, keepdim=False)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1val, res2val, atol=0, rtol=0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1ind, res2ind, atol=0, rtol=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test use of result tensor
*da0073e9SAndroid Build Coastguard Worker        res2val = torch.tensor((), device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        res2ind = torch.tensor((), device=device, dtype=torch.long)
*da0073e9SAndroid Build Coastguard Worker        torch.mode(x, keepdim=False, out=(res2val, res2ind))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1val, res2val, atol=0, rtol=0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1ind, res2ind, atol=0, rtol=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test non-default dim
*da0073e9SAndroid Build Coastguard Worker        res2val, res2ind = torch.mode(x, 0, False)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1val, res2val, atol=0, rtol=0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1ind, res2ind, atol=0, rtol=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # input unchanged
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x, x0, atol=0, rtol=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_mode_intervals(self, shape, intervals, device, dtype, v=1):
*da0073e9SAndroid Build Coastguard Worker        x = torch.arange(0, shape[1], device=device, dtype=dtype).expand(shape)
*da0073e9SAndroid Build Coastguard Worker        x = x.contiguous()
*da0073e9SAndroid Build Coastguard Worker        x[:, v] = intervals[0][0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Set the value of each interval to the mode "v"
*da0073e9SAndroid Build Coastguard Worker        for (beg, end) in intervals:
*da0073e9SAndroid Build Coastguard Worker            x[:, beg:end] = v
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        values, indices = torch.mode(x, -1, False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Check whether the returned indices correspond to the returned values
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue((x.gather(1, indices.unsqueeze(1)).t() == values).all())
*da0073e9SAndroid Build Coastguard Worker        # Check whether the returned values are the mode
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue((values == v).all().item())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*all_types_and(torch.half, torch.bfloat16))
*da0073e9SAndroid Build Coastguard Worker    def test_mode_large(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        # i should be less than (d - 2) / 2
*da0073e9SAndroid Build Coastguard Worker        def testset_for_shape(shape, i):
*da0073e9SAndroid Build Coastguard Worker            d = shape[-1]
*da0073e9SAndroid Build Coastguard Worker            # Mode only in the middle.
*da0073e9SAndroid Build Coastguard Worker            self._test_mode_intervals(shape, [(i, d - i)], device, dtype)
*da0073e9SAndroid Build Coastguard Worker            # Mode in discontiguous parts of the input.
*da0073e9SAndroid Build Coastguard Worker            self._test_mode_intervals(shape, [(0, i), (i + 1, d - i - 1), (d - i, d)], device, dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # More than one line of (65535) thread blocks
*da0073e9SAndroid Build Coastguard Worker        testset_for_shape((65536, 10), 3)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Max slice size (2048)
*da0073e9SAndroid Build Coastguard Worker        testset_for_shape((10, 2048), 10)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Naive kernel for big slice sizes (> 2048)
*da0073e9SAndroid Build Coastguard Worker        testset_for_shape((10, 4096), 10)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_mode_boolean(self, device):
*da0073e9SAndroid Build Coastguard Worker        shapes = [
*da0073e9SAndroid Build Coastguard Worker            (10, 10),
*da0073e9SAndroid Build Coastguard Worker            (4, 2048),
*da0073e9SAndroid Build Coastguard Worker            (1, 4096),
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for shape in shapes:
*da0073e9SAndroid Build Coastguard Worker            a = torch.zeros(shape, device=device, dtype=torch.bool)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a[:, (shape[1] - 1) // 2:] = True
*da0073e9SAndroid Build Coastguard Worker            values, indices = a.mode(-1)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(values, torch.ones(shape[0], dtype=torch.bool))
*da0073e9SAndroid Build Coastguard Worker            print(indices)
*da0073e9SAndroid Build Coastguard Worker            indexed = a.gather(1, indices.unsqueeze(1)).squeeze(1)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(values, indexed)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            a.fill_(False)
*da0073e9SAndroid Build Coastguard Worker            a[:, shape[1] // 2 + 1:] = True
*da0073e9SAndroid Build Coastguard Worker            values, indices = a.mode(-1)
*da0073e9SAndroid Build Coastguard Worker            print(indices)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(values, torch.zeros(shape[0], dtype=torch.bool))
*da0073e9SAndroid Build Coastguard Worker            indexed = a.gather(1, indices.unsqueeze(1)).squeeze(1)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(values, indexed)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @expectedFailureMeta  # mode only supports CPU and CUDA device type
*da0073e9SAndroid Build Coastguard Worker    @onlyNativeDeviceTypes
*da0073e9SAndroid Build Coastguard Worker    def test_mode_wrong_dtype(self, device):
*da0073e9SAndroid Build Coastguard Worker        def test_for_dtypes(x_ty, v_ty, i_ty, message):
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones(10, device=device, dtype=x_ty)
*da0073e9SAndroid Build Coastguard Worker            v = torch.ones(10, device=device, dtype=v_ty)
*da0073e9SAndroid Build Coastguard Worker            i = torch.ones(10, device=device, dtype=i_ty)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, message):
*da0073e9SAndroid Build Coastguard Worker                torch.mode(x, -1, True, out=(v, i))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        err_msg = "expected scalar type .* but got .* for "
*da0073e9SAndroid Build Coastguard Worker        values_err = err_msg + "values"
*da0073e9SAndroid Build Coastguard Worker        indices_err = err_msg + "indices"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test_for_dtypes(torch.uint8, torch.int8, torch.long, values_err)
*da0073e9SAndroid Build Coastguard Worker        test_for_dtypes(torch.int8, torch.int16, torch.long, values_err)
*da0073e9SAndroid Build Coastguard Worker        test_for_dtypes(torch.int32, torch.float32, torch.long, values_err)
*da0073e9SAndroid Build Coastguard Worker        test_for_dtypes(torch.float32, torch.float64, torch.long, values_err)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test_for_dtypes(torch.uint8, torch.uint8, torch.int8, indices_err)
*da0073e9SAndroid Build Coastguard Worker        test_for_dtypes(torch.int8, torch.int8, torch.int16, indices_err)
*da0073e9SAndroid Build Coastguard Worker        test_for_dtypes(torch.int32, torch.int32, torch.float32, indices_err)
*da0073e9SAndroid Build Coastguard Worker        test_for_dtypes(torch.float32, torch.float32, torch.float64, indices_err)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_mode_wrong_device(self, device):
*da0073e9SAndroid Build Coastguard Worker        # CPU Input Tensor
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                                    "expected device .* but got .* for values"):
*da0073e9SAndroid Build Coastguard Worker            values = torch.tensor([], device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.mode(x, -1, True, out=(values, torch.tensor([], dtype=torch.long)))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                                    "expected device .* but got .* for indices"):
*da0073e9SAndroid Build Coastguard Worker            indices = torch.tensor([], device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.mode(x, -1, True, out=(torch.tensor([]), indices))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: make work on CUDA, too
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_accreal_type(self, device) -> None:
*da0073e9SAndroid Build Coastguard Worker        x = torch.ones(2, 3, 4)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(x.double().sum().item(), float)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(x.float().sum().item(), float)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(x.long().sum().item(), int)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(x.int().sum().item(), int)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(x.short().sum().item(), int)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(x.char().sum().item(), int)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(x.byte().sum().item(), int)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_var_mean_some_dims(self, device):
*da0073e9SAndroid Build Coastguard Worker        sizes = (4, 6, 7, 5, 3)
*da0073e9SAndroid Build Coastguard Worker        dims = len(sizes)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(sizes, device=device)
*da0073e9SAndroid Build Coastguard Worker        for num_of_dims in range(2, dims):
*da0073e9SAndroid Build Coastguard Worker            dim_list = list(combinations(list(range(dims)), r=num_of_dims))
*da0073e9SAndroid Build Coastguard Worker            for dim in dim_list:
*da0073e9SAndroid Build Coastguard Worker                for unbiased in [False, True]:
*da0073e9SAndroid Build Coastguard Worker                    for keepdim in [False, True]:
*da0073e9SAndroid Build Coastguard Worker                        var1, mean1 = torch.var_mean(x, dim=dim, unbiased=unbiased, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                        var2 = x.var(dim=dim, unbiased=unbiased, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                        mean2 = x.mean(dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                        self.assertEqual(var1, var2)
*da0073e9SAndroid Build Coastguard Worker                        self.assertEqual(mean1, mean2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: this should be a generic opinfo test
*da0073e9SAndroid Build Coastguard Worker    def test_all_any_empty(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.ByteTensor().to(device)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x.all())
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(x.any())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.BoolTensor().to(device)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(x.all())
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(x.any())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_all_issue117215(self, device):
*da0073e9SAndroid Build Coastguard Worker        info = torch.iinfo(torch.uint8)
*da0073e9SAndroid Build Coastguard Worker        a = torch.randint(info.min, info.max, (73, 11, 3, 17), dtype=torch.uint8)
*da0073e9SAndroid Build Coastguard Worker        b = torch.all(a, dim=0)
*da0073e9SAndroid Build Coastguard Worker        c = a.to(torch.bool).all(dim=0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.ne(b, c).sum(), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(torch.half, torch.bfloat16, torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.half, torch.bfloat16, torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_max_with_inf(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([[-inf, -inf, inf, 3], [inf, inf, -inf, -1]], dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.all(torch.max(a, dim=1).values == inf).item())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.all(torch.amax(a, dim=1) == inf).item())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.max(a).item() == inf)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.amax(a).item() == inf)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(torch.half, torch.bfloat16, torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.half, torch.float, torch.bfloat16, torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_min_with_inf(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        a = torch.tensor([[-inf, -inf, inf, 3], [inf, inf, -inf, -1]], dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.all(torch.min(a, dim=1).values == (-inf)).item())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.all(torch.amin(a, dim=1) == (-inf)).item())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.min(a).item() == -inf)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.amin(a).item() == -inf)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_minmax_helper(self, torchfn, reffn, device, dtype, skip_indices=False):
*da0073e9SAndroid Build Coastguard Worker        def create_input(shape, device, dtype):
*da0073e9SAndroid Build Coastguard Worker            if dtype.is_floating_point:
*da0073e9SAndroid Build Coastguard Worker                return torch.randn(*shape, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                low = 0 if dtype == torch.bool else -1000
*da0073e9SAndroid Build Coastguard Worker                high = 2 if dtype == torch.bool else 1000
*da0073e9SAndroid Build Coastguard Worker                return torch.randint(low, high, shape, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        x = create_input((100, 100), device, dtype)
*da0073e9SAndroid Build Coastguard Worker        self.compare_with_numpy(torchfn, reffn, x)
*da0073e9SAndroid Build Coastguard Worker        # non contiguous
*da0073e9SAndroid Build Coastguard Worker        x = create_input((10, 10, 10), device, dtype)
*da0073e9SAndroid Build Coastguard Worker        x = x[:, 4]
*da0073e9SAndroid Build Coastguard Worker        self.compare_with_numpy(torchfn, reffn, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def get_values(x):
*da0073e9SAndroid Build Coastguard Worker            if isinstance(x, tuple):
*da0073e9SAndroid Build Coastguard Worker                return x[0]
*da0073e9SAndroid Build Coastguard Worker            return x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # indices
*da0073e9SAndroid Build Coastguard Worker        if not skip_indices:
*da0073e9SAndroid Build Coastguard Worker            size = 5
*da0073e9SAndroid Build Coastguard Worker            x = create_input((size, size), device, dtype)
*da0073e9SAndroid Build Coastguard Worker            inputs = (x, x.t())
*da0073e9SAndroid Build Coastguard Worker            dims = (0, 1)
*da0073e9SAndroid Build Coastguard Worker            for xinp, d in product(inputs, dims):
*da0073e9SAndroid Build Coastguard Worker                self.compare_with_numpy(lambda x: get_values(torchfn(x, d, False)), lambda x: reffn(x, d, keepdims=False), xinp)
*da0073e9SAndroid Build Coastguard Worker                result = torchfn(xinp, d, False)
*da0073e9SAndroid Build Coastguard Worker                if isinstance(result, tuple):
*da0073e9SAndroid Build Coastguard Worker                    v, i = result
*da0073e9SAndroid Build Coastguard Worker                    if d == 1:
*da0073e9SAndroid Build Coastguard Worker                        self.assertEqual(xinp[torch.arange(size), i], v, atol=0, rtol=0)
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        self.assertEqual(xinp[i, torch.arange(size)], v, atol=0, rtol=0)
*da0073e9SAndroid Build Coastguard Worker        # nan
*da0073e9SAndroid Build Coastguard Worker        if dtype.is_floating_point:
*da0073e9SAndroid Build Coastguard Worker            for index in (0, 4, 99):
*da0073e9SAndroid Build Coastguard Worker                x = create_input((100,), device, dtype)
*da0073e9SAndroid Build Coastguard Worker                x[index] = nan
*da0073e9SAndroid Build Coastguard Worker                if not skip_indices:
*da0073e9SAndroid Build Coastguard Worker                    result = torchfn(x, 0)
*da0073e9SAndroid Build Coastguard Worker                    v = get_values(result)
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(v, nan)
*da0073e9SAndroid Build Coastguard Worker                    if isinstance(result, tuple):
*da0073e9SAndroid Build Coastguard Worker                        i = result[1]
*da0073e9SAndroid Build Coastguard Worker                        self.assertEqual(i, index)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(torchfn(x), nan)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCPU(torch.float, torch.double, torch.long, torch.bool, torch.half)
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(torch.half, torch.float, torch.long, torch.bool)
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.half, torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_max(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        self._test_minmax_helper(torch.max, np.amax, device, dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCPU(torch.float, torch.double, torch.long, torch.bool, torch.half)
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(torch.half, torch.float, torch.long, torch.bool)
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.half, torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_min(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        self._test_minmax_helper(torch.min, np.amin, device, dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCPU(torch.half, torch.float, torch.double, torch.int, torch.long, torch.bool)
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(torch.half, torch.float, torch.int, torch.long, torch.bool)
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.half, torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_amin(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        self._test_minmax_helper(torch.amin, np.amin, device, dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCPU(torch.half, torch.float, torch.double, torch.int, torch.long, torch.bool)
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(torch.half, torch.float, torch.int, torch.long, torch.bool)
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_amax(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        self._test_minmax_helper(torch.amax, np.amax, device, dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyNativeDeviceTypes
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.double, torch.bfloat16, torch.half)
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(torch.half, torch.float, torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker    def test_aminmax(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def _amin_wrapper(x, dim=None, keepdims=False):
*da0073e9SAndroid Build Coastguard Worker            return torch.aminmax(x, dim=dim, keepdim=keepdims)[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def _amax_wrapper(x, dim=None, keepdims=False):
*da0073e9SAndroid Build Coastguard Worker            return torch.aminmax(x, dim=dim, keepdim=keepdims)[1]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self._test_minmax_helper(_amin_wrapper, np.amin, device, dtype)
*da0073e9SAndroid Build Coastguard Worker        self._test_minmax_helper(_amax_wrapper, np.amax, device, dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyNativeDeviceTypes
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*complex_types())
*da0073e9SAndroid Build Coastguard Worker    def test_invalid_0dim_aminmax(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'not implemented'):
*da0073e9SAndroid Build Coastguard Worker            torch.aminmax(torch.tensor(1., dtype=dtype, device=device), dim=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: bincount isn't a classic reduction -- maybe this test suite is
*da0073e9SAndroid Build Coastguard Worker    #   reductions and summary ops?
*da0073e9SAndroid Build Coastguard Worker    def test_bincount(self, device):
*da0073e9SAndroid Build Coastguard Worker        # negative input throws
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, '1-d non-negative integral'):
*da0073e9SAndroid Build Coastguard Worker            torch.bincount(torch.tensor([1, -1], device=device))
*da0073e9SAndroid Build Coastguard Worker        # n-d input, with n > 1 throws
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, '1-d non-negative integral'):
*da0073e9SAndroid Build Coastguard Worker            torch.bincount(torch.tensor([[1, 2], [3, 4]], device=device))
*da0073e9SAndroid Build Coastguard Worker        # floating input type throws
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'not implemented'):
*da0073e9SAndroid Build Coastguard Worker            torch.bincount(torch.tensor([1., 0.3], device=device))
*da0073e9SAndroid Build Coastguard Worker        # minlength < 0 throws
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'minlength should be >= 0'):
*da0073e9SAndroid Build Coastguard Worker            torch.bincount(torch.tensor([1, 3], device=device),
*da0073e9SAndroid Build Coastguard Worker                           torch.tensor([.2, .2], device=device),
*da0073e9SAndroid Build Coastguard Worker                           minlength=-1)
*da0073e9SAndroid Build Coastguard Worker        # n-d weights, with n > 1 throws
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, '1-d'):
*da0073e9SAndroid Build Coastguard Worker            torch.bincount(torch.tensor([1, 0], device=device),
*da0073e9SAndroid Build Coastguard Worker                           torch.tensor([[1., 0.3], [1., 0.3]], device=device))
*da0073e9SAndroid Build Coastguard Worker        # input and weights dim mismatch
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'same length'):
*da0073e9SAndroid Build Coastguard Worker            torch.bincount(torch.tensor([1, 0], device=device),
*da0073e9SAndroid Build Coastguard Worker                           torch.tensor([1., 0.3, 0.5], device=device))
*da0073e9SAndroid Build Coastguard Worker        # 1-d input with no elements and default minlength
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.bincount(torch.tensor([], device=device, dtype=torch.long)),
*da0073e9SAndroid Build Coastguard Worker                         torch.zeros(0, dtype=torch.long, device=device))
*da0073e9SAndroid Build Coastguard Worker        # 1-d input with no elements and specified minlength
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.bincount(torch.tensor([], device=device, dtype=torch.long), minlength=10),
*da0073e9SAndroid Build Coastguard Worker                         torch.zeros(10, dtype=torch.long, device=device))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test tensor method without weights
*da0073e9SAndroid Build Coastguard Worker        long_counts = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [0, 3, 2, 1, 3], dtype=torch.uint8, device=device).bincount()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([1, 1, 1, 2], dtype=torch.int64, device=device),
*da0073e9SAndroid Build Coastguard Worker            long_counts)
*da0073e9SAndroid Build Coastguard Worker        # test avoiding overflow for uint8 (#76979)
*da0073e9SAndroid Build Coastguard Worker        count_uint8 = torch.tensor([0, 1, 2, 3, 255], dtype=torch.uint8, device=device).bincount()
*da0073e9SAndroid Build Coastguard Worker        count_int16 = torch.tensor([0, 1, 2, 3, 255], dtype=torch.int16, device=device).bincount()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(count_uint8, count_int16)
*da0073e9SAndroid Build Coastguard Worker        # test minlength functionality
*da0073e9SAndroid Build Coastguard Worker        int_counts = torch.bincount(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([1, 1, 1, 1], device=device), minlength=5)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0, 4, 0, 0, 0], dtype=torch.int64, device=device),
*da0073e9SAndroid Build Coastguard Worker            int_counts)
*da0073e9SAndroid Build Coastguard Worker        # test weights
*da0073e9SAndroid Build Coastguard Worker        byte_counts = torch.bincount(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0, 1, 1, 1, 4], device=device),
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([.1, .2, .3, .4, .5], device=device))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0.1, 0.9, 0, 0, 0.5], device=device), byte_counts)
*da0073e9SAndroid Build Coastguard Worker        byte_counts = torch.bincount(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0, 1, 1, 1, 4], device=device),
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([1, 2, 3, 4, 5], dtype=torch.int8, device=device))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([1, 9, 0, 0, 5], device=device, dtype=torch.float64), byte_counts)
*da0073e9SAndroid Build Coastguard Worker        # test non-contiguous inputs and weights
*da0073e9SAndroid Build Coastguard Worker        inputs = torch.tensor([[0, 0], [3, 1], [2, 1], [1, 1], [3, 4]], device=device)
*da0073e9SAndroid Build Coastguard Worker        weights = torch.tensor([[.1, 1], [.2, 2], [.3, 3], [.4, 4], [.5, 5]], device=device)
*da0073e9SAndroid Build Coastguard Worker        for i in [0, 1]:
*da0073e9SAndroid Build Coastguard Worker            assert not inputs[:, i].is_contiguous(), "Inputs are supposed to be non-contiguous"
*da0073e9SAndroid Build Coastguard Worker            assert not weights[:, i].is_contiguous(), "Weights are supposed to be non-contiguous"
*da0073e9SAndroid Build Coastguard Worker        # inputs are non-contiguous but weights are contiguous
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(inputs[:, 0].bincount(), torch.tensor([1, 1, 1, 2]))
*da0073e9SAndroid Build Coastguard Worker        # inputs and weights are non-contiguous
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            inputs[:, 1].bincount(weights[:, 1]),
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([1, 9, 0, 0, 5], dtype=torch.float32))
*da0073e9SAndroid Build Coastguard Worker        # weights are non-contiguous but inputs are contiguous
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(inputs[:, 1].contiguous().bincount(weights[:, 1]),
*da0073e9SAndroid Build Coastguard Worker                         torch.tensor([1, 9, 0, 0, 5], dtype=torch.float32))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test bincount on non-contiguous slices
*da0073e9SAndroid Build Coastguard Worker        all0s = torch.zeros((32, 2), dtype=torch.int64, device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(all0s[:, 0].bincount(), torch.tensor([32]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        all1s = torch.ones((32, 2), dtype=torch.int64, device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(all1s[:, 0].bincount(), torch.tensor([0, 32]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test large number of bins - global memory use
*da0073e9SAndroid Build Coastguard Worker        big_exp = torch.zeros(10000000, device=device)
*da0073e9SAndroid Build Coastguard Worker        big_exp[-1] = 50.0
*da0073e9SAndroid Build Coastguard Worker        big_w = torch.tensor([.5] * 100, device=device)
*da0073e9SAndroid Build Coastguard Worker        big_out = torch.tensor([9999999] * 100, device=device).bincount(big_w)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(big_exp, big_out)
*da0073e9SAndroid Build Coastguard Worker        # test large input size
*da0073e9SAndroid Build Coastguard Worker        big_exp = torch.zeros(2, device=device, dtype=torch.int64)
*da0073e9SAndroid Build Coastguard Worker        big_exp[1] = 1000000
*da0073e9SAndroid Build Coastguard Worker        big_out = torch.ones(1000000, dtype=torch.int8, device=device).bincount()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(big_exp, big_out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: how many var stability tests are there?
*da0073e9SAndroid Build Coastguard Worker    def test_var_stability2(self, device):
*da0073e9SAndroid Build Coastguard Worker        tensor = torch.FloatTensor([2281.5, 2281.25]).to(device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Stability for inner dim
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.var(0), 0.03125)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # General stability
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.var(), 0.03125)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Stability for outer dimensions
*da0073e9SAndroid Build Coastguard Worker        tensor = tensor.unsqueeze(1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor.var(0), 0.03125)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.bfloat16, torch.float16)
*da0073e9SAndroid Build Coastguard Worker    def test_sum_noncontig_lowp(self, device, dtype) -> None:
*da0073e9SAndroid Build Coastguard Worker        dim_sequences = {
*da0073e9SAndroid Build Coastguard Worker            2: [0, 1],
*da0073e9SAndroid Build Coastguard Worker            3: [0, 1, 2],
*da0073e9SAndroid Build Coastguard Worker            4: [0, 1, 2, 3],
*da0073e9SAndroid Build Coastguard Worker            5: [0, 1, 2, 3, 4],
*da0073e9SAndroid Build Coastguard Worker        }
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def create_noncontig_inputs(x, ndim):
*da0073e9SAndroid Build Coastguard Worker            if ndim == 2:
*da0073e9SAndroid Build Coastguard Worker                return x[::2, ::2]
*da0073e9SAndroid Build Coastguard Worker            elif ndim == 3:
*da0073e9SAndroid Build Coastguard Worker                return x[::2, ::2, ::2]
*da0073e9SAndroid Build Coastguard Worker            elif ndim == 4:
*da0073e9SAndroid Build Coastguard Worker                return x[::2, ::2, ::2, ::2]
*da0073e9SAndroid Build Coastguard Worker            elif ndim == 5:
*da0073e9SAndroid Build Coastguard Worker                return x[::2, ::2, ::2, ::2, ::2]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def helper(self, shape, reduce_dims, device, dtype):
*da0073e9SAndroid Build Coastguard Worker            for permute_list in list(permutations(dim_sequences[len(shape)], len(shape))):
*da0073e9SAndroid Build Coastguard Worker                x = torch.ones(shape, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker                x = create_noncontig_inputs(x, len(shape))
*da0073e9SAndroid Build Coastguard Worker                x_trans = x.permute(permute_list)
*da0073e9SAndroid Build Coastguard Worker                x_sum = torch.sum(x_trans, reduce_dims)
*da0073e9SAndroid Build Coastguard Worker                x_trans_ref = x_trans.float()
*da0073e9SAndroid Build Coastguard Worker                x_sum_ref = torch.sum(x_trans_ref, reduce_dims)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(x_sum, x_sum_ref.to(dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        shapes = [
*da0073e9SAndroid Build Coastguard Worker            (50, 50),
*da0073e9SAndroid Build Coastguard Worker            (50, 50, 50),
*da0073e9SAndroid Build Coastguard Worker            (10, 50, 30, 30),
*da0073e9SAndroid Build Coastguard Worker            (10, 5, 10, 50, 7),
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for shape in shapes:
*da0073e9SAndroid Build Coastguard Worker            for i in range(1, len(shape) + 1):
*da0073e9SAndroid Build Coastguard Worker                reduce_dims = list(combinations(dim_sequences[len(shape)], i))
*da0073e9SAndroid Build Coastguard Worker                for reduce_dim in reduce_dims:
*da0073e9SAndroid Build Coastguard Worker                    helper(self, shape, reduce_dim, device, dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.bool, torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_sum_all(self, device, dtype) -> None:
*da0073e9SAndroid Build Coastguard Worker        def check_sum_all(tensor: torch.Tensor) -> None:
*da0073e9SAndroid Build Coastguard Worker            pylist = tensor.reshape(-1).tolist()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(tensor.sum(), sum(pylist))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if dtype != torch.bool:
*da0073e9SAndroid Build Coastguard Worker            check_sum_all(torch.tensor([1, 2, 3, 4, 5], dtype=dtype, device=device))
*da0073e9SAndroid Build Coastguard Worker            check_sum_all(torch.randn(200000, dtype=dtype, device=device))
*da0073e9SAndroid Build Coastguard Worker            check_sum_all(torch.randn(2000, 2, dtype=dtype, device=device)[:, 0])
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            check_sum_all(torch.tensor([True, False, True], dtype=torch.bool, device=device))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_memory_format_transformations(self, device, input_generator_fn, transformation_fn,
*da0073e9SAndroid Build Coastguard Worker                                            memory_format, compare_data=True, default_is_preserve=False):
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        assert memory_format == torch.channels_last or memory_format == torch.channels_last_3d
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # xc is a channels last tensor
*da0073e9SAndroid Build Coastguard Worker        xc = input_generator_fn(device)
*da0073e9SAndroid Build Coastguard Worker        # xc is not memory dense, but looks like channels last
*da0073e9SAndroid Build Coastguard Worker        if memory_format == torch.channels_last:
*da0073e9SAndroid Build Coastguard Worker            xc = xc[..., ::2, ::2]
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            xc = xc[..., ::2, ::2, ::2]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        clone = transformation_fn(xc, memory_format=torch.preserve_format)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(clone.is_contiguous())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(clone.is_contiguous(memory_format=memory_format))
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(xc.is_contiguous())
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(xc.is_contiguous(memory_format=memory_format))
*da0073e9SAndroid Build Coastguard Worker        if compare_data:
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(xc, clone.to(xc))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        xc = input_generator_fn(device)
*da0073e9SAndroid Build Coastguard Worker        clone = transformation_fn(xc, memory_format=torch.contiguous_format)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(clone.is_contiguous())
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(clone.is_contiguous(memory_format=memory_format))
*da0073e9SAndroid Build Coastguard Worker        if compare_data:
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(xc, clone.to(xc))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        xc = input_generator_fn(device)
*da0073e9SAndroid Build Coastguard Worker        clone = transformation_fn(xc)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if default_is_preserve:
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(clone.is_contiguous())
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(clone.is_contiguous(memory_format=memory_format))
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            self.assertTrue(clone.is_contiguous())
*da0073e9SAndroid Build Coastguard Worker            self.assertFalse(clone.is_contiguous(memory_format=memory_format))
*da0073e9SAndroid Build Coastguard Worker        if compare_data:
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(xc, clone.to(xc))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn((3, 4, 5, 6, 7, 8, 9), device=device)
*da0073e9SAndroid Build Coastguard Worker        for _ in range(10):
*da0073e9SAndroid Build Coastguard Worker            permutation = list(range(len(x.shape)))
*da0073e9SAndroid Build Coastguard Worker            random.shuffle(permutation)
*da0073e9SAndroid Build Coastguard Worker            x = x.permute(permutation)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.stride(), transformation_fn(x, memory_format=torch.preserve_format).stride())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_sum_out(self, device, dtype: torch.dtype) -> None:
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(100, 100, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        res1 = torch.sum(x, 1)
*da0073e9SAndroid Build Coastguard Worker        res2 = torch.tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        torch.sum(x, 1, out=res2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1, res2)
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(100, 100, 100, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        res1 = x.sum(2).sum(1)
*da0073e9SAndroid Build Coastguard Worker        res2 = torch.tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        torch.sum(x, (2, 1), out=res2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1, res2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float16, torch.float32)
*da0073e9SAndroid Build Coastguard Worker    def test_prod_gpu(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor([2, 3, 6, 9, 8], dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Check all combinations: fp16 input - fp16 output, fp16 input - fp32
*da0073e9SAndroid Build Coastguard Worker        # output, fp32 input - fp16 output, fp32 input - fp32 output
*da0073e9SAndroid Build Coastguard Worker        for dtype_output in [torch.float16, torch.float32]:
*da0073e9SAndroid Build Coastguard Worker            result_expected = torch.tensor(2592, dtype=dtype_output, device=device)
*da0073e9SAndroid Build Coastguard Worker            output = torch.prod(x, dtype=dtype_output)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(output, result_expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            output = x.prod(dtype=dtype_output)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(output, result_expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float)
*da0073e9SAndroid Build Coastguard Worker    def test_prod(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(100, 100, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        res1 = torch.prod(x, 1)
*da0073e9SAndroid Build Coastguard Worker        res2 = torch.tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        torch.prod(x, 1, out=res2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1, res2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float16, torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker    def test_prod_lowp(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(100, 100, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        x_ref = x.float()
*da0073e9SAndroid Build Coastguard Worker        res1 = torch.prod(x, 1)
*da0073e9SAndroid Build Coastguard Worker        res2 = torch.prod(x_ref, 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1, res2.to(dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker        res1 = torch.prod(x, 0)
*da0073e9SAndroid Build Coastguard Worker        res2 = torch.prod(x_ref, 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res1, res2.to(dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_prod_bool(self, device):
*da0073e9SAndroid Build Coastguard Worker        vals = [
*da0073e9SAndroid Build Coastguard Worker            [True, True],
*da0073e9SAndroid Build Coastguard Worker            [True, False],
*da0073e9SAndroid Build Coastguard Worker            [False, False],
*da0073e9SAndroid Build Coastguard Worker            [],
*da0073e9SAndroid Build Coastguard Worker            [False] * 256,  # https://github.com/pytorch/pytorch/issues/127866
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker        for val in vals:
*da0073e9SAndroid Build Coastguard Worker            result = torch.prod(torch.tensor(val, device=device), dtype=torch.bool).item()
*da0073e9SAndroid Build Coastguard Worker            expect = np.prod(np.array(val), dtype=bool)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(result, expect)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            result = torch.prod(torch.tensor(val, device=device)).item()
*da0073e9SAndroid Build Coastguard Worker            expect = np.prod(np.array(val))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(result, expect)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_max_mixed_devices(self, device):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(10, device=device)
*da0073e9SAndroid Build Coastguard Worker        if torch.cuda.is_available():
*da0073e9SAndroid Build Coastguard Worker            values = torch.randn(10).cuda()
*da0073e9SAndroid Build Coastguard Worker            indices = torch.cuda.LongTensor()
*da0073e9SAndroid Build Coastguard Worker            self.assertRaises(RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                              lambda: torch.max(a, 0, out=(values, indices)))
*da0073e9SAndroid Build Coastguard Worker            self.assertRaises(RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                              lambda: torch.amax(a, 0, out=values))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    def test_min_mixed_devices(self, device):
*da0073e9SAndroid Build Coastguard Worker        a = torch.randn(10, device=device)
*da0073e9SAndroid Build Coastguard Worker        if torch.cuda.is_available():
*da0073e9SAndroid Build Coastguard Worker            values = torch.randn(10).cuda()
*da0073e9SAndroid Build Coastguard Worker            indices = torch.cuda.LongTensor()
*da0073e9SAndroid Build Coastguard Worker            self.assertRaises(RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                              lambda: torch.min(a, 0, out=(values, indices)))
*da0073e9SAndroid Build Coastguard Worker            self.assertRaises(RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                              lambda: torch.amin(a, 0, out=values))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: consider refactoring with bincount test
*da0073e9SAndroid Build Coastguard Worker    def test_bucketization(self, device):
*da0073e9SAndroid Build Coastguard Worker        values_1d = torch.tensor([1, 2, 3, 4, 5, 6, 7, 8, 9], device=device)
*da0073e9SAndroid Build Coastguard Worker        values_3d = torch.tensor([[[1, 3, 5], [2, 4, 6]], [[1, 2, 3], [4, 5, 6]]], device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # simple 1d boundary and 3d input value
*da0073e9SAndroid Build Coastguard Worker        boundaries = torch.tensor([1, 2, 3, 4, 5, 6], device=device)
*da0073e9SAndroid Build Coastguard Worker        expected_result = torch.tensor([[[0, 2, 4], [1, 3, 5]], [[0, 1, 2], [3, 4, 5]]], device=device)
*da0073e9SAndroid Build Coastguard Worker        output = torch.empty(2, 2, 3, device=device, dtype=torch.int64)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.bucketize(values_3d, boundaries), expected_result)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.bucketize(values_3d, boundaries, out=output), expected_result)
*da0073e9SAndroid Build Coastguard Worker        expected_result = torch.tensor([[[1, 3, 5], [2, 4, 6]], [[1, 2, 3], [4, 5, 6]]], device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.bucketize(values_3d, boundaries, right=True), expected_result)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.bucketize(values_3d, boundaries, out=output, right=True), expected_result)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # simple float 1d boundary and 1d input with output int32 type
*da0073e9SAndroid Build Coastguard Worker        for dtype in [torch.float32, torch.float16]:
*da0073e9SAndroid Build Coastguard Worker            values_1d_float = values_1d.to(dtype)
*da0073e9SAndroid Build Coastguard Worker            boundaries = torch.tensor([0.9, 1, 2, 2, 3, 3, 4, 4.1, 9, 9], device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            expected_result = torch.tensor([1, 2, 4, 6, 8, 8, 8, 8, 8], device=device, dtype=torch.int32)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.searchsorted(boundaries, values_1d_float, out_int32=True), expected_result)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.bucketize(values_1d_float, boundaries, out_int32=True), expected_result)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # multiple dimension input with 0 elements
*da0073e9SAndroid Build Coastguard Worker        boundaries = torch.tensor([1, 2, 3, 4, 5, 6], device=device, dtype=torch.int64)
*da0073e9SAndroid Build Coastguard Worker        values_0_el = torch.tensor([[[]]], device=device, dtype=torch.int64)
*da0073e9SAndroid Build Coastguard Worker        expected_result = values_0_el.to(torch.int64)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.searchsorted(boundaries, values_0_el), expected_result)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.bucketize(values_0_el, boundaries), expected_result)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # nan input
*da0073e9SAndroid Build Coastguard Worker        values_nan = torch.tensor([1.0, float('nan'), 2.0, float('nan')], device=device, dtype=torch.float64)
*da0073e9SAndroid Build Coastguard Worker        boundaries = torch.tensor([0.0, 1.0, 2.0, 3.0], device=device, dtype=torch.float64)
*da0073e9SAndroid Build Coastguard Worker        expected_result = torch.tensor([1, 4, 2, 4], device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.searchsorted(boundaries, values_nan), expected_result)
*da0073e9SAndroid Build Coastguard Worker        expected_result = torch.tensor([2, 4, 3, 4], device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.searchsorted(boundaries, values_nan, right=True), expected_result)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.searchsorted(boundaries, values_nan, side='right'), expected_result)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # type promotion and non contiguous tensors
*da0073e9SAndroid Build Coastguard Worker        values_3d_permute = values_3d.permute(2, 1, 0).to(torch.int32)
*da0073e9SAndroid Build Coastguard Worker        boundaries_permute = values_3d.permute(2, 1, 0).to(torch.float64)
*da0073e9SAndroid Build Coastguard Worker        expected_result = torch.tensor([[[0, 0], [0, 1]], [[2, 0], [0, 1]], [[2, 0], [0, 0]]], device=device)
*da0073e9SAndroid Build Coastguard Worker        if self.device_type != 'xla':
*da0073e9SAndroid Build Coastguard Worker            self.assertWarnsRegex(
*da0073e9SAndroid Build Coastguard Worker                UserWarning, "tensor is non-contiguous",
*da0073e9SAndroid Build Coastguard Worker                lambda: self.assertEqual(torch.searchsorted(boundaries_permute, values_3d_permute), expected_result))
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            # All tensors in XLA is contiguous even doing permute, no warning msg will be generate in XLA
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.searchsorted(boundaries_permute, values_3d_permute), expected_result)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # scalar type
*da0073e9SAndroid Build Coastguard Worker        boundaries = torch.tensor([1.5, 2.5, 3.5], device=device)
*da0073e9SAndroid Build Coastguard Worker        expected_result = torch.tensor(1, device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.searchsorted(boundaries, 2), expected_result)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.bucketize(torch.tensor(2, device=device), boundaries), expected_result)
*da0073e9SAndroid Build Coastguard Worker        expected_result = torch.tensor(3, device=device)
*da0073e9SAndroid Build Coastguard Worker        scalar_tensor_nan = torch.tensor(float('nan'), device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.searchsorted(boundaries, scalar_tensor_nan), expected_result)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.bucketize(float('nan'), boundaries, right=True), expected_result)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # invalid input dimensions
*da0073e9SAndroid Build Coastguard Worker        boundaries = torch.tensor([[1, 2, 3], [4, 5, 6]], device=device)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "first N-1 dimensions of boundaries tensor and input value tensor must match"):
*da0073e9SAndroid Build Coastguard Worker            torch.searchsorted(boundaries, values_3d)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "boundaries tensor must be 1 dimension"):
*da0073e9SAndroid Build Coastguard Worker            torch.bucketize(values_3d, boundaries)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError, "only when boundaries tensor dimension is 1"):
*da0073e9SAndroid Build Coastguard Worker            torch.searchsorted(boundaries, 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # incompatiable output tensor's dtype
*da0073e9SAndroid Build Coastguard Worker        def test_output_dtype(dtype, is_int32):
*da0073e9SAndroid Build Coastguard Worker            output = values_1d.to(dtype)
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                    RuntimeError, "output tensor's dtype is wrong"):
*da0073e9SAndroid Build Coastguard Worker                torch.searchsorted(values_1d, values_1d, out=output, out_int32=is_int32)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test_output_dtype(torch.float32, False)
*da0073e9SAndroid Build Coastguard Worker        test_output_dtype(torch.int32, False)
*da0073e9SAndroid Build Coastguard Worker        test_output_dtype(torch.int64, True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # invalid side argument
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "side can only be 'left' or 'right'"):
*da0073e9SAndroid Build Coastguard Worker            torch.searchsorted(values_1d, values_1d, side='bad')
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # invalid sorter argument, wrong size
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "boundary and sorter must have the same size"):
*da0073e9SAndroid Build Coastguard Worker            sequence = torch.rand_like(values_1d, dtype=torch.float)
*da0073e9SAndroid Build Coastguard Worker            _, sorted_idx = torch.sort(sequence)
*da0073e9SAndroid Build Coastguard Worker            torch.searchsorted(sequence, values_1d, sorter=sorted_idx[:-1])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # invalid sorter argument, is not dtype long
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "sorter must be a tensor of long dtype"):
*da0073e9SAndroid Build Coastguard Worker            sequence = torch.rand_like(values_1d, dtype=torch.float)
*da0073e9SAndroid Build Coastguard Worker            _, sorted_idx = torch.sort(sequence)
*da0073e9SAndroid Build Coastguard Worker            torch.searchsorted(sequence, values_1d, sorter=sorted_idx.to(torch.float32))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # invalid sorter value, out of bound (>= innermost size)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "sorter index out of range"):
*da0073e9SAndroid Build Coastguard Worker            torch.searchsorted(torch.tensor([1, 2, 3]), 2.5, sorter=torch.tensor([0, 1, 3]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # invalid sorter value, out of bound (< 0)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "sorter index out of range"):
*da0073e9SAndroid Build Coastguard Worker            torch.searchsorted(torch.tensor([1, 2, 3]), 2.5, sorter=torch.tensor([-1, 1, 2]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # scalar type bfloat16
*da0073e9SAndroid Build Coastguard Worker        if self.device_type == 'cpu':
*da0073e9SAndroid Build Coastguard Worker            def test_dtype_bfloat16(values_bf16=False, boundaries_bf16=False):
*da0073e9SAndroid Build Coastguard Worker                values_1d_float = values_1d.to(torch.float32)
*da0073e9SAndroid Build Coastguard Worker                boundaries = torch.tensor([0.9, 1, 2, 2, 3, 3, 4, 4.1, 9, 9], device=device, dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker                if values_bf16:
*da0073e9SAndroid Build Coastguard Worker                    values_1d_float = values_1d_float.to(torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker                if boundaries_bf16:
*da0073e9SAndroid Build Coastguard Worker                    boundaries = boundaries.to(torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker                expected_result = torch.tensor([1, 2, 4, 6, 8, 8, 8, 8, 8], device=device, dtype=torch.int32)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(torch.bucketize(values_1d_float, boundaries, out_int32=True), expected_result)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            test_dtype_bfloat16(True, False)
*da0073e9SAndroid Build Coastguard Worker            test_dtype_bfloat16(False, True)
*da0073e9SAndroid Build Coastguard Worker            test_dtype_bfloat16(True, True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*all_types_and(torch.half, torch.bfloat16))
*da0073e9SAndroid Build Coastguard Worker    def test_nansum(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        args = product(
*da0073e9SAndroid Build Coastguard Worker            (True, False),  # noncontiguous
*da0073e9SAndroid Build Coastguard Worker            (0, 1, None),   # dim
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        zero = torch.zeros((), device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for noncontiguous, dim in args:
*da0073e9SAndroid Build Coastguard Worker            # Randomly scale the values
*da0073e9SAndroid Build Coastguard Worker            scale = random.randint(10, 100)
*da0073e9SAndroid Build Coastguard Worker            x = make_tensor((17, 17), device=device, dtype=dtype,
*da0073e9SAndroid Build Coastguard Worker                            low=-scale, high=scale, noncontiguous=noncontiguous)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if dtype.is_floating_point:
*da0073e9SAndroid Build Coastguard Worker                nan_mask = x < 0.2 * scale
*da0073e9SAndroid Build Coastguard Worker                x_nonan = torch.where(nan_mask, zero, x)
*da0073e9SAndroid Build Coastguard Worker                x[nan_mask] = np.nan
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                x_nonan = x
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            dim_kwargs = {} if dim is None else {"dim": dim}
*da0073e9SAndroid Build Coastguard Worker            expect = torch.sum(x_nonan, **dim_kwargs)
*da0073e9SAndroid Build Coastguard Worker            actual = torch.nansum(x, **dim_kwargs)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(expect, actual)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_reduction_function_with_numpy(self, torch_func, np_func, device, dtype,
*da0073e9SAndroid Build Coastguard Worker                                            with_extremal=False, atol=None, rtol=None,
*da0073e9SAndroid Build Coastguard Worker                                            exact_dtype=True, with_keepdim=False):
*da0073e9SAndroid Build Coastguard Worker        # Test 0-d to 3-d tensors.
*da0073e9SAndroid Build Coastguard Worker        for ndims in range(0, 4):
*da0073e9SAndroid Build Coastguard Worker            shape = _rand_shape(ndims, min_size=5, max_size=10)
*da0073e9SAndroid Build Coastguard Worker            for n in range(ndims + 1):
*da0073e9SAndroid Build Coastguard Worker                for c in combinations(list(range(ndims)), n):
*da0073e9SAndroid Build Coastguard Worker                    for count_dim in permutations(c):
*da0073e9SAndroid Build Coastguard Worker                        # Generate Input.
*da0073e9SAndroid Build Coastguard Worker                        x = _generate_input(shape, dtype, device, with_extremal)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                        if count_dim == ():
*da0073e9SAndroid Build Coastguard Worker                            # Default `dims=None` case
*da0073e9SAndroid Build Coastguard Worker                            self.compare_with_numpy(torch_func, np_func, x, device=None, dtype=None,
*da0073e9SAndroid Build Coastguard Worker                                                    atol=atol, rtol=rtol, exact_dtype=exact_dtype)
*da0073e9SAndroid Build Coastguard Worker                        else:
*da0073e9SAndroid Build Coastguard Worker                            # With `dims: tuple of ints` case
*da0073e9SAndroid Build Coastguard Worker                            if with_keepdim:
*da0073e9SAndroid Build Coastguard Worker                                torch_func_partial = partial(torch_func, keepdim=True, dim=count_dim)
*da0073e9SAndroid Build Coastguard Worker                                np_func_partial = partial(np_func, keepdims=True, axis=count_dim)
*da0073e9SAndroid Build Coastguard Worker                            else:
*da0073e9SAndroid Build Coastguard Worker                                torch_func_partial = partial(torch_func, dim=count_dim)
*da0073e9SAndroid Build Coastguard Worker                                np_func_partial = partial(np_func, axis=count_dim)
*da0073e9SAndroid Build Coastguard Worker                            self.compare_with_numpy(torch_func_partial, np_func_partial, x, device=None, dtype=None,
*da0073e9SAndroid Build Coastguard Worker                                                    atol=atol, rtol=rtol, exact_dtype=exact_dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*all_types_and_complex_and(torch.half))
*da0073e9SAndroid Build Coastguard Worker    def test_count_nonzero(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        self._test_reduction_function_with_numpy(torch.count_nonzero, np.count_nonzero, device, dtype)
*da0073e9SAndroid Build Coastguard Worker        self._test_reduction_function_with_numpy(torch.count_nonzero, np.count_nonzero, device, dtype, True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: Investigate why the output is not close to numpy.
*da0073e9SAndroid Build Coastguard Worker    def _get_relaxed_tolerances_for(self, dtype):
*da0073e9SAndroid Build Coastguard Worker        if dtype == torch.float16:
*da0073e9SAndroid Build Coastguard Worker            atol = 0.4
*da0073e9SAndroid Build Coastguard Worker            rtol = 1e-2
*da0073e9SAndroid Build Coastguard Worker        elif dtype == torch.float32:
*da0073e9SAndroid Build Coastguard Worker            atol = 7e-05
*da0073e9SAndroid Build Coastguard Worker            rtol = 3e-06
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            # Default values
*da0073e9SAndroid Build Coastguard Worker            atol = None
*da0073e9SAndroid Build Coastguard Worker            rtol = None
*da0073e9SAndroid Build Coastguard Worker        return atol, rtol
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_sum_reduction_vs_numpy(self, torch_fn, np_fn, device, dtype, with_keepdim=False, with_extremal=False):
*da0073e9SAndroid Build Coastguard Worker        def is_integral(dtype):
*da0073e9SAndroid Build Coastguard Worker            return dtype in integral_types()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        exact_dtype = True
*da0073e9SAndroid Build Coastguard Worker        # On Windows CI, the current version of `numpy` promotes all lower integers
*da0073e9SAndroid Build Coastguard Worker        # dtypes to int32 while `torch` promotes them to int64. Hence we skip on checking
*da0073e9SAndroid Build Coastguard Worker        # the exact dtype.
*da0073e9SAndroid Build Coastguard Worker        # Reference : https://dr.pytorch.org/api/view-log-full?build_id=122051580
*da0073e9SAndroid Build Coastguard Worker        # PR : https://github.com/pytorch/pytorch/pull/38628#issuecomment-655905370
*da0073e9SAndroid Build Coastguard Worker        if IS_WINDOWS and is_integral(dtype):
*da0073e9SAndroid Build Coastguard Worker            exact_dtype = False
*da0073e9SAndroid Build Coastguard Worker        # For uint8, numpy promotes to uint64 while torch promotes to int64.
*da0073e9SAndroid Build Coastguard Worker        # So we must skip this as well.
*da0073e9SAndroid Build Coastguard Worker        if dtype == torch.uint8:
*da0073e9SAndroid Build Coastguard Worker            exact_dtype = False
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # TODO: Investigate why the output is not close to numpy.
*da0073e9SAndroid Build Coastguard Worker        atol, rtol = self._get_relaxed_tolerances_for(dtype)
*da0073e9SAndroid Build Coastguard Worker        self._test_reduction_function_with_numpy(torch_fn, np_fn, device, dtype,
*da0073e9SAndroid Build Coastguard Worker                                                 atol=atol, rtol=rtol, exact_dtype=exact_dtype,
*da0073e9SAndroid Build Coastguard Worker                                                 with_keepdim=with_keepdim, with_extremal=with_extremal)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyNativeDeviceTypes
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*set(all_types_and(torch.half)) - {torch.uint8})
*da0073e9SAndroid Build Coastguard Worker    def test_sum_vs_numpy(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        self._test_sum_reduction_vs_numpy(torch.sum, np.sum, device, dtype)
*da0073e9SAndroid Build Coastguard Worker        self._test_sum_reduction_vs_numpy(torch.sum, np.sum, device, dtype, with_extremal=True)
*da0073e9SAndroid Build Coastguard Worker        self._test_sum_reduction_vs_numpy(torch.sum, np.sum, device, dtype, with_keepdim=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyNativeDeviceTypes
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*set(all_types_and(torch.half)) - {torch.uint8})
*da0073e9SAndroid Build Coastguard Worker    def test_nansum_vs_numpy(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        self._test_sum_reduction_vs_numpy(torch.nansum, np.nansum, device, dtype)
*da0073e9SAndroid Build Coastguard Worker        self._test_sum_reduction_vs_numpy(torch.nansum, np.nansum, device, dtype, with_extremal=True)
*da0073e9SAndroid Build Coastguard Worker        self._test_sum_reduction_vs_numpy(torch.nansum, np.nansum, device, dtype, with_keepdim=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*complex_types())
*da0073e9SAndroid Build Coastguard Worker    def test_nansum_complex(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn((3, 3, 3), device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "nansum does not support complex inputs"):
*da0073e9SAndroid Build Coastguard Worker            torch.nansum(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*all_types_and(torch.half))
*da0073e9SAndroid Build Coastguard Worker    def test_nansum_out_dtype(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        out_dtype = dtype
*da0073e9SAndroid Build Coastguard Worker        inp_dtypes = all_types_and(torch.half) if out_dtype.is_floating_point else integral_types()
*da0073e9SAndroid Build Coastguard Worker        for inp_dtype in inp_dtypes:
*da0073e9SAndroid Build Coastguard Worker            # TODO: Investigate why the output is not close to numpy.
*da0073e9SAndroid Build Coastguard Worker            atol, rtol = self._get_relaxed_tolerances_for(dtype)
*da0073e9SAndroid Build Coastguard Worker            shape = _rand_shape(random.randint(2, 5), min_size=5, max_size=10)
*da0073e9SAndroid Build Coastguard Worker            x = _generate_input(shape, inp_dtype, device, with_extremal=False)
*da0073e9SAndroid Build Coastguard Worker            torch_fn = partial(torch.nansum, dtype=out_dtype)
*da0073e9SAndroid Build Coastguard Worker            np_out_dtype = torch_to_numpy_dtype_dict[out_dtype]
*da0073e9SAndroid Build Coastguard Worker            np_fn = partial(np.nansum, dtype=np_out_dtype)
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch_fn, np_fn, x, device=None, dtype=None, atol=atol, rtol=rtol)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*all_types_and(torch.half))
*da0073e9SAndroid Build Coastguard Worker    def test_argminmax_multiple(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        # Case: All Ones
*da0073e9SAndroid Build Coastguard Worker        t = torch.ones(3, 3, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        self.compare_with_numpy(torch.argmax, np.argmax, t)
*da0073e9SAndroid Build Coastguard Worker        self.compare_with_numpy(torch.argmin, np.argmin, t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Case: With single `nan` present.
*da0073e9SAndroid Build Coastguard Worker        if dtype in floating_types_and(torch.half, torch.bfloat16):
*da0073e9SAndroid Build Coastguard Worker            t[2, 2] = float('nan')
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch.argmax, np.argmax, t)
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch.argmin, np.argmin, t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Case: Randomly Generated Tensors
*da0073e9SAndroid Build Coastguard Worker        for ndims in range(1, 5):
*da0073e9SAndroid Build Coastguard Worker            shape = _rand_shape(ndims, min_size=5, max_size=10)
*da0073e9SAndroid Build Coastguard Worker            for with_extremal in [False, True]:
*da0073e9SAndroid Build Coastguard Worker                for contiguous in [False, True]:
*da0073e9SAndroid Build Coastguard Worker                    # Generate Input.
*da0073e9SAndroid Build Coastguard Worker                    x = _generate_input(shape, dtype, device, with_extremal)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    if dtype == torch.half:
*da0073e9SAndroid Build Coastguard Worker                        max_val = torch.max(x.to(torch.float))
*da0073e9SAndroid Build Coastguard Worker                        min_val = torch.min(x.to(torch.float))
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        max_val = torch.max(x)
*da0073e9SAndroid Build Coastguard Worker                        min_val = torch.min(x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    mask = torch.randn(x.shape) > 0.5
*da0073e9SAndroid Build Coastguard Worker                    x[mask] = torch.tensor(max_val + 1, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    mask = torch.randn(x.shape) > 0.5
*da0073e9SAndroid Build Coastguard Worker                    x[mask] = torch.tensor(min_val - 1, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    if not contiguous:
*da0073e9SAndroid Build Coastguard Worker                        x = x.T
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    self.compare_with_numpy(torch.argmax, np.argmax, x, device=None, dtype=None)
*da0073e9SAndroid Build Coastguard Worker                    self.compare_with_numpy(torch.argmin, np.argmin, x, device=None, dtype=None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # Verify indices returned by max and min.
*da0073e9SAndroid Build Coastguard Worker                    if dtype != torch.half:
*da0073e9SAndroid Build Coastguard Worker                        rand_dim = random.randint(0, ndims - 1)
*da0073e9SAndroid Build Coastguard Worker                        self.compare_with_numpy(lambda x: torch.max(x, dim=rand_dim)[1],
*da0073e9SAndroid Build Coastguard Worker                                                lambda x: np.argmax(x, axis=rand_dim), x, device=None, dtype=None)
*da0073e9SAndroid Build Coastguard Worker                        self.compare_with_numpy(lambda x: torch.min(x, dim=rand_dim)[1],
*da0073e9SAndroid Build Coastguard Worker                                                lambda x: np.argmin(x, axis=rand_dim), x, device=None, dtype=None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def verify_against_numpy(t):
*da0073e9SAndroid Build Coastguard Worker            # Argmax
*da0073e9SAndroid Build Coastguard Worker            torch_fn = partial(torch.argmax, dim=1)
*da0073e9SAndroid Build Coastguard Worker            np_fn = partial(np.argmax, axis=1)
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch_fn, np_fn, t)
*da0073e9SAndroid Build Coastguard Worker            # Non-contiguous input
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch_fn, np_fn, t.T)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Verify indices returned by max.
*da0073e9SAndroid Build Coastguard Worker            if dtype != torch.half:
*da0073e9SAndroid Build Coastguard Worker                self.compare_with_numpy(lambda x: torch.max(x, dim=1)[1], np_fn, x, device=None, dtype=None)
*da0073e9SAndroid Build Coastguard Worker                self.compare_with_numpy(lambda x: torch.max(x, dim=1)[1], np_fn, x.T, device=None, dtype=None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Argmin
*da0073e9SAndroid Build Coastguard Worker            torch_fn = partial(torch.argmin, dim=1)
*da0073e9SAndroid Build Coastguard Worker            np_fn = partial(np.argmin, axis=1)
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch_fn, np_fn, t)
*da0073e9SAndroid Build Coastguard Worker            # Non-contiguous input
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch_fn, np_fn, t.T)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Verify indices returned by min.
*da0073e9SAndroid Build Coastguard Worker            if dtype != torch.half:
*da0073e9SAndroid Build Coastguard Worker                self.compare_with_numpy(lambda x: torch.min(x, dim=1)[1], np_fn, x, device=None, dtype=None)
*da0073e9SAndroid Build Coastguard Worker                self.compare_with_numpy(lambda x: torch.min(x, dim=1)[1], np_fn, x.T, device=None, dtype=None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Case: Sample from issue: https://github.com/pytorch/pytorch/issues/41998
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor([[1, 5],
*da0073e9SAndroid Build Coastguard Worker                          [2, 10],
*da0073e9SAndroid Build Coastguard Worker                          [3, 3]], device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        verify_against_numpy(t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Case: Sample from issue: https://github.com/pytorch/pytorch/issues/41998
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor([[1, 5],
*da0073e9SAndroid Build Coastguard Worker                          [2, 10],
*da0073e9SAndroid Build Coastguard Worker                          [0, 0]], device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        verify_against_numpy(t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*all_types_and_complex_and(torch.half, torch.bool))
*da0073e9SAndroid Build Coastguard Worker    def test_all_any_vs_numpy(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        # Note [all, any uint8 compatibility]: However for compatibility reason,
*da0073e9SAndroid Build Coastguard Worker        # for `uint8`, they return Tensor of same dtype `uint8`.
*da0073e9SAndroid Build Coastguard Worker        # Reference: https://github.com/pytorch/pytorch/pull/47878#issuecomment-747108561
*da0073e9SAndroid Build Coastguard Worker        exact_dtype = True if dtype != torch.uint8 else False
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def _test_all_any(x):
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch.all, np.all, x)
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch.any, np.any, x)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def _test_all_any_with_dim(x, dim):
*da0073e9SAndroid Build Coastguard Worker            torch_fn = partial(torch.all, dim=dim)
*da0073e9SAndroid Build Coastguard Worker            np_fn = partial(np.all, axis=dim)
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch_fn, np_fn, x, exact_dtype=exact_dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            torch_fn = partial(torch.any, dim=dim)
*da0073e9SAndroid Build Coastguard Worker            np_fn = partial(np.any, axis=dim)
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch_fn, np_fn, x, exact_dtype=exact_dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def _test_out_variant(x, dim):
*da0073e9SAndroid Build Coastguard Worker            out = torch.empty_like(x)
*da0073e9SAndroid Build Coastguard Worker            if dtype == torch.bool or dtype == torch.uint8:
*da0073e9SAndroid Build Coastguard Worker                expected = torch.all(x, dim)
*da0073e9SAndroid Build Coastguard Worker                torch.all(x, dim, out=out)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(expected, out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                expected = torch.any(x, dim)
*da0073e9SAndroid Build Coastguard Worker                torch.any(x, dim, out=out)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(expected, out)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, "all only supports bool tensor for result, got"):
*da0073e9SAndroid Build Coastguard Worker                    torch.all(x, dim, out=out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, "any only supports bool tensor for result, got"):
*da0073e9SAndroid Build Coastguard Worker                    torch.any(x, dim, out=out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def _test_all_any_with_dim_keepdim(x, dim, keepdim):
*da0073e9SAndroid Build Coastguard Worker            torch_fn = partial(torch.all, dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker            np_fn = partial(np.all, axis=dim, keepdims=keepdim)
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch_fn, np_fn, x, exact_dtype=exact_dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            torch_fn = partial(torch.any, dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker            np_fn = partial(np.any, axis=dim, keepdims=keepdim)
*da0073e9SAndroid Build Coastguard Worker            self.compare_with_numpy(torch_fn, np_fn, x, exact_dtype=exact_dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def _test_output_dtype(x):
*da0073e9SAndroid Build Coastguard Worker            # This test will fail once the functions return bool output
*da0073e9SAndroid Build Coastguard Worker            # for uint8 input.
*da0073e9SAndroid Build Coastguard Worker            expected_dtype = torch.uint8 if dtype == torch.uint8 else torch.bool
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.all(x).dtype, expected_dtype)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.any(x).dtype, expected_dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.all(x, dim=0).dtype, expected_dtype)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.any(x, dim=0).dtype, expected_dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for ndim in range(5):
*da0073e9SAndroid Build Coastguard Worker            shape = _rand_shape(ndim, 1, 5)
*da0073e9SAndroid Build Coastguard Worker            x = _generate_input(shape, dtype, device, with_extremal=False)
*da0073e9SAndroid Build Coastguard Worker            _test_all_any(x)
*da0073e9SAndroid Build Coastguard Worker            _test_all_any(x.T)
*da0073e9SAndroid Build Coastguard Worker            _test_all_any(x[..., ::2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = _generate_input(shape, dtype, device, with_extremal=True)
*da0073e9SAndroid Build Coastguard Worker            _test_all_any(x)
*da0073e9SAndroid Build Coastguard Worker            _test_all_any(x.T)
*da0073e9SAndroid Build Coastguard Worker            _test_all_any(x[..., ::2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.zeros_like(x)
*da0073e9SAndroid Build Coastguard Worker            _test_all_any(x)
*da0073e9SAndroid Build Coastguard Worker            _test_all_any(x.T)
*da0073e9SAndroid Build Coastguard Worker            _test_all_any(x[..., ::2])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            x = torch.ones_like(x)
*da0073e9SAndroid Build Coastguard Worker            _test_all_any(x)
*da0073e9SAndroid Build Coastguard Worker            _test_all_any(x.T)
*da0073e9SAndroid Build Coastguard Worker            _test_all_any(x[..., ::2])
*da0073e9SAndroid Build Coastguard Worker            _test_output_dtype(x)
*da0073e9SAndroid Build Coastguard Worker            for dim in range(ndim):
*da0073e9SAndroid Build Coastguard Worker                x = _generate_input(shape, dtype, device, with_extremal=False)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim(x, dim)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim(x.T, dim)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim(x[..., ::2], dim)
*da0073e9SAndroid Build Coastguard Worker                _test_out_variant(x, dim)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim_keepdim(x, dim, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim_keepdim(x, dim, keepdim=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                x = _generate_input(shape, dtype, device, with_extremal=True)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim(x, dim)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim(x.T, dim)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim(x[..., ::2], dim)
*da0073e9SAndroid Build Coastguard Worker                _test_out_variant(x, dim)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim_keepdim(x, dim, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim_keepdim(x, dim, keepdim=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                x = torch.zeros_like(x)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim(x, dim)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim(x.T, dim)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim(x[..., ::2], dim)
*da0073e9SAndroid Build Coastguard Worker                _test_out_variant(x, dim)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim_keepdim(x, dim, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim_keepdim(x, dim, keepdim=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                x = torch.ones_like(x)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim(x, dim)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim(x.T, dim)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim(x[..., ::2], dim)
*da0073e9SAndroid Build Coastguard Worker                _test_out_variant(x, dim)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim_keepdim(x, dim, keepdim=True)
*da0073e9SAndroid Build Coastguard Worker                _test_all_any_with_dim_keepdim(x, dim, keepdim=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: part of this test covers torch.norm, with should be covered by test_linalg
*da0073e9SAndroid Build Coastguard Worker    @onlyNativeDeviceTypes
*da0073e9SAndroid Build Coastguard Worker    def test_repeated_dim(self, device):
*da0073e9SAndroid Build Coastguard Worker        ops = [torch.mean, torch.sum, torch.nansum, torch.std, torch.logsumexp, torch.std, torch.var,
*da0073e9SAndroid Build Coastguard Worker               torch.norm]
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(3, 3, 3, 3, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        error_msg = r'appears multiple times in the list of dims'
*da0073e9SAndroid Build Coastguard Worker        for op in ops:
*da0073e9SAndroid Build Coastguard Worker            for dim in [(0, 0), (0, -4)]:
*da0073e9SAndroid Build Coastguard Worker                with self.assertRaisesRegex(RuntimeError, error_msg):
*da0073e9SAndroid Build Coastguard Worker                    op(x, dim=dim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: update this test to comapre against NumPy
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_var(self, device):
*da0073e9SAndroid Build Coastguard Worker        cpu_tensor = torch.randn(2, 3, 3)
*da0073e9SAndroid Build Coastguard Worker        device_tensor = cpu_tensor.to(device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(device_tensor.var(), cpu_tensor.var())
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(device_tensor.var(1), cpu_tensor.var(1))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(device_tensor.var(2), cpu_tensor.var(2))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(device_tensor.std(), cpu_tensor.std())
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(device_tensor.std(1), cpu_tensor.std(1))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(device_tensor.var(2), cpu_tensor.var(2))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        cpu_tensor = torch.randn(100)
*da0073e9SAndroid Build Coastguard Worker        device_tensor = cpu_tensor.to(device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(device_tensor.var(), cpu_tensor.var())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: update this test to compare against NumPy
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_var_large_input(self, device):
*da0073e9SAndroid Build Coastguard Worker        # Large, not-nice input
*da0073e9SAndroid Build Coastguard Worker        cpu_tensor = torch.randn(2 * 32 * 1024 + 1, 2, 67)
*da0073e9SAndroid Build Coastguard Worker        device_tensor = cpu_tensor.to(device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(cpu_tensor.var(2), device_tensor.var(2))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: update this to compare against NumPy instead of CPU
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_sum_noncontig(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(1, 75, 57, 20, dtype=dtype, device=device).permute(0, 3, 1, 2)
*da0073e9SAndroid Build Coastguard Worker        y = x.cpu()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.sum().cpu(), y.sum())
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.sum(dim=(-1, -2)).cpu(), y.sum(dim=(-1, -2)))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.sum(dim=(1, 3)).cpu(), y.sum(dim=(1, 3)))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: update this to compare against NumPy instead of CPU
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_min_max_nan(self, device):
*da0073e9SAndroid Build Coastguard Worker        tests = [(lambda x: x.min(), 'min'),
*da0073e9SAndroid Build Coastguard Worker                 (lambda x: x.max(), 'max'),
*da0073e9SAndroid Build Coastguard Worker                 (lambda x: x.amin(), 'amin'),
*da0073e9SAndroid Build Coastguard Worker                 (lambda x: x.amax(), 'amax'),
*da0073e9SAndroid Build Coastguard Worker                 (lambda x: x.min(0).values, 'min_dim'),
*da0073e9SAndroid Build Coastguard Worker                 (lambda x: x.max(0).values, 'max_dim'),
*da0073e9SAndroid Build Coastguard Worker                 (lambda x: x.amin(0), 'amin_dim'),
*da0073e9SAndroid Build Coastguard Worker                 (lambda x: x.amax(0), 'amax_dim')]
*da0073e9SAndroid Build Coastguard Worker        for f, name in tests:
*da0073e9SAndroid Build Coastguard Worker            a = torch.arange(25.0).view(5, 5)
*da0073e9SAndroid Build Coastguard Worker            a[2, 2] = nan
*da0073e9SAndroid Build Coastguard Worker            actual = f(a.to(device)).cpu()
*da0073e9SAndroid Build Coastguard Worker            expected = f(a).cpu()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.isnan(actual), torch.isnan(expected), msg=f'nans for {name}')
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(actual[~torch.isnan(actual)],
*da0073e9SAndroid Build Coastguard Worker                             expected[~torch.isnan(expected)], msg=f'nans for {name}')
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: make this test generic using OpInfos
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_sum_cpu_device_mismatch(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(20, dtype=torch.float32, device=device)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(1, dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        err_string = f"Expected out tensor to have device {device}, but got cpu instead"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, err_string):
*da0073e9SAndroid Build Coastguard Worker            torch.sum(x, dim=[0], dtype=torch.float32, out=y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # tests half to float promotion
*da0073e9SAndroid Build Coastguard Worker        if self.device_type == 'cuda':
*da0073e9SAndroid Build Coastguard Worker            x = x.half()
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, err_string):
*da0073e9SAndroid Build Coastguard Worker                torch.sum(x, dim=[0], dtype=torch.float32, out=y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Assert for illegal dtype would not be raised on XLA
*da0073e9SAndroid Build Coastguard Worker    @onlyNativeDeviceTypes
*da0073e9SAndroid Build Coastguard Worker    def test_minmax_illegal_dtype(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 5, dtype=torch.float32, device=device)
*da0073e9SAndroid Build Coastguard Worker        valid_values = torch.empty(5, dtype=torch.float32, device=device)
*da0073e9SAndroid Build Coastguard Worker        valid_indices = torch.empty(5, dtype=torch.long, device=device)
*da0073e9SAndroid Build Coastguard Worker        illegal_values = torch.empty(5, dtype=torch.int, device=device)
*da0073e9SAndroid Build Coastguard Worker        illegal_indices = torch.empty(5, dtype=torch.double, device=device)
*da0073e9SAndroid Build Coastguard Worker        torch.max(x, dim=0, out=(valid_values, valid_indices))
*da0073e9SAndroid Build Coastguard Worker        torch.min(x, dim=0, out=(valid_values, valid_indices))
*da0073e9SAndroid Build Coastguard Worker        torch.amax(x, dim=0, out=valid_values)
*da0073e9SAndroid Build Coastguard Worker        torch.amin(x, dim=0, out=valid_values)
*da0073e9SAndroid Build Coastguard Worker        rmsg = r'scalar type|dtype'
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, rmsg):
*da0073e9SAndroid Build Coastguard Worker            torch.max(x, dim=0, out=(illegal_values, valid_indices))
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, rmsg):
*da0073e9SAndroid Build Coastguard Worker            torch.min(x, dim=0, out=(illegal_values, valid_indices))
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, rmsg):
*da0073e9SAndroid Build Coastguard Worker            torch.max(x, dim=0, out=(valid_values, illegal_indices))
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, rmsg):
*da0073e9SAndroid Build Coastguard Worker            torch.min(x, dim=0, out=(valid_values, illegal_indices))
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, rmsg):
*da0073e9SAndroid Build Coastguard Worker            torch.max(x, dim=0, out=(illegal_values, illegal_indices))
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, rmsg):
*da0073e9SAndroid Build Coastguard Worker            torch.min(x, dim=0, out=(illegal_values, illegal_indices))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*all_types_and(torch.half, torch.bfloat16))
*da0073e9SAndroid Build Coastguard Worker    def test_dim_arg_reduction_scalar(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        example = 4.0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(example, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax().item(), 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax(dim=None).item(), 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax(dim=0).item(), 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax(dim=0, keepdim=True), torch.tensor(0, dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(example, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin().item(), 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(dim=None).item(), 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(dim=0).item(), 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(dim=0, keepdim=True), torch.tensor(0, dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @precisionOverride({torch.float16: 1e-2, torch.bfloat16: 1e-2})
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*set(all_types_and(torch.half, torch.bfloat16)) - {torch.uint8})
*da0073e9SAndroid Build Coastguard Worker    def test_dim_reduction(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        example = [[-1, 2, 1], [5, 3, 6]]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        sum_dtype = {
*da0073e9SAndroid Build Coastguard Worker            torch.bfloat16: torch.bfloat16,
*da0073e9SAndroid Build Coastguard Worker            torch.double: torch.double,
*da0073e9SAndroid Build Coastguard Worker            torch.float: torch.float,
*da0073e9SAndroid Build Coastguard Worker            torch.half: torch.half,
*da0073e9SAndroid Build Coastguard Worker            torch.int64: torch.int64,
*da0073e9SAndroid Build Coastguard Worker            torch.int32: torch.int64,
*da0073e9SAndroid Build Coastguard Worker            torch.int16: torch.int64,
*da0073e9SAndroid Build Coastguard Worker            torch.int8: torch.int64
*da0073e9SAndroid Build Coastguard Worker        }
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # This won't test for 256bit instructions, since we usually
*da0073e9SAndroid Build Coastguard Worker        # only work on 1 cacheline (512bit) at a time and these
*da0073e9SAndroid Build Coastguard Worker        # examples aren't big enough to trigger that.
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(example, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.sum().item(), 16)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.sum(0), torch.tensor([4, 5, 7], dtype=sum_dtype[dtype]))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.sum(1), torch.tensor([2, 14], dtype=sum_dtype[dtype]))
*da0073e9SAndroid Build Coastguard Worker        y = torch.tensor(example, device=device, dtype=sum_dtype[dtype])
*da0073e9SAndroid Build Coastguard Worker        torch.sum(x, 0, out=y)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.sum(0), y)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Mean not supported for Int types
*da0073e9SAndroid Build Coastguard Worker        if dtype in [torch.float16, torch.bfloat16, torch.float32, torch.float64]:
*da0073e9SAndroid Build Coastguard Worker            x = torch.tensor(example, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.mean().item(), 16.0 / 6)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.mean(0), torch.tensor([2.0, 2.5, 7.0 / 2], dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.mean(1), torch.tensor([2.0 / 3, 14.0 / 3], dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.mean(), x.mean((0, 1)))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        prod_dtype = {
*da0073e9SAndroid Build Coastguard Worker            torch.bfloat16: torch.bfloat16,
*da0073e9SAndroid Build Coastguard Worker            torch.double: torch.double,
*da0073e9SAndroid Build Coastguard Worker            torch.float: torch.float,
*da0073e9SAndroid Build Coastguard Worker            torch.float16: torch.float16,
*da0073e9SAndroid Build Coastguard Worker            torch.int64: torch.int64,
*da0073e9SAndroid Build Coastguard Worker            torch.int32: torch.int64,
*da0073e9SAndroid Build Coastguard Worker            torch.int16: torch.int64,
*da0073e9SAndroid Build Coastguard Worker            torch.int8: torch.int64,
*da0073e9SAndroid Build Coastguard Worker        }
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # prod is not supported for float16 & bfloat16 on CPU
*da0073e9SAndroid Build Coastguard Worker        if not (self.device_type == 'cpu' and dtype in [torch.float16, torch.bfloat16]):
*da0073e9SAndroid Build Coastguard Worker            x = torch.tensor(example, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.prod().item(), -180)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.prod(0), torch.tensor([-5, 6, 6], dtype=prod_dtype[dtype]))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.prod(1), torch.tensor([-2, 90], dtype=prod_dtype[dtype]))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(example, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.min().item(), -1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin().item(), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # TODO: torch.min does not support the same operation as argmin
*da0073e9SAndroid Build Coastguard Worker        # for the same case, should we enable it?
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(dim=None).item(), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.min(0), (torch.tensor([-1, 2, 1], dtype=dtype),
*da0073e9SAndroid Build Coastguard Worker                                    torch.tensor([0, 0, 0], dtype=torch.int64)))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.amin(0), torch.tensor([-1, 2, 1], dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(0), torch.tensor([0, 0, 0], dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.min(dim=0, keepdim=True), (torch.tensor([[-1, 2, 1]], dtype=dtype),
*da0073e9SAndroid Build Coastguard Worker                         torch.tensor([[0, 0, 0]], dtype=torch.int64)))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.amin(dim=0, keepdim=True), torch.tensor([[-1, 2, 1]], dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(dim=0, keepdim=True), torch.tensor([[0, 0, 0]], dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.min(1), (torch.tensor([-1, 3], dtype=dtype),
*da0073e9SAndroid Build Coastguard Worker                         torch.tensor([0, 1], dtype=torch.int64)))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.amin(1), torch.tensor([-1, 3], dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(1), torch.tensor([0, 1], dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.min(dim=1, keepdim=True), (torch.tensor([[-1], [3]], dtype=dtype),
*da0073e9SAndroid Build Coastguard Worker                         torch.tensor([[0], [1]], dtype=torch.int64)))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.amin(dim=1, keepdim=True), torch.tensor([[-1], [3]], dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(dim=1, keepdim=True), torch.tensor([[0], [1]], dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test that non-contiguous tensors work
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x[:, :2].min().item(), -1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x[:, :2].amin().item(), -1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x[:, :2].argmin().item(), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.tensor(example, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.max().item(), 6)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.amax().item(), 6)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax().item(), 5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.max(0), (torch.tensor([5, 3, 6], dtype=dtype),
*da0073e9SAndroid Build Coastguard Worker                                    torch.tensor([1, 1, 1], dtype=torch.int64)))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.amax(0), torch.tensor([5, 3, 6], dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax(dim=0), torch.tensor([1, 1, 1], dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.max(dim=0, keepdim=True), (torch.tensor([[5, 3, 6]], dtype=dtype),
*da0073e9SAndroid Build Coastguard Worker                                                      torch.tensor([[1, 1, 1]], dtype=torch.int64)))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.amax(dim=0, keepdim=True), torch.tensor([[5, 3, 6]], dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax(dim=0, keepdim=True), torch.tensor([[1, 1, 1]], dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.max(1), (torch.tensor([2, 6], dtype=dtype),
*da0073e9SAndroid Build Coastguard Worker                                    torch.tensor([1, 2], dtype=torch.int64)))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.amax(1), torch.tensor([2, 6], dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax(dim=1), torch.tensor([1, 2], dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.max(1, keepdim=True), (torch.tensor([[2], [6]], dtype=dtype),
*da0073e9SAndroid Build Coastguard Worker                                                  torch.tensor([[1], [2]], dtype=torch.int64)))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.amax(1, keepdim=True), torch.tensor([[2], [6]], dtype=dtype))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax(dim=1, keepdim=True), torch.tensor([[1], [2]], dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test that non-contiguous tensors work
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x[:, :2].max().item(), 5)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x[:, :2].amax().item(), 5)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x[:, :2].argmax().item(), 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @precisionOverride({torch.float16: 1e-2, torch.bfloat16: 1e-2})
*da0073e9SAndroid Build Coastguard Worker    @dtypes(*set(all_types_and(torch.half, torch.bfloat16)) - {torch.uint8})
*da0073e9SAndroid Build Coastguard Worker    @parametrize("fn_name", [
*da0073e9SAndroid Build Coastguard Worker        "mean", "median", "nanmedian", "mode", "norm", "prod",
*da0073e9SAndroid Build Coastguard Worker        "std", "sum", "var", "max", "min", "amax", "amin"])
*da0073e9SAndroid Build Coastguard Worker    def test_dim_reduction_fns(self, device, dtype, fn_name):
*da0073e9SAndroid Build Coastguard Worker        def normfn_attr(t, dim, keepdim=False, out=None):
*da0073e9SAndroid Build Coastguard Worker            attr = torch.norm
*da0073e9SAndroid Build Coastguard Worker            return attr(t, 2, dim, keepdim, out=out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        fn_attr = getattr(torch, fn_name) if fn_name != "norm" else normfn_attr
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn(x, dim, keepdim=False, out=None):
*da0073e9SAndroid Build Coastguard Worker            ans = fn_attr(x, dim, keepdim=keepdim, out=out)
*da0073e9SAndroid Build Coastguard Worker            return ans if not isinstance(ans, tuple) else ans[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def fn_tuple(x, dim, keepdim=False, out=None):
*da0073e9SAndroid Build Coastguard Worker            return fn_attr(x, dim, keepdim=keepdim, out=out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def test_multidim(x, dim):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(fn(x, dim).unsqueeze(dim), fn(x, dim, keepdim=True))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.ndimension() - 1, fn(x, dim).ndimension())
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.ndimension(), fn(x, dim, keepdim=True).ndimension())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # general case
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(3, 4, 5, device=device)
*da0073e9SAndroid Build Coastguard Worker        dim = random.randint(0, 2)
*da0073e9SAndroid Build Coastguard Worker        test_multidim(x, dim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check 1-d behavior
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(1, device=device)
*da0073e9SAndroid Build Coastguard Worker        dim = 0
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(fn(x, dim).shape, ())
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(fn(x, dim, keepdim=True).shape, (1,))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check reducing of a singleton dimension
*da0073e9SAndroid Build Coastguard Worker        dims = [3, 4, 5]
*da0073e9SAndroid Build Coastguard Worker        singleton_dim = random.randint(0, 2)
*da0073e9SAndroid Build Coastguard Worker        dims[singleton_dim] = 1
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(dims, device=device)
*da0073e9SAndroid Build Coastguard Worker        test_multidim(x, singleton_dim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check reducing with output kwargs
*da0073e9SAndroid Build Coastguard Worker        if fn_name in ['median', 'nanmedian', 'mode', 'max', 'min']:
*da0073e9SAndroid Build Coastguard Worker            y = torch.randn(5, 3, device=device)
*da0073e9SAndroid Build Coastguard Worker            values = torch.randn(5, 3, device=device)
*da0073e9SAndroid Build Coastguard Worker            indices = torch.zeros(5, 3, device=device).long() - 1
*da0073e9SAndroid Build Coastguard Worker            fn_tuple(y, 1, keepdim=False, out=(values[:, 1], indices[:, 1]))
*da0073e9SAndroid Build Coastguard Worker            values_expected, indices_expected = fn_tuple(y, 1, keepdim=False)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(values[:, 1], values_expected,
*da0073e9SAndroid Build Coastguard Worker                             msg=f'{fn_name} values with out= kwarg')
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(indices[:, 1], indices_expected,
*da0073e9SAndroid Build Coastguard Worker                             msg=f'{fn_name} indices with out= kwarg')
*da0073e9SAndroid Build Coastguard Worker            return
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(5, 3, device=device)
*da0073e9SAndroid Build Coastguard Worker        y = torch.randn(5, 3, device=device)
*da0073e9SAndroid Build Coastguard Worker        fn(y, 1, keepdim=False, out=x[:, 1])
*da0073e9SAndroid Build Coastguard Worker        expected = fn(y, 1, keepdim=False)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x[:, 1], expected, msg=f'{fn_name} with out= kwarg')
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    @largeTensorTest('10GB')
*da0073e9SAndroid Build Coastguard Worker    def test_reduction_split(self, device):
*da0073e9SAndroid Build Coastguard Worker        # Test reduction when there is a 32bit-indexing split
*da0073e9SAndroid Build Coastguard Worker        # https://github.com/pytorch/pytorch/issues/37583
*da0073e9SAndroid Build Coastguard Worker        input_ = torch.randn(5, 14400, 14400, device=device)
*da0073e9SAndroid Build Coastguard Worker        result = input_.sum(dim=0)
*da0073e9SAndroid Build Coastguard Worker        expect = input_[0] + input_[1] + input_[2] + input_[3] + input_[4]
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(result, expect)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.half, torch.float, torch.double, torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker    def test_reduction_vectorize_along_input_corner(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        # 1D case: sum
*da0073e9SAndroid Build Coastguard Worker        size = 1024 * 1024 * 64 + 3
*da0073e9SAndroid Build Coastguard Worker        shift = 1
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(size, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        y = x[shift:]
*da0073e9SAndroid Build Coastguard Worker        for i in range(100):
*da0073e9SAndroid Build Coastguard Worker            x.zero_()
*da0073e9SAndroid Build Coastguard Worker            x[i] = 1
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.sum(), 1.0)
*da0073e9SAndroid Build Coastguard Worker            if i < shift:
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(y.sum(), 0.0)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(y.sum(), 1.0)
*da0073e9SAndroid Build Coastguard Worker        for i in range(1, 100):
*da0073e9SAndroid Build Coastguard Worker            x.zero_()
*da0073e9SAndroid Build Coastguard Worker            x[-i] = 1
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.sum(), 1.0)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(y.sum(), 1.0)
*da0073e9SAndroid Build Coastguard Worker        # 1D case: argmax
*da0073e9SAndroid Build Coastguard Worker        size = 1024 * 1024 * 64 + 3
*da0073e9SAndroid Build Coastguard Worker        shift = 1
*da0073e9SAndroid Build Coastguard Worker        ysize = size - shift
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(size, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        y = x[shift:]
*da0073e9SAndroid Build Coastguard Worker        for i in range(100):
*da0073e9SAndroid Build Coastguard Worker            x.zero_()
*da0073e9SAndroid Build Coastguard Worker            x[i] = 1
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.argmax().item(), i)
*da0073e9SAndroid Build Coastguard Worker            if i >= shift:
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(y.argmax().item(), i - shift)
*da0073e9SAndroid Build Coastguard Worker        for i in range(1, 100):
*da0073e9SAndroid Build Coastguard Worker            x.zero_()
*da0073e9SAndroid Build Coastguard Worker            x[-i] = 1
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(x.argmax().item(), size - i)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(y.argmax().item(), ysize - i)
*da0073e9SAndroid Build Coastguard Worker        # 2D case: sum
*da0073e9SAndroid Build Coastguard Worker        size = (7, 1024 * 1024 + 3)
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(size, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        for i in range(100):
*da0073e9SAndroid Build Coastguard Worker            x.zero_()
*da0073e9SAndroid Build Coastguard Worker            for j in range(7):
*da0073e9SAndroid Build Coastguard Worker                x[j][i] = j
*da0073e9SAndroid Build Coastguard Worker            xs = x.sum(dim=-1)
*da0073e9SAndroid Build Coastguard Worker            for j in range(7):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(xs[j].item(), float(j))
*da0073e9SAndroid Build Coastguard Worker        for i in range(100):
*da0073e9SAndroid Build Coastguard Worker            x.zero_()
*da0073e9SAndroid Build Coastguard Worker            for j in range(7):
*da0073e9SAndroid Build Coastguard Worker                x[j][-i] = j
*da0073e9SAndroid Build Coastguard Worker            xs = x.sum(dim=-1)
*da0073e9SAndroid Build Coastguard Worker            for j in range(7):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(xs[j].item(), float(j))
*da0073e9SAndroid Build Coastguard Worker        # 2D case: max/argmax
*da0073e9SAndroid Build Coastguard Worker        size = (7, 1024 * 1024 + 3)
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(size, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        for i in range(100):
*da0073e9SAndroid Build Coastguard Worker            x.zero_()
*da0073e9SAndroid Build Coastguard Worker            for j in range(7):
*da0073e9SAndroid Build Coastguard Worker                x[j][i] = j + 1
*da0073e9SAndroid Build Coastguard Worker            xs1 = x.argmax(dim=-1)
*da0073e9SAndroid Build Coastguard Worker            xs2 = x.max(dim=-1).indices
*da0073e9SAndroid Build Coastguard Worker            for j in range(7):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(xs1[j].item(), i)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(xs2[j].item(), i)
*da0073e9SAndroid Build Coastguard Worker        for i in range(1, 100):
*da0073e9SAndroid Build Coastguard Worker            x.zero_()
*da0073e9SAndroid Build Coastguard Worker            for j in range(7):
*da0073e9SAndroid Build Coastguard Worker                x[j][-i] = j + 1
*da0073e9SAndroid Build Coastguard Worker            xs1 = x.argmax(dim=-1)
*da0073e9SAndroid Build Coastguard Worker            xs2 = x.max(dim=-1).indices
*da0073e9SAndroid Build Coastguard Worker            for j in range(7):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(xs1[j].item(), size[1] - i)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(xs2[j].item(), size[1] - i)
*da0073e9SAndroid Build Coastguard Worker        # 2D case: min/argmin
*da0073e9SAndroid Build Coastguard Worker        size = (7, 1024 * 1024 + 3)
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(size, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        for i in range(100):
*da0073e9SAndroid Build Coastguard Worker            x.zero_()
*da0073e9SAndroid Build Coastguard Worker            for j in range(7):
*da0073e9SAndroid Build Coastguard Worker                x[j][i] = -(j + 1)
*da0073e9SAndroid Build Coastguard Worker            xs1 = x.argmin(dim=-1)
*da0073e9SAndroid Build Coastguard Worker            xs2 = x.min(dim=-1).indices
*da0073e9SAndroid Build Coastguard Worker            for j in range(7):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(xs1[j].item(), i)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(xs2[j].item(), i)
*da0073e9SAndroid Build Coastguard Worker        for i in range(1, 100):
*da0073e9SAndroid Build Coastguard Worker            x.zero_()
*da0073e9SAndroid Build Coastguard Worker            for j in range(7):
*da0073e9SAndroid Build Coastguard Worker                x[j][-i] = -(j + 1)
*da0073e9SAndroid Build Coastguard Worker            xs1 = x.argmin(dim=-1)
*da0073e9SAndroid Build Coastguard Worker            xs2 = x.min(dim=-1).indices
*da0073e9SAndroid Build Coastguard Worker            for j in range(7):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(xs1[j].item(), size[1] - i)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(xs2[j].item(), size[1] - i)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.half, torch.float, torch.double, torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker    def test_reduction_vectorize_along_output(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        def run_test(input_):
*da0073e9SAndroid Build Coastguard Worker            M, N = input_.shape
*da0073e9SAndroid Build Coastguard Worker            input_.zero_()
*da0073e9SAndroid Build Coastguard Worker            for i in range(min(M, N)):
*da0073e9SAndroid Build Coastguard Worker                input_[i][i] = 1
*da0073e9SAndroid Build Coastguard Worker            output1 = input_.argmax(dim=0)
*da0073e9SAndroid Build Coastguard Worker            output2 = input_.sum(dim=0)
*da0073e9SAndroid Build Coastguard Worker            for i in range(min(M, N)):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(output1[i], i)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(output2[i], 1)
*da0073e9SAndroid Build Coastguard Worker        # vec 4
*da0073e9SAndroid Build Coastguard Worker        run_test(torch.zeros(64, 64, dtype=dtype, device=device))
*da0073e9SAndroid Build Coastguard Worker        # vec 2
*da0073e9SAndroid Build Coastguard Worker        run_test(torch.zeros(64 * 64 + 2, dtype=dtype, device=device)[2:].view(64, 64))
*da0073e9SAndroid Build Coastguard Worker        run_test(torch.zeros(64, 62, dtype=dtype, device=device))
*da0073e9SAndroid Build Coastguard Worker        run_test(torch.zeros(64, 2, dtype=dtype, device=device))
*da0073e9SAndroid Build Coastguard Worker        # vec 1
*da0073e9SAndroid Build Coastguard Worker        run_test(torch.zeros(64 * 64 + 1, dtype=dtype, device=device)[1:].view(64, 64))
*da0073e9SAndroid Build Coastguard Worker        run_test(torch.zeros(64, 61, dtype=dtype, device=device))
*da0073e9SAndroid Build Coastguard Worker        run_test(torch.zeros(64, 1, dtype=dtype, device=device))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    def test_argminmax_large_axis(self, device):
*da0073e9SAndroid Build Coastguard Worker        # Regression test for gh-32863
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(2**31, device=device, dtype=torch.int8)
*da0073e9SAndroid Build Coastguard Worker        x[-1] = 1
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax(0), x.shape[0] - 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.max(0).indices, x.shape[0] - 1)
*da0073e9SAndroid Build Coastguard Worker        x[-1] = -1
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(0), x.shape[0] - 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.min(0).indices, x.shape[0] - 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_argminmax_axis_with_dim_one(self, device):
*da0073e9SAndroid Build Coastguard Worker        # See: https://github.com/pytorch/pytorch/issues/38922
*da0073e9SAndroid Build Coastguard Worker        n = 32768
*da0073e9SAndroid Build Coastguard Worker        x = torch.zeros(1, n)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax(dim=0), torch.zeros(n, dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(dim=0), torch.zeros(n, dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax(dim=-2), torch.zeros(n, dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(dim=-2), torch.zeros(n, dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax(dim=0, keepdim=True), torch.zeros(1, n, dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(dim=0, keepdim=True), torch.zeros(1, n, dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmax(dim=-2, keepdim=True), torch.zeros(1, n, dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(x.argmin(dim=-2, keepdim=True), torch.zeros(1, n, dtype=torch.int64))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.int, torch.long, torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(torch.int, torch.long, torch.half, torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_median_real_values(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        # Generate random 0-3D sizes
*da0073e9SAndroid Build Coastguard Worker        sizes = [random.sample(range(1, 32), i) for i in range(4) for _ in range(2)]
*da0073e9SAndroid Build Coastguard Worker        for size in sizes:
*da0073e9SAndroid Build Coastguard Worker            # Create random input tensor
*da0073e9SAndroid Build Coastguard Worker            t = torch.randn(size, device=device).type(dtype)
*da0073e9SAndroid Build Coastguard Worker            t_numpy = t.cpu().numpy()
*da0073e9SAndroid Build Coastguard Worker            res = t.median()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(res, t.nanmedian())
*da0073e9SAndroid Build Coastguard Worker            k = int((t.numel() - 1) / 2)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(res, t.view(-1).sort()[0][k])
*da0073e9SAndroid Build Coastguard Worker            if t.numel() % 2 == 1:
*da0073e9SAndroid Build Coastguard Worker                # We can only test agains numpy for odd reductions because numpy
*da0073e9SAndroid Build Coastguard Worker                # returns the mean of the two medians and torch returns the lower
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(res.cpu().numpy(), np.median(t_numpy))
*da0073e9SAndroid Build Coastguard Worker            for dim in range(t.ndim):
*da0073e9SAndroid Build Coastguard Worker                res = t.median(dim, True)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(res, t.nanmedian(dim, True))
*da0073e9SAndroid Build Coastguard Worker                size = t.size(dim) if t.ndim > 0 else 1
*da0073e9SAndroid Build Coastguard Worker                k = int((size - 1) / 2)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(res[0], (t.sort(dim)[0]).select(dim, k).unsqueeze_(dim))
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(res[0], t.gather(dim, res[1]))
*da0073e9SAndroid Build Coastguard Worker                if size % 2 == 1:
*da0073e9SAndroid Build Coastguard Worker                    # We can only test agains numpy for odd reductions because numpy
*da0073e9SAndroid Build Coastguard Worker                    # returns the mean of the two medians and torch returns the lower
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(res[0].cpu().numpy(), np.median(t_numpy, dim, keepdims=True), exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    @dtypesIfCUDA(torch.half, torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_median_nan_values(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        # Generate random 0-3D sizes
*da0073e9SAndroid Build Coastguard Worker        sizes = [random.sample(range(1, 32), i) for i in range(4) for _ in range(2)]
*da0073e9SAndroid Build Coastguard Worker        for size in sizes:
*da0073e9SAndroid Build Coastguard Worker            # Create random input tensor with nan values
*da0073e9SAndroid Build Coastguard Worker            t = torch.rand(size, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            t.masked_fill_(t < 0.1, float('nan'))
*da0073e9SAndroid Build Coastguard Worker            t_numpy = t.cpu().numpy()
*da0073e9SAndroid Build Coastguard Worker            for op in [torch.median, torch.nanmedian]:
*da0073e9SAndroid Build Coastguard Worker                numpy_op = np.median if op == torch.median else np.nanmedian
*da0073e9SAndroid Build Coastguard Worker                res = op(t)
*da0073e9SAndroid Build Coastguard Worker                num_nan = t.isnan().sum()
*da0073e9SAndroid Build Coastguard Worker                if op == torch.median and num_nan > 0:
*da0073e9SAndroid Build Coastguard Worker                    k = t.numel() - 1
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    k = int((t.numel() - num_nan - 1) / 2)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(res, t.view(-1).sort()[0][k])
*da0073e9SAndroid Build Coastguard Worker                if (t.numel() - num_nan) % 2 == 1:
*da0073e9SAndroid Build Coastguard Worker                    # We can only test agains numpy for odd reductions because numpy
*da0073e9SAndroid Build Coastguard Worker                    # returns the mean of the two medians and torch returns the lower
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(res.item(), numpy_op(t.cpu().numpy()))
*da0073e9SAndroid Build Coastguard Worker                for dim in range(t.ndim):
*da0073e9SAndroid Build Coastguard Worker                    res = op(t, dim, True)
*da0073e9SAndroid Build Coastguard Worker                    size = t.size(dim) if t.ndim > 0 else 1
*da0073e9SAndroid Build Coastguard Worker                    num_nan = t.isnan().sum(dim, True)
*da0073e9SAndroid Build Coastguard Worker                    if op == torch.median:
*da0073e9SAndroid Build Coastguard Worker                        k = torch.where(num_nan > 0, size - 1, int((size - 1) / 2))
*da0073e9SAndroid Build Coastguard Worker                    else:
*da0073e9SAndroid Build Coastguard Worker                        k = ((size - num_nan - 1) / 2).type(torch.long)
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(res[0], (t.sort(dim)[0]).gather(dim, k))
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(res[0], t.gather(dim, res[1]))
*da0073e9SAndroid Build Coastguard Worker                    # We can only test agains numpy for odd reductions because numpy
*da0073e9SAndroid Build Coastguard Worker                    # returns the mean of the two medians and torch returns the lower
*da0073e9SAndroid Build Coastguard Worker                    mask = (size - num_nan) % 2 == 1
*da0073e9SAndroid Build Coastguard Worker                    res = res[0].masked_select(mask).cpu()
*da0073e9SAndroid Build Coastguard Worker                    ref = numpy_op(t_numpy, dim, keepdims=True)[mask.cpu().numpy()]
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(res, torch.from_numpy(ref))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_median_corner_cases(self, device):
*da0073e9SAndroid Build Coastguard Worker        def check(op, a, args, key):
*da0073e9SAndroid Build Coastguard Worker            t = torch.tensor(a, device=device)
*da0073e9SAndroid Build Coastguard Worker            res = op(t, *args)
*da0073e9SAndroid Build Coastguard Worker            if not args:
*da0073e9SAndroid Build Coastguard Worker                key = torch.tensor(key, device=device)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                if len(key) == 1:
*da0073e9SAndroid Build Coastguard Worker                    key = torch.tensor(key[0], device=device)
*da0073e9SAndroid Build Coastguard Worker                    res = res[0]
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    key = (torch.tensor(key[0], device=device), torch.tensor(key[1], device=device))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(res, key)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        nan = float('nan')
*da0073e9SAndroid Build Coastguard Worker        check(torch.median, nan, [], nan)
*da0073e9SAndroid Build Coastguard Worker        check(torch.median, [], [], nan)
*da0073e9SAndroid Build Coastguard Worker        check(torch.nanmedian, nan, [], nan)
*da0073e9SAndroid Build Coastguard Worker        check(torch.median, nan, [0], [nan, 0])
*da0073e9SAndroid Build Coastguard Worker        check(torch.nanmedian, nan, [0], [nan, 0])
*da0073e9SAndroid Build Coastguard Worker        check(torch.median, [nan], [0, True], [[nan], [0]])
*da0073e9SAndroid Build Coastguard Worker        check(torch.nanmedian, [nan], [0, True], [[nan], [0]])
*da0073e9SAndroid Build Coastguard Worker        check(torch.median, [nan], [0, True], [[nan], [0]])
*da0073e9SAndroid Build Coastguard Worker        check(torch.nanmedian, [nan], [0, True], [[nan], [0]])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Indices are not deterministic here so can only check values
*da0073e9SAndroid Build Coastguard Worker        check(torch.median, [[nan, nan], [1, 2]], [0], [[nan, nan]])
*da0073e9SAndroid Build Coastguard Worker        check(torch.nanmedian, [[nan, nan], [1, 2]], [0], [[1, 2.]])
*da0073e9SAndroid Build Coastguard Worker        check(torch.median, [[nan, nan], [1, 2]], [1], [[nan, 1]])
*da0073e9SAndroid Build Coastguard Worker        check(torch.nanmedian, [[nan, nan], [1, 2]], [1], [[nan, 1.]])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Discontiguous and strided tensors
*da0073e9SAndroid Build Coastguard Worker        a = torch.arange(12, device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a[::2].median(), torch.tensor(4, device=device))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a[::2].nanmedian(), torch.tensor(4, device=device))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a.resize_(3, 4)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.T.median(), torch.tensor(5, device=device))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.T.nanmedian(), torch.tensor(5, device=device))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a[::2, ::2].median(-1)[0], torch.tensor([0, 8], device=device))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a[::2, ::2].nanmedian(-1)[0], torch.tensor([0, 8], device=device))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        a.resize_(2, 3, 2)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.T.median(), torch.tensor(5, device=device))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a.T.nanmedian(), torch.tensor(5, device=device))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a[:, ::2, :].median(-1)[0], torch.tensor([[0, 4], [6, 10]], device=device))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(a[:, ::2, :].nanmedian(-1)[0], torch.tensor([[0, 4], [6, 10]], device=device))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyNativeDeviceTypes
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.double)
*da0073e9SAndroid Build Coastguard Worker    def test_quantile(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        # Generate some random test cases
*da0073e9SAndroid Build Coastguard Worker        ops = ['quantile', 'nanquantile']
*da0073e9SAndroid Build Coastguard Worker        inputs = [tuple(np.random.randint(2, 10, size=i)) for i in range(1, 4)]
*da0073e9SAndroid Build Coastguard Worker        quantiles = [tuple(np.random.rand(i)) for i in range(0, 5)]
*da0073e9SAndroid Build Coastguard Worker        keepdims = [True, False]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Add corner cases
*da0073e9SAndroid Build Coastguard Worker        inputs.extend([0.75, (1,), (1, 1), (1, 2, 1)])
*da0073e9SAndroid Build Coastguard Worker        inputs.extend([[float('nan')], [[float('nan'), float('nan')], [1, 2]]])
*da0073e9SAndroid Build Coastguard Worker        inputs.extend([[[float('nan'), float('nan')], [float('nan'), 2]]])
*da0073e9SAndroid Build Coastguard Worker        quantiles.extend([0.5, [0., 1.], np.random.rand(10)])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Enumerate all input combinations
*da0073e9SAndroid Build Coastguard Worker        for op, x, q, keepdim in product(ops, inputs, quantiles, keepdims):
*da0073e9SAndroid Build Coastguard Worker            if type(x) is tuple:
*da0073e9SAndroid Build Coastguard Worker                a = torch.randn(x, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker                # Make some random elements NaN
*da0073e9SAndroid Build Coastguard Worker                a.masked_fill_(torch.randint_like(a, 20) == 0, float('nan'))
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                a = torch.tensor(x, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            q = torch.tensor(q, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            torch_op = getattr(torch, op)
*da0073e9SAndroid Build Coastguard Worker            numpy_op = getattr(np, op)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Compute quantile along every dimension and flattened tensor
*da0073e9SAndroid Build Coastguard Worker            interpolations = ('linear', 'lower', 'higher', 'midpoint', 'nearest')
*da0073e9SAndroid Build Coastguard Worker            for interpolation, dim in product(interpolations,
*da0073e9SAndroid Build Coastguard Worker                                              [None] + list(range(a.ndim))):
*da0073e9SAndroid Build Coastguard Worker                result = torch_op(a, q, dim=dim, keepdim=keepdim, interpolation=interpolation)
*da0073e9SAndroid Build Coastguard Worker                expected = numpy_op(a.cpu().numpy(), q.cpu().numpy(), dim,
*da0073e9SAndroid Build Coastguard Worker                                    interpolation=interpolation, keepdims=keepdim)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(result.cpu(), torch.from_numpy(np.array(expected)).type(result.type()))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # Test out variation
*da0073e9SAndroid Build Coastguard Worker                out = torch.empty_like(result)
*da0073e9SAndroid Build Coastguard Worker                torch_op(a, q, dim=dim, keepdim=keepdim, interpolation=interpolation, out=out)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(out.cpu(), result.cpu())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_quantile_backward(self, device):
*da0073e9SAndroid Build Coastguard Worker        def check(a, q, dim, expected_grad, ops=(torch.quantile, torch.nanquantile)):
*da0073e9SAndroid Build Coastguard Worker            for op in ops:
*da0073e9SAndroid Build Coastguard Worker                t = torch.tensor(a, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker                op(t, torch.tensor(q, device=device), dim).sum().backward()
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(t.grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check([1., 2, 3], 0.5, 0, [0, 1, 0])
*da0073e9SAndroid Build Coastguard Worker        check([1., 2, 3, 4], 0.5, 0, [0, 0.5, 0.5, 0])
*da0073e9SAndroid Build Coastguard Worker        check([3., 1, 4, 2], 0.5, 0, [0.5, 0, 0, 0.5])
*da0073e9SAndroid Build Coastguard Worker        check([1., 2, 3, 4], [0.25, 0.5, 0.75], 0, [0.25, 1.25, 1.25, 0.25])
*da0073e9SAndroid Build Coastguard Worker        check([[1., 2], [2, 1]], 0., 0, [[1, 0], [0, 1]])
*da0073e9SAndroid Build Coastguard Worker        check([[1., 2], [4, 3]], 1., 1, [[0, 1], [1, 0]])
*da0073e9SAndroid Build Coastguard Worker        check([1, float('nan'), 2], 0.5, 0, [0, 1, 0], [torch.quantile])
*da0073e9SAndroid Build Coastguard Worker        check([1, float('nan'), 2], 0.5, 0, [0.5, 0, 0.5], [torch.nanquantile])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_quantile_error(self, device):
*da0073e9SAndroid Build Coastguard Worker        def check(a, q, args, kwargs, message):
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, r'quantile\(\) ' + message):
*da0073e9SAndroid Build Coastguard Worker                at = torch.tensor(a, device=device)
*da0073e9SAndroid Build Coastguard Worker                qt = torch.tensor(q, device=device) if isinstance(q, list) else q
*da0073e9SAndroid Build Coastguard Worker                torch.quantile(at, qt, *args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        check([], 0.5, [], {}, r'input tensor must be non-empty')
*da0073e9SAndroid Build Coastguard Worker        check([1.], [[1.]], [], {}, r'q must be a scalar or 1D tensor')
*da0073e9SAndroid Build Coastguard Worker        check([1], 0.5, [], {}, r'input tensor must be either float or double dtype')
*da0073e9SAndroid Build Coastguard Worker        check([1.], [1], [], {}, r'q tensor must be same dtype as the input tensor')
*da0073e9SAndroid Build Coastguard Worker        check([1.], -1., [], {}, r'q must be in the range \[0, 1\] but got -1')
*da0073e9SAndroid Build Coastguard Worker        check([1.], 1.1, [], {}, r'q must be in the range \[0, 1\] but got 1.1')
*da0073e9SAndroid Build Coastguard Worker        check([1.], 0.5, [], {'out': torch.empty([], dtype=torch.int32, device=device)},
*da0073e9SAndroid Build Coastguard Worker              r'out tensor must be same dtype as the input tensor')
*da0073e9SAndroid Build Coastguard Worker        check([1.], [1.], [None, False], {'interpolation': 'random_mode'},
*da0073e9SAndroid Build Coastguard Worker              r"interpolation must be one of linear, lower, higher, midpoint or nearest, but got random_mode")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if self.device_type == "cpu":
*da0073e9SAndroid Build Coastguard Worker            check([1.], [0.5, 1.1, -1], [], {}, r'q values must be in the range \[0, 1\]')
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if self.device_type == "cuda":
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                    RuntimeError, r'quantile\(\) q tensor must be on the same device as the input tensor'):
*da0073e9SAndroid Build Coastguard Worker                torch.randn(1, device=device).quantile(torch.tensor(0.5))
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                    RuntimeError, r'quantile\(\) out tensor must be on the same device as the input tensor'):
*da0073e9SAndroid Build Coastguard Worker                torch.quantile(torch.randn(1, device=device), 0.5, out=torch.scalar_tensor(1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_std_mean(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(100, 50, 20, device=device)
*da0073e9SAndroid Build Coastguard Worker        for dim in range(x.dim()):
*da0073e9SAndroid Build Coastguard Worker            for unbiased in [False, True]:
*da0073e9SAndroid Build Coastguard Worker                for keepdim in [False, True]:
*da0073e9SAndroid Build Coastguard Worker                    std1, mean1 = torch.std_mean(x, dim=dim, unbiased=unbiased, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                    std2 = x.std(dim=dim, unbiased=unbiased, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                    mean2 = x.mean(dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(std1, std2)
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(mean1, mean2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_std_mean_all_dims(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(100, 50, 20, device=device)
*da0073e9SAndroid Build Coastguard Worker        for unbiased in [False, True]:
*da0073e9SAndroid Build Coastguard Worker            std1, mean1 = torch.std_mean(x, unbiased=unbiased)
*da0073e9SAndroid Build Coastguard Worker            std2 = x.std(unbiased=unbiased)
*da0073e9SAndroid Build Coastguard Worker            mean2 = x.mean()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(std1, std2)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(mean1, mean2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_var_mean(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(100, 300, 50, device=device)
*da0073e9SAndroid Build Coastguard Worker        for dim in range(x.dim()):
*da0073e9SAndroid Build Coastguard Worker            for unbiased in [False, True]:
*da0073e9SAndroid Build Coastguard Worker                for keepdim in [False, True]:
*da0073e9SAndroid Build Coastguard Worker                    var1, mean1 = torch.var_mean(x, dim=dim, unbiased=unbiased, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                    var2 = x.var(dim=dim, unbiased=unbiased, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                    mean2 = x.mean(dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(var1, var2)
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(mean1, mean2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_var_mean_all_dims(self, device):
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(100, 50, 20, device=device)
*da0073e9SAndroid Build Coastguard Worker        for unbiased in [False, True]:
*da0073e9SAndroid Build Coastguard Worker            var1, mean1 = torch.var_mean(x, unbiased=unbiased)
*da0073e9SAndroid Build Coastguard Worker            var2 = x.var(unbiased=unbiased)
*da0073e9SAndroid Build Coastguard Worker            mean2 = x.mean()
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(var1, var2)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(mean1, mean2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_std_mean_some_dims(self, device):
*da0073e9SAndroid Build Coastguard Worker        sizes = (4, 6, 7, 5, 3)
*da0073e9SAndroid Build Coastguard Worker        dims = len(sizes)
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(sizes, device=device)
*da0073e9SAndroid Build Coastguard Worker        for num_of_dims in range(2, dims):
*da0073e9SAndroid Build Coastguard Worker            dim_list = list(combinations(list(range(dims)), r=num_of_dims))
*da0073e9SAndroid Build Coastguard Worker            for dim in dim_list:
*da0073e9SAndroid Build Coastguard Worker                for unbiased in [False, True]:
*da0073e9SAndroid Build Coastguard Worker                    for keepdim in [False, True]:
*da0073e9SAndroid Build Coastguard Worker                        std1, mean1 = torch.std_mean(x, dim=dim, unbiased=unbiased, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                        std2 = x.std(dim=dim, unbiased=unbiased, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                        mean2 = x.mean(dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                        self.assertEqual(std1, std2)
*da0073e9SAndroid Build Coastguard Worker                        self.assertEqual(mean1, mean2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _compare_std_var_with_numpy(self, op, device, dtype, input, dim,
*da0073e9SAndroid Build Coastguard Worker                                    keepdim, unbiased, use_out):
*da0073e9SAndroid Build Coastguard Worker        a = input.cpu().numpy() if input.dtype is not torch.bfloat16 else input.float().cpu().numpy()
*da0073e9SAndroid Build Coastguard Worker        numpy_kwargs = {
*da0073e9SAndroid Build Coastguard Worker            'axis' : dim,
*da0073e9SAndroid Build Coastguard Worker            'keepdims' : keepdim,
*da0073e9SAndroid Build Coastguard Worker            'ddof' : 1 if unbiased else 0,
*da0073e9SAndroid Build Coastguard Worker        }
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if dim is None:
*da0073e9SAndroid Build Coastguard Worker            del numpy_kwargs['axis']
*da0073e9SAndroid Build Coastguard Worker            del numpy_kwargs['keepdims']
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if op == 'var':
*da0073e9SAndroid Build Coastguard Worker            torch_op = torch.var
*da0073e9SAndroid Build Coastguard Worker            numpy_op = np.var
*da0073e9SAndroid Build Coastguard Worker        elif op == 'std':
*da0073e9SAndroid Build Coastguard Worker            torch_op = torch.std
*da0073e9SAndroid Build Coastguard Worker            numpy_op = np.std
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            self.fail("Unknown op!")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        numpy_result = numpy_op(a, **numpy_kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if dim is None and use_out is False:
*da0073e9SAndroid Build Coastguard Worker            torch_result = torch_op(input, unbiased)
*da0073e9SAndroid Build Coastguard Worker        elif dim is not None and use_out is False:
*da0073e9SAndroid Build Coastguard Worker            torch_result = torch_op(input, dim, unbiased, keepdim)
*da0073e9SAndroid Build Coastguard Worker        elif dim is not None and use_out is True:
*da0073e9SAndroid Build Coastguard Worker            out = torch.empty(0, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            torch_result = torch_op(input, dim, unbiased, keepdim, out=out)
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            out = torch.empty(0, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            torch_result = torch_op(input, dim, unbiased, keepdim, out=out)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        exact_dtype = input.dtype not in (torch.bfloat16, torch.complex32, torch.complex64, torch.complex128)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch_result, numpy_result, exact_dtype=exact_dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.double, torch.cfloat, torch.cdouble)
*da0073e9SAndroid Build Coastguard Worker    def test_var_vs_numpy(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        _size = (20, 20)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for test_case in product((torch.randn(_size, device=device, dtype=dtype),),
*da0073e9SAndroid Build Coastguard Worker                                 (None, 0, 1),
*da0073e9SAndroid Build Coastguard Worker                                 (False, True),
*da0073e9SAndroid Build Coastguard Worker                                 (False, True),
*da0073e9SAndroid Build Coastguard Worker                                 (False, True),):
*da0073e9SAndroid Build Coastguard Worker            self._compare_std_var_with_numpy('var', device, dtype, *test_case)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.double, torch.cfloat, torch.cdouble)
*da0073e9SAndroid Build Coastguard Worker    def test_std_vs_numpy(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        _size = (20, 20)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for test_case in product((torch.randn(_size, device=device, dtype=dtype),),
*da0073e9SAndroid Build Coastguard Worker                                 (None, 0, 1),
*da0073e9SAndroid Build Coastguard Worker                                 (False, True),
*da0073e9SAndroid Build Coastguard Worker                                 (False, True),
*da0073e9SAndroid Build Coastguard Worker                                 (False, True),):
*da0073e9SAndroid Build Coastguard Worker            self._compare_std_var_with_numpy('std', device, dtype, *test_case)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.double, torch.cfloat, torch.cdouble)
*da0073e9SAndroid Build Coastguard Worker    def test_var_correction_vs_numpy(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        _size = (20, 20)
*da0073e9SAndroid Build Coastguard Worker        test_args = [
*da0073e9SAndroid Build Coastguard Worker            *product(
*da0073e9SAndroid Build Coastguard Worker                # dim
*da0073e9SAndroid Build Coastguard Worker                (None, 0, 1),
*da0073e9SAndroid Build Coastguard Worker                # correction
*da0073e9SAndroid Build Coastguard Worker                (None, 0, 10, 30),
*da0073e9SAndroid Build Coastguard Worker                # keepdim
*da0073e9SAndroid Build Coastguard Worker                (False, True),
*da0073e9SAndroid Build Coastguard Worker            ),
*da0073e9SAndroid Build Coastguard Worker            [None, -100, True],  # Negative correction
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tensor = make_tensor(_size, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        array = tensor.cpu().numpy()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for dim, correction, keepdim in test_args:
*da0073e9SAndroid Build Coastguard Worker            numpy_kwargs = dict(axis=dim, ddof=correction, keepdims=keepdim)
*da0073e9SAndroid Build Coastguard Worker            if correction is None:
*da0073e9SAndroid Build Coastguard Worker                # NumPy default is not compatible with torch.std (gh-50010)
*da0073e9SAndroid Build Coastguard Worker                numpy_kwargs['ddof'] = 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            numpy_res = np.asarray(np.var(array, **numpy_kwargs))
*da0073e9SAndroid Build Coastguard Worker            torch_res = torch.var(tensor, dim=dim, correction=correction, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # inf vs. nan results are sensitive to machine precision,
*da0073e9SAndroid Build Coastguard Worker            # just treat them as equivalent
*da0073e9SAndroid Build Coastguard Worker            numpy_res[np.isinf(numpy_res)] = np.nan
*da0073e9SAndroid Build Coastguard Worker            torch_res[torch_res.isinf()] = np.nan
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch_res, numpy_res)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.double, torch.cfloat, torch.cdouble)
*da0073e9SAndroid Build Coastguard Worker    def test_std_correction_vs_numpy(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        _size = (20, 20)
*da0073e9SAndroid Build Coastguard Worker        test_args = [
*da0073e9SAndroid Build Coastguard Worker            *product(
*da0073e9SAndroid Build Coastguard Worker                # dim
*da0073e9SAndroid Build Coastguard Worker                (None, 0, 1),
*da0073e9SAndroid Build Coastguard Worker                # correction
*da0073e9SAndroid Build Coastguard Worker                (None, 0, 10, 30),
*da0073e9SAndroid Build Coastguard Worker                # keepdim
*da0073e9SAndroid Build Coastguard Worker                (False, True),
*da0073e9SAndroid Build Coastguard Worker            ),
*da0073e9SAndroid Build Coastguard Worker            [None, -100, True],  # Negative correction
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tensor = make_tensor(_size, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        array = tensor.cpu().numpy()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for dim, correction, keepdim in test_args:
*da0073e9SAndroid Build Coastguard Worker            numpy_kwargs = dict(axis=dim, ddof=correction, keepdims=keepdim)
*da0073e9SAndroid Build Coastguard Worker            if correction is None:
*da0073e9SAndroid Build Coastguard Worker                # NumPy default is incompatible with torch.std (gh-50010)
*da0073e9SAndroid Build Coastguard Worker                numpy_kwargs['ddof'] = 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            numpy_res = np.asarray(np.std(array, **numpy_kwargs))
*da0073e9SAndroid Build Coastguard Worker            torch_res = torch.std(tensor, dim=dim, correction=correction, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # inf vs. nan results are sensitive to machine precision,
*da0073e9SAndroid Build Coastguard Worker            # just treat them as equivalent
*da0073e9SAndroid Build Coastguard Worker            numpy_res[np.isinf(numpy_res)] = np.nan
*da0073e9SAndroid Build Coastguard Worker            torch_res[torch_res.isinf()] = np.nan
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch_res, numpy_res)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.double, torch.cfloat, torch.cdouble)
*da0073e9SAndroid Build Coastguard Worker    def test_std_mean_correction(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        _size = (20, 20)
*da0073e9SAndroid Build Coastguard Worker        test_args = [
*da0073e9SAndroid Build Coastguard Worker            *product(
*da0073e9SAndroid Build Coastguard Worker                # dim
*da0073e9SAndroid Build Coastguard Worker                (None, 0, 1),
*da0073e9SAndroid Build Coastguard Worker                # correction
*da0073e9SAndroid Build Coastguard Worker                (None, 0, 10, 30),
*da0073e9SAndroid Build Coastguard Worker                # keepdim
*da0073e9SAndroid Build Coastguard Worker                (False, True),
*da0073e9SAndroid Build Coastguard Worker            ),
*da0073e9SAndroid Build Coastguard Worker            [None, -100, True],  # Negative correction
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tensor = make_tensor(_size, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for dim, correction, keepdim in test_args:
*da0073e9SAndroid Build Coastguard Worker            kwargs = dict(dim=dim, correction=correction, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker            std1 = torch.std(tensor, **kwargs)
*da0073e9SAndroid Build Coastguard Worker            if dim is not None:
*da0073e9SAndroid Build Coastguard Worker                mean1 = torch.mean(tensor, dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                mean1 = torch.mean(tensor)
*da0073e9SAndroid Build Coastguard Worker                if keepdim:
*da0073e9SAndroid Build Coastguard Worker                    mean1 = mean1.reshape((1,) * tensor.ndim)
*da0073e9SAndroid Build Coastguard Worker            std2, mean2 = torch.std_mean(tensor, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(std1, std2)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(mean1, mean2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.double, torch.cfloat, torch.cdouble)
*da0073e9SAndroid Build Coastguard Worker    def test_var_mean_correction(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        _size = (20, 20)
*da0073e9SAndroid Build Coastguard Worker        test_args = [
*da0073e9SAndroid Build Coastguard Worker            *product(
*da0073e9SAndroid Build Coastguard Worker                # dim
*da0073e9SAndroid Build Coastguard Worker                (None, 0, 1),
*da0073e9SAndroid Build Coastguard Worker                # correction
*da0073e9SAndroid Build Coastguard Worker                (None, 0, 10, 30),
*da0073e9SAndroid Build Coastguard Worker                # keepdim
*da0073e9SAndroid Build Coastguard Worker                (False, True),
*da0073e9SAndroid Build Coastguard Worker            ),
*da0073e9SAndroid Build Coastguard Worker            [None, -100, True],  # Negative correction
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tensor = make_tensor(_size, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for dim, correction, keepdim in test_args:
*da0073e9SAndroid Build Coastguard Worker            kwargs = dict(dim=dim, correction=correction, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker            var1 = torch.var(tensor, **kwargs)
*da0073e9SAndroid Build Coastguard Worker            if dim is not None:
*da0073e9SAndroid Build Coastguard Worker                mean1 = torch.mean(tensor, dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                mean1 = torch.mean(tensor)
*da0073e9SAndroid Build Coastguard Worker                if keepdim:
*da0073e9SAndroid Build Coastguard Worker                    mean1 = mean1.reshape((1,) * tensor.ndim)
*da0073e9SAndroid Build Coastguard Worker            var2, mean2 = torch.var_mean(tensor, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(var1, var2)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(mean1, mean2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float, torch.double, torch.cfloat, torch.cdouble)
*da0073e9SAndroid Build Coastguard Worker    def test_warn_invalid_degrees_of_freedom(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        def _assert_warning(_func, _tensor, _correction):
*da0073e9SAndroid Build Coastguard Worker            with warnings.catch_warnings(record=True) as w:
*da0073e9SAndroid Build Coastguard Worker                _func(_tensor, dim=-1, correction=_correction)
*da0073e9SAndroid Build Coastguard Worker            self.assertIn('degrees of freedom is <= 0', str(w[0].message))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        correction = 20
*da0073e9SAndroid Build Coastguard Worker        size = (10, correction)
*da0073e9SAndroid Build Coastguard Worker        tensor = make_tensor(size, dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker        for f in [torch.std, torch.var, torch.var_mean, torch.std_mean]:
*da0073e9SAndroid Build Coastguard Worker            _assert_warning(f, tensor, correction)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_amin_amax_some_dims(self, device):
*da0073e9SAndroid Build Coastguard Worker        sizes = (4, 6, 7, 5, 3)
*da0073e9SAndroid Build Coastguard Worker        dims = len(sizes)
*da0073e9SAndroid Build Coastguard Worker        x = torch.rand(sizes, device=device)
*da0073e9SAndroid Build Coastguard Worker        for num_of_dims in range(2, dims):
*da0073e9SAndroid Build Coastguard Worker            dim_list = list(combinations(list(range(dims)), r=num_of_dims))
*da0073e9SAndroid Build Coastguard Worker            for dim in dim_list:
*da0073e9SAndroid Build Coastguard Worker                for keepdim in [False, True]:
*da0073e9SAndroid Build Coastguard Worker                    amin1 = torch.amin(x, dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                    amax1 = torch.amax(x, dim=dim, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                    amin2 = x
*da0073e9SAndroid Build Coastguard Worker                    amax2 = x
*da0073e9SAndroid Build Coastguard Worker                    for i, d in enumerate(dim):
*da0073e9SAndroid Build Coastguard Worker                        if not keepdim:
*da0073e9SAndroid Build Coastguard Worker                            d -= i
*da0073e9SAndroid Build Coastguard Worker                        amin2 = torch.amin(amin2, dim=d, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                        amax2 = torch.amax(amax2, dim=d, keepdim=keepdim)
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(amin1, amin2)
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(amax1, amax2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_histc(self, device):
*da0073e9SAndroid Build Coastguard Worker        # negative nbins throws
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'bins must be > 0'):
*da0073e9SAndroid Build Coastguard Worker            torch.histc(torch.tensor([1], dtype=torch.float, device=device), bins=-1)
*da0073e9SAndroid Build Coastguard Worker        # empty tensor
*da0073e9SAndroid Build Coastguard Worker        actual = torch.histc(torch.tensor([], device=device), min=0, max=3)
*da0073e9SAndroid Build Coastguard Worker        expected = torch.zeros(100, dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected, actual)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # without nbins
*da0073e9SAndroid Build Coastguard Worker        actual = torch.histc(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([2, 5], dtype=torch.float, device=device))
*da0073e9SAndroid Build Coastguard Worker        expected = torch.zeros(100, dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker        expected[0] = 1
*da0073e9SAndroid Build Coastguard Worker        expected[99] = 1
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected, actual)
*da0073e9SAndroid Build Coastguard Worker        # tensor with the same element
*da0073e9SAndroid Build Coastguard Worker        actual = torch.histc(torch.ones(5, dtype=torch.float, device=device), bins=5)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0, 0, 5, 0, 0], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker            actual)
*da0073e9SAndroid Build Coastguard Worker        # no element falls between [min, max]
*da0073e9SAndroid Build Coastguard Worker        actual = torch.histc(
*da0073e9SAndroid Build Coastguard Worker            torch.ones(5, dtype=torch.float, device=device), bins=5, min=2, max=3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0, 0, 0, 0, 0], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker            actual)
*da0073e9SAndroid Build Coastguard Worker        # element falls below min + integral bin size and
*da0073e9SAndroid Build Coastguard Worker        actual = torch.histc(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([2, 4, 2, 2, 5, 4], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker            bins=5, min=1, max=5)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0, 3, 0, 2, 1], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker            actual)
*da0073e9SAndroid Build Coastguard Worker        # non-integral bin size
*da0073e9SAndroid Build Coastguard Worker        actual = torch.histc(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([1, 2, 1], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker            bins=4, min=0, max=3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0, 2, 1, 0], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker            actual)
*da0073e9SAndroid Build Coastguard Worker        # double input
*da0073e9SAndroid Build Coastguard Worker        actual = torch.histc(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([1, 2, 1], dtype=torch.double, device=device), bins=4, min=0, max=3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0, 2, 1, 0], dtype=torch.double, device=device),
*da0073e9SAndroid Build Coastguard Worker            actual)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(actual.dtype, torch.double)
*da0073e9SAndroid Build Coastguard Worker        # mixed input
*da0073e9SAndroid Build Coastguard Worker        actual = torch.histc(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([1., 2, 1], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker            bins=4, min=0, max=3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0, 2, 1, 0], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker            actual)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(actual.dtype, torch.float)
*da0073e9SAndroid Build Coastguard Worker        # scalar input and 1 bin -- should return a 1-dimensional tensor, not a scalar.
*da0073e9SAndroid Build Coastguard Worker        actual = torch.histc(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor(0, dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker            bins=1, min=0, max=3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([1], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker            actual)
*da0073e9SAndroid Build Coastguard Worker        # tensors with inf; min, max not provided -- should throw a RuntimeError
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, r'range of \[inf, inf\] is not finite'):
*da0073e9SAndroid Build Coastguard Worker            torch.histc(torch.tensor([float("inf")], dtype=torch.float, device=device))
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, r'range of \[1, inf\] is not finite'):
*da0073e9SAndroid Build Coastguard Worker            torch.histc(torch.tensor([1., 2., float("inf")], dtype=torch.float, device=device))
*da0073e9SAndroid Build Coastguard Worker        # tensors with inf; min, max provided
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.histc(torch.tensor([float("inf")], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker                        bins=1, min=0, max=3),
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0], dtype=torch.float, device=device))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.histc(torch.tensor([1., 2., float("inf")], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker                        bins=4, max=3),
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0, 1, 1, 0], dtype=torch.float, device=device))
*da0073e9SAndroid Build Coastguard Worker        # tensor with nan; min, max not provided -- should throw a RuntimeError
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, r'range of \[nan, nan\] is not finite'):
*da0073e9SAndroid Build Coastguard Worker            torch.histc(torch.tensor([float("nan")], dtype=torch.float, device=device))
*da0073e9SAndroid Build Coastguard Worker        # tensor with nan; min, max provided -- nan is ignored
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.histc(torch.tensor([1., 2., float("nan")], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker                        bins=4, max=3),
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0, 1, 1, 0], dtype=torch.float, device=device))
*da0073e9SAndroid Build Coastguard Worker        # tensors with min > max -- should throw a RuntimeError
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, "max must be larger than min"):
*da0073e9SAndroid Build Coastguard Worker            torch.histc(torch.tensor([1., 2., 3.], dtype=torch.float, device=device),
*da0073e9SAndroid Build Coastguard Worker                        bins=4, min=5, max=1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test against numpy.histogram()
*da0073e9SAndroid Build Coastguard Worker        def test_against_np(tensor, bins=100, min=0, max=0):
*da0073e9SAndroid Build Coastguard Worker            if min == 0 and max == 0:
*da0073e9SAndroid Build Coastguard Worker                min = tensor.min().item()
*da0073e9SAndroid Build Coastguard Worker                max = tensor.max().item()
*da0073e9SAndroid Build Coastguard Worker            nparr = tensor.cpu().numpy()
*da0073e9SAndroid Build Coastguard Worker            actual = torch.histc(tensor, bins=bins, min=min, max=max)
*da0073e9SAndroid Build Coastguard Worker            expected = torch.from_numpy(np.histogram(nparr, bins=bins, range=(min, max))[0])
*da0073e9SAndroid Build Coastguard Worker            actual_cpu = actual.cpu()
*da0073e9SAndroid Build Coastguard Worker            # NB: Numpy returns a int64 tensor, like normal people...
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(actual, expected.to(actual_cpu))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test_against_np(torch.tensor([1., 2, 1], device=device))
*da0073e9SAndroid Build Coastguard Worker        test_against_np(torch.randn(5000, device=device))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test bins arg
*da0073e9SAndroid Build Coastguard Worker        test_against_np(torch.randn(301, device=device), bins=10)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test truncated range
*da0073e9SAndroid Build Coastguard Worker        test_against_np(torch.randn(201, device=device), min=0.1, max=1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        noncontig = torch.randn(100, 3, device=device)[:, 2]
*da0073e9SAndroid Build Coastguard Worker        test_against_np(noncontig)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        multidim = torch.randn(3, 5, 7, 2, device=device)
*da0073e9SAndroid Build Coastguard Worker        test_against_np(multidim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        expanded = torch.randn(1, 5, 1, 2, device=device).expand(3, 5, 7, 2)
*da0073e9SAndroid Build Coastguard Worker        test_against_np(expanded)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        linear = torch.linspace(0, 0.99 - 5.0e-7, 101).to(device)
*da0073e9SAndroid Build Coastguard Worker        test_against_np(linear, bins=20, min=0, max=0.99)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.bfloat16, torch.half)
*da0073e9SAndroid Build Coastguard Worker    def test_histc_lowp(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        actual = torch.histc(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([1, 2, 1], dtype=dtype, device=device), bins=4, min=0, max=3)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([0, 2, 1, 0], dtype=dtype, device=device),
*da0073e9SAndroid Build Coastguard Worker            actual)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(actual.dtype, dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    Runs torch.histogram and numpy.histogram on the specified input parameters
*da0073e9SAndroid Build Coastguard Worker    and asserts that their output is equal.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    def _test_histogram_numpy(self, t, bins, bin_range, weights, density):
*da0073e9SAndroid Build Coastguard Worker        def to_np(t):
*da0073e9SAndroid Build Coastguard Worker            if not torch.is_tensor(t):
*da0073e9SAndroid Build Coastguard Worker                return t
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                return t.cpu().numpy()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Wrapper around numpy.histogram performing conversions between torch tensors and numpy arrays.
*da0073e9SAndroid Build Coastguard Worker        def reference_histogram(self, t, bins, bin_range, weights, density, dtype):
*da0073e9SAndroid Build Coastguard Worker            (np_t, np_bins, np_weights) = map(to_np, [t, bins, weights])
*da0073e9SAndroid Build Coastguard Worker            (np_hist, np_bin_edges) = np.histogram(np_t, np_bins, range=bin_range, weights=np_weights, density=density)
*da0073e9SAndroid Build Coastguard Worker            return (torch.from_numpy(np_hist).to(dtype), torch.from_numpy(np_bin_edges).to(dtype))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Doesn't pass a 'range' kwarg unless necessary because the override of histogram with Tensor bins doesn't accept one
*da0073e9SAndroid Build Coastguard Worker        if bin_range:
*da0073e9SAndroid Build Coastguard Worker            (actual_hist, actual_bin_edges) = torch.histogram(t, bins, range=bin_range, weight=weights, density=density)
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            (actual_hist, actual_bin_edges) = torch.histogram(t, bins, weight=weights, density=density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        (expected_hist, expected_bin_edges) = reference_histogram(self, t, bins, bin_range, weights, density, actual_hist.dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        Works around linspace discrepancies by passing torch's constructed bin_edges to numpy.
*da0073e9SAndroid Build Coastguard Worker        When bin edges are not explicitly defined, histogram uses the linspace operator internally
*da0073e9SAndroid Build Coastguard Worker        to construct the sequence of bin edges. In some cases, torch.linspace output differs slightly
*da0073e9SAndroid Build Coastguard Worker        from numpy.linspace output.
*da0073e9SAndroid Build Coastguard Worker        Issue: https://github.com/pytorch/pytorch/issues/58758
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        if not torch.is_tensor(bins):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(actual_bin_edges, expected_bin_edges, atol=1e-5, rtol=1e-5)
*da0073e9SAndroid Build Coastguard Worker            # Calls numpy.histogram again, passing torch's actual_bin_edges as the bins argument
*da0073e9SAndroid Build Coastguard Worker            (expected_hist, expected_bin_edges) = reference_histogram(
*da0073e9SAndroid Build Coastguard Worker                self, t, actual_bin_edges, bin_range, weights, density, actual_hist.dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(actual_hist, expected_hist)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(actual_bin_edges, expected_bin_edges)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Test passing non-contiguous output tensors
*da0073e9SAndroid Build Coastguard Worker        hist_out = make_tensor(expected_hist.shape, device=expected_hist.device, dtype=expected_hist.dtype,
*da0073e9SAndroid Build Coastguard Worker                               noncontiguous=True)
*da0073e9SAndroid Build Coastguard Worker        bin_edges_out = make_tensor(expected_bin_edges.shape, device=expected_bin_edges.device, dtype=expected_bin_edges.dtype,
*da0073e9SAndroid Build Coastguard Worker                                    noncontiguous=True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Doesn't pass a 'range' kwarg unless necessary because the override of histogram with Tensor bins doesn't accept one
*da0073e9SAndroid Build Coastguard Worker        if bin_range:
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(t, bins, range=bin_range, weight=weights, density=density, out=(hist_out, bin_edges_out))
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(t, bins, weight=weights, density=density, out=(hist_out, bin_edges_out))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(hist_out, expected_hist)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(bin_edges_out, expected_bin_edges)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float32)
*da0073e9SAndroid Build Coastguard Worker    def test_histogram(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        shapes = (
*da0073e9SAndroid Build Coastguard Worker            (),
*da0073e9SAndroid Build Coastguard Worker            (0,),
*da0073e9SAndroid Build Coastguard Worker            (1,),
*da0073e9SAndroid Build Coastguard Worker            (1, 5),
*da0073e9SAndroid Build Coastguard Worker            (3, 5),
*da0073e9SAndroid Build Coastguard Worker            (1, 5, 1),
*da0073e9SAndroid Build Coastguard Worker            (2, 3, 5))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for contig, bins_contig, bin_ct, weighted, density, shape in \
*da0073e9SAndroid Build Coastguard Worker                product([True, False], [True, False], range(1, 10), [True, False], [True, False], shapes):
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor(shape, dtype=dtype, device=device, low=-9, high=9, noncontiguous=not contig)
*da0073e9SAndroid Build Coastguard Worker            weights = make_tensor(shape, dtype=dtype, device=device, low=0, high=9, noncontiguous=not contig) if weighted else None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Tests passing just the bin_ct
*da0073e9SAndroid Build Coastguard Worker            self._test_histogram_numpy(values, bin_ct, None, weights, density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Tests with caller-specified histogram range
*da0073e9SAndroid Build Coastguard Worker            bin_range = sorted((random.uniform(-9, 9), random.uniform(-9, 9)))
*da0073e9SAndroid Build Coastguard Worker            self._test_histogram_numpy(values, bin_ct, bin_range, weights, density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Tests with range min=max
*da0073e9SAndroid Build Coastguard Worker            bin_range[1] = bin_range[0]
*da0073e9SAndroid Build Coastguard Worker            self._test_histogram_numpy(values, bin_ct, bin_range, weights, density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Tests with caller-specified bin edges
*da0073e9SAndroid Build Coastguard Worker            bin_edges = make_tensor(bin_ct + 1, dtype=dtype, device=device, low=-9, high=9).msort()
*da0073e9SAndroid Build Coastguard Worker            if not bins_contig:
*da0073e9SAndroid Build Coastguard Worker                # Necessary because msort always produces contiguous output
*da0073e9SAndroid Build Coastguard Worker                bin_edges_noncontig = make_tensor(bin_ct + 1, dtype=dtype, device=device, noncontiguous=not bins_contig)
*da0073e9SAndroid Build Coastguard Worker                bin_edges_noncontig.copy_(bin_edges)
*da0073e9SAndroid Build Coastguard Worker                bin_edges = bin_edges_noncontig
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(bin_edges.is_contiguous(), bins_contig)
*da0073e9SAndroid Build Coastguard Worker            self._test_histogram_numpy(values, bin_edges, None, weights, density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Tests with input tensor in which all elements are equal
*da0073e9SAndroid Build Coastguard Worker            elt = random.uniform(-9, 9)
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor(shape, dtype=dtype, device=device, low=elt, high=elt, noncontiguous=not contig)
*da0073e9SAndroid Build Coastguard Worker            self._test_histogram_numpy(values, bin_ct, bin_range, weights, density)
*da0073e9SAndroid Build Coastguard Worker            self._test_histogram_numpy(values, bin_edges, None, weights, density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Tests with input equal to bin_edges
*da0073e9SAndroid Build Coastguard Worker            weights = (
*da0073e9SAndroid Build Coastguard Worker                make_tensor(bin_ct + 1, dtype=dtype, device=device, low=0, high=9, noncontiguous=not contig)
*da0073e9SAndroid Build Coastguard Worker                if weighted
*da0073e9SAndroid Build Coastguard Worker                else None
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            self._test_histogram_numpy(bin_edges, bin_edges, None, weights, density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Tests values of default args
*da0073e9SAndroid Build Coastguard Worker        for bin_ct, shape in product(range(1, 10), shapes):
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor(shape, dtype=dtype, device=device, low=-9, high=9)
*da0073e9SAndroid Build Coastguard Worker            (actual_hist, actual_bin_edges) = torch.histogram(values, bin_ct)
*da0073e9SAndroid Build Coastguard Worker            (expected_hist, expected_bin_edges) = torch.histogram(
*da0073e9SAndroid Build Coastguard Worker                values, bin_ct, range=None, weight=None, density=False)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(actual_hist, expected_hist)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(actual_bin_edges, expected_bin_edges)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    Runs torch.histogramdd and numpy.histogramdd on the specified input parameters
*da0073e9SAndroid Build Coastguard Worker    and asserts that their output is equal.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    def _test_histogramdd_numpy(self, t, bins, bin_range, weights, density):
*da0073e9SAndroid Build Coastguard Worker        def to_np(t):
*da0073e9SAndroid Build Coastguard Worker            if type(t) == list:
*da0073e9SAndroid Build Coastguard Worker                return list(map(to_np, t))
*da0073e9SAndroid Build Coastguard Worker            if not torch.is_tensor(t):
*da0073e9SAndroid Build Coastguard Worker                return t
*da0073e9SAndroid Build Coastguard Worker            return t.cpu().numpy()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Wrapper around numpy.histogram performing conversions between torch tensors and numpy arrays.
*da0073e9SAndroid Build Coastguard Worker        def reference_histogramdd(t, bins, bin_range, weights, density, dtype):
*da0073e9SAndroid Build Coastguard Worker            (np_t, np_bins, np_weights) = map(to_np, [t, bins, weights])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # numpy.histogramdd accepts only (N, D) shapes
*da0073e9SAndroid Build Coastguard Worker            D = np_t.shape[-1]
*da0073e9SAndroid Build Coastguard Worker            N = np.prod(np_t.shape[:-1])
*da0073e9SAndroid Build Coastguard Worker            reshaped_t = np.reshape(np_t, (N, D))
*da0073e9SAndroid Build Coastguard Worker            reshaped_wt = np.reshape(np_weights, (N,)) if np_weights is not None else None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # numpy.histogramdd throws an error for D=0
*da0073e9SAndroid Build Coastguard Worker            if D == 0:
*da0073e9SAndroid Build Coastguard Worker                return (torch.tensor(float('nan') if density else 0.), [])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # numpy.histogramdd expects range to be specified as a sequence of D (lower, upper) tuples
*da0073e9SAndroid Build Coastguard Worker            reshaped_range = None if not bin_range else [(bin_range[2 * i], bin_range[2 * i + 1]) for i in range(D)]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            (np_hist, np_bin_edges) = np.histogramdd(reshaped_t, np_bins,
*da0073e9SAndroid Build Coastguard Worker                                                     range=reshaped_range, weights=reshaped_wt, density=density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            return (torch.from_numpy(np_hist).to(dtype), [torch.from_numpy(t).to(dtype) for t in np_bin_edges])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        (actual_hist, actual_bin_edges) = torch.histogramdd(t, bins, range=bin_range, weight=weights, density=density)
*da0073e9SAndroid Build Coastguard Worker        (expected_hist, expected_bin_edges) = reference_histogramdd(t, bins, bin_range, weights, density, actual_hist.dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        D = len(actual_bin_edges)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(D, len(expected_bin_edges))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        Works around linspace discrepancies by passing torch's constructed bin_edges to numpy.
*da0073e9SAndroid Build Coastguard Worker        When bin edges are not explicitly defined, histogram uses the linspace operator internally
*da0073e9SAndroid Build Coastguard Worker        to construct the sequence of bin edges. In some cases, torch.linspace output differs slightly
*da0073e9SAndroid Build Coastguard Worker        from numpy.linspace output.
*da0073e9SAndroid Build Coastguard Worker        Issue: https://github.com/pytorch/pytorch/issues/58758
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        if not torch.is_tensor(bins):
*da0073e9SAndroid Build Coastguard Worker            for dim in range(D):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(actual_bin_edges[dim], expected_bin_edges[dim], atol=1e-5, rtol=1e-5)
*da0073e9SAndroid Build Coastguard Worker            # Calls numpy.histogram again, passing torch's actual_bin_edges as the bins argument
*da0073e9SAndroid Build Coastguard Worker            (expected_hist, expected_bin_edges) = reference_histogramdd(
*da0073e9SAndroid Build Coastguard Worker                t, actual_bin_edges, bin_range, weights, density, actual_hist.dtype)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(D, len(expected_bin_edges))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(actual_hist, expected_hist)
*da0073e9SAndroid Build Coastguard Worker        for dim in range(D):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(actual_bin_edges[dim], expected_bin_edges[dim])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float32)
*da0073e9SAndroid Build Coastguard Worker    def test_histogramdd(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        shapes = (
*da0073e9SAndroid Build Coastguard Worker            (1, 5),
*da0073e9SAndroid Build Coastguard Worker            (3, 5),
*da0073e9SAndroid Build Coastguard Worker            (1, 5, 1),
*da0073e9SAndroid Build Coastguard Worker            (2, 3, 5),
*da0073e9SAndroid Build Coastguard Worker            (7, 7, 7, 7),
*da0073e9SAndroid Build Coastguard Worker            (16, 8, 4, 2),
*da0073e9SAndroid Build Coastguard Worker            (10, 10, 10),
*da0073e9SAndroid Build Coastguard Worker            (7, 0, 3),
*da0073e9SAndroid Build Coastguard Worker            (5, 0),)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for contig, bins_contig, weighted, density, shape in \
*da0073e9SAndroid Build Coastguard Worker                product([True, False], [True, False], [True, False], [True, False], shapes):
*da0073e9SAndroid Build Coastguard Worker            D = shape[-1]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor(shape, dtype=dtype, device=device, low=-9, high=9, noncontiguous=not contig)
*da0073e9SAndroid Build Coastguard Worker            weights = (
*da0073e9SAndroid Build Coastguard Worker                make_tensor(shape[:-1], dtype=dtype, device=device, low=0, high=9, noncontiguous=not contig)
*da0073e9SAndroid Build Coastguard Worker                if weighted
*da0073e9SAndroid Build Coastguard Worker                else None
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Tests passing a single bin count
*da0073e9SAndroid Build Coastguard Worker            bin_ct = random.randint(1, 5)
*da0073e9SAndroid Build Coastguard Worker            self._test_histogramdd_numpy(values, bin_ct, None, weights, density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Tests passing a bin count for each dimension
*da0073e9SAndroid Build Coastguard Worker            bin_ct = [random.randint(1, 5) for dim in range(D)]
*da0073e9SAndroid Build Coastguard Worker            self._test_histogramdd_numpy(values, bin_ct, None, weights, density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Tests with caller-specified histogram range
*da0073e9SAndroid Build Coastguard Worker            bin_range_tuples = [sorted((random.uniform(-9, 9), random.uniform(-9, 9))) for dim in range(D)]
*da0073e9SAndroid Build Coastguard Worker            bin_range = [elt for t in bin_range_tuples for elt in t]
*da0073e9SAndroid Build Coastguard Worker            self._test_histogramdd_numpy(values, bin_ct, bin_range, weights, density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Tests with range min=max
*da0073e9SAndroid Build Coastguard Worker            for dim in range(D):
*da0073e9SAndroid Build Coastguard Worker                bin_range[2 * dim + 1] = bin_range[2 * dim]
*da0073e9SAndroid Build Coastguard Worker            self._test_histogramdd_numpy(values, bin_ct, bin_range, weights, density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Tests with caller-specified bin edges
*da0073e9SAndroid Build Coastguard Worker            bin_edges = [make_tensor(ct + 1, dtype=dtype, device=device, low=-9, high=9).msort() for ct in bin_ct]
*da0073e9SAndroid Build Coastguard Worker            if not bins_contig:
*da0073e9SAndroid Build Coastguard Worker                # Necessary because msort always produces contiguous output
*da0073e9SAndroid Build Coastguard Worker                bin_edges_noncontig = [
*da0073e9SAndroid Build Coastguard Worker                    make_tensor(ct + 1, dtype=dtype, device=device, noncontiguous=not bins_contig)
*da0073e9SAndroid Build Coastguard Worker                    for ct in bin_ct
*da0073e9SAndroid Build Coastguard Worker                ]
*da0073e9SAndroid Build Coastguard Worker                for dim in range(D):
*da0073e9SAndroid Build Coastguard Worker                    bin_edges_noncontig[dim].copy_(bin_edges[dim])
*da0073e9SAndroid Build Coastguard Worker                bin_edges = bin_edges_noncontig
*da0073e9SAndroid Build Coastguard Worker            for dim in range(D):
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(bin_edges[dim].is_contiguous(), bins_contig)
*da0073e9SAndroid Build Coastguard Worker            self._test_histogramdd_numpy(values, bin_edges, None, weights, density)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCPU
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.float32)
*da0073e9SAndroid Build Coastguard Worker    def test_histogram_error_handling(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'not implemented for'):
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor((), dtype=torch.int32, device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(values, 1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        inconsistent_dtype = torch.float32 if dtype != torch.float32 else torch.float64
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'input tensor and bins tensors should have the same dtype'):
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            bins = make_tensor((), dtype=inconsistent_dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(values, bins)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'input tensor and weight tensor should have the same dtype'):
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            weight = make_tensor((), dtype=inconsistent_dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(values, 1, weight=weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'input tensor and hist tensor should have the same dtype'):
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            hist = make_tensor((), dtype=inconsistent_dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            bin_edges = make_tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(values, 1, out=(hist, bin_edges))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'input tensor and bin_edges tensor should have the same dtype'):
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            hist = make_tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            bin_edges = make_tensor((), dtype=inconsistent_dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(values, 1, out=(hist, bin_edges))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'bins tensor should have one dimension'):
*da0073e9SAndroid Build Coastguard Worker            t = make_tensor((2, 2), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(t, t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'bins tensor should have at least 1 element'):
*da0073e9SAndroid Build Coastguard Worker            t = make_tensor((0), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(t, t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'bins must be > 0'):
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(values, -1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'if weight tensor is provided it should have the same shape \
*da0073e9SAndroid Build Coastguard Workeras the input tensor excluding its innermost dimension'):
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor((2, 2), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            weight = make_tensor((1), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(values, 1, weight=weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(TypeError, 'received an invalid combination of arguments'):
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            bin_edges = make_tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(values, bin_edges, range=(0, 1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, 'min should not exceed max'):
*da0073e9SAndroid Build Coastguard Worker            values = make_tensor((), dtype=dtype, device=device)
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(values, 2, range=(1, 0))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, r'range \[nan, nan\] is not finite'):
*da0073e9SAndroid Build Coastguard Worker            values = torch.tensor([float("nan")], device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker            torch.histogram(values, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Tests to ensure that reduction functions employing comparison operators are usable when there
*da0073e9SAndroid Build Coastguard Worker    # exists a zero dimension (i.e. when the tensors are empty) in the tensor. These tests specifically
*da0073e9SAndroid Build Coastguard Worker    # cater to functions where specifying the `dim` parameter is necessary.
*da0073e9SAndroid Build Coastguard Worker    def test_tensor_compare_ops_empty(self, device):
*da0073e9SAndroid Build Coastguard Worker        shape = (2, 0, 4)
*da0073e9SAndroid Build Coastguard Worker        master_input = torch.randn(shape, device=device)
*da0073e9SAndroid Build Coastguard Worker        np_input = np.empty(shape)
*da0073e9SAndroid Build Coastguard Worker        test_functions = [
*da0073e9SAndroid Build Coastguard Worker            ('amax', torch.amax, np.amax),
*da0073e9SAndroid Build Coastguard Worker            ('amin', torch.amin, np.amin),
*da0073e9SAndroid Build Coastguard Worker            ('max', lambda *args, **kwargs: torch.max(*args, **kwargs).values, np.max),
*da0073e9SAndroid Build Coastguard Worker            ('min', lambda *args, **kwargs: torch.min(*args, **kwargs).values, np.min),
*da0073e9SAndroid Build Coastguard Worker            ('median', lambda *args, **kwargs: torch.median(*args, **kwargs).values, np.median),
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for name, fn, np_function in test_functions:
*da0073e9SAndroid Build Coastguard Worker            # Check if reduction happens along the specified dim with and without keepdim. Check with
*da0073e9SAndroid Build Coastguard Worker            # numpy to maintain compatibility with numpy functions.
*da0073e9SAndroid Build Coastguard Worker            error_msg = f"test function: {name}"
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.empty((2, 0), device=device), fn(master_input, dim=2), msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(np_function(np_input, axis=2),
*da0073e9SAndroid Build Coastguard Worker                             fn(master_input, dim=2).cpu().numpy(), msg=error_msg, exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.empty((2, 0), device=device), fn(master_input, dim=-1), msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(np_function(np_input, axis=-1),
*da0073e9SAndroid Build Coastguard Worker                             fn(master_input, dim=-1).cpu().numpy(), msg=error_msg, exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.empty((2, 0, 1), device=device), fn(master_input, dim=2, keepdim=True),
*da0073e9SAndroid Build Coastguard Worker                             msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(np_function(np_input, axis=2, keepdims=True),
*da0073e9SAndroid Build Coastguard Worker                             fn(master_input, dim=2, keepdim=True).cpu().numpy(), msg=error_msg, exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.empty((2, 0, 1), device=device), fn(master_input, dim=-1, keepdim=True),
*da0073e9SAndroid Build Coastguard Worker                             msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(np_function(np_input, axis=-1, keepdims=True),
*da0073e9SAndroid Build Coastguard Worker                             fn(master_input, dim=-1, keepdim=True).cpu().numpy(), msg=error_msg, exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Check if function raises error on specified zero'd dimension as reduction dim.
*da0073e9SAndroid Build Coastguard Worker            self.assertRaisesRegex(IndexError, "Expected reduction dim", lambda: fn(master_input, dim=1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Tests to ensure that reduction of zero-dim tensors (i.e. empty tensors) using comparison operators
*da0073e9SAndroid Build Coastguard Worker    # raises an error if no `dim` parameter is specified. This exists separately from tests in
*da0073e9SAndroid Build Coastguard Worker    # test_tensot_compare_ops_empty because not specifying a `dim` parameter in the former tests does
*da0073e9SAndroid Build Coastguard Worker    # not throw errors. Also, checking the return type of argmax requires supplying a different dtype
*da0073e9SAndroid Build Coastguard Worker    # argument than that for the input tensor. There is also variantion in numpy testing.
*da0073e9SAndroid Build Coastguard Worker    def test_tensor_compare_ops_argmax_argmix_kthvalue_dim_empty(self, device):
*da0073e9SAndroid Build Coastguard Worker        shape = (2, 0, 4)
*da0073e9SAndroid Build Coastguard Worker        master_input = torch.randn(shape, device=device)
*da0073e9SAndroid Build Coastguard Worker        np_input = np.empty(shape)
*da0073e9SAndroid Build Coastguard Worker        test_functions = [
*da0073e9SAndroid Build Coastguard Worker            ('argmax', torch.argmax, {'dtype': torch.int64}, np.argmax),
*da0073e9SAndroid Build Coastguard Worker            ('argmin', torch.argmin, {'dtype': torch.int64}, np.argmin),
*da0073e9SAndroid Build Coastguard Worker            ('kthvalue', lambda *args, k=1, **kwargs: torch.kthvalue(*args, k=1, **kwargs).values,
*da0073e9SAndroid Build Coastguard Worker             {}, lambda *args, k=1, axis=None, **kwargs: np.partition(*args, k, **kwargs).take(k - 1, axis=axis))
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for name, fn, dtype, np_function in test_functions:
*da0073e9SAndroid Build Coastguard Worker            error_msg = f"test function: {name}"
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.empty((2, 0), device=device, **dtype), fn(master_input, dim=2), msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                np_function(np_input, axis=2), fn(master_input, dim=2).cpu().numpy(), msg=error_msg, exact_dtype=False
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.empty((2, 0), device=device, **dtype), fn(master_input, dim=-1), msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                np_function(np_input, axis=-1), fn(master_input, dim=-1).cpu().numpy(), msg=error_msg, exact_dtype=False
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # keepdim variant does not exist for numpy
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.empty((2, 0, 1), device=device, **dtype), fn(master_input, dim=2, keepdim=True),
*da0073e9SAndroid Build Coastguard Worker                             msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.empty((2, 0, 1), device=device, **dtype), fn(master_input, dim=-1, keepdim=True),
*da0073e9SAndroid Build Coastguard Worker                             msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Check if function raises error on specified zero'd dimension as reduction dim.
*da0073e9SAndroid Build Coastguard Worker            self.assertRaisesRegex(IndexError, "Expected reduction dim", lambda: fn(master_input, dim=1))
*da0073e9SAndroid Build Coastguard Worker            if name != 'kthvalue':
*da0073e9SAndroid Build Coastguard Worker                self.assertRaisesRegex(IndexError, "Expected reduction dim", lambda: fn(master_input))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Tests to ensure that reduction of zero-dim tensors (i.e. empty tensors) using math operators works when a
*da0073e9SAndroid Build Coastguard Worker    # non-zero dim is specified for the reduction and throws an error when the dim specified is 0. Although
*da0073e9SAndroid Build Coastguard Worker    # there is some repetition with test_tensor_compare_ops_optional_dim_empty and test_tensor_compare_ops_empty,
*da0073e9SAndroid Build Coastguard Worker    # these tests are kept separate since tests for math operators also require checking for correctness of the
*da0073e9SAndroid Build Coastguard Worker    # returned data using allclose() or isinf() which does not exists in the former tests.
*da0073e9SAndroid Build Coastguard Worker    @skipIfNoSciPy
*da0073e9SAndroid Build Coastguard Worker    def test_tensor_reduce_ops_empty(self, device):
*da0073e9SAndroid Build Coastguard Worker        from scipy.special import logsumexp
*da0073e9SAndroid Build Coastguard Worker        shape = (2, 0, 4)
*da0073e9SAndroid Build Coastguard Worker        master_input = torch.randn(shape, device=device)
*da0073e9SAndroid Build Coastguard Worker        np_input = np.empty(shape)
*da0073e9SAndroid Build Coastguard Worker        test_functions = [
*da0073e9SAndroid Build Coastguard Worker            ('prod', torch.prod, 1., np.prod),
*da0073e9SAndroid Build Coastguard Worker            ('sum', torch.sum, 0., np.sum),
*da0073e9SAndroid Build Coastguard Worker            ('norm', torch.norm, 0., np.linalg.norm),
*da0073e9SAndroid Build Coastguard Worker            ('mean', torch.mean, nan, np.mean),
*da0073e9SAndroid Build Coastguard Worker            ('var', torch.var, nan, np.var),
*da0073e9SAndroid Build Coastguard Worker            ('std', torch.std, nan, np.std),
*da0073e9SAndroid Build Coastguard Worker            ('logsumexp', torch.logsumexp, -inf, logsumexp),
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for name, fn, return_value, np_function in test_functions:
*da0073e9SAndroid Build Coastguard Worker            # Check if reduction happens along the specified dimension.
*da0073e9SAndroid Build Coastguard Worker            error_msg = f"test function: {name}"
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.empty((2, 0), device=device), fn(master_input, dim=2), msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(np_function(np_input, axis=2), fn(master_input, dim=2).cpu().numpy(), msg=error_msg,
*da0073e9SAndroid Build Coastguard Worker                             exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.empty((2, 0), device=device), fn(master_input, dim=-1), msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(np_function(np_input, axis=-1), fn(master_input, dim=-1).cpu().numpy(), msg=error_msg,
*da0073e9SAndroid Build Coastguard Worker                             exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.empty((2, 0, 1), device=device), fn(master_input, dim=2, keepdim=True),
*da0073e9SAndroid Build Coastguard Worker                             msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(np_function(np_input, axis=2, keepdims=True), fn(master_input, dim=2, keepdim=True),
*da0073e9SAndroid Build Coastguard Worker                             msg=error_msg, exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.empty((2, 0, 1), device=device), fn(master_input, dim=-1, keepdim=True),
*da0073e9SAndroid Build Coastguard Worker                             msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(np_function(np_input, axis=-1, keepdims=True), fn(master_input, dim=-1, keepdim=True),
*da0073e9SAndroid Build Coastguard Worker                             msg=error_msg, exact_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.full((2, 4), return_value, device=device), fn(master_input, dim=1), msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.full((2, 4), return_value, device=device), fn(master_input, dim=-2), msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.full((2, 1, 4), return_value, device=device), fn(master_input, dim=1, keepdim=True),
*da0073e9SAndroid Build Coastguard Worker                             msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.full((2, 1, 4), return_value, device=device), fn(master_input, dim=-2, keepdim=True),
*da0073e9SAndroid Build Coastguard Worker                             msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if name != 'logsumexp':
*da0073e9SAndroid Build Coastguard Worker                # The scipy function does not work for reduction the zero dimension
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(np.float32(np_function(np_input, axis=1)), fn(master_input, dim=1).cpu().numpy(),
*da0073e9SAndroid Build Coastguard Worker                                 msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(np.float32(np_function(np_input, axis=-2)), fn(master_input, dim=-2).cpu().numpy(),
*da0073e9SAndroid Build Coastguard Worker                                 msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(np.float32(np_function(np_input, axis=1, keepdims=True)),
*da0073e9SAndroid Build Coastguard Worker                                 fn(master_input, dim=1, keepdim=True).cpu().numpy(),
*da0073e9SAndroid Build Coastguard Worker                                 msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(np.float32(np_function(np_input, axis=-2, keepdims=True)),
*da0073e9SAndroid Build Coastguard Worker                                 fn(master_input, dim=-2, keepdim=True).cpu().numpy(),
*da0073e9SAndroid Build Coastguard Worker                                 msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # logsumexp throws a type error when not specifying dim so test separately.
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(torch.full((), return_value, device=device), fn(master_input), msg=error_msg)
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                self.assertRaises(TypeError, lambda: fn(master_input))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # Tests to ensure that any() and all() functions work with zero-dim tensors. Kept separate from
*da0073e9SAndroid Build Coastguard Worker    # other tests for checking reduction with zero-dim tensors because these tests have significantly
*da0073e9SAndroid Build Coastguard Worker    # different testing behaviour than that used for the former tests.
*da0073e9SAndroid Build Coastguard Worker    def test_reduction_empty_any_all(self, device):
*da0073e9SAndroid Build Coastguard Worker        shape = (2, 0, 4)
*da0073e9SAndroid Build Coastguard Worker        x = torch.randn(shape, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for dtype in all_types_and_complex_and(torch.half, torch.bool):
*da0073e9SAndroid Build Coastguard Worker            # Refer: [all, any uint8 compatibility]
*da0073e9SAndroid Build Coastguard Worker            if dtype == torch.uint8:
*da0073e9SAndroid Build Coastguard Worker                out_dtype = torch.uint8
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                out_dtype = torch.bool  # output of all/any is bool irrespective of input dtype
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            xb = x.to(dtype)
*da0073e9SAndroid Build Coastguard Worker            yb = x.to(dtype)
*da0073e9SAndroid Build Coastguard Worker            # any
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual((2, 0), xb.any(2).shape)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual((2, 0, 1), xb.any(2, keepdim=True).shape)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.zeros((2, 4), device=device, dtype=out_dtype), xb.any(1))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.zeros((2, 1, 4), device=device, dtype=out_dtype), xb.any(1, keepdim=True))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.zeros((), device=device, dtype=out_dtype), xb.any())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # all
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual((2, 0), xb.all(2).shape)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual((2, 0, 1), xb.all(2, keepdim=True).shape)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.ones((2, 4), device=device, dtype=out_dtype), xb.all(1))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.ones((2, 1, 4), device=device, dtype=out_dtype), xb.all(1, keepdim=True))
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.ones((), device=device, dtype=out_dtype), xb.all())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # TODO: can these be merged with their respective OpInfos?
*da0073e9SAndroid Build Coastguard Worker    def test_reduce_dtype(self, device):
*da0073e9SAndroid Build Coastguard Worker        def test_reduction(op, has_no_dim, takes_dtype=True):
*da0073e9SAndroid Build Coastguard Worker            x = torch.randn(3, 3, dtype=torch.float, requires_grad=True, device=device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if has_no_dim:
*da0073e9SAndroid Build Coastguard Worker                grad1, = torch.autograd.grad([op(x)], [x])
*da0073e9SAndroid Build Coastguard Worker                grad2, = torch.autograd.grad([op(x, dtype=torch.double)], [x])
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(grad1, grad2)
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(grad2.dtype, torch.float)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            gi = torch.randn(op(x, dim=0).shape, dtype=torch.float, device=device)
*da0073e9SAndroid Build Coastguard Worker            grad1, = torch.autograd.grad([op(x, dim=0)], [x], gi)
*da0073e9SAndroid Build Coastguard Worker            if takes_dtype:
*da0073e9SAndroid Build Coastguard Worker                grad2, = torch.autograd.grad([op(x, dim=0, dtype=torch.double)], [x], gi.double())
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                grad2, = torch.autograd.grad([op(x.double(), dim=0)], [x], gi.double())
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(grad1, grad2)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(grad2.dtype, torch.float)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        test_reduction(torch.sum, True)
*da0073e9SAndroid Build Coastguard Worker        test_reduction(torch.prod, True)
*da0073e9SAndroid Build Coastguard Worker        test_reduction(torch.cumsum, False)
*da0073e9SAndroid Build Coastguard Worker        test_reduction(torch.cumprod, False)
*da0073e9SAndroid Build Coastguard Worker        test_reduction(torch.logcumsumexp, False, takes_dtype=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(reference_masked_ops)
*da0073e9SAndroid Build Coastguard Worker    def test_reference_masked(self, device, dtype, op):
*da0073e9SAndroid Build Coastguard Worker        """Test masked reduction operations on strided-only tensors using
*da0073e9SAndroid Build Coastguard Worker        numpy reductions as reference.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def to_numpy(input):
*da0073e9SAndroid Build Coastguard Worker            if input.dtype is torch.bfloat16:
*da0073e9SAndroid Build Coastguard Worker                return input.cpu().to(torch.float32).numpy()
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                return input.cpu().numpy()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        samples = op.sample_inputs_func(op, device, dtype, requires_grad=False)
*da0073e9SAndroid Build Coastguard Worker        for sample_input in samples:
*da0073e9SAndroid Build Coastguard Worker            t = sample_input.input
*da0073e9SAndroid Build Coastguard Worker            actual = op(t, *sample_input.args, **sample_input.kwargs)
*da0073e9SAndroid Build Coastguard Worker            exact_dtype = not (t.dtype is torch.bfloat16
*da0073e9SAndroid Build Coastguard Worker                               or (op.promotes_int_to_float and not torch.is_floating_point(t)))
*da0073e9SAndroid Build Coastguard Worker            expected = op.ref(to_numpy(t), *sample_input.args,
*da0073e9SAndroid Build Coastguard Worker                              **dict(
*da0073e9SAndroid Build Coastguard Worker                                  # `identity` is mapped to numpy reduction `initial` argument
*da0073e9SAndroid Build Coastguard Worker                                  identity=torch.masked._reduction_identity(op.name, t),
*da0073e9SAndroid Build Coastguard Worker                                  **sample_input.kwargs))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Workaround https://github.com/pytorch/pytorch/issues/66556
*da0073e9SAndroid Build Coastguard Worker            expected = np.asarray(expected)  # transform numpy scalars to numpy.ndarray instances
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # Numpy differs, producing uint32 on Windows
*da0073e9SAndroid Build Coastguard Worker            if expected.dtype in [np.uint64, np.uint32]:
*da0073e9SAndroid Build Coastguard Worker                exact_dtype = False
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            msg = ("Failed to produce expected results! Input tensor was"
*da0073e9SAndroid Build Coastguard Worker                   f" {t}, torch result is {actual}, and reference result is"
*da0073e9SAndroid Build Coastguard Worker                   f" {expected}.") if t.numel() < 10 else None
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(actual, expected, msg, exact_dtype=exact_dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @onlyCUDA
*da0073e9SAndroid Build Coastguard Worker    @largeTensorTest("8GB")
*da0073e9SAndroid Build Coastguard Worker    @dtypes(torch.half, torch.chalf, torch.bfloat16)
*da0073e9SAndroid Build Coastguard Worker    def test_reductions_large_half_tensors(self, device, dtype):
*da0073e9SAndroid Build Coastguard Worker        t = torch.ones(2**31, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        t[2**30:] = -1
*da0073e9SAndroid Build Coastguard Worker        expected = torch.tensor(0, device=device, dtype=dtype)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(torch.sum(t), expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # mean_cuda is not implemented for ComplexHalf
*da0073e9SAndroid Build Coastguard Worker        err_msg = "not implemented for 'ComplexHalf'"
*da0073e9SAndroid Build Coastguard Worker        ctx = self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, err_msg) if dtype is torch.chalf else contextlib.nullcontext()
*da0073e9SAndroid Build Coastguard Worker        with ctx:
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(torch.mean(t), expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerinstantiate_device_type_tests(TestReductions, globals())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerif __name__ == '__main__':
*da0073e9SAndroid Build Coastguard Worker    run_tests()