pytorch/test/test_expanded_weights.py

*da0073e9SAndroid Build Coastguard Worker# Owner(s): ["module: nn"]
*da0073e9SAndroid Build Coastguard Workerimport unittest
*da0073e9SAndroid Build Coastguard Workerfrom dataclasses import dataclass
*da0073e9SAndroid Build Coastguard Workerfrom functools import partial
*da0073e9SAndroid Build Coastguard Workerfrom itertools import chain, product
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport torch
*da0073e9SAndroid Build Coastguard Workerimport torch.nn as nn
*da0073e9SAndroid Build Coastguard Workerimport torch.nn.functional as F
*da0073e9SAndroid Build Coastguard Workerfrom torch.nn import CrossEntropyLoss
*da0073e9SAndroid Build Coastguard Workerfrom torch.nn.utils._expanded_weights import ExpandedWeight
*da0073e9SAndroid Build Coastguard Workerfrom torch.nn.utils._expanded_weights.expanded_weights_utils import (
*da0073e9SAndroid Build Coastguard Worker    forward_helper,
*da0073e9SAndroid Build Coastguard Worker    set_grad_sample_if_exists,
*da0073e9SAndroid Build Coastguard Worker    standard_kwargs,
*da0073e9SAndroid Build Coastguard Worker    sum_over_all_but_batch_and_last_n,
*da0073e9SAndroid Build Coastguard Worker    unpack_expanded_weight_or_tensor,
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Workerfrom torch.nn.utils._per_sample_grad import call_for_per_sample_grads
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_cuda import TEST_CUDA, tf32_off
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_device_type import (
*da0073e9SAndroid Build Coastguard Worker    instantiate_device_type_tests,
*da0073e9SAndroid Build Coastguard Worker    OpDTypes,
*da0073e9SAndroid Build Coastguard Worker    ops,
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_methods_invocations import op_db, SampleInput
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_modules import module_db, modules
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_nn import module_tests, new_module_tests, TestBase
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_utils import (
*da0073e9SAndroid Build Coastguard Worker    freeze_rng_state,
*da0073e9SAndroid Build Coastguard Worker    make_tensor,
*da0073e9SAndroid Build Coastguard Worker    parametrize,
*da0073e9SAndroid Build Coastguard Worker    run_tests,
*da0073e9SAndroid Build Coastguard Worker    skipIfTorchDynamo,
*da0073e9SAndroid Build Coastguard Worker    TestCase,
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Workerfrom torch.utils._pytree import tree_map_only
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestContext:
*da0073e9SAndroid Build Coastguard Worker    pass
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestExpandedWeightHelperFunction(TestCase):
*da0073e9SAndroid Build Coastguard Worker    def test_forward_helper(self, device):
*da0073e9SAndroid Build Coastguard Worker        input = torch.randn(3, 4, device=device)
*da0073e9SAndroid Build Coastguard Worker        weight = torch.randn(5, 4, device=device)
*da0073e9SAndroid Build Coastguard Worker        bias = torch.randn(5, device=device)
*da0073e9SAndroid Build Coastguard Worker        for weight_batched, bias_batched in product([True, False], [True, False]):
*da0073e9SAndroid Build Coastguard Worker            maybe_batched_weight = weight
*da0073e9SAndroid Build Coastguard Worker            maybe_batched_bias = bias
*da0073e9SAndroid Build Coastguard Worker            if weight_batched:
*da0073e9SAndroid Build Coastguard Worker                maybe_batched_weight = ExpandedWeight(
*da0073e9SAndroid Build Coastguard Worker                    weight.clone().requires_grad_(), 3, loss_reduction="sum"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            if bias_batched:
*da0073e9SAndroid Build Coastguard Worker                maybe_batched_bias = ExpandedWeight(
*da0073e9SAndroid Build Coastguard Worker                    bias.clone().requires_grad_(), 3, loss_reduction="sum"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            args = (input, maybe_batched_weight, maybe_batched_bias)
*da0073e9SAndroid Build Coastguard Worker            expanded_args, expanded_kwargs = standard_kwargs(("bias",), args)
*da0073e9SAndroid Build Coastguard Worker            res = forward_helper(nn.functional.linear, expanded_args, expanded_kwargs)
*da0073e9SAndroid Build Coastguard Worker            expected = nn.functional.linear(input, weight, bias)
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(res, expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(len(expanded_args), 2)
*da0073e9SAndroid Build Coastguard Worker            assert expanded_args[0] is args[0]  # avoids property checks in assertEquals
*da0073e9SAndroid Build Coastguard Worker            assert expanded_args[1] is args[1]  # avoids property checks in assertEquals
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(len(expanded_kwargs), 1)
*da0073e9SAndroid Build Coastguard Worker            assert (
*da0073e9SAndroid Build Coastguard Worker                expanded_kwargs["bias"] is args[2]
*da0073e9SAndroid Build Coastguard Worker            )  # avoids property checks in assertEquals
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_forward_helper_failure_args(self, device):
*da0073e9SAndroid Build Coastguard Worker        weight = torch.randn(5, 4, device=device)
*da0073e9SAndroid Build Coastguard Worker        bias = torch.randn(5, device=device)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, r"do not support inputs that are also ExpandedWeights."
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            input = ExpandedWeight(
*da0073e9SAndroid Build Coastguard Worker                torch.randn(3, 4, requires_grad=True), 3, loss_reduction="sum"
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            expanded_args, expanded_kwargs = standard_kwargs(
*da0073e9SAndroid Build Coastguard Worker                ("bias",), (input, weight, bias)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            forward_helper(nn.functional.linear, expanded_args, expanded_kwargs)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, r"requires a Tensor as the first input"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            expanded_args, expanded_kwargs = standard_kwargs(
*da0073e9SAndroid Build Coastguard Worker                ("bias",), (3, weight, bias)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            forward_helper(nn.functional.linear, expanded_args, expanded_kwargs)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, r"requires a batch dimension but got an input of size 0"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            expanded_args, expanded_kwargs = standard_kwargs(
*da0073e9SAndroid Build Coastguard Worker                ("bias",), (torch.tensor(3), weight, bias)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            forward_helper(nn.functional.linear, expanded_args, expanded_kwargs)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, r"0 is not a valid batch size for Expanded Weights"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            expanded_args, expanded_kwargs = standard_kwargs(
*da0073e9SAndroid Build Coastguard Worker                ("bias",), (torch.randn(0, 1, 2), weight, bias)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            forward_helper(nn.functional.linear, expanded_args, expanded_kwargs)
*da0073e9SAndroid Build Coastguard Worker        input = torch.randn(3, 4)
*da0073e9SAndroid Build Coastguard Worker        for weight_batched, bias_batched in product([True, False], [True, False]):
*da0073e9SAndroid Build Coastguard Worker            if not weight_batched and not bias_batched:
*da0073e9SAndroid Build Coastguard Worker                continue
*da0073e9SAndroid Build Coastguard Worker            maybe_batched_weight = weight
*da0073e9SAndroid Build Coastguard Worker            maybe_batched_bias = bias
*da0073e9SAndroid Build Coastguard Worker            if weight_batched:
*da0073e9SAndroid Build Coastguard Worker                maybe_batched_weight = ExpandedWeight(
*da0073e9SAndroid Build Coastguard Worker                    weight.clone().requires_grad_(), 4, loss_reduction="sum"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            if bias_batched:
*da0073e9SAndroid Build Coastguard Worker                maybe_batched_bias = ExpandedWeight(
*da0073e9SAndroid Build Coastguard Worker                    bias.clone().requires_grad_(), 4, loss_reduction="sum"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker                RuntimeError,
*da0073e9SAndroid Build Coastguard Worker                r"Expected ExpandedWeights to have batch size matching input",
*da0073e9SAndroid Build Coastguard Worker            ):
*da0073e9SAndroid Build Coastguard Worker                expanded_args, expanded_kwargs = standard_kwargs(
*da0073e9SAndroid Build Coastguard Worker                    ("bias",), (input, maybe_batched_weight, maybe_batched_bias)
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                forward_helper(nn.functional.linear, expanded_args, expanded_kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_grad_sample_if_exists(self, device):
*da0073e9SAndroid Build Coastguard Worker        def test_fn(a):
*da0073e9SAndroid Build Coastguard Worker            return grad_sample
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        orig_weight = torch.randn(4, device=device, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        expanded_weight = ExpandedWeight(orig_weight, 3, loss_reduction="sum")
*da0073e9SAndroid Build Coastguard Worker        grad_sample = torch.randn(3)
*da0073e9SAndroid Build Coastguard Worker        set_grad_sample_if_exists(expanded_weight, test_fn)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(hasattr(orig_weight, "grad_sample"))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(orig_weight.grad_sample, grad_sample)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        basic_tensor = torch.randn(4, device=device)
*da0073e9SAndroid Build Coastguard Worker        set_grad_sample_if_exists(basic_tensor, test_fn)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(hasattr(basic_tensor, "grad_sample"))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        non_tensor = 3
*da0073e9SAndroid Build Coastguard Worker        set_grad_sample_if_exists(non_tensor, test_fn)
*da0073e9SAndroid Build Coastguard Worker        self.assertFalse(hasattr(non_tensor, "grad_sample"))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_set_grad_sample_if_exists_failure(self, device):
*da0073e9SAndroid Build Coastguard Worker        def test_fn(a):
*da0073e9SAndroid Build Coastguard Worker            return True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        grad_tensor = torch.randn(4, requires_grad=True, device=device)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            r"does not support a mixture of ExpandedWeight parameters and normal Parameters",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            set_grad_sample_if_exists(grad_tensor, test_fn)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_unpack_expanded_weight_or_tensor(self, device):
*da0073e9SAndroid Build Coastguard Worker        input = torch.randn(3, requires_grad=True, device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            input,
*da0073e9SAndroid Build Coastguard Worker            unpack_expanded_weight_or_tensor(
*da0073e9SAndroid Build Coastguard Worker                ExpandedWeight(input, 3, loss_reduction="sum")
*da0073e9SAndroid Build Coastguard Worker            ),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        input.requires_grad_(False)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(input, unpack_expanded_weight_or_tensor(input))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(unpack_expanded_weight_or_tensor(4) is None)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_unpack_expanded_weight_or_tensor_with_custom_function(self, device):
*da0073e9SAndroid Build Coastguard Worker        input = torch.randn(3, requires_grad=True, device=device)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker            unpack_expanded_weight_or_tensor(
*da0073e9SAndroid Build Coastguard Worker                ExpandedWeight(input, 3, loss_reduction="sum"), lambda x: x is input
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        input.requires_grad_(False)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(unpack_expanded_weight_or_tensor(input, lambda x: x is input))
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(
*da0073e9SAndroid Build Coastguard Worker            unpack_expanded_weight_or_tensor(4, lambda x: x is input) is None
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_unpack_expanded_weight_or_tensor_failure(self, device):
*da0073e9SAndroid Build Coastguard Worker        input = torch.randn(3, requires_grad=True, device=device)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            r"does not support a mixture of ExpandedWeight parameters and normal Parameters",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            unpack_expanded_weight_or_tensor(input)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            r"does not support a mixture of ExpandedWeight parameters and normal Parameters",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            unpack_expanded_weight_or_tensor(input, lambda x: x is input)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_sum_over_all_but_batch_and_last_n(self, device):
*da0073e9SAndroid Build Coastguard Worker        input = torch.randn(1, 2, 3, 4, 5, device=device)
*da0073e9SAndroid Build Coastguard Worker        res = sum_over_all_but_batch_and_last_n(input, 2)
*da0073e9SAndroid Build Coastguard Worker        expected = input.sum((1, 2))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res, expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        res = sum_over_all_but_batch_and_last_n(input, 0)
*da0073e9SAndroid Build Coastguard Worker        expected = input.sum((1, 2, 3, 4))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res, expected)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        res = sum_over_all_but_batch_and_last_n(input, 4)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(res, input)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestExpandedWeightFunctional(TestCase):
*da0073e9SAndroid Build Coastguard Worker    def _compare_ew_and_for_loop_per_sample_grads(self, op, sample_input, reduction):
*da0073e9SAndroid Build Coastguard Worker        input = sample_input.input
*da0073e9SAndroid Build Coastguard Worker        args = sample_input.args
*da0073e9SAndroid Build Coastguard Worker        kwargs = sample_input.kwargs
*da0073e9SAndroid Build Coastguard Worker        batch_size = input.shape[0] if len(input.shape) > 1 else 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # get per sample grads with ExpandedWeights objects
*da0073e9SAndroid Build Coastguard Worker        loss_reduction = "sum" if reduction == torch.sum else "mean"
*da0073e9SAndroid Build Coastguard Worker        (ew_input, ew_args, ew_kwargs) = make_expanded_weight(
*da0073e9SAndroid Build Coastguard Worker            sample_input, batch_size, loss_reduction
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        diff_input_list = (ew_input,) + tuple(ew_args) + tuple(ew_kwargs.values())
*da0073e9SAndroid Build Coastguard Worker        diff_input_list = [i for i in diff_input_list if is_diff_tensor(i)]
*da0073e9SAndroid Build Coastguard Worker        diff_input_list = [
*da0073e9SAndroid Build Coastguard Worker            i.orig_weight if isinstance(i, ExpandedWeight) else i
*da0073e9SAndroid Build Coastguard Worker            for i in diff_input_list
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker        if not diff_input_list:
*da0073e9SAndroid Build Coastguard Worker            return
*da0073e9SAndroid Build Coastguard Worker        result = run_op(op, ew_input, *ew_args, **ew_kwargs)
*da0073e9SAndroid Build Coastguard Worker        reduction(
*da0073e9SAndroid Build Coastguard Worker            result
*da0073e9SAndroid Build Coastguard Worker        ).backward()  # grad doesn't work with ExpandedWeight because it calls __torch_function__
*da0073e9SAndroid Build Coastguard Worker        expanded_weight_grad = tuple(
*da0073e9SAndroid Build Coastguard Worker            i.grad_sample if hasattr(i, "grad_sample") else i.grad
*da0073e9SAndroid Build Coastguard Worker            for i in diff_input_list
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # get per sample grads with for loop
*da0073e9SAndroid Build Coastguard Worker        func = partial(run_op, op)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        per_sample_grad = for_loop_per_sample_grad(
*da0073e9SAndroid Build Coastguard Worker            batch_size, reduction, input, func, *args, **kwargs
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check equality
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(per_sample_grad), len(expanded_weight_grad))
*da0073e9SAndroid Build Coastguard Worker        if loss_reduction == "mean":
*da0073e9SAndroid Build Coastguard Worker            # don't check equality of `input.grad`s since these vanilla tensors won't be scaled
*da0073e9SAndroid Build Coastguard Worker            expanded_weight_grad = expanded_weight_grad[1:]
*da0073e9SAndroid Build Coastguard Worker            per_sample_grad = per_sample_grad[1:]
*da0073e9SAndroid Build Coastguard Worker        for result_grad, expected_grad in zip(expanded_weight_grad, per_sample_grad):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(result_grad, expected_grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(
*da0073e9SAndroid Build Coastguard Worker        filter(lambda op: op.supports_expanded_weight, op_db),
*da0073e9SAndroid Build Coastguard Worker        dtypes=OpDTypes.supported,
*da0073e9SAndroid Build Coastguard Worker        allowed_dtypes=(torch.double,),
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_expanded_weight_per_sample_grad_sum(self, device, dtype, op):
*da0073e9SAndroid Build Coastguard Worker        sample_inputs = op.sample_inputs(device, dtype, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        for sample_input in supported_inputs(op, sample_inputs):
*da0073e9SAndroid Build Coastguard Worker            if (
*da0073e9SAndroid Build Coastguard Worker                op.name == "nn.functional.embedding"
*da0073e9SAndroid Build Coastguard Worker            ):  # embedding flips its argument order for autograd tests
*da0073e9SAndroid Build Coastguard Worker                sample_input = SampleInput(
*da0073e9SAndroid Build Coastguard Worker                    sample_input.args[0],
*da0073e9SAndroid Build Coastguard Worker                    args=(sample_input.input,),
*da0073e9SAndroid Build Coastguard Worker                    kwargs=sample_input.kwargs,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self._compare_ew_and_for_loop_per_sample_grads(op, sample_input, torch.sum)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(
*da0073e9SAndroid Build Coastguard Worker        filter(lambda op: op.supports_expanded_weight, op_db),
*da0073e9SAndroid Build Coastguard Worker        dtypes=OpDTypes.supported,
*da0073e9SAndroid Build Coastguard Worker        allowed_dtypes=(torch.double,),
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_expanded_weight_per_sample_grad_mean(self, device, dtype, op):
*da0073e9SAndroid Build Coastguard Worker        sample_inputs = op.sample_inputs(device, dtype, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        for sample_input in supported_inputs(op, sample_inputs):
*da0073e9SAndroid Build Coastguard Worker            if (
*da0073e9SAndroid Build Coastguard Worker                op.name == "nn.functional.embedding"
*da0073e9SAndroid Build Coastguard Worker            ):  # embedding flips its argument order for autograd tests
*da0073e9SAndroid Build Coastguard Worker                sample_input = SampleInput(
*da0073e9SAndroid Build Coastguard Worker                    sample_input.args[0],
*da0073e9SAndroid Build Coastguard Worker                    args=(sample_input.input,),
*da0073e9SAndroid Build Coastguard Worker                    kwargs=sample_input.kwargs,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self._compare_ew_and_for_loop_per_sample_grads(op, sample_input, torch.mean)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(
*da0073e9SAndroid Build Coastguard Worker        filter(lambda op: op.supports_expanded_weight, op_db),
*da0073e9SAndroid Build Coastguard Worker        dtypes=OpDTypes.supported,
*da0073e9SAndroid Build Coastguard Worker        allowed_dtypes=(torch.double,),
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_expanded_weights_per_sample_grad_input_no_grad(self, device, dtype, op):
*da0073e9SAndroid Build Coastguard Worker        sample_inputs = op.sample_inputs(device, dtype, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        for sample_input in supported_inputs(op, sample_inputs):
*da0073e9SAndroid Build Coastguard Worker            if (
*da0073e9SAndroid Build Coastguard Worker                op.name == "nn.functional.embedding"
*da0073e9SAndroid Build Coastguard Worker            ):  # embedding flips its argument order for autograd tests
*da0073e9SAndroid Build Coastguard Worker                sample_input = SampleInput(
*da0073e9SAndroid Build Coastguard Worker                    sample_input.args[0],
*da0073e9SAndroid Build Coastguard Worker                    args=(sample_input.input,),
*da0073e9SAndroid Build Coastguard Worker                    kwargs=sample_input.kwargs,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            sample_input.input.requires_grad_(False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            self._compare_ew_and_for_loop_per_sample_grads(op, sample_input, torch.mean)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @skipIfTorchDynamo("Checking error message doesn't work with dynamo")
*da0073e9SAndroid Build Coastguard Worker    @ops(
*da0073e9SAndroid Build Coastguard Worker        filter(lambda op: op.supports_expanded_weight, op_db),
*da0073e9SAndroid Build Coastguard Worker        dtypes=OpDTypes.supported,
*da0073e9SAndroid Build Coastguard Worker        allowed_dtypes=(torch.double,),
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_unsupported_expand_weights(self, device, dtype, op):
*da0073e9SAndroid Build Coastguard Worker        sample_inputs = op.sample_inputs(device, dtype, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        unsupported_inputs = supported_inputs(op, sample_inputs, supported_inputs=False)
*da0073e9SAndroid Build Coastguard Worker        for sample_input in unsupported_inputs:
*da0073e9SAndroid Build Coastguard Worker            with self.assertRaisesRegex(RuntimeError, r"Expanded Weights"):
*da0073e9SAndroid Build Coastguard Worker                if (
*da0073e9SAndroid Build Coastguard Worker                    op.name == "nn.functional.embedding"
*da0073e9SAndroid Build Coastguard Worker                ):  # embedding flips its argument order for autograd tests
*da0073e9SAndroid Build Coastguard Worker                    sample_input = SampleInput(
*da0073e9SAndroid Build Coastguard Worker                        sample_input.args[0],
*da0073e9SAndroid Build Coastguard Worker                        args=(sample_input.input,),
*da0073e9SAndroid Build Coastguard Worker                        kwargs=sample_input.kwargs,
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                input = sample_input.input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                batch_size = input.shape[0] if len(input.shape) > 1 else 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # get per sample grads with ExpandedWeights objects
*da0073e9SAndroid Build Coastguard Worker                (ew_input, ew_args, ew_kwargs) = make_expanded_weight(
*da0073e9SAndroid Build Coastguard Worker                    sample_input, batch_size
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                result = run_op(op, ew_input, *ew_args, **ew_kwargs)
*da0073e9SAndroid Build Coastguard Worker                diff_input_list = (
*da0073e9SAndroid Build Coastguard Worker                    (ew_input,) + tuple(ew_args) + tuple(ew_kwargs.values())
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                diff_input_list = [i for i in diff_input_list if is_diff_tensor(i)]
*da0073e9SAndroid Build Coastguard Worker                diff_input_list = [
*da0073e9SAndroid Build Coastguard Worker                    i.orig_weight if isinstance(i, ExpandedWeight) else i
*da0073e9SAndroid Build Coastguard Worker                    for i in diff_input_list
*da0073e9SAndroid Build Coastguard Worker                ]
*da0073e9SAndroid Build Coastguard Worker                result.sum().backward()  # grad doesn't work with ExpandedWeight because it calls __torch_function__
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @ops(
*da0073e9SAndroid Build Coastguard Worker        filter(lambda op: op.supports_expanded_weight, op_db), dtypes=OpDTypes.supported
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    def test_expanded_weight_forward(self, device, dtype, op):
*da0073e9SAndroid Build Coastguard Worker        sample_inputs = op.sample_inputs(device, dtype)
*da0073e9SAndroid Build Coastguard Worker        for sample_input in supported_inputs(op, sample_inputs):
*da0073e9SAndroid Build Coastguard Worker            if (
*da0073e9SAndroid Build Coastguard Worker                op.name == "nn.functional.embedding"
*da0073e9SAndroid Build Coastguard Worker            ):  # embedding flips its argument order for autograd tests
*da0073e9SAndroid Build Coastguard Worker                sample_input = SampleInput(
*da0073e9SAndroid Build Coastguard Worker                    sample_input.args[0].clone(),
*da0073e9SAndroid Build Coastguard Worker                    args=(sample_input.input.clone(),),
*da0073e9SAndroid Build Coastguard Worker                    kwargs=sample_input.kwargs,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                if (
*da0073e9SAndroid Build Coastguard Worker                    "cuda" in device
*da0073e9SAndroid Build Coastguard Worker                    and "max_norm" in sample_input.kwargs
*da0073e9SAndroid Build Coastguard Worker                    and "padding_idx" in sample_input.kwargs
*da0073e9SAndroid Build Coastguard Worker                ):
*da0073e9SAndroid Build Coastguard Worker                    self.skipTest(
*da0073e9SAndroid Build Coastguard Worker                        "embedding is non-determinstic in this case, see issue #74679"
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker            batch_size = (
*da0073e9SAndroid Build Coastguard Worker                sample_input.input.shape[0] if len(sample_input.input.shape) > 1 else 1
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            for loss_reduction in ["sum", "mean"]:
*da0073e9SAndroid Build Coastguard Worker                (ew_input, ew_args, ew_kwargs) = make_expanded_weight(
*da0073e9SAndroid Build Coastguard Worker                    sample_input, batch_size, loss_reduction
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                expanded_weight_result = run_op(op, ew_input, *ew_args, **ew_kwargs)
*da0073e9SAndroid Build Coastguard Worker                normal_result = run_op(
*da0073e9SAndroid Build Coastguard Worker                    op, sample_input.input, *sample_input.args, **sample_input.kwargs
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(expanded_weight_result, normal_result)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_expanded_weight_error(self, device):
*da0073e9SAndroid Build Coastguard Worker        batch_size = 3
*da0073e9SAndroid Build Coastguard Worker        sample_input = make_tensor(
*da0073e9SAndroid Build Coastguard Worker            (batch_size, 4), dtype=torch.float32, device=device, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        sample_weight = make_tensor(
*da0073e9SAndroid Build Coastguard Worker            (4), dtype=torch.float32, device=device, requires_grad=True
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, r"Expanded Weights encountered but cannot handle function"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            torch.add(
*da0073e9SAndroid Build Coastguard Worker                sample_input,
*da0073e9SAndroid Build Coastguard Worker                ExpandedWeight(sample_weight, batch_size, loss_reduction="sum"),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_embedding_model(self, model, num_embedding, device):
*da0073e9SAndroid Build Coastguard Worker        batch_size = 32
*da0073e9SAndroid Build Coastguard Worker        input = torch.randint(0, num_embedding, (batch_size, 5, 5), device=device)
*da0073e9SAndroid Build Coastguard Worker        return self._test_model(
*da0073e9SAndroid Build Coastguard Worker            partial(model, num_embedding=num_embedding), batch_size, input, device
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_conv_model(
*da0073e9SAndroid Build Coastguard Worker        self,
*da0073e9SAndroid Build Coastguard Worker        model,
*da0073e9SAndroid Build Coastguard Worker        input_size,
*da0073e9SAndroid Build Coastguard Worker        num_dim,
*da0073e9SAndroid Build Coastguard Worker        device,
*da0073e9SAndroid Build Coastguard Worker        loss_reduction="sum",
*da0073e9SAndroid Build Coastguard Worker        atol=1e-4,
*da0073e9SAndroid Build Coastguard Worker        rtol=5e-5,
*da0073e9SAndroid Build Coastguard Worker    ):
*da0073e9SAndroid Build Coastguard Worker        batch_size = 32
*da0073e9SAndroid Build Coastguard Worker        input_ending = [input_size] * num_dim
*da0073e9SAndroid Build Coastguard Worker        input = torch.randn([batch_size, 3] + input_ending, device=device)
*da0073e9SAndroid Build Coastguard Worker        return self._test_model(
*da0073e9SAndroid Build Coastguard Worker            partial(model, num_dim=num_dim),
*da0073e9SAndroid Build Coastguard Worker            batch_size,
*da0073e9SAndroid Build Coastguard Worker            input,
*da0073e9SAndroid Build Coastguard Worker            device,
*da0073e9SAndroid Build Coastguard Worker            loss_reduction,
*da0073e9SAndroid Build Coastguard Worker            atol,
*da0073e9SAndroid Build Coastguard Worker            rtol,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _test_model(
*da0073e9SAndroid Build Coastguard Worker        self,
*da0073e9SAndroid Build Coastguard Worker        model,
*da0073e9SAndroid Build Coastguard Worker        batch_size,
*da0073e9SAndroid Build Coastguard Worker        input,
*da0073e9SAndroid Build Coastguard Worker        device,
*da0073e9SAndroid Build Coastguard Worker        loss_reduction="sum",
*da0073e9SAndroid Build Coastguard Worker        atol=1e-4,
*da0073e9SAndroid Build Coastguard Worker        rtol=5e-5,
*da0073e9SAndroid Build Coastguard Worker    ):
*da0073e9SAndroid Build Coastguard Worker        model = model(10).to(device)
*da0073e9SAndroid Build Coastguard Worker        targets = torch.randint(0, 10, (batch_size,), device=device)
*da0073e9SAndroid Build Coastguard Worker        criterion = CrossEntropyLoss(reduction=loss_reduction)
*da0073e9SAndroid Build Coastguard Worker        result = call_for_per_sample_grads(model, loss_reduction=loss_reduction)(input)
*da0073e9SAndroid Build Coastguard Worker        loss = criterion(result, targets)
*da0073e9SAndroid Build Coastguard Worker        loss.backward()
*da0073e9SAndroid Build Coastguard Worker        result = []
*da0073e9SAndroid Build Coastguard Worker        for weight in model.parameters():
*da0073e9SAndroid Build Coastguard Worker            result.append(weight.grad_sample)
*da0073e9SAndroid Build Coastguard Worker            del weight.grad_sample
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        expected = []
*da0073e9SAndroid Build Coastguard Worker        for i in range(batch_size):
*da0073e9SAndroid Build Coastguard Worker            loss = criterion(model(input[i].unsqueeze(0)), targets[i].unsqueeze(0))
*da0073e9SAndroid Build Coastguard Worker            expected.append(
*da0073e9SAndroid Build Coastguard Worker                torch.autograd.grad(loss, model.parameters(), torch.ones_like(loss))
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        expected = [torch.stack(grad) for grad in zip(*expected)]
*da0073e9SAndroid Build Coastguard Worker        for res, exp in zip(result, expected):
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(res, exp, atol=atol, rtol=rtol)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _compute_tolerances(self, device):
*da0073e9SAndroid Build Coastguard Worker        is_cuda_sm86 = device.startswith("cuda") and torch.cuda.get_device_capability(
*da0073e9SAndroid Build Coastguard Worker            0
*da0073e9SAndroid Build Coastguard Worker        ) == (8, 6)
*da0073e9SAndroid Build Coastguard Worker        return (9e-3, 5e-5) if is_cuda_sm86 else (1e-4, 5e-5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @tf32_off()
*da0073e9SAndroid Build Coastguard Worker    def test_cnn_model_sum(self, device):
*da0073e9SAndroid Build Coastguard Worker        def convnet(num_classes, num_dim):
*da0073e9SAndroid Build Coastguard Worker            return nn.Sequential(
*da0073e9SAndroid Build Coastguard Worker                nn.Conv2d(3, 32, kernel_size=3, stride=1, padding=1),
*da0073e9SAndroid Build Coastguard Worker                nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker                nn.AvgPool2d(kernel_size=2, stride=2),
*da0073e9SAndroid Build Coastguard Worker                nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1),
*da0073e9SAndroid Build Coastguard Worker                nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker                nn.AvgPool2d(kernel_size=2, stride=2),
*da0073e9SAndroid Build Coastguard Worker                nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1),
*da0073e9SAndroid Build Coastguard Worker                nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker                nn.AvgPool2d(kernel_size=2, stride=2),
*da0073e9SAndroid Build Coastguard Worker                nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1),
*da0073e9SAndroid Build Coastguard Worker                nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker                nn.AdaptiveAvgPool2d((1, 1)),
*da0073e9SAndroid Build Coastguard Worker                nn.Flatten(start_dim=1, end_dim=-1),
*da0073e9SAndroid Build Coastguard Worker                nn.Linear(128, num_classes, bias=True),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        atol, rtol = self._compute_tolerances(device)
*da0073e9SAndroid Build Coastguard Worker        return self._test_conv_model(convnet, 28, 2, device, atol=atol, rtol=rtol)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @tf32_off()
*da0073e9SAndroid Build Coastguard Worker    def test_cnn_model_mean(self, device):
*da0073e9SAndroid Build Coastguard Worker        def convnet(num_classes, num_dim):
*da0073e9SAndroid Build Coastguard Worker            return nn.Sequential(
*da0073e9SAndroid Build Coastguard Worker                nn.Conv2d(3, 32, kernel_size=3, stride=1, padding=1),
*da0073e9SAndroid Build Coastguard Worker                nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker                nn.AvgPool2d(kernel_size=2, stride=2),
*da0073e9SAndroid Build Coastguard Worker                nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1),
*da0073e9SAndroid Build Coastguard Worker                nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker                nn.AvgPool2d(kernel_size=2, stride=2),
*da0073e9SAndroid Build Coastguard Worker                nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1),
*da0073e9SAndroid Build Coastguard Worker                nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker                nn.AvgPool2d(kernel_size=2, stride=2),
*da0073e9SAndroid Build Coastguard Worker                nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1),
*da0073e9SAndroid Build Coastguard Worker                nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker                nn.AdaptiveAvgPool2d((1, 1)),
*da0073e9SAndroid Build Coastguard Worker                nn.Flatten(start_dim=1, end_dim=-1),
*da0073e9SAndroid Build Coastguard Worker                nn.Linear(128, num_classes, bias=True),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        atol, rtol = self._compute_tolerances(device)
*da0073e9SAndroid Build Coastguard Worker        return self._test_conv_model(
*da0073e9SAndroid Build Coastguard Worker            convnet, 28, 2, device, loss_reduction="mean", atol=atol, rtol=rtol
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize("num_dim", [1, 2, 3])
*da0073e9SAndroid Build Coastguard Worker    @tf32_off()
*da0073e9SAndroid Build Coastguard Worker    def test_instance_norm_model(self, num_dim, device):
*da0073e9SAndroid Build Coastguard Worker        def instance_norm_model(num_classes, num_dim):
*da0073e9SAndroid Build Coastguard Worker            conv_layer = (
*da0073e9SAndroid Build Coastguard Worker                nn.Conv1d if num_dim == 1 else nn.Conv2d if num_dim == 2 else nn.Conv3d
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            norm_layer = (
*da0073e9SAndroid Build Coastguard Worker                nn.InstanceNorm1d
*da0073e9SAndroid Build Coastguard Worker                if num_dim == 1
*da0073e9SAndroid Build Coastguard Worker                else nn.InstanceNorm2d
*da0073e9SAndroid Build Coastguard Worker                if num_dim == 2
*da0073e9SAndroid Build Coastguard Worker                else nn.InstanceNorm3d
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            return nn.Sequential(
*da0073e9SAndroid Build Coastguard Worker                conv_layer(3, 32, kernel_size=3, stride=1, padding=1),
*da0073e9SAndroid Build Coastguard Worker                norm_layer(32, affine=True),
*da0073e9SAndroid Build Coastguard Worker                nn.Flatten(start_dim=1, end_dim=-1),
*da0073e9SAndroid Build Coastguard Worker                nn.Linear(32 * (7**num_dim), num_classes, bias=True),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        atol, rtol = self._compute_tolerances(device)
*da0073e9SAndroid Build Coastguard Worker        return self._test_conv_model(
*da0073e9SAndroid Build Coastguard Worker            instance_norm_model, 7, num_dim, device, atol=atol, rtol=rtol
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize("num_dim", [1, 2, 3])
*da0073e9SAndroid Build Coastguard Worker    @tf32_off()
*da0073e9SAndroid Build Coastguard Worker    def test_group_norm_model(self, num_dim, device):
*da0073e9SAndroid Build Coastguard Worker        def group_norm_model(num_classes, num_dim):
*da0073e9SAndroid Build Coastguard Worker            conv_layer = (
*da0073e9SAndroid Build Coastguard Worker                nn.Conv1d if num_dim == 1 else nn.Conv2d if num_dim == 2 else nn.Conv3d
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            return nn.Sequential(
*da0073e9SAndroid Build Coastguard Worker                conv_layer(3, 32, kernel_size=3, stride=1, padding=1),
*da0073e9SAndroid Build Coastguard Worker                nn.GroupNorm(8, 32, affine=True),
*da0073e9SAndroid Build Coastguard Worker                nn.Flatten(start_dim=1, end_dim=-1),
*da0073e9SAndroid Build Coastguard Worker                nn.Linear(32 * (7**num_dim), num_classes, bias=True),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        atol, rtol = self._compute_tolerances(device)
*da0073e9SAndroid Build Coastguard Worker        return self._test_conv_model(
*da0073e9SAndroid Build Coastguard Worker            group_norm_model, 7, num_dim, device, atol=atol, rtol=rtol
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @parametrize("num_dim", [1, 2, 3])
*da0073e9SAndroid Build Coastguard Worker    @tf32_off()
*da0073e9SAndroid Build Coastguard Worker    def test_layer_norm_model(self, num_dim, device):
*da0073e9SAndroid Build Coastguard Worker        def layer_norm_model(num_classes, num_dim):
*da0073e9SAndroid Build Coastguard Worker            conv_layer = (
*da0073e9SAndroid Build Coastguard Worker                nn.Conv1d if num_dim == 1 else nn.Conv2d if num_dim == 2 else nn.Conv3d
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            normalized_shape = [7] * num_dim
*da0073e9SAndroid Build Coastguard Worker            return nn.Sequential(
*da0073e9SAndroid Build Coastguard Worker                conv_layer(3, 32, kernel_size=3, stride=1, padding=1),
*da0073e9SAndroid Build Coastguard Worker                nn.LayerNorm(normalized_shape, elementwise_affine=True),
*da0073e9SAndroid Build Coastguard Worker                nn.Flatten(start_dim=1, end_dim=-1),
*da0073e9SAndroid Build Coastguard Worker                nn.Linear(32 * (7**num_dim), num_classes, bias=True),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        atol, rtol = self._compute_tolerances(device)
*da0073e9SAndroid Build Coastguard Worker        return self._test_conv_model(
*da0073e9SAndroid Build Coastguard Worker            layer_norm_model, 7, num_dim, device, atol=atol, rtol=rtol
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_embedding_model(self, device):
*da0073e9SAndroid Build Coastguard Worker        def embedding_model(num_classes, num_embedding):
*da0073e9SAndroid Build Coastguard Worker            return nn.Sequential(
*da0073e9SAndroid Build Coastguard Worker                nn.Embedding(num_embedding, 15),
*da0073e9SAndroid Build Coastguard Worker                nn.Flatten(start_dim=1, end_dim=-1),
*da0073e9SAndroid Build Coastguard Worker                nn.Linear(375, num_classes, bias=True),
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        return self._test_embedding_model(embedding_model, 16, device)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_group_norm_error(self, device):
*da0073e9SAndroid Build Coastguard Worker        # group norm has to call native_group_norm. This checks that it hits the same errors
*da0073e9SAndroid Build Coastguard Worker        # that normal group norm would
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        N = 3
*da0073e9SAndroid Build Coastguard Worker        C = 5
*da0073e9SAndroid Build Coastguard Worker        inp = torch.randn(N, C)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, r"Expected number of channels in input to be divisible"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            F.group_norm(inp, 2)  # 5 is not divisible by 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestExpandedWeightModule(TestCase):
*da0073e9SAndroid Build Coastguard Worker    def _do_test(
*da0073e9SAndroid Build Coastguard Worker        self,
*da0073e9SAndroid Build Coastguard Worker        module,
*da0073e9SAndroid Build Coastguard Worker        input,
*da0073e9SAndroid Build Coastguard Worker        args=None,
*da0073e9SAndroid Build Coastguard Worker        kwargs=None,
*da0073e9SAndroid Build Coastguard Worker        batch_first=True,
*da0073e9SAndroid Build Coastguard Worker        atol=None,
*da0073e9SAndroid Build Coastguard Worker        rtol=None,
*da0073e9SAndroid Build Coastguard Worker    ):
*da0073e9SAndroid Build Coastguard Worker        args = args or ()
*da0073e9SAndroid Build Coastguard Worker        kwargs = kwargs or {}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        batch_dim = 0 if batch_first else 1
*da0073e9SAndroid Build Coastguard Worker        batch_size = input.shape[batch_dim]
*da0073e9SAndroid Build Coastguard Worker        diff_input = input.dtype == torch.float or input.dtype == torch.double
*da0073e9SAndroid Build Coastguard Worker        if diff_input:
*da0073e9SAndroid Build Coastguard Worker            input.requires_grad_()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with freeze_rng_state():
*da0073e9SAndroid Build Coastguard Worker            # get per sample grads with ExpandedWeights context manager
*da0073e9SAndroid Build Coastguard Worker            actual_res = call_for_per_sample_grads(
*da0073e9SAndroid Build Coastguard Worker                module,
*da0073e9SAndroid Build Coastguard Worker                batch_size=batch_size,
*da0073e9SAndroid Build Coastguard Worker                loss_reduction="sum",
*da0073e9SAndroid Build Coastguard Worker                batch_first=batch_first,
*da0073e9SAndroid Build Coastguard Worker            )(input, *args, **kwargs).sum()
*da0073e9SAndroid Build Coastguard Worker            actual_res.backward()
*da0073e9SAndroid Build Coastguard Worker            actual_grads = []
*da0073e9SAndroid Build Coastguard Worker            for param in module.parameters():
*da0073e9SAndroid Build Coastguard Worker                actual_grads.append(param.grad_sample)
*da0073e9SAndroid Build Coastguard Worker                del param.grad_sample
*da0073e9SAndroid Build Coastguard Worker            if diff_input:
*da0073e9SAndroid Build Coastguard Worker                actual_grads.append(input.grad.clone())
*da0073e9SAndroid Build Coastguard Worker                input.grad = torch.zeros_like(input.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # get per sample grads with a for loop
*da0073e9SAndroid Build Coastguard Worker            expected_res = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker                0.0, device=input.device, dtype=actual_res.dtype
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            expected_grads = []
*da0073e9SAndroid Build Coastguard Worker            for i in range(batch_size):
*da0073e9SAndroid Build Coastguard Worker                input_slice = input.narrow(batch_dim, i, 1)
*da0073e9SAndroid Build Coastguard Worker                input_slice = input_slice.squeeze(batch_dim)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                # h's batch dim is always the first dim. Must be contiguous for CUDA
*da0073e9SAndroid Build Coastguard Worker                sliced_args = tree_map_only(
*da0073e9SAndroid Build Coastguard Worker                    torch.Tensor, lambda t: t.narrow(1, i, 1).contiguous(), args
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                diff_params = module.parameters()
*da0073e9SAndroid Build Coastguard Worker                if diff_input:
*da0073e9SAndroid Build Coastguard Worker                    diff_params = chain(diff_params, (input_slice,))
*da0073e9SAndroid Build Coastguard Worker                res = module(
*da0073e9SAndroid Build Coastguard Worker                    input_slice.unsqueeze(batch_dim).contiguous(),
*da0073e9SAndroid Build Coastguard Worker                    *sliced_args,
*da0073e9SAndroid Build Coastguard Worker                    **kwargs,
*da0073e9SAndroid Build Coastguard Worker                ).sum()
*da0073e9SAndroid Build Coastguard Worker                out_grads = torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                    res, diff_params, torch.ones_like(res), allow_unused=True
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                expected_grads.append(out_grads)
*da0073e9SAndroid Build Coastguard Worker                expected_res += res
*da0073e9SAndroid Build Coastguard Worker            expected_grads = [torch.stack(grad) for grad in zip(*expected_grads)]
*da0073e9SAndroid Build Coastguard Worker            if not batch_first:
*da0073e9SAndroid Build Coastguard Worker                expected_grads[-1] = expected_grads[-1].transpose(0, 1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(actual_res, expected_res)
*da0073e9SAndroid Build Coastguard Worker        [
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(actual, expected, atol=atol, rtol=rtol)
*da0073e9SAndroid Build Coastguard Worker            for (actual, expected) in zip(actual_grads, expected_grads)
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _do_test_multi_input(self, module, input):
*da0073e9SAndroid Build Coastguard Worker        class TestModule(nn.Module):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self, module):
*da0073e9SAndroid Build Coastguard Worker                super().__init__()
*da0073e9SAndroid Build Coastguard Worker                self.module = module
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def forward(self, input):
*da0073e9SAndroid Build Coastguard Worker                return self.module(input) + self.module(input)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        batch_size = input.shape[0]
*da0073e9SAndroid Build Coastguard Worker        diff_input = input.dtype == torch.float or input.dtype == torch.double
*da0073e9SAndroid Build Coastguard Worker        if diff_input:
*da0073e9SAndroid Build Coastguard Worker            input.requires_grad_()
*da0073e9SAndroid Build Coastguard Worker        with freeze_rng_state():
*da0073e9SAndroid Build Coastguard Worker            # get per sample grads with ExpandedWeights context manager, calling .backward() twice
*da0073e9SAndroid Build Coastguard Worker            test_module = TestModule(module)
*da0073e9SAndroid Build Coastguard Worker            actual_res = call_for_per_sample_grads(test_module, loss_reduction="sum")(
*da0073e9SAndroid Build Coastguard Worker                input
*da0073e9SAndroid Build Coastguard Worker            ).sum()
*da0073e9SAndroid Build Coastguard Worker            actual_res.backward()
*da0073e9SAndroid Build Coastguard Worker            actual_grads = []
*da0073e9SAndroid Build Coastguard Worker            for param in module.parameters():
*da0073e9SAndroid Build Coastguard Worker                actual_grads.append(param.grad_sample)
*da0073e9SAndroid Build Coastguard Worker                del param.grad_sample
*da0073e9SAndroid Build Coastguard Worker            if diff_input:
*da0073e9SAndroid Build Coastguard Worker                actual_grads.append(input.grad.clone())
*da0073e9SAndroid Build Coastguard Worker                input.grad = torch.zeros_like(input.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # get per sample grads with a for loop, running over the input twice
*da0073e9SAndroid Build Coastguard Worker            expected_grads = []
*da0073e9SAndroid Build Coastguard Worker            for i in range(batch_size):
*da0073e9SAndroid Build Coastguard Worker                input_slice = input[i]
*da0073e9SAndroid Build Coastguard Worker                diff_params = module.parameters()
*da0073e9SAndroid Build Coastguard Worker                if diff_input:
*da0073e9SAndroid Build Coastguard Worker                    diff_params = chain(diff_params, (input_slice,))
*da0073e9SAndroid Build Coastguard Worker                res = module(input_slice.unsqueeze(0)).sum()
*da0073e9SAndroid Build Coastguard Worker                out_grads = torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                    res, diff_params, torch.ones_like(res), allow_unused=True
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                expected_grads.append(out_grads)
*da0073e9SAndroid Build Coastguard Worker        expected_grads = tuple(torch.stack(grad) for grad in zip(*expected_grads))
*da0073e9SAndroid Build Coastguard Worker        expected_grads = tuple(
*da0073e9SAndroid Build Coastguard Worker            expected_grad
*da0073e9SAndroid Build Coastguard Worker            for expected_grad in expected_grads
*da0073e9SAndroid Build Coastguard Worker            if expected_grad is not None
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        assert [
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(actual, 2 * expected)
*da0073e9SAndroid Build Coastguard Worker            for (actual, expected) in zip(actual_grads, expected_grads)
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _do_test_rnn_packed_sequence(
*da0073e9SAndroid Build Coastguard Worker        self, module, input, args=None, kwargs=None, atol=None, rtol=None
*da0073e9SAndroid Build Coastguard Worker    ):
*da0073e9SAndroid Build Coastguard Worker        args = args if args is not None else ()
*da0073e9SAndroid Build Coastguard Worker        kwargs = kwargs if kwargs is not None else {}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        batch_size = max(tuple(input.batch_sizes)).item()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with freeze_rng_state():
*da0073e9SAndroid Build Coastguard Worker            # get per sample grads with ExpandedWeights context manager
*da0073e9SAndroid Build Coastguard Worker            actual_res = call_for_per_sample_grads(
*da0073e9SAndroid Build Coastguard Worker                module, batch_size=batch_size, loss_reduction="sum"
*da0073e9SAndroid Build Coastguard Worker            )(input, *args, **kwargs).data.sum()
*da0073e9SAndroid Build Coastguard Worker            actual_res.backward()
*da0073e9SAndroid Build Coastguard Worker            actual_grads = []
*da0073e9SAndroid Build Coastguard Worker            for param in module.parameters():
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(param.grad_sample.shape[0], batch_size)
*da0073e9SAndroid Build Coastguard Worker                actual_grads.append(param.grad_sample)
*da0073e9SAndroid Build Coastguard Worker                del param.grad_sample
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            input.data.grad = torch.zeros_like(input.data)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # compute the per sample grads with a for loop
*da0073e9SAndroid Build Coastguard Worker            expected_res = torch.zeros_like(actual_res)
*da0073e9SAndroid Build Coastguard Worker            expected_grads = []
*da0073e9SAndroid Build Coastguard Worker            padded_input, seq_sizes = torch.nn.utils.rnn.pad_packed_sequence(
*da0073e9SAndroid Build Coastguard Worker                input, batch_first=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            for i in range(len(seq_sizes)):
*da0073e9SAndroid Build Coastguard Worker                input_slice = padded_input[i].narrow(0, 0, seq_sizes[i])
*da0073e9SAndroid Build Coastguard Worker                diff_params = module.parameters()
*da0073e9SAndroid Build Coastguard Worker                batch_dim = 0 if module.m.batch_first else 1
*da0073e9SAndroid Build Coastguard Worker                res = module(input_slice.unsqueeze(batch_dim), *args, **kwargs).sum()
*da0073e9SAndroid Build Coastguard Worker                expected_res += res
*da0073e9SAndroid Build Coastguard Worker                out_grads = torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                    res, diff_params, torch.ones_like(res), allow_unused=True
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker                expected_grads.append(out_grads)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            expected_grads = [torch.stack(grad) for grad in zip(*expected_grads)]
*da0073e9SAndroid Build Coastguard Worker            self.assertEqual(actual_res, expected_res)
*da0073e9SAndroid Build Coastguard Worker            [
*da0073e9SAndroid Build Coastguard Worker                self.assertEqual(actual, expected, atol=atol, rtol=rtol)
*da0073e9SAndroid Build Coastguard Worker                for (actual, expected) in zip(actual_grads, expected_grads)
*da0073e9SAndroid Build Coastguard Worker            ]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @modules(
*da0073e9SAndroid Build Coastguard Worker        filter(
*da0073e9SAndroid Build Coastguard Worker            lambda m_info: m_info.module_cls
*da0073e9SAndroid Build Coastguard Worker            in (torch.nn.RNN, torch.nn.LSTM, torch.nn.GRU),
*da0073e9SAndroid Build Coastguard Worker            module_db,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker    @tf32_off()
*da0073e9SAndroid Build Coastguard Worker    def test_module(self, device, dtype, module_info, training):
*da0073e9SAndroid Build Coastguard Worker        class RNNWrapper(torch.nn.Module):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self, m_cons, args, kwargs):
*da0073e9SAndroid Build Coastguard Worker                super().__init__()
*da0073e9SAndroid Build Coastguard Worker                self.m = m_cons(*args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def forward(self, *inps):
*da0073e9SAndroid Build Coastguard Worker                ret = self.m(*inps)
*da0073e9SAndroid Build Coastguard Worker                assert isinstance(ret, tuple)
*da0073e9SAndroid Build Coastguard Worker                return ret[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        def batch_hidden(h):
*da0073e9SAndroid Build Coastguard Worker            new_h_shape = [1] * (len(h.shape) + 1)
*da0073e9SAndroid Build Coastguard Worker            new_h_shape[1] = 2
*da0073e9SAndroid Build Coastguard Worker            return h.unsqueeze(1).repeat(new_h_shape)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        module_cls = module_info.module_cls
*da0073e9SAndroid Build Coastguard Worker        atol, rtol = (
*da0073e9SAndroid Build Coastguard Worker            (1e-4, 1e-5)
*da0073e9SAndroid Build Coastguard Worker            if module_cls == torch.nn.GRU and dtype == torch.float32
*da0073e9SAndroid Build Coastguard Worker            else (None, None)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        module_inputs = module_info.module_inputs_func(
*da0073e9SAndroid Build Coastguard Worker            module_info,
*da0073e9SAndroid Build Coastguard Worker            device=device,
*da0073e9SAndroid Build Coastguard Worker            dtype=dtype,
*da0073e9SAndroid Build Coastguard Worker            requires_grad=True,
*da0073e9SAndroid Build Coastguard Worker            training=training,
*da0073e9SAndroid Build Coastguard Worker            with_packed_sequence=True,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        for module_input in module_inputs:
*da0073e9SAndroid Build Coastguard Worker            if module_input.forward_input is None:
*da0073e9SAndroid Build Coastguard Worker                continue
*da0073e9SAndroid Build Coastguard Worker            args, kwargs = (
*da0073e9SAndroid Build Coastguard Worker                module_input.constructor_input.args,
*da0073e9SAndroid Build Coastguard Worker                module_input.constructor_input.kwargs,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            m = RNNWrapper(module_cls, args, kwargs)
*da0073e9SAndroid Build Coastguard Worker            batch_first = m.m.batch_first
*da0073e9SAndroid Build Coastguard Worker            m.to(device).to(dtype)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            args, kwargs = (
*da0073e9SAndroid Build Coastguard Worker                module_input.forward_input.args,
*da0073e9SAndroid Build Coastguard Worker                module_input.forward_input.kwargs,
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            # if the RNN tests use unbatched inputs--batch the inputs
*da0073e9SAndroid Build Coastguard Worker            input = args[0]
*da0073e9SAndroid Build Coastguard Worker            if isinstance(input, torch.Tensor) and input.dim() == 2:
*da0073e9SAndroid Build Coastguard Worker                input = input.detach()
*da0073e9SAndroid Build Coastguard Worker                new_input_shape = [1] * (len(input.shape) + 1)
*da0073e9SAndroid Build Coastguard Worker                if batch_first:
*da0073e9SAndroid Build Coastguard Worker                    new_input_shape[0] = 2
*da0073e9SAndroid Build Coastguard Worker                    input = input.repeat(new_input_shape)
*da0073e9SAndroid Build Coastguard Worker                else:
*da0073e9SAndroid Build Coastguard Worker                    new_input_shape[1] = 2
*da0073e9SAndroid Build Coastguard Worker                    input = input.unsqueeze(1).repeat(new_input_shape)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                h = args[1] if len(args) > 1 else None
*da0073e9SAndroid Build Coastguard Worker                if h is not None:
*da0073e9SAndroid Build Coastguard Worker                    h = (
*da0073e9SAndroid Build Coastguard Worker                        batch_hidden(h)
*da0073e9SAndroid Build Coastguard Worker                        if isinstance(h, torch.Tensor)
*da0073e9SAndroid Build Coastguard Worker                        else tuple(batch_hidden(hx) for hx in h)
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                    args = list(args)
*da0073e9SAndroid Build Coastguard Worker                    args[1] = h
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            if isinstance(input, torch.nn.utils.rnn.PackedSequence):
*da0073e9SAndroid Build Coastguard Worker                self._do_test_rnn_packed_sequence(
*da0073e9SAndroid Build Coastguard Worker                    m, input, args[1:], kwargs, atol=atol, rtol=rtol
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            else:
*da0073e9SAndroid Build Coastguard Worker                self._do_test(
*da0073e9SAndroid Build Coastguard Worker                    m,
*da0073e9SAndroid Build Coastguard Worker                    input,
*da0073e9SAndroid Build Coastguard Worker                    args[1:],
*da0073e9SAndroid Build Coastguard Worker                    kwargs,
*da0073e9SAndroid Build Coastguard Worker                    batch_first=batch_first,
*da0073e9SAndroid Build Coastguard Worker                    atol=atol,
*da0073e9SAndroid Build Coastguard Worker                    rtol=rtol,
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_per_sample_api_failing(self):
*da0073e9SAndroid Build Coastguard Worker        module = nn.Linear(10, 10)
*da0073e9SAndroid Build Coastguard Worker        input = torch.randn(64, 10)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, r"Module passed must be nn.Module"):
*da0073e9SAndroid Build Coastguard Worker            call_for_per_sample_grads("fail")(input)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, r"Batch size passed must be None or an integer"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            call_for_per_sample_grads(module, batch_size=6.4)(input)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, r"Batch size must be positive"):
*da0073e9SAndroid Build Coastguard Worker            call_for_per_sample_grads(module, batch_size=-64)(input)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(RuntimeError, r"incorrect for multiple calls"):
*da0073e9SAndroid Build Coastguard Worker            loss = call_for_per_sample_grads(module)(input).sum()
*da0073e9SAndroid Build Coastguard Worker            loss.backward()  # populate grad_sample fields
*da0073e9SAndroid Build Coastguard Worker            call_for_per_sample_grads(module)(input)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        module = nn.Linear(10, 10)  # reset to not have grad_sample fields
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, r"Expected loss_reduction argument to be sum or mean"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            call_for_per_sample_grads(module, loss_reduction="")(input)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_per_sample_api_compute_batch_size(self):
*da0073e9SAndroid Build Coastguard Worker        class CustomModule(nn.Module):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                super().__init__()
*da0073e9SAndroid Build Coastguard Worker                self.linear = nn.Linear(5, 5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def forward(self, input1, input2):
*da0073e9SAndroid Build Coastguard Worker                return self.linear(input1) + self.linear(input2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        module = CustomModule()
*da0073e9SAndroid Build Coastguard Worker        input1 = torch.randn(4, 5)
*da0073e9SAndroid Build Coastguard Worker        input2 = torch.randn(5, 5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "found at least one input with batch size 4 and one with batch size 5",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            call_for_per_sample_grads(module)(input1, input2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        input2 = torch.randn(4, 5)
*da0073e9SAndroid Build Coastguard Worker        call_for_per_sample_grads(module)(input1, input2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        module = CustomModule()
*da0073e9SAndroid Build Coastguard Worker        call_for_per_sample_grads(module)(input1, input2=input2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        module = CustomModule()
*da0073e9SAndroid Build Coastguard Worker        call_for_per_sample_grads(module)(input1=input1, input2=input2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_per_sample_api_compute_batch_size_not_pytreeable(self):
*da0073e9SAndroid Build Coastguard Worker        @dataclass
*da0073e9SAndroid Build Coastguard Worker        class NonPytreeableTuple:
*da0073e9SAndroid Build Coastguard Worker            elem1: torch.Tensor
*da0073e9SAndroid Build Coastguard Worker            elem2: torch.Tensor
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        class CustomModule(nn.Module):
*da0073e9SAndroid Build Coastguard Worker            def __init__(self) -> None:
*da0073e9SAndroid Build Coastguard Worker                super().__init__()
*da0073e9SAndroid Build Coastguard Worker                self.linear = nn.Linear(5, 5)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker            def forward(self, input1, input2):
*da0073e9SAndroid Build Coastguard Worker                return self.linear(input1.elem1) + self.linear(input1.elem2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        input = NonPytreeableTuple(torch.randn(4, 5), torch.randn(4, 5))
*da0073e9SAndroid Build Coastguard Worker        model = CustomModule()
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError,
*da0073e9SAndroid Build Coastguard Worker            "ExpandedWeights cannot compute the batch size from the inputs",
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            call_for_per_sample_grads(model)(input, "")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # would prefer for it to error because input is not pytree-able but that's hard to detect
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaisesRegex(
*da0073e9SAndroid Build Coastguard Worker            RuntimeError, "Expected ExpandedWeights to have batch size matching input"
*da0073e9SAndroid Build Coastguard Worker        ):
*da0073e9SAndroid Build Coastguard Worker            call_for_per_sample_grads(model)(input, torch.randn(5))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        model = CustomModule()  # TODO: functional call bug, sam will fix
*da0073e9SAndroid Build Coastguard Worker        call_for_per_sample_grads(model)(input, torch.randn(4, 5))
*da0073e9SAndroid Build Coastguard Worker        model = CustomModule()
*da0073e9SAndroid Build Coastguard Worker        call_for_per_sample_grads(model, batch_size=4)(input, torch.randn(5))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass ContextManagerTests(TestBase):
*da0073e9SAndroid Build Coastguard Worker    def __init__(self, *args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker        self.test_cpu = kwargs.get("test_cpu", True)
*da0073e9SAndroid Build Coastguard Worker        self.test_cuda = kwargs.get("test_cuda", True)
*da0073e9SAndroid Build Coastguard Worker        super().__init__(*args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def constructor_args(self):
*da0073e9SAndroid Build Coastguard Worker        return self._get_arg("constructor_args", False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_context_manager(self, test_case, device):
*da0073e9SAndroid Build Coastguard Worker        kwargs = {"device": device, "dtype": torch.double}
*da0073e9SAndroid Build Coastguard Worker        module = self.constructor(*self.constructor_args).to(**kwargs)
*da0073e9SAndroid Build Coastguard Worker        if "Embedding" in self.get_name():
*da0073e9SAndroid Build Coastguard Worker            kwargs["dtype"] = torch.long
*da0073e9SAndroid Build Coastguard Worker        input = self._get_input().to(**kwargs)
*da0073e9SAndroid Build Coastguard Worker        if len(input.shape) == 0 or input.shape[0] == 0:
*da0073e9SAndroid Build Coastguard Worker            raise unittest.SkipTest(
*da0073e9SAndroid Build Coastguard Worker                "Can't get per sample gradients when no batch dim or batch dim is 0"
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        if self.constructor == torch.nn.Linear and len(input.shape) == 1:
*da0073e9SAndroid Build Coastguard Worker            raise unittest.SkipTest(
*da0073e9SAndroid Build Coastguard Worker                "Can't get per sample gradients for input of rank 1"
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        test_case._do_test(module, input)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_context_manager_multiple_inputs(self, test_case, device):
*da0073e9SAndroid Build Coastguard Worker        module = self.constructor(*self.constructor_args).to(device)
*da0073e9SAndroid Build Coastguard Worker        input = self._get_input()
*da0073e9SAndroid Build Coastguard Worker        if len(input.shape) == 0 or input.shape[0] == 0:
*da0073e9SAndroid Build Coastguard Worker            raise unittest.SkipTest(
*da0073e9SAndroid Build Coastguard Worker                "Can't get per sample gradients when no batch dim or batch dim is 0"
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        if self.constructor == torch.nn.Linear and len(input.shape) == 1:
*da0073e9SAndroid Build Coastguard Worker            raise unittest.SkipTest(
*da0073e9SAndroid Build Coastguard Worker                "Can't get per sample gradients for input of rank 1"
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        test_case._do_test_multi_input(module, input)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef filter_supported_tests(t):
*da0073e9SAndroid Build Coastguard Worker    supported_modules = [
*da0073e9SAndroid Build Coastguard Worker        "Linear",
*da0073e9SAndroid Build Coastguard Worker        "Conv1d",
*da0073e9SAndroid Build Coastguard Worker        "Conv2d",
*da0073e9SAndroid Build Coastguard Worker        "Conv3d",
*da0073e9SAndroid Build Coastguard Worker        "Embedding",
*da0073e9SAndroid Build Coastguard Worker        "LayerNorm",
*da0073e9SAndroid Build Coastguard Worker        "GroupNorm",
*da0073e9SAndroid Build Coastguard Worker        "InstanceNorm",
*da0073e9SAndroid Build Coastguard Worker    ]
*da0073e9SAndroid Build Coastguard Worker    if "module_name" in t and t["module_name"] in supported_modules:
*da0073e9SAndroid Build Coastguard Worker        return True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# TODO: Once all of these use ModuleInfo, replace with ModuleInfo tests
*da0073e9SAndroid Build Coastguard Worker# These currently use the legacy nn tests
*da0073e9SAndroid Build Coastguard Workersupported_tests = [
*da0073e9SAndroid Build Coastguard Worker    t for t in module_tests + new_module_tests if filter_supported_tests(t)
*da0073e9SAndroid Build Coastguard Worker]
*da0073e9SAndroid Build Coastguard Workerfor test_param in supported_tests:
*da0073e9SAndroid Build Coastguard Worker    if "constructor" not in test_param:
*da0073e9SAndroid Build Coastguard Worker        name = test_param.pop("module_name")
*da0073e9SAndroid Build Coastguard Worker        test_param["constructor"] = getattr(nn, name)
*da0073e9SAndroid Build Coastguard Worker    decorator = test_param.pop("decorator", lambda test: test)
*da0073e9SAndroid Build Coastguard Worker    test = ContextManagerTests(**test_param)
*da0073e9SAndroid Build Coastguard Worker    test_name = test.get_name()
*da0073e9SAndroid Build Coastguard Worker    if hasattr(TestExpandedWeightModule, test_name):
*da0073e9SAndroid Build Coastguard Worker        raise RuntimeError("Found two tests with the same name: " + test_name)
*da0073e9SAndroid Build Coastguard Worker    test_name_multi_input = test.get_name() + "_multiple_inputs"
*da0073e9SAndroid Build Coastguard Worker    if hasattr(TestExpandedWeightModule, test_name_multi_input):
*da0073e9SAndroid Build Coastguard Worker        raise RuntimeError("Found two tests with the same name: " + test_name)
*da0073e9SAndroid Build Coastguard Worker    if test.test_cpu:
*da0073e9SAndroid Build Coastguard Worker        setattr(
*da0073e9SAndroid Build Coastguard Worker            TestExpandedWeightModule,
*da0073e9SAndroid Build Coastguard Worker            test_name,
*da0073e9SAndroid Build Coastguard Worker            decorator(lambda self, test=test: test.test_context_manager(self, "cpu")),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        setattr(
*da0073e9SAndroid Build Coastguard Worker            TestExpandedWeightModule,
*da0073e9SAndroid Build Coastguard Worker            test_name_multi_input,
*da0073e9SAndroid Build Coastguard Worker            decorator(
*da0073e9SAndroid Build Coastguard Worker                lambda self, test=test: test.test_context_manager_multiple_inputs(
*da0073e9SAndroid Build Coastguard Worker                    self, "cpu"
*da0073e9SAndroid Build Coastguard Worker                )
*da0073e9SAndroid Build Coastguard Worker            ),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    if TEST_CUDA and test.test_cuda:
*da0073e9SAndroid Build Coastguard Worker        # since this checks derivatives, only use double for precision
*da0073e9SAndroid Build Coastguard Worker        setattr(
*da0073e9SAndroid Build Coastguard Worker            TestExpandedWeightModule,
*da0073e9SAndroid Build Coastguard Worker            test_name + "_cuda_double",
*da0073e9SAndroid Build Coastguard Worker            decorator(lambda self, test=test: test.test_context_manager(self, "cuda")),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker# ------------- HELPER FUNCTIONS -----------------
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef run_op(op, input, *args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker    r"""
*da0073e9SAndroid Build Coastguard Worker    OpInfo for Embedding switches the input and weight so autograd tests will only check the derivative
*da0073e9SAndroid Build Coastguard Worker    of the weight, not the input, which can't be differentiable since its dtype is int. Calls op,
*da0073e9SAndroid Build Coastguard Worker    using the special ordering that Embedding's OpInfo expects for that case.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    if op.name == "nn.functional.embedding":
*da0073e9SAndroid Build Coastguard Worker        return op(args[0], input, **kwargs)
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        return op(input, *args, **kwargs)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef make_expanded_weight(sample_input, batch_size, loss_reduction="sum"):
*da0073e9SAndroid Build Coastguard Worker    def expanded_weight_or_clone(arg):
*da0073e9SAndroid Build Coastguard Worker        if is_diff_tensor(arg):
*da0073e9SAndroid Build Coastguard Worker            return ExpandedWeight(torch.clone(arg), batch_size, loss_reduction)
*da0073e9SAndroid Build Coastguard Worker        return clone_if_tensor(arg)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    ew_input = clone_if_tensor(sample_input.input)
*da0073e9SAndroid Build Coastguard Worker    ew_args = tuple(expanded_weight_or_clone(arg) for arg in sample_input.args)
*da0073e9SAndroid Build Coastguard Worker    ew_kwargs = {
*da0073e9SAndroid Build Coastguard Worker        name: expanded_weight_or_clone(arg)
*da0073e9SAndroid Build Coastguard Worker        for (name, arg) in sample_input.kwargs.items()
*da0073e9SAndroid Build Coastguard Worker    }
*da0073e9SAndroid Build Coastguard Worker    return ew_input, ew_args, ew_kwargs
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef supported_inputs(op, sample_inputs, supported_inputs=True):
*da0073e9SAndroid Build Coastguard Worker    r"""
*da0073e9SAndroid Build Coastguard Worker    ExpandedWeights currently does not support some use cases when there's no batch dimension or
*da0073e9SAndroid Build Coastguard Worker    operations that would cause inter-batch operations. Removes all of the cases it cannot deal with
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def filter_fn(input):
*da0073e9SAndroid Build Coastguard Worker        convolutions = [
*da0073e9SAndroid Build Coastguard Worker            "nn.functional.conv1d",
*da0073e9SAndroid Build Coastguard Worker            "nn.functional.conv2d",
*da0073e9SAndroid Build Coastguard Worker            "nn.functional.conv3d",
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker        batched_input_size = dict(zip(convolutions, [3, 4, 5]))
*da0073e9SAndroid Build Coastguard Worker        if op.name == "nn.functional.linear":
*da0073e9SAndroid Build Coastguard Worker            is_supported_input = (
*da0073e9SAndroid Build Coastguard Worker                input.input.dim() > 1
*da0073e9SAndroid Build Coastguard Worker            )  # input of rank 1 means no batch dim
*da0073e9SAndroid Build Coastguard Worker        elif op.name == "nn.functional.layer_norm":
*da0073e9SAndroid Build Coastguard Worker            normalized_shape = input.args[0]
*da0073e9SAndroid Build Coastguard Worker            is_supported_input = (
*da0073e9SAndroid Build Coastguard Worker                input.input.shape != normalized_shape
*da0073e9SAndroid Build Coastguard Worker            )  # would cause inter-batch operations
*da0073e9SAndroid Build Coastguard Worker        elif op.name in convolutions:
*da0073e9SAndroid Build Coastguard Worker            # currently can't deal with padding computation on Python level
*da0073e9SAndroid Build Coastguard Worker            is_supported_input = input.input.dim() == batched_input_size[op.name]
*da0073e9SAndroid Build Coastguard Worker        elif op.name == "nn.functional.embedding":
*da0073e9SAndroid Build Coastguard Worker            idx = input.args[0]
*da0073e9SAndroid Build Coastguard Worker            is_supported_input = len(idx.shape) > 1  # there's no batch size
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            is_supported_input = True
*da0073e9SAndroid Build Coastguard Worker        is_supported_input = (
*da0073e9SAndroid Build Coastguard Worker            is_supported_input and input.input.shape[0] > 0
*da0073e9SAndroid Build Coastguard Worker        )  # 0 is not a valid batch size
*da0073e9SAndroid Build Coastguard Worker        return is_supported_input if supported_inputs else not is_supported_input
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return [input for input in sample_inputs if filter_fn(input)]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef for_loop_per_sample_grad(batch_size, reduction, input, func, *args, **kwargs):
*da0073e9SAndroid Build Coastguard Worker    # get per sample grads by getting derivative for each input in a for loop
*da0073e9SAndroid Build Coastguard Worker    per_sample_grad = []
*da0073e9SAndroid Build Coastguard Worker    for i in range(batch_size):
*da0073e9SAndroid Build Coastguard Worker        per_sample_input = input[i]
*da0073e9SAndroid Build Coastguard Worker        result = reduction(func(per_sample_input.unsqueeze(0), *args, **kwargs))
*da0073e9SAndroid Build Coastguard Worker        diff_input_list = (per_sample_input,) + tuple(args) + tuple(kwargs.values())
*da0073e9SAndroid Build Coastguard Worker        diff_input_list = [
*da0073e9SAndroid Build Coastguard Worker            i
*da0073e9SAndroid Build Coastguard Worker            for i in diff_input_list
*da0073e9SAndroid Build Coastguard Worker            if isinstance(i, torch.Tensor) and i.requires_grad
*da0073e9SAndroid Build Coastguard Worker        ]
*da0073e9SAndroid Build Coastguard Worker        per_sample_grad.append(
*da0073e9SAndroid Build Coastguard Worker            torch.autograd.grad(
*da0073e9SAndroid Build Coastguard Worker                result, diff_input_list, torch.ones_like(result), allow_unused=True
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker    if len(per_sample_grad) == batch_size:
*da0073e9SAndroid Build Coastguard Worker        per_sample_grad = tuple(torch.stack(grad) for grad in zip(*per_sample_grad))
*da0073e9SAndroid Build Coastguard Worker    return per_sample_grad
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef is_diff_tensor(t):
*da0073e9SAndroid Build Coastguard Worker    return isinstance(t, ExpandedWeight) or (
*da0073e9SAndroid Build Coastguard Worker        isinstance(t, torch.Tensor) and t.requires_grad
*da0073e9SAndroid Build Coastguard Worker    )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef clone_if_tensor(t):
*da0073e9SAndroid Build Coastguard Worker    if isinstance(t, torch.Tensor):
*da0073e9SAndroid Build Coastguard Worker        res = torch.clone(t).detach()
*da0073e9SAndroid Build Coastguard Worker        res.requires_grad_(t.requires_grad)
*da0073e9SAndroid Build Coastguard Worker        return res
*da0073e9SAndroid Build Coastguard Worker    else:
*da0073e9SAndroid Build Coastguard Worker        return t
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerinstantiate_device_type_tests(TestExpandedWeightHelperFunction, globals())
*da0073e9SAndroid Build Coastguard Workerinstantiate_device_type_tests(TestExpandedWeightFunctional, globals())
*da0073e9SAndroid Build Coastguard Workerinstantiate_device_type_tests(TestExpandedWeightModule, globals())
*da0073e9SAndroid Build Coastguard Workerif __name__ == "__main__":
*da0073e9SAndroid Build Coastguard Worker    run_tests()