test/nn/test_pruning.py

*da0073e9SAndroid Build Coastguard Worker# Owner(s): ["module: nn"]
*da0073e9SAndroid Build Coastguard Workerimport pickle
*da0073e9SAndroid Build Coastguard Workerimport unittest
*da0073e9SAndroid Build Coastguard Workerimport unittest.mock as mock
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport torch
*da0073e9SAndroid Build Coastguard Workerimport torch.nn as nn
*da0073e9SAndroid Build Coastguard Workerimport torch.nn.utils.prune as prune
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_nn import NNTestCase
*da0073e9SAndroid Build Coastguard Workerfrom torch.testing._internal.common_utils import (
*da0073e9SAndroid Build Coastguard Worker    instantiate_parametrized_tests,
*da0073e9SAndroid Build Coastguard Worker    run_tests,
*da0073e9SAndroid Build Coastguard Worker    TemporaryFileName,
*da0073e9SAndroid Build Coastguard Worker    TEST_NUMPY,
*da0073e9SAndroid Build Coastguard Worker)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass TestPruningNN(NNTestCase):
*da0073e9SAndroid Build Coastguard Worker    _do_cuda_memory_leak_check = True
*da0073e9SAndroid Build Coastguard Worker    _do_cuda_non_default_stream = True
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    # torch/nn/utils/prune.py
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(not TEST_NUMPY, "numpy not found")
*da0073e9SAndroid Build Coastguard Worker    def test_validate_pruning_amount_init(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test the first util function that validates the pruning
*da0073e9SAndroid Build Coastguard Worker        amount requested by the user the moment the pruning method
*da0073e9SAndroid Build Coastguard Worker        is initialized. This test checks that the expected errors are
*da0073e9SAndroid Build Coastguard Worker        raised whenever the amount is invalid.
*da0073e9SAndroid Build Coastguard Worker        The original function runs basic type checking + value range checks.
*da0073e9SAndroid Build Coastguard Worker        It doesn't check the validity of the pruning amount with
*da0073e9SAndroid Build Coastguard Worker        respect to the size of the tensor to prune. That's left to
*da0073e9SAndroid Build Coastguard Worker        `_validate_pruning_amount`, tested below.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        # neither float not int should raise TypeError
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(TypeError):
*da0073e9SAndroid Build Coastguard Worker            prune._validate_pruning_amount_init(amount="I'm a string")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # float not in [0, 1] should raise ValueError
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(ValueError):
*da0073e9SAndroid Build Coastguard Worker            prune._validate_pruning_amount_init(amount=1.1)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(ValueError):
*da0073e9SAndroid Build Coastguard Worker            prune._validate_pruning_amount_init(amount=20.0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # negative int should raise ValueError
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(ValueError):
*da0073e9SAndroid Build Coastguard Worker            prune._validate_pruning_amount_init(amount=-10)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # all these should pass without errors because they're valid amounts
*da0073e9SAndroid Build Coastguard Worker        prune._validate_pruning_amount_init(amount=0.34)
*da0073e9SAndroid Build Coastguard Worker        prune._validate_pruning_amount_init(amount=1500)
*da0073e9SAndroid Build Coastguard Worker        prune._validate_pruning_amount_init(amount=0)
*da0073e9SAndroid Build Coastguard Worker        prune._validate_pruning_amount_init(amount=0.0)
*da0073e9SAndroid Build Coastguard Worker        prune._validate_pruning_amount_init(amount=1)
*da0073e9SAndroid Build Coastguard Worker        prune._validate_pruning_amount_init(amount=1.0)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(not TEST_NUMPY, "numpy not found")
*da0073e9SAndroid Build Coastguard Worker    def test_validate_pruning_amount(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Tests the second util function that validates the pruning
*da0073e9SAndroid Build Coastguard Worker        amount requested by the user, this time with respect to the size
*da0073e9SAndroid Build Coastguard Worker        of the tensor to prune. The rationale is that if the pruning amount,
*da0073e9SAndroid Build Coastguard Worker        converted to absolute value of units to prune, is larger than
*da0073e9SAndroid Build Coastguard Worker        the number of units in the tensor, then we expect the util function
*da0073e9SAndroid Build Coastguard Worker        to raise a value error.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        # if amount is int and amount > tensor_size, raise ValueError
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(ValueError):
*da0073e9SAndroid Build Coastguard Worker            prune._validate_pruning_amount(amount=20, tensor_size=19)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # amount is a float so this should not raise an error
*da0073e9SAndroid Build Coastguard Worker        prune._validate_pruning_amount(amount=0.3, tensor_size=0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # this is okay
*da0073e9SAndroid Build Coastguard Worker        prune._validate_pruning_amount(amount=19, tensor_size=20)
*da0073e9SAndroid Build Coastguard Worker        prune._validate_pruning_amount(amount=0, tensor_size=0)
*da0073e9SAndroid Build Coastguard Worker        prune._validate_pruning_amount(amount=1, tensor_size=1)
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(True)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @unittest.skipIf(not TEST_NUMPY, "numpy not found")
*da0073e9SAndroid Build Coastguard Worker    def test_compute_nparams_to_prune(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that requested pruning `amount` gets translated into the
*da0073e9SAndroid Build Coastguard Worker        correct absolute number of units to prune.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(prune._compute_nparams_toprune(amount=0, tensor_size=15), 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(prune._compute_nparams_toprune(amount=10, tensor_size=15), 10)
*da0073e9SAndroid Build Coastguard Worker        # if 1 is int, means 1 unit
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(prune._compute_nparams_toprune(amount=1, tensor_size=15), 1)
*da0073e9SAndroid Build Coastguard Worker        # if 1. is float, means 100% of units
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(prune._compute_nparams_toprune(amount=1.0, tensor_size=15), 15)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(prune._compute_nparams_toprune(amount=0.4, tensor_size=17), 7)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_random_pruning_sizes(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that the new parameters and buffers created by the pruning
*da0073e9SAndroid Build Coastguard Worker        method have the same size as the input tensor to prune. These, in
*da0073e9SAndroid Build Coastguard Worker        fact, correspond to the pruned version of the tensor itself, its
*da0073e9SAndroid Build Coastguard Worker        mask, and its original copy, so the size must match.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        # fixturize test
*da0073e9SAndroid Build Coastguard Worker        # TODO: add other modules
*da0073e9SAndroid Build Coastguard Worker        modules = [nn.Linear(5, 7), nn.Conv3d(2, 2, 2)]
*da0073e9SAndroid Build Coastguard Worker        names = ["weight", "bias"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for m in modules:
*da0073e9SAndroid Build Coastguard Worker            for name in names:
*da0073e9SAndroid Build Coastguard Worker                with self.subTest(m=m, name=name):
*da0073e9SAndroid Build Coastguard Worker                    original_tensor = getattr(m, name)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    prune.random_unstructured(m, name=name, amount=0.1)
*da0073e9SAndroid Build Coastguard Worker                    # mask has the same size as tensor being pruned
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                        original_tensor.size(), getattr(m, name + "_mask").size()
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                    # 'orig' tensor has the same size as the original tensor
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                        original_tensor.size(), getattr(m, name + "_orig").size()
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker                    # new tensor has the same size as the original tensor
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(original_tensor.size(), getattr(m, name).size())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_random_pruning_orig(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that original tensor is correctly stored in 'orig'
*da0073e9SAndroid Build Coastguard Worker        after pruning is applied. Important to make sure we don't
*da0073e9SAndroid Build Coastguard Worker        lose info about the original unpruned parameter.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        # fixturize test
*da0073e9SAndroid Build Coastguard Worker        # TODO: add other modules
*da0073e9SAndroid Build Coastguard Worker        modules = [nn.Linear(5, 7), nn.Conv3d(2, 2, 2)]
*da0073e9SAndroid Build Coastguard Worker        names = ["weight", "bias"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for m in modules:
*da0073e9SAndroid Build Coastguard Worker            for name in names:
*da0073e9SAndroid Build Coastguard Worker                with self.subTest(m=m, name=name):
*da0073e9SAndroid Build Coastguard Worker                    # tensor prior to pruning
*da0073e9SAndroid Build Coastguard Worker                    original_tensor = getattr(m, name)
*da0073e9SAndroid Build Coastguard Worker                    prune.random_unstructured(m, name=name, amount=0.1)
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(original_tensor, getattr(m, name + "_orig"))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_random_pruning_new_weight(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that module.name now contains a pruned version of
*da0073e9SAndroid Build Coastguard Worker        the original tensor obtained from multiplying it by the mask.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        # fixturize test
*da0073e9SAndroid Build Coastguard Worker        # TODO: add other modules
*da0073e9SAndroid Build Coastguard Worker        modules = [nn.Linear(5, 7), nn.Conv3d(2, 2, 2)]
*da0073e9SAndroid Build Coastguard Worker        names = ["weight", "bias"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for m in modules:
*da0073e9SAndroid Build Coastguard Worker            for name in names:
*da0073e9SAndroid Build Coastguard Worker                with self.subTest(m=m, name=name):
*da0073e9SAndroid Build Coastguard Worker                    # tensor prior to pruning
*da0073e9SAndroid Build Coastguard Worker                    original_tensor = getattr(m, name)
*da0073e9SAndroid Build Coastguard Worker                    prune.random_unstructured(m, name=name, amount=0.1)
*da0073e9SAndroid Build Coastguard Worker                    # weight = weight_orig * weight_mask
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker                        getattr(m, name),
*da0073e9SAndroid Build Coastguard Worker                        getattr(m, name + "_orig")
*da0073e9SAndroid Build Coastguard Worker                        * getattr(m, name + "_mask").to(dtype=original_tensor.dtype),
*da0073e9SAndroid Build Coastguard Worker                    )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_identity_pruning(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that a mask of 1s does not change forward or backward."""
*da0073e9SAndroid Build Coastguard Worker        input_ = torch.ones(1, 5)
*da0073e9SAndroid Build Coastguard Worker        m = nn.Linear(5, 2)
*da0073e9SAndroid Build Coastguard Worker        y_prepruning = m(input_)  # output prior to pruning
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # compute grad pre-pruning and check it's equal to all ones
*da0073e9SAndroid Build Coastguard Worker        y_prepruning.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        old_grad_weight = m.weight.grad.clone()  # don't grab pointer!
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(old_grad_weight, torch.ones_like(m.weight))
*da0073e9SAndroid Build Coastguard Worker        old_grad_bias = m.bias.grad.clone()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(old_grad_bias, torch.ones_like(m.bias))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # remove grads
*da0073e9SAndroid Build Coastguard Worker        m.zero_grad()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # force the mask to be made of all 1s
*da0073e9SAndroid Build Coastguard Worker        prune.identity(m, name="weight")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # with mask of 1s, output should be identical to no mask
*da0073e9SAndroid Build Coastguard Worker        y_postpruning = m(input_)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y_prepruning, y_postpruning)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # with mask of 1s, grad should be identical to no mask
*da0073e9SAndroid Build Coastguard Worker        y_postpruning.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(old_grad_weight, m.weight_orig.grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(old_grad_bias, m.bias.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # calling forward twice in a row shouldn't change output
*da0073e9SAndroid Build Coastguard Worker        y1 = m(input_)
*da0073e9SAndroid Build Coastguard Worker        y2 = m(input_)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y1, y2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_random_pruning_0perc(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that a mask of 1s does not change forward or backward."""
*da0073e9SAndroid Build Coastguard Worker        input_ = torch.ones(1, 5)
*da0073e9SAndroid Build Coastguard Worker        m = nn.Linear(5, 2)
*da0073e9SAndroid Build Coastguard Worker        y_prepruning = m(input_)  # output prior to pruning
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # compute grad pre-pruning and check it's equal to all ones
*da0073e9SAndroid Build Coastguard Worker        y_prepruning.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        old_grad_weight = m.weight.grad.clone()  # don't grab pointer!
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(old_grad_weight, torch.ones_like(m.weight))
*da0073e9SAndroid Build Coastguard Worker        old_grad_bias = m.bias.grad.clone()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(old_grad_bias, torch.ones_like(m.bias))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # remove grads
*da0073e9SAndroid Build Coastguard Worker        m.zero_grad()
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # force the mask to be made of all 1s
*da0073e9SAndroid Build Coastguard Worker        with mock.patch(
*da0073e9SAndroid Build Coastguard Worker            "torch.nn.utils.prune.RandomUnstructured.compute_mask"
*da0073e9SAndroid Build Coastguard Worker        ) as compute_mask:
*da0073e9SAndroid Build Coastguard Worker            compute_mask.return_value = torch.ones_like(m.weight)
*da0073e9SAndroid Build Coastguard Worker            prune.random_unstructured(
*da0073e9SAndroid Build Coastguard Worker                m, name="weight", amount=0.9
*da0073e9SAndroid Build Coastguard Worker            )  # amount won't count
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # with mask of 1s, output should be identical to no mask
*da0073e9SAndroid Build Coastguard Worker        y_postpruning = m(input_)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y_prepruning, y_postpruning)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # with mask of 1s, grad should be identical to no mask
*da0073e9SAndroid Build Coastguard Worker        y_postpruning.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(old_grad_weight, m.weight_orig.grad)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(old_grad_bias, m.bias.grad)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # calling forward twice in a row shouldn't change output
*da0073e9SAndroid Build Coastguard Worker        y1 = m(input_)
*da0073e9SAndroid Build Coastguard Worker        y2 = m(input_)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y1, y2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_random_pruning(self):
*da0073e9SAndroid Build Coastguard Worker        input_ = torch.ones(1, 5)
*da0073e9SAndroid Build Coastguard Worker        m = nn.Linear(5, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # define custom mask to assign with mock
*da0073e9SAndroid Build Coastguard Worker        mask = torch.ones_like(m.weight)
*da0073e9SAndroid Build Coastguard Worker        mask[1, 0] = 0
*da0073e9SAndroid Build Coastguard Worker        mask[0, 3] = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check grad is zero for masked weights
*da0073e9SAndroid Build Coastguard Worker        with mock.patch(
*da0073e9SAndroid Build Coastguard Worker            "torch.nn.utils.prune.RandomUnstructured.compute_mask"
*da0073e9SAndroid Build Coastguard Worker        ) as compute_mask:
*da0073e9SAndroid Build Coastguard Worker            compute_mask.return_value = mask
*da0073e9SAndroid Build Coastguard Worker            prune.random_unstructured(m, name="weight", amount=0.9)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y_postpruning = m(input_)
*da0073e9SAndroid Build Coastguard Worker        y_postpruning.sum().backward()
*da0073e9SAndroid Build Coastguard Worker        # weight_orig is the parameter, so it's the tensor that will accumulate the grad
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(m.weight_orig.grad, mask)  # all 1s, except for masked units
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(m.bias.grad, torch.ones_like(m.bias))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # make sure that weight_orig update doesn't modify [1, 0] and [0, 3]
*da0073e9SAndroid Build Coastguard Worker        old_weight_orig = m.weight_orig.clone()
*da0073e9SAndroid Build Coastguard Worker        # update weights
*da0073e9SAndroid Build Coastguard Worker        learning_rate = 1.0
*da0073e9SAndroid Build Coastguard Worker        for p in m.parameters():
*da0073e9SAndroid Build Coastguard Worker            p.data.sub_(p.grad.data * learning_rate)
*da0073e9SAndroid Build Coastguard Worker        # since these are pruned, they should not be updated
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(old_weight_orig[1, 0], m.weight_orig[1, 0])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(old_weight_orig[0, 3], m.weight_orig[0, 3])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_random_pruning_forward(self):
*da0073e9SAndroid Build Coastguard Worker        r"""check forward with mask (by hand)."""
*da0073e9SAndroid Build Coastguard Worker        input_ = torch.ones(1, 5)
*da0073e9SAndroid Build Coastguard Worker        m = nn.Linear(5, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # define custom mask to assign with mock
*da0073e9SAndroid Build Coastguard Worker        mask = torch.zeros_like(m.weight)
*da0073e9SAndroid Build Coastguard Worker        mask[1, 0] = 1
*da0073e9SAndroid Build Coastguard Worker        mask[0, 3] = 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with mock.patch(
*da0073e9SAndroid Build Coastguard Worker            "torch.nn.utils.prune.RandomUnstructured.compute_mask"
*da0073e9SAndroid Build Coastguard Worker        ) as compute_mask:
*da0073e9SAndroid Build Coastguard Worker            compute_mask.return_value = mask
*da0073e9SAndroid Build Coastguard Worker            prune.random_unstructured(m, name="weight", amount=0.9)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        yhat = m(input_)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(yhat[0, 0], m.weight_orig[0, 3] + m.bias[0])
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(yhat[0, 1], m.weight_orig[1, 0] + m.bias[1])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_remove_pruning_forward(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Remove pruning and check forward is unchanged from previous
*da0073e9SAndroid Build Coastguard Worker        pruned state.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        input_ = torch.ones(1, 5)
*da0073e9SAndroid Build Coastguard Worker        m = nn.Linear(5, 2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # define custom mask to assign with mock
*da0073e9SAndroid Build Coastguard Worker        mask = torch.ones_like(m.weight)
*da0073e9SAndroid Build Coastguard Worker        mask[1, 0] = 0
*da0073e9SAndroid Build Coastguard Worker        mask[0, 3] = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check grad is zero for masked weights
*da0073e9SAndroid Build Coastguard Worker        with mock.patch(
*da0073e9SAndroid Build Coastguard Worker            "torch.nn.utils.prune.RandomUnstructured.compute_mask"
*da0073e9SAndroid Build Coastguard Worker        ) as compute_mask:
*da0073e9SAndroid Build Coastguard Worker            compute_mask.return_value = mask
*da0073e9SAndroid Build Coastguard Worker            prune.random_unstructured(m, name="weight", amount=0.9)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y_postpruning = m(input_)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        prune.remove(m, "weight")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        y_postremoval = m(input_)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(y_postpruning, y_postremoval)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_pruning_id_consistency(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that pruning doesn't change the id of the parameters, which
*da0073e9SAndroid Build Coastguard Worker        would otherwise introduce issues with pre-existing optimizers that
*da0073e9SAndroid Build Coastguard Worker        point to old parameters.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        m = nn.Linear(5, 2, bias=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        tensor_id = id(next(iter(m.parameters())))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        prune.random_unstructured(m, name="weight", amount=0.9)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor_id, id(next(iter(m.parameters()))))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        prune.remove(m, "weight")
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(tensor_id, id(next(iter(m.parameters()))))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_random_pruning_pickle(self):
*da0073e9SAndroid Build Coastguard Worker        modules = [nn.Linear(5, 7), nn.Conv3d(2, 2, 2)]
*da0073e9SAndroid Build Coastguard Worker        names = ["weight", "bias"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for m in modules:
*da0073e9SAndroid Build Coastguard Worker            for name in names:
*da0073e9SAndroid Build Coastguard Worker                with self.subTest(m=m, name=name):
*da0073e9SAndroid Build Coastguard Worker                    prune.random_unstructured(m, name=name, amount=0.1)
*da0073e9SAndroid Build Coastguard Worker                    m_new = pickle.loads(pickle.dumps(m))
*da0073e9SAndroid Build Coastguard Worker                    self.assertIsInstance(m_new, type(m))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_multiple_pruning_calls(self):
*da0073e9SAndroid Build Coastguard Worker        # if you call pruning twice, the hook becomes a PruningContainer
*da0073e9SAndroid Build Coastguard Worker        m = nn.Conv3d(2, 2, 2)
*da0073e9SAndroid Build Coastguard Worker        prune.l1_unstructured(m, name="weight", amount=0.1)
*da0073e9SAndroid Build Coastguard Worker        weight_mask0 = m.weight_mask  # save it for later sanity check
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # prune again
*da0073e9SAndroid Build Coastguard Worker        prune.ln_structured(m, name="weight", amount=0.3, n=2, dim=0)
*da0073e9SAndroid Build Coastguard Worker        hook = next(iter(m._forward_pre_hooks.values()))
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(hook, torch.nn.utils.prune.PruningContainer)
*da0073e9SAndroid Build Coastguard Worker        # check that container._tensor_name is correctly set no matter how
*da0073e9SAndroid Build Coastguard Worker        # many pruning methods are in the container
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(hook._tensor_name, "weight")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check that the pruning container has the right length
*da0073e9SAndroid Build Coastguard Worker        # equal to the number of pruning iters
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(hook), 2)  # m.weight has been pruned twice
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check that the entries of the pruning container are of the expected
*da0073e9SAndroid Build Coastguard Worker        # type and in the expected order
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(hook[0], torch.nn.utils.prune.L1Unstructured)
*da0073e9SAndroid Build Coastguard Worker        self.assertIsInstance(hook[1], torch.nn.utils.prune.LnStructured)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check that all entries that are 0 in the 1st mask are 0 in the
*da0073e9SAndroid Build Coastguard Worker        # 2nd mask too
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(torch.all(m.weight_mask[weight_mask0 == 0] == 0))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # prune again
*da0073e9SAndroid Build Coastguard Worker        prune.ln_structured(m, name="weight", amount=0.1, n=float("inf"), dim=1)
*da0073e9SAndroid Build Coastguard Worker        # check that container._tensor_name is correctly set no matter how
*da0073e9SAndroid Build Coastguard Worker        # many pruning methods are in the container
*da0073e9SAndroid Build Coastguard Worker        hook = next(iter(m._forward_pre_hooks.values()))
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(hook._tensor_name, "weight")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_pruning_container(self):
*da0073e9SAndroid Build Coastguard Worker        # create an empty container
*da0073e9SAndroid Build Coastguard Worker        container = prune.PruningContainer()
*da0073e9SAndroid Build Coastguard Worker        container._tensor_name = "test"
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(len(container), 0)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        p = prune.L1Unstructured(amount=2)
*da0073e9SAndroid Build Coastguard Worker        p._tensor_name = "test"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test adding a pruning method to a container
*da0073e9SAndroid Build Coastguard Worker        container.add_pruning_method(p)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test error raised if tensor name is different
*da0073e9SAndroid Build Coastguard Worker        q = prune.L1Unstructured(amount=2)
*da0073e9SAndroid Build Coastguard Worker        q._tensor_name = "another_test"
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(ValueError):
*da0073e9SAndroid Build Coastguard Worker            container.add_pruning_method(q)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # test that adding a non-pruning method object to a pruning container
*da0073e9SAndroid Build Coastguard Worker        # raises a TypeError
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(TypeError):
*da0073e9SAndroid Build Coastguard Worker            container.add_pruning_method(10)
*da0073e9SAndroid Build Coastguard Worker        with self.assertRaises(TypeError):
*da0073e9SAndroid Build Coastguard Worker            container.add_pruning_method("ugh")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_pruning_container_compute_mask(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test `compute_mask` of pruning container with a known `t` and
*da0073e9SAndroid Build Coastguard Worker        `default_mask`. Indirectly checks that Ln structured pruning is
*da0073e9SAndroid Build Coastguard Worker        acting on the right axis.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        # create an empty container
*da0073e9SAndroid Build Coastguard Worker        container = prune.PruningContainer()
*da0073e9SAndroid Build Coastguard Worker        container._tensor_name = "test"
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # 1) test unstructured pruning
*da0073e9SAndroid Build Coastguard Worker        # create a new pruning method
*da0073e9SAndroid Build Coastguard Worker        p = prune.L1Unstructured(amount=2)
*da0073e9SAndroid Build Coastguard Worker        p._tensor_name = "test"
*da0073e9SAndroid Build Coastguard Worker        # add the pruning method to the container
*da0073e9SAndroid Build Coastguard Worker        container.add_pruning_method(p)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # create tensor to be pruned
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor([[1, 2, 3, 4], [5, 6, 7, 8]]).to(dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        # create prior mask by hand
*da0073e9SAndroid Build Coastguard Worker        default_mask = torch.tensor([[1, 1, 1, 0], [1, 1, 0, 1]])
*da0073e9SAndroid Build Coastguard Worker        # since we are pruning the two lowest magnitude units, the outcome of
*da0073e9SAndroid Build Coastguard Worker        # the calculation should be this:
*da0073e9SAndroid Build Coastguard Worker        expected_mask = torch.tensor([[0, 0, 1, 0], [1, 1, 0, 1]], dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        computed_mask = container.compute_mask(t, default_mask)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_mask, computed_mask)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # 2) test structured pruning
*da0073e9SAndroid Build Coastguard Worker        q = prune.LnStructured(amount=1, n=2, dim=0)
*da0073e9SAndroid Build Coastguard Worker        q._tensor_name = "test"
*da0073e9SAndroid Build Coastguard Worker        container.add_pruning_method(q)
*da0073e9SAndroid Build Coastguard Worker        # since we are pruning the lowest magnitude one of the two rows, the
*da0073e9SAndroid Build Coastguard Worker        # outcome of the calculation should be this:
*da0073e9SAndroid Build Coastguard Worker        expected_mask = torch.tensor([[0, 0, 0, 0], [1, 1, 0, 1]], dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        computed_mask = container.compute_mask(t, default_mask)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_mask, computed_mask)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # 2) test structured pruning, along another axis
*da0073e9SAndroid Build Coastguard Worker        r = prune.LnStructured(amount=1, n=2, dim=1)
*da0073e9SAndroid Build Coastguard Worker        r._tensor_name = "test"
*da0073e9SAndroid Build Coastguard Worker        container.add_pruning_method(r)
*da0073e9SAndroid Build Coastguard Worker        # since we are pruning the lowest magnitude of the four columns, the
*da0073e9SAndroid Build Coastguard Worker        # outcome of the calculation should be this:
*da0073e9SAndroid Build Coastguard Worker        expected_mask = torch.tensor([[0, 1, 1, 0], [0, 1, 0, 1]], dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        computed_mask = container.compute_mask(t, default_mask)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_mask, computed_mask)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_l1_unstructured_pruning(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that l1 unstructured pruning actually removes the lowest
*da0073e9SAndroid Build Coastguard Worker        entries by l1 norm (by hand). It also checks that applying l1
*da0073e9SAndroid Build Coastguard Worker        unstructured pruning more than once respects the previous mask.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        m = nn.Linear(4, 2)
*da0073e9SAndroid Build Coastguard Worker        # modify its weight matrix by hand
*da0073e9SAndroid Build Coastguard Worker        m.weight = torch.nn.Parameter(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([[1, 2, 3, 4], [-4, -3, -2, -1]], dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        prune.l1_unstructured(m, "weight", amount=2)
*da0073e9SAndroid Build Coastguard Worker        expected_weight = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [[0, 2, 3, 4], [-4, -3, -2, 0]], dtype=m.weight.dtype
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_weight, m.weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check that pruning again removes the next two smallest entries
*da0073e9SAndroid Build Coastguard Worker        prune.l1_unstructured(m, "weight", amount=2)
*da0073e9SAndroid Build Coastguard Worker        expected_weight = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [[0, 0, 3, 4], [-4, -3, 0, 0]], dtype=m.weight.dtype
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_weight, m.weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_l1_unstructured_pruning_with_importance_scores(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that l1 unstructured pruning actually removes the lowest
*da0073e9SAndroid Build Coastguard Worker        entries of importance scores and not the parameter by l1 norm (by hand).
*da0073e9SAndroid Build Coastguard Worker        It also checks that applying l1 unstructured pruning more than once
*da0073e9SAndroid Build Coastguard Worker        respects the previous mask.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        m = nn.Linear(4, 2)
*da0073e9SAndroid Build Coastguard Worker        # modify its weight matrix by hand
*da0073e9SAndroid Build Coastguard Worker        m.weight = torch.nn.Parameter(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([[1, 2, 3, 4], [-4, -3, -2, -1]], dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        importance_scores = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [[4, 2, 1, 3], [-3, -1, -2, -4]], dtype=torch.float32
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        prune.l1_unstructured(
*da0073e9SAndroid Build Coastguard Worker            m, "weight", amount=2, importance_scores=importance_scores
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        expected_weight = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [[1, 2, 0, 4], [-4, 0, -2, -1]], dtype=m.weight.dtype
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_weight, m.weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check that pruning again removes two entries of m.weight that are colocated with
*da0073e9SAndroid Build Coastguard Worker        # the next two smallest absolute values of importance scores.
*da0073e9SAndroid Build Coastguard Worker        prune.l1_unstructured(
*da0073e9SAndroid Build Coastguard Worker            m, "weight", amount=2, importance_scores=importance_scores
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        expected_weight = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [[1, 0, 0, 4], [-4, 0, 0, -1]], dtype=m.weight.dtype
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_weight, m.weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_unstructured_pruning_same_magnitude(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Since it may happen that the tensor to prune has entries with the
*da0073e9SAndroid Build Coastguard Worker        same exact magnitude, it is important to check that pruning happens
*da0073e9SAndroid Build Coastguard Worker        consistenly based on the bottom % of weights, and not by threshold,
*da0073e9SAndroid Build Coastguard Worker        which would instead kill off *all* units with magnitude = threshold.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        AMOUNT = 0.2
*da0073e9SAndroid Build Coastguard Worker        p = prune.L1Unstructured(amount=AMOUNT)
*da0073e9SAndroid Build Coastguard Worker        # create a random tensors with entries in {-2, 0, 2}
*da0073e9SAndroid Build Coastguard Worker        t = 2 * torch.randint(low=-1, high=2, size=(10, 7))
*da0073e9SAndroid Build Coastguard Worker        nparams_toprune = prune._compute_nparams_toprune(AMOUNT, t.nelement())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        computed_mask = p.compute_mask(t, default_mask=torch.ones_like(t))
*da0073e9SAndroid Build Coastguard Worker        nparams_pruned = torch.sum(computed_mask == 0)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(nparams_toprune, nparams_pruned)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_random_structured_pruning_amount(self):
*da0073e9SAndroid Build Coastguard Worker        AMOUNT = 0.6
*da0073e9SAndroid Build Coastguard Worker        AXIS = 2
*da0073e9SAndroid Build Coastguard Worker        p = prune.RandomStructured(amount=AMOUNT, dim=AXIS)
*da0073e9SAndroid Build Coastguard Worker        t = 2 * torch.randint(low=-1, high=2, size=(5, 4, 2)).to(dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        nparams_toprune = prune._compute_nparams_toprune(AMOUNT, t.shape[AXIS])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        computed_mask = p.compute_mask(t, default_mask=torch.ones_like(t))
*da0073e9SAndroid Build Coastguard Worker        # check that 1 column is fully prune, the others are left untouched
*da0073e9SAndroid Build Coastguard Worker        remaining_axes = [_ for _ in range(len(t.shape)) if _ != AXIS]
*da0073e9SAndroid Build Coastguard Worker        per_column_sums = sorted(torch.sum(computed_mask == 0, axis=remaining_axes))
*da0073e9SAndroid Build Coastguard Worker        assert per_column_sums == [0, 20]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_ln_structured_pruning(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Check Ln structured pruning by hand."""
*da0073e9SAndroid Build Coastguard Worker        m = nn.Conv2d(3, 1, 2)
*da0073e9SAndroid Build Coastguard Worker        m.weight.data = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [
*da0073e9SAndroid Build Coastguard Worker                [
*da0073e9SAndroid Build Coastguard Worker                    [[1.0, 2.0], [1.0, 2.5]],
*da0073e9SAndroid Build Coastguard Worker                    [[0.5, 1.0], [0.1, 0.1]],
*da0073e9SAndroid Build Coastguard Worker                    [[-3.0, -5.0], [0.1, -1.0]],
*da0073e9SAndroid Build Coastguard Worker                ]
*da0073e9SAndroid Build Coastguard Worker            ]
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        # expected effect of pruning 1 of the 3 channels by L2-norm
*da0073e9SAndroid Build Coastguard Worker        expected_mask_axis1 = torch.ones_like(m.weight)
*da0073e9SAndroid Build Coastguard Worker        expected_mask_axis1[:, 1] = 0.0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        prune.ln_structured(m, "weight", amount=1, n=2, dim=1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_mask_axis1, m.weight_mask)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # expected effect of pruning 1 of the 2 columns along axis -1 by L1-norm
*da0073e9SAndroid Build Coastguard Worker        expected_mask_axis3 = expected_mask_axis1
*da0073e9SAndroid Build Coastguard Worker        expected_mask_axis3[:, :, :, 0] = 0.0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        prune.ln_structured(m, "weight", amount=1, n=1, dim=-1)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_mask_axis3, m.weight_mask)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_ln_structured_pruning_importance_scores(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Check Ln structured pruning by hand."""
*da0073e9SAndroid Build Coastguard Worker        m = nn.Conv2d(3, 1, 2)
*da0073e9SAndroid Build Coastguard Worker        m.weight.data = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [
*da0073e9SAndroid Build Coastguard Worker                [
*da0073e9SAndroid Build Coastguard Worker                    [[1.0, 2.0], [1.0, 2.5]],
*da0073e9SAndroid Build Coastguard Worker                    [[0.5, 1.0], [0.1, 0.1]],
*da0073e9SAndroid Build Coastguard Worker                    [[-3.0, -5.0], [0.1, -1.0]],
*da0073e9SAndroid Build Coastguard Worker                ]
*da0073e9SAndroid Build Coastguard Worker            ]
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        importance_scores = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [
*da0073e9SAndroid Build Coastguard Worker                [
*da0073e9SAndroid Build Coastguard Worker                    [[10.0, 1.0], [10.0, 1.0]],
*da0073e9SAndroid Build Coastguard Worker                    [[30.0, 3.0], [30.0, 3.0]],
*da0073e9SAndroid Build Coastguard Worker                    [[-20.0, -2.0], [-20.0, -2.0]],
*da0073e9SAndroid Build Coastguard Worker                ]
*da0073e9SAndroid Build Coastguard Worker            ]
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        # expected effect of pruning 1 of the 3 channels by L2-norm
*da0073e9SAndroid Build Coastguard Worker        expected_mask_axis1 = torch.ones_like(m.weight)
*da0073e9SAndroid Build Coastguard Worker        expected_mask_axis1[:, 0] = 0.0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        prune.ln_structured(
*da0073e9SAndroid Build Coastguard Worker            m, "weight", amount=1, n=2, dim=1, importance_scores=importance_scores
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_mask_axis1, m.weight_mask)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # expected effect of pruning 1 of the 2 columns along axis -1 by L1-norm
*da0073e9SAndroid Build Coastguard Worker        expected_mask_axis3 = expected_mask_axis1
*da0073e9SAndroid Build Coastguard Worker        expected_mask_axis3[:, :, :, 1] = 0.0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        prune.ln_structured(
*da0073e9SAndroid Build Coastguard Worker            m, "weight", amount=1, n=1, dim=-1, importance_scores=importance_scores
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_mask_axis3, m.weight_mask)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_remove_pruning(self):
*da0073e9SAndroid Build Coastguard Worker        r"""`prune.remove` removes the hook and the reparametrization
*da0073e9SAndroid Build Coastguard Worker        and makes the pruning final in the original parameter.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        modules = [nn.Linear(5, 7), nn.Conv3d(2, 2, 2)]
*da0073e9SAndroid Build Coastguard Worker        names = ["weight", "bias"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for m in modules:
*da0073e9SAndroid Build Coastguard Worker            for name in names:
*da0073e9SAndroid Build Coastguard Worker                with self.subTest(m=m, name=name):
*da0073e9SAndroid Build Coastguard Worker                    # first prune
*da0073e9SAndroid Build Coastguard Worker                    prune.random_unstructured(m, name, amount=0.5)
*da0073e9SAndroid Build Coastguard Worker                    self.assertIn(name + "_orig", dict(m.named_parameters()))
*da0073e9SAndroid Build Coastguard Worker                    self.assertIn(name + "_mask", dict(m.named_buffers()))
*da0073e9SAndroid Build Coastguard Worker                    self.assertNotIn(name, dict(m.named_parameters()))
*da0073e9SAndroid Build Coastguard Worker                    self.assertTrue(hasattr(m, name))
*da0073e9SAndroid Build Coastguard Worker                    pruned_t = getattr(m, name)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    # then remove pruning
*da0073e9SAndroid Build Coastguard Worker                    prune.remove(m, name)
*da0073e9SAndroid Build Coastguard Worker                    self.assertIn(name, dict(m.named_parameters()))
*da0073e9SAndroid Build Coastguard Worker                    self.assertNotIn(name + "_orig", dict(m.named_parameters()))
*da0073e9SAndroid Build Coastguard Worker                    self.assertNotIn(name + "_mask", dict(m.named_buffers()))
*da0073e9SAndroid Build Coastguard Worker                    final_t = getattr(m, name)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    self.assertEqual(pruned_t, final_t)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_remove_pruning_exception(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Removing from an unpruned tensor throws an assertion error"""
*da0073e9SAndroid Build Coastguard Worker        modules = [nn.Linear(5, 7), nn.Conv3d(2, 2, 2)]
*da0073e9SAndroid Build Coastguard Worker        names = ["weight", "bias"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for m in modules:
*da0073e9SAndroid Build Coastguard Worker            for name in names:
*da0073e9SAndroid Build Coastguard Worker                with self.subTest(m=m, name=name):
*da0073e9SAndroid Build Coastguard Worker                    # check that the module isn't pruned
*da0073e9SAndroid Build Coastguard Worker                    self.assertFalse(prune.is_pruned(m))
*da0073e9SAndroid Build Coastguard Worker                    # since it isn't pruned, pruning can't be removed from it
*da0073e9SAndroid Build Coastguard Worker                    with self.assertRaises(ValueError):
*da0073e9SAndroid Build Coastguard Worker                        prune.remove(m, name)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_global_pruning(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that global l1 unstructured pruning over 2 parameters removes
*da0073e9SAndroid Build Coastguard Worker        the `amount=4` smallest global weights across the 2 parameters.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        m = nn.Linear(4, 2)
*da0073e9SAndroid Build Coastguard Worker        n = nn.Linear(3, 1)
*da0073e9SAndroid Build Coastguard Worker        # modify the weight matrices by hand
*da0073e9SAndroid Build Coastguard Worker        m.weight = torch.nn.Parameter(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([[1, 2, 3, 4], [-4, -3, -2, -1]]).to(dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        n.weight = torch.nn.Parameter(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([[0, 0.1, -2]]).to(dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        params_to_prune = (
*da0073e9SAndroid Build Coastguard Worker            (m, "weight"),
*da0073e9SAndroid Build Coastguard Worker            (n, "weight"),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # prune the 4 smallest weights globally by L1 magnitude
*da0073e9SAndroid Build Coastguard Worker        prune.global_unstructured(
*da0073e9SAndroid Build Coastguard Worker            params_to_prune, pruning_method=prune.L1Unstructured, amount=4
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        expected_mweight = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [[0, 2, 3, 4], [-4, -3, -2, 0]], dtype=m.weight.dtype
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_mweight, m.weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        expected_nweight = torch.tensor([[0, 0, -2]]).to(dtype=n.weight.dtype)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_nweight, n.weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_global_pruning_importance_scores(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that global l1 unstructured pruning over 2 parameters removes
*da0073e9SAndroid Build Coastguard Worker        the `amount=4` smallest global weights across the 2 parameters.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        m = nn.Linear(4, 2)
*da0073e9SAndroid Build Coastguard Worker        n = nn.Linear(3, 1)
*da0073e9SAndroid Build Coastguard Worker        # modify the weight matrices by hand
*da0073e9SAndroid Build Coastguard Worker        m.weight = torch.nn.Parameter(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([[1, 2, 3, 4], [-4, -3, -2, -1]]).to(dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        m_importance_scores = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [[4, 2, 1, 3], [-3, -1, -2, -4]], dtype=torch.float32
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        n.weight = torch.nn.Parameter(
*da0073e9SAndroid Build Coastguard Worker            torch.tensor([[0, 0.1, -2]]).to(dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        n_importance_scores = torch.tensor([[0, 10.0, -0.2]]).to(dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        params_to_prune = (
*da0073e9SAndroid Build Coastguard Worker            (m, "weight"),
*da0073e9SAndroid Build Coastguard Worker            (n, "weight"),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        importance_scores = {
*da0073e9SAndroid Build Coastguard Worker            (m, "weight"): m_importance_scores,
*da0073e9SAndroid Build Coastguard Worker            (n, "weight"): n_importance_scores,
*da0073e9SAndroid Build Coastguard Worker        }
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # prune the 4 smallest weights globally by L1 magnitude
*da0073e9SAndroid Build Coastguard Worker        prune.global_unstructured(
*da0073e9SAndroid Build Coastguard Worker            params_to_prune,
*da0073e9SAndroid Build Coastguard Worker            pruning_method=prune.L1Unstructured,
*da0073e9SAndroid Build Coastguard Worker            amount=4,
*da0073e9SAndroid Build Coastguard Worker            importance_scores=importance_scores,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        expected_m_weight = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [[1, 2, 0, 4], [-4, 0, -2, -1]], dtype=m.weight.dtype
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_m_weight, m.weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        expected_n_weight = torch.tensor([[0, 0.1, 0]]).to(dtype=n.weight.dtype)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(expected_n_weight, n.weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_custom_from_mask_pruning(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that the CustomFromMask is capable of receiving
*da0073e9SAndroid Build Coastguard Worker        as input at instantiation time a custom mask, and combining it with
*da0073e9SAndroid Build Coastguard Worker        the previous default mask to generate the correct final mask.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        # new mask
*da0073e9SAndroid Build Coastguard Worker        mask = torch.tensor([[0, 1, 1, 0], [0, 0, 1, 1]])
*da0073e9SAndroid Build Coastguard Worker        # old mask
*da0073e9SAndroid Build Coastguard Worker        default_mask = torch.tensor([[0, 0, 0, 0], [1, 1, 1, 1]])
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # some tensor (not actually used)
*da0073e9SAndroid Build Coastguard Worker        t = torch.rand_like(mask.to(dtype=torch.float32))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        p = prune.CustomFromMask(mask=mask)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        computed_mask = p.compute_mask(t, default_mask)
*da0073e9SAndroid Build Coastguard Worker        expected_mask = torch.tensor(
*da0073e9SAndroid Build Coastguard Worker            [[0, 0, 0, 0], [0, 0, 1, 1]], dtype=computed_mask.dtype
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(computed_mask, expected_mask)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_pruning_rollback(self):
*da0073e9SAndroid Build Coastguard Worker        r"""Test that if something fails when the we try to compute the mask,
*da0073e9SAndroid Build Coastguard Worker        then the model isn't left in some intermediate half-pruned state.
*da0073e9SAndroid Build Coastguard Worker        The try/except statement in `apply` should handle rolling back
*da0073e9SAndroid Build Coastguard Worker        to the previous state before pruning began.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker        modules = [nn.Linear(5, 7), nn.Conv3d(2, 2, 2)]
*da0073e9SAndroid Build Coastguard Worker        names = ["weight", "bias"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        for m in modules:
*da0073e9SAndroid Build Coastguard Worker            for name in names:
*da0073e9SAndroid Build Coastguard Worker                with self.subTest(m=m, name=name):
*da0073e9SAndroid Build Coastguard Worker                    with mock.patch(
*da0073e9SAndroid Build Coastguard Worker                        "torch.nn.utils.prune.L1Unstructured.compute_mask"
*da0073e9SAndroid Build Coastguard Worker                    ) as compute_mask:
*da0073e9SAndroid Build Coastguard Worker                        compute_mask.side_effect = Exception("HA!")
*da0073e9SAndroid Build Coastguard Worker                        with self.assertRaises(Exception):
*da0073e9SAndroid Build Coastguard Worker                            prune.l1_unstructured(m, name=name, amount=0.9)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                        self.assertTrue(name in dict(m.named_parameters()))
*da0073e9SAndroid Build Coastguard Worker                        self.assertFalse(name + "_mask" in dict(m.named_buffers()))
*da0073e9SAndroid Build Coastguard Worker                        self.assertFalse(name + "_orig" in dict(m.named_parameters()))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_pruning_serialization_model(self):
*da0073e9SAndroid Build Coastguard Worker        # create a model
*da0073e9SAndroid Build Coastguard Worker        model = torch.nn.Sequential(
*da0073e9SAndroid Build Coastguard Worker            torch.nn.Linear(10, 10),
*da0073e9SAndroid Build Coastguard Worker            torch.nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker            torch.nn.Linear(10, 1),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        # check that everything looks normal before pruning
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIn("0.weight_orig", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIn("0.weight_mask", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("0.weight", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # prune one of its parameters
*da0073e9SAndroid Build Coastguard Worker        prune.l1_unstructured(module=model[0], name="weight", amount=0.9)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check that the original weight and the new mask are present
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("0.weight_orig", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("0.weight_mask", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIn("0.weight", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(hasattr(model[0], "weight"))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        pruned_weight = model[0].weight
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        with TemporaryFileName() as fname:
*da0073e9SAndroid Build Coastguard Worker            torch.save(model, fname)
*da0073e9SAndroid Build Coastguard Worker            # weights_only=False as this is legacy code that saves the model
*da0073e9SAndroid Build Coastguard Worker            new_model = torch.load(fname, weights_only=False)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check that the original weight and the new mask are present
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("0.weight_orig", new_model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("0.weight_mask", new_model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIn("0.weight", new_model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(hasattr(new_model[0], "weight"))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(pruned_weight, new_model[0].weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_pruning_serialization_state_dict(self):
*da0073e9SAndroid Build Coastguard Worker        # create a model
*da0073e9SAndroid Build Coastguard Worker        model = torch.nn.Sequential(
*da0073e9SAndroid Build Coastguard Worker            torch.nn.Linear(10, 10),
*da0073e9SAndroid Build Coastguard Worker            torch.nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker            torch.nn.Linear(10, 1),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        # check that everything looks normal before pruning
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIn("0.weight_orig", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIn("0.weight_mask", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("0.weight", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # prune one of its parameters
*da0073e9SAndroid Build Coastguard Worker        prune.l1_unstructured(module=model[0], name="weight", amount=0.9)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check that the original weight and the new mask are present
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("0.weight_orig", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("0.weight_mask", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIn("0.weight", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertTrue(hasattr(model[0], "weight"))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        pruned_weight = model[0].weight
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # make pruning permanent and restore parameter names as in base
*da0073e9SAndroid Build Coastguard Worker        # architecture
*da0073e9SAndroid Build Coastguard Worker        prune.remove(module=model[0], name="weight")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check that the original weight and the new mask are no longer present
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIn("0.weight_orig", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIn("0.weight_mask", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("0.weight", model.state_dict())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # save the state dict of model and reload it into new_model
*da0073e9SAndroid Build Coastguard Worker        new_model = torch.nn.Sequential(
*da0073e9SAndroid Build Coastguard Worker            torch.nn.Linear(10, 10),
*da0073e9SAndroid Build Coastguard Worker            torch.nn.ReLU(),
*da0073e9SAndroid Build Coastguard Worker            torch.nn.Linear(10, 1),
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        with TemporaryFileName() as fname:
*da0073e9SAndroid Build Coastguard Worker            torch.save(model.state_dict(), fname)
*da0073e9SAndroid Build Coastguard Worker            new_model.load_state_dict(torch.load(fname))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # check that the original weight and the new mask are not present in
*da0073e9SAndroid Build Coastguard Worker        # new_model either.
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIn("0.weight_orig", new_model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertNotIn("0.weight_mask", new_model.state_dict())
*da0073e9SAndroid Build Coastguard Worker        self.assertIn("0.weight", new_model.state_dict())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(pruned_weight, new_model[0].weight)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_prune(self):
*da0073e9SAndroid Build Coastguard Worker        # create a new pruning method
*da0073e9SAndroid Build Coastguard Worker        p = prune.L1Unstructured(amount=2)
*da0073e9SAndroid Build Coastguard Worker        # create tensor to be pruned
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor([[1, 2, 3, 4], [5, 6, 7, 8]]).to(dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        # create prior mask by hand
*da0073e9SAndroid Build Coastguard Worker        default_mask = torch.tensor([[1, 1, 1, 0], [1, 1, 0, 1]])
*da0073e9SAndroid Build Coastguard Worker        # since we are pruning the two lowest magnitude units, the outcome of
*da0073e9SAndroid Build Coastguard Worker        # the calculation should be this:
*da0073e9SAndroid Build Coastguard Worker        expected_mask = torch.tensor([[0, 0, 1, 0], [1, 1, 0, 1]])
*da0073e9SAndroid Build Coastguard Worker        pruned_tensor = p.prune(t, default_mask)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(t * expected_mask, pruned_tensor)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_prune_importance_scores(self):
*da0073e9SAndroid Build Coastguard Worker        # create a new pruning method
*da0073e9SAndroid Build Coastguard Worker        p = prune.L1Unstructured(amount=2)
*da0073e9SAndroid Build Coastguard Worker        # create tensor to be pruned
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor([[1, 2, 3, 4], [5, 6, 7, 8]]).to(dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        importance_scores = torch.tensor([[1, 2, 3, 4], [1.5, 1.6, 1.7, 1.8]]).to(
*da0073e9SAndroid Build Coastguard Worker            dtype=torch.float32
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        # create prior mask by hand
*da0073e9SAndroid Build Coastguard Worker        default_mask = torch.tensor([[1, 1, 1, 0], [1, 1, 0, 1]])
*da0073e9SAndroid Build Coastguard Worker        # since we are pruning the two lowest magnitude units, the outcome of
*da0073e9SAndroid Build Coastguard Worker        # the calculation should be this:
*da0073e9SAndroid Build Coastguard Worker        expected_mask = torch.tensor([[0, 1, 1, 0], [0, 1, 0, 1]])
*da0073e9SAndroid Build Coastguard Worker        pruned_tensor = p.prune(t, default_mask, importance_scores=importance_scores)
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(t * expected_mask, pruned_tensor)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_prune_importance_scores_mimic_default(self):
*da0073e9SAndroid Build Coastguard Worker        # create a new pruning method
*da0073e9SAndroid Build Coastguard Worker        p = prune.L1Unstructured(amount=2)
*da0073e9SAndroid Build Coastguard Worker        # create tensor to be pruned
*da0073e9SAndroid Build Coastguard Worker        t = torch.tensor([[1, 2, 3, 4], [5, 6, 7, 8]]).to(dtype=torch.float32)
*da0073e9SAndroid Build Coastguard Worker        # create prior mask by hand
*da0073e9SAndroid Build Coastguard Worker        default_mask = torch.tensor([[1, 1, 1, 0], [1, 1, 0, 1]])
*da0073e9SAndroid Build Coastguard Worker        # since we are pruning the two lowest magnitude units, the outcome of
*da0073e9SAndroid Build Coastguard Worker        # the calculation should be this:
*da0073e9SAndroid Build Coastguard Worker        expected_mask = torch.tensor([[0, 0, 1, 0], [1, 1, 0, 1]])
*da0073e9SAndroid Build Coastguard Worker        pruned_tensor_without_importance_scores = p.prune(t, default_mask)
*da0073e9SAndroid Build Coastguard Worker        pruned_tensor_with_importance_scores = p.prune(
*da0073e9SAndroid Build Coastguard Worker            t, default_mask, importance_scores=t
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(
*da0073e9SAndroid Build Coastguard Worker            pruned_tensor_without_importance_scores,
*da0073e9SAndroid Build Coastguard Worker            pruned_tensor_with_importance_scores,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        self.assertEqual(t * expected_mask, pruned_tensor_without_importance_scores)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def test_rnn_pruning(self):
*da0073e9SAndroid Build Coastguard Worker        l = torch.nn.LSTM(32, 32)
*da0073e9SAndroid Build Coastguard Worker        # This Module has 4 parameters called:
*da0073e9SAndroid Build Coastguard Worker        # 'weight_ih_l0', 'weight_hh_l0', 'bias_ih_l0', 'bias_hh_l0'
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Pruning one of them causes one of the weights to become a tensor
*da0073e9SAndroid Build Coastguard Worker        prune.l1_unstructured(l, "weight_ih_l0", 0.5)
*da0073e9SAndroid Build Coastguard Worker        assert sum(isinstance(p, torch.nn.Parameter) for p in l._flat_weights) == 3
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Removing the pruning reparametrization restores the Parameter
*da0073e9SAndroid Build Coastguard Worker        prune.remove(l, "weight_ih_l0")
*da0073e9SAndroid Build Coastguard Worker        assert sum(isinstance(p, torch.nn.Parameter) for p in l._flat_weights) == 4
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Make sure that, upon removal of the reparametrization, the
*da0073e9SAndroid Build Coastguard Worker        # `._parameters` and `.named_parameters` contain the right params.
*da0073e9SAndroid Build Coastguard Worker        # Specifically, the original weight ('weight_ih_l0') should be placed
*da0073e9SAndroid Build Coastguard Worker        # back in the parameters, while the reparametrization component
*da0073e9SAndroid Build Coastguard Worker        # ('weight_ih_l0_orig') should be removed.
*da0073e9SAndroid Build Coastguard Worker        assert "weight_ih_l0" in l._parameters
*da0073e9SAndroid Build Coastguard Worker        assert l._parameters["weight_ih_l0"] is not None
*da0073e9SAndroid Build Coastguard Worker        assert "weight_ih_l0_orig" not in l._parameters
*da0073e9SAndroid Build Coastguard Worker        assert "weight_ih_l0" in dict(l.named_parameters())
*da0073e9SAndroid Build Coastguard Worker        assert dict(l.named_parameters())["weight_ih_l0"] is not None
*da0073e9SAndroid Build Coastguard Worker        assert "weight_ih_l0_orig" not in dict(l.named_parameters())
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerinstantiate_parametrized_tests(TestPruningNN)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerif __name__ == "__main__":
*da0073e9SAndroid Build Coastguard Worker    run_tests()