torch/nn/grad.py

*da0073e9SAndroid Build Coastguard Worker# mypy: allow-untyped-defs
*da0073e9SAndroid Build Coastguard Worker"""Gradient interface."""
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport torch
*da0073e9SAndroid Build Coastguard Workerfrom torch.nn.modules.utils import _pair, _single, _triple
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef conv1d_input(
*da0073e9SAndroid Build Coastguard Worker    input_size,
*da0073e9SAndroid Build Coastguard Worker    weight,
*da0073e9SAndroid Build Coastguard Worker    grad_output,
*da0073e9SAndroid Build Coastguard Worker    stride=1,
*da0073e9SAndroid Build Coastguard Worker    padding=0,
*da0073e9SAndroid Build Coastguard Worker    dilation=1,
*da0073e9SAndroid Build Coastguard Worker    groups=1,
*da0073e9SAndroid Build Coastguard Worker):
*da0073e9SAndroid Build Coastguard Worker    r"""Compute the gradient of conv1d with respect to the input of the convolution.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    This is same as the 1D transposed convolution operator under the hood but requires
*da0073e9SAndroid Build Coastguard Worker    the shape of the gradient w.r.t. input to be specified explicitly.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        input_size : Shape of the input gradient tensor
*da0073e9SAndroid Build Coastguard Worker        weight: weight tensor (out_channels x in_channels/groups x kW)
*da0073e9SAndroid Build Coastguard Worker        grad_output : output gradient tensor (minibatch x out_channels x oW)
*da0073e9SAndroid Build Coastguard Worker        stride (int or tuple, optional): Stride of the convolution. Default: 1
*da0073e9SAndroid Build Coastguard Worker        padding (int or tuple, optional): Zero-padding added to both sides of the input. Default: 0
*da0073e9SAndroid Build Coastguard Worker        dilation (int or tuple, optional): Spacing between kernel elements. Default: 1
*da0073e9SAndroid Build Coastguard Worker        groups (int, optional): Number of blocked connections from input channels to output channels. Default: 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Examples::
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        >>> input = torch.randn(1, 1, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        >>> weight = torch.randn(1, 1, 1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        >>> output = F.conv1d(input, weight)
*da0073e9SAndroid Build Coastguard Worker        >>> grad_output = torch.randn(output.shape)
*da0073e9SAndroid Build Coastguard Worker        >>> grad_input = torch.autograd.grad(output, input, grad_output)
*da0073e9SAndroid Build Coastguard Worker        >>> F.grad.conv1d_input(input.shape, weight, grad_output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    input = grad_output.new_empty(1).expand(input_size)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return torch.ops.aten.convolution_backward(
*da0073e9SAndroid Build Coastguard Worker        grad_output,
*da0073e9SAndroid Build Coastguard Worker        input,
*da0073e9SAndroid Build Coastguard Worker        weight,
*da0073e9SAndroid Build Coastguard Worker        None,
*da0073e9SAndroid Build Coastguard Worker        _single(stride),
*da0073e9SAndroid Build Coastguard Worker        _single(padding),
*da0073e9SAndroid Build Coastguard Worker        _single(dilation),
*da0073e9SAndroid Build Coastguard Worker        False,
*da0073e9SAndroid Build Coastguard Worker        [0],
*da0073e9SAndroid Build Coastguard Worker        groups,
*da0073e9SAndroid Build Coastguard Worker        (True, False, False),
*da0073e9SAndroid Build Coastguard Worker    )[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef conv1d_weight(
*da0073e9SAndroid Build Coastguard Worker    input,
*da0073e9SAndroid Build Coastguard Worker    weight_size,
*da0073e9SAndroid Build Coastguard Worker    grad_output,
*da0073e9SAndroid Build Coastguard Worker    stride=1,
*da0073e9SAndroid Build Coastguard Worker    padding=0,
*da0073e9SAndroid Build Coastguard Worker    dilation=1,
*da0073e9SAndroid Build Coastguard Worker    groups=1,
*da0073e9SAndroid Build Coastguard Worker):
*da0073e9SAndroid Build Coastguard Worker    r"""Compute the gradient of conv1d with respect to the weight of the convolution.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        input: input tensor of shape (minibatch x in_channels x iW)
*da0073e9SAndroid Build Coastguard Worker        weight_size : Shape of the weight gradient tensor
*da0073e9SAndroid Build Coastguard Worker        grad_output : output gradient tensor (minibatch x out_channels x oW)
*da0073e9SAndroid Build Coastguard Worker        stride (int or tuple, optional): Stride of the convolution. Default: 1
*da0073e9SAndroid Build Coastguard Worker        padding (int or tuple, optional): Zero-padding added to both sides of the input. Default: 0
*da0073e9SAndroid Build Coastguard Worker        dilation (int or tuple, optional): Spacing between kernel elements. Default: 1
*da0073e9SAndroid Build Coastguard Worker        groups (int, optional): Number of blocked connections from input channels to output channels. Default: 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Examples::
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        >>> input = torch.randn(1, 1, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        >>> weight = torch.randn(1, 1, 1, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        >>> output = F.conv1d(input, weight)
*da0073e9SAndroid Build Coastguard Worker        >>> grad_output = torch.randn(output.shape)
*da0073e9SAndroid Build Coastguard Worker        >>> # xdoctest: +SKIP
*da0073e9SAndroid Build Coastguard Worker        >>> grad_weight = torch.autograd.grad(output, filter, grad_output)
*da0073e9SAndroid Build Coastguard Worker        >>> F.grad.conv1d_weight(input, weight.shape, grad_output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    weight = grad_output.new_empty(1).expand(weight_size)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return torch.ops.aten.convolution_backward(
*da0073e9SAndroid Build Coastguard Worker        grad_output,
*da0073e9SAndroid Build Coastguard Worker        input,
*da0073e9SAndroid Build Coastguard Worker        weight,
*da0073e9SAndroid Build Coastguard Worker        None,
*da0073e9SAndroid Build Coastguard Worker        _single(stride),
*da0073e9SAndroid Build Coastguard Worker        _single(padding),
*da0073e9SAndroid Build Coastguard Worker        _single(dilation),
*da0073e9SAndroid Build Coastguard Worker        False,
*da0073e9SAndroid Build Coastguard Worker        [0],
*da0073e9SAndroid Build Coastguard Worker        groups,
*da0073e9SAndroid Build Coastguard Worker        (False, True, False),
*da0073e9SAndroid Build Coastguard Worker    )[1]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef conv2d_input(
*da0073e9SAndroid Build Coastguard Worker    input_size,
*da0073e9SAndroid Build Coastguard Worker    weight,
*da0073e9SAndroid Build Coastguard Worker    grad_output,
*da0073e9SAndroid Build Coastguard Worker    stride=1,
*da0073e9SAndroid Build Coastguard Worker    padding=0,
*da0073e9SAndroid Build Coastguard Worker    dilation=1,
*da0073e9SAndroid Build Coastguard Worker    groups=1,
*da0073e9SAndroid Build Coastguard Worker):
*da0073e9SAndroid Build Coastguard Worker    r"""Compute the gradient of conv2d with respect to the input of the convolution.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    This is same as the 2D transposed convolution operator under the hood but requires
*da0073e9SAndroid Build Coastguard Worker    the shape of the gradient w.r.t. input to be specified explicitly.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        input_size : Shape of the input gradient tensor
*da0073e9SAndroid Build Coastguard Worker        weight: weight tensor (out_channels x in_channels/groups x kH x kW)
*da0073e9SAndroid Build Coastguard Worker        grad_output : output gradient tensor (minibatch x out_channels x oH x oW)
*da0073e9SAndroid Build Coastguard Worker        stride (int or tuple, optional): Stride of the convolution. Default: 1
*da0073e9SAndroid Build Coastguard Worker        padding (int or tuple, optional): Zero-padding added to both sides of the input. Default: 0
*da0073e9SAndroid Build Coastguard Worker        dilation (int or tuple, optional): Spacing between kernel elements. Default: 1
*da0073e9SAndroid Build Coastguard Worker        groups (int, optional): Number of blocked connections from input channels to output channels. Default: 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Examples::
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        >>> input = torch.randn(1, 1, 3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        >>> weight = torch.randn(1, 1, 1, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        >>> output = F.conv2d(input, weight)
*da0073e9SAndroid Build Coastguard Worker        >>> grad_output = torch.randn(output.shape)
*da0073e9SAndroid Build Coastguard Worker        >>> grad_input = torch.autograd.grad(output, input, grad_output)
*da0073e9SAndroid Build Coastguard Worker        >>> F.grad.conv2d_input(input.shape, weight, grad_output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    input = grad_output.new_empty(1).expand(input_size)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return torch.ops.aten.convolution_backward(
*da0073e9SAndroid Build Coastguard Worker        grad_output,
*da0073e9SAndroid Build Coastguard Worker        input,
*da0073e9SAndroid Build Coastguard Worker        weight,
*da0073e9SAndroid Build Coastguard Worker        None,
*da0073e9SAndroid Build Coastguard Worker        _pair(stride),
*da0073e9SAndroid Build Coastguard Worker        _pair(padding),
*da0073e9SAndroid Build Coastguard Worker        _pair(dilation),
*da0073e9SAndroid Build Coastguard Worker        False,
*da0073e9SAndroid Build Coastguard Worker        [0],
*da0073e9SAndroid Build Coastguard Worker        groups,
*da0073e9SAndroid Build Coastguard Worker        (True, False, False),
*da0073e9SAndroid Build Coastguard Worker    )[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef conv2d_weight(
*da0073e9SAndroid Build Coastguard Worker    input,
*da0073e9SAndroid Build Coastguard Worker    weight_size,
*da0073e9SAndroid Build Coastguard Worker    grad_output,
*da0073e9SAndroid Build Coastguard Worker    stride=1,
*da0073e9SAndroid Build Coastguard Worker    padding=0,
*da0073e9SAndroid Build Coastguard Worker    dilation=1,
*da0073e9SAndroid Build Coastguard Worker    groups=1,
*da0073e9SAndroid Build Coastguard Worker):
*da0073e9SAndroid Build Coastguard Worker    r"""Compute the gradient of conv2d with respect to the weight of the convolution.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        input: input tensor of shape (minibatch x in_channels x iH x iW)
*da0073e9SAndroid Build Coastguard Worker        weight_size : Shape of the weight gradient tensor
*da0073e9SAndroid Build Coastguard Worker        grad_output : output gradient tensor (minibatch x out_channels x oH x oW)
*da0073e9SAndroid Build Coastguard Worker        stride (int or tuple, optional): Stride of the convolution. Default: 1
*da0073e9SAndroid Build Coastguard Worker        padding (int or tuple, optional): Zero-padding added to both sides of the input. Default: 0
*da0073e9SAndroid Build Coastguard Worker        dilation (int or tuple, optional): Spacing between kernel elements. Default: 1
*da0073e9SAndroid Build Coastguard Worker        groups (int, optional): Number of blocked connections from input channels to output channels. Default: 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Examples::
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        >>> input = torch.randn(1, 1, 3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        >>> weight = torch.randn(1, 1, 1, 2, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        >>> output = F.conv2d(input, weight)
*da0073e9SAndroid Build Coastguard Worker        >>> grad_output = torch.randn(output.shape)
*da0073e9SAndroid Build Coastguard Worker        >>> # xdoctest: +SKIP
*da0073e9SAndroid Build Coastguard Worker        >>> grad_weight = torch.autograd.grad(output, filter, grad_output)
*da0073e9SAndroid Build Coastguard Worker        >>> F.grad.conv2d_weight(input, weight.shape, grad_output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    weight = grad_output.new_empty(1).expand(weight_size)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return torch.ops.aten.convolution_backward(
*da0073e9SAndroid Build Coastguard Worker        grad_output,
*da0073e9SAndroid Build Coastguard Worker        input,
*da0073e9SAndroid Build Coastguard Worker        weight,
*da0073e9SAndroid Build Coastguard Worker        None,
*da0073e9SAndroid Build Coastguard Worker        _pair(stride),
*da0073e9SAndroid Build Coastguard Worker        _pair(padding),
*da0073e9SAndroid Build Coastguard Worker        _pair(dilation),
*da0073e9SAndroid Build Coastguard Worker        False,
*da0073e9SAndroid Build Coastguard Worker        [0],
*da0073e9SAndroid Build Coastguard Worker        groups,
*da0073e9SAndroid Build Coastguard Worker        (False, True, False),
*da0073e9SAndroid Build Coastguard Worker    )[1]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef conv3d_input(
*da0073e9SAndroid Build Coastguard Worker    input_size,
*da0073e9SAndroid Build Coastguard Worker    weight,
*da0073e9SAndroid Build Coastguard Worker    grad_output,
*da0073e9SAndroid Build Coastguard Worker    stride=1,
*da0073e9SAndroid Build Coastguard Worker    padding=0,
*da0073e9SAndroid Build Coastguard Worker    dilation=1,
*da0073e9SAndroid Build Coastguard Worker    groups=1,
*da0073e9SAndroid Build Coastguard Worker):
*da0073e9SAndroid Build Coastguard Worker    r"""Compute the gradient of conv3d with respect to the input of the convolution.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    This is same as the 3D transposed convolution operator under the hood but requires
*da0073e9SAndroid Build Coastguard Worker    the shape of the gradient w.r.t. input to be specified explicitly.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        input_size : Shape of the input gradient tensor
*da0073e9SAndroid Build Coastguard Worker        weight: weights tensor (out_channels x in_channels/groups x kT x kH x kW)
*da0073e9SAndroid Build Coastguard Worker        grad_output : output gradient tensor (minibatch x out_channels x oT x oH x oW)
*da0073e9SAndroid Build Coastguard Worker        stride (int or tuple, optional): Stride of the convolution. Default: 1
*da0073e9SAndroid Build Coastguard Worker        padding (int or tuple, optional): Zero-padding added to both sides of the input. Default: 0
*da0073e9SAndroid Build Coastguard Worker        dilation (int or tuple, optional): Spacing between kernel elements. Default: 1
*da0073e9SAndroid Build Coastguard Worker        groups (int, optional): Number of blocked connections from input channels to output channels. Default: 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Examples::
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        >>> input = torch.randn(2, 8, 10, 10, 20, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        >>> weight = torch.randn(4, 8, 2, 3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        >>> output = F.conv3d(input, weight)
*da0073e9SAndroid Build Coastguard Worker        >>> grad_output = torch.randn(output.shape)
*da0073e9SAndroid Build Coastguard Worker        >>> grad_input = torch.autograd.grad(output, input, grad_output)
*da0073e9SAndroid Build Coastguard Worker        >>> F.grad.conv3d_input(input.shape, weight, grad_output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    input = grad_output.new_empty(1).expand(input_size)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return torch.ops.aten.convolution_backward(
*da0073e9SAndroid Build Coastguard Worker        grad_output,
*da0073e9SAndroid Build Coastguard Worker        input,
*da0073e9SAndroid Build Coastguard Worker        weight,
*da0073e9SAndroid Build Coastguard Worker        None,
*da0073e9SAndroid Build Coastguard Worker        _triple(stride),
*da0073e9SAndroid Build Coastguard Worker        _triple(padding),
*da0073e9SAndroid Build Coastguard Worker        _triple(dilation),
*da0073e9SAndroid Build Coastguard Worker        False,
*da0073e9SAndroid Build Coastguard Worker        [0],
*da0073e9SAndroid Build Coastguard Worker        groups,
*da0073e9SAndroid Build Coastguard Worker        (True, False, False),
*da0073e9SAndroid Build Coastguard Worker    )[0]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef conv3d_weight(
*da0073e9SAndroid Build Coastguard Worker    input,
*da0073e9SAndroid Build Coastguard Worker    weight_size,
*da0073e9SAndroid Build Coastguard Worker    grad_output,
*da0073e9SAndroid Build Coastguard Worker    stride=1,
*da0073e9SAndroid Build Coastguard Worker    padding=0,
*da0073e9SAndroid Build Coastguard Worker    dilation=1,
*da0073e9SAndroid Build Coastguard Worker    groups=1,
*da0073e9SAndroid Build Coastguard Worker):
*da0073e9SAndroid Build Coastguard Worker    r"""Compute the gradient of conv3d with respect to the weight of the convolution.
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        input: input tensor of shape (minibatch x in_channels x iT x iH x iW)
*da0073e9SAndroid Build Coastguard Worker        weight_size : Shape of the weight gradient tensor
*da0073e9SAndroid Build Coastguard Worker        grad_output : output gradient tensor (minibatch x out_channels x oT x oH x oW)
*da0073e9SAndroid Build Coastguard Worker        stride (int or tuple, optional): Stride of the convolution. Default: 1
*da0073e9SAndroid Build Coastguard Worker        padding (int or tuple, optional): Zero-padding added to both sides of the input. Default: 0
*da0073e9SAndroid Build Coastguard Worker        dilation (int or tuple, optional): Spacing between kernel elements. Default: 1
*da0073e9SAndroid Build Coastguard Worker        groups (int, optional): Number of blocked connections from input channels to output channels. Default: 1
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Examples::
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        >>> input = torch.randn(2, 8, 10, 10, 20, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        >>> weight = torch.randn(4, 8, 2, 3, 3, requires_grad=True)
*da0073e9SAndroid Build Coastguard Worker        >>> output = F.conv3d(input, weight)
*da0073e9SAndroid Build Coastguard Worker        >>> grad_output = torch.randn(output.shape)
*da0073e9SAndroid Build Coastguard Worker        >>> grad_weight = torch.autograd.grad(output, weight, grad_output)
*da0073e9SAndroid Build Coastguard Worker        >>> F.grad.conv3d_weight(input, weight.shape, grad_output)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    weight = grad_output.new_empty(1).expand(weight_size)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    return torch.ops.aten.convolution_backward(
*da0073e9SAndroid Build Coastguard Worker        grad_output,
*da0073e9SAndroid Build Coastguard Worker        input,
*da0073e9SAndroid Build Coastguard Worker        weight,
*da0073e9SAndroid Build Coastguard Worker        None,
*da0073e9SAndroid Build Coastguard Worker        _triple(stride),
*da0073e9SAndroid Build Coastguard Worker        _triple(padding),
*da0073e9SAndroid Build Coastguard Worker        _triple(dilation),
*da0073e9SAndroid Build Coastguard Worker        False,
*da0073e9SAndroid Build Coastguard Worker        [0],
*da0073e9SAndroid Build Coastguard Worker        groups,
*da0073e9SAndroid Build Coastguard Worker        (False, True, False),
*da0073e9SAndroid Build Coastguard Worker    )[1]