torch/distributions/wishart.py

*da0073e9SAndroid Build Coastguard Worker# mypy: allow-untyped-defs
*da0073e9SAndroid Build Coastguard Workerimport math
*da0073e9SAndroid Build Coastguard Workerimport warnings
*da0073e9SAndroid Build Coastguard Workerfrom numbers import Number
*da0073e9SAndroid Build Coastguard Workerfrom typing import Optional, Union
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerimport torch
*da0073e9SAndroid Build Coastguard Workerfrom torch import nan
*da0073e9SAndroid Build Coastguard Workerfrom torch.distributions import constraints
*da0073e9SAndroid Build Coastguard Workerfrom torch.distributions.exp_family import ExponentialFamily
*da0073e9SAndroid Build Coastguard Workerfrom torch.distributions.multivariate_normal import _precision_to_scale_tril
*da0073e9SAndroid Build Coastguard Workerfrom torch.distributions.utils import lazy_property
*da0073e9SAndroid Build Coastguard Workerfrom torch.types import _size
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker__all__ = ["Wishart"]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker_log_2 = math.log(2)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _mvdigamma(x: torch.Tensor, p: int) -> torch.Tensor:
*da0073e9SAndroid Build Coastguard Worker    assert x.gt((p - 1) / 2).all(), "Wrong domain for multivariate digamma function."
*da0073e9SAndroid Build Coastguard Worker    return torch.digamma(
*da0073e9SAndroid Build Coastguard Worker        x.unsqueeze(-1)
*da0073e9SAndroid Build Coastguard Worker        - torch.arange(p, dtype=x.dtype, device=x.device).div(2).expand(x.shape + (-1,))
*da0073e9SAndroid Build Coastguard Worker    ).sum(-1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerdef _clamp_above_eps(x: torch.Tensor) -> torch.Tensor:
*da0073e9SAndroid Build Coastguard Worker    # We assume positive input for this function
*da0073e9SAndroid Build Coastguard Worker    return x.clamp(min=torch.finfo(x.dtype).eps)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerclass Wishart(ExponentialFamily):
*da0073e9SAndroid Build Coastguard Worker    r"""
*da0073e9SAndroid Build Coastguard Worker    Creates a Wishart distribution parameterized by a symmetric positive definite matrix :math:`\Sigma`,
*da0073e9SAndroid Build Coastguard Worker    or its Cholesky decomposition :math:`\mathbf{\Sigma} = \mathbf{L}\mathbf{L}^\top`
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Example:
*da0073e9SAndroid Build Coastguard Worker        >>> # xdoctest: +SKIP("FIXME: scale_tril must be at least two-dimensional")
*da0073e9SAndroid Build Coastguard Worker        >>> m = Wishart(torch.Tensor([2]), covariance_matrix=torch.eye(2))
*da0073e9SAndroid Build Coastguard Worker        >>> m.sample()  # Wishart distributed with mean=`df * I` and
*da0073e9SAndroid Build Coastguard Worker        >>>             # variance(x_ij)=`df` for i != j and variance(x_ij)=`2 * df` for i == j
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    Args:
*da0073e9SAndroid Build Coastguard Worker        df (float or Tensor): real-valued parameter larger than the (dimension of Square matrix) - 1
*da0073e9SAndroid Build Coastguard Worker        covariance_matrix (Tensor): positive-definite covariance matrix
*da0073e9SAndroid Build Coastguard Worker        precision_matrix (Tensor): positive-definite precision matrix
*da0073e9SAndroid Build Coastguard Worker        scale_tril (Tensor): lower-triangular factor of covariance, with positive-valued diagonal
*da0073e9SAndroid Build Coastguard Worker    Note:
*da0073e9SAndroid Build Coastguard Worker        Only one of :attr:`covariance_matrix` or :attr:`precision_matrix` or
*da0073e9SAndroid Build Coastguard Worker        :attr:`scale_tril` can be specified.
*da0073e9SAndroid Build Coastguard Worker        Using :attr:`scale_tril` will be more efficient: all computations internally
*da0073e9SAndroid Build Coastguard Worker        are based on :attr:`scale_tril`. If :attr:`covariance_matrix` or
*da0073e9SAndroid Build Coastguard Worker        :attr:`precision_matrix` is passed instead, it is only used to compute
*da0073e9SAndroid Build Coastguard Worker        the corresponding lower triangular matrices using a Cholesky decomposition.
*da0073e9SAndroid Build Coastguard Worker        'torch.distributions.LKJCholesky' is a restricted Wishart distribution.[1]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    **References**
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    [1] Wang, Z., Wu, Y. and Chu, H., 2018. `On equivalence of the LKJ distribution and the restricted Wishart distribution`.
*da0073e9SAndroid Build Coastguard Worker    [2] Sawyer, S., 2007. `Wishart Distributions and Inverse-Wishart Sampling`.
*da0073e9SAndroid Build Coastguard Worker    [3] Anderson, T. W., 2003. `An Introduction to Multivariate Statistical Analysis (3rd ed.)`.
*da0073e9SAndroid Build Coastguard Worker    [4] Odell, P. L. & Feiveson, A. H., 1966. `A Numerical Procedure to Generate a SampleCovariance Matrix`. JASA, 61(313):199-203.
*da0073e9SAndroid Build Coastguard Worker    [5] Ku, Y.-C. & Bloomfield, P., 2010. `Generating Random Wishart Matrices with Fractional Degrees of Freedom in OX`.
*da0073e9SAndroid Build Coastguard Worker    """
*da0073e9SAndroid Build Coastguard Worker    arg_constraints = {
*da0073e9SAndroid Build Coastguard Worker        "covariance_matrix": constraints.positive_definite,
*da0073e9SAndroid Build Coastguard Worker        "precision_matrix": constraints.positive_definite,
*da0073e9SAndroid Build Coastguard Worker        "scale_tril": constraints.lower_cholesky,
*da0073e9SAndroid Build Coastguard Worker        "df": constraints.greater_than(0),
*da0073e9SAndroid Build Coastguard Worker    }
*da0073e9SAndroid Build Coastguard Worker    support = constraints.positive_definite
*da0073e9SAndroid Build Coastguard Worker    has_rsample = True
*da0073e9SAndroid Build Coastguard Worker    _mean_carrier_measure = 0
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def __init__(
*da0073e9SAndroid Build Coastguard Worker        self,
*da0073e9SAndroid Build Coastguard Worker        df: Union[torch.Tensor, Number],
*da0073e9SAndroid Build Coastguard Worker        covariance_matrix: Optional[torch.Tensor] = None,
*da0073e9SAndroid Build Coastguard Worker        precision_matrix: Optional[torch.Tensor] = None,
*da0073e9SAndroid Build Coastguard Worker        scale_tril: Optional[torch.Tensor] = None,
*da0073e9SAndroid Build Coastguard Worker        validate_args=None,
*da0073e9SAndroid Build Coastguard Worker    ):
*da0073e9SAndroid Build Coastguard Worker        assert (covariance_matrix is not None) + (scale_tril is not None) + (
*da0073e9SAndroid Build Coastguard Worker            precision_matrix is not None
*da0073e9SAndroid Build Coastguard Worker        ) == 1, "Exactly one of covariance_matrix or precision_matrix or scale_tril may be specified."
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        param = next(
*da0073e9SAndroid Build Coastguard Worker            p
*da0073e9SAndroid Build Coastguard Worker            for p in (covariance_matrix, precision_matrix, scale_tril)
*da0073e9SAndroid Build Coastguard Worker            if p is not None
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if param.dim() < 2:
*da0073e9SAndroid Build Coastguard Worker            raise ValueError(
*da0073e9SAndroid Build Coastguard Worker                "scale_tril must be at least two-dimensional, with optional leading batch dimensions"
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if isinstance(df, Number):
*da0073e9SAndroid Build Coastguard Worker            batch_shape = torch.Size(param.shape[:-2])
*da0073e9SAndroid Build Coastguard Worker            self.df = torch.tensor(df, dtype=param.dtype, device=param.device)
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            batch_shape = torch.broadcast_shapes(param.shape[:-2], df.shape)
*da0073e9SAndroid Build Coastguard Worker            self.df = df.expand(batch_shape)
*da0073e9SAndroid Build Coastguard Worker        event_shape = param.shape[-2:]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if self.df.le(event_shape[-1] - 1).any():
*da0073e9SAndroid Build Coastguard Worker            raise ValueError(
*da0073e9SAndroid Build Coastguard Worker                f"Value of df={df} expected to be greater than ndim - 1 = {event_shape[-1]-1}."
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if scale_tril is not None:
*da0073e9SAndroid Build Coastguard Worker            self.scale_tril = param.expand(batch_shape + (-1, -1))
*da0073e9SAndroid Build Coastguard Worker        elif covariance_matrix is not None:
*da0073e9SAndroid Build Coastguard Worker            self.covariance_matrix = param.expand(batch_shape + (-1, -1))
*da0073e9SAndroid Build Coastguard Worker        elif precision_matrix is not None:
*da0073e9SAndroid Build Coastguard Worker            self.precision_matrix = param.expand(batch_shape + (-1, -1))
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        self.arg_constraints["df"] = constraints.greater_than(event_shape[-1] - 1)
*da0073e9SAndroid Build Coastguard Worker        if self.df.lt(event_shape[-1]).any():
*da0073e9SAndroid Build Coastguard Worker            warnings.warn(
*da0073e9SAndroid Build Coastguard Worker                "Low df values detected. Singular samples are highly likely to occur for ndim - 1 < df < ndim."
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        super().__init__(batch_shape, event_shape, validate_args=validate_args)
*da0073e9SAndroid Build Coastguard Worker        self._batch_dims = [-(x + 1) for x in range(len(self._batch_shape))]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if scale_tril is not None:
*da0073e9SAndroid Build Coastguard Worker            self._unbroadcasted_scale_tril = scale_tril
*da0073e9SAndroid Build Coastguard Worker        elif covariance_matrix is not None:
*da0073e9SAndroid Build Coastguard Worker            self._unbroadcasted_scale_tril = torch.linalg.cholesky(covariance_matrix)
*da0073e9SAndroid Build Coastguard Worker        else:  # precision_matrix is not None
*da0073e9SAndroid Build Coastguard Worker            self._unbroadcasted_scale_tril = _precision_to_scale_tril(precision_matrix)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Chi2 distribution is needed for Bartlett decomposition sampling
*da0073e9SAndroid Build Coastguard Worker        self._dist_chi2 = torch.distributions.chi2.Chi2(
*da0073e9SAndroid Build Coastguard Worker            df=(
*da0073e9SAndroid Build Coastguard Worker                self.df.unsqueeze(-1)
*da0073e9SAndroid Build Coastguard Worker                - torch.arange(
*da0073e9SAndroid Build Coastguard Worker                    self._event_shape[-1],
*da0073e9SAndroid Build Coastguard Worker                    dtype=self._unbroadcasted_scale_tril.dtype,
*da0073e9SAndroid Build Coastguard Worker                    device=self._unbroadcasted_scale_tril.device,
*da0073e9SAndroid Build Coastguard Worker                ).expand(batch_shape + (-1,))
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def expand(self, batch_shape, _instance=None):
*da0073e9SAndroid Build Coastguard Worker        new = self._get_checked_instance(Wishart, _instance)
*da0073e9SAndroid Build Coastguard Worker        batch_shape = torch.Size(batch_shape)
*da0073e9SAndroid Build Coastguard Worker        cov_shape = batch_shape + self.event_shape
*da0073e9SAndroid Build Coastguard Worker        new._unbroadcasted_scale_tril = self._unbroadcasted_scale_tril.expand(cov_shape)
*da0073e9SAndroid Build Coastguard Worker        new.df = self.df.expand(batch_shape)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        new._batch_dims = [-(x + 1) for x in range(len(batch_shape))]
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if "covariance_matrix" in self.__dict__:
*da0073e9SAndroid Build Coastguard Worker            new.covariance_matrix = self.covariance_matrix.expand(cov_shape)
*da0073e9SAndroid Build Coastguard Worker        if "scale_tril" in self.__dict__:
*da0073e9SAndroid Build Coastguard Worker            new.scale_tril = self.scale_tril.expand(cov_shape)
*da0073e9SAndroid Build Coastguard Worker        if "precision_matrix" in self.__dict__:
*da0073e9SAndroid Build Coastguard Worker            new.precision_matrix = self.precision_matrix.expand(cov_shape)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Chi2 distribution is needed for Bartlett decomposition sampling
*da0073e9SAndroid Build Coastguard Worker        new._dist_chi2 = torch.distributions.chi2.Chi2(
*da0073e9SAndroid Build Coastguard Worker            df=(
*da0073e9SAndroid Build Coastguard Worker                new.df.unsqueeze(-1)
*da0073e9SAndroid Build Coastguard Worker                - torch.arange(
*da0073e9SAndroid Build Coastguard Worker                    self.event_shape[-1],
*da0073e9SAndroid Build Coastguard Worker                    dtype=new._unbroadcasted_scale_tril.dtype,
*da0073e9SAndroid Build Coastguard Worker                    device=new._unbroadcasted_scale_tril.device,
*da0073e9SAndroid Build Coastguard Worker                ).expand(batch_shape + (-1,))
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        super(Wishart, new).__init__(batch_shape, self.event_shape, validate_args=False)
*da0073e9SAndroid Build Coastguard Worker        new._validate_args = self._validate_args
*da0073e9SAndroid Build Coastguard Worker        return new
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @lazy_property
*da0073e9SAndroid Build Coastguard Worker    def scale_tril(self):
*da0073e9SAndroid Build Coastguard Worker        return self._unbroadcasted_scale_tril.expand(
*da0073e9SAndroid Build Coastguard Worker            self._batch_shape + self._event_shape
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @lazy_property
*da0073e9SAndroid Build Coastguard Worker    def covariance_matrix(self):
*da0073e9SAndroid Build Coastguard Worker        return (
*da0073e9SAndroid Build Coastguard Worker            self._unbroadcasted_scale_tril
*da0073e9SAndroid Build Coastguard Worker            @ self._unbroadcasted_scale_tril.transpose(-2, -1)
*da0073e9SAndroid Build Coastguard Worker        ).expand(self._batch_shape + self._event_shape)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @lazy_property
*da0073e9SAndroid Build Coastguard Worker    def precision_matrix(self):
*da0073e9SAndroid Build Coastguard Worker        identity = torch.eye(
*da0073e9SAndroid Build Coastguard Worker            self._event_shape[-1],
*da0073e9SAndroid Build Coastguard Worker            device=self._unbroadcasted_scale_tril.device,
*da0073e9SAndroid Build Coastguard Worker            dtype=self._unbroadcasted_scale_tril.dtype,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        return torch.cholesky_solve(identity, self._unbroadcasted_scale_tril).expand(
*da0073e9SAndroid Build Coastguard Worker            self._batch_shape + self._event_shape
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def mean(self):
*da0073e9SAndroid Build Coastguard Worker        return self.df.view(self._batch_shape + (1, 1)) * self.covariance_matrix
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def mode(self):
*da0073e9SAndroid Build Coastguard Worker        factor = self.df - self.covariance_matrix.shape[-1] - 1
*da0073e9SAndroid Build Coastguard Worker        factor[factor <= 0] = nan
*da0073e9SAndroid Build Coastguard Worker        return factor.view(self._batch_shape + (1, 1)) * self.covariance_matrix
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def variance(self):
*da0073e9SAndroid Build Coastguard Worker        V = self.covariance_matrix  # has shape (batch_shape x event_shape)
*da0073e9SAndroid Build Coastguard Worker        diag_V = V.diagonal(dim1=-2, dim2=-1)
*da0073e9SAndroid Build Coastguard Worker        return self.df.view(self._batch_shape + (1, 1)) * (
*da0073e9SAndroid Build Coastguard Worker            V.pow(2) + torch.einsum("...i,...j->...ij", diag_V, diag_V)
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _bartlett_sampling(self, sample_shape=torch.Size()):
*da0073e9SAndroid Build Coastguard Worker        p = self._event_shape[-1]  # has singleton shape
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Implemented Sampling using Bartlett decomposition
*da0073e9SAndroid Build Coastguard Worker        noise = _clamp_above_eps(
*da0073e9SAndroid Build Coastguard Worker            self._dist_chi2.rsample(sample_shape).sqrt()
*da0073e9SAndroid Build Coastguard Worker        ).diag_embed(dim1=-2, dim2=-1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        i, j = torch.tril_indices(p, p, offset=-1)
*da0073e9SAndroid Build Coastguard Worker        noise[..., i, j] = torch.randn(
*da0073e9SAndroid Build Coastguard Worker            torch.Size(sample_shape) + self._batch_shape + (int(p * (p - 1) / 2),),
*da0073e9SAndroid Build Coastguard Worker            dtype=noise.dtype,
*da0073e9SAndroid Build Coastguard Worker            device=noise.device,
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker        chol = self._unbroadcasted_scale_tril @ noise
*da0073e9SAndroid Build Coastguard Worker        return chol @ chol.transpose(-2, -1)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def rsample(
*da0073e9SAndroid Build Coastguard Worker        self, sample_shape: _size = torch.Size(), max_try_correction=None
*da0073e9SAndroid Build Coastguard Worker    ) -> torch.Tensor:
*da0073e9SAndroid Build Coastguard Worker        r"""
*da0073e9SAndroid Build Coastguard Worker        .. warning::
*da0073e9SAndroid Build Coastguard Worker            In some cases, sampling algorithm based on Bartlett decomposition may return singular matrix samples.
*da0073e9SAndroid Build Coastguard Worker            Several tries to correct singular samples are performed by default, but it may end up returning
*da0073e9SAndroid Build Coastguard Worker            singular matrix samples. Singular samples may return `-inf` values in `.log_prob()`.
*da0073e9SAndroid Build Coastguard Worker            In those cases, the user should validate the samples and either fix the value of `df`
*da0073e9SAndroid Build Coastguard Worker            or adjust `max_try_correction` value for argument in `.rsample` accordingly.
*da0073e9SAndroid Build Coastguard Worker        """
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if max_try_correction is None:
*da0073e9SAndroid Build Coastguard Worker            max_try_correction = 3 if torch._C._get_tracing_state() else 10
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        sample_shape = torch.Size(sample_shape)
*da0073e9SAndroid Build Coastguard Worker        sample = self._bartlett_sampling(sample_shape)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        # Below part is to improve numerical stability temporally and should be removed in the future
*da0073e9SAndroid Build Coastguard Worker        is_singular = self.support.check(sample)
*da0073e9SAndroid Build Coastguard Worker        if self._batch_shape:
*da0073e9SAndroid Build Coastguard Worker            is_singular = is_singular.amax(self._batch_dims)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        if torch._C._get_tracing_state():
*da0073e9SAndroid Build Coastguard Worker            # Less optimized version for JIT
*da0073e9SAndroid Build Coastguard Worker            for _ in range(max_try_correction):
*da0073e9SAndroid Build Coastguard Worker                sample_new = self._bartlett_sampling(sample_shape)
*da0073e9SAndroid Build Coastguard Worker                sample = torch.where(is_singular, sample_new, sample)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                is_singular = ~self.support.check(sample)
*da0073e9SAndroid Build Coastguard Worker                if self._batch_shape:
*da0073e9SAndroid Build Coastguard Worker                    is_singular = is_singular.amax(self._batch_dims)
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        else:
*da0073e9SAndroid Build Coastguard Worker            # More optimized version with data-dependent control flow.
*da0073e9SAndroid Build Coastguard Worker            if is_singular.any():
*da0073e9SAndroid Build Coastguard Worker                warnings.warn("Singular sample detected.")
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                for _ in range(max_try_correction):
*da0073e9SAndroid Build Coastguard Worker                    sample_new = self._bartlett_sampling(is_singular[is_singular].shape)
*da0073e9SAndroid Build Coastguard Worker                    sample[is_singular] = sample_new
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    is_singular_new = ~self.support.check(sample_new)
*da0073e9SAndroid Build Coastguard Worker                    if self._batch_shape:
*da0073e9SAndroid Build Coastguard Worker                        is_singular_new = is_singular_new.amax(self._batch_dims)
*da0073e9SAndroid Build Coastguard Worker                    is_singular[is_singular.clone()] = is_singular_new
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker                    if not is_singular.any():
*da0073e9SAndroid Build Coastguard Worker                        break
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker        return sample
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def log_prob(self, value):
*da0073e9SAndroid Build Coastguard Worker        if self._validate_args:
*da0073e9SAndroid Build Coastguard Worker            self._validate_sample(value)
*da0073e9SAndroid Build Coastguard Worker        nu = self.df  # has shape (batch_shape)
*da0073e9SAndroid Build Coastguard Worker        p = self._event_shape[-1]  # has singleton shape
*da0073e9SAndroid Build Coastguard Worker        return (
*da0073e9SAndroid Build Coastguard Worker            -nu
*da0073e9SAndroid Build Coastguard Worker            * (
*da0073e9SAndroid Build Coastguard Worker                p * _log_2 / 2
*da0073e9SAndroid Build Coastguard Worker                + self._unbroadcasted_scale_tril.diagonal(dim1=-2, dim2=-1)
*da0073e9SAndroid Build Coastguard Worker                .log()
*da0073e9SAndroid Build Coastguard Worker                .sum(-1)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            - torch.mvlgamma(nu / 2, p=p)
*da0073e9SAndroid Build Coastguard Worker            + (nu - p - 1) / 2 * torch.linalg.slogdet(value).logabsdet
*da0073e9SAndroid Build Coastguard Worker            - torch.cholesky_solve(value, self._unbroadcasted_scale_tril)
*da0073e9SAndroid Build Coastguard Worker            .diagonal(dim1=-2, dim2=-1)
*da0073e9SAndroid Build Coastguard Worker            .sum(dim=-1)
*da0073e9SAndroid Build Coastguard Worker            / 2
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def entropy(self):
*da0073e9SAndroid Build Coastguard Worker        nu = self.df  # has shape (batch_shape)
*da0073e9SAndroid Build Coastguard Worker        p = self._event_shape[-1]  # has singleton shape
*da0073e9SAndroid Build Coastguard Worker        V = self.covariance_matrix  # has shape (batch_shape x event_shape)
*da0073e9SAndroid Build Coastguard Worker        return (
*da0073e9SAndroid Build Coastguard Worker            (p + 1)
*da0073e9SAndroid Build Coastguard Worker            * (
*da0073e9SAndroid Build Coastguard Worker                p * _log_2 / 2
*da0073e9SAndroid Build Coastguard Worker                + self._unbroadcasted_scale_tril.diagonal(dim1=-2, dim2=-1)
*da0073e9SAndroid Build Coastguard Worker                .log()
*da0073e9SAndroid Build Coastguard Worker                .sum(-1)
*da0073e9SAndroid Build Coastguard Worker            )
*da0073e9SAndroid Build Coastguard Worker            + torch.mvlgamma(nu / 2, p=p)
*da0073e9SAndroid Build Coastguard Worker            - (nu - p - 1) / 2 * _mvdigamma(nu / 2, p=p)
*da0073e9SAndroid Build Coastguard Worker            + nu * p / 2
*da0073e9SAndroid Build Coastguard Worker        )
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    @property
*da0073e9SAndroid Build Coastguard Worker    def _natural_params(self):
*da0073e9SAndroid Build Coastguard Worker        nu = self.df  # has shape (batch_shape)
*da0073e9SAndroid Build Coastguard Worker        p = self._event_shape[-1]  # has singleton shape
*da0073e9SAndroid Build Coastguard Worker        return -self.precision_matrix / 2, (nu - p - 1) / 2
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker    def _log_normalizer(self, x, y):
*da0073e9SAndroid Build Coastguard Worker        p = self._event_shape[-1]
*da0073e9SAndroid Build Coastguard Worker        return (y + (p + 1) / 2) * (
*da0073e9SAndroid Build Coastguard Worker            -torch.linalg.slogdet(-2 * x).logabsdet + _log_2 * p
*da0073e9SAndroid Build Coastguard Worker        ) + torch.mvlgamma(y + (p + 1) / 2, p=p)