validation/reference/DFT.cpp

*c217d954SCole Faust/*
*c217d954SCole Faust * Copyright (c) 2019-2020 Arm Limited.
*c217d954SCole Faust *
*c217d954SCole Faust * SPDX-License-Identifier: MIT
*c217d954SCole Faust *
*c217d954SCole Faust * Permission is hereby granted, free of charge, to any person obtaining a copy
*c217d954SCole Faust * of this software and associated documentation files (the "Software"), to
*c217d954SCole Faust * deal in the Software without restriction, including without limitation the
*c217d954SCole Faust * rights to use, copy, modify, merge, publish, distribute, sublicense, and/or
*c217d954SCole Faust * sell copies of the Software, and to permit persons to whom the Software is
*c217d954SCole Faust * furnished to do so, subject to the following conditions:
*c217d954SCole Faust *
*c217d954SCole Faust * The above copyright notice and this permission notice shall be included in all
*c217d954SCole Faust * copies or substantial portions of the Software.
*c217d954SCole Faust *
*c217d954SCole Faust * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
*c217d954SCole Faust * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
*c217d954SCole Faust * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
*c217d954SCole Faust * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
*c217d954SCole Faust * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
*c217d954SCole Faust * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
*c217d954SCole Faust * SOFTWARE.
*c217d954SCole Faust */
*c217d954SCole Faust#include "DFT.h"
*c217d954SCole Faust
*c217d954SCole Faust#include "PadLayer.h"
*c217d954SCole Faust#include "Permute.h"
*c217d954SCole Faust#include "Reverse.h"
*c217d954SCole Faust#include "SliceOperations.h"
*c217d954SCole Faust#include "support/ToolchainSupport.h"
*c217d954SCole Faust
*c217d954SCole Faust#include <cmath>
*c217d954SCole Faust
*c217d954SCole Faustnamespace arm_compute
*c217d954SCole Faust{
*c217d954SCole Faustnamespace test
*c217d954SCole Faust{
*c217d954SCole Faustnamespace validation
*c217d954SCole Faust{
*c217d954SCole Faustnamespace reference
*c217d954SCole Faust{
*c217d954SCole Faustnamespace
*c217d954SCole Faust{
*c217d954SCole Faust/** Performs an one dimensional DFT on a given real sequence.
*c217d954SCole Faust *
*c217d954SCole Faust * @param[in]  src_ptr Pointer to the real input sequence.
*c217d954SCole Faust * @param[in]  N       Size of input sequence.
*c217d954SCole Faust * @param[out] dst_ptr Pointer to the complex output sequence.
*c217d954SCole Faust * @param[out] K       Size of the output sequence
*c217d954SCole Faust */
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole Faustvoid rdft_1d_step(const T *src_ptr, size_t N, T *dst_ptr, size_t K)
*c217d954SCole Faust{
*c217d954SCole Faust#if defined(_OPENMP)
*c217d954SCole Faust    #pragma omp parallel for
*c217d954SCole Faust#endif /* _OPENMP */
*c217d954SCole Faust    for(unsigned int k = 0; k < K; ++k)
*c217d954SCole Faust    {
*c217d954SCole Faust        float Xr = 0;
*c217d954SCole Faust        float Xi = 0;
*c217d954SCole Faust        for(unsigned int n = 0; n < N; ++n)
*c217d954SCole Faust        {
*c217d954SCole Faust            const float alpha = (2 * M_PI * k * n) / N;
*c217d954SCole Faust            const float val_r = src_ptr[n];
*c217d954SCole Faust            // Assuming DFT from the R domain thus skipping imaginary calculations
*c217d954SCole Faust            Xr += val_r * cos(alpha);
*c217d954SCole Faust            Xi -= val_r * sin(alpha);
*c217d954SCole Faust        }
*c217d954SCole Faust
*c217d954SCole Faust        dst_ptr[k * 2]     = Xr;
*c217d954SCole Faust        dst_ptr[k * 2 + 1] = Xi;
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faust/** Performs an one dimensional DFT on a given complex sequence.
*c217d954SCole Faust *
*c217d954SCole Faust * @param[in]  src_ptr Pointer to the complex input sequence.
*c217d954SCole Faust * @param[out] dst_ptr Pointer to the complex output sequence.
*c217d954SCole Faust * @param[in]  N       Size of the sequences
*c217d954SCole Faust */
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole Faustvoid dft_1d_step(const T *src_ptr, T *dst_ptr, size_t N)
*c217d954SCole Faust{
*c217d954SCole Faust#if defined(_OPENMP)
*c217d954SCole Faust    #pragma omp parallel for
*c217d954SCole Faust#endif /* _OPENMP */
*c217d954SCole Faust    for(unsigned int k = 0; k < N; ++k)
*c217d954SCole Faust    {
*c217d954SCole Faust        float Xr = 0;
*c217d954SCole Faust        float Xi = 0;
*c217d954SCole Faust        for(unsigned int n = 0; n < N; ++n)
*c217d954SCole Faust        {
*c217d954SCole Faust            const float alpha     = (2 * M_PI * k * n) / N;
*c217d954SCole Faust            const float val_r     = src_ptr[2 * n];
*c217d954SCole Faust            const float val_i     = src_ptr[2 * n + 1];
*c217d954SCole Faust            const float cos_alpha = cos(alpha);
*c217d954SCole Faust            const float sin_alpha = sin(alpha);
*c217d954SCole Faust
*c217d954SCole Faust            Xr += val_r * cos_alpha + val_i * sin_alpha;
*c217d954SCole Faust            Xi += val_i * cos_alpha - val_r * sin_alpha;
*c217d954SCole Faust        }
*c217d954SCole Faust
*c217d954SCole Faust        dst_ptr[k * 2]     = Xr;
*c217d954SCole Faust        dst_ptr[k * 2 + 1] = Xi;
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faust/** Performs an one dimensional inverse DFT on a given real sequence.
*c217d954SCole Faust *
*c217d954SCole Faust * @param[in]  src_ptr Pointer to the real input sequence.
*c217d954SCole Faust * @param[in]  K       Size of input sequence.
*c217d954SCole Faust * @param[out] dst_ptr Pointer to the complex output sequence.
*c217d954SCole Faust * @param[out] N       Size of the output sequence
*c217d954SCole Faust */
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole Faustvoid irdft_1d_step(const T *src_ptr, size_t K, T *dst_ptr, size_t N)
*c217d954SCole Faust{
*c217d954SCole Faust    const bool         is_odd     = N % 2;
*c217d954SCole Faust    const unsigned int Nleft      = N - K;
*c217d954SCole Faust    const int          tail_start = is_odd ? K - 1 : K - 2;
*c217d954SCole Faust#if defined(_OPENMP)
*c217d954SCole Faust    #pragma omp parallel for
*c217d954SCole Faust#endif /* _OPENMP */
*c217d954SCole Faust    for(unsigned int n = 0; n < N; ++n)
*c217d954SCole Faust    {
*c217d954SCole Faust        float xr = 0;
*c217d954SCole Faust        for(unsigned int k = 0; k < K; ++k)
*c217d954SCole Faust        {
*c217d954SCole Faust            const float alpha = (2 * M_PI * k * n) / N;
*c217d954SCole Faust            xr += src_ptr[2 * k] * cos(alpha) - src_ptr[2 * k + 1] * sin(alpha);
*c217d954SCole Faust        }
*c217d954SCole Faust
*c217d954SCole Faust        unsigned int j = tail_start;
*c217d954SCole Faust        for(unsigned int k = 0; k < Nleft; ++k)
*c217d954SCole Faust        {
*c217d954SCole Faust            const float alpha = (2 * M_PI * (k + K) * n) / N;
*c217d954SCole Faust            xr += src_ptr[2 * j] * cos(alpha) + src_ptr[2 * j + 1] * sin(alpha);
*c217d954SCole Faust            --j;
*c217d954SCole Faust        }
*c217d954SCole Faust
*c217d954SCole Faust        dst_ptr[n] = xr;
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faust/** Performs an one dimensional inverse DFT on a given complex sequence.
*c217d954SCole Faust *
*c217d954SCole Faust * @param[in]  src_ptr Pointer to the complex input sequence.
*c217d954SCole Faust * @param[out] dst_ptr Pointer to the complex output sequence.
*c217d954SCole Faust * @param[in]  N       Size of the sequences
*c217d954SCole Faust */
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole Faustvoid idft_1d_step(const T *src_ptr, T *dst_ptr, size_t N)
*c217d954SCole Faust{
*c217d954SCole Faust#if defined(_OPENMP)
*c217d954SCole Faust    #pragma omp parallel for
*c217d954SCole Faust#endif /* _OPENMP */
*c217d954SCole Faust    for(unsigned int n = 0; n < N; ++n)
*c217d954SCole Faust    {
*c217d954SCole Faust        float xr = 0;
*c217d954SCole Faust        float xi = 0;
*c217d954SCole Faust        for(unsigned int k = 0; k < N; ++k)
*c217d954SCole Faust        {
*c217d954SCole Faust            const float alpha     = (2 * M_PI * k * n) / N;
*c217d954SCole Faust            const float cos_alpha = cos(alpha);
*c217d954SCole Faust            const float sin_alpha = sin(alpha);
*c217d954SCole Faust            const float val_r     = src_ptr[2 * k];
*c217d954SCole Faust            const float val_i     = src_ptr[2 * k + 1];
*c217d954SCole Faust
*c217d954SCole Faust            xr += val_r * cos_alpha - val_i * sin_alpha;
*c217d954SCole Faust            xi += val_i * cos_alpha + val_r * sin_alpha;
*c217d954SCole Faust        }
*c217d954SCole Faust
*c217d954SCole Faust        dst_ptr[2 * n]     = xr;
*c217d954SCole Faust        dst_ptr[2 * n + 1] = xi;
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole FaustSimpleTensor<T> rdft_1d_core(const SimpleTensor<T> &src, FFTDirection direction, bool is_odd)
*c217d954SCole Faust{
*c217d954SCole Faust    // Performs only rdft
*c217d954SCole Faust    ARM_COMPUTE_ERROR_ON(direction == FFTDirection::Forward && src.num_channels() != 1);
*c217d954SCole Faust    ARM_COMPUTE_ERROR_ON(direction == FFTDirection::Inverse && src.num_channels() != 2);
*c217d954SCole Faust
*c217d954SCole Faust    const unsigned int inverse_tail = is_odd ? 1 : 0;
*c217d954SCole Faust    const unsigned int N            = src.shape()[0];
*c217d954SCole Faust    const unsigned int K            = direction == FFTDirection::Forward ? N / 2 + 1 : (N - 1) * 2 + inverse_tail;
*c217d954SCole Faust    const unsigned int num_channels = direction == FFTDirection::Forward ? 2 : 1;
*c217d954SCole Faust
*c217d954SCole Faust    TensorShape dst_shape = src.shape();
*c217d954SCole Faust    dst_shape.set(0, K);
*c217d954SCole Faust
*c217d954SCole Faust    SimpleTensor<T> dst(dst_shape, src.data_type(), num_channels);
*c217d954SCole Faust
*c217d954SCole Faust    const unsigned int upper_dims = src.shape().total_size_upper(1);
*c217d954SCole Faust#if defined(_OPENMP)
*c217d954SCole Faust    #pragma omp parallel for
*c217d954SCole Faust#endif /* _OPENMP */
*c217d954SCole Faust    for(unsigned int du = 0; du < upper_dims; ++du)
*c217d954SCole Faust    {
*c217d954SCole Faust        const T *src_row_ptr = src.data() + du * N * src.num_channels();
*c217d954SCole Faust        T       *dst_row_ptr = dst.data() + du * K * dst.num_channels();
*c217d954SCole Faust        direction == FFTDirection::Forward ? rdft_1d_step(src_row_ptr, N, dst_row_ptr, K) : irdft_1d_step(src_row_ptr, N, dst_row_ptr, K);
*c217d954SCole Faust    }
*c217d954SCole Faust
*c217d954SCole Faust    return dst;
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole FaustSimpleTensor<T> dft_1d_core(const SimpleTensor<T> &src, FFTDirection direction)
*c217d954SCole Faust{
*c217d954SCole Faust    ARM_COMPUTE_ERROR_ON(src.num_channels() != 2);
*c217d954SCole Faust
*c217d954SCole Faust    const unsigned int N = src.shape()[0];
*c217d954SCole Faust
*c217d954SCole Faust    SimpleTensor<T> dst(src.shape(), src.data_type(), src.num_channels());
*c217d954SCole Faust
*c217d954SCole Faust    const unsigned int upper_dims = src.shape().total_size_upper(1);
*c217d954SCole Faust#if defined(_OPENMP)
*c217d954SCole Faust    #pragma omp parallel for
*c217d954SCole Faust#endif /* _OPENMP */
*c217d954SCole Faust    for(unsigned int du = 0; du < upper_dims; ++du)
*c217d954SCole Faust    {
*c217d954SCole Faust        const T *src_row_ptr = src.data() + du * N * src.num_channels();
*c217d954SCole Faust        T       *dst_row_ptr = dst.data() + du * N * dst.num_channels();
*c217d954SCole Faust        direction == FFTDirection::Forward ? dft_1d_step(src_row_ptr, dst_row_ptr, N) : idft_1d_step(src_row_ptr, dst_row_ptr, N);
*c217d954SCole Faust    }
*c217d954SCole Faust
*c217d954SCole Faust    return dst;
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faust/** Scale a tensor by a given scaling factor.
*c217d954SCole Faust *
*c217d954SCole Faust * @param[in,out] tensor         Tensor to scale.
*c217d954SCole Faust * @param[in]     scaling_factor Scaling to scale the tensor data with.
*c217d954SCole Faust */
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole Faustvoid scale(SimpleTensor<T> &tensor, T scaling_factor)
*c217d954SCole Faust{
*c217d954SCole Faust    const int total_elements = tensor.num_elements() * tensor.num_channels();
*c217d954SCole Faust    T        *data_ptr       = tensor.data();
*c217d954SCole Faust#if defined(_OPENMP)
*c217d954SCole Faust    #pragma omp parallel for
*c217d954SCole Faust#endif /* _OPENMP */
*c217d954SCole Faust    for(int i = 0; i < total_elements; ++i)
*c217d954SCole Faust    {
*c217d954SCole Faust        data_ptr[i] /= scaling_factor;
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faust/** Performs a complex element-wise multiplication with reduction across the channels axis.
*c217d954SCole Faust *
*c217d954SCole Faust * @param[in] input   Input tensor.
*c217d954SCole Faust * @param[in] weights Weights tensor.
*c217d954SCole Faust *
*c217d954SCole Faust * @return Output tensor.
*c217d954SCole Faust */
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole FaustSimpleTensor<T> complex_mul_and_reduce(const SimpleTensor<T> &input, const SimpleTensor<T> &weights)
*c217d954SCole Faust{
*c217d954SCole Faust    const uint32_t W  = input.shape().x();
*c217d954SCole Faust    const uint32_t H  = input.shape().y();
*c217d954SCole Faust    const uint32_t Ci = input.shape().z();
*c217d954SCole Faust    const uint32_t Co = weights.shape()[3];
*c217d954SCole Faust    const uint32_t N  = input.shape().total_size() / (W * H * Ci);
*c217d954SCole Faust
*c217d954SCole Faust    TensorShape output_shape = input.shape();
*c217d954SCole Faust    output_shape.set(2, Co);
*c217d954SCole Faust    SimpleTensor<T> dst(output_shape, input.data_type(), input.num_channels());
*c217d954SCole Faust
*c217d954SCole Faust    // dst memory to zero
*c217d954SCole Faust    const auto total_element_count = dst.num_channels() * dst.num_elements();
*c217d954SCole Faust    std::fill_n(dst.data(), total_element_count, 0);
*c217d954SCole Faust
*c217d954SCole Faust    for(uint32_t b = 0; b < N; ++b)
*c217d954SCole Faust    {
*c217d954SCole Faust        for(uint32_t co = 0; co < Co; ++co)
*c217d954SCole Faust        {
*c217d954SCole Faust            for(uint32_t ci = 0; ci < Ci; ++ci)
*c217d954SCole Faust            {
*c217d954SCole Faust                for(uint32_t h = 0; h < H; ++h)
*c217d954SCole Faust                {
*c217d954SCole Faust                    for(uint32_t w = 0; w < W; ++w)
*c217d954SCole Faust                    {
*c217d954SCole Faust                        const uint32_t    i_index  = w + h * W + ci * H * W + b * H * W * Ci;
*c217d954SCole Faust                        const uint32_t    w_index  = w + h * W + ci * H * W + co * H * W * Ci;
*c217d954SCole Faust                        const uint32_t    o_index  = w + h * W + co * H * W + b * H * W * Co;
*c217d954SCole Faust                        const Coordinates i_coords = index2coords(input.shape(), i_index);
*c217d954SCole Faust                        const Coordinates w_coords = index2coords(weights.shape(), w_index);
*c217d954SCole Faust                        const Coordinates o_coords = index2coords(dst.shape(), o_index);
*c217d954SCole Faust
*c217d954SCole Faust                        auto i_ptr = static_cast<const T *>(input(i_coords));
*c217d954SCole Faust                        auto w_ptr = static_cast<const T *>(weights(w_coords));
*c217d954SCole Faust                        auto o_ptr = static_cast<T *>(dst(o_coords));
*c217d954SCole Faust
*c217d954SCole Faust                        const T Rin = i_ptr[0];
*c217d954SCole Faust                        const T Iin = i_ptr[1];
*c217d954SCole Faust                        const T Rw  = w_ptr[0];
*c217d954SCole Faust                        const T Iw  = w_ptr[1];
*c217d954SCole Faust
*c217d954SCole Faust                        o_ptr[0] += Rin * Rw - Iin * Iw;
*c217d954SCole Faust                        o_ptr[1] += Rin * Iw + Rw * Iin;
*c217d954SCole Faust                    }
*c217d954SCole Faust                }
*c217d954SCole Faust            }
*c217d954SCole Faust        }
*c217d954SCole Faust    }
*c217d954SCole Faust    return dst;
*c217d954SCole Faust}
*c217d954SCole Faust} // namespace
*c217d954SCole Faust
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole FaustSimpleTensor<T> rdft_1d(const SimpleTensor<T> &src)
*c217d954SCole Faust{
*c217d954SCole Faust    return rdft_1d_core(src, FFTDirection::Forward, false);
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole FaustSimpleTensor<T> ridft_1d(const SimpleTensor<T> &src, bool is_odd)
*c217d954SCole Faust{
*c217d954SCole Faust    auto dst = rdft_1d_core(src, FFTDirection::Inverse, is_odd);
*c217d954SCole Faust
*c217d954SCole Faust    const T scaling_factor = T(dst.shape()[0]);
*c217d954SCole Faust    scale(dst, scaling_factor);
*c217d954SCole Faust
*c217d954SCole Faust    return dst;
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole FaustSimpleTensor<T> dft_1d(const SimpleTensor<T> &src, FFTDirection direction)
*c217d954SCole Faust{
*c217d954SCole Faust    auto dst = dft_1d_core(src, direction);
*c217d954SCole Faust    if(direction == FFTDirection::Inverse)
*c217d954SCole Faust    {
*c217d954SCole Faust        const T scaling_factor = T(dst.shape()[0]);
*c217d954SCole Faust        scale(dst, scaling_factor);
*c217d954SCole Faust    }
*c217d954SCole Faust    return dst;
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole FaustSimpleTensor<T> rdft_2d(const SimpleTensor<T> &src)
*c217d954SCole Faust{
*c217d954SCole Faust    ARM_COMPUTE_ERROR_ON(src.num_channels() != 1);
*c217d954SCole Faust    constexpr FFTDirection direction = FFTDirection::Forward;
*c217d954SCole Faust
*c217d954SCole Faust    auto first_pass  = rdft_1d_core(src, direction, false);
*c217d954SCole Faust    auto transposed  = permute(first_pass, PermutationVector(1U, 0U));
*c217d954SCole Faust    auto second_pass = dft_1d_core(transposed, direction);
*c217d954SCole Faust    return permute(second_pass, PermutationVector(1U, 0U));
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole FaustSimpleTensor<T> ridft_2d(const SimpleTensor<T> &src, bool is_odd)
*c217d954SCole Faust{
*c217d954SCole Faust    ARM_COMPUTE_ERROR_ON(src.num_channels() != 2);
*c217d954SCole Faust    constexpr FFTDirection direction = FFTDirection::Inverse;
*c217d954SCole Faust
*c217d954SCole Faust    auto transposed   = permute(src, PermutationVector(1U, 0U));
*c217d954SCole Faust    auto first_pass   = dft_1d_core(transposed, direction);
*c217d954SCole Faust    auto transposed_2 = permute(first_pass, PermutationVector(1U, 0U));
*c217d954SCole Faust    auto dst          = rdft_1d_core(transposed_2, direction, is_odd);
*c217d954SCole Faust
*c217d954SCole Faust    const T scaling_factor = T(dst.shape()[0] * dst.shape()[1]);
*c217d954SCole Faust    scale(dst, scaling_factor);
*c217d954SCole Faust    return dst;
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole FaustSimpleTensor<T> dft_2d(const SimpleTensor<T> &src, FFTDirection direction)
*c217d954SCole Faust{
*c217d954SCole Faust    ARM_COMPUTE_ERROR_ON(src.num_channels() != 2);
*c217d954SCole Faust
*c217d954SCole Faust    if(direction == FFTDirection::Forward)
*c217d954SCole Faust    {
*c217d954SCole Faust        auto first_pass  = dft_1d_core(src, direction);
*c217d954SCole Faust        auto transposed  = permute(first_pass, PermutationVector(1U, 0U));
*c217d954SCole Faust        auto second_pass = dft_1d_core(transposed, direction);
*c217d954SCole Faust        return permute(second_pass, PermutationVector(1U, 0U));
*c217d954SCole Faust    }
*c217d954SCole Faust    else
*c217d954SCole Faust    {
*c217d954SCole Faust        auto transposed   = permute(src, PermutationVector(1U, 0U));
*c217d954SCole Faust        auto first_pass   = dft_1d_core(transposed, direction);
*c217d954SCole Faust        auto transposed_2 = permute(first_pass, PermutationVector(1U, 0U));
*c217d954SCole Faust        auto dst          = dft_1d_core(transposed_2, direction);
*c217d954SCole Faust
*c217d954SCole Faust        const T scaling_factor = T(dst.shape()[0] * dst.shape()[1]);
*c217d954SCole Faust        scale(dst, scaling_factor);
*c217d954SCole Faust
*c217d954SCole Faust        return dst;
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <typename T>
*c217d954SCole FaustSimpleTensor<T> conv2d_dft(const SimpleTensor<T> &src, const SimpleTensor<T> &w, const PadStrideInfo &conv_info)
*c217d954SCole Faust{
*c217d954SCole Faust    // Pad input to full padding
*c217d954SCole Faust    const PaddingList padding_in = { { 0, w.shape()[0] - 1 }, { 0, w.shape()[1] - 1 } };
*c217d954SCole Faust    auto              padded_src = pad_layer(src, padding_in);
*c217d954SCole Faust
*c217d954SCole Faust    // Flip weights
*c217d954SCole Faust    std::vector<uint32_t>  axis_v = { 0, 1 };
*c217d954SCole Faust    SimpleTensor<uint32_t> axis{ TensorShape(2U), DataType::U32 };
*c217d954SCole Faust    std::copy(axis_v.begin(), axis_v.begin() + axis.shape().x(), axis.data());
*c217d954SCole Faust    auto flipped_w = reverse(w, axis);
*c217d954SCole Faust
*c217d954SCole Faust    // Pad weights to have the same size as input
*c217d954SCole Faust    const PaddingList paddings_w = { { 0, src.shape()[0] - 1 }, { 0, src.shape()[1] - 1 } };
*c217d954SCole Faust    auto              padded_w   = pad_layer(flipped_w, paddings_w);
*c217d954SCole Faust
*c217d954SCole Faust    // Transform input and weights to frequency domain
*c217d954SCole Faust    auto Fsrc = rdft_2d(padded_src);
*c217d954SCole Faust    auto Fw   = rdft_2d(padded_w);
*c217d954SCole Faust
*c217d954SCole Faust    // Perform dot product
*c217d954SCole Faust    auto Fdst = complex_mul_and_reduce(Fsrc, Fw);
*c217d954SCole Faust
*c217d954SCole Faust    // Transform output back to frequency domain
*c217d954SCole Faust    auto conv_res = ridft_2d(Fdst);
*c217d954SCole Faust
*c217d954SCole Faust    // Slice output
*c217d954SCole Faust    const int start_left = w.shape().x() - conv_info.pad_left() - 1;
*c217d954SCole Faust    const int start_top  = w.shape().y() - conv_info.pad_top() - 1;
*c217d954SCole Faust    const int end_right  = conv_res.shape().x() - (w.shape().x() - conv_info.pad_right() - 1);
*c217d954SCole Faust    const int end_botton = conv_res.shape().y() - (w.shape().y() - conv_info.pad_bottom() - 1);
*c217d954SCole Faust    return slice(conv_res, Coordinates(start_left, start_top), Coordinates(end_right, end_botton));
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faust// FP32
*c217d954SCole Fausttemplate SimpleTensor<float> rdft_1d(const SimpleTensor<float> &src);
*c217d954SCole Fausttemplate SimpleTensor<float> ridft_1d(const SimpleTensor<float> &src, bool is_odd);
*c217d954SCole Fausttemplate SimpleTensor<float> dft_1d(const SimpleTensor<float> &src, FFTDirection direction);
*c217d954SCole Faust
*c217d954SCole Fausttemplate SimpleTensor<float> rdft_2d(const SimpleTensor<float> &src);
*c217d954SCole Fausttemplate SimpleTensor<float> ridft_2d(const SimpleTensor<float> &src, bool is_odd);
*c217d954SCole Fausttemplate SimpleTensor<float> dft_2d(const SimpleTensor<float> &src, FFTDirection direction);
*c217d954SCole Faust
*c217d954SCole Fausttemplate SimpleTensor<float> conv2d_dft(const SimpleTensor<float> &src, const SimpleTensor<float> &w, const PadStrideInfo &conv_info);
*c217d954SCole Faust
*c217d954SCole Faust// FP16
*c217d954SCole Fausttemplate SimpleTensor<half> rdft_1d(const SimpleTensor<half> &src);
*c217d954SCole Fausttemplate SimpleTensor<half> ridft_1d(const SimpleTensor<half> &src, bool is_odd);
*c217d954SCole Fausttemplate SimpleTensor<half> dft_1d(const SimpleTensor<half> &src, FFTDirection direction);
*c217d954SCole Faust
*c217d954SCole Fausttemplate SimpleTensor<half> rdft_2d(const SimpleTensor<half> &src);
*c217d954SCole Fausttemplate SimpleTensor<half> ridft_2d(const SimpleTensor<half> &src, bool is_odd);
*c217d954SCole Fausttemplate SimpleTensor<half> dft_2d(const SimpleTensor<half> &src, FFTDirection direction);
*c217d954SCole Faust
*c217d954SCole Fausttemplate SimpleTensor<half> conv2d_dft(const SimpleTensor<half> &src, const SimpleTensor<half> &w, const PadStrideInfo &conv_info);
*c217d954SCole Faust} // namespace reference
*c217d954SCole Faust} // namespace validation
*c217d954SCole Faust} // namespace test
*c217d954SCole Faust} // namespace arm_compute