libopus/src/mlp.c

*a58d3d2aSXin Li/* Copyright (c) 2008-2011 Octasic Inc.
*a58d3d2aSXin Li                 2012-2017 Jean-Marc Valin */
*a58d3d2aSXin Li/*
*a58d3d2aSXin Li   Redistribution and use in source and binary forms, with or without
*a58d3d2aSXin Li   modification, are permitted provided that the following conditions
*a58d3d2aSXin Li   are met:
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions of source code must retain the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Li   documentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*a58d3d2aSXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*a58d3d2aSXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*a58d3d2aSXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR
*a58d3d2aSXin Li   CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*a58d3d2aSXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*a58d3d2aSXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*a58d3d2aSXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*a58d3d2aSXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*a58d3d2aSXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*a58d3d2aSXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef HAVE_CONFIG_H
*a58d3d2aSXin Li#include "config.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include <math.h>
*a58d3d2aSXin Li#include "opus_types.h"
*a58d3d2aSXin Li#include "opus_defines.h"
*a58d3d2aSXin Li#include "arch.h"
*a58d3d2aSXin Li#include "mlp.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define fmadd(a, b, c) ((a)*(b)+(c))
*a58d3d2aSXin Listatic OPUS_INLINE float tansig_approx(float x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    const float N0 = 952.52801514f;
*a58d3d2aSXin Li    const float N1 = 96.39235687f;
*a58d3d2aSXin Li    const float N2 = 0.60863042f;
*a58d3d2aSXin Li    const float D0 = 952.72399902f;
*a58d3d2aSXin Li    const float D1 = 413.36801147f;
*a58d3d2aSXin Li    const float D2 = 11.88600922f;
*a58d3d2aSXin Li    float X2, num, den;
*a58d3d2aSXin Li    X2 = x*x;
*a58d3d2aSXin Li    num = fmadd(fmadd(N2, X2, N1), X2, N0);
*a58d3d2aSXin Li    den = fmadd(fmadd(D2, X2, D1), X2, D0);
*a58d3d2aSXin Li    num = num*x/den;
*a58d3d2aSXin Li    return MAX32(-1.f, MIN32(1.f, num));
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic OPUS_INLINE float sigmoid_approx(float x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   return .5f + .5f*tansig_approx(.5f*x);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void gemm_accum(float *out, const opus_int8 *weights, int rows, int cols, int col_stride, const float *x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i, j;
*a58d3d2aSXin Li   for (i=0;i<rows;i++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      for (j=0;j<cols;j++)
*a58d3d2aSXin Li         out[i] += weights[j*col_stride + i]*x[j];
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid analysis_compute_dense(const AnalysisDenseLayer *layer, float *output, const float *input)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   int N, M;
*a58d3d2aSXin Li   int stride;
*a58d3d2aSXin Li   M = layer->nb_inputs;
*a58d3d2aSXin Li   N = layer->nb_neurons;
*a58d3d2aSXin Li   stride = N;
*a58d3d2aSXin Li   for (i=0;i<N;i++)
*a58d3d2aSXin Li      output[i] = layer->bias[i];
*a58d3d2aSXin Li   gemm_accum(output, layer->input_weights, N, M, stride, input);
*a58d3d2aSXin Li   for (i=0;i<N;i++)
*a58d3d2aSXin Li      output[i] *= WEIGHTS_SCALE;
*a58d3d2aSXin Li   if (layer->sigmoid) {
*a58d3d2aSXin Li      for (i=0;i<N;i++)
*a58d3d2aSXin Li         output[i] = sigmoid_approx(output[i]);
*a58d3d2aSXin Li   } else {
*a58d3d2aSXin Li      for (i=0;i<N;i++)
*a58d3d2aSXin Li         output[i] = tansig_approx(output[i]);
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid analysis_compute_gru(const AnalysisGRULayer *gru, float *state, const float *input)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   int N, M;
*a58d3d2aSXin Li   int stride;
*a58d3d2aSXin Li   float tmp[MAX_NEURONS];
*a58d3d2aSXin Li   float z[MAX_NEURONS];
*a58d3d2aSXin Li   float r[MAX_NEURONS];
*a58d3d2aSXin Li   float h[MAX_NEURONS];
*a58d3d2aSXin Li   M = gru->nb_inputs;
*a58d3d2aSXin Li   N = gru->nb_neurons;
*a58d3d2aSXin Li   stride = 3*N;
*a58d3d2aSXin Li   /* Compute update gate. */
*a58d3d2aSXin Li   for (i=0;i<N;i++)
*a58d3d2aSXin Li      z[i] = gru->bias[i];
*a58d3d2aSXin Li   gemm_accum(z, gru->input_weights, N, M, stride, input);
*a58d3d2aSXin Li   gemm_accum(z, gru->recurrent_weights, N, N, stride, state);
*a58d3d2aSXin Li   for (i=0;i<N;i++)
*a58d3d2aSXin Li      z[i] = sigmoid_approx(WEIGHTS_SCALE*z[i]);
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* Compute reset gate. */
*a58d3d2aSXin Li   for (i=0;i<N;i++)
*a58d3d2aSXin Li      r[i] = gru->bias[N + i];
*a58d3d2aSXin Li   gemm_accum(r, &gru->input_weights[N], N, M, stride, input);
*a58d3d2aSXin Li   gemm_accum(r, &gru->recurrent_weights[N], N, N, stride, state);
*a58d3d2aSXin Li   for (i=0;i<N;i++)
*a58d3d2aSXin Li      r[i] = sigmoid_approx(WEIGHTS_SCALE*r[i]);
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* Compute output. */
*a58d3d2aSXin Li   for (i=0;i<N;i++)
*a58d3d2aSXin Li      h[i] = gru->bias[2*N + i];
*a58d3d2aSXin Li   for (i=0;i<N;i++)
*a58d3d2aSXin Li      tmp[i] = state[i] * r[i];
*a58d3d2aSXin Li   gemm_accum(h, &gru->input_weights[2*N], N, M, stride, input);
*a58d3d2aSXin Li   gemm_accum(h, &gru->recurrent_weights[2*N], N, N, stride, tmp);
*a58d3d2aSXin Li   for (i=0;i<N;i++)
*a58d3d2aSXin Li      h[i] = z[i]*state[i] + (1-z[i])*tansig_approx(WEIGHTS_SCALE*h[i]);
*a58d3d2aSXin Li   for (i=0;i<N;i++)
*a58d3d2aSXin Li      state[i] = h[i];
*a58d3d2aSXin Li}
*a58d3d2aSXin Li