libopus/dnn/nnet.c

*a58d3d2aSXin Li/* Copyright (c) 2018 Mozilla
*a58d3d2aSXin Li                 2008-2011 Octasic Inc.
*a58d3d2aSXin Li                 2012-2017 Jean-Marc Valin */
*a58d3d2aSXin Li/*
*a58d3d2aSXin Li   Redistribution and use in source and binary forms, with or without
*a58d3d2aSXin Li   modification, are permitted provided that the following conditions
*a58d3d2aSXin Li   are met:
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions of source code must retain the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Li   documentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*a58d3d2aSXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*a58d3d2aSXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*a58d3d2aSXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR
*a58d3d2aSXin Li   CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*a58d3d2aSXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*a58d3d2aSXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*a58d3d2aSXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*a58d3d2aSXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*a58d3d2aSXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*a58d3d2aSXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef HAVE_CONFIG_H
*a58d3d2aSXin Li#include "config.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include <stdlib.h>
*a58d3d2aSXin Li#include <math.h>
*a58d3d2aSXin Li#include "opus_types.h"
*a58d3d2aSXin Li#include "arch.h"
*a58d3d2aSXin Li#include "nnet.h"
*a58d3d2aSXin Li#include "dred_rdovae_constants.h"
*a58d3d2aSXin Li#include "plc_data.h"
*a58d3d2aSXin Li#include "fargan.h"
*a58d3d2aSXin Li#include "os_support.h"
*a58d3d2aSXin Li#include "vec.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef ENABLE_OSCE
*a58d3d2aSXin Li#include "osce.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef NO_OPTIMIZATIONS
*a58d3d2aSXin Li#if defined(_MSC_VER)
*a58d3d2aSXin Li#pragma message ("Compiling without any vectorization. This code will be very slow")
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#warning Compiling without any vectorization. This code will be very slow
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define SOFTMAX_HACK
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid compute_generic_dense(const LinearLayer *layer, float *output, const float *input, int activation, int arch)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   compute_linear(layer, output, input, arch);
*a58d3d2aSXin Li   compute_activation(output, output, layer->nb_outputs, activation, arch);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef ENABLE_OSCE
*a58d3d2aSXin Li#define MAX_RNN_NEURONS_ALL IMAX(IMAX(IMAX(FARGAN_MAX_RNN_NEURONS, PLC_MAX_RNN_UNITS), DRED_MAX_RNN_NEURONS), OSCE_MAX_RNN_NEURONS)
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define MAX_RNN_NEURONS_ALL IMAX(IMAX(FARGAN_MAX_RNN_NEURONS, PLC_MAX_RNN_UNITS), DRED_MAX_RNN_NEURONS)
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid compute_generic_gru(const LinearLayer *input_weights, const LinearLayer *recurrent_weights, float *state, const float *in, int arch)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li  int i;
*a58d3d2aSXin Li  int N;
*a58d3d2aSXin Li  float zrh[3*MAX_RNN_NEURONS_ALL];
*a58d3d2aSXin Li  float recur[3*MAX_RNN_NEURONS_ALL];
*a58d3d2aSXin Li  float *z;
*a58d3d2aSXin Li  float *r;
*a58d3d2aSXin Li  float *h;
*a58d3d2aSXin Li  celt_assert(3*recurrent_weights->nb_inputs == recurrent_weights->nb_outputs);
*a58d3d2aSXin Li  celt_assert(input_weights->nb_outputs == recurrent_weights->nb_outputs);
*a58d3d2aSXin Li  N = recurrent_weights->nb_inputs;
*a58d3d2aSXin Li  z = zrh;
*a58d3d2aSXin Li  r = &zrh[N];
*a58d3d2aSXin Li  h = &zrh[2*N];
*a58d3d2aSXin Li  celt_assert(recurrent_weights->nb_outputs <= 3*MAX_RNN_NEURONS_ALL);
*a58d3d2aSXin Li  celt_assert(in != state);
*a58d3d2aSXin Li  compute_linear(input_weights, zrh, in, arch);
*a58d3d2aSXin Li  compute_linear(recurrent_weights, recur, state, arch);
*a58d3d2aSXin Li  for (i=0;i<2*N;i++)
*a58d3d2aSXin Li     zrh[i] += recur[i];
*a58d3d2aSXin Li  compute_activation(zrh, zrh, 2*N, ACTIVATION_SIGMOID, arch);
*a58d3d2aSXin Li  for (i=0;i<N;i++)
*a58d3d2aSXin Li     h[i] += recur[2*N+i]*r[i];
*a58d3d2aSXin Li  compute_activation(h, h, N, ACTIVATION_TANH, arch);
*a58d3d2aSXin Li  for (i=0;i<N;i++)
*a58d3d2aSXin Li     h[i] = z[i]*state[i] + (1-z[i])*h[i];
*a58d3d2aSXin Li  for (i=0;i<N;i++)
*a58d3d2aSXin Li     state[i] = h[i];
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid compute_glu(const LinearLayer *layer, float *output, const float *input, int arch)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   float act2[MAX_INPUTS];
*a58d3d2aSXin Li   celt_assert(layer->nb_inputs == layer->nb_outputs);
*a58d3d2aSXin Li   compute_linear(layer, act2, input, arch);
*a58d3d2aSXin Li   compute_activation(act2, act2, layer->nb_outputs, ACTIVATION_SIGMOID, arch);
*a58d3d2aSXin Li   if (input == output) {
*a58d3d2aSXin Li     /* Give a vectorization hint to the compiler for the in-place case. */
*a58d3d2aSXin Li     for (i=0;i<layer->nb_outputs;i++) output[i] = output[i]*act2[i];
*a58d3d2aSXin Li   } else {
*a58d3d2aSXin Li     for (i=0;i<layer->nb_outputs;i++) output[i] = input[i]*act2[i];
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define MAX_CONV_INPUTS_ALL DRED_MAX_CONV_INPUTS
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid compute_generic_conv1d(const LinearLayer *layer, float *output, float *mem, const float *input, int input_size, int activation, int arch)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   float tmp[MAX_CONV_INPUTS_ALL];
*a58d3d2aSXin Li   celt_assert(input != output);
*a58d3d2aSXin Li   celt_assert(layer->nb_inputs <= MAX_CONV_INPUTS_ALL);
*a58d3d2aSXin Li   if (layer->nb_inputs!=input_size) OPUS_COPY(tmp, mem, layer->nb_inputs-input_size);
*a58d3d2aSXin Li   OPUS_COPY(&tmp[layer->nb_inputs-input_size], input, input_size);
*a58d3d2aSXin Li   compute_linear(layer, output, tmp, arch);
*a58d3d2aSXin Li   compute_activation(output, output, layer->nb_outputs, activation, arch);
*a58d3d2aSXin Li   if (layer->nb_inputs!=input_size) OPUS_COPY(mem, &tmp[input_size], layer->nb_inputs-input_size);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid compute_generic_conv1d_dilation(const LinearLayer *layer, float *output, float *mem, const float *input, int input_size, int dilation, int activation, int arch)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   float tmp[MAX_CONV_INPUTS_ALL];
*a58d3d2aSXin Li   int ksize = layer->nb_inputs/input_size;
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   celt_assert(input != output);
*a58d3d2aSXin Li   celt_assert(layer->nb_inputs <= MAX_CONV_INPUTS_ALL);
*a58d3d2aSXin Li   if (dilation==1) OPUS_COPY(tmp, mem, layer->nb_inputs-input_size);
*a58d3d2aSXin Li   else for (i=0;i<ksize-1;i++) OPUS_COPY(&tmp[i*input_size], &mem[i*input_size*dilation], input_size);
*a58d3d2aSXin Li   OPUS_COPY(&tmp[layer->nb_inputs-input_size], input, input_size);
*a58d3d2aSXin Li   compute_linear(layer, output, tmp, arch);
*a58d3d2aSXin Li   compute_activation(output, output, layer->nb_outputs, activation, arch);
*a58d3d2aSXin Li   if (dilation==1) OPUS_COPY(mem, &tmp[input_size], layer->nb_inputs-input_size);
*a58d3d2aSXin Li   else {
*a58d3d2aSXin Li     OPUS_COPY(mem, &mem[input_size], input_size*dilation*(ksize-1)-input_size);
*a58d3d2aSXin Li     OPUS_COPY(&mem[input_size*dilation*(ksize-1)-input_size], input, input_size);
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li}