libopus/dnn/fwgan.c

*a58d3d2aSXin Li/* Copyright (c) 2023 Amazon */
*a58d3d2aSXin Li/*
*a58d3d2aSXin Li   Redistribution and use in source and binary forms, with or without
*a58d3d2aSXin Li   modification, are permitted provided that the following conditions
*a58d3d2aSXin Li   are met:
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions of source code must retain the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Li   documentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*a58d3d2aSXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*a58d3d2aSXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*a58d3d2aSXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER
*a58d3d2aSXin Li   OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*a58d3d2aSXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*a58d3d2aSXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*a58d3d2aSXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*a58d3d2aSXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*a58d3d2aSXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*a58d3d2aSXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef HAVE_CONFIG_H
*a58d3d2aSXin Li#include "config.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include "fwgan.h"
*a58d3d2aSXin Li#include "os_support.h"
*a58d3d2aSXin Li#include "freq.h"
*a58d3d2aSXin Li#include "fwgan_data.h"
*a58d3d2aSXin Li#include "lpcnet.h"
*a58d3d2aSXin Li#include "pitch.h"
*a58d3d2aSXin Li#include "nnet.h"
*a58d3d2aSXin Li#include "lpcnet_private.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define FEAT_IN_SIZE (BFCC_WITH_CORR_UPSAMPLER_FC_OUT_SIZE/4 + FWGAN_FRAME_SIZE/2)
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define FWGAN_FEATURES (NB_FEATURES-1)
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void pitch_embeddings(float *pembed, float *phase, double w0) {
*a58d3d2aSXin Li  int i;
*a58d3d2aSXin Li  float wreal, wimag;
*a58d3d2aSXin Li#if 1
*a58d3d2aSXin Li  /* This Taylor expansion should be good enough since w0 is always small. */
*a58d3d2aSXin Li  float w2 = w0*w0;
*a58d3d2aSXin Li  wreal = 1 - .5*w2*(1.f - 0.083333333f*w2);
*a58d3d2aSXin Li  wimag = w0*(1 - 0.166666667f*w2*(1.f - 0.05f*w2));
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li  wreal = cos(w0);
*a58d3d2aSXin Li  wimag = sin(w0);
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li  /* Speed-up phase reference by making phase a unit-norm complex value and rotating it
*a58d3d2aSXin Li     by exp(-i*w0) each sample.  */
*a58d3d2aSXin Li  for (i=0;i<SUBFRAME_SIZE;i++) {
*a58d3d2aSXin Li    float tmp;
*a58d3d2aSXin Li    tmp = phase[0]*wreal - phase[1]*wimag;
*a58d3d2aSXin Li    phase[1] = phase[0]*wimag + phase[1]*wreal;
*a58d3d2aSXin Li    phase[0] = tmp;
*a58d3d2aSXin Li    pembed[i] = phase[1];
*a58d3d2aSXin Li    pembed[SUBFRAME_SIZE+i] = phase[0];
*a58d3d2aSXin Li  }
*a58d3d2aSXin Li  /* Renormalize once per sub-frame, though we could probably do it even less frequently. */
*a58d3d2aSXin Li  {
*a58d3d2aSXin Li    float r = 1.f/sqrt(phase[0]*phase[0] + phase[1]*phase[1]);
*a58d3d2aSXin Li    phase[0] *= r;
*a58d3d2aSXin Li    phase[1] *= r;
*a58d3d2aSXin Li  }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void compute_wlpc(float lpc[LPC_ORDER], const float *features) {
*a58d3d2aSXin Li  float lpc_weight;
*a58d3d2aSXin Li  int i;
*a58d3d2aSXin Li  lpc_from_cepstrum(lpc, features);
*a58d3d2aSXin Li  lpc_weight = 1.f;
*a58d3d2aSXin Li  for (i=0;i<LPC_ORDER;i++) {
*a58d3d2aSXin Li    lpc_weight *= FWGAN_GAMMA;
*a58d3d2aSXin Li    lpc[i] *= lpc_weight;
*a58d3d2aSXin Li  }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void run_fwgan_upsampler(FWGANState *st, float *cond, const float *features)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li  FWGAN *model;
*a58d3d2aSXin Li  model = &st->model;
*a58d3d2aSXin Li  celt_assert(FWGAN_FEATURES == model->bfcc_with_corr_upsampler_fc.nb_inputs);
*a58d3d2aSXin Li  celt_assert(BFCC_WITH_CORR_UPSAMPLER_FC_OUT_SIZE == model->bfcc_with_corr_upsampler_fc.nb_outputs);
*a58d3d2aSXin Li  compute_generic_dense(&model->bfcc_with_corr_upsampler_fc, cond, features, ACTIVATION_TANH);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void fwgan_synthesize_impl(FWGANState *st, float *pcm, const float *lpc, const float *features);
*a58d3d2aSXin Livoid fwgan_cont(FWGANState *st, const float *pcm0, const float *features0)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li  int i;
*a58d3d2aSXin Li  float norm2, norm_1;
*a58d3d2aSXin Li  float wpcm0[CONT_PCM_INPUTS];
*a58d3d2aSXin Li  float cont_inputs[CONT_PCM_INPUTS+1];
*a58d3d2aSXin Li  float tmp1[MAX_CONT_SIZE];
*a58d3d2aSXin Li  float tmp2[MAX_CONT_SIZE];
*a58d3d2aSXin Li  float lpc[LPC_ORDER];
*a58d3d2aSXin Li  float new_pcm[FWGAN_FRAME_SIZE];
*a58d3d2aSXin Li  FWGAN *model;
*a58d3d2aSXin Li  st->embed_phase[0] = 1;
*a58d3d2aSXin Li  model = &st->model;
*a58d3d2aSXin Li  compute_wlpc(lpc, features0);
*a58d3d2aSXin Li  /* Deemphasis memory is just the last continuation sample. */
*a58d3d2aSXin Li  st->deemph_mem = pcm0[CONT_PCM_INPUTS-1];
*a58d3d2aSXin Li
*a58d3d2aSXin Li  /* Apply analysis filter, considering that the preemphasis and deemphasis filter
*a58d3d2aSXin Li     cancel each other in this case since the LPC filter is constant across that boundary.
*a58d3d2aSXin Li     */
*a58d3d2aSXin Li  for (i=LPC_ORDER;i<CONT_PCM_INPUTS;i++) {
*a58d3d2aSXin Li    int j;
*a58d3d2aSXin Li    wpcm0[i] = pcm0[i];
*a58d3d2aSXin Li    for (j=0;j<LPC_ORDER;j++) wpcm0[i] += lpc[j]*pcm0[i-j-1];
*a58d3d2aSXin Li  }
*a58d3d2aSXin Li  /* FIXME: Make this less stupid. */
*a58d3d2aSXin Li  for (i=0;i<LPC_ORDER;i++) wpcm0[i] = wpcm0[LPC_ORDER];
*a58d3d2aSXin Li
*a58d3d2aSXin Li  /* The memory of the pre-empahsis is the last sample of the weighted signal
*a58d3d2aSXin Li     (ignoring preemphasis+deemphasis combination). */
*a58d3d2aSXin Li  st->preemph_mem = wpcm0[CONT_PCM_INPUTS-1];
*a58d3d2aSXin Li  /* The memory of the synthesis filter is the pre-emphasized continuation. */
*a58d3d2aSXin Li  for (i=0;i<LPC_ORDER;i++) st->syn_mem[i] = pcm0[CONT_PCM_INPUTS-1-i] - FWGAN_DEEMPHASIS*pcm0[CONT_PCM_INPUTS-2-i];
*a58d3d2aSXin Li
*a58d3d2aSXin Li  norm2 = celt_inner_prod(wpcm0, wpcm0, CONT_PCM_INPUTS, st->arch);
*a58d3d2aSXin Li  norm_1 = 1.f/sqrt(1e-8f + norm2);
*a58d3d2aSXin Li  for (i=0;i<CONT_PCM_INPUTS;i++) cont_inputs[i+1] = norm_1*wpcm0[i];
*a58d3d2aSXin Li  cont_inputs[0] = log(sqrt(norm2) + 1e-7f);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  /* Continuation network */
*a58d3d2aSXin Li  compute_generic_dense(&model->cont_net_0, tmp1, cont_inputs, ACTIVATION_TANH);
*a58d3d2aSXin Li  compute_generic_dense(&model->cont_net_2, tmp2, tmp1, ACTIVATION_TANH);
*a58d3d2aSXin Li  compute_generic_dense(&model->cont_net_4, tmp1, tmp2, ACTIVATION_TANH);
*a58d3d2aSXin Li  compute_generic_dense(&model->cont_net_6, tmp2, tmp1, ACTIVATION_TANH);
*a58d3d2aSXin Li  compute_generic_dense(&model->cont_net_8, tmp1, tmp2, ACTIVATION_TANH);
*a58d3d2aSXin Li  celt_assert(CONT_NET_10_OUT_SIZE == model->cont_net_10.nb_outputs);
*a58d3d2aSXin Li  compute_generic_dense(&model->cont_net_10, st->cont, tmp1, ACTIVATION_TANH);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  /* Computing continuation for each layer. */
*a58d3d2aSXin Li  celt_assert(RNN_GRU_STATE_SIZE == model->rnn_cont_fc_0.nb_outputs);
*a58d3d2aSXin Li  compute_generic_dense(&model->rnn_cont_fc_0, st->rnn_state, st->cont, ACTIVATION_TANH);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  celt_assert(FWC1_STATE_SIZE == model->fwc1_cont_fc_0.nb_outputs);
*a58d3d2aSXin Li  compute_generic_dense(&model->fwc1_cont_fc_0, st->fwc1_state, st->cont, ACTIVATION_TANH);
*a58d3d2aSXin Li  celt_assert(FWC2_STATE_SIZE == model->fwc2_cont_fc_0.nb_outputs);
*a58d3d2aSXin Li  compute_generic_dense(&model->fwc2_cont_fc_0, st->fwc2_state, st->cont, ACTIVATION_TANH);
*a58d3d2aSXin Li  celt_assert(FWC3_STATE_SIZE == model->fwc3_cont_fc_0.nb_outputs);
*a58d3d2aSXin Li  compute_generic_dense(&model->fwc3_cont_fc_0, st->fwc3_state, st->cont, ACTIVATION_TANH);
*a58d3d2aSXin Li  celt_assert(FWC4_STATE_SIZE == model->fwc4_cont_fc_0.nb_outputs);
*a58d3d2aSXin Li  compute_generic_dense(&model->fwc4_cont_fc_0, st->fwc4_state, st->cont, ACTIVATION_TANH);
*a58d3d2aSXin Li  celt_assert(FWC5_STATE_SIZE == model->fwc5_cont_fc_0.nb_outputs);
*a58d3d2aSXin Li  compute_generic_dense(&model->fwc5_cont_fc_0, st->fwc5_state, st->cont, ACTIVATION_TANH);
*a58d3d2aSXin Li  celt_assert(FWC6_STATE_SIZE == model->fwc6_cont_fc_0.nb_outputs);
*a58d3d2aSXin Li  compute_generic_dense(&model->fwc6_cont_fc_0, st->fwc6_state, st->cont, ACTIVATION_TANH);
*a58d3d2aSXin Li  celt_assert(FWC7_STATE_SIZE == model->fwc7_cont_fc_0.nb_outputs);
*a58d3d2aSXin Li  compute_generic_dense(&model->fwc7_cont_fc_0, st->fwc7_state, st->cont, ACTIVATION_TANH);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  st->cont_initialized = 1;
*a58d3d2aSXin Li  /* Process the first frame, discard the first subframe, and keep the rest for the first
*a58d3d2aSXin Li     synthesis call. */
*a58d3d2aSXin Li  fwgan_synthesize_impl(st, new_pcm, lpc, features0);
*a58d3d2aSXin Li  OPUS_COPY(st->pcm_buf, &new_pcm[SUBFRAME_SIZE], FWGAN_FRAME_SIZE-SUBFRAME_SIZE);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void apply_gain(float *pcm, float c0, float *last_gain) {
*a58d3d2aSXin Li  int i;
*a58d3d2aSXin Li  float gain = pow(10.f, (0.5f*c0/sqrt(18.f)));
*a58d3d2aSXin Li  for (i=0;i<SUBFRAME_SIZE;i++) pcm[i] *= *last_gain;
*a58d3d2aSXin Li  *last_gain = gain;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void fwgan_lpc_syn(float *pcm, float *mem, const float *lpc, float last_lpc[LPC_ORDER]) {
*a58d3d2aSXin Li  int i;
*a58d3d2aSXin Li  for (i=0;i<SUBFRAME_SIZE;i++) {
*a58d3d2aSXin Li    int j;
*a58d3d2aSXin Li    for (j=0;j<LPC_ORDER;j++) pcm[i] -= mem[j]*last_lpc[j];
*a58d3d2aSXin Li    OPUS_MOVE(&mem[1], &mem[0], LPC_ORDER-1);
*a58d3d2aSXin Li    mem[0] = pcm[i];
*a58d3d2aSXin Li  }
*a58d3d2aSXin Li  OPUS_COPY(last_lpc, lpc, LPC_ORDER);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void fwgan_preemphasis(float *pcm, float *preemph_mem) {
*a58d3d2aSXin Li  int i;
*a58d3d2aSXin Li  for (i=0;i<SUBFRAME_SIZE;i++) {
*a58d3d2aSXin Li    float tmp = pcm[i];
*a58d3d2aSXin Li    pcm[i] -= FWGAN_DEEMPHASIS * *preemph_mem;
*a58d3d2aSXin Li    *preemph_mem = tmp;
*a58d3d2aSXin Li  }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void fwgan_deemphasis(float *pcm, float *deemph_mem) {
*a58d3d2aSXin Li  int i;
*a58d3d2aSXin Li  for (i=0;i<SUBFRAME_SIZE;i++) {
*a58d3d2aSXin Li    pcm[i] += FWGAN_DEEMPHASIS * *deemph_mem;
*a58d3d2aSXin Li    *deemph_mem = pcm[i];
*a58d3d2aSXin Li  }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void run_fwgan_subframe(FWGANState *st, float *pcm, const float *cond, double w0, const float *lpc, float c0)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li  float tmp1[FWC1_FC_0_OUT_SIZE];
*a58d3d2aSXin Li  float tmp2[IMAX(RNN_GRU_STATE_SIZE, FWC2_FC_0_OUT_SIZE)];
*a58d3d2aSXin Li  float feat_in[FEAT_IN_SIZE];
*a58d3d2aSXin Li  float rnn_in[FEAT_IN_CONV1_CONV_OUT_SIZE];
*a58d3d2aSXin Li  float pembed[FWGAN_FRAME_SIZE/2];
*a58d3d2aSXin Li  FWGAN *model;
*a58d3d2aSXin Li  model = &st->model;
*a58d3d2aSXin Li
*a58d3d2aSXin Li  pitch_embeddings(pembed, st->embed_phase, w0);
*a58d3d2aSXin Li  /* Interleave bfcc_cond and pembed for each subframe in feat_in. */
*a58d3d2aSXin Li  OPUS_COPY(&feat_in[BFCC_WITH_CORR_UPSAMPLER_FC_OUT_SIZE/4], &cond[0], BFCC_WITH_CORR_UPSAMPLER_FC_OUT_SIZE/4);
*a58d3d2aSXin Li  OPUS_COPY(&feat_in[0], &pembed[0], FWGAN_FRAME_SIZE/2);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  compute_generic_conv1d(&model->feat_in_conv1_conv, rnn_in, st->cont_conv1_mem, feat_in, FEAT_IN_CONV1_CONV_IN_SIZE, ACTIVATION_LINEAR);
*a58d3d2aSXin Li  celt_assert(FEAT_IN_NL1_GATE_OUT_SIZE == model->feat_in_nl1_gate.nb_outputs);
*a58d3d2aSXin Li  compute_gated_activation(&model->feat_in_nl1_gate, rnn_in, rnn_in, ACTIVATION_TANH);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  if (st->cont_initialized == 1) {
*a58d3d2aSXin Li    /* On the very first subframe we stop here. We only want to run the feat_in layer since the
*a58d3d2aSXin Li       others are initialized via the continuation network. */
*a58d3d2aSXin Li    OPUS_CLEAR(pcm, SUBFRAME_SIZE);
*a58d3d2aSXin Li    st->cont_initialized = 2;
*a58d3d2aSXin Li    apply_gain(pcm, c0, &st->last_gain);
*a58d3d2aSXin Li    OPUS_COPY(st->last_lpc, lpc, LPC_ORDER);
*a58d3d2aSXin Li    return;
*a58d3d2aSXin Li  }
*a58d3d2aSXin Li
*a58d3d2aSXin Li  compute_generic_gru(&model->rnn_gru_input, &model->rnn_gru_recurrent, st->rnn_state, rnn_in);
*a58d3d2aSXin Li  celt_assert(IMAX(RNN_GRU_STATE_SIZE, FWC2_FC_0_OUT_SIZE) >= model->rnn_nl_gate.nb_outputs);
*a58d3d2aSXin Li  compute_gated_activation(&model->rnn_nl_gate, tmp2, st->rnn_state, ACTIVATION_TANH);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  compute_generic_conv1d(&model->fwc1_fc_0, tmp1, st->fwc1_state, tmp2, RNN_GRU_STATE_SIZE, ACTIVATION_LINEAR);
*a58d3d2aSXin Li  compute_gated_activation(&model->fwc1_fc_1_gate, tmp1, tmp1, ACTIVATION_TANH);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  compute_generic_conv1d(&model->fwc2_fc_0, tmp2, st->fwc2_state, tmp1, FWC1_FC_0_OUT_SIZE, ACTIVATION_LINEAR);
*a58d3d2aSXin Li  compute_gated_activation(&model->fwc2_fc_1_gate, tmp2, tmp2, ACTIVATION_TANH);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  compute_generic_conv1d(&model->fwc3_fc_0, tmp1, st->fwc3_state, tmp2, FWC2_FC_0_OUT_SIZE, ACTIVATION_LINEAR);
*a58d3d2aSXin Li  compute_gated_activation(&model->fwc3_fc_1_gate, tmp1, tmp1, ACTIVATION_TANH);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  compute_generic_conv1d(&model->fwc4_fc_0, tmp2, st->fwc4_state, tmp1, FWC3_FC_0_OUT_SIZE, ACTIVATION_LINEAR);
*a58d3d2aSXin Li  compute_gated_activation(&model->fwc4_fc_1_gate, tmp2, tmp2, ACTIVATION_TANH);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  compute_generic_conv1d(&model->fwc5_fc_0, tmp1, st->fwc5_state, tmp2, FWC4_FC_0_OUT_SIZE, ACTIVATION_LINEAR);
*a58d3d2aSXin Li  compute_gated_activation(&model->fwc5_fc_1_gate, tmp1, tmp1, ACTIVATION_TANH);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  compute_generic_conv1d(&model->fwc6_fc_0, tmp2, st->fwc6_state, tmp1, FWC5_FC_0_OUT_SIZE, ACTIVATION_LINEAR);
*a58d3d2aSXin Li  compute_gated_activation(&model->fwc6_fc_1_gate, tmp2, tmp2, ACTIVATION_TANH);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  compute_generic_conv1d(&model->fwc7_fc_0, tmp1, st->fwc7_state, tmp2, FWC6_FC_0_OUT_SIZE, ACTIVATION_LINEAR);
*a58d3d2aSXin Li  compute_gated_activation(&model->fwc7_fc_1_gate, pcm, tmp1, ACTIVATION_TANH);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  apply_gain(pcm, c0, &st->last_gain);
*a58d3d2aSXin Li  fwgan_preemphasis(pcm, &st->preemph_mem);
*a58d3d2aSXin Li  fwgan_lpc_syn(pcm, st->syn_mem, lpc, st->last_lpc);
*a58d3d2aSXin Li  fwgan_deemphasis(pcm, &st->deemph_mem);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid fwgan_init(FWGANState *st)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li  int ret;
*a58d3d2aSXin Li  OPUS_CLEAR(st, 1);
*a58d3d2aSXin Li  ret = init_fwgan(&st->model, fwgan_arrays);
*a58d3d2aSXin Li  celt_assert(ret == 0);
*a58d3d2aSXin Li  /* FIXME: perform arch detection. */
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Liint fwgan_load_model(FWGANState *st, const unsigned char *data, int len) {
*a58d3d2aSXin Li  WeightArray *list;
*a58d3d2aSXin Li  int ret;
*a58d3d2aSXin Li  parse_weights(&list, data, len);
*a58d3d2aSXin Li  ret = init_fwgan(&st->model, list);
*a58d3d2aSXin Li  opus_free(list);
*a58d3d2aSXin Li  if (ret == 0) return 0;
*a58d3d2aSXin Li  else return -1;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void fwgan_synthesize_impl(FWGANState *st, float *pcm, const float *lpc, const float *features)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li  int subframe;
*a58d3d2aSXin Li  float cond[BFCC_WITH_CORR_UPSAMPLER_FC_OUT_SIZE];
*a58d3d2aSXin Li  double w0;
*a58d3d2aSXin Li  int period;
*a58d3d2aSXin Li  float fwgan_features[NB_FEATURES-1];
*a58d3d2aSXin Li  celt_assert(st->cont_initialized);
*a58d3d2aSXin Li  OPUS_COPY(fwgan_features, features, NB_FEATURES-2);
*a58d3d2aSXin Li  fwgan_features[NB_FEATURES-2] = features[NB_FEATURES-1]+.5;
*a58d3d2aSXin Li
*a58d3d2aSXin Li  period = (int)floor(.1 + 50*features[NB_BANDS]+100);
*a58d3d2aSXin Li  w0 = 2*M_PI/period;
*a58d3d2aSXin Li  run_fwgan_upsampler(st, cond, fwgan_features);
*a58d3d2aSXin Li  for (subframe=0;subframe<NB_SUBFRAMES;subframe++) {
*a58d3d2aSXin Li    float *sub_cond;
*a58d3d2aSXin Li    sub_cond = &cond[subframe*BFCC_WITH_CORR_UPSAMPLER_FC_OUT_SIZE/4];
*a58d3d2aSXin Li    run_fwgan_subframe(st, &pcm[subframe*SUBFRAME_SIZE], sub_cond, w0, lpc, features[0]);
*a58d3d2aSXin Li  }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid fwgan_synthesize(FWGANState *st, float *pcm, const float *features)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li  float lpc[LPC_ORDER];
*a58d3d2aSXin Li  float new_pcm[FWGAN_FRAME_SIZE];
*a58d3d2aSXin Li  compute_wlpc(lpc, features);
*a58d3d2aSXin Li  fwgan_synthesize_impl(st, new_pcm, lpc, features);
*a58d3d2aSXin Li  /* Handle buffering. */
*a58d3d2aSXin Li  OPUS_COPY(pcm, st->pcm_buf, FWGAN_FRAME_SIZE-SUBFRAME_SIZE);
*a58d3d2aSXin Li  OPUS_COPY(&pcm[FWGAN_FRAME_SIZE-SUBFRAME_SIZE], new_pcm, SUBFRAME_SIZE);
*a58d3d2aSXin Li  OPUS_COPY(st->pcm_buf, &new_pcm[SUBFRAME_SIZE], FWGAN_FRAME_SIZE-SUBFRAME_SIZE);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid fwgan_synthesize_int(FWGANState *st, opus_int16 *pcm, const float *features)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li  int i;
*a58d3d2aSXin Li  float fpcm[FWGAN_FRAME_SIZE];
*a58d3d2aSXin Li  fwgan_synthesize(st, fpcm, features);
*a58d3d2aSXin Li  for (i=0;i<LPCNET_FRAME_SIZE;i++) pcm[i] = (int)floor(.5 + MIN32(32767, MAX32(-32767, 32768.f*fpcm[i])));
*a58d3d2aSXin Li}