dnn/training_tf2/lpcnet_plc.py

*a58d3d2aSXin Li#!/usr/bin/python3
*a58d3d2aSXin Li'''Copyright (c) 2021-2022 Amazon
*a58d3d2aSXin Li   Copyright (c) 2018-2019 Mozilla
*a58d3d2aSXin Li
*a58d3d2aSXin Li   Redistribution and use in source and binary forms, with or without
*a58d3d2aSXin Li   modification, are permitted provided that the following conditions
*a58d3d2aSXin Li   are met:
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions of source code must retain the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Li   documentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*a58d3d2aSXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*a58d3d2aSXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*a58d3d2aSXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR
*a58d3d2aSXin Li   CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*a58d3d2aSXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*a58d3d2aSXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*a58d3d2aSXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*a58d3d2aSXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*a58d3d2aSXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*a58d3d2aSXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li'''
*a58d3d2aSXin Li
*a58d3d2aSXin Liimport math
*a58d3d2aSXin Liimport tensorflow as tf
*a58d3d2aSXin Lifrom tensorflow.keras.models import Model
*a58d3d2aSXin Lifrom tensorflow.keras.layers import Input, GRU, Dense, Embedding, Reshape, Concatenate, Lambda, Conv1D, Multiply, Add, Bidirectional, MaxPooling1D, Activation, GaussianNoise
*a58d3d2aSXin Lifrom tensorflow.compat.v1.keras.layers import CuDNNGRU
*a58d3d2aSXin Lifrom tensorflow.keras import backend as K
*a58d3d2aSXin Lifrom tensorflow.keras.constraints import Constraint
*a58d3d2aSXin Lifrom tensorflow.keras.initializers import Initializer
*a58d3d2aSXin Lifrom tensorflow.keras.callbacks import Callback
*a58d3d2aSXin Liimport numpy as np
*a58d3d2aSXin Li
*a58d3d2aSXin Lidef quant_regularizer(x):
*a58d3d2aSXin Li    Q = 128
*a58d3d2aSXin Li    Q_1 = 1./Q
*a58d3d2aSXin Li    #return .01 * tf.reduce_mean(1 - tf.math.cos(2*3.1415926535897931*(Q*x-tf.round(Q*x))))
*a58d3d2aSXin Li    return .01 * tf.reduce_mean(K.sqrt(K.sqrt(1.0001 - tf.math.cos(2*3.1415926535897931*(Q*x-tf.round(Q*x))))))
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Liclass WeightClip(Constraint):
*a58d3d2aSXin Li    '''Clips the weights incident to each hidden unit to be inside a range
*a58d3d2aSXin Li    '''
*a58d3d2aSXin Li    def __init__(self, c=2):
*a58d3d2aSXin Li        self.c = c
*a58d3d2aSXin Li
*a58d3d2aSXin Li    def __call__(self, p):
*a58d3d2aSXin Li        # Ensure that abs of adjacent weights don't sum to more than 127. Otherwise there's a risk of
*a58d3d2aSXin Li        # saturation when implementing dot products with SSSE3 or AVX2.
*a58d3d2aSXin Li        return self.c*p/tf.maximum(self.c, tf.repeat(tf.abs(p[:, 1::2])+tf.abs(p[:, 0::2]), 2, axis=1))
*a58d3d2aSXin Li        #return K.clip(p, -self.c, self.c)
*a58d3d2aSXin Li
*a58d3d2aSXin Li    def get_config(self):
*a58d3d2aSXin Li        return {'name': self.__class__.__name__,
*a58d3d2aSXin Li            'c': self.c}
*a58d3d2aSXin Li
*a58d3d2aSXin Liconstraint = WeightClip(0.992)
*a58d3d2aSXin Li
*a58d3d2aSXin Lidef new_lpcnet_plc_model(rnn_units=256, nb_used_features=20, nb_burg_features=36, batch_size=128, training=False, adaptation=False, quantize=False, cond_size=128):
*a58d3d2aSXin Li    feat = Input(shape=(None, nb_used_features+nb_burg_features), batch_size=batch_size)
*a58d3d2aSXin Li    lost = Input(shape=(None, 1), batch_size=batch_size)
*a58d3d2aSXin Li
*a58d3d2aSXin Li    fdense1 = Dense(cond_size, activation='tanh', name='plc_dense1')
*a58d3d2aSXin Li
*a58d3d2aSXin Li    cfeat = Concatenate()([feat, lost])
*a58d3d2aSXin Li    cfeat = fdense1(cfeat)
*a58d3d2aSXin Li    #cfeat = Conv1D(cond_size, 3, padding='causal', activation='tanh', name='plc_conv1')(cfeat)
*a58d3d2aSXin Li
*a58d3d2aSXin Li    quant = quant_regularizer if quantize else None
*a58d3d2aSXin Li
*a58d3d2aSXin Li    if training:
*a58d3d2aSXin Li        rnn = CuDNNGRU(rnn_units, return_sequences=True, return_state=True, name='plc_gru1', stateful=True,
*a58d3d2aSXin Li              kernel_constraint=constraint, recurrent_constraint = constraint, kernel_regularizer=quant, recurrent_regularizer=quant)
*a58d3d2aSXin Li        rnn2 = CuDNNGRU(rnn_units, return_sequences=True, return_state=True, name='plc_gru2', stateful=True,
*a58d3d2aSXin Li              kernel_constraint=constraint, recurrent_constraint = constraint, kernel_regularizer=quant, recurrent_regularizer=quant)
*a58d3d2aSXin Li    else:
*a58d3d2aSXin Li        rnn = GRU(rnn_units, return_sequences=True, return_state=True, recurrent_activation="sigmoid", reset_after='true', name='plc_gru1', stateful=True,
*a58d3d2aSXin Li              kernel_constraint=constraint, recurrent_constraint = constraint, kernel_regularizer=quant, recurrent_regularizer=quant)
*a58d3d2aSXin Li        rnn2 = GRU(rnn_units, return_sequences=True, return_state=True, recurrent_activation="sigmoid", reset_after='true', name='plc_gru2', stateful=True,
*a58d3d2aSXin Li              kernel_constraint=constraint, recurrent_constraint = constraint, kernel_regularizer=quant, recurrent_regularizer=quant)
*a58d3d2aSXin Li
*a58d3d2aSXin Li    gru_out1, _ = rnn(cfeat)
*a58d3d2aSXin Li    gru_out1 = GaussianNoise(.005)(gru_out1)
*a58d3d2aSXin Li    gru_out2, _ = rnn2(gru_out1)
*a58d3d2aSXin Li
*a58d3d2aSXin Li    out_dense = Dense(nb_used_features, activation='linear', name='plc_out')
*a58d3d2aSXin Li    plc_out = out_dense(gru_out2)
*a58d3d2aSXin Li
*a58d3d2aSXin Li    model = Model([feat, lost], plc_out)
*a58d3d2aSXin Li    model.rnn_units = rnn_units
*a58d3d2aSXin Li    model.cond_size = cond_size
*a58d3d2aSXin Li    model.nb_used_features = nb_used_features
*a58d3d2aSXin Li    model.nb_burg_features = nb_burg_features
*a58d3d2aSXin Li
*a58d3d2aSXin Li    return model