dnn/training_tf2/keraslayerdump.py

*a58d3d2aSXin Li'''Copyright (c) 2017-2018 Mozilla
*a58d3d2aSXin Li
*a58d3d2aSXin Li   Redistribution and use in source and binary forms, with or without
*a58d3d2aSXin Li   modification, are permitted provided that the following conditions
*a58d3d2aSXin Li   are met:
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions of source code must retain the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Li   documentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*a58d3d2aSXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*a58d3d2aSXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*a58d3d2aSXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR
*a58d3d2aSXin Li   CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*a58d3d2aSXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*a58d3d2aSXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*a58d3d2aSXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*a58d3d2aSXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*a58d3d2aSXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*a58d3d2aSXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li'''
*a58d3d2aSXin Li
*a58d3d2aSXin Li""" helper functions for dumping some Keras layers to C files """
*a58d3d2aSXin Li
*a58d3d2aSXin Liimport numpy as np
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Lidef printVector(f, vector, name, dtype='float', dotp=False, static=True):
*a58d3d2aSXin Li    """ prints vector as one-dimensional C array """
*a58d3d2aSXin Li    if dotp:
*a58d3d2aSXin Li        vector = vector.reshape((vector.shape[0]//4, 4, vector.shape[1]//8, 8))
*a58d3d2aSXin Li        vector = vector.transpose((2, 0, 3, 1))
*a58d3d2aSXin Li    v = np.reshape(vector, (-1))
*a58d3d2aSXin Li    if static:
*a58d3d2aSXin Li        f.write('static const {} {}[{}] = {{\n   '.format(dtype, name, len(v)))
*a58d3d2aSXin Li    else:
*a58d3d2aSXin Li        f.write('const {} {}[{}] = {{\n   '.format(dtype, name, len(v)))
*a58d3d2aSXin Li    for i in range(0, len(v)):
*a58d3d2aSXin Li        f.write('{}'.format(v[i]))
*a58d3d2aSXin Li        if (i!=len(v)-1):
*a58d3d2aSXin Li            f.write(',')
*a58d3d2aSXin Li        else:
*a58d3d2aSXin Li            break;
*a58d3d2aSXin Li        if (i%8==7):
*a58d3d2aSXin Li            f.write("\n   ")
*a58d3d2aSXin Li        else:
*a58d3d2aSXin Li            f.write(" ")
*a58d3d2aSXin Li    f.write('\n};\n\n')
*a58d3d2aSXin Li    return vector
*a58d3d2aSXin Li
*a58d3d2aSXin Lidef printSparseVector(f, A, name, have_diag=True):
*a58d3d2aSXin Li    N = A.shape[0]
*a58d3d2aSXin Li    M = A.shape[1]
*a58d3d2aSXin Li    W = np.zeros((0,), dtype='int')
*a58d3d2aSXin Li    W0 = np.zeros((0,))
*a58d3d2aSXin Li    if have_diag:
*a58d3d2aSXin Li        diag = np.concatenate([np.diag(A[:,:N]), np.diag(A[:,N:2*N]), np.diag(A[:,2*N:])])
*a58d3d2aSXin Li        A[:,:N] = A[:,:N] - np.diag(np.diag(A[:,:N]))
*a58d3d2aSXin Li        A[:,N:2*N] = A[:,N:2*N] - np.diag(np.diag(A[:,N:2*N]))
*a58d3d2aSXin Li        A[:,2*N:] = A[:,2*N:] - np.diag(np.diag(A[:,2*N:]))
*a58d3d2aSXin Li        printVector(f, diag, name + '_diag')
*a58d3d2aSXin Li    AQ = np.minimum(127, np.maximum(-128, np.round(A*128))).astype('int')
*a58d3d2aSXin Li    idx = np.zeros((0,), dtype='int')
*a58d3d2aSXin Li    for i in range(M//8):
*a58d3d2aSXin Li        pos = idx.shape[0]
*a58d3d2aSXin Li        idx = np.append(idx, -1)
*a58d3d2aSXin Li        nb_nonzero = 0
*a58d3d2aSXin Li        for j in range(N//4):
*a58d3d2aSXin Li            block = A[j*4:(j+1)*4, i*8:(i+1)*8]
*a58d3d2aSXin Li            qblock = AQ[j*4:(j+1)*4, i*8:(i+1)*8]
*a58d3d2aSXin Li            if np.sum(np.abs(block)) > 1e-10:
*a58d3d2aSXin Li                nb_nonzero = nb_nonzero + 1
*a58d3d2aSXin Li                idx = np.append(idx, j*4)
*a58d3d2aSXin Li                vblock = qblock.transpose((1,0)).reshape((-1,))
*a58d3d2aSXin Li                W0 = np.concatenate([W0, block.reshape((-1,))])
*a58d3d2aSXin Li                W = np.concatenate([W, vblock])
*a58d3d2aSXin Li        idx[pos] = nb_nonzero
*a58d3d2aSXin Li    f.write('#ifdef DOT_PROD\n')
*a58d3d2aSXin Li    printVector(f, W, name, dtype='qweight')
*a58d3d2aSXin Li    f.write('#else /*DOT_PROD*/\n')
*a58d3d2aSXin Li    printVector(f, W0, name, dtype='qweight')
*a58d3d2aSXin Li    f.write('#endif /*DOT_PROD*/\n')
*a58d3d2aSXin Li    printVector(f, idx, name + '_idx', dtype='int')
*a58d3d2aSXin Li    return AQ
*a58d3d2aSXin Li
*a58d3d2aSXin Lidef dump_sparse_gru(self, f, hf):
*a58d3d2aSXin Li    name = 'sparse_' + self.name
*a58d3d2aSXin Li    print("printing layer " + name + " of type sparse " + self.__class__.__name__)
*a58d3d2aSXin Li    weights = self.get_weights()
*a58d3d2aSXin Li    qweights = printSparseVector(f, weights[1], name + '_recurrent_weights')
*a58d3d2aSXin Li    printVector(f, weights[-1], name + '_bias')
*a58d3d2aSXin Li    subias = weights[-1].copy()
*a58d3d2aSXin Li    subias[1,:] = subias[1,:] - np.sum(qweights*(1./128),axis=0)
*a58d3d2aSXin Li    printVector(f, subias, name + '_subias')
*a58d3d2aSXin Li    if hasattr(self, 'activation'):
*a58d3d2aSXin Li        activation = self.activation.__name__.upper()
*a58d3d2aSXin Li    else:
*a58d3d2aSXin Li        activation = 'TANH'
*a58d3d2aSXin Li    if hasattr(self, 'reset_after') and not self.reset_after:
*a58d3d2aSXin Li        reset_after = 0
*a58d3d2aSXin Li    else:
*a58d3d2aSXin Li        reset_after = 1
*a58d3d2aSXin Li    neurons = weights[0].shape[1]//3
*a58d3d2aSXin Li    max_rnn_neurons = neurons
*a58d3d2aSXin Li    f.write('const SparseGRULayer {} = {{\n   {}_bias,\n   {}_subias,\n   {}_recurrent_weights_diag,\n   {}_recurrent_weights,\n   {}_recurrent_weights_idx,\n   {}, ACTIVATION_{}, {}\n}};\n\n'
*a58d3d2aSXin Li            .format(name, name, name, name, name, name, weights[0].shape[1]//3, activation, reset_after))
*a58d3d2aSXin Li    hf.write('#define {}_OUT_SIZE {}\n'.format(name.upper(), weights[0].shape[1]//3))
*a58d3d2aSXin Li    hf.write('#define {}_STATE_SIZE {}\n'.format(name.upper(), weights[0].shape[1]//3))
*a58d3d2aSXin Li    hf.write('extern const SparseGRULayer {};\n\n'.format(name));
*a58d3d2aSXin Li    return max_rnn_neurons
*a58d3d2aSXin Li
*a58d3d2aSXin Lidef dump_gru_layer(self, f, hf, dotp=False, sparse=False):
*a58d3d2aSXin Li    name = self.name
*a58d3d2aSXin Li    print("printing layer " + name + " of type " + self.__class__.__name__)
*a58d3d2aSXin Li    weights = self.get_weights()
*a58d3d2aSXin Li    if sparse:
*a58d3d2aSXin Li        qweight = printSparseVector(f, weights[0], name + '_weights', have_diag=False)
*a58d3d2aSXin Li    else:
*a58d3d2aSXin Li        qweight = printVector(f, weights[0], name + '_weights')
*a58d3d2aSXin Li
*a58d3d2aSXin Li    if dotp:
*a58d3d2aSXin Li        f.write('#ifdef DOT_PROD\n')
*a58d3d2aSXin Li        qweight2 = np.clip(np.round(128.*weights[1]).astype('int'), -128, 127)
*a58d3d2aSXin Li        printVector(f, qweight2, name + '_recurrent_weights', dotp=True, dtype='qweight')
*a58d3d2aSXin Li        f.write('#else /*DOT_PROD*/\n')
*a58d3d2aSXin Li    else:
*a58d3d2aSXin Li        qweight2 = weights[1]
*a58d3d2aSXin Li
*a58d3d2aSXin Li    printVector(f, weights[1], name + '_recurrent_weights')
*a58d3d2aSXin Li    if dotp:
*a58d3d2aSXin Li        f.write('#endif /*DOT_PROD*/\n')
*a58d3d2aSXin Li
*a58d3d2aSXin Li    printVector(f, weights[-1], name + '_bias')
*a58d3d2aSXin Li    subias = weights[-1].copy()
*a58d3d2aSXin Li    subias[0,:] = subias[0,:] - np.sum(qweight*(1./128.),axis=0)
*a58d3d2aSXin Li    subias[1,:] = subias[1,:] - np.sum(qweight2*(1./128.),axis=0)
*a58d3d2aSXin Li    printVector(f, subias, name + '_subias')
*a58d3d2aSXin Li    if hasattr(self, 'activation'):
*a58d3d2aSXin Li        activation = self.activation.__name__.upper()
*a58d3d2aSXin Li    else:
*a58d3d2aSXin Li        activation = 'TANH'
*a58d3d2aSXin Li    if hasattr(self, 'reset_after') and not self.reset_after:
*a58d3d2aSXin Li        reset_after = 0
*a58d3d2aSXin Li    else:
*a58d3d2aSXin Li        reset_after = 1
*a58d3d2aSXin Li    neurons = weights[0].shape[1]//3
*a58d3d2aSXin Li    max_rnn_neurons = neurons
*a58d3d2aSXin Li    f.write('const GRULayer {} = {{\n   {}_bias,\n   {}_subias,\n   {}_weights,\n   {},\n   {}_recurrent_weights,\n   {}, {}, ACTIVATION_{}, {}\n}};\n\n'
*a58d3d2aSXin Li            .format(name, name, name, name, name + "_weights_idx" if sparse else "NULL", name, weights[0].shape[0], weights[0].shape[1]//3, activation, reset_after))
*a58d3d2aSXin Li    hf.write('#define {}_OUT_SIZE {}\n'.format(name.upper(), weights[0].shape[1]//3))
*a58d3d2aSXin Li    hf.write('#define {}_STATE_SIZE {}\n'.format(name.upper(), weights[0].shape[1]//3))
*a58d3d2aSXin Li    hf.write('extern const GRULayer {};\n\n'.format(name));
*a58d3d2aSXin Li    return max_rnn_neurons
*a58d3d2aSXin Li
*a58d3d2aSXin Lidef dump_dense_layer_impl(name, weights, bias, activation, f, hf):
*a58d3d2aSXin Li    printVector(f, weights, name + '_weights')
*a58d3d2aSXin Li    printVector(f, bias, name + '_bias')
*a58d3d2aSXin Li    f.write('const DenseLayer {} = {{\n   {}_bias,\n   {}_weights,\n   {}, {}, ACTIVATION_{}\n}};\n\n'
*a58d3d2aSXin Li            .format(name, name, name, weights.shape[0], weights.shape[1], activation))
*a58d3d2aSXin Li    hf.write('#define {}_OUT_SIZE {}\n'.format(name.upper(), weights.shape[1]))
*a58d3d2aSXin Li    hf.write('extern const DenseLayer {};\n\n'.format(name));
*a58d3d2aSXin Li
*a58d3d2aSXin Lidef dump_dense_layer(self, f, hf):
*a58d3d2aSXin Li    name = self.name
*a58d3d2aSXin Li    print("printing layer " + name + " of type " + self.__class__.__name__)
*a58d3d2aSXin Li    weights = self.get_weights()
*a58d3d2aSXin Li    activation = self.activation.__name__.upper()
*a58d3d2aSXin Li    dump_dense_layer_impl(name, weights[0], weights[1], activation, f, hf)
*a58d3d2aSXin Li    return False
*a58d3d2aSXin Li
*a58d3d2aSXin Lidef dump_conv1d_layer(self, f, hf):
*a58d3d2aSXin Li    name = self.name
*a58d3d2aSXin Li    print("printing layer " + name + " of type " + self.__class__.__name__)
*a58d3d2aSXin Li    weights = self.get_weights()
*a58d3d2aSXin Li    printVector(f, weights[0], name + '_weights')
*a58d3d2aSXin Li    printVector(f, weights[-1], name + '_bias')
*a58d3d2aSXin Li    activation = self.activation.__name__.upper()
*a58d3d2aSXin Li    max_conv_inputs = weights[0].shape[1]*weights[0].shape[0]
*a58d3d2aSXin Li    f.write('const Conv1DLayer {} = {{\n   {}_bias,\n   {}_weights,\n   {}, {}, {}, ACTIVATION_{}\n}};\n\n'
*a58d3d2aSXin Li            .format(name, name, name, weights[0].shape[1], weights[0].shape[0], weights[0].shape[2], activation))
*a58d3d2aSXin Li    hf.write('#define {}_OUT_SIZE {}\n'.format(name.upper(), weights[0].shape[2]))
*a58d3d2aSXin Li    hf.write('#define {}_STATE_SIZE ({}*{})\n'.format(name.upper(), weights[0].shape[1], (weights[0].shape[0]-1)))
*a58d3d2aSXin Li    hf.write('#define {}_DELAY {}\n'.format(name.upper(), (weights[0].shape[0]-1)//2))
*a58d3d2aSXin Li    hf.write('extern const Conv1DLayer {};\n\n'.format(name));
*a58d3d2aSXin Li    return max_conv_inputs