libopus/silk/dec_API.c

*a58d3d2aSXin Li/***********************************************************************
*a58d3d2aSXin LiCopyright (c) 2006-2011, Skype Limited. All rights reserved.
*a58d3d2aSXin LiRedistribution and use in source and binary forms, with or without
*a58d3d2aSXin Limodification, are permitted provided that the following conditions
*a58d3d2aSXin Liare met:
*a58d3d2aSXin Li- Redistributions of source code must retain the above copyright notice,
*a58d3d2aSXin Lithis list of conditions and the following disclaimer.
*a58d3d2aSXin Li- Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Linotice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Lidocumentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li- Neither the name of Internet Society, IETF or IETF Trust, nor the
*a58d3d2aSXin Linames of specific contributors, may be used to endorse or promote
*a58d3d2aSXin Liproducts derived from this software without specific prior written
*a58d3d2aSXin Lipermission.
*a58d3d2aSXin LiTHIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
*a58d3d2aSXin LiAND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
*a58d3d2aSXin LiIMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
*a58d3d2aSXin LiARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
*a58d3d2aSXin LiLIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
*a58d3d2aSXin LiCONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
*a58d3d2aSXin LiSUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
*a58d3d2aSXin LiINTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
*a58d3d2aSXin LiCONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
*a58d3d2aSXin LiARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
*a58d3d2aSXin LiPOSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li***********************************************************************/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef HAVE_CONFIG_H
*a58d3d2aSXin Li#include "config.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li#include "API.h"
*a58d3d2aSXin Li#include "main.h"
*a58d3d2aSXin Li#include "stack_alloc.h"
*a58d3d2aSXin Li#include "os_support.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef ENABLE_OSCE
*a58d3d2aSXin Li#include "osce.h"
*a58d3d2aSXin Li#include "osce_structs.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li/************************/
*a58d3d2aSXin Li/* Decoder Super Struct */
*a58d3d2aSXin Li/************************/
*a58d3d2aSXin Litypedef struct {
*a58d3d2aSXin Li    silk_decoder_state          channel_state[ DECODER_NUM_CHANNELS ];
*a58d3d2aSXin Li    stereo_dec_state                sStereo;
*a58d3d2aSXin Li    opus_int                         nChannelsAPI;
*a58d3d2aSXin Li    opus_int                         nChannelsInternal;
*a58d3d2aSXin Li    opus_int                         prev_decode_only_middle;
*a58d3d2aSXin Li#ifdef ENABLE_OSCE
*a58d3d2aSXin Li    OSCEModel                        osce_model;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li} silk_decoder;
*a58d3d2aSXin Li
*a58d3d2aSXin Li/*********************/
*a58d3d2aSXin Li/* Decoder functions */
*a58d3d2aSXin Li/*********************/
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_int silk_LoadOSCEModels(void *decState, const unsigned char *data, int len)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li#ifdef ENABLE_OSCE
*a58d3d2aSXin Li    opus_int ret = SILK_NO_ERROR;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    ret = osce_load_models(&((silk_decoder *)decState)->osce_model, data, len);
*a58d3d2aSXin Li    ((silk_decoder *)decState)->osce_model.loaded = (ret == 0);
*a58d3d2aSXin Li    return ret;
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li    (void) decState;
*a58d3d2aSXin Li    (void) data;
*a58d3d2aSXin Li    (void) len;
*a58d3d2aSXin Li    return SILK_NO_ERROR;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_int silk_Get_Decoder_Size(                         /* O    Returns error code                              */
*a58d3d2aSXin Li    opus_int                        *decSizeBytes       /* O    Number of bytes in SILK decoder state           */
*a58d3d2aSXin Li)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    opus_int ret = SILK_NO_ERROR;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    *decSizeBytes = sizeof( silk_decoder );
*a58d3d2aSXin Li
*a58d3d2aSXin Li    return ret;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Reset decoder state */
*a58d3d2aSXin Liopus_int silk_ResetDecoder(                              /* O    Returns error code                              */
*a58d3d2aSXin Li    void                            *decState           /* I/O  State                                           */
*a58d3d2aSXin Li)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    opus_int n, ret = SILK_NO_ERROR;
*a58d3d2aSXin Li    silk_decoder_state *channel_state = ((silk_decoder *)decState)->channel_state;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    for( n = 0; n < DECODER_NUM_CHANNELS; n++ ) {
*a58d3d2aSXin Li        ret  = silk_reset_decoder( &channel_state[ n ] );
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    silk_memset(&((silk_decoder *)decState)->sStereo, 0, sizeof(((silk_decoder *)decState)->sStereo));
*a58d3d2aSXin Li    /* Not strictly needed, but it's cleaner that way */
*a58d3d2aSXin Li    ((silk_decoder *)decState)->prev_decode_only_middle = 0;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    return ret;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_int silk_InitDecoder(                              /* O    Returns error code                              */
*a58d3d2aSXin Li    void                            *decState           /* I/O  State                                           */
*a58d3d2aSXin Li)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    opus_int n, ret = SILK_NO_ERROR;
*a58d3d2aSXin Li    silk_decoder_state *channel_state = ((silk_decoder *)decState)->channel_state;
*a58d3d2aSXin Li#ifdef ENABLE_OSCE
*a58d3d2aSXin Li    ((silk_decoder *)decState)->osce_model.loaded = 0;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li#ifndef USE_WEIGHTS_FILE
*a58d3d2aSXin Li    /* load osce models */
*a58d3d2aSXin Li    silk_LoadOSCEModels(decState, NULL, 0);
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li    for( n = 0; n < DECODER_NUM_CHANNELS; n++ ) {
*a58d3d2aSXin Li        ret  = silk_init_decoder( &channel_state[ n ] );
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    silk_memset(&((silk_decoder *)decState)->sStereo, 0, sizeof(((silk_decoder *)decState)->sStereo));
*a58d3d2aSXin Li    /* Not strictly needed, but it's cleaner that way */
*a58d3d2aSXin Li    ((silk_decoder *)decState)->prev_decode_only_middle = 0;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    return ret;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Decode a frame */
*a58d3d2aSXin Liopus_int silk_Decode(                                   /* O    Returns error code                              */
*a58d3d2aSXin Li    void*                           decState,           /* I/O  State                                           */
*a58d3d2aSXin Li    silk_DecControlStruct*          decControl,         /* I/O  Control Structure                               */
*a58d3d2aSXin Li    opus_int                        lostFlag,           /* I    0: no loss, 1 loss, 2 decode fec                */
*a58d3d2aSXin Li    opus_int                        newPacketFlag,      /* I    Indicates first decoder call for this packet    */
*a58d3d2aSXin Li    ec_dec                          *psRangeDec,        /* I/O  Compressor data structure                       */
*a58d3d2aSXin Li    opus_int16                      *samplesOut,        /* O    Decoded output speech vector                    */
*a58d3d2aSXin Li    opus_int32                      *nSamplesOut,       /* O    Number of samples decoded                       */
*a58d3d2aSXin Li#ifdef ENABLE_DEEP_PLC
*a58d3d2aSXin Li    LPCNetPLCState                  *lpcnet,
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li    int                             arch                /* I    Run-time architecture                           */
*a58d3d2aSXin Li)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    opus_int   i, n, decode_only_middle = 0, ret = SILK_NO_ERROR;
*a58d3d2aSXin Li    opus_int32 nSamplesOutDec, LBRR_symbol;
*a58d3d2aSXin Li    opus_int16 *samplesOut1_tmp[ 2 ];
*a58d3d2aSXin Li    VARDECL( opus_int16, samplesOut1_tmp_storage1 );
*a58d3d2aSXin Li    VARDECL( opus_int16, samplesOut1_tmp_storage2 );
*a58d3d2aSXin Li    VARDECL( opus_int16, samplesOut2_tmp );
*a58d3d2aSXin Li    opus_int32 MS_pred_Q13[ 2 ] = { 0 };
*a58d3d2aSXin Li    opus_int16 *resample_out_ptr;
*a58d3d2aSXin Li    silk_decoder *psDec = ( silk_decoder * )decState;
*a58d3d2aSXin Li    silk_decoder_state *channel_state = psDec->channel_state;
*a58d3d2aSXin Li    opus_int has_side;
*a58d3d2aSXin Li    opus_int stereo_to_mono;
*a58d3d2aSXin Li    int delay_stack_alloc;
*a58d3d2aSXin Li    SAVE_STACK;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    celt_assert( decControl->nChannelsInternal == 1 || decControl->nChannelsInternal == 2 );
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /**********************************/
*a58d3d2aSXin Li    /* Test if first frame in payload */
*a58d3d2aSXin Li    /**********************************/
*a58d3d2aSXin Li    if( newPacketFlag ) {
*a58d3d2aSXin Li        for( n = 0; n < decControl->nChannelsInternal; n++ ) {
*a58d3d2aSXin Li            channel_state[ n ].nFramesDecoded = 0;  /* Used to count frames in packet */
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* If Mono -> Stereo transition in bitstream: init state of second channel */
*a58d3d2aSXin Li    if( decControl->nChannelsInternal > psDec->nChannelsInternal ) {
*a58d3d2aSXin Li        ret += silk_init_decoder( &channel_state[ 1 ] );
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    stereo_to_mono = decControl->nChannelsInternal == 1 && psDec->nChannelsInternal == 2 &&
*a58d3d2aSXin Li                     ( decControl->internalSampleRate == 1000*channel_state[ 0 ].fs_kHz );
*a58d3d2aSXin Li
*a58d3d2aSXin Li    if( channel_state[ 0 ].nFramesDecoded == 0 ) {
*a58d3d2aSXin Li        for( n = 0; n < decControl->nChannelsInternal; n++ ) {
*a58d3d2aSXin Li            opus_int fs_kHz_dec;
*a58d3d2aSXin Li            if( decControl->payloadSize_ms == 0 ) {
*a58d3d2aSXin Li                /* Assuming packet loss, use 10 ms */
*a58d3d2aSXin Li                channel_state[ n ].nFramesPerPacket = 1;
*a58d3d2aSXin Li                channel_state[ n ].nb_subfr = 2;
*a58d3d2aSXin Li            } else if( decControl->payloadSize_ms == 10 ) {
*a58d3d2aSXin Li                channel_state[ n ].nFramesPerPacket = 1;
*a58d3d2aSXin Li                channel_state[ n ].nb_subfr = 2;
*a58d3d2aSXin Li            } else if( decControl->payloadSize_ms == 20 ) {
*a58d3d2aSXin Li                channel_state[ n ].nFramesPerPacket = 1;
*a58d3d2aSXin Li                channel_state[ n ].nb_subfr = 4;
*a58d3d2aSXin Li            } else if( decControl->payloadSize_ms == 40 ) {
*a58d3d2aSXin Li                channel_state[ n ].nFramesPerPacket = 2;
*a58d3d2aSXin Li                channel_state[ n ].nb_subfr = 4;
*a58d3d2aSXin Li            } else if( decControl->payloadSize_ms == 60 ) {
*a58d3d2aSXin Li                channel_state[ n ].nFramesPerPacket = 3;
*a58d3d2aSXin Li                channel_state[ n ].nb_subfr = 4;
*a58d3d2aSXin Li            } else {
*a58d3d2aSXin Li                celt_assert( 0 );
*a58d3d2aSXin Li                RESTORE_STACK;
*a58d3d2aSXin Li                return SILK_DEC_INVALID_FRAME_SIZE;
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li            fs_kHz_dec = ( decControl->internalSampleRate >> 10 ) + 1;
*a58d3d2aSXin Li            if( fs_kHz_dec != 8 && fs_kHz_dec != 12 && fs_kHz_dec != 16 ) {
*a58d3d2aSXin Li                celt_assert( 0 );
*a58d3d2aSXin Li                RESTORE_STACK;
*a58d3d2aSXin Li                return SILK_DEC_INVALID_SAMPLING_FREQUENCY;
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li            ret += silk_decoder_set_fs( &channel_state[ n ], fs_kHz_dec, decControl->API_sampleRate );
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    if( decControl->nChannelsAPI == 2 && decControl->nChannelsInternal == 2 && ( psDec->nChannelsAPI == 1 || psDec->nChannelsInternal == 1 ) ) {
*a58d3d2aSXin Li        silk_memset( psDec->sStereo.pred_prev_Q13, 0, sizeof( psDec->sStereo.pred_prev_Q13 ) );
*a58d3d2aSXin Li        silk_memset( psDec->sStereo.sSide, 0, sizeof( psDec->sStereo.sSide ) );
*a58d3d2aSXin Li        silk_memcpy( &channel_state[ 1 ].resampler_state, &channel_state[ 0 ].resampler_state, sizeof( silk_resampler_state_struct ) );
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    psDec->nChannelsAPI      = decControl->nChannelsAPI;
*a58d3d2aSXin Li    psDec->nChannelsInternal = decControl->nChannelsInternal;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    if( decControl->API_sampleRate > (opus_int32)MAX_API_FS_KHZ * 1000 || decControl->API_sampleRate < 8000 ) {
*a58d3d2aSXin Li        ret = SILK_DEC_INVALID_SAMPLING_FREQUENCY;
*a58d3d2aSXin Li        RESTORE_STACK;
*a58d3d2aSXin Li        return( ret );
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    if( lostFlag != FLAG_PACKET_LOST && channel_state[ 0 ].nFramesDecoded == 0 ) {
*a58d3d2aSXin Li        /* First decoder call for this payload */
*a58d3d2aSXin Li        /* Decode VAD flags and LBRR flag */
*a58d3d2aSXin Li        for( n = 0; n < decControl->nChannelsInternal; n++ ) {
*a58d3d2aSXin Li            for( i = 0; i < channel_state[ n ].nFramesPerPacket; i++ ) {
*a58d3d2aSXin Li                channel_state[ n ].VAD_flags[ i ] = ec_dec_bit_logp(psRangeDec, 1);
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li            channel_state[ n ].LBRR_flag = ec_dec_bit_logp(psRangeDec, 1);
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li        /* Decode LBRR flags */
*a58d3d2aSXin Li        for( n = 0; n < decControl->nChannelsInternal; n++ ) {
*a58d3d2aSXin Li            silk_memset( channel_state[ n ].LBRR_flags, 0, sizeof( channel_state[ n ].LBRR_flags ) );
*a58d3d2aSXin Li            if( channel_state[ n ].LBRR_flag ) {
*a58d3d2aSXin Li                if( channel_state[ n ].nFramesPerPacket == 1 ) {
*a58d3d2aSXin Li                    channel_state[ n ].LBRR_flags[ 0 ] = 1;
*a58d3d2aSXin Li                } else {
*a58d3d2aSXin Li                    LBRR_symbol = ec_dec_icdf( psRangeDec, silk_LBRR_flags_iCDF_ptr[ channel_state[ n ].nFramesPerPacket - 2 ], 8 ) + 1;
*a58d3d2aSXin Li                    for( i = 0; i < channel_state[ n ].nFramesPerPacket; i++ ) {
*a58d3d2aSXin Li                        channel_state[ n ].LBRR_flags[ i ] = silk_RSHIFT( LBRR_symbol, i ) & 1;
*a58d3d2aSXin Li                    }
*a58d3d2aSXin Li                }
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li
*a58d3d2aSXin Li        if( lostFlag == FLAG_DECODE_NORMAL ) {
*a58d3d2aSXin Li            /* Regular decoding: skip all LBRR data */
*a58d3d2aSXin Li            for( i = 0; i < channel_state[ 0 ].nFramesPerPacket; i++ ) {
*a58d3d2aSXin Li                for( n = 0; n < decControl->nChannelsInternal; n++ ) {
*a58d3d2aSXin Li                    if( channel_state[ n ].LBRR_flags[ i ] ) {
*a58d3d2aSXin Li                        opus_int16 pulses[ MAX_FRAME_LENGTH ];
*a58d3d2aSXin Li                        opus_int condCoding;
*a58d3d2aSXin Li
*a58d3d2aSXin Li                        if( decControl->nChannelsInternal == 2 && n == 0 ) {
*a58d3d2aSXin Li                            silk_stereo_decode_pred( psRangeDec, MS_pred_Q13 );
*a58d3d2aSXin Li                            if( channel_state[ 1 ].LBRR_flags[ i ] == 0 ) {
*a58d3d2aSXin Li                                silk_stereo_decode_mid_only( psRangeDec, &decode_only_middle );
*a58d3d2aSXin Li                            }
*a58d3d2aSXin Li                        }
*a58d3d2aSXin Li                        /* Use conditional coding if previous frame available */
*a58d3d2aSXin Li                        if( i > 0 && channel_state[ n ].LBRR_flags[ i - 1 ] ) {
*a58d3d2aSXin Li                            condCoding = CODE_CONDITIONALLY;
*a58d3d2aSXin Li                        } else {
*a58d3d2aSXin Li                            condCoding = CODE_INDEPENDENTLY;
*a58d3d2aSXin Li                        }
*a58d3d2aSXin Li                        silk_decode_indices( &channel_state[ n ], psRangeDec, i, 1, condCoding );
*a58d3d2aSXin Li                        silk_decode_pulses( psRangeDec, pulses, channel_state[ n ].indices.signalType,
*a58d3d2aSXin Li                            channel_state[ n ].indices.quantOffsetType, channel_state[ n ].frame_length );
*a58d3d2aSXin Li                    }
*a58d3d2aSXin Li                }
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* Get MS predictor index */
*a58d3d2aSXin Li    if( decControl->nChannelsInternal == 2 ) {
*a58d3d2aSXin Li        if(   lostFlag == FLAG_DECODE_NORMAL ||
*a58d3d2aSXin Li            ( lostFlag == FLAG_DECODE_LBRR && channel_state[ 0 ].LBRR_flags[ channel_state[ 0 ].nFramesDecoded ] == 1 ) )
*a58d3d2aSXin Li        {
*a58d3d2aSXin Li            silk_stereo_decode_pred( psRangeDec, MS_pred_Q13 );
*a58d3d2aSXin Li            /* For LBRR data, decode mid-only flag only if side-channel's LBRR flag is false */
*a58d3d2aSXin Li            if( ( lostFlag == FLAG_DECODE_NORMAL && channel_state[ 1 ].VAD_flags[ channel_state[ 0 ].nFramesDecoded ] == 0 ) ||
*a58d3d2aSXin Li                ( lostFlag == FLAG_DECODE_LBRR && channel_state[ 1 ].LBRR_flags[ channel_state[ 0 ].nFramesDecoded ] == 0 ) )
*a58d3d2aSXin Li            {
*a58d3d2aSXin Li                silk_stereo_decode_mid_only( psRangeDec, &decode_only_middle );
*a58d3d2aSXin Li            } else {
*a58d3d2aSXin Li                decode_only_middle = 0;
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li        } else {
*a58d3d2aSXin Li            for( n = 0; n < 2; n++ ) {
*a58d3d2aSXin Li                MS_pred_Q13[ n ] = psDec->sStereo.pred_prev_Q13[ n ];
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* Reset side channel decoder prediction memory for first frame with side coding */
*a58d3d2aSXin Li    if( decControl->nChannelsInternal == 2 && decode_only_middle == 0 && psDec->prev_decode_only_middle == 1 ) {
*a58d3d2aSXin Li        silk_memset( psDec->channel_state[ 1 ].outBuf, 0, sizeof(psDec->channel_state[ 1 ].outBuf) );
*a58d3d2aSXin Li        silk_memset( psDec->channel_state[ 1 ].sLPC_Q14_buf, 0, sizeof(psDec->channel_state[ 1 ].sLPC_Q14_buf) );
*a58d3d2aSXin Li        psDec->channel_state[ 1 ].lagPrev        = 100;
*a58d3d2aSXin Li        psDec->channel_state[ 1 ].LastGainIndex  = 10;
*a58d3d2aSXin Li        psDec->channel_state[ 1 ].prevSignalType = TYPE_NO_VOICE_ACTIVITY;
*a58d3d2aSXin Li        psDec->channel_state[ 1 ].first_frame_after_reset = 1;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* Check if the temp buffer fits into the output PCM buffer. If it fits,
*a58d3d2aSXin Li       we can delay allocating the temp buffer until after the SILK peak stack
*a58d3d2aSXin Li       usage. We need to use a < and not a <= because of the two extra samples. */
*a58d3d2aSXin Li    delay_stack_alloc = decControl->internalSampleRate*decControl->nChannelsInternal
*a58d3d2aSXin Li          < decControl->API_sampleRate*decControl->nChannelsAPI;
*a58d3d2aSXin Li    ALLOC( samplesOut1_tmp_storage1, delay_stack_alloc ? ALLOC_NONE
*a58d3d2aSXin Li           : decControl->nChannelsInternal*(channel_state[ 0 ].frame_length + 2 ),
*a58d3d2aSXin Li           opus_int16 );
*a58d3d2aSXin Li    if ( delay_stack_alloc )
*a58d3d2aSXin Li    {
*a58d3d2aSXin Li       samplesOut1_tmp[ 0 ] = samplesOut;
*a58d3d2aSXin Li       samplesOut1_tmp[ 1 ] = samplesOut + channel_state[ 0 ].frame_length + 2;
*a58d3d2aSXin Li    } else {
*a58d3d2aSXin Li       samplesOut1_tmp[ 0 ] = samplesOut1_tmp_storage1;
*a58d3d2aSXin Li       samplesOut1_tmp[ 1 ] = samplesOut1_tmp_storage1 + channel_state[ 0 ].frame_length + 2;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    if( lostFlag == FLAG_DECODE_NORMAL ) {
*a58d3d2aSXin Li        has_side = !decode_only_middle;
*a58d3d2aSXin Li    } else {
*a58d3d2aSXin Li        has_side = !psDec->prev_decode_only_middle
*a58d3d2aSXin Li              || (decControl->nChannelsInternal == 2 && lostFlag == FLAG_DECODE_LBRR && channel_state[1].LBRR_flags[ channel_state[1].nFramesDecoded ] == 1 );
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    channel_state[ 0 ].sPLC.enable_deep_plc = decControl->enable_deep_plc;
*a58d3d2aSXin Li    /* Call decoder for one frame */
*a58d3d2aSXin Li    for( n = 0; n < decControl->nChannelsInternal; n++ ) {
*a58d3d2aSXin Li        if( n == 0 || has_side ) {
*a58d3d2aSXin Li            opus_int FrameIndex;
*a58d3d2aSXin Li            opus_int condCoding;
*a58d3d2aSXin Li
*a58d3d2aSXin Li            FrameIndex = channel_state[ 0 ].nFramesDecoded - n;
*a58d3d2aSXin Li            /* Use independent coding if no previous frame available */
*a58d3d2aSXin Li            if( FrameIndex <= 0 ) {
*a58d3d2aSXin Li                condCoding = CODE_INDEPENDENTLY;
*a58d3d2aSXin Li            } else if( lostFlag == FLAG_DECODE_LBRR ) {
*a58d3d2aSXin Li                condCoding = channel_state[ n ].LBRR_flags[ FrameIndex - 1 ] ? CODE_CONDITIONALLY : CODE_INDEPENDENTLY;
*a58d3d2aSXin Li            } else if( n > 0 && psDec->prev_decode_only_middle ) {
*a58d3d2aSXin Li                /* If we skipped a side frame in this packet, we don't
*a58d3d2aSXin Li                   need LTP scaling; the LTP state is well-defined. */
*a58d3d2aSXin Li                condCoding = CODE_INDEPENDENTLY_NO_LTP_SCALING;
*a58d3d2aSXin Li            } else {
*a58d3d2aSXin Li                condCoding = CODE_CONDITIONALLY;
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li#ifdef ENABLE_OSCE
*a58d3d2aSXin Li            if ( channel_state[n].osce.method != decControl->osce_method ) {
*a58d3d2aSXin Li                osce_reset( &channel_state[n].osce, decControl->osce_method );
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li            ret += silk_decode_frame( &channel_state[ n ], psRangeDec, &samplesOut1_tmp[ n ][ 2 ], &nSamplesOutDec, lostFlag, condCoding,
*a58d3d2aSXin Li#ifdef ENABLE_DEEP_PLC
*a58d3d2aSXin Li                n == 0 ? lpcnet : NULL,
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li#ifdef ENABLE_OSCE
*a58d3d2aSXin Li                &psDec->osce_model,
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li                arch);
*a58d3d2aSXin Li        } else {
*a58d3d2aSXin Li            silk_memset( &samplesOut1_tmp[ n ][ 2 ], 0, nSamplesOutDec * sizeof( opus_int16 ) );
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li        channel_state[ n ].nFramesDecoded++;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    if( decControl->nChannelsAPI == 2 && decControl->nChannelsInternal == 2 ) {
*a58d3d2aSXin Li        /* Convert Mid/Side to Left/Right */
*a58d3d2aSXin Li        silk_stereo_MS_to_LR( &psDec->sStereo, samplesOut1_tmp[ 0 ], samplesOut1_tmp[ 1 ], MS_pred_Q13, channel_state[ 0 ].fs_kHz, nSamplesOutDec );
*a58d3d2aSXin Li    } else {
*a58d3d2aSXin Li        /* Buffering */
*a58d3d2aSXin Li        silk_memcpy( samplesOut1_tmp[ 0 ], psDec->sStereo.sMid, 2 * sizeof( opus_int16 ) );
*a58d3d2aSXin Li        silk_memcpy( psDec->sStereo.sMid, &samplesOut1_tmp[ 0 ][ nSamplesOutDec ], 2 * sizeof( opus_int16 ) );
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* Number of output samples */
*a58d3d2aSXin Li    *nSamplesOut = silk_DIV32( nSamplesOutDec * decControl->API_sampleRate, silk_SMULBB( channel_state[ 0 ].fs_kHz, 1000 ) );
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* Set up pointers to temp buffers */
*a58d3d2aSXin Li    ALLOC( samplesOut2_tmp,
*a58d3d2aSXin Li           decControl->nChannelsAPI == 2 ? *nSamplesOut : ALLOC_NONE, opus_int16 );
*a58d3d2aSXin Li    if( decControl->nChannelsAPI == 2 ) {
*a58d3d2aSXin Li        resample_out_ptr = samplesOut2_tmp;
*a58d3d2aSXin Li    } else {
*a58d3d2aSXin Li        resample_out_ptr = samplesOut;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    ALLOC( samplesOut1_tmp_storage2, delay_stack_alloc
*a58d3d2aSXin Li           ? decControl->nChannelsInternal*(channel_state[ 0 ].frame_length + 2 )
*a58d3d2aSXin Li           : ALLOC_NONE,
*a58d3d2aSXin Li           opus_int16 );
*a58d3d2aSXin Li    if ( delay_stack_alloc ) {
*a58d3d2aSXin Li       OPUS_COPY(samplesOut1_tmp_storage2, samplesOut, decControl->nChannelsInternal*(channel_state[ 0 ].frame_length + 2));
*a58d3d2aSXin Li       samplesOut1_tmp[ 0 ] = samplesOut1_tmp_storage2;
*a58d3d2aSXin Li       samplesOut1_tmp[ 1 ] = samplesOut1_tmp_storage2 + channel_state[ 0 ].frame_length + 2;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    for( n = 0; n < silk_min( decControl->nChannelsAPI, decControl->nChannelsInternal ); n++ ) {
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* Resample decoded signal to API_sampleRate */
*a58d3d2aSXin Li        ret += silk_resampler( &channel_state[ n ].resampler_state, resample_out_ptr, &samplesOut1_tmp[ n ][ 1 ], nSamplesOutDec );
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* Interleave if stereo output and stereo stream */
*a58d3d2aSXin Li        if( decControl->nChannelsAPI == 2 ) {
*a58d3d2aSXin Li            for( i = 0; i < *nSamplesOut; i++ ) {
*a58d3d2aSXin Li                samplesOut[ n + 2 * i ] = resample_out_ptr[ i ];
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* Create two channel output from mono stream */
*a58d3d2aSXin Li    if( decControl->nChannelsAPI == 2 && decControl->nChannelsInternal == 1 ) {
*a58d3d2aSXin Li        if ( stereo_to_mono ){
*a58d3d2aSXin Li            /* Resample right channel for newly collapsed stereo just in case
*a58d3d2aSXin Li               we weren't doing collapsing when switching to mono */
*a58d3d2aSXin Li            ret += silk_resampler( &channel_state[ 1 ].resampler_state, resample_out_ptr, &samplesOut1_tmp[ 0 ][ 1 ], nSamplesOutDec );
*a58d3d2aSXin Li
*a58d3d2aSXin Li            for( i = 0; i < *nSamplesOut; i++ ) {
*a58d3d2aSXin Li                samplesOut[ 1 + 2 * i ] = resample_out_ptr[ i ];
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li        } else {
*a58d3d2aSXin Li            for( i = 0; i < *nSamplesOut; i++ ) {
*a58d3d2aSXin Li                samplesOut[ 1 + 2 * i ] = samplesOut[ 0 + 2 * i ];
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* Export pitch lag, measured at 48 kHz sampling rate */
*a58d3d2aSXin Li    if( channel_state[ 0 ].prevSignalType == TYPE_VOICED ) {
*a58d3d2aSXin Li        int mult_tab[ 3 ] = { 6, 4, 3 };
*a58d3d2aSXin Li        decControl->prevPitchLag = channel_state[ 0 ].lagPrev * mult_tab[ ( channel_state[ 0 ].fs_kHz - 8 ) >> 2 ];
*a58d3d2aSXin Li    } else {
*a58d3d2aSXin Li        decControl->prevPitchLag = 0;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    if( lostFlag == FLAG_PACKET_LOST ) {
*a58d3d2aSXin Li       /* On packet loss, remove the gain clamping to prevent having the energy "bounce back"
*a58d3d2aSXin Li          if we lose packets when the energy is going down */
*a58d3d2aSXin Li       for ( i = 0; i < psDec->nChannelsInternal; i++ )
*a58d3d2aSXin Li          psDec->channel_state[ i ].LastGainIndex = 10;
*a58d3d2aSXin Li    } else {
*a58d3d2aSXin Li       psDec->prev_decode_only_middle = decode_only_middle;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    RESTORE_STACK;
*a58d3d2aSXin Li    return ret;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if 0
*a58d3d2aSXin Li/* Getting table of contents for a packet */
*a58d3d2aSXin Liopus_int silk_get_TOC(
*a58d3d2aSXin Li    const opus_uint8                *payload,           /* I    Payload data                                */
*a58d3d2aSXin Li    const opus_int                  nBytesIn,           /* I    Number of input bytes                       */
*a58d3d2aSXin Li    const opus_int                  nFramesPerPayload,  /* I    Number of SILK frames per payload           */
*a58d3d2aSXin Li    silk_TOC_struct                 *Silk_TOC           /* O    Type of content                             */
*a58d3d2aSXin Li)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    opus_int i, flags, ret = SILK_NO_ERROR;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    if( nBytesIn < 1 ) {
*a58d3d2aSXin Li        return -1;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    if( nFramesPerPayload < 0 || nFramesPerPayload > 3 ) {
*a58d3d2aSXin Li        return -1;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    silk_memset( Silk_TOC, 0, sizeof( *Silk_TOC ) );
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* For stereo, extract the flags for the mid channel */
*a58d3d2aSXin Li    flags = silk_RSHIFT( payload[ 0 ], 7 - nFramesPerPayload ) & ( silk_LSHIFT( 1, nFramesPerPayload + 1 ) - 1 );
*a58d3d2aSXin Li
*a58d3d2aSXin Li    Silk_TOC->inbandFECFlag = flags & 1;
*a58d3d2aSXin Li    for( i = nFramesPerPayload - 1; i >= 0 ; i-- ) {
*a58d3d2aSXin Li        flags = silk_RSHIFT( flags, 1 );
*a58d3d2aSXin Li        Silk_TOC->VADFlags[ i ] = flags & 1;
*a58d3d2aSXin Li        Silk_TOC->VADFlag |= flags & 1;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    return ret;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#endif