external/android-nn-driver/ArmnnPreparedModel_1_3.cpp

*3e777be0SXin Li//
*3e777be0SXin Li// Copyright © 2020-2023 Arm Ltd and Contributors. All rights reserved.
*3e777be0SXin Li// SPDX-License-Identifier: MIT
*3e777be0SXin Li//
*3e777be0SXin Li// Note: the ArmnnFencedExecutionCallback and code snippet in the executeFenced() function
*3e777be0SXin Li//       in this file is based on Android code
*3e777be0SXin Li//       under the Apache 2.0 license. See comments below for details.
*3e777be0SXin Li//
*3e777be0SXin Li
*3e777be0SXin Li#define LOG_TAG "ArmnnDriver"
*3e777be0SXin Li
*3e777be0SXin Li#include "ArmnnPreparedModel_1_3.hpp"
*3e777be0SXin Li#include "Utils.hpp"
*3e777be0SXin Li
*3e777be0SXin Li#include <armnn/Types.hpp>
*3e777be0SXin Li
*3e777be0SXin Li#include <Utils.h>
*3e777be0SXin Li#include <android/sync.h>
*3e777be0SXin Li#include <log/log.h>
*3e777be0SXin Li#include <OperationsUtils.h>
*3e777be0SXin Li#include <ExecutionBurstServer.h>
*3e777be0SXin Li#include <ValidateHal.h>
*3e777be0SXin Li
*3e777be0SXin Li#include <chrono>
*3e777be0SXin Li#include <cinttypes>
*3e777be0SXin Li
*3e777be0SXin Li#ifdef ARMNN_ANDROID_S
*3e777be0SXin Li#include <LegacyUtils.h>
*3e777be0SXin Li#endif
*3e777be0SXin Li
*3e777be0SXin Liusing namespace android;
*3e777be0SXin Liusing namespace android::hardware;
*3e777be0SXin Li
*3e777be0SXin Linamespace {
*3e777be0SXin Li
*3e777be0SXin Listatic const V1_2::Timing g_NoTiming = {.timeOnDevice = UINT64_MAX, .timeInDriver = UINT64_MAX};
*3e777be0SXin Liusing namespace armnn_driver;
*3e777be0SXin Liusing TimePoint = std::chrono::steady_clock::time_point;
*3e777be0SXin Li
*3e777be0SXin LiTimePoint Now()
*3e777be0SXin Li{
*3e777be0SXin Li    return std::chrono::steady_clock::now();
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Liunsigned long MicrosecondsDuration(TimePoint endPoint, TimePoint startPoint)
*3e777be0SXin Li{
*3e777be0SXin Li    return static_cast<unsigned long>(std::chrono::duration_cast<std::chrono::microseconds>(
*3e777be0SXin Li                                      endPoint - startPoint).count());
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Livoid NotifyCallbackAndCheck(const ::android::sp<V1_0::IExecutionCallback>& callback,
*3e777be0SXin Li                            V1_3::ErrorStatus errorStatus,
*3e777be0SXin Li                            std::vector<V1_2::OutputShape>,
*3e777be0SXin Li                            const V1_2::Timing,
*3e777be0SXin Li                            std::string callingFunction)
*3e777be0SXin Li{
*3e777be0SXin Li    Return<void> returned = callback->notify(convertToV1_0(errorStatus));
*3e777be0SXin Li    // This check is required, if the callback fails and it isn't checked it will bring down the service
*3e777be0SXin Li    if (!returned.isOk())
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",
*3e777be0SXin Li              callingFunction.c_str(), returned.description().c_str());
*3e777be0SXin Li    }
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Livoid NotifyCallbackAndCheck(const ::android::sp<V1_2::IExecutionCallback>& callback,
*3e777be0SXin Li                            V1_3::ErrorStatus errorStatus,
*3e777be0SXin Li                            std::vector<V1_2::OutputShape> outputShapes,
*3e777be0SXin Li                            const V1_2::Timing timing,
*3e777be0SXin Li                            std::string callingFunction)
*3e777be0SXin Li{
*3e777be0SXin Li    Return<void> returned = callback->notify_1_2(convertToV1_0(errorStatus), outputShapes, timing);
*3e777be0SXin Li    // This check is required, if the callback fails and it isn't checked it will bring down the service
*3e777be0SXin Li    if (!returned.isOk())
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",
*3e777be0SXin Li              callingFunction.c_str(), returned.description().c_str());
*3e777be0SXin Li    }
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Livoid NotifyCallbackAndCheck(const ::android::sp<V1_3::IExecutionCallback>& callback,
*3e777be0SXin Li                            V1_3::ErrorStatus errorStatus,
*3e777be0SXin Li                            std::vector<V1_2::OutputShape> outputShapes,
*3e777be0SXin Li                            const V1_2::Timing timing,
*3e777be0SXin Li                            std::string callingFunction)
*3e777be0SXin Li{
*3e777be0SXin Li    Return<void> returned = callback->notify_1_3(errorStatus, outputShapes, timing);
*3e777be0SXin Li    // This check is required, if the callback fails and it isn't checked it will bring down the service
*3e777be0SXin Li    if (!returned.isOk())
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnDriver::%s: hidl callback failed to return properly: %s",
*3e777be0SXin Li              callingFunction.c_str(), returned.description().c_str());
*3e777be0SXin Li    }
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Libool ValidateRequestArgument(const V1_0::RequestArgument& requestArg, const armnn::TensorInfo& tensorInfo)
*3e777be0SXin Li{
*3e777be0SXin Li    if (requestArg.dimensions.size() != 0)
*3e777be0SXin Li    {
*3e777be0SXin Li        if (requestArg.dimensions.size() != tensorInfo.GetNumDimensions())
*3e777be0SXin Li        {
*3e777be0SXin Li            ALOGE("Mismatched dimensions (request argument: %zu, expected: %u)",
*3e777be0SXin Li                  requestArg.dimensions.size(), tensorInfo.GetNumDimensions());
*3e777be0SXin Li            return false;
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        for (unsigned int d = 0; d < tensorInfo.GetNumDimensions(); ++d)
*3e777be0SXin Li        {
*3e777be0SXin Li            if (requestArg.dimensions[d] != 0 && requestArg.dimensions[d] != tensorInfo.GetShape()[d])
*3e777be0SXin Li            {
*3e777be0SXin Li                ALOGE("Mismatched size for dimension %d (request argument: %u, expected %u)",
*3e777be0SXin Li                      d, requestArg.dimensions[d], tensorInfo.GetShape()[d]);
*3e777be0SXin Li                return false;
*3e777be0SXin Li            }
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    return true;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Liarmnn::Tensor GetTensorForRequestArgument(const V1_0::RequestArgument& requestArg,
*3e777be0SXin Li                                          const armnn::TensorInfo& tensorInfo,
*3e777be0SXin Li                                          const std::vector<::android::nn::RunTimePoolInfo>& requestPools)
*3e777be0SXin Li{
*3e777be0SXin Li    if (!ValidateRequestArgument(requestArg, tensorInfo))
*3e777be0SXin Li    {
*3e777be0SXin Li        return armnn::Tensor();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    return armnn::Tensor(tensorInfo, GetMemoryFromPool(requestArg.location, requestPools));
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Liinline std::string BuildTensorName(const char* tensorNamePrefix, std::size_t index)
*3e777be0SXin Li{
*3e777be0SXin Li    return tensorNamePrefix + std::to_string(index);
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Li} // anonymous namespace
*3e777be0SXin Li
*3e777be0SXin Liusing namespace android::hardware;
*3e777be0SXin Li
*3e777be0SXin Linamespace armnn_driver
*3e777be0SXin Li{
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiRequestThread_1_3<ArmnnPreparedModel_1_3, HalVersion, CallbackContext_1_3>
*3e777be0SXin Li        ArmnnPreparedModel_1_3<HalVersion>::m_RequestThread;
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin Listd::unique_ptr<armnn::Threadpool> ArmnnPreparedModel_1_3<HalVersion>::m_Threadpool(nullptr);
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin Litemplate<typename TensorBindingCollection>
*3e777be0SXin Livoid ArmnnPreparedModel_1_3<HalVersion>::DumpTensorsIfRequired(char const* tensorNamePrefix,
*3e777be0SXin Li                                                               const TensorBindingCollection& tensorBindings)
*3e777be0SXin Li{
*3e777be0SXin Li    if (!m_RequestInputsAndOutputsDumpDir.empty())
*3e777be0SXin Li    {
*3e777be0SXin Li        const std::string requestName = std::to_string(m_NetworkId) + "_" + std::to_string(m_RequestCount) + ".dump";
*3e777be0SXin Li        for (std::size_t i = 0u; i < tensorBindings.size(); ++i)
*3e777be0SXin Li        {
*3e777be0SXin Li            DumpTensor(m_RequestInputsAndOutputsDumpDir,
*3e777be0SXin Li                       requestName,
*3e777be0SXin Li                       BuildTensorName(tensorNamePrefix, i),
*3e777be0SXin Li                       tensorBindings[i].second);
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiArmnnPreparedModel_1_3<HalVersion>::ArmnnPreparedModel_1_3(armnn::NetworkId networkId,
*3e777be0SXin Li                                                           armnn::IRuntime* runtime,
*3e777be0SXin Li                                                           const V1_3::Model& model,
*3e777be0SXin Li                                                           const std::string& requestInputsAndOutputsDumpDir,
*3e777be0SXin Li                                                           const bool gpuProfilingEnabled,
*3e777be0SXin Li                                                           V1_3::Priority priority,
*3e777be0SXin Li                                                           const bool asyncModelExecutionEnabled,
*3e777be0SXin Li                                                           const unsigned int numberOfThreads,
*3e777be0SXin Li                                                           const bool importEnabled,
*3e777be0SXin Li                                                           const bool exportEnabled)
*3e777be0SXin Li    : m_NetworkId(networkId)
*3e777be0SXin Li    , m_Runtime(runtime)
*3e777be0SXin Li    , m_Model(model)
*3e777be0SXin Li    , m_RequestCount(0)
*3e777be0SXin Li    , m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)
*3e777be0SXin Li    , m_GpuProfilingEnabled(gpuProfilingEnabled)
*3e777be0SXin Li    , m_ModelPriority(priority)
*3e777be0SXin Li    , m_AsyncModelExecutionEnabled(asyncModelExecutionEnabled)
*3e777be0SXin Li    , m_EnableImport(importEnabled)
*3e777be0SXin Li    , m_EnableExport(exportEnabled)
*3e777be0SXin Li    , m_PreparedFromCache(false)
*3e777be0SXin Li{
*3e777be0SXin Li    // Enable profiling if required.
*3e777be0SXin Li    m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);
*3e777be0SXin Li
*3e777be0SXin Li    if (m_AsyncModelExecutionEnabled)
*3e777be0SXin Li    {
*3e777be0SXin Li        std::vector<std::shared_ptr<armnn::IWorkingMemHandle>> memHandles;
*3e777be0SXin Li        for (unsigned int i=0; i < numberOfThreads; ++i)
*3e777be0SXin Li        {
*3e777be0SXin Li            memHandles.emplace_back(m_Runtime->CreateWorkingMemHandle(networkId));
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        if (!m_Threadpool)
*3e777be0SXin Li        {
*3e777be0SXin Li            m_Threadpool = std::make_unique<armnn::Threadpool>(numberOfThreads, runtime, memHandles);
*3e777be0SXin Li        }
*3e777be0SXin Li        else
*3e777be0SXin Li        {
*3e777be0SXin Li            m_Threadpool->LoadMemHandles(memHandles);
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        m_WorkingMemHandle = memHandles.back();
*3e777be0SXin Li    }
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiArmnnPreparedModel_1_3<HalVersion>::ArmnnPreparedModel_1_3(armnn::NetworkId networkId,
*3e777be0SXin Li                                                           armnn::IRuntime* runtime,
*3e777be0SXin Li                                                           const std::string& requestInputsAndOutputsDumpDir,
*3e777be0SXin Li                                                           const bool gpuProfilingEnabled,
*3e777be0SXin Li                                                           V1_3::Priority priority,
*3e777be0SXin Li                                                           const bool asyncModelExecutionEnabled,
*3e777be0SXin Li                                                           const unsigned int numberOfThreads,
*3e777be0SXin Li                                                           const bool importEnabled,
*3e777be0SXin Li                                                           const bool exportEnabled,
*3e777be0SXin Li                                                           const bool preparedFromCache)
*3e777be0SXin Li    : m_NetworkId(networkId)
*3e777be0SXin Li    , m_Runtime(runtime)
*3e777be0SXin Li    , m_RequestCount(0)
*3e777be0SXin Li    , m_RequestInputsAndOutputsDumpDir(requestInputsAndOutputsDumpDir)
*3e777be0SXin Li    , m_GpuProfilingEnabled(gpuProfilingEnabled)
*3e777be0SXin Li    , m_ModelPriority(priority)
*3e777be0SXin Li    , m_AsyncModelExecutionEnabled(asyncModelExecutionEnabled)
*3e777be0SXin Li    , m_EnableImport(importEnabled)
*3e777be0SXin Li    , m_EnableExport(exportEnabled)
*3e777be0SXin Li    , m_PreparedFromCache(preparedFromCache)
*3e777be0SXin Li{
*3e777be0SXin Li    // Enable profiling if required.
*3e777be0SXin Li    m_Runtime->GetProfiler(m_NetworkId)->EnableProfiling(m_GpuProfilingEnabled);
*3e777be0SXin Li
*3e777be0SXin Li    if (m_AsyncModelExecutionEnabled)
*3e777be0SXin Li    {
*3e777be0SXin Li        std::vector<std::shared_ptr<armnn::IWorkingMemHandle>> memHandles;
*3e777be0SXin Li        for (unsigned int i=0; i < numberOfThreads; ++i)
*3e777be0SXin Li        {
*3e777be0SXin Li            memHandles.emplace_back(m_Runtime->CreateWorkingMemHandle(networkId));
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        if (!m_Threadpool)
*3e777be0SXin Li        {
*3e777be0SXin Li            m_Threadpool = std::make_unique<armnn::Threadpool>(numberOfThreads, runtime, memHandles);
*3e777be0SXin Li        }
*3e777be0SXin Li        else
*3e777be0SXin Li        {
*3e777be0SXin Li            m_Threadpool->LoadMemHandles(memHandles);
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        m_WorkingMemHandle = memHandles.back();
*3e777be0SXin Li    }
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiArmnnPreparedModel_1_3<HalVersion>::~ArmnnPreparedModel_1_3()
*3e777be0SXin Li{
*3e777be0SXin Li    // Get a hold of the profiler used by this model.
*3e777be0SXin Li    std::shared_ptr<armnn::IProfiler> profiler = m_Runtime->GetProfiler(m_NetworkId);
*3e777be0SXin Li    if (profiler && m_GpuProfilingEnabled)
*3e777be0SXin Li    {
*3e777be0SXin Li        // Dump the profiling info to a file if required.
*3e777be0SXin Li        DumpJsonProfilingIfRequired(m_GpuProfilingEnabled, m_RequestInputsAndOutputsDumpDir, m_NetworkId,
*3e777be0SXin Li                                    profiler.get());
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Unload the network associated with this model.
*3e777be0SXin Li    m_Runtime->UnloadNetwork(m_NetworkId);
*3e777be0SXin Li
*3e777be0SXin Li    // Unload the network memhandles from the threadpool
*3e777be0SXin Li    if (m_AsyncModelExecutionEnabled)
*3e777be0SXin Li    {
*3e777be0SXin Li        m_Threadpool->UnloadMemHandles(m_NetworkId);
*3e777be0SXin Li    }
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiReturn <V1_0::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute(const V1_0::Request& request,
*3e777be0SXin Li        const ::android::sp<V1_0::IExecutionCallback>& callback)
*3e777be0SXin Li{
*3e777be0SXin Li    if (callback.get() == nullptr)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnPreparedModel_1_3::execute invalid callback passed");
*3e777be0SXin Li        return V1_0::ErrorStatus::INVALID_ARGUMENT;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    auto cb = [callback](V1_3::ErrorStatus errorStatus,
*3e777be0SXin Li                         std::vector<V1_2::OutputShape> outputShapes,
*3e777be0SXin Li                         const V1_2::Timing& timing,
*3e777be0SXin Li                         std::string callingFunction)
*3e777be0SXin Li    {
*3e777be0SXin Li        NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);
*3e777be0SXin Li    };
*3e777be0SXin Li
*3e777be0SXin Li
*3e777be0SXin Li    return convertToV1_0(Execute(convertToV1_3(request), V1_2::MeasureTiming::NO, cb));
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiReturn <V1_0::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute_1_2(
*3e777be0SXin Li    const V1_0::Request& request,
*3e777be0SXin Li    V1_2::MeasureTiming measureTiming,
*3e777be0SXin Li    const sp<V1_2::IExecutionCallback>& callback)
*3e777be0SXin Li{
*3e777be0SXin Li    if (callback.get() == nullptr)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnPreparedModel_1_3::execute_1_2 invalid callback passed");
*3e777be0SXin Li        return V1_0::ErrorStatus::INVALID_ARGUMENT;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    auto cb = [callback](V1_3::ErrorStatus errorStatus,
*3e777be0SXin Li                         std::vector<V1_2::OutputShape> outputShapes,
*3e777be0SXin Li                         const V1_2::Timing& timing,
*3e777be0SXin Li                         std::string callingFunction)
*3e777be0SXin Li    {
*3e777be0SXin Li        NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);
*3e777be0SXin Li    };
*3e777be0SXin Li
*3e777be0SXin Li    return convertToV1_0(Execute(convertToV1_3(request), measureTiming, cb));
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiReturn <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::execute_1_3(
*3e777be0SXin Li        const V1_3::Request& request,
*3e777be0SXin Li        V1_2::MeasureTiming measureTiming,
*3e777be0SXin Li        const V1_3::OptionalTimePoint&,
*3e777be0SXin Li        const V1_3::OptionalTimeoutDuration&,
*3e777be0SXin Li        const sp<V1_3::IExecutionCallback>& callback)
*3e777be0SXin Li{
*3e777be0SXin Li    if (callback.get() == nullptr)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnPreparedModel_1_3::execute_1_3 invalid callback passed");
*3e777be0SXin Li        return V1_3::ErrorStatus::INVALID_ARGUMENT;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    auto cb = [callback](V1_3::ErrorStatus errorStatus,
*3e777be0SXin Li                         std::vector<V1_2::OutputShape> outputShapes,
*3e777be0SXin Li                         const V1_2::Timing& timing,
*3e777be0SXin Li                         std::string callingFunction)
*3e777be0SXin Li    {
*3e777be0SXin Li        NotifyCallbackAndCheck(callback, errorStatus, outputShapes, timing, callingFunction);
*3e777be0SXin Li    };
*3e777be0SXin Li
*3e777be0SXin Li    return Execute(request, measureTiming, cb);
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Li/// This class is inspired by the sample implementation in Android named SampleFencedExecutionCallback.
*3e777be0SXin Li/// The original code is licensed under Apache-2.0 and can be found at the following link:
*3e777be0SXin Li/// https://android.googlesource.com/platform/frameworks/ml/+/master/nn/driver/sample/SampleDriver.h
*3e777be0SXin Liclass ArmnnFencedExecutionCallback : public V1_3::IFencedExecutionCallback
*3e777be0SXin Li{
*3e777be0SXin Lipublic:
*3e777be0SXin Li    ArmnnFencedExecutionCallback(V1_3::ErrorStatus errorStatus, V1_2::Timing timing, V1_2::Timing fenceTiming)
*3e777be0SXin Li        : m_ErrorStatus(errorStatus), m_Timing(timing), m_FenceTiming(fenceTiming) {}
*3e777be0SXin Li    ~ArmnnFencedExecutionCallback() {}
*3e777be0SXin Li
*3e777be0SXin Li    Return<void> getExecutionInfo(getExecutionInfo_cb callback) override
*3e777be0SXin Li    {
*3e777be0SXin Li        callback(m_ErrorStatus, m_Timing, m_FenceTiming);
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Liprivate:
*3e777be0SXin Li    V1_3::ErrorStatus m_ErrorStatus;
*3e777be0SXin Li    V1_2::Timing m_Timing;
*3e777be0SXin Li    V1_2::Timing m_FenceTiming;
*3e777be0SXin Li};
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiReturn<void> ArmnnPreparedModel_1_3<HalVersion>::executeFenced(const V1_3::Request& request,
*3e777be0SXin Li                                                               const hidl_vec<hidl_handle>& fenceWaitFor,
*3e777be0SXin Li                                                               V1_2::MeasureTiming measureTiming,
*3e777be0SXin Li                                                               const V1_3::OptionalTimePoint& deadline,
*3e777be0SXin Li                                                               const V1_3::OptionalTimeoutDuration& loopTimeoutDuration,
*3e777be0SXin Li                                                               const V1_3::OptionalTimeoutDuration&,
*3e777be0SXin Li                                                               executeFenced_cb cb)
*3e777be0SXin Li{
*3e777be0SXin Li    ALOGV("ArmnnPreparedModel_1_3::executeFenced(...)");
*3e777be0SXin Li    if (cb == nullptr)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnPreparedModel_1_3::executeFenced invalid callback passed");
*3e777be0SXin Li        cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (deadline.getDiscriminator() != V1_3::OptionalTimePoint::hidl_discriminator::none)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnPreparedModel_1_3::executeFenced parameter deadline is set but not supported.");
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (loopTimeoutDuration.getDiscriminator() != V1_3::OptionalTimeoutDuration::hidl_discriminator::none)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnPreparedModel_1_3::executeFenced parameter loopTimeoutDuration is set but not supported.");
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!m_PreparedFromCache && !android::nn::validateRequest(request, m_Model, /*allowUnspecifiedOutput=*/false))
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGV("ArmnnPreparedModel_1_3::executeFenced outputs must be specified for fenced execution ");
*3e777be0SXin Li        cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    ExecutionContext_1_3 ctx;
*3e777be0SXin Li    if (measureTiming == V1_2::MeasureTiming::YES)
*3e777be0SXin Li    {
*3e777be0SXin Li        ctx.measureTimings = measureTiming;
*3e777be0SXin Li        ctx.driverStart = Now();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!m_PreparedFromCache)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGV("ArmnnPreparedModel_1_3::executeFenced(): %s", GetModelSummary(m_Model).c_str());
*3e777be0SXin Li    }
*3e777be0SXin Li    m_RequestCount++;
*3e777be0SXin Li
*3e777be0SXin Li    if (!m_RequestInputsAndOutputsDumpDir.empty())
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&cb));
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // This code snippet is inspired by the sample implementation in Android named SampleDriver::executeFenced()
*3e777be0SXin Li    // function. The original code is licensed under Apache-2.0 and can be found at the following link:
*3e777be0SXin Li    // https://android.googlesource.com/platform/frameworks/ml/+/master/nn/driver/sample/SampleDriver.cpp
*3e777be0SXin Li    const auto fenceSize = fenceWaitFor.size();
*3e777be0SXin Li    for (unsigned int index = 0; index < fenceSize; ++index)
*3e777be0SXin Li    {
*3e777be0SXin Li        auto fenceNativeHandle = fenceWaitFor[index].getNativeHandle();
*3e777be0SXin Li        if (!fenceNativeHandle)
*3e777be0SXin Li        {
*3e777be0SXin Li            cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);
*3e777be0SXin Li            return Void();
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        if (fenceNativeHandle->numFds != 1)
*3e777be0SXin Li        {
*3e777be0SXin Li            cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);
*3e777be0SXin Li            return Void();
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        if (sync_wait(fenceNativeHandle->data[0], -1) < 0)
*3e777be0SXin Li        {
*3e777be0SXin Li            ALOGE("ArmnnPreparedModel_1_3::executeFenced sync fence failed.");
*3e777be0SXin Li            cb(V1_3::ErrorStatus::GENERAL_FAILURE, hidl_handle(nullptr), nullptr);
*3e777be0SXin Li            return Void();
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    TimePoint fenceExecutionStart;
*3e777be0SXin Li    if (measureTiming == V1_2::MeasureTiming::YES)
*3e777be0SXin Li    {
*3e777be0SXin Li        fenceExecutionStart = Now();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // map the memory pool into shared pointers
*3e777be0SXin Li    // use a shared memory pools vector on the heap, as it is passed to the request thread
*3e777be0SXin Li    auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();
*3e777be0SXin Li
*3e777be0SXin Li    // allocate the tensors on the heap, as they are passed to the request thread
*3e777be0SXin Li    auto inputs = std::make_shared<armnn::InputTensors>();
*3e777be0SXin Li    auto outputs = std::make_shared<armnn::OutputTensors>();
*3e777be0SXin Li
*3e777be0SXin Li    auto [status, outShapes, timings, message] = PrepareMemoryForIO(*inputs, *outputs, *memPools, request);
*3e777be0SXin Li    if (status != V1_3::ErrorStatus::NONE)
*3e777be0SXin Li    {
*3e777be0SXin Li        cb(V1_3::ErrorStatus::INVALID_ARGUMENT, hidl_handle(nullptr), nullptr);
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    ALOGV("ArmnnPreparedModel_1_3::executeFenced(...) before ExecuteGraph");
*3e777be0SXin Li
*3e777be0SXin Li    // call it with nullCallback for now as we will report the error status from here..
*3e777be0SXin Li    auto nullCallback = [](V1_3::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};
*3e777be0SXin Li    CallbackContext_1_3 cbCtx;
*3e777be0SXin Li    cbCtx.callback = nullCallback;
*3e777be0SXin Li    cbCtx.ctx = ctx;
*3e777be0SXin Li
*3e777be0SXin Li    auto errorStatus = ExecuteGraph(memPools, *inputs, *outputs, cbCtx);
*3e777be0SXin Li    if (errorStatus != V1_3::ErrorStatus::NONE)
*3e777be0SXin Li    {
*3e777be0SXin Li        cb(errorStatus, hidl_handle(nullptr), nullptr);
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Li    ALOGV("ArmnnPreparedModel_1_3::executeFenced(...) after ExecuteGraph");
*3e777be0SXin Li
*3e777be0SXin Li    V1_2::Timing timing = g_NoTiming;
*3e777be0SXin Li    V1_2::Timing fenceTiming = g_NoTiming;
*3e777be0SXin Li    if (measureTiming == V1_2::MeasureTiming::YES)
*3e777be0SXin Li    {
*3e777be0SXin Li        fenceTiming.timeOnDevice = MicrosecondsDuration(ctx.deviceEnd, ctx.deviceStart);
*3e777be0SXin Li        fenceTiming.timeInDriver = MicrosecondsDuration(ctx.driverEnd, fenceExecutionStart);
*3e777be0SXin Li        ALOGV("ArmnnPreparedModel_1_3::fenceFinishExecutionTiming - Device = %lu Driver = %lu",
*3e777be0SXin Li              static_cast<unsigned long>(fenceTiming.timeOnDevice),
*3e777be0SXin Li              static_cast<unsigned long>(fenceTiming.timeInDriver));
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    sp<ArmnnFencedExecutionCallback> armnnFencedExecutionCallback =
*3e777be0SXin Li        new ArmnnFencedExecutionCallback(V1_3::ErrorStatus::NONE, timing, fenceTiming);
*3e777be0SXin Li    cb(V1_3::ErrorStatus::NONE, hidl_handle(nullptr), armnnFencedExecutionCallback);
*3e777be0SXin Li    return Void();
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiReturn<V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForInputs(
*3e777be0SXin Li    armnn::InputTensors& inputs,
*3e777be0SXin Li    const V1_3::Request& request,
*3e777be0SXin Li    const std::vector<android::nn::RunTimePoolInfo>& memPools)
*3e777be0SXin Li{
*3e777be0SXin Li    inputs.reserve(request.inputs.size());
*3e777be0SXin Li    for (unsigned int i = 0; i < request.inputs.size(); i++)
*3e777be0SXin Li    {
*3e777be0SXin Li        const auto& inputArg = request.inputs[i];
*3e777be0SXin Li        armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);
*3e777be0SXin Li        // inputs (of type InputTensors) is composed of a vector of ConstTensors.
*3e777be0SXin Li        // Therefore, set all TensorInfo isConstant parameters of input Tensors to true.
*3e777be0SXin Li        inputTensorInfo.SetConstant();
*3e777be0SXin Li        auto result = ValidateRequestArgument<V1_3::ErrorStatus, V1_3::Request>(request,
*3e777be0SXin Li                                                                                inputTensorInfo,
*3e777be0SXin Li                                                                                inputArg,
*3e777be0SXin Li                                                                                "input");
*3e777be0SXin Li
*3e777be0SXin Li        if (result != V1_3::ErrorStatus::NONE)
*3e777be0SXin Li        {
*3e777be0SXin Li            return result;
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        const armnn::Tensor inputTensor = GetTensorForRequestArgument(inputArg, inputTensorInfo, memPools);
*3e777be0SXin Li
*3e777be0SXin Li        if (inputTensor.GetMemoryArea() == nullptr)
*3e777be0SXin Li        {
*3e777be0SXin Li            ALOGE("Cannot execute request. Error converting request input %u to tensor", i);
*3e777be0SXin Li            return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        inputs.emplace_back(i, inputTensor);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiReturn<V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForOutputs(
*3e777be0SXin Li    armnn::OutputTensors& outputs,
*3e777be0SXin Li    std::vector<V1_2::OutputShape> &outputShapes,
*3e777be0SXin Li    const V1_3::Request& request,
*3e777be0SXin Li    const std::vector<android::nn::RunTimePoolInfo>& memPools)
*3e777be0SXin Li{
*3e777be0SXin Li    outputs.reserve(request.outputs.size());
*3e777be0SXin Li    for (unsigned int i = 0; i < request.outputs.size(); i++)
*3e777be0SXin Li    {
*3e777be0SXin Li        const auto& outputArg = request.outputs[i];
*3e777be0SXin Li        armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);
*3e777be0SXin Li        auto result = ValidateRequestArgument<V1_3::ErrorStatus, V1_3::Request>(request,
*3e777be0SXin Li                                                                                outputTensorInfo,
*3e777be0SXin Li                                                                                outputArg,
*3e777be0SXin Li                                                                                "output");
*3e777be0SXin Li
*3e777be0SXin Li        if (result != V1_3::ErrorStatus::NONE)
*3e777be0SXin Li        {
*3e777be0SXin Li            return result;
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        const armnn::Tensor outputTensor = GetTensorForRequestArgument(outputArg, outputTensorInfo, memPools);
*3e777be0SXin Li
*3e777be0SXin Li        if (outputTensor.GetMemoryArea() == nullptr)
*3e777be0SXin Li        {
*3e777be0SXin Li            ALOGE("Cannot execute request. Error converting request output %u to tensor", i);
*3e777be0SXin Li            return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li        }
*3e777be0SXin Li        const size_t outputSize = outputTensorInfo.GetNumBytes();
*3e777be0SXin Li
*3e777be0SXin Li        unsigned int count = 0;
*3e777be0SXin Li        std::for_each(outputArg.dimensions.begin(), outputArg.dimensions.end(), [&](auto dim)
*3e777be0SXin Li        {
*3e777be0SXin Li            if (dim != 0)
*3e777be0SXin Li            {
*3e777be0SXin Li                outputTensorInfo.GetShape()[count] = dim;
*3e777be0SXin Li            }
*3e777be0SXin Li            else
*3e777be0SXin Li            {
*3e777be0SXin Li                outputTensorInfo.GetShape()[count] = outputArg.dimensions.size();
*3e777be0SXin Li            }
*3e777be0SXin Li
*3e777be0SXin Li            count++;
*3e777be0SXin Li        });
*3e777be0SXin Li
*3e777be0SXin Li        outputs.emplace_back(i, outputTensor);
*3e777be0SXin Li        outputShapes[i] = ComputeShape(outputTensorInfo);
*3e777be0SXin Li
*3e777be0SXin Li        if (outputArg.location.length < outputSize)
*3e777be0SXin Li        {
*3e777be0SXin Li            ALOGW("ArmnnPreparedModel_1_3::Execute failed outputArg.location.length (%s) < outputSize (%s)",
*3e777be0SXin Li                std::to_string(outputArg.location.length).c_str(), std::to_string(outputSize).c_str());
*3e777be0SXin Li            outputShapes[i].isSufficient = false;
*3e777be0SXin Li            return V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        size_t bufferSize = 0;
*3e777be0SXin Li#if !defined(ARMNN_ANDROID_S)
*3e777be0SXin Li        bufferSize = memPools.at(outputArg.location.poolIndex).getHidlMemory().size();
*3e777be0SXin Li#else
*3e777be0SXin Li        bufferSize = memPools.at(outputArg.location.poolIndex).getSize();
*3e777be0SXin Li#endif
*3e777be0SXin Li        if (bufferSize < outputSize)
*3e777be0SXin Li        {
*3e777be0SXin Li            ALOGW("ArmnnPreparedModel_1_3::Execute failed bufferSize (%s) < outputSize (%s)",
*3e777be0SXin Li                  std::to_string(bufferSize).c_str(), std::to_string(outputSize).c_str());
*3e777be0SXin Li            outputShapes[i].isSufficient = false;
*3e777be0SXin Li            return V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE;
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin Listd::tuple<V1_3::ErrorStatus, hidl_vec<V1_2::OutputShape>, V1_2::Timing, std::string>
*3e777be0SXin Li    ArmnnPreparedModel_1_3<HalVersion>::PrepareMemoryForIO(armnn::InputTensors& inputs,
*3e777be0SXin Li                                                           armnn::OutputTensors& outputs,
*3e777be0SXin Li                                                           std::vector<android::nn::RunTimePoolInfo>& memPools,
*3e777be0SXin Li                                                           const V1_3::Request& request)
*3e777be0SXin Li{
*3e777be0SXin Li#if !defined(ARMNN_ANDROID_S)
*3e777be0SXin Li    if (!setRunTimePoolInfosFromMemoryPools(&memPools, request.pools))
*3e777be0SXin Li#else
*3e777be0SXin Li    if (!setRunTimePoolInfosFromMemoryPools(&memPools, uncheckedConvert(request.pools)))
*3e777be0SXin Li#endif
*3e777be0SXin Li    {
*3e777be0SXin Li        return {V1_3::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // add the inputs and outputs with their data
*3e777be0SXin Li    try
*3e777be0SXin Li    {
*3e777be0SXin Li        if (PrepareMemoryForInputs(inputs, request, memPools) != V1_3::ErrorStatus::NONE)
*3e777be0SXin Li        {
*3e777be0SXin Li            return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        std::vector<V1_2::OutputShape> outputShapes(request.outputs.size());
*3e777be0SXin Li
*3e777be0SXin Li        auto errorStatus = PrepareMemoryForOutputs(outputs, outputShapes, request, memPools);
*3e777be0SXin Li        if (errorStatus != V1_3::ErrorStatus::NONE)
*3e777be0SXin Li        {
*3e777be0SXin Li            return {errorStatus, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li    catch (armnn::Exception& e)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("armnn::Exception caught while preparing for EnqueueWorkload: %s", e.what());
*3e777be0SXin Li        return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};
*3e777be0SXin Li    }
*3e777be0SXin Li    catch (std::exception& e)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("std::exception caught while preparing for EnqueueWorkload: %s", e.what());
*3e777be0SXin Li        return {V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    return {V1_3::ErrorStatus::NONE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute"};
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin Litemplate<typename CallbackContext>
*3e777be0SXin LiReturn<void> ArmnnPreparedModel_1_3<HalVersion>::ExecuteSynchronously(const V1_3::Request& request,
*3e777be0SXin Li                                                                      CallbackContext cbCtx)
*3e777be0SXin Li{
*3e777be0SXin Li    if (cbCtx.ctx.measureTimings == V1_2::MeasureTiming::YES)
*3e777be0SXin Li    {
*3e777be0SXin Li        cbCtx.ctx.driverStart = Now();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!m_PreparedFromCache && !android::nn::validateRequest(convertToV1_3(request), m_Model))
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");
*3e777be0SXin Li        cbCtx.callback(V1_3::ErrorStatus::INVALID_ARGUMENT,
*3e777be0SXin Li                       {},
*3e777be0SXin Li                       g_NoTiming,
*3e777be0SXin Li                       "ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!m_PreparedFromCache && !android::nn::validateRequest(request, m_Model))
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");
*3e777be0SXin Li        cbCtx.callback(V1_3::ErrorStatus::INVALID_ARGUMENT,
*3e777be0SXin Li                       {},
*3e777be0SXin Li                       g_NoTiming,
*3e777be0SXin Li                       "ArmnnPreparedModel_1_3::ExecuteSynchronously invalid request model");
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li
*3e777be0SXin Li    // map the memory pool into shared pointers
*3e777be0SXin Li    // use a shared memory pools vector on the heap, as it is passed to the request thread
*3e777be0SXin Li    auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();
*3e777be0SXin Li
*3e777be0SXin Li    // allocate the tensors on the heap, as they are passed to the request thread
*3e777be0SXin Li    auto inputs = std::make_shared<armnn::InputTensors>();
*3e777be0SXin Li    auto outputs = std::make_shared<armnn::OutputTensors>();
*3e777be0SXin Li
*3e777be0SXin Li    auto [status, outputShapes, timing, message] = PrepareMemoryForIO(*inputs, *outputs, *memPools, request);
*3e777be0SXin Li    if (status != V1_3::ErrorStatus::NONE)
*3e777be0SXin Li    {
*3e777be0SXin Li        cbCtx.callback(status, outputShapes, timing, message);
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    ALOGV("ArmnnPreparedModel_1_3::ExecuteSynchronously() before Execution");
*3e777be0SXin Li
*3e777be0SXin Li    ExecuteGraph(memPools, *inputs, *outputs, cbCtx);
*3e777be0SXin Li    return Void();
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiReturn<void> ArmnnPreparedModel_1_3<HalVersion>::executeSynchronously(const V1_0::Request& request,
*3e777be0SXin Li                                                                      V1_2::MeasureTiming measureTiming,
*3e777be0SXin Li                                                                      executeSynchronously_cb cb)
*3e777be0SXin Li{
*3e777be0SXin Li    if (!m_PreparedFromCache)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGV("ArmnnPreparedModel_1_3::executeSynchronously(): %s", GetModelSummary(m_Model).c_str());
*3e777be0SXin Li    }
*3e777be0SXin Li    m_RequestCount++;
*3e777be0SXin Li
*3e777be0SXin Li    if (cb == nullptr)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnPreparedModel_1_3::executeSynchronously invalid callback passed");
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    auto cbWrapper = [cb](V1_3::ErrorStatus errorStatus,
*3e777be0SXin Li                          std::vector<V1_2::OutputShape> outputShapes,
*3e777be0SXin Li                          const V1_2::Timing& timing,
*3e777be0SXin Li                          std::string)
*3e777be0SXin Li    {
*3e777be0SXin Li        cb(convertToV1_0(errorStatus), outputShapes, timing);
*3e777be0SXin Li    };
*3e777be0SXin Li
*3e777be0SXin Li    CallbackContext_1_3 cbCtx;
*3e777be0SXin Li    cbCtx.callback = cbWrapper;
*3e777be0SXin Li    cbCtx.ctx.measureTimings = measureTiming;
*3e777be0SXin Li
*3e777be0SXin Li    ExecuteSynchronously(convertToV1_3(request), cbCtx);
*3e777be0SXin Li    return Void();
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiReturn<void>  ArmnnPreparedModel_1_3<HalVersion>::executeSynchronously_1_3(
*3e777be0SXin Li        const V1_3::Request& request,
*3e777be0SXin Li        V1_2::MeasureTiming measureTiming,
*3e777be0SXin Li        const V1_3::OptionalTimePoint& deadline,
*3e777be0SXin Li        const V1_3::OptionalTimeoutDuration& loopTimeoutDuration,
*3e777be0SXin Li        executeSynchronously_1_3_cb cb)
*3e777be0SXin Li{
*3e777be0SXin Li    if (!m_PreparedFromCache)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGV("ArmnnPreparedModel_1_3::executeSynchronously_1_3(): %s", GetModelSummary(m_Model).c_str());
*3e777be0SXin Li    }
*3e777be0SXin Li    m_RequestCount++;
*3e777be0SXin Li
*3e777be0SXin Li    if (cb == nullptr)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnPreparedModel_1_3::executeSynchronously_1_3 invalid callback passed");
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (deadline.getDiscriminator() != V1_3::OptionalTimePoint::hidl_discriminator::none)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnPreparedModel_1_3::executeSynchronously_1_3 parameter deadline is set but not supported.");
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (loopTimeoutDuration.getDiscriminator() != V1_3::OptionalTimeoutDuration::hidl_discriminator::none)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW(
*3e777be0SXin Li           "ArmnnPreparedModel_1_3::executeSynchronously_1_3 parameter loopTimeoutDuration is set but not supported.");
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    auto cbWrapper = [cb](V1_3::ErrorStatus errorStatus,
*3e777be0SXin Li                          std::vector<V1_2::OutputShape> outputShapes,
*3e777be0SXin Li                          const V1_2::Timing& timing,
*3e777be0SXin Li                          std::string)
*3e777be0SXin Li    {
*3e777be0SXin Li        cb(errorStatus, outputShapes, timing);
*3e777be0SXin Li    };
*3e777be0SXin Li
*3e777be0SXin Li    CallbackContext_1_3 cbCtx;
*3e777be0SXin Li    cbCtx.callback = cbWrapper;
*3e777be0SXin Li    cbCtx.ctx.measureTimings = measureTiming;
*3e777be0SXin Li
*3e777be0SXin Li    ExecuteSynchronously(request, cbCtx);
*3e777be0SXin Li    return Void();
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiReturn<void> ArmnnPreparedModel_1_3<HalVersion>::configureExecutionBurst(
*3e777be0SXin Li        const sp<V1_2::IBurstCallback>& callback,
*3e777be0SXin Li        const MQDescriptorSync<V1_2::FmqRequestDatum>& requestChannel,
*3e777be0SXin Li        const MQDescriptorSync<V1_2::FmqResultDatum>& resultChannel,
*3e777be0SXin Li        V1_3::IPreparedModel::configureExecutionBurst_cb cb)
*3e777be0SXin Li{
*3e777be0SXin Li    ALOGV("ArmnnPreparedModel_1_3::configureExecutionBurst");
*3e777be0SXin Li    const sp<V1_2::IBurstContext> burst = ExecutionBurstServer::create(callback,
*3e777be0SXin Li                                                                       requestChannel,
*3e777be0SXin Li                                                                       resultChannel,
*3e777be0SXin Li                                                                       this);
*3e777be0SXin Li
*3e777be0SXin Li    if (burst == nullptr)
*3e777be0SXin Li    {
*3e777be0SXin Li        cb(V1_0::ErrorStatus::GENERAL_FAILURE, {});
*3e777be0SXin Li    }
*3e777be0SXin Li    else
*3e777be0SXin Li    {
*3e777be0SXin Li        cb(V1_0::ErrorStatus::NONE, burst);
*3e777be0SXin Li    }
*3e777be0SXin Li    return Void();
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin Litemplate<typename CallbackContext>
*3e777be0SXin LiReturn <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::ExecuteGraph(
*3e777be0SXin Li    std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,
*3e777be0SXin Li    armnn::InputTensors& inputTensors,
*3e777be0SXin Li    armnn::OutputTensors& outputTensors,
*3e777be0SXin Li    CallbackContext cb)
*3e777be0SXin Li{
*3e777be0SXin Li    ALOGV("ArmnnPreparedModel_1_3::ExecuteGraph(...)");
*3e777be0SXin Li    // Capture the graph execution start time.
*3e777be0SXin Li    std::chrono::time_point<std::chrono::system_clock> graphExecutionStart = std::chrono::system_clock::now();
*3e777be0SXin Li
*3e777be0SXin Li    DumpTensorsIfRequired("Input", inputTensors);
*3e777be0SXin Li
*3e777be0SXin Li    std::vector<V1_2::OutputShape> outputShapes(outputTensors.size());
*3e777be0SXin Li    for (unsigned int i = 0; i < outputTensors.size(); i++)
*3e777be0SXin Li    {
*3e777be0SXin Li        std::pair<int, armnn::Tensor> outputTensorPair = outputTensors[i];
*3e777be0SXin Li        const armnn::Tensor outputTensor = outputTensorPair.second;
*3e777be0SXin Li        const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();
*3e777be0SXin Li
*3e777be0SXin Li        outputShapes[i] = ComputeShape(outputTensorInfo);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // run it
*3e777be0SXin Li    try
*3e777be0SXin Li    {
*3e777be0SXin Li        if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)
*3e777be0SXin Li        {
*3e777be0SXin Li            cb.ctx.deviceStart = Now();
*3e777be0SXin Li        }
*3e777be0SXin Li        armnn::Status status;
*3e777be0SXin Li        if (m_AsyncModelExecutionEnabled)
*3e777be0SXin Li        {
*3e777be0SXin Li            ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph m_AsyncModelExecutionEnabled true");
*3e777be0SXin Li            status = m_Runtime->Execute(*m_WorkingMemHandle, inputTensors, outputTensors);
*3e777be0SXin Li        }
*3e777be0SXin Li        else
*3e777be0SXin Li        {
*3e777be0SXin Li            ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph m_AsyncModelExecutionEnabled false");
*3e777be0SXin Li            // Create a vector of Input and Output Ids which can be imported. An empty vector means all will be copied.
*3e777be0SXin Li            std::vector<armnn::ImportedInputId> importedInputIds;
*3e777be0SXin Li            if (m_EnableImport)
*3e777be0SXin Li            {
*3e777be0SXin Li                importedInputIds =  m_Runtime->ImportInputs(m_NetworkId, inputTensors, armnn::MemorySource::Malloc);
*3e777be0SXin Li            }
*3e777be0SXin Li            std::vector<armnn::ImportedOutputId> importedOutputIds;
*3e777be0SXin Li            if (m_EnableExport)
*3e777be0SXin Li            {
*3e777be0SXin Li                importedOutputIds = m_Runtime->ImportOutputs(m_NetworkId, outputTensors, armnn::MemorySource::Malloc);
*3e777be0SXin Li            }
*3e777be0SXin Li            status = m_Runtime->EnqueueWorkload(m_NetworkId, inputTensors, outputTensors,
*3e777be0SXin Li                                                importedInputIds, importedOutputIds);
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)
*3e777be0SXin Li        {
*3e777be0SXin Li            cb.ctx.deviceEnd = Now();
*3e777be0SXin Li        }
*3e777be0SXin Li        if (status != armnn::Status::Success)
*3e777be0SXin Li        {
*3e777be0SXin Li            ALOGW("ArmnnPreparedModel_1_3::ExecuteGraph EnqueueWorkload failed");
*3e777be0SXin Li            cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");
*3e777be0SXin Li            return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li    catch (armnn::Exception& e)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("armnn:Exception caught from EnqueueWorkload: %s", e.what());
*3e777be0SXin Li        cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");
*3e777be0SXin Li        return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li    }
*3e777be0SXin Li    catch (std::exception& e)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("std::exception caught from EnqueueWorkload: %s", e.what());
*3e777be0SXin Li        cb.callback(V1_3::ErrorStatus::GENERAL_FAILURE, {}, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");
*3e777be0SXin Li        return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    CommitPools(*pMemPools);
*3e777be0SXin Li
*3e777be0SXin Li    DumpTensorsIfRequired("Output", outputTensors);
*3e777be0SXin Li
*3e777be0SXin Li    if (cb.ctx.measureTimings == V1_2::MeasureTiming::YES)
*3e777be0SXin Li    {
*3e777be0SXin Li        cb.ctx.driverEnd = Now();
*3e777be0SXin Li        V1_2::Timing timing;
*3e777be0SXin Li        timing.timeOnDevice = MicrosecondsDuration(cb.ctx.deviceEnd, cb.ctx.deviceStart);
*3e777be0SXin Li        timing.timeInDriver = MicrosecondsDuration(cb.ctx.driverEnd, cb.ctx.driverStart);
*3e777be0SXin Li        ALOGV("ArmnnPreparedModel_1_3::execute timing - Device = %lu Driver = %lu",
*3e777be0SXin Li              static_cast<unsigned long>(timing.timeOnDevice), static_cast<unsigned long>(timing.timeInDriver));
*3e777be0SXin Li        cb.callback(V1_3::ErrorStatus::NONE, outputShapes, timing, "ArmnnPreparedModel_1_3::ExecuteGraph");
*3e777be0SXin Li    } else
*3e777be0SXin Li    {
*3e777be0SXin Li        cb.callback(V1_3::ErrorStatus::NONE, outputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");
*3e777be0SXin Li    }
*3e777be0SXin Li    // Log the total time in this call. This is a good number to compare to that printed out by
*3e777be0SXin Li    // RuntimeImpl::EnqueueWorkload. The difference should be the execution overhead of the driver.
*3e777be0SXin Li    ALOGI("ArmnnPreparedModel_1_3::ExecuteGraph Execution time = %lld µs",
*3e777be0SXin Li          std::chrono::duration_cast<std::chrono::microseconds>
*3e777be0SXin Li          (std::chrono::system_clock::now() - graphExecutionStart).count());
*3e777be0SXin Li    return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Li/// Schedule the graph prepared from the request for execution
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin Litemplate<typename CallbackContext>
*3e777be0SXin Livoid ArmnnPreparedModel_1_3<HalVersion>::ScheduleGraphForExecution(
*3e777be0SXin Li        std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,
*3e777be0SXin Li        std::shared_ptr<armnn::InputTensors>& inputTensors,
*3e777be0SXin Li        std::shared_ptr<armnn::OutputTensors>& outputTensors,
*3e777be0SXin Li        CallbackContext callbackContext,
*3e777be0SXin Li        armnn::QosExecPriority priority)
*3e777be0SXin Li{
*3e777be0SXin Li    ALOGV("ArmnnPreparedModel_1_3::ScheduleGraphForExecution(...)");
*3e777be0SXin Li
*3e777be0SXin Li    DumpTensorsIfRequired("Input", *inputTensors);
*3e777be0SXin Li
*3e777be0SXin Li    unsigned int outputTensorSize = outputTensors.get()->size();
*3e777be0SXin Li    std::vector<V1_2::OutputShape> outputShapes(outputTensorSize);
*3e777be0SXin Li    for (unsigned int i = 0; i < outputTensorSize; i++)
*3e777be0SXin Li    {
*3e777be0SXin Li        std::pair<int, armnn::Tensor> outputTensorPair = outputTensors.get()->at(i);
*3e777be0SXin Li        const armnn::Tensor outputTensor = outputTensorPair.second;
*3e777be0SXin Li        const armnn::TensorInfo outputTensorInfo = outputTensor.GetInfo();
*3e777be0SXin Li
*3e777be0SXin Li        outputShapes[i] = ComputeShape(outputTensorInfo);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    auto tpCb = std::make_shared<
*3e777be0SXin Li        ArmnnThreadPoolCallback_1_3<CallbackContext_1_3>>(this,
*3e777be0SXin Li                                                          pMemPools,
*3e777be0SXin Li                                                          outputShapes,
*3e777be0SXin Li                                                          inputTensors,
*3e777be0SXin Li                                                          outputTensors,
*3e777be0SXin Li                                                          callbackContext);
*3e777be0SXin Li
*3e777be0SXin Li    m_Threadpool->Schedule(m_NetworkId,
*3e777be0SXin Li                           *tpCb->m_InputTensors,
*3e777be0SXin Li                           *tpCb->m_OutputTensors,
*3e777be0SXin Li                           priority,
*3e777be0SXin Li                           tpCb);
*3e777be0SXin Li    ALOGV("ArmnnPreparedModel_1_3::ScheduleGraphForExecution end");
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin Libool ArmnnPreparedModel_1_3<HalVersion>::ExecuteWithDummyInputs(unsigned int numInputs, unsigned int numOutputs)
*3e777be0SXin Li{
*3e777be0SXin Li    std::vector<std::vector<char>> storage;
*3e777be0SXin Li    armnn::InputTensors inputTensors;
*3e777be0SXin Li    for (unsigned int i = 0; i < numInputs; i++)
*3e777be0SXin Li    {
*3e777be0SXin Li        armnn::TensorInfo inputTensorInfo = m_Runtime->GetInputTensorInfo(m_NetworkId, i);
*3e777be0SXin Li        // pInputTensors (of type InputTensors) is composed of a vector of ConstTensors.
*3e777be0SXin Li        // Therefore, set all TensorInfo isConstant parameters of input Tensors to true.
*3e777be0SXin Li        inputTensorInfo.SetConstant();
*3e777be0SXin Li
*3e777be0SXin Li        storage.emplace_back(inputTensorInfo.GetNumBytes());
*3e777be0SXin Li        const armnn::ConstTensor inputTensor(inputTensorInfo, storage.back().data());
*3e777be0SXin Li
*3e777be0SXin Li        inputTensors.emplace_back(i, inputTensor);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    armnn::OutputTensors outputTensors;
*3e777be0SXin Li    for (unsigned int i = 0; i < numOutputs; i++)
*3e777be0SXin Li    {
*3e777be0SXin Li        const armnn::TensorInfo outputTensorInfo = m_Runtime->GetOutputTensorInfo(m_NetworkId, i);
*3e777be0SXin Li        storage.emplace_back(outputTensorInfo.GetNumBytes());
*3e777be0SXin Li        const armnn::Tensor outputTensor(outputTensorInfo, storage.back().data());
*3e777be0SXin Li
*3e777be0SXin Li        outputTensors.emplace_back(i, outputTensor);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    auto nullCallback = [](V1_3::ErrorStatus, std::vector<V1_2::OutputShape>, const V1_2::Timing&, std::string) {};
*3e777be0SXin Li    CallbackContext_1_3 callbackContext;
*3e777be0SXin Li    callbackContext.callback = nullCallback;
*3e777be0SXin Li    callbackContext.ctx.measureTimings = V1_2::MeasureTiming::NO;
*3e777be0SXin Li    auto memPools = std::make_shared<std::vector<::android::nn::RunTimePoolInfo>>();
*3e777be0SXin Li
*3e777be0SXin Li    auto errorStatus = ExecuteGraph(memPools,
*3e777be0SXin Li                                    inputTensors,
*3e777be0SXin Li                                    outputTensors,
*3e777be0SXin Li                                    callbackContext);
*3e777be0SXin Li    return errorStatus == V1_3::ErrorStatus::NONE;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiReturn <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<HalVersion>::Execute(const V1_3::Request& request,
*3e777be0SXin Li                                                                       V1_2::MeasureTiming measureTiming,
*3e777be0SXin Li                                                                       CallbackAsync_1_3 callback)
*3e777be0SXin Li{
*3e777be0SXin Li    ExecutionContext_1_3 ctx;
*3e777be0SXin Li    if (measureTiming == V1_2::MeasureTiming::YES)
*3e777be0SXin Li    {
*3e777be0SXin Li        ctx.measureTimings = measureTiming;
*3e777be0SXin Li        ctx.driverStart = Now();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!m_PreparedFromCache)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGV("ArmnnPreparedModel_1_3::execute(): %s", GetModelSummary(m_Model).c_str());
*3e777be0SXin Li    }
*3e777be0SXin Li    m_RequestCount++;
*3e777be0SXin Li
*3e777be0SXin Li    if (!m_PreparedFromCache && !android::nn::validateRequest(request, m_Model))
*3e777be0SXin Li    {
*3e777be0SXin Li        callback(V1_3::ErrorStatus::INVALID_ARGUMENT, {}, g_NoTiming, "ArmnnPreparedModel_1_3::execute");
*3e777be0SXin Li        return V1_3::ErrorStatus::INVALID_ARGUMENT;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!m_RequestInputsAndOutputsDumpDir.empty())
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGD("Dumping inputs and outputs for request %" PRIuPTR, reinterpret_cast<std::uintptr_t>(&callback));
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // map the memory pool into shared pointers
*3e777be0SXin Li    // use a shared memory pools vector on the heap, as it is passed to the request thread
*3e777be0SXin Li    auto memPools = std::make_shared<std::vector<android::nn::RunTimePoolInfo>>();
*3e777be0SXin Li
*3e777be0SXin Li    // allocate the tensors on the heap, as they are passed to the request thread
*3e777be0SXin Li    auto inputTensors = std::make_shared<armnn::InputTensors>();
*3e777be0SXin Li    auto outputTensors = std::make_shared<armnn::OutputTensors>();
*3e777be0SXin Li
*3e777be0SXin Li    auto [status, outShapes, timing, message] = PrepareMemoryForIO(*inputTensors, *outputTensors,
*3e777be0SXin Li                                                                   *memPools, request);
*3e777be0SXin Li    if (status != V1_3::ErrorStatus::NONE)
*3e777be0SXin Li    {
*3e777be0SXin Li        callback(status, outShapes, timing, message);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    switch(status)
*3e777be0SXin Li    {
*3e777be0SXin Li        case V1_3::ErrorStatus::OUTPUT_INSUFFICIENT_SIZE:
*3e777be0SXin Li            return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li        case V1_3::ErrorStatus::GENERAL_FAILURE:
*3e777be0SXin Li            return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li        case V1_3::ErrorStatus::INVALID_ARGUMENT:
*3e777be0SXin Li            return V1_3::ErrorStatus::INVALID_ARGUMENT;
*3e777be0SXin Li        default:
*3e777be0SXin Li        {}
*3e777be0SXin Li    }
*3e777be0SXin Li    CallbackContext_1_3 cb;
*3e777be0SXin Li    cb.callback = callback;
*3e777be0SXin Li    cb.ctx = ctx;
*3e777be0SXin Li
*3e777be0SXin Li
*3e777be0SXin Li    enum class QosExecPriority
*3e777be0SXin Li    {
*3e777be0SXin Li        Low    = 0,
*3e777be0SXin Li        Medium = 1,
*3e777be0SXin Li        High   = 2
*3e777be0SXin Li    };
*3e777be0SXin Li
*3e777be0SXin Li
*3e777be0SXin Li    if (m_AsyncModelExecutionEnabled)
*3e777be0SXin Li    {
*3e777be0SXin Li        armnn::QosExecPriority priority;
*3e777be0SXin Li
*3e777be0SXin Li        switch (GetModelPriority()) {
*3e777be0SXin Li            case V1_3::Priority::LOW:
*3e777be0SXin Li                priority = armnn::QosExecPriority::Low;
*3e777be0SXin Li                break;
*3e777be0SXin Li            case V1_3::Priority::MEDIUM:
*3e777be0SXin Li                priority = armnn::QosExecPriority::Medium;
*3e777be0SXin Li                break;
*3e777be0SXin Li            case V1_3::Priority::HIGH:
*3e777be0SXin Li                priority = armnn::QosExecPriority::High;
*3e777be0SXin Li                break;
*3e777be0SXin Li            default:
*3e777be0SXin Li                priority = armnn::QosExecPriority::Medium;
*3e777be0SXin Li
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        ALOGV("ArmnnPreparedModel_1_3::execute(...) before ScheduleGraphForExecution");
*3e777be0SXin Li        ScheduleGraphForExecution(memPools, inputTensors, outputTensors, cb, priority);
*3e777be0SXin Li        ALOGV("ArmnnPreparedModel_1_3::execute(...) after ScheduleGraphForExecution");
*3e777be0SXin Li        return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    ALOGV("ArmnnPreparedModel_1_3::execute(...) before PostMsg");
*3e777be0SXin Li    // post the request for asynchronous execution
*3e777be0SXin Li    m_RequestThread.PostMsg(this, memPools, inputTensors, outputTensors, cb);
*3e777be0SXin Li    ALOGV("ArmnnPreparedModel_1_3::execute(...) after PostMsg");
*3e777be0SXin Li    return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin LiV1_3::Priority ArmnnPreparedModel_1_3<HalVersion>::GetModelPriority()
*3e777be0SXin Li{
*3e777be0SXin Li    return m_ModelPriority;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalVersion>
*3e777be0SXin Litemplate <typename CallbackContext>
*3e777be0SXin Livoid ArmnnPreparedModel_1_3<HalVersion>::ArmnnThreadPoolCallback_1_3<CallbackContext>::Notify(
*3e777be0SXin Li        armnn::Status status, armnn::InferenceTimingPair timeTaken)
*3e777be0SXin Li{
*3e777be0SXin Li    ALOGV("ArmnnPreparedModel_1_3::ArmnnThreadPoolCallback_1_3<CallbackContext>::Notify");
*3e777be0SXin Li    CommitPools(*m_MemPools);
*3e777be0SXin Li
*3e777be0SXin Li     m_Model->DumpTensorsIfRequired("Output", *m_OutputTensors);
*3e777be0SXin Li
*3e777be0SXin Li    if (status != armnn::Status::Success)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnThreadPoolCallback_1_3::Notify EnqueueWorkload failed");
*3e777be0SXin Li        m_CallbackContext.callback(V1_3::ErrorStatus::GENERAL_FAILURE,
*3e777be0SXin Li                                   {},
*3e777be0SXin Li                                   g_NoTiming,
*3e777be0SXin Li                                   "ArmnnPreparedModel_1_3::ArmnnThreadPoolCallback_1_3");
*3e777be0SXin Li        return;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (m_CallbackContext.ctx.measureTimings == V1_2::MeasureTiming::YES)
*3e777be0SXin Li    {
*3e777be0SXin Li        m_CallbackContext.ctx.deviceStart = timeTaken.first;
*3e777be0SXin Li        m_CallbackContext.ctx.deviceEnd = timeTaken.second;
*3e777be0SXin Li        m_CallbackContext.ctx.driverEnd = std::chrono::steady_clock::now();
*3e777be0SXin Li        V1_2::Timing timing;
*3e777be0SXin Li        timing.timeOnDevice = MicrosecondsDuration(m_CallbackContext.ctx.deviceEnd, m_CallbackContext.ctx.deviceStart);
*3e777be0SXin Li        timing.timeInDriver = MicrosecondsDuration(m_CallbackContext.ctx.driverEnd, m_CallbackContext.ctx.driverStart);
*3e777be0SXin Li        ALOGV("ArmnnPreparedModel_1_3::execute timing - Device = %lu Driver = %lu",
*3e777be0SXin Li              static_cast<unsigned long>(timing.timeOnDevice), static_cast<unsigned long>(timing.timeInDriver));
*3e777be0SXin Li        m_CallbackContext.callback(
*3e777be0SXin Li                V1_3::ErrorStatus::NONE, m_OutputShapes, timing, "ArmnnPreparedModel_1_3::ExecuteGraph");
*3e777be0SXin Li    } else
*3e777be0SXin Li    {
*3e777be0SXin Li        m_CallbackContext.callback(
*3e777be0SXin Li                V1_3::ErrorStatus::NONE, m_OutputShapes, g_NoTiming, "ArmnnPreparedModel_1_3::ExecuteGraph");
*3e777be0SXin Li    }
*3e777be0SXin Li    return;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Li#ifdef ARMNN_ANDROID_NN_V1_3
*3e777be0SXin Litemplate class ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>;
*3e777be0SXin Litemplate Return <V1_3::ErrorStatus> ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>::ExecuteGraph<CallbackContext_1_3>(
*3e777be0SXin Li        std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,
*3e777be0SXin Li        armnn::InputTensors& pInputTensors,
*3e777be0SXin Li        armnn::OutputTensors& pOutputTensors,
*3e777be0SXin Li        CallbackContext_1_3 cb);
*3e777be0SXin Li
*3e777be0SXin Litemplate void ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>::ScheduleGraphForExecution<CallbackContext_1_3>(
*3e777be0SXin Li                std::shared_ptr<std::vector<::android::nn::RunTimePoolInfo>>& pMemPools,
*3e777be0SXin Li                std::shared_ptr<armnn::InputTensors>& inputTensors,
*3e777be0SXin Li                std::shared_ptr<armnn::OutputTensors>& outputTensors,
*3e777be0SXin Li                CallbackContext_1_3 callbackContext,
*3e777be0SXin Li                armnn::QosExecPriority priority);
*3e777be0SXin Li#endif
*3e777be0SXin Li
*3e777be0SXin Li} // namespace armnn_driver