android-nn-driver/1.3/ArmnnDriverImpl.cpp

*3e777be0SXin Li//
*3e777be0SXin Li// Copyright © 2020, 2023 Arm Ltd. All rights reserved.
*3e777be0SXin Li// SPDX-License-Identifier: MIT
*3e777be0SXin Li//
*3e777be0SXin Li
*3e777be0SXin Li#include "ArmnnDriverImpl.hpp"
*3e777be0SXin Li#include "../ArmnnPreparedModel_1_3.hpp"
*3e777be0SXin Li#include "../ModelToINetworkConverter.hpp"
*3e777be0SXin Li#include "../SystemPropertiesUtils.hpp"
*3e777be0SXin Li
*3e777be0SXin Li#include <armnnDeserializer/IDeserializer.hpp>
*3e777be0SXin Li
*3e777be0SXin Li#include <log/log.h>
*3e777be0SXin Li
*3e777be0SXin Li#include <sys/stat.h>
*3e777be0SXin Li#include <chrono>
*3e777be0SXin Li
*3e777be0SXin Linamespace
*3e777be0SXin Li{
*3e777be0SXin Liconst char *g_RelaxedFloat32toFloat16PerformanceExecTime    = "ArmNN.relaxedFloat32toFloat16Performance.execTime";
*3e777be0SXin Liconst char *g_RelaxedFloat32toFloat16PerformancePowerUsage  = "ArmNN.relaxedFloat32toFloat16Performance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_ifPerformanceExecTime                         = "ArmNN.ifPerformance.execTime";
*3e777be0SXin Liconst char *g_ifPerformancePowerUsage                       = "ArmNN.ifPerformance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_whilePerformanceExecTime                      = "ArmNN.whilePerformance.execTime";
*3e777be0SXin Liconst char *g_whilePerformancePowerUsage                    = "ArmNN.whilePerformance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_OperandTypeTensorFloat32PerformanceExecTime   = "Armnn.operandTypeTensorFloat32Performance.execTime";
*3e777be0SXin Liconst char *g_OperandTypeTensorFloat32PerformancePowerUsage = "Armnn.operandTypeTensorFloat32Performance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_OperandTypeFloat32PerformanceExecTime         = "Armnn.operandTypeFloat32Performance.execTime";
*3e777be0SXin Liconst char *g_OperandTypeFloat32PerformancePowerUsage       = "Armnn.operandTypeFloat32Performance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_OperandTypeTensorFloat16PerformanceExecTime   = "Armnn.operandTypeTensorFloat16Performance.execTime";
*3e777be0SXin Liconst char *g_OperandTypeTensorFloat16PerformancePowerUsage = "Armnn.operandTypeTensorFloat16Performance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_OperandTypeFloat16PerformanceExecTime         = "Armnn.operandTypeFloat16Performance.execTime";
*3e777be0SXin Liconst char *g_OperandTypeFloat16PerformancePowerUsage       = "Armnn.operandTypeFloat16Performance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_OperandTypeTensorQuant8AsymmPerformanceExecTime =
*3e777be0SXin Li        "Armnn.operandTypeTensorQuant8AsymmPerformance.execTime";
*3e777be0SXin Liconst char *g_OperandTypeTensorQuant8AsymmPerformancePowerUsage =
*3e777be0SXin Li        "Armnn.operandTypeTensorQuant8AsymmPerformance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_OperandTypeTensorQuant8AsymmSignedPerformanceExecTime =
*3e777be0SXin Li    "Armnn.operandTypeTensorQuant8AsymmSignedPerformance.execTime";
*3e777be0SXin Liconst char *g_OperandTypeTensorQuant8AsymmSignedPerformancePowerUsage =
*3e777be0SXin Li    "Armnn.operandTypeTensorQuant8AsymmSignedPerformance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_OperandTypeTensorQuant16SymmPerformanceExecTime =
*3e777be0SXin Li        "Armnn.operandTypeTensorQuant16SymmPerformance.execTime";
*3e777be0SXin Liconst char *g_OperandTypeTensorQuant16SymmPerformancePowerUsage =
*3e777be0SXin Li        "Armnn.operandTypeTensorQuant16SymmPerformance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_OperandTypeTensorQuant8SymmPerformanceExecTime =
*3e777be0SXin Li        "Armnn.operandTypeTensorQuant8SymmPerformance.execTime";
*3e777be0SXin Liconst char *g_OperandTypeTensorQuant8SymmPerformancePowerUsage =
*3e777be0SXin Li        "Armnn.operandTypeTensorQuant8SymmPerformance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_OperandTypeTensorQuant8SymmPerChannelPerformanceExecTime =
*3e777be0SXin Li    "Armnn.operandTypeTensorQuant8SymmPerChannelPerformance.execTime";
*3e777be0SXin Liconst char *g_OperandTypeTensorQuant8SymmPerChannelPerformancePowerUsage =
*3e777be0SXin Li    "Armnn.operandTypeTensorQuant8SymmPerChannelPerformance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_OperandTypeTensorInt32PerformanceExecTime     = "Armnn.operandTypeTensorInt32Performance.execTime";
*3e777be0SXin Liconst char *g_OperandTypeTensorInt32PerformancePowerUsage   = "Armnn.operandTypeTensorInt32Performance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Liconst char *g_OperandTypeInt32PerformanceExecTime           = "Armnn.operandTypeInt32Performance.execTime";
*3e777be0SXin Liconst char *g_OperandTypeInt32PerformancePowerUsage         = "Armnn.operandTypeInt32Performance.powerUsage";
*3e777be0SXin Li
*3e777be0SXin Li
*3e777be0SXin Livoid NotifyCallbackAndCheck(const android::sp<V1_3::IPreparedModelCallback>& callback,
*3e777be0SXin Li                            V1_3::ErrorStatus errorStatus,
*3e777be0SXin Li                            const android::sp<V1_3::IPreparedModel>& preparedModelPtr)
*3e777be0SXin Li{
*3e777be0SXin Li    Return<void> returned = callback->notify_1_3(errorStatus, preparedModelPtr);
*3e777be0SXin Li    // This check is required, if the callback fails and it isn't checked it will bring down the service
*3e777be0SXin Li    if (!returned.isOk())
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnDriverImpl::prepareModel: hidl callback failed to return properly: %s ",
*3e777be0SXin Li              returned.description().c_str());
*3e777be0SXin Li    }
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin LiReturn<V1_3::ErrorStatus> FailPrepareModel(V1_3::ErrorStatus error,
*3e777be0SXin Li                                           const std::string& message,
*3e777be0SXin Li                                           const android::sp<V1_3::IPreparedModelCallback>& callback)
*3e777be0SXin Li{
*3e777be0SXin Li    ALOGW("ArmnnDriverImpl::prepareModel: %s", message.c_str());
*3e777be0SXin Li    NotifyCallbackAndCheck(callback, error, nullptr);
*3e777be0SXin Li    return error;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Li} // anonymous namespace
*3e777be0SXin Li
*3e777be0SXin Linamespace armnn_driver
*3e777be0SXin Li{
*3e777be0SXin Linamespace hal_1_3
*3e777be0SXin Li{
*3e777be0SXin Li
*3e777be0SXin LiReturn<V1_3::ErrorStatus> ArmnnDriverImpl::prepareArmnnModel_1_3(
*3e777be0SXin Li       const armnn::IRuntimePtr& runtime,
*3e777be0SXin Li       const armnn::IGpuAccTunedParametersPtr& clTunedParameters,
*3e777be0SXin Li       const DriverOptions& options,
*3e777be0SXin Li       const V1_3::Model& model,
*3e777be0SXin Li       const android::hardware::hidl_vec<android::hardware::hidl_handle>& modelCacheHandle,
*3e777be0SXin Li       const android::hardware::hidl_vec<android::hardware::hidl_handle>& dataCacheHandle,
*3e777be0SXin Li       const HidlToken& token,
*3e777be0SXin Li       const android::sp<V1_3::IPreparedModelCallback>& cb,
*3e777be0SXin Li       bool float32ToFloat16,
*3e777be0SXin Li       V1_3::Priority priority)
*3e777be0SXin Li{
*3e777be0SXin Li    ALOGV("ArmnnDriverImpl::prepareArmnnModel_1_3()");
*3e777be0SXin Li
*3e777be0SXin Li    std::chrono::time_point<std::chrono::system_clock> prepareModelTimepoint = std::chrono::system_clock::now();
*3e777be0SXin Li
*3e777be0SXin Li    if (cb.get() == nullptr)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnDriverImpl::prepareModel: Invalid callback passed to prepareModel");
*3e777be0SXin Li        return V1_3::ErrorStatus::INVALID_ARGUMENT;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!runtime)
*3e777be0SXin Li    {
*3e777be0SXin Li        return FailPrepareModel(V1_3::ErrorStatus::DEVICE_UNAVAILABLE, "Device unavailable", cb);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!android::nn::validateModel(model))
*3e777be0SXin Li    {
*3e777be0SXin Li        return FailPrepareModel(V1_3::ErrorStatus::INVALID_ARGUMENT, "Invalid model passed as input", cb);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Deliberately ignore any unsupported operations requested by the options -
*3e777be0SXin Li    // at this point we're being asked to prepare a model that we've already declared support for
*3e777be0SXin Li    // and the operation indices may be different to those in getSupportedOperations anyway.
*3e777be0SXin Li    std::set<unsigned int> unsupportedOperations;
*3e777be0SXin Li    ModelToINetworkConverter<HalPolicy> modelConverter(options.GetBackends(),
*3e777be0SXin Li                                                       model,
*3e777be0SXin Li                                                       unsupportedOperations);
*3e777be0SXin Li
*3e777be0SXin Li    if (modelConverter.GetConversionResult() != ConversionResult::Success)
*3e777be0SXin Li    {
*3e777be0SXin Li        FailPrepareModel(V1_3::ErrorStatus::GENERAL_FAILURE, "ModelToINetworkConverter failed", cb);
*3e777be0SXin Li        return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Serialize the network graph to a .armnn file if an output directory
*3e777be0SXin Li    // has been specified in the drivers' arguments.
*3e777be0SXin Li    std::vector<uint8_t> dataCacheData;
*3e777be0SXin Li    bool serializeToFile = dataCacheHandle.size() < 1 ? false : true;
*3e777be0SXin Li    auto serializedNetworkFileName =
*3e777be0SXin Li        SerializeNetwork(*modelConverter.GetINetwork(),
*3e777be0SXin Li                         options.GetRequestInputsAndOutputsDumpDir(),
*3e777be0SXin Li                         dataCacheData,
*3e777be0SXin Li                         serializeToFile);
*3e777be0SXin Li
*3e777be0SXin Li    // Optimize the network
*3e777be0SXin Li    armnn::IOptimizedNetworkPtr optNet(nullptr, nullptr);
*3e777be0SXin Li    armnn::OptimizerOptionsOpaque OptOptions;
*3e777be0SXin Li    OptOptions.SetReduceFp32ToFp16(float32ToFloat16);
*3e777be0SXin Li    OptOptions.SetProfilingEnabled(options.IsGpuProfilingEnabled());
*3e777be0SXin Li
*3e777be0SXin Li    int cachedFd = -1;
*3e777be0SXin Li    bool saveCachedNetwork = options.SaveCachedNetwork();
*3e777be0SXin Li
*3e777be0SXin Li    unsigned int numberOfCachedModelFiles = 0;
*3e777be0SXin Li    if (modelCacheHandle.size() > 0)
*3e777be0SXin Li    {
*3e777be0SXin Li        unsigned int index = 0;
*3e777be0SXin Li        for (auto& backend : options.GetBackends())
*3e777be0SXin Li        {
*3e777be0SXin Li            // modelCacheHandle size should be equal to numberOfCachedModelFiles
*3e777be0SXin Li            // modelCacheHandle vector should be in same order as backends
*3e777be0SXin Li            auto numberOfCacheFiles = GetNumberOfCacheFiles(backend);
*3e777be0SXin Li            if (numberOfCacheFiles > 0)
*3e777be0SXin Li            {
*3e777be0SXin Li                numberOfCachedModelFiles += numberOfCacheFiles;
*3e777be0SXin Li                if (modelCacheHandle[index]->numFds == 1)
*3e777be0SXin Li                {
*3e777be0SXin Li                    // For GpuAcc numberOfCachedFiles is 1
*3e777be0SXin Li                    if (backend == armnn::Compute::GpuAcc)
*3e777be0SXin Li                    {
*3e777be0SXin Li                        cachedFd = modelCacheHandle[index]->data[0];
*3e777be0SXin Li                        saveCachedNetwork = true;
*3e777be0SXin Li                    }
*3e777be0SXin Li                }
*3e777be0SXin Li                index += numberOfCachedModelFiles;
*3e777be0SXin Li            }
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    armnn::BackendOptions gpuAcc("GpuAcc",
*3e777be0SXin Li    {
*3e777be0SXin Li        { "FastMathEnabled", options.IsFastMathEnabled() },
*3e777be0SXin Li        { "SaveCachedNetwork", saveCachedNetwork },
*3e777be0SXin Li        { "CachedNetworkFilePath", options.GetCachedNetworkFilePath() },
*3e777be0SXin Li        { "MLGOTuningFilePath", options.GetClMLGOTunedParametersFile() },
*3e777be0SXin Li        { "CachedFileDescriptor", cachedFd }
*3e777be0SXin Li    });
*3e777be0SXin Li
*3e777be0SXin Li    armnn::BackendOptions cpuAcc("CpuAcc",
*3e777be0SXin Li    {
*3e777be0SXin Li        { "FastMathEnabled", options.IsFastMathEnabled() },
*3e777be0SXin Li        { "NumberOfThreads", options.GetNumberOfThreads() }
*3e777be0SXin Li    });
*3e777be0SXin Li    OptOptions.AddModelOption(gpuAcc);
*3e777be0SXin Li    OptOptions.AddModelOption(cpuAcc);
*3e777be0SXin Li
*3e777be0SXin Li    std::vector<std::string> errMessages;
*3e777be0SXin Li    try
*3e777be0SXin Li    {
*3e777be0SXin Li        optNet = armnn::Optimize(*modelConverter.GetINetwork(),
*3e777be0SXin Li                                 options.GetBackends(),
*3e777be0SXin Li                                 runtime->GetDeviceSpec(),
*3e777be0SXin Li                                 OptOptions,
*3e777be0SXin Li                                 errMessages);
*3e777be0SXin Li    }
*3e777be0SXin Li    catch (std::exception& e)
*3e777be0SXin Li    {
*3e777be0SXin Li        std::stringstream message;
*3e777be0SXin Li        message << "Exception (" << e.what() << ") caught from optimize.";
*3e777be0SXin Li        FailPrepareModel(V1_3::ErrorStatus::GENERAL_FAILURE, message.str(), cb);
*3e777be0SXin Li        return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Check that the optimized network is valid.
*3e777be0SXin Li    if (!optNet)
*3e777be0SXin Li    {
*3e777be0SXin Li        std::stringstream message;
*3e777be0SXin Li        message << "Invalid optimized network";
*3e777be0SXin Li        for (const std::string& msg : errMessages)
*3e777be0SXin Li        {
*3e777be0SXin Li            message << "\n" << msg;
*3e777be0SXin Li        }
*3e777be0SXin Li        FailPrepareModel(V1_3::ErrorStatus::GENERAL_FAILURE, message.str(), cb);
*3e777be0SXin Li        return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Export the optimized network graph to a dot file if an output dump directory
*3e777be0SXin Li    // has been specified in the drivers' arguments.
*3e777be0SXin Li    std::string dotGraphFileName = ExportNetworkGraphToDotFile(*optNet,
*3e777be0SXin Li                                                               options.GetRequestInputsAndOutputsDumpDir());
*3e777be0SXin Li
*3e777be0SXin Li    // Load it into the runtime.
*3e777be0SXin Li    armnn::NetworkId netId = 0;
*3e777be0SXin Li    std::string msg;
*3e777be0SXin Li    armnn::INetworkProperties networkProperties(options.isAsyncModelExecutionEnabled(),
*3e777be0SXin Li                                                MemorySource::Undefined,
*3e777be0SXin Li                                                MemorySource::Undefined,
*3e777be0SXin Li                                                options.IsGpuProfilingEnabled());
*3e777be0SXin Li
*3e777be0SXin Li    auto numInputs  = getMainModel(model).inputIndexes.size();
*3e777be0SXin Li    auto numOutputs = getMainModel(model).outputIndexes.size();
*3e777be0SXin Li    try
*3e777be0SXin Li    {
*3e777be0SXin Li        if (runtime->LoadNetwork(netId, move(optNet), msg, networkProperties) != armnn::Status::Success)
*3e777be0SXin Li        {
*3e777be0SXin Li            return FailPrepareModel(V1_3::ErrorStatus::GENERAL_FAILURE, "Network could not be loaded", cb);
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li    catch (std::exception& e)
*3e777be0SXin Li    {
*3e777be0SXin Li        std::stringstream message;
*3e777be0SXin Li        message << "Exception (" << e.what()<< ") caught from LoadNetwork.";
*3e777be0SXin Li        FailPrepareModel(V1_3::ErrorStatus::GENERAL_FAILURE, message.str(), cb);
*3e777be0SXin Li        return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Now that we have a networkId for the graph rename the exported files to use it
*3e777be0SXin Li    // so that we can associate the graph file and the input/output tensor exported files
*3e777be0SXin Li    RenameExportedFiles(serializedNetworkFileName,
*3e777be0SXin Li                        dotGraphFileName,
*3e777be0SXin Li                        options.GetRequestInputsAndOutputsDumpDir(),
*3e777be0SXin Li                        netId);
*3e777be0SXin Li
*3e777be0SXin Li    std::unique_ptr<ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>> preparedModel(
*3e777be0SXin Li            new ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>(
*3e777be0SXin Li                    netId,
*3e777be0SXin Li                    runtime.get(),
*3e777be0SXin Li                    model,
*3e777be0SXin Li                    options.GetRequestInputsAndOutputsDumpDir(),
*3e777be0SXin Li                    options.IsGpuProfilingEnabled(),
*3e777be0SXin Li                    priority,
*3e777be0SXin Li                    options.isAsyncModelExecutionEnabled(),
*3e777be0SXin Li                    options.getNoOfArmnnThreads(),
*3e777be0SXin Li                    options.isImportEnabled(),
*3e777be0SXin Li                    options.isExportEnabled()));
*3e777be0SXin Li
*3e777be0SXin Li    // Run a single 'dummy' inference of the model. This means that CL kernels will get compiled (and tuned if
*3e777be0SXin Li    // this is enabled) before the first 'real' inference which removes the overhead of the first inference.
*3e777be0SXin Li    // Only run this if the GpuAcc backend has been added to options
*3e777be0SXin Li    if (std::find(options.GetBackends().begin(),
*3e777be0SXin Li                  options.GetBackends().end(),
*3e777be0SXin Li                  armnn::Compute::GpuAcc) != options.GetBackends().end())
*3e777be0SXin Li    {
*3e777be0SXin Li        if (!preparedModel->ExecuteWithDummyInputs(numInputs, numOutputs))
*3e777be0SXin Li        {
*3e777be0SXin Li            return FailPrepareModel(V1_3::ErrorStatus::GENERAL_FAILURE, "Network could not be executed", cb);
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        if (clTunedParameters &&
*3e777be0SXin Li            options.GetClTunedParametersMode() == armnn::IGpuAccTunedParameters::Mode::UpdateTunedParameters)
*3e777be0SXin Li        {
*3e777be0SXin Li            // Now that we've done one inference the CL kernel parameters will have been tuned,
*3e777be0SXin Li            // so save the updated file.
*3e777be0SXin Li            try
*3e777be0SXin Li            {
*3e777be0SXin Li                clTunedParameters->Save(options.GetClTunedParametersFile().c_str());
*3e777be0SXin Li            }
*3e777be0SXin Li            catch (std::exception& error)
*3e777be0SXin Li            {
*3e777be0SXin Li                ALOGE("ArmnnDriverImpl::prepareModel: Failed to save CL tuned parameters file '%s': %s",
*3e777be0SXin Li                      options.GetClTunedParametersFile().c_str(), error.what());
*3e777be0SXin Li            }
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li    size_t hashValue = 0;
*3e777be0SXin Li    // Cache the model
*3e777be0SXin Li    if (dataCacheHandle.size() > 0)
*3e777be0SXin Li    {
*3e777be0SXin Li        // Cache the Arm NN model
*3e777be0SXin Li        if (dataCacheHandle.size() != 1)
*3e777be0SXin Li        {
*3e777be0SXin Li            NotifyCallbackAndCheck(cb, V1_3::ErrorStatus::NONE, preparedModel.release());
*3e777be0SXin Li            return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        if (dataCacheHandle[0]->numFds != 1)
*3e777be0SXin Li        {
*3e777be0SXin Li            ALOGW("ArmnnDriverImpl::prepareArmnnModel_1_3: Cannot cache the data, numFds != 1.");
*3e777be0SXin Li            NotifyCallbackAndCheck(cb, V1_3::ErrorStatus::NONE, preparedModel.release());
*3e777be0SXin Li            return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        if (dataCacheHandle[0]->data[0] < 0)
*3e777be0SXin Li        {
*3e777be0SXin Li            ALOGW("ArmnnDriverImpl::prepareArmnnModel_1_3: Cannot cache the data, fd < 0");
*3e777be0SXin Li            NotifyCallbackAndCheck(cb, V1_3::ErrorStatus::NONE, preparedModel.release());
*3e777be0SXin Li            return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        int dataCacheFileAccessMode = fcntl(dataCacheHandle[0]->data[0], F_GETFL) & O_ACCMODE;
*3e777be0SXin Li        if (dataCacheFileAccessMode != O_RDWR)
*3e777be0SXin Li        {
*3e777be0SXin Li            ALOGW("ArmnnDriverImpl::prepareModelFromCache_1_3(): Invalid Access Mode.");
*3e777be0SXin Li            NotifyCallbackAndCheck(cb, V1_3::ErrorStatus::NONE, preparedModel.release());
*3e777be0SXin Li            return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        write(dataCacheHandle[0]->data[0], dataCacheData.data(), dataCacheData.size());
*3e777be0SXin Li        hashValue = CacheDataHandlerInstance().Hash(dataCacheData);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Cache the model data
*3e777be0SXin Li    if (modelCacheHandle.size() > 0)
*3e777be0SXin Li    {
*3e777be0SXin Li        if (modelCacheHandle.size() != numberOfCachedModelFiles)
*3e777be0SXin Li        {
*3e777be0SXin Li            NotifyCallbackAndCheck(cb, V1_3::ErrorStatus::NONE, preparedModel.release());
*3e777be0SXin Li            return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        for (uint32_t i = 0; i < modelCacheHandle.size(); ++i)
*3e777be0SXin Li        {
*3e777be0SXin Li            if (modelCacheHandle[i]->numFds == 1)
*3e777be0SXin Li            {
*3e777be0SXin Li                int modelCacheFileAccessMode = fcntl(modelCacheHandle[i]->data[0], F_GETFL) & O_ACCMODE;
*3e777be0SXin Li                if (modelCacheFileAccessMode != O_RDONLY)
*3e777be0SXin Li                {
*3e777be0SXin Li                    struct stat statBuffer;
*3e777be0SXin Li                    if (fstat(modelCacheHandle[i]->data[0], &statBuffer) == 0)
*3e777be0SXin Li                    {
*3e777be0SXin Li                        long modelDataSize = statBuffer.st_size;
*3e777be0SXin Li                        if (modelDataSize > 0)
*3e777be0SXin Li                        {
*3e777be0SXin Li                            std::vector<uint8_t> modelData(modelDataSize);
*3e777be0SXin Li                            pread(modelCacheHandle[i]->data[0], modelData.data(), modelData.size(), 0);
*3e777be0SXin Li                            hashValue ^= CacheDataHandlerInstance().Hash(modelData);
*3e777be0SXin Li                        }
*3e777be0SXin Li                    }
*3e777be0SXin Li                }
*3e777be0SXin Li            }
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li    if (hashValue != 0)
*3e777be0SXin Li    {
*3e777be0SXin Li        CacheDataHandlerInstance().Register(token, hashValue, dataCacheData.size());
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    NotifyCallbackAndCheck(cb, V1_3::ErrorStatus::NONE, preparedModel.release());
*3e777be0SXin Li
*3e777be0SXin Li    ALOGV("ArmnnDriverImpl::prepareModel cache timing = %lld µs", std::chrono::duration_cast<std::chrono::microseconds>
*3e777be0SXin Li         (std::chrono::system_clock::now() - prepareModelTimepoint).count());
*3e777be0SXin Li
*3e777be0SXin Li
*3e777be0SXin Li    return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin LiReturn<V1_3::ErrorStatus> ArmnnDriverImpl::prepareModelFromCache_1_3(
*3e777be0SXin Li    const armnn::IRuntimePtr& runtime,
*3e777be0SXin Li    const DriverOptions& options,
*3e777be0SXin Li    const android::hardware::hidl_vec<android::hardware::hidl_handle>& modelCacheHandle,
*3e777be0SXin Li    const android::hardware::hidl_vec<android::hardware::hidl_handle>& dataCacheHandle,
*3e777be0SXin Li    const HidlToken& token,
*3e777be0SXin Li    const android::sp<V1_3::IPreparedModelCallback>& cb)
*3e777be0SXin Li{
*3e777be0SXin Li    ALOGV("ArmnnDriverImpl::prepareModelFromCache_1_3()");
*3e777be0SXin Li    std::chrono::time_point<std::chrono::system_clock> modelFromCacheTimepoint = std::chrono::system_clock::now();
*3e777be0SXin Li
*3e777be0SXin Li    if (token.size() != ANEURALNETWORKS_BYTE_SIZE_OF_CACHE_TOKEN)
*3e777be0SXin Li    {
*3e777be0SXin Li        cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li        return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (cb.get() == nullptr)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnDriverImpl::prepareModelFromCache_1_3: Invalid callback passed to prepareModelFromCache_1_3");
*3e777be0SXin Li        return V1_3::ErrorStatus::INVALID_ARGUMENT;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!runtime)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnDriverImpl::prepareModelFromCache_1_3: Device unavailable");
*3e777be0SXin Li        return V1_3::ErrorStatus::DEVICE_UNAVAILABLE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // DataCacheHandle size should always be 1
*3e777be0SXin Li    // Arm NN model
*3e777be0SXin Li    if (dataCacheHandle.size() != 1)
*3e777be0SXin Li    {
*3e777be0SXin Li        cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li        return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Check if model files cached they match the expected value
*3e777be0SXin Li    unsigned int numberOfCachedModelFiles = 0;
*3e777be0SXin Li    for (auto& backend : options.GetBackends())
*3e777be0SXin Li    {
*3e777be0SXin Li        numberOfCachedModelFiles += GetNumberOfCacheFiles(backend);
*3e777be0SXin Li    }
*3e777be0SXin Li    if (modelCacheHandle.size() != numberOfCachedModelFiles)
*3e777be0SXin Li    {
*3e777be0SXin Li        cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li        return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (dataCacheHandle[0]->numFds != 1)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnDriverImpl::prepareModelFromCache_1_3(): Cannot read from the cache data, numFds != 1.");
*3e777be0SXin Li        cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li        return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (dataCacheHandle[0]->data[0] < 0)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnDriverImpl::prepareModelFromCache_1_3(): Cannot read from the cache data, fd < 0");
*3e777be0SXin Li        cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li        return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    int dataCacheFileAccessMode = fcntl(dataCacheHandle[0]->data[0], F_GETFL) & O_ACCMODE;
*3e777be0SXin Li    if (dataCacheFileAccessMode != O_RDWR)
*3e777be0SXin Li    {
*3e777be0SXin Li        cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li        return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    auto dataSize = CacheDataHandlerInstance().GetCacheSize(token);
*3e777be0SXin Li    if (dataSize == 0)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnDriverImpl::prepareModelFromCache_1_3: Invalid data to deserialize!");
*3e777be0SXin Li        cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li        return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    int offset = 0;
*3e777be0SXin Li    {
*3e777be0SXin Li        struct stat statBuffer;
*3e777be0SXin Li        if (fstat(dataCacheHandle[0]->data[0], &statBuffer) == 0)
*3e777be0SXin Li        {
*3e777be0SXin Li            unsigned long bufferSize = statBuffer.st_size;
*3e777be0SXin Li            if (bufferSize != dataSize)
*3e777be0SXin Li            {
*3e777be0SXin Li                ALOGW("ArmnnDriverImpl::prepareModelFromCache_1_3: Invalid data to deserialize!");
*3e777be0SXin Li                cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li                return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li            }
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li    std::vector<uint8_t> dataCacheData(dataSize);
*3e777be0SXin Li    pread(dataCacheHandle[0]->data[0], dataCacheData.data(), dataCacheData.size(), offset);
*3e777be0SXin Li    auto hashValue = CacheDataHandlerInstance().Hash(dataCacheData);
*3e777be0SXin Li
*3e777be0SXin Li    int gpuAccCachedFd = -1;
*3e777be0SXin Li    bool saveCachedNetwork = false;
*3e777be0SXin Li    if (modelCacheHandle.size() > 0)
*3e777be0SXin Li    {
*3e777be0SXin Li        unsigned int index = 0;
*3e777be0SXin Li        for (auto& backend : options.GetBackends())
*3e777be0SXin Li        {
*3e777be0SXin Li            // modelCacheHandle size should be equal to numberOfCachedModelFiles
*3e777be0SXin Li            // modelCacheHandle vector should be in same order as backends
*3e777be0SXin Li            auto numberOfCacheFiles = GetNumberOfCacheFiles(backend);
*3e777be0SXin Li            if (numberOfCacheFiles > 0)
*3e777be0SXin Li            {
*3e777be0SXin Li                if (modelCacheHandle[index]->numFds != 1)
*3e777be0SXin Li                {
*3e777be0SXin Li                    ALOGW(
*3e777be0SXin Li                       "ArmnnDriverImpl::prepareModelFromCache_1_3(): Cannot read from the model cache, numFds != 1.");
*3e777be0SXin Li                    cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li                    return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li                }
*3e777be0SXin Li                auto cachedFd = modelCacheHandle[index]->data[0];
*3e777be0SXin Li
*3e777be0SXin Li                int modelCacheFileAccessMode = fcntl(cachedFd, F_GETFL) & O_ACCMODE;
*3e777be0SXin Li                if (modelCacheFileAccessMode != O_RDWR)
*3e777be0SXin Li                {
*3e777be0SXin Li                    cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li                    return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li                }
*3e777be0SXin Li
*3e777be0SXin Li                struct stat statBuffer;
*3e777be0SXin Li                if (cachedFd != -1 && fstat(cachedFd, &statBuffer) == 0)
*3e777be0SXin Li                {
*3e777be0SXin Li                    long modelDataSize = statBuffer.st_size;
*3e777be0SXin Li                    if (modelDataSize <= 0)
*3e777be0SXin Li                    {
*3e777be0SXin Li                        ALOGW("ArmnnDriverImpl::prepareModelFromCache_1_3(): Wrong cached model size!");
*3e777be0SXin Li                        cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li                        return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li                    }
*3e777be0SXin Li                    std::vector<uint8_t> modelData(modelDataSize);
*3e777be0SXin Li                    pread(cachedFd, modelData.data(), modelData.size(), 0);
*3e777be0SXin Li                    hashValue ^= CacheDataHandlerInstance().Hash(modelData);
*3e777be0SXin Li
*3e777be0SXin Li                    // For GpuAcc numberOfCachedFiles is 1
*3e777be0SXin Li                    if (backend == armnn::Compute::GpuAcc)
*3e777be0SXin Li                    {
*3e777be0SXin Li                        gpuAccCachedFd = cachedFd;
*3e777be0SXin Li                    }
*3e777be0SXin Li                }
*3e777be0SXin Li                index += numberOfCacheFiles;
*3e777be0SXin Li            }
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!CacheDataHandlerInstance().Validate(token, hashValue, dataCacheData.size()))
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnDriverImpl::prepareModelFromCache_1_3: ValidateHash() failed!");
*3e777be0SXin Li        cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li        return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Deserialize the network..
*3e777be0SXin Li    armnn::INetworkPtr network = armnn::INetworkPtr(nullptr, [](armnn::INetwork*){});
*3e777be0SXin Li    try
*3e777be0SXin Li    {
*3e777be0SXin Li        network = armnnDeserializer::IDeserializer::Create()->CreateNetworkFromBinary(dataCacheData);
*3e777be0SXin Li    }
*3e777be0SXin Li    catch (std::exception&)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnDriverImpl::prepareModelFromCache_1_3: Exception caught from Deserializer!");
*3e777be0SXin Li        cb->notify_1_3(V1_3::ErrorStatus::GENERAL_FAILURE, nullptr);
*3e777be0SXin Li        return V1_3::ErrorStatus::GENERAL_FAILURE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Optimize the network
*3e777be0SXin Li    armnn::IOptimizedNetworkPtr optNet(nullptr, nullptr);
*3e777be0SXin Li    armnn::OptimizerOptionsOpaque OptOptions;
*3e777be0SXin Li    OptOptions.SetReduceFp32ToFp16(options.GetFp16Enabled());
*3e777be0SXin Li    OptOptions.SetProfilingEnabled(options.IsGpuProfilingEnabled());
*3e777be0SXin Li
*3e777be0SXin Li    armnn::BackendOptions gpuAcc("GpuAcc",
*3e777be0SXin Li                                 {
*3e777be0SXin Li                                         {"FastMathEnabled",       options.IsFastMathEnabled()},
*3e777be0SXin Li                                         {"SaveCachedNetwork",     saveCachedNetwork},
*3e777be0SXin Li                                         {"CachedNetworkFilePath", options.GetCachedNetworkFilePath()},
*3e777be0SXin Li                                         {"MLGOTuningFilePath",    options.GetClMLGOTunedParametersFile()},
*3e777be0SXin Li                                         {"CachedFileDescriptor",  gpuAccCachedFd}
*3e777be0SXin Li                                 });
*3e777be0SXin Li
*3e777be0SXin Li    armnn::BackendOptions cpuAcc("CpuAcc",
*3e777be0SXin Li                                 {
*3e777be0SXin Li                                         {"FastMathEnabled", options.IsFastMathEnabled()},
*3e777be0SXin Li                                         {"NumberOfThreads", options.GetNumberOfThreads()}
*3e777be0SXin Li                                 });
*3e777be0SXin Li    OptOptions.AddModelOption(gpuAcc);
*3e777be0SXin Li    OptOptions.AddModelOption(cpuAcc);
*3e777be0SXin Li
*3e777be0SXin Li    std::vector<std::string> errMessages;
*3e777be0SXin Li    try
*3e777be0SXin Li    {
*3e777be0SXin Li        optNet = armnn::Optimize(*network.get(),
*3e777be0SXin Li                                 options.GetBackends(),
*3e777be0SXin Li                                 runtime->GetDeviceSpec(),
*3e777be0SXin Li                                 OptOptions,
*3e777be0SXin Li                                 errMessages);
*3e777be0SXin Li    }
*3e777be0SXin Li    catch (std::exception& e)
*3e777be0SXin Li    {
*3e777be0SXin Li        std::stringstream message;
*3e777be0SXin Li        message << "Exception (" << e.what() << ") caught from optimize.";
*3e777be0SXin Li        FailPrepareModel(V1_3::ErrorStatus::GENERAL_FAILURE, message.str(), cb);
*3e777be0SXin Li        return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Check that the optimized network is valid.
*3e777be0SXin Li    if (!optNet)
*3e777be0SXin Li    {
*3e777be0SXin Li        std::stringstream message;
*3e777be0SXin Li        message << "Invalid optimized network";
*3e777be0SXin Li        for (const std::string& msg : errMessages)
*3e777be0SXin Li        {
*3e777be0SXin Li            message << "\n" << msg;
*3e777be0SXin Li        }
*3e777be0SXin Li        FailPrepareModel(V1_3::ErrorStatus::GENERAL_FAILURE, message.str(), cb);
*3e777be0SXin Li        return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Export the optimized network graph to a dot file if an output dump directory
*3e777be0SXin Li    // has been specified in the drivers' arguments.
*3e777be0SXin Li    std::string dotGraphFileName = ExportNetworkGraphToDotFile(*optNet,
*3e777be0SXin Li                                                               options.GetRequestInputsAndOutputsDumpDir());
*3e777be0SXin Li
*3e777be0SXin Li    // Load it into the runtime.
*3e777be0SXin Li    armnn::NetworkId netId = 0;
*3e777be0SXin Li    std::string msg;
*3e777be0SXin Li    armnn::INetworkProperties networkProperties(options.isAsyncModelExecutionEnabled(),
*3e777be0SXin Li                                                MemorySource::Undefined,
*3e777be0SXin Li                                                MemorySource::Undefined,
*3e777be0SXin Li                                                options.IsGpuProfilingEnabled());
*3e777be0SXin Li
*3e777be0SXin Li    try
*3e777be0SXin Li    {
*3e777be0SXin Li        if (runtime->LoadNetwork(netId, move(optNet), msg, networkProperties) != armnn::Status::Success)
*3e777be0SXin Li        {
*3e777be0SXin Li            return FailPrepareModel(V1_3::ErrorStatus::GENERAL_FAILURE, msg, cb);
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li    catch (std::exception& e)
*3e777be0SXin Li    {
*3e777be0SXin Li        std::stringstream message;
*3e777be0SXin Li        message << "Exception (" << e.what() << ") caught from LoadNetwork.";
*3e777be0SXin Li        FailPrepareModel(V1_3::ErrorStatus::GENERAL_FAILURE, message.str(), cb);
*3e777be0SXin Li        return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    std::unique_ptr<ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>> preparedModel(
*3e777be0SXin Li            new ArmnnPreparedModel_1_3<hal_1_3::HalPolicy>(netId,
*3e777be0SXin Li                                                           runtime.get(),
*3e777be0SXin Li                                                           options.GetRequestInputsAndOutputsDumpDir(),
*3e777be0SXin Li                                                           options.IsGpuProfilingEnabled(),
*3e777be0SXin Li                                                           V1_3::Priority::MEDIUM,
*3e777be0SXin Li                                                           options.isAsyncModelExecutionEnabled(),
*3e777be0SXin Li                                                           options.getNoOfArmnnThreads(),
*3e777be0SXin Li                                                           options.isImportEnabled(),
*3e777be0SXin Li                                                           options.isExportEnabled(),
*3e777be0SXin Li                                                           true));
*3e777be0SXin Li
*3e777be0SXin Li    NotifyCallbackAndCheck(cb, V1_3::ErrorStatus::NONE, preparedModel.release());
*3e777be0SXin Li
*3e777be0SXin Li    ALOGV("ArmnnDriverImpl::prepareModelFromCache timing = %lld µs",
*3e777be0SXin Li          std::chrono::duration_cast<std::chrono::microseconds>
*3e777be0SXin Li          (std::chrono::system_clock::now() - modelFromCacheTimepoint).count());
*3e777be0SXin Li
*3e777be0SXin Li    return V1_3::ErrorStatus::NONE;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin LiReturn<void> ArmnnDriverImpl::getCapabilities_1_3(const armnn::IRuntimePtr& runtime,
*3e777be0SXin Li                                                  V1_3::IDevice::getCapabilities_1_3_cb cb)
*3e777be0SXin Li{
*3e777be0SXin Li    ALOGV("hal_1_3::ArmnnDriverImpl::getCapabilities()");
*3e777be0SXin Li
*3e777be0SXin Li    V1_3::Capabilities capabilities;
*3e777be0SXin Li
*3e777be0SXin Li    float defaultValue = .1f;
*3e777be0SXin Li
*3e777be0SXin Li    if (runtime)
*3e777be0SXin Li    {
*3e777be0SXin Li        capabilities.relaxedFloat32toFloat16PerformanceScalar.execTime =
*3e777be0SXin Li                ParseSystemProperty(g_RelaxedFloat32toFloat16PerformanceExecTime, defaultValue);
*3e777be0SXin Li
*3e777be0SXin Li        capabilities.relaxedFloat32toFloat16PerformanceScalar.powerUsage =
*3e777be0SXin Li                ParseSystemProperty(g_RelaxedFloat32toFloat16PerformancePowerUsage, defaultValue);
*3e777be0SXin Li
*3e777be0SXin Li        capabilities.relaxedFloat32toFloat16PerformanceTensor.execTime =
*3e777be0SXin Li                ParseSystemProperty(g_RelaxedFloat32toFloat16PerformanceExecTime, defaultValue);
*3e777be0SXin Li
*3e777be0SXin Li        capabilities.relaxedFloat32toFloat16PerformanceTensor.powerUsage =
*3e777be0SXin Li                ParseSystemProperty(g_RelaxedFloat32toFloat16PerformancePowerUsage, defaultValue);
*3e777be0SXin Li
*3e777be0SXin Li        capabilities.ifPerformance.execTime =
*3e777be0SXin Li                ParseSystemProperty(g_ifPerformanceExecTime, defaultValue);
*3e777be0SXin Li
*3e777be0SXin Li        capabilities.ifPerformance.powerUsage =
*3e777be0SXin Li                ParseSystemProperty(g_ifPerformancePowerUsage, defaultValue);
*3e777be0SXin Li
*3e777be0SXin Li        capabilities.whilePerformance.execTime =
*3e777be0SXin Li                ParseSystemProperty(g_whilePerformanceExecTime, defaultValue);
*3e777be0SXin Li
*3e777be0SXin Li        capabilities.whilePerformance.powerUsage =
*3e777be0SXin Li                ParseSystemProperty(g_whilePerformancePowerUsage, defaultValue);
*3e777be0SXin Li
*3e777be0SXin Li        // Set the base value for all operand types
*3e777be0SXin Li        capabilities.operandPerformance = nonExtensionOperandPerformance<HalVersion::V1_3>({FLT_MAX, FLT_MAX});
*3e777be0SXin Li
*3e777be0SXin Li        // Load supported operand types
*3e777be0SXin Li        update(&capabilities.operandPerformance, V1_3::OperandType::TENSOR_FLOAT32,
*3e777be0SXin Li                {
*3e777be0SXin Li                    .execTime = ParseSystemProperty(g_OperandTypeTensorFloat32PerformanceExecTime, defaultValue),
*3e777be0SXin Li                    .powerUsage = ParseSystemProperty(g_OperandTypeTensorFloat32PerformancePowerUsage, defaultValue)
*3e777be0SXin Li                });
*3e777be0SXin Li
*3e777be0SXin Li        update(&capabilities.operandPerformance, V1_3::OperandType::FLOAT32,
*3e777be0SXin Li                {
*3e777be0SXin Li                    .execTime = ParseSystemProperty(g_OperandTypeFloat32PerformanceExecTime, defaultValue),
*3e777be0SXin Li                    .powerUsage = ParseSystemProperty(g_OperandTypeFloat32PerformancePowerUsage, defaultValue)
*3e777be0SXin Li                });
*3e777be0SXin Li
*3e777be0SXin Li        update(&capabilities.operandPerformance, V1_3::OperandType::TENSOR_FLOAT16,
*3e777be0SXin Li                {
*3e777be0SXin Li                    .execTime = ParseSystemProperty(g_OperandTypeTensorFloat16PerformanceExecTime, defaultValue),
*3e777be0SXin Li                    .powerUsage = ParseSystemProperty(g_OperandTypeTensorFloat16PerformancePowerUsage, defaultValue)
*3e777be0SXin Li                });
*3e777be0SXin Li
*3e777be0SXin Li        update(&capabilities.operandPerformance, V1_3::OperandType::FLOAT16,
*3e777be0SXin Li                {
*3e777be0SXin Li                    .execTime = ParseSystemProperty(g_OperandTypeFloat16PerformanceExecTime, defaultValue),
*3e777be0SXin Li                    .powerUsage = ParseSystemProperty(g_OperandTypeFloat16PerformancePowerUsage, defaultValue)
*3e777be0SXin Li                });
*3e777be0SXin Li
*3e777be0SXin Li        update(&capabilities.operandPerformance, V1_3::OperandType::TENSOR_QUANT8_ASYMM,
*3e777be0SXin Li                {
*3e777be0SXin Li                    .execTime = ParseSystemProperty(g_OperandTypeTensorQuant8AsymmPerformanceExecTime, defaultValue),
*3e777be0SXin Li                    .powerUsage = ParseSystemProperty(g_OperandTypeTensorQuant8AsymmPerformancePowerUsage, defaultValue)
*3e777be0SXin Li                });
*3e777be0SXin Li
*3e777be0SXin Li        update(&capabilities.operandPerformance, V1_3::OperandType::TENSOR_QUANT8_SYMM,
*3e777be0SXin Li                {
*3e777be0SXin Li                    .execTime = ParseSystemProperty(g_OperandTypeTensorQuant8SymmPerformanceExecTime, defaultValue),
*3e777be0SXin Li                    .powerUsage = ParseSystemProperty(g_OperandTypeTensorQuant8SymmPerformancePowerUsage, defaultValue)
*3e777be0SXin Li                });
*3e777be0SXin Li        update(&capabilities.operandPerformance, V1_3::OperandType::TENSOR_QUANT8_ASYMM_SIGNED,
*3e777be0SXin Li               {
*3e777be0SXin Li                   .execTime = ParseSystemProperty(g_OperandTypeTensorQuant8AsymmSignedPerformanceExecTime,
*3e777be0SXin Li                   defaultValue),
*3e777be0SXin Li                   .powerUsage = ParseSystemProperty(g_OperandTypeTensorQuant8AsymmSignedPerformancePowerUsage,
*3e777be0SXin Li                   defaultValue)
*3e777be0SXin Li               });
*3e777be0SXin Li
*3e777be0SXin Li        update(&capabilities.operandPerformance, V1_3::OperandType::TENSOR_QUANT16_SYMM,
*3e777be0SXin Li                {
*3e777be0SXin Li                    .execTime = ParseSystemProperty(g_OperandTypeTensorQuant16SymmPerformanceExecTime, defaultValue),
*3e777be0SXin Li                    .powerUsage = ParseSystemProperty(g_OperandTypeTensorQuant16SymmPerformancePowerUsage, defaultValue)
*3e777be0SXin Li                });
*3e777be0SXin Li
*3e777be0SXin Li        update(&capabilities.operandPerformance, V1_3::OperandType::TENSOR_QUANT8_SYMM_PER_CHANNEL,
*3e777be0SXin Li               {
*3e777be0SXin Li                   .execTime =
*3e777be0SXin Li                   ParseSystemProperty(g_OperandTypeTensorQuant8SymmPerChannelPerformanceExecTime, defaultValue),
*3e777be0SXin Li                   .powerUsage =
*3e777be0SXin Li                   ParseSystemProperty(g_OperandTypeTensorQuant8SymmPerChannelPerformancePowerUsage, defaultValue)
*3e777be0SXin Li               });
*3e777be0SXin Li
*3e777be0SXin Li        update(&capabilities.operandPerformance, V1_3::OperandType::TENSOR_INT32,
*3e777be0SXin Li                {
*3e777be0SXin Li                    .execTime = ParseSystemProperty(g_OperandTypeTensorInt32PerformanceExecTime, defaultValue),
*3e777be0SXin Li                    .powerUsage = ParseSystemProperty(g_OperandTypeTensorInt32PerformancePowerUsage, defaultValue)
*3e777be0SXin Li                });
*3e777be0SXin Li
*3e777be0SXin Li        update(&capabilities.operandPerformance, V1_3::OperandType::INT32,
*3e777be0SXin Li                {
*3e777be0SXin Li                    .execTime = ParseSystemProperty(g_OperandTypeInt32PerformanceExecTime, defaultValue),
*3e777be0SXin Li                    .powerUsage = ParseSystemProperty(g_OperandTypeInt32PerformancePowerUsage, defaultValue)
*3e777be0SXin Li                });
*3e777be0SXin Li
*3e777be0SXin Li        cb(V1_3::ErrorStatus::NONE, capabilities);
*3e777be0SXin Li    }
*3e777be0SXin Li    else
*3e777be0SXin Li    {
*3e777be0SXin Li        capabilities.relaxedFloat32toFloat16PerformanceScalar.execTime   = 0;
*3e777be0SXin Li        capabilities.relaxedFloat32toFloat16PerformanceScalar.powerUsage = 0;
*3e777be0SXin Li        capabilities.relaxedFloat32toFloat16PerformanceTensor.execTime   = 0;
*3e777be0SXin Li        capabilities.relaxedFloat32toFloat16PerformanceTensor.powerUsage = 0;
*3e777be0SXin Li        capabilities.ifPerformance.execTime      = 0;
*3e777be0SXin Li        capabilities.ifPerformance.powerUsage    = 0;
*3e777be0SXin Li        capabilities.whilePerformance.execTime   = 0;
*3e777be0SXin Li        capabilities.whilePerformance.powerUsage = 0;
*3e777be0SXin Li
*3e777be0SXin Li        // Set the base value for all operand types
*3e777be0SXin Li        capabilities.operandPerformance = nonExtensionOperandPerformance<HalVersion::V1_3>({0.f, 0.0f});
*3e777be0SXin Li
*3e777be0SXin Li        cb(V1_3::ErrorStatus::DEVICE_UNAVAILABLE, capabilities);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    return Void();
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Li} // namespace hal_1_3
*3e777be0SXin Li} // namespace armnn_driver