_executor_resource_pool_8h_source.html

 /*

  * Copyright 2022 HEAVY.AI, Inc.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  *     http://www.apache.org/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #pragma once


 #include <array>

 #include <map>

 #include <shared_mutex>


 #include "ExecutorResourceMgrCommon.h"

 #include "ResourceGrantPolicy.h"

 #include "ResourceRequest.h"


 namespace ExecutorResourceMgr_Namespace {


 inline ResourceType map_resource_subtype_to_resource_type(

     const ResourceSubtype resource_subtype) {

   switch (resource_subtype) {

     case ResourceSubtype::CPU_SLOTS:

       return ResourceType::CPU_SLOTS;

     case ResourceSubtype::GPU_SLOTS:

       return ResourceType::GPU_SLOTS;

     case ResourceSubtype::CPU_RESULT_MEM:

       return ResourceType::CPU_RESULT_MEM;

     case ResourceSubtype::GPU_RESULT_MEM:

       return ResourceType::GPU_RESULT_MEM;

     case ResourceSubtype::PINNED_CPU_BUFFER_POOL_MEM:

       return ResourceType::CPU_BUFFER_POOL_MEM;

     case ResourceSubtype::PINNED_GPU_BUFFER_POOL_MEM:

       return ResourceType::GPU_BUFFER_POOL_MEM;

     case ResourceSubtype::PAGEABLE_CPU_BUFFER_POOL_MEM:

       return ResourceType::CPU_BUFFER_POOL_MEM;

     case ResourceSubtype::PAGEABLE_GPU_BUFFER_POOL_MEM:

       return ResourceType::GPU_BUFFER_POOL_MEM;

     default:

       UNREACHABLE();

       return ResourceType::INVALID_TYPE;

   }

 }


 inline std::vector<ResourceSubtype> map_resource_type_to_resource_subtypes(

     const ResourceType resource_type) {

   switch (resource_type) {

     case ResourceType::CPU_SLOTS:

       return {ResourceSubtype::CPU_SLOTS};

     case ResourceType::GPU_SLOTS:

       return {ResourceSubtype::GPU_SLOTS};

     case ResourceType::CPU_RESULT_MEM:

       return {ResourceSubtype::CPU_RESULT_MEM};

     case ResourceType::GPU_RESULT_MEM:

       return {ResourceSubtype::GPU_RESULT_MEM};

     case ResourceType::CPU_BUFFER_POOL_MEM:

       return {ResourceSubtype::PINNED_CPU_BUFFER_POOL_MEM,

               ResourceSubtype::PAGEABLE_CPU_BUFFER_POOL_MEM};

     case ResourceType::GPU_BUFFER_POOL_MEM:

       return {ResourceSubtype::PINNED_GPU_BUFFER_POOL_MEM,

               ResourceSubtype::PAGEABLE_GPU_BUFFER_POOL_MEM};

     default:

       UNREACHABLE();

       return {ResourceSubtype::INVALID_SUBTYPE};

   }

 }


 struct ResourcePoolInfo {

   size_t total_cpu_slots{0};

   size_t total_gpu_slots{0};

   size_t total_cpu_result_mem{0};

   size_t total_cpu_buffer_pool_mem{0};

   size_t total_gpu_buffer_pool_mem{0};


   size_t allocated_cpu_slots{0};

   size_t allocated_gpu_slots{0};

   size_t allocated_cpu_result_mem{0};

   size_t allocated_cpu_buffer_pool_mem{0};

   size_t allocated_gpu_buffer_pool_mem{0};


   size_t allocated_cpu_buffers{0};

   size_t allocated_gpu_buffers{0};


   size_t allocated_temp_cpu_buffer_pool_mem{0};

   size_t allocated_temp_gpu_buffer_pool_mem{0};


   size_t total_requests{0};

   size_t outstanding_requests{0};

   size_t outstanding_cpu_slots_requests{0};

   size_t outstanding_gpu_slots_requests{0};

   size_t outstanding_cpu_result_mem_requests{0};

   size_t outstanding_cpu_buffer_pool_mem_requests{0};

   size_t outstanding_gpu_buffer_pool_mem_requests{0};


   ResourcePoolInfo() {}


   ResourcePoolInfo(const size_t total_cpu_slots,

                    const size_t total_gpu_slots,

                    const size_t total_cpu_result_mem,

                    const size_t total_cpu_buffer_pool_mem,

                    const size_t total_gpu_buffer_pool_mem,

                    const size_t allocated_cpu_slots,

                    const size_t allocated_gpu_slots,

                    const size_t allocated_cpu_result_mem,

                    const size_t allocated_cpu_buffer_pool_mem,

                    const size_t allocated_gpu_buffer_pool_mem,

                    const size_t allocated_cpu_buffers,

                    const size_t allocated_gpu_buffers,

                    const size_t allocated_temp_cpu_buffer_pool_mem,

                    const size_t allocated_temp_gpu_buffer_pool_mem,

                    const size_t total_requests,

                    const size_t outstanding_requests,

                    const size_t outstanding_cpu_slots_requests,

                    const size_t outstanding_gpu_slots_requests,

                    const size_t outstanding_cpu_result_mem_requests,

                    const size_t outstanding_cpu_buffer_pool_mem_requests,

                    const size_t outstanding_gpu_buffer_pool_mem_requests)

       : total_cpu_slots(total_cpu_slots)

       , total_gpu_slots(total_gpu_slots)

       , total_cpu_result_mem(total_cpu_result_mem)

       , total_cpu_buffer_pool_mem(total_cpu_buffer_pool_mem)

       , total_gpu_buffer_pool_mem(total_gpu_buffer_pool_mem)

       , allocated_cpu_slots(allocated_cpu_slots)

       , allocated_gpu_slots(allocated_gpu_slots)

       , allocated_cpu_result_mem(allocated_cpu_result_mem)

       , allocated_cpu_buffer_pool_mem(allocated_cpu_buffer_pool_mem)

       , allocated_gpu_buffer_pool_mem(allocated_gpu_buffer_pool_mem)

       , allocated_cpu_buffers(allocated_cpu_buffers)

       , allocated_gpu_buffers(allocated_gpu_buffers)

       , allocated_temp_cpu_buffer_pool_mem(allocated_temp_cpu_buffer_pool_mem)

       , allocated_temp_gpu_buffer_pool_mem(allocated_temp_gpu_buffer_pool_mem)

       , total_requests(total_requests)

       , outstanding_requests(outstanding_requests)

       , outstanding_cpu_slots_requests(outstanding_cpu_slots_requests)

       , outstanding_gpu_slots_requests(outstanding_gpu_slots_requests)

       , outstanding_cpu_result_mem_requests(outstanding_cpu_result_mem_requests)

       , outstanding_cpu_buffer_pool_mem_requests(outstanding_cpu_buffer_pool_mem_requests)

       , outstanding_gpu_buffer_pool_mem_requests(

             outstanding_gpu_buffer_pool_mem_requests) {}

 };


 struct ResourceGrant {

   size_t cpu_slots{0};

   size_t gpu_slots{0};

   size_t cpu_result_mem{0};


   // Below is only relevant if buffer_mem_gated_per_slot is true

   bool buffer_mem_gated_per_slot{false};

   size_t buffer_mem_per_slot{0};

   size_t buffer_mem_for_given_slots{0};


   bool is_empty() const {

     return cpu_slots == 0 && gpu_slots == 0 && cpu_result_mem == 0;

   }


   void print() const;


   std::string to_string() const;

 };


 using BufferPoolChunkMap =

     std::map<ChunkKey, std::pair<size_t, size_t>>;  // Value is reference count and size


 class ExecutorResourcePool {

  public:

   ExecutorResourcePool(

       const std::vector<std::pair<ResourceType, size_t>>& total_resources,

       const std::vector<ConcurrentResourceGrantPolicy>&

           concurrent_resource_grant_policies,

       const std::vector<ResourceGrantPolicy>& max_per_request_resource_grant_policies);


   void log_parameters() const;


   std::vector<ResourceRequestGrant> calc_static_resource_grant_ranges_for_request(

       const std::vector<ResourceRequest>& resource_requests) const;


   std::pair<ResourceGrant, ResourceGrant> calc_min_max_resource_grants_for_request(

       const RequestInfo& resource_request) const;


   bool can_currently_satisfy_request(const ResourceGrant& min_resource_grant,

                                      const ChunkRequestInfo& chunk_request_info) const;


   std::pair<bool, ResourceGrant> determine_dynamic_resource_grant(

       const ResourceGrant& min_resource_grant,

       const ResourceGrant& max_resource_grant,

       const ChunkRequestInfo& chunk_request_info,

       const double max_request_backoff_ratio) const;


   void allocate_resources(const ResourceGrant& resource_grant,

                           const ChunkRequestInfo& chunk_request_info);


   void deallocate_resources(const ResourceGrant& resource_grant,

                             const ChunkRequestInfo& chunk_request_info);


   std::pair<size_t, size_t> get_resource_info(const ResourceType resource_type) const;


   ResourcePoolInfo get_resource_info() const;


   void set_resource(const ResourceType resource_type, const size_t resource_quantity);


   inline ConcurrentResourceGrantPolicy get_concurrent_resource_grant_policy(

       const ResourceType resource_type) const {

     return concurrent_resource_grant_policies_[static_cast<size_t>(resource_type)];

   }


   inline const ResourceGrantPolicy& get_max_resource_grant_per_request_policy(

       const ResourceSubtype resource_subtype) const {

     return max_resource_grants_per_request_policies_[static_cast<size_t>(

         resource_subtype)];

   }


   void set_concurrent_resource_grant_policy(

       const ConcurrentResourceGrantPolicy& concurrent_resource_grant_policy);


  private:

   void init(

       const std::vector<std::pair<ResourceType, size_t>>& total_resources,

       const std::vector<ConcurrentResourceGrantPolicy>&

           concurrent_resource_grant_policies,

       const std::vector<ResourceGrantPolicy>& max_per_request_resource_grant_policies);


   void init_concurrency_policies();

   void init_max_resource_grants_per_requests();


   void throw_insufficient_resource_error(const ResourceSubtype resource_subtype,

                                          const size_t min_resource_requested) const;


   size_t calc_max_resource_grant_for_request(

       const size_t requested_resource_quantity,

       const size_t min_requested_resource_quantity,

       const size_t max_grantable_resource_quantity) const;


   std::pair<size_t, size_t> calc_min_dependent_resource_grant_for_request(

       const size_t min_requested_dependent_resource_quantity,

       const size_t min_requested_independent_resource_quantity,

       const size_t dependent_to_independent_resource_ratio) const;


   std::pair<size_t, size_t> calc_max_dependent_resource_grant_for_request(

       const size_t requested_dependent_resource_quantity,

       const size_t min_requested_dependent_resource_quantity,

       const size_t max_grantable_dependent_resource_quantity,

       const size_t min_requested_independent_resource_quantity,

       const size_t max_grantable_independent_resource_quantity,

       const size_t dependent_to_independent_resource_ratio) const;


   bool check_request_against_global_policy(

       const size_t resource_total,

       const size_t resource_allocated,

       const ConcurrentResourceGrantPolicy& concurrent_resource_grant_policy) const;


   bool check_request_against_policy(

       const size_t resource_request,

       const size_t resource_total,

       const size_t resource_allocated,

       const size_t global_outstanding_requests,

       const ConcurrentResourceGrantPolicy& concurrent_resource_grant_policy) const;


   // Unlocked internal version

   bool can_currently_satisfy_request_impl(

       const ResourceGrant& min_resource_grant,

       const ChunkRequestInfo& chunk_request_info) const;


   bool can_currently_satisfy_chunk_request(

       const ResourceGrant& min_resource_grant,

       const ChunkRequestInfo& chunk_request_info) const;

   ChunkRequestInfo get_requested_chunks_not_in_pool(

       const ChunkRequestInfo& chunk_request_info) const;

   size_t get_chunk_bytes_not_in_pool(const ChunkRequestInfo& chunk_request_info) const;

   void add_chunk_requests_to_allocated_pool(const ResourceGrant& resource_grant,

                                             const ChunkRequestInfo& chunk_request_info);

   void remove_chunk_requests_from_allocated_pool(

       const ResourceGrant& resource_grant,

       const ChunkRequestInfo& chunk_request_info);


   size_t determine_dynamic_single_resource_grant(

       const size_t min_resource_requested,

       const size_t max_resource_requested,

       const size_t resource_allocated,

       const size_t total_resource,

       const double max_request_backoff_ratio) const;


   void sanity_check_requests_against_allocations() const;


   inline size_t get_total_allocated_buffer_pool_mem_for_level(

       const ExecutorDeviceType memory_pool_type) const {

     return memory_pool_type == ExecutorDeviceType::CPU

                ? get_allocated_resource_of_type(ResourceType::CPU_BUFFER_POOL_MEM)

                : get_allocated_resource_of_type(ResourceType::GPU_BUFFER_POOL_MEM);

   }


   inline bool is_resource_valid(const ResourceType resource_type) const {

     return resource_type_validity_[static_cast<size_t>(resource_type)];

   }


   inline size_t get_total_resource(const ResourceType resource_type) const {

     return total_resources_[static_cast<size_t>(resource_type)];

   }


   inline size_t get_allocated_resource_of_subtype(

       const ResourceSubtype resource_subtype) const {

     return allocated_resources_[static_cast<size_t>(resource_subtype)];

   }


   size_t get_allocated_resource_of_type(const ResourceType resource_type) const;


   inline size_t get_max_resource_grant_per_request(

       const ResourceSubtype resource_subtype) const {

     return max_resource_grants_per_request_[static_cast<size_t>(resource_subtype)];

   }


   inline size_t get_total_per_resource_num_requests(

       const ResourceType resource_type) const {

     return total_per_resource_num_requests_[static_cast<size_t>(resource_type)];

   }


   inline size_t increment_total_per_resource_num_requests(

       const ResourceType resource_type) {

     return ++total_per_resource_num_requests_[static_cast<size_t>(resource_type)];

   }


   inline size_t decrement_total_per_resource_num_requests(

       const ResourceType resource_type) {

     return --total_per_resource_num_requests_[static_cast<size_t>(resource_type)];

   }


   inline size_t get_outstanding_per_resource_num_requests(

       const ResourceType resource_type) const {

     return outstanding_per_resource_num_requests_[static_cast<size_t>(resource_type)];

   }


   inline size_t increment_outstanding_per_resource_num_requests(

       const ResourceType resource_type) {

     return ++outstanding_per_resource_num_requests_[static_cast<size_t>(resource_type)];

   }


   inline size_t decrement_outstanding_per_resource_num_requests(

       const ResourceType resource_type) {

     return --outstanding_per_resource_num_requests_[static_cast<size_t>(resource_type)];

   }


   std::array<size_t, ResourceTypeSize>

       total_resources_{};  // Will be value initialized to 0s

   std::array<bool, ResourceTypeSize> resource_type_validity_{

       false};  // Will be value initialized to false

   std::array<size_t, ResourceSubtypeSize>

       allocated_resources_{};  // Will be value initialized to 0s

   std::array<ResourceGrantPolicy, ResourceSubtypeSize>

       max_resource_grants_per_request_policies_{};

   std::array<size_t, ResourceSubtypeSize> max_resource_grants_per_request_{};

   std::array<ConcurrentResourceGrantPolicy, ResourceTypeSize>

       concurrent_resource_grant_policies_;


   size_t total_num_requests_{0};

   size_t outstanding_num_requests_{0};


   std::array<size_t, ResourceTypeSize>

       total_per_resource_num_requests_{};  // Will be value initialized to 0s


   std::array<size_t, ResourceTypeSize>

       outstanding_per_resource_num_requests_{};  // Will be value initialized to 0s


   BufferPoolChunkMap allocated_cpu_buffer_pool_chunks_;

   BufferPoolChunkMap allocated_gpu_buffer_pool_chunks_;


   const bool sanity_check_pool_state_on_deallocations_{false};

   mutable std::shared_mutex resource_mutex_;

 };


 }  // namespace ExecutorResourceMgr_Namespace

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_total_resource
size_t get_total_resource(const ResourceType resource_type) const
Definition: ExecutorResourcePool.h:478

ExecutorResourceMgr_Namespace::ResourcePoolInfo
A container for various stats about the current state of the ExecutorResourcePool. Note that ExecutorResourcePool does not persist a struct of this type, but rather builds one on the fly when ExecutorResourcePool::get_resource_info() is called.
Definition: ExecutorResourcePool.h:98

ExecutorResourceMgr_Namespace::RequestInfo
A container to store requested and minimum neccessary resource requests across all resource types cur...
Definition: ResourceRequest.h:70

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_chunk_bytes_not_in_pool
size_t get_chunk_bytes_not_in_pool(const ChunkRequestInfo &chunk_request_info) const
Definition: ExecutorResourcePool.cpp:658

ExecutorResourceMgr_Namespace::ResourceType::CPU_SLOTS

ExecutorResourceMgr_Namespace::ResourceGrant::is_empty
bool is_empty() const
Definition: ExecutorResourcePool.h:186

ExecutorResourceMgr_Namespace::ResourcePoolInfo::outstanding_cpu_result_mem_requests
size_t outstanding_cpu_result_mem_requests
Definition: ExecutorResourcePool.h:121

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_resource_info
ResourcePoolInfo get_resource_info() const
Returns a struct detailing the allocated and total available resources of each type tracked in Execut...
Definition: ExecutorResourcePool.cpp:186

ExecutorResourceMgr_Namespace::ExecutorResourcePool::allocated_resources_
std::array< size_t, ResourceSubtypeSize > allocated_resources_
Definition: ExecutorResourcePool.h:529

ExecutorResourceMgr_Namespace::ExecutorResourcePool::init_max_resource_grants_per_requests
void init_max_resource_grants_per_requests()
Definition: ExecutorResourcePool.cpp:118

ExecutorResourceMgr_Namespace::ResourcePoolInfo::allocated_cpu_buffers
size_t allocated_cpu_buffers
Definition: ExecutorResourcePool.h:111

ExecutorResourceMgr_Namespace::ExecutorResourcePool::resource_mutex_
std::shared_mutex resource_mutex_
Definition: ExecutorResourcePool.h:549

ExecutorResourceMgr_Namespace::ResourceGrant::buffer_mem_per_slot
size_t buffer_mem_per_slot
Definition: ExecutorResourcePool.h:183

ExecutorResourceMgr_Namespace::ResourcePoolInfo::allocated_temp_gpu_buffer_pool_mem
size_t allocated_temp_gpu_buffer_pool_mem
Definition: ExecutorResourcePool.h:115

ExecutorResourceMgr_Namespace::ExecutorResourcePool::can_currently_satisfy_request
bool can_currently_satisfy_request(const ResourceGrant &min_resource_grant, const ChunkRequestInfo &chunk_request_info) const
Definition: ExecutorResourcePool.cpp:910

ExecutorResourceMgr_Namespace::ResourceType::GPU_RESULT_MEM

ResourceRequest.h

ExecutorResourceMgr_Namespace::ResourceType::GPU_BUFFER_POOL_MEM

ExecutorResourceMgr_Namespace::ExecutorResourcePool::resource_type_validity_
std::array< bool, ResourceTypeSize > resource_type_validity_
Definition: ExecutorResourcePool.h:526

ExecutorResourceMgr_Namespace::ResourcePoolInfo::outstanding_gpu_slots_requests
size_t outstanding_gpu_slots_requests
Definition: ExecutorResourcePool.h:120

ExecutorResourceMgr_Namespace::ResourceGrant::to_string
std::string to_string() const
Definition: ExecutorResourcePool.cpp:41

ExecutorResourceMgr_Namespace::ResourcePoolInfo::total_requests
size_t total_requests
Definition: ExecutorResourcePool.h:117

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_allocated_resource_of_subtype
size_t get_allocated_resource_of_subtype(const ResourceSubtype resource_subtype) const
Definition: ExecutorResourcePool.h:482

ExecutorResourceMgr_Namespace::ExecutorResourcePool::total_resources_
std::array< size_t, ResourceTypeSize > total_resources_
Definition: ExecutorResourcePool.h:525

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_requested_chunks_not_in_pool
ChunkRequestInfo get_requested_chunks_not_in_pool(const ChunkRequestInfo &chunk_request_info) const
Definition: ExecutorResourcePool.cpp:638

ExecutorResourceMgr_Namespace::ResourcePoolInfo::allocated_cpu_slots
size_t allocated_cpu_slots
Definition: ExecutorResourcePool.h:105

ExecutorResourceMgr_Namespace::ExecutorResourcePool::set_resource
void set_resource(const ResourceType resource_type, const size_t resource_quantity)
Sets the quantity of resource_type to resource_quantity. If pool has outstanding requests, will throw. Responsibility of allowing the pool to empty and preventing concurrent requests while this operation is running is left to the caller (in particular, ExecutorResourceMgr::set_resource pauses the process queue, which waits until all executing requests are finished before yielding to the caller, before calling this method).
Definition: ExecutorResourcePool.cpp:212

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_max_resource_grant_per_request_policy
const ResourceGrantPolicy & get_max_resource_grant_per_request_policy(const ResourceSubtype resource_subtype) const
Definition: ExecutorResourcePool.h:374

ExecutorResourceMgr_Namespace::ExecutorResourcePool::deallocate_resources
void deallocate_resources(const ResourceGrant &resource_grant, const ChunkRequestInfo &chunk_request_info)
Deallocates resources granted to a requestor such that they can be used for other requests...
Definition: ExecutorResourcePool.cpp:1087

UNREACHABLE
#define UNREACHABLE()
Definition: Logger.h:338

ExecutorResourceMgr_Namespace::ResourceType
ResourceType
Stores the resource type for a ExecutorResourcePool request.
Definition: ExecutorResourceMgrCommon.h:108

ExecutorResourceMgr_Namespace::ResourcePoolInfo::allocated_gpu_buffers
size_t allocated_gpu_buffers
Definition: ExecutorResourcePool.h:112

ExecutorResourceMgr_Namespace::map_resource_type_to_resource_subtypes
std::vector< ResourceSubtype > map_resource_type_to_resource_subtypes(const ResourceType resource_type)
Returns the 1-or-more ResourceSubtypes associated with a given ResourceType.
Definition: ExecutorResourcePool.h:69

ExecutorResourceMgr_Namespace::ExecutorResourcePool::is_resource_valid
bool is_resource_valid(const ResourceType resource_type) const
Definition: ExecutorResourcePool.h:474

ExecutorResourceMgr_Namespace::ExecutorResourcePool::init_concurrency_policies
void init_concurrency_policies()
Definition: ExecutorResourcePool.cpp:95

ExecutorResourceMgr_Namespace::ExecutorResourcePool::can_currently_satisfy_request_impl
bool can_currently_satisfy_request_impl(const ResourceGrant &min_resource_grant, const ChunkRequestInfo &chunk_request_info) const
Definition: ExecutorResourcePool.cpp:555

ExecutorResourceMgr_Namespace::ExecutorResourcePool::calc_max_resource_grant_for_request
size_t calc_max_resource_grant_for_request(const size_t requested_resource_quantity, const size_t min_requested_resource_quantity, const size_t max_grantable_resource_quantity) const
Definition: ExecutorResourcePool.cpp:235

ExecutorResourceMgr_Namespace::BufferPoolChunkMap
std::map< ChunkKey, std::pair< size_t, size_t >> BufferPoolChunkMap
Definition: ExecutorResourcePool.h:196

ExecutorResourceMgr_Namespace::ConcurrentResourceGrantPolicy
Specifies the policies for resource grants in the presence of other requests, both under situations o...
Definition: ResourceGrantPolicy.h:172

ExecutorResourceMgr_Namespace::ExecutorResourcePool::add_chunk_requests_to_allocated_pool
void add_chunk_requests_to_allocated_pool(const ResourceGrant &resource_grant, const ChunkRequestInfo &chunk_request_info)
Definition: ExecutorResourcePool.cpp:714

ExecutorResourceMgr_Namespace::ExecutorResourcePool::determine_dynamic_single_resource_grant
size_t determine_dynamic_single_resource_grant(const size_t min_resource_requested, const size_t max_resource_requested, const size_t resource_allocated, const size_t total_resource, const double max_request_backoff_ratio) const
Definition: ExecutorResourcePool.cpp:917

ExecutorResourceMgr_Namespace::ResourceGrant::gpu_slots
size_t gpu_slots
Definition: ExecutorResourcePool.h:178

ExecutorResourceMgr_Namespace::ExecutorResourcePool::total_per_resource_num_requests_
std::array< size_t, ResourceTypeSize > total_per_resource_num_requests_
Definition: ExecutorResourcePool.h:540

ExecutorDeviceType
ExecutorDeviceType
Definition: ExecutorDeviceType.h:23

ExecutorResourceMgr_Namespace::ResourceSubtype
ResourceSubtype
Stores the resource sub-type for a ExecutorResourcePool request.
Definition: ExecutorResourceMgrCommon.h:144

ExecutorResourceMgr_Namespace::ExecutorResourcePool::can_currently_satisfy_chunk_request
bool can_currently_satisfy_chunk_request(const ResourceGrant &min_resource_grant, const ChunkRequestInfo &chunk_request_info) const
Definition: ExecutorResourcePool.cpp:676

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_total_allocated_buffer_pool_mem_for_level
size_t get_total_allocated_buffer_pool_mem_for_level(const ExecutorDeviceType memory_pool_type) const
Definition: ExecutorResourcePool.h:467

ExecutorResourceMgr_Namespace::ExecutorResourcePool::increment_outstanding_per_resource_num_requests
size_t increment_outstanding_per_resource_num_requests(const ResourceType resource_type)
Definition: ExecutorResourcePool.h:514

ExecutorResourceMgr_Namespace::ExecutorResourcePool::allocated_cpu_buffer_pool_chunks_
BufferPoolChunkMap allocated_cpu_buffer_pool_chunks_
Definition: ExecutorResourcePool.h:545

ExecutorResourceMgr_Namespace::ResourceSubtype::PAGEABLE_GPU_BUFFER_POOL_MEM

ExecutorResourceMgr_Namespace::ExecutorResourcePool::calc_min_max_resource_grants_for_request
std::pair< ResourceGrant, ResourceGrant > calc_min_max_resource_grants_for_request(const RequestInfo &resource_request) const
Given the provided resource_request, statically calculate the minimum and maximum grantable resources...
Definition: ExecutorResourcePool.cpp:365

ExecutorResourceMgr_Namespace::ExecutorResourcePool::calc_static_resource_grant_ranges_for_request
std::vector< ResourceRequestGrant > calc_static_resource_grant_ranges_for_request(const std::vector< ResourceRequest > &resource_requests) const
Definition: ExecutorResourcePool.cpp:337

ExecutorResourceMgr_Namespace::ResourcePoolInfo::allocated_cpu_result_mem
size_t allocated_cpu_result_mem
Definition: ExecutorResourcePool.h:107

ExecutorResourceMgr_Namespace::ExecutorResourcePool::allocate_resources
void allocate_resources(const ResourceGrant &resource_grant, const ChunkRequestInfo &chunk_request_info)
Given a resource grant (assumed to be computed in determine_dynamic_resource_grant), actually allocate (reserve) the resources in the pool so other requestors (queries) cannot use those resources until returned to the pool.
Definition: ExecutorResourcePool.cpp:1022

ExecutorResourceMgr_Namespace::ResourceGrant
Specifies the resources of each type for a given resource grant.
Definition: ExecutorResourcePool.h:176

ExecutorResourceMgr_Namespace::ExecutorResourcePool::set_concurrent_resource_grant_policy
void set_concurrent_resource_grant_policy(const ConcurrentResourceGrantPolicy &concurrent_resource_grant_policy)
Resets the concurrent resource grant policy object, which specifies a ResourceType as well as normal ...
Definition: ExecutorResourcePool.cpp:224

ExecutorResourceMgr_Namespace::ResourcePoolInfo::ResourcePoolInfo
ResourcePoolInfo(const size_t total_cpu_slots, const size_t total_gpu_slots, const size_t total_cpu_result_mem, const size_t total_cpu_buffer_pool_mem, const size_t total_gpu_buffer_pool_mem, const size_t allocated_cpu_slots, const size_t allocated_gpu_slots, const size_t allocated_cpu_result_mem, const size_t allocated_cpu_buffer_pool_mem, const size_t allocated_gpu_buffer_pool_mem, const size_t allocated_cpu_buffers, const size_t allocated_gpu_buffers, const size_t allocated_temp_cpu_buffer_pool_mem, const size_t allocated_temp_gpu_buffer_pool_mem, const size_t total_requests, const size_t outstanding_requests, const size_t outstanding_cpu_slots_requests, const size_t outstanding_gpu_slots_requests, const size_t outstanding_cpu_result_mem_requests, const size_t outstanding_cpu_buffer_pool_mem_requests, const size_t outstanding_gpu_buffer_pool_mem_requests)
Definition: ExecutorResourcePool.h:127

ExecutorResourceMgr_Namespace::ResourceSubtype::PINNED_GPU_BUFFER_POOL_MEM

ExecutorResourceMgr_Namespace::ResourcePoolInfo::outstanding_requests
size_t outstanding_requests
Definition: ExecutorResourcePool.h:118

ExecutorResourceMgr_Namespace::ExecutorResourcePool::increment_total_per_resource_num_requests
size_t increment_total_per_resource_num_requests(const ResourceType resource_type)
Definition: ExecutorResourcePool.h:499

ExecutorResourceMgr_Namespace::ResourceType::CPU_BUFFER_POOL_MEM

ExecutorResourceMgr_Namespace::ResourceGrant::buffer_mem_for_given_slots
size_t buffer_mem_for_given_slots
Definition: ExecutorResourcePool.h:184

ExecutorResourceMgr_Namespace::ResourceSubtype::PINNED_CPU_BUFFER_POOL_MEM

ExecutorResourceMgrCommon.h

ExecutorResourceMgr_Namespace::ExecutorResourcePool::calc_max_dependent_resource_grant_for_request
std::pair< size_t, size_t > calc_max_dependent_resource_grant_for_request(const size_t requested_dependent_resource_quantity, const size_t min_requested_dependent_resource_quantity, const size_t max_grantable_dependent_resource_quantity, const size_t min_requested_independent_resource_quantity, const size_t max_grantable_independent_resource_quantity, const size_t dependent_to_independent_resource_ratio) const
Definition: ExecutorResourcePool.cpp:266

ExecutorResourceMgr_Namespace::ResourceType::GPU_SLOTS

ExecutorResourceMgr_Namespace::ResourcePoolInfo::total_cpu_buffer_pool_mem
size_t total_cpu_buffer_pool_mem
Definition: ExecutorResourcePool.h:102

ExecutorResourceMgr_Namespace::ResourceSubtype::PAGEABLE_CPU_BUFFER_POOL_MEM

ExecutorResourceMgr_Namespace::ExecutorResourcePool::check_request_against_global_policy
bool check_request_against_global_policy(const size_t resource_total, const size_t resource_allocated, const ConcurrentResourceGrantPolicy &concurrent_resource_grant_policy) const
Definition: ExecutorResourcePool.cpp:491

ExecutorResourceMgr_Namespace::ExecutorResourcePool::ExecutorResourcePool
ExecutorResourcePool(const std::vector< std::pair< ResourceType, size_t >> &total_resources, const std::vector< ConcurrentResourceGrantPolicy > &concurrent_resource_grant_policies, const std::vector< ResourceGrantPolicy > &max_per_request_resource_grant_policies)
Definition: ExecutorResourcePool.cpp:48

ExecutorResourceMgr_Namespace::ResourcePoolInfo::ResourcePoolInfo
ResourcePoolInfo()
Definition: ExecutorResourcePool.h:125

ExecutorResourceMgr_Namespace::ResourceGrantPolicy
Specifies the policy for granting a resource of a specific ResourceSubtype. Note that this policy onl...
Definition: ResourceGrantPolicy.h:47

ExecutorResourceMgr_Namespace::ResourceType::INVALID_TYPE

ExecutorResourceMgr_Namespace::ResourcePoolInfo::allocated_temp_cpu_buffer_pool_mem
size_t allocated_temp_cpu_buffer_pool_mem
Definition: ExecutorResourcePool.h:114

ExecutorResourceMgr_Namespace::ExecutorResourcePool
ExecutorResourcePool keeps track of available compute and memory resources and can be queried to get ...
Definition: ExecutorResourcePool.h:237

ExecutorResourceMgr_Namespace::ResourceGrant::cpu_result_mem
size_t cpu_result_mem
Definition: ExecutorResourcePool.h:179

ExecutorResourceMgr_Namespace::ResourceGrant::print
void print() const
Definition: ExecutorResourcePool.cpp:34

ExecutorResourceMgr_Namespace::ResourcePoolInfo::total_cpu_result_mem
size_t total_cpu_result_mem
Definition: ExecutorResourcePool.h:101

ExecutorResourceMgr_Namespace::ExecutorResourcePool::decrement_total_per_resource_num_requests
size_t decrement_total_per_resource_num_requests(const ResourceType resource_type)
Definition: ExecutorResourcePool.h:504

ExecutorResourceMgr_Namespace::ExecutorResourcePool::sanity_check_requests_against_allocations
void sanity_check_requests_against_allocations() const
Definition: ExecutorResourcePool.cpp:1153

ExecutorResourceMgr_Namespace::ExecutorResourcePool::determine_dynamic_resource_grant
std::pair< bool, ResourceGrant > determine_dynamic_resource_grant(const ResourceGrant &min_resource_grant, const ResourceGrant &max_resource_grant, const ChunkRequestInfo &chunk_request_info, const double max_request_backoff_ratio) const
Determines the actual resource grant to give a query (which will be somewhere between the provided mi...
Definition: ExecutorResourcePool.cpp:936

ExecutorResourceMgr_Namespace::ResourceSubtype::INVALID_SUBTYPE

ExecutorResourceMgr_Namespace::ExecutorResourcePool::calc_min_dependent_resource_grant_for_request
std::pair< size_t, size_t > calc_min_dependent_resource_grant_for_request(const size_t min_requested_dependent_resource_quantity, const size_t min_requested_independent_resource_quantity, const size_t dependent_to_independent_resource_ratio) const
Definition: ExecutorResourcePool.cpp:249

ExecutorResourceMgr_Namespace::ExecutorResourcePool::allocated_gpu_buffer_pool_chunks_
BufferPoolChunkMap allocated_gpu_buffer_pool_chunks_
Definition: ExecutorResourcePool.h:546

ExecutorResourceMgr_Namespace::ExecutorResourcePool::outstanding_num_requests_
size_t outstanding_num_requests_
Definition: ExecutorResourcePool.h:537

ExecutorResourceMgr_Namespace::ExecutorResourcePool::concurrent_resource_grant_policies_
std::array< ConcurrentResourceGrantPolicy, ResourceTypeSize > concurrent_resource_grant_policies_
Definition: ExecutorResourcePool.h:534

ExecutorDeviceType::CPU

ExecutorResourceMgr_Namespace::ResourcePoolInfo::total_gpu_buffer_pool_mem
size_t total_gpu_buffer_pool_mem
Definition: ExecutorResourcePool.h:103

ExecutorResourceMgr_Namespace::map_resource_subtype_to_resource_type
ResourceType map_resource_subtype_to_resource_type(const ResourceSubtype resource_subtype)
Returns the ResourceType associated with a given ResourceSubtype
Definition: ExecutorResourcePool.h:36

ExecutorResourceMgr_Namespace::ExecutorResourcePool::remove_chunk_requests_from_allocated_pool
void remove_chunk_requests_from_allocated_pool(const ResourceGrant &resource_grant, const ChunkRequestInfo &chunk_request_info)
Definition: ExecutorResourcePool.cpp:814

ExecutorResourceMgr_Namespace::ExecutorResourcePool::init
void init(const std::vector< std::pair< ResourceType, size_t >> &total_resources, const std::vector< ConcurrentResourceGrantPolicy > &concurrent_resource_grant_policies, const std::vector< ResourceGrantPolicy > &max_per_request_resource_grant_policies)
Definition: ExecutorResourcePool.cpp:58

ExecutorResourceMgr_Namespace::ExecutorResourcePool::log_parameters
void log_parameters() const
Definition: ExecutorResourcePool.cpp:149

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_outstanding_per_resource_num_requests
size_t get_outstanding_per_resource_num_requests(const ResourceType resource_type) const
Definition: ExecutorResourcePool.h:509

ExecutorResourceMgr_Namespace::ResourceType::CPU_RESULT_MEM

ExecutorResourceMgr_Namespace::ExecutorResourcePool::outstanding_per_resource_num_requests_
std::array< size_t, ResourceTypeSize > outstanding_per_resource_num_requests_
Definition: ExecutorResourcePool.h:543

ExecutorResourceMgr_Namespace::ExecutorResourcePool::total_num_requests_
size_t total_num_requests_
Definition: ExecutorResourcePool.h:536

ExecutorResourceMgr_Namespace::ResourcePoolInfo::outstanding_gpu_buffer_pool_mem_requests
size_t outstanding_gpu_buffer_pool_mem_requests
Definition: ExecutorResourcePool.h:123

ExecutorResourceMgr_Namespace::ResourcePoolInfo::allocated_gpu_buffer_pool_mem
size_t allocated_gpu_buffer_pool_mem
Definition: ExecutorResourcePool.h:109

ExecutorResourceMgr_Namespace::ExecutorResourcePool::sanity_check_pool_state_on_deallocations_
const bool sanity_check_pool_state_on_deallocations_
Definition: ExecutorResourcePool.h:548

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_max_resource_grant_per_request
size_t get_max_resource_grant_per_request(const ResourceSubtype resource_subtype) const
Definition: ExecutorResourcePool.h:489

ExecutorResourceMgr_Namespace::ExecutorResourcePool::check_request_against_policy
bool check_request_against_policy(const size_t resource_request, const size_t resource_total, const size_t resource_allocated, const size_t global_outstanding_requests, const ConcurrentResourceGrantPolicy &concurrent_resource_grant_policy) const
Definition: ExecutorResourcePool.cpp:508

ResourceGrantPolicy.h

ExecutorResourceMgr_Namespace::ResourcePoolInfo::allocated_gpu_slots
size_t allocated_gpu_slots
Definition: ExecutorResourcePool.h:106

heavyai::shared_mutex
std::shared_timed_mutex shared_mutex
Definition: heavyai_shared_mutex.h:31

ExecutorResourceMgr_Namespace::ChunkRequestInfo
Specifies all DataMgr chunks needed for a query step/request, along with their sizes in bytes...
Definition: ResourceRequest.h:34

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_total_per_resource_num_requests
size_t get_total_per_resource_num_requests(const ResourceType resource_type) const
Definition: ExecutorResourcePool.h:494

ExecutorResourceMgr_Namespace::ResourceGrant::buffer_mem_gated_per_slot
bool buffer_mem_gated_per_slot
Definition: ExecutorResourcePool.h:182

ExecutorResourceMgr_Namespace::ResourcePoolInfo::total_cpu_slots
size_t total_cpu_slots
Definition: ExecutorResourcePool.h:99

ExecutorResourceMgr_Namespace::ExecutorResourcePool::max_resource_grants_per_request_
std::array< size_t, ResourceSubtypeSize > max_resource_grants_per_request_
Definition: ExecutorResourcePool.h:532

ExecutorResourceMgr_Namespace::ResourceGrant::cpu_slots
size_t cpu_slots
Definition: ExecutorResourcePool.h:177

ExecutorResourceMgr_Namespace::ExecutorResourcePool::decrement_outstanding_per_resource_num_requests
size_t decrement_outstanding_per_resource_num_requests(const ResourceType resource_type)
Definition: ExecutorResourcePool.h:519

ExecutorResourceMgr_Namespace::ExecutorResourcePool::throw_insufficient_resource_error
void throw_insufficient_resource_error(const ResourceSubtype resource_subtype, const size_t min_resource_requested) const
Definition: ExecutorResourcePool.cpp:314

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_allocated_resource_of_type
size_t get_allocated_resource_of_type(const ResourceType resource_type) const
Definition: ExecutorResourcePool.cpp:169

ExecutorResourceMgr_Namespace::ResourcePoolInfo::allocated_cpu_buffer_pool_mem
size_t allocated_cpu_buffer_pool_mem
Definition: ExecutorResourcePool.h:108

ExecutorResourceMgr_Namespace::ExecutorResourcePool::max_resource_grants_per_request_policies_
std::array< ResourceGrantPolicy, ResourceSubtypeSize > max_resource_grants_per_request_policies_
Definition: ExecutorResourcePool.h:531

ExecutorResourceMgr_Namespace::ResourcePoolInfo::total_gpu_slots
size_t total_gpu_slots
Definition: ExecutorResourcePool.h:100

ExecutorResourceMgr_Namespace::ResourcePoolInfo::outstanding_cpu_slots_requests
size_t outstanding_cpu_slots_requests
Definition: ExecutorResourcePool.h:119

ExecutorResourceMgr_Namespace::ResourcePoolInfo::outstanding_cpu_buffer_pool_mem_requests
size_t outstanding_cpu_buffer_pool_mem_requests
Definition: ExecutorResourcePool.h:122

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_concurrent_resource_grant_policy
ConcurrentResourceGrantPolicy get_concurrent_resource_grant_policy(const ResourceType resource_type) const
Definition: ExecutorResourcePool.h:369