_executor_resource_mgr_8h_source.html

 /*

  * Copyright 2022 HEAVY.AI, Inc.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  *     http://www.apache.org/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #pragma once


 #include <atomic>

 #include <chrono>

 #include <condition_variable>

 #include <mutex>

 #include <set>

 #include <shared_mutex>


 #include "ExecutorResourceMgrCommon.h"

 #include "ExecutorResourcePool.h"

 #include "OutstandingQueueRequests.h"


 namespace ExecutorResourceMgr_Namespace {


 struct ExecutorStats {

   size_t requests{0};

   size_t cpu_requests{0};

   size_t gpu_requests{0};

   size_t queue_length{0};

   size_t cpu_queue_length{0};

   size_t gpu_queue_length{0};

   size_t total_queue_time_ms{0};

   size_t total_cpu_queue_time_ms{0};

   size_t total_gpu_queue_time_ms{0};

   size_t requests_actually_queued{0};

   size_t cpu_requests_actually_queued{0};

   size_t gpu_requests_actually_queued{0};

   size_t sum_queue_size_at_entry{0};

   size_t sum_cpu_queue_size_at_entry{0};

   size_t sum_gpu_queue_size_at_entry{0};

   size_t requests_executing{0};

   size_t cpu_requests_executing{0};

   size_t gpu_requests_executing{0};

   size_t requests_executed{0};

   size_t cpu_requests_executed{0};

   size_t gpu_requests_executed{0};

   size_t total_execution_time_ms{0};

   size_t total_cpu_execution_time_ms{0};

   size_t total_gpu_execution_time_ms{0};

   size_t total_time_ms{0};

   size_t total_cpu_time_ms{0};

   size_t total_gpu_time_ms{0};

   size_t requests_with_timeouts{0};

   size_t requests_timed_out{0};

 };


 struct RequestStats {

   const RequestId request_id;

   const RequestInfo request_info;

   const ResourceGrant min_resource_grant;

   const ResourceGrant max_resource_grant;

   ResourceGrant actual_resource_grant;

   std::chrono::steady_clock::time_point enqueue_time;             // in ms

   std::chrono::steady_clock::time_point deque_time;               // in ms

   std::chrono::steady_clock::time_point execution_finished_time;  // in ms

   size_t queue_length_at_entry;

   size_t device_type_queue_length_at_entry;

   bool finished_queueing{false};

   bool finished_executing{false};

   size_t queue_time_ms{0};

   size_t execution_time_ms{0};

   size_t total_time_ms{0};

   size_t timeout_in_ms{0};

   bool timed_out{false};

   // this variable will be filled w/ a corresponding msg when an error is occurred

   // when processing the resource allocation request by ERM

   std::optional<std::string> error;


   RequestStats(const RequestId request_id,

                const RequestInfo& request_info,

                const ResourceGrant& min_resource_grant,

                const ResourceGrant& max_resource_grant,

                const std::chrono::steady_clock::time_point& enqueue_time,

                const size_t queue_length_at_entry,

                const size_t device_type_queue_length_at_entry,

                const size_t timeout_in_ms)

       : request_id(request_id)

       , request_info(request_info)

       , min_resource_grant(min_resource_grant)

       , max_resource_grant(max_resource_grant)

       , enqueue_time(enqueue_time)

       , queue_length_at_entry(queue_length_at_entry)

       , device_type_queue_length_at_entry(device_type_queue_length_at_entry)

       , timeout_in_ms(timeout_in_ms) {}

 };


 enum ExecutionRequestStage { QUEUED, EXECUTING };


 class ExecutorResourceHandle;  // forward declaration


 class ExecutorResourceMgr : public std::enable_shared_from_this<ExecutorResourceMgr> {

  public:

   ExecutorResourceMgr(

       const std::vector<std::pair<ResourceType, size_t>>& total_resources,

       const std::vector<ConcurrentResourceGrantPolicy>&

           concurrent_resource_grant_policies,

       const std::vector<ResourceGrantPolicy>& max_per_request_resource_grant_policies,

       const double max_available_resource_use_ratio);


   ~ExecutorResourceMgr();


   std::unique_ptr<ExecutorResourceHandle> request_resources_with_timeout(

       const RequestInfo& request_info,

       const size_t timeout_in_ms);


   std::unique_ptr<ExecutorResourceHandle> request_resources(

       const RequestInfo& request_info);


   void release_resources(const RequestId request_id, const ResourceGrant& resource_grant);


   ExecutorStats get_executor_stats() const;


   void print_executor_stats() const;


   std::pair<size_t, size_t> get_resource_info(const ResourceType resource_type) const {

     return executor_resource_pool_.get_resource_info(resource_type);

   }


   ResourcePoolInfo get_resource_info() const {

     return executor_resource_pool_.get_resource_info();

   }


   void set_resource(const ResourceType resource_type, const size_t resoure_quantity);


   ConcurrentResourceGrantPolicy get_concurrent_resource_grant_policy(

       const ResourceType resource_type) const;


   void set_concurrent_resource_grant_policy(

       const ConcurrentResourceGrantPolicy& concurrent_resource_grant_policy);


   void pause_process_queue();


   void resume_process_queue();


  private:

   void process_queue_loop();


   RequestStats get_request_for_id(const RequestId request_id) const;


   void mark_request_error(const RequestId request_id, std::string error_msg);


   RequestId choose_next_request();


   RequestId enqueue_request(const RequestInfo& request_info,

                             const size_t timeout_in_ms,

                             const ResourceGrant& min_resource_grant,

                             const ResourceGrant& max_resource_grant);


   void mark_request_dequed(const RequestId request_id);


   void mark_request_timed_out(const RequestId request_id);


   void mark_request_finished(const RequestId request_id);


   void set_process_queue_flag() {

     std::unique_lock<std::mutex> queue_lock(processor_queue_mutex_);

     should_process_queue_ = true;

   }


   void stop_process_queue_thread();


   std::vector<RequestId> get_requests_for_stage(

       const ExecutionRequestStage request_status) const;


   void add_request_to_stage(const RequestId request_id,

                             const ExecutionRequestStage request_status);


   void remove_request_from_stage(const RequestId request_id,

                                  const ExecutionRequestStage request_status);

   ChunkRequestInfo get_chunk_request_info(const RequestId request_id);


   ExecutorResourcePool executor_resource_pool_;


   std::atomic<size_t> requests_count_{0};


   ExecutorStats executor_stats_;


   const size_t ACTUALLY_QUEUED_MIN_MS{2};


   std::thread process_queue_thread_;


   mutable std::mutex processor_queue_mutex_;


   mutable std::mutex pause_processor_queue_mutex_;

   mutable std::mutex print_mutex_;


   mutable std::shared_mutex queue_stats_mutex_;


   mutable std::shared_mutex queued_set_mutex_;


   mutable std::shared_mutex executing_set_mutex_;


   std::condition_variable processor_queue_condition_;

   std::condition_variable pause_processor_queue_condition_;


   bool should_process_queue_{false};

   bool stop_process_queue_thread_{false};

   bool pause_process_queue_{false};

   bool process_queue_is_paused_{false};

   size_t process_queue_counter_{0};


   OutstandingQueueRequests outstanding_queue_requests_;


   std::set<RequestId> queued_requests_;


   std::set<RequestId> executing_requests_;


   std::vector<RequestStats> requests_stats_;


   const bool enable_stats_printing_{false};

   const bool enable_debug_printing_{false};


   const RequestId INVALID_REQUEST_ID{std::numeric_limits<size_t>::max()};


   const double max_available_resource_use_ratio_;

 };


 std::shared_ptr<ExecutorResourceMgr> generate_executor_resource_mgr(

     const size_t num_cpu_slots,

     const size_t num_gpu_slots,

     const size_t cpu_result_mem,

     const size_t cpu_buffer_pool_mem,

     const size_t gpu_buffer_pool_mem,

     const double per_query_max_cpu_slots_ratio,

     const double per_query_max_cpu_result_mem_ratio,

     const double per_query_max_pinned_cpu_buffer_pool_mem_ratio,

     const double per_query_max_pageable_cpu_buffer_pool_mem_ratio,

     const bool allow_cpu_kernel_concurrency,

     const bool allow_cpu_gpu_kernel_concurrency,

     const bool allow_cpu_slot_oversubscription_concurrency,

     const bool allow_gpu_slot_oversubscription,

     const bool allow_cpu_result_mem_oversubscription_concurrency,

     const double max_available_resource_use_ratio);


 class ExecutorResourceHandle {

  public:

   ExecutorResourceHandle(std::shared_ptr<ExecutorResourceMgr> resource_mgr,

                          const RequestId request_id,

                          const ResourceGrant& resource_grant)

       : resource_mgr_(resource_mgr)

       , request_id_(request_id)

       , resource_grant_(resource_grant) {}


   ~ExecutorResourceHandle() {

     resource_mgr_->release_resources(request_id_, resource_grant_);

   }


   inline RequestId get_request_id() const { return request_id_; }

   inline ResourceGrant get_resource_grant() const { return resource_grant_; }


  private:

   std::shared_ptr<ExecutorResourceMgr> resource_mgr_;

   const RequestId request_id_;

   const ResourceGrant resource_grant_;

 };


 }  // namespace ExecutorResourceMgr_Namespace

ExecutorResourceMgr_Namespace::ExecutorStats::gpu_queue_length
size_t gpu_queue_length
Definition: ExecutorResourceMgr.h:48

ExecutorResourceMgr_Namespace::ResourcePoolInfo
A container for various stats about the current state of the ExecutorResourcePool. Note that ExecutorResourcePool does not persist a struct of this type, but rather builds one on the fly when ExecutorResourcePool::get_resource_info() is called.
Definition: ExecutorResourcePool.h:98

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::release_resources
void release_resources(const RequestId request_id, const ResourceGrant &resource_grant)
Instructs ExecutorResourceMgr that the resources held by the requestor with the given request_id can ...
Definition: ExecutorResourceMgr.cpp:108

ExecutorResourceMgr_Namespace::ExecutorStats::requests_timed_out
size_t requests_timed_out
Definition: ExecutorResourceMgr.h:71

ExecutorResourceMgr_Namespace::ExecutorStats::sum_gpu_queue_size_at_entry
size_t sum_gpu_queue_size_at_entry
Definition: ExecutorResourceMgr.h:57

ExecutorResourceMgr_Namespace::RequestInfo
A container to store requested and minimum neccessary resource requests across all resource types cur...
Definition: ResourceRequest.h:70

ExecutorResourceMgr_Namespace::OutstandingQueueRequests
Stores and allows access to a binary semaphore per RequestId (using an std::unordered_map), as well as accessing all outstanding RequestIds for waiting requests.
Definition: OutstandingQueueRequests.h:35

ExecutorResourceMgr_Namespace::generate_executor_resource_mgr
std::shared_ptr< ExecutorResourceMgr > generate_executor_resource_mgr(const size_t num_cpu_slots, const size_t num_gpu_slots, const size_t cpu_result_mem, const size_t cpu_buffer_pool_mem, const size_t gpu_buffer_pool_mem, const double per_query_max_cpu_slots_ratio, const double per_query_max_cpu_result_mem_ratio, const double per_query_max_pinned_cpu_buffer_pool_mem_ratio, const double per_query_max_pageable_cpu_buffer_pool_mem_ratio, const bool allow_cpu_kernel_concurrency, const bool allow_cpu_gpu_kernel_concurrency, const bool allow_cpu_slot_oversubscription_concurrency, const bool allow_gpu_slot_oversubscription, const bool allow_cpu_result_mem_oversubscription_concurrency, const double max_available_resource_use_ratio)
Convenience factory-esque method that allows us to use the same logic to generate an ExecutorResource...
Definition: ExecutorResourceMgr.cpp:609

ExecutorResourceMgr_Namespace::ExecutorStats::requests_executed
size_t requests_executed
Definition: ExecutorResourceMgr.h:61

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_chunk_request_info
ChunkRequestInfo get_chunk_request_info(const RequestId request_id)
Get the DataMgr chunk ids and associated sizes pertaining to the input data needed by a request...
Definition: ExecutorResourceMgr.cpp:604

ExecutorResourceMgr_Namespace::ExecutorStats::gpu_requests
size_t gpu_requests
Definition: ExecutorResourceMgr.h:45

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::remove_request_from_stage
void remove_request_from_stage(const RequestId request_id, const ExecutionRequestStage request_status)
Internal method: Removes the request specified by the provided request_id from the specified stage...
Definition: ExecutorResourceMgr.cpp:590

ExecutorResourceMgr_Namespace::ExecutorStats::total_gpu_queue_time_ms
size_t total_gpu_queue_time_ms
Definition: ExecutorResourceMgr.h:51

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::request_resources
std::unique_ptr< ExecutorResourceHandle > request_resources(const RequestInfo &request_info)
Requests resources from ExecutorResourceMgr, with no timeout (unlike request_resources_with_timeout) ...
Definition: ExecutorResourceMgr.cpp:101

ExecutorResourceMgr_Namespace::ExecutorResourceHandle::get_request_id
RequestId get_request_id() const
Definition: ExecutorResourceMgr.h:607

ExecutorResourceMgr_Namespace::ExecutorStats::sum_queue_size_at_entry
size_t sum_queue_size_at_entry
Definition: ExecutorResourceMgr.h:55

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::should_process_queue_
bool should_process_queue_
Definition: ExecutorResourceMgr.h:517

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::pause_processor_queue_condition_
std::condition_variable pause_processor_queue_condition_
Definition: ExecutorResourceMgr.h:515

ExecutorResourceMgr_Namespace::ExecutorStats::sum_cpu_queue_size_at_entry
size_t sum_cpu_queue_size_at_entry
Definition: ExecutorResourceMgr.h:56

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::ACTUALLY_QUEUED_MIN_MS
const size_t ACTUALLY_QUEUED_MIN_MS
Definition: ExecutorResourceMgr.h:477

ExecutorResourceMgr_Namespace::RequestStats::finished_executing
bool finished_executing
Definition: ExecutorResourceMgr.h:95

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::add_request_to_stage
void add_request_to_stage(const RequestId request_id, const ExecutionRequestStage request_status)
Internal method: Adds the request specified by the provided request_id to the specified stage...
Definition: ExecutorResourceMgr.cpp:576

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::executor_stats_
ExecutorStats executor_stats_
Holds a single ExecutorStats struct that pertains to cummulative stats for ExecutorResourceMgr, i.e. number of requests, queue length, total execution time, etc.
Definition: ExecutorResourceMgr.h:475

ExecutorResourceMgr_Namespace::ExecutorStats::cpu_requests
size_t cpu_requests
Definition: ExecutorResourceMgr.h:44

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::process_queue_is_paused_
bool process_queue_is_paused_
Definition: ExecutorResourceMgr.h:520

ExecutorResourceMgr_Namespace::RequestId
size_t RequestId
Definition: ExecutorResourceMgrCommon.h:30

ExecutorResourceMgr_Namespace::ResourceType
ResourceType
Stores the resource type for a ExecutorResourcePool request.
Definition: ExecutorResourceMgrCommon.h:108

ExecutorResourceMgr_Namespace::RequestStats::min_resource_grant
const ResourceGrant min_resource_grant
Definition: ExecutorResourceMgr.h:86

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::queue_stats_mutex_
std::shared_mutex queue_stats_mutex_
RW mutex that protects access to executor_stats_ and request_stats_
Definition: ExecutorResourceMgr.h:502

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::process_queue_loop
void process_queue_loop()
Internal method: A thread is assigned to run this function in the constructor of ExecutorResourceMgr...
Definition: ExecutorResourceMgr.cpp:313

ExecutorResourceMgr_Namespace::ExecutorResourceHandle::~ExecutorResourceHandle
~ExecutorResourceHandle()
Definition: ExecutorResourceMgr.h:603

ExecutorResourceMgr_Namespace::ConcurrentResourceGrantPolicy
Specifies the policies for resource grants in the presence of other requests, both under situations o...
Definition: ResourceGrantPolicy.h:172

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::ExecutorResourceMgr
ExecutorResourceMgr(const std::vector< std::pair< ResourceType, size_t >> &total_resources, const std::vector< ConcurrentResourceGrantPolicy > &concurrent_resource_grant_policies, const std::vector< ResourceGrantPolicy > &max_per_request_resource_grant_policies, const double max_available_resource_use_ratio)
The constructor instantiates an ExecutorResourcePool with the provided parameters, and starts the process queue by launching a thread to invoke process_queue_loop.
Definition: ExecutorResourceMgr.cpp:25

ExecutorResourceMgr_Namespace::ExecutorStats::cpu_requests_executing
size_t cpu_requests_executing
Definition: ExecutorResourceMgr.h:59

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::stop_process_queue_thread
void stop_process_queue_thread()
Internal method: Invoked from ExecutorResourceMgr destructor, sets stop_process_queue_thread_ to true...
Definition: ExecutorResourceMgr.cpp:236

ExecutorResourceMgr_Namespace::RequestStats::device_type_queue_length_at_entry
size_t device_type_queue_length_at_entry
Definition: ExecutorResourceMgr.h:93

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::~ExecutorResourceMgr
~ExecutorResourceMgr()
The destructor ensures that the process queue thread (process_queue_thread) is stopped and that any t...
Definition: ExecutorResourceMgr.cpp:40

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::set_concurrent_resource_grant_policy
void set_concurrent_resource_grant_policy(const ConcurrentResourceGrantPolicy &concurrent_resource_grant_policy)
Set the concurrent resource grant policy for a given resource type (stored in ConcurrentResourceGrant...
Definition: ExecutorResourceMgr.cpp:298

ExecutorResourceMgr_Namespace::ExecutorStats::cpu_requests_executed
size_t cpu_requests_executed
Definition: ExecutorResourceMgr.h:62

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::mark_request_error
void mark_request_error(const RequestId request_id, std::string error_msg)
Definition: ExecutorResourceMgr.cpp:126

ExecutorResourceMgr_Namespace::RequestStats::deque_time
std::chrono::steady_clock::time_point deque_time
Definition: ExecutorResourceMgr.h:90

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_requests_for_stage
std::vector< RequestId > get_requests_for_stage(const ExecutionRequestStage request_status) const
Internal method: Get the request ids for a given stage (QUEUED or EXECUTING)
Definition: ExecutorResourceMgr.cpp:562

ExecutorResourceMgr_Namespace::ResourceGrant
Specifies the resources of each type for a given resource grant.
Definition: ExecutorResourcePool.h:176

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::processor_queue_mutex_
std::mutex processor_queue_mutex_
RW mutex that protects access to stop_process_queue_thread_ and pause_processor_queue_ ...
Definition: ExecutorResourceMgr.h:493

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::executor_resource_pool_
ExecutorResourcePool executor_resource_pool_
Keeps track of available resources for execution.
Definition: ExecutorResourceMgr.h:461

ExecutorResourceMgr_Namespace::ExecutorStats::requests_executing
size_t requests_executing
Definition: ExecutorResourceMgr.h:58

ExecutorResourceMgr_Namespace::ExecutorStats::gpu_requests_executed
size_t gpu_requests_executed
Definition: ExecutorResourceMgr.h:63

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_resource_info
ResourcePoolInfo get_resource_info() const
Returns a struct containing the total and allocated amounts of all resources tracked by ExecutorResou...
Definition: ExecutorResourceMgr.h:237

ExecutorResourceMgr_Namespace::ExecutorStats::total_time_ms
size_t total_time_ms
Definition: ExecutorResourceMgr.h:67

ExecutorResourceMgr_Namespace::ExecutorResourceHandle::resource_grant_
const ResourceGrant resource_grant_
Definition: ExecutorResourceMgr.h:613

ExecutorResourceMgrCommon.h

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::INVALID_REQUEST_ID
const RequestId INVALID_REQUEST_ID
Definition: ExecutorResourceMgr.h:560

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::executing_requests_
std::set< RequestId > executing_requests_
Set of all request ids that are currently executing (i.e. post-granting of resources). Protected by executing_set_mutex_.
Definition: ExecutorResourceMgr.h:540

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::requests_count_
std::atomic< size_t > requests_count_
An atomic that is incremented with each incoming request, and used to assign RequestIds to incoming r...
Definition: ExecutorResourceMgr.h:468

ExecutorResourceMgr_Namespace::RequestStats::actual_resource_grant
ResourceGrant actual_resource_grant
Definition: ExecutorResourceMgr.h:88

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_concurrent_resource_grant_policy
ConcurrentResourceGrantPolicy get_concurrent_resource_grant_policy(const ResourceType resource_type) const
Get the concurrent resource grant policy for a given resource type.
Definition: ExecutorResourceMgr.cpp:293

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::mark_request_dequed
void mark_request_dequed(const RequestId request_id)
Internal method: Moves the request from the QUEUED stage to EXECUTING stage and performs other bookke...
Definition: ExecutorResourceMgr.cpp:435

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::choose_next_request
RequestId choose_next_request()
Internal method: Invoked from process_queue_loop, chooses the next resource request to grant...
Definition: ExecutorResourceMgr.cpp:133

ExecutorResourceMgr_Namespace::ExecutorResourceHandle::ExecutorResourceHandle
ExecutorResourceHandle(std::shared_ptr< ExecutorResourceMgr > resource_mgr, const RequestId request_id, const ResourceGrant &resource_grant)
Definition: ExecutorResourceMgr.h:596

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_resource_info
std::pair< size_t, size_t > get_resource_info(const ResourceType resource_type) const
Returns the allocated and total available amount of the resource specified.
Definition: ExecutorResourcePool.cpp:179

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::queued_set_mutex_
std::shared_mutex queued_set_mutex_
RW mutex that protects access to queued_requests_
Definition: ExecutorResourceMgr.h:507

ExecutorResourceMgr_Namespace::RequestStats::request_id
const RequestId request_id
Definition: ExecutorResourceMgr.h:84

OutstandingQueueRequests.h

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::enable_stats_printing_
const bool enable_stats_printing_
Definition: ExecutorResourceMgr.h:557

ExecutorResourceMgr_Namespace::RequestStats::request_info
const RequestInfo request_info
Definition: ExecutorResourceMgr.h:85

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::process_queue_counter_
size_t process_queue_counter_
Definition: ExecutorResourceMgr.h:521

ExecutorResourceMgr_Namespace::ExecutorResourcePool
ExecutorResourcePool keeps track of available compute and memory resources and can be queried to get ...
Definition: ExecutorResourcePool.h:237

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::pause_process_queue_
bool pause_process_queue_
Definition: ExecutorResourceMgr.h:519

ExecutorResourceMgr_Namespace::ExecutorStats::total_cpu_queue_time_ms
size_t total_cpu_queue_time_ms
Definition: ExecutorResourceMgr.h:50

ExecutorResourceMgr_Namespace::RequestStats::execution_time_ms
size_t execution_time_ms
Definition: ExecutorResourceMgr.h:97

ExecutorResourceMgr_Namespace::ExecutorStats::queue_length
size_t queue_length
Definition: ExecutorResourceMgr.h:46

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::outstanding_queue_requests_
OutstandingQueueRequests outstanding_queue_requests_
Stores and manages a map of request ids to BinarySemaphore objects to allow threads waiting for resou...
Definition: ExecutorResourceMgr.h:528

ExecutorResourceMgr_Namespace::ExecutorResourceHandle::get_resource_grant
ResourceGrant get_resource_grant() const
Definition: ExecutorResourceMgr.h:608

ExecutorResourceMgr_Namespace::ExecutorStats
Stores current key statistics relating to ExecutorResourceMgr state, particularly around the number o...
Definition: ExecutorResourceMgr.h:42

ExecutorResourceMgr_Namespace::ExecutorStats::requests_with_timeouts
size_t requests_with_timeouts
Definition: ExecutorResourceMgr.h:70

ExecutorResourceMgr_Namespace::ExecutorStats::cpu_queue_length
size_t cpu_queue_length
Definition: ExecutorResourceMgr.h:47

ExecutorResourceMgr_Namespace::ExecutorStats::gpu_requests_executing
size_t gpu_requests_executing
Definition: ExecutorResourceMgr.h:60

ExecutorResourceMgr_Namespace::ExecutorStats::requests_actually_queued
size_t requests_actually_queued
Definition: ExecutorResourceMgr.h:52

ExecutorResourceMgr_Namespace::ExecutorStats::gpu_requests_actually_queued
size_t gpu_requests_actually_queued
Definition: ExecutorResourceMgr.h:54

ExecutorResourceMgr_Namespace::EXECUTING
Definition: ExecutorResourceMgr.h:123

ExecutorResourceMgr_Namespace::RequestStats::queue_length_at_entry
size_t queue_length_at_entry
Definition: ExecutorResourceMgr.h:92

ExecutorResourceMgr_Namespace::RequestStats::finished_queueing
bool finished_queueing
Definition: ExecutorResourceMgr.h:94

ExecutorResourceMgr_Namespace::ExecutorStats::total_gpu_execution_time_ms
size_t total_gpu_execution_time_ms
Definition: ExecutorResourceMgr.h:66

ExecutorResourceMgr_Namespace::ExecutorResourceHandle
A wrapper returned by ExecutorResourceMgr to the requestee, containing the ResourceGrant that was gra...
Definition: ExecutorResourceMgr.h:594

ExecutorResourceMgr_Namespace::ExecutorResourceHandle::request_id_
const RequestId request_id_
Definition: ExecutorResourceMgr.h:612

ExecutorResourceMgr_Namespace::RequestStats::error
std::optional< std::string > error
Definition: ExecutorResourceMgr.h:103

ExecutorResourceMgr_Namespace::RequestStats::queue_time_ms
size_t queue_time_ms
Definition: ExecutorResourceMgr.h:96

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::pause_process_queue
void pause_process_queue()
Pauses the process queue in a thread-safe manner, waiting for all queries in the executing stage to f...
Definition: ExecutorResourceMgr.cpp:245

ExecutorResourceMgr_Namespace::ExecutorStats::total_cpu_time_ms
size_t total_cpu_time_ms
Definition: ExecutorResourceMgr.h:68

logger::request_id
RequestId request_id()
Definition: Logger.cpp:876

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_executor_stats
ExecutorStats get_executor_stats() const
Returns a copy of the ExecutorStats struct held by ExecutorResourceMgr. Used for testing currently...
Definition: ExecutorResourceMgr.cpp:168

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::mark_request_finished
void mark_request_finished(const RequestId request_id)
Internal method: Invoked on successful completion of a query step from release_resources method...
Definition: ExecutorResourceMgr.cpp:517

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_resource_info
std::pair< size_t, size_t > get_resource_info(const ResourceType resource_type) const
Returns the allocated and total available amount of the resource specified.
Definition: ExecutorResourceMgr.h:224

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::request_resources_with_timeout
std::unique_ptr< ExecutorResourceHandle > request_resources_with_timeout(const RequestInfo &request_info, const size_t timeout_in_ms)
Requests resources from ExecutorResourceMgr, will throw if request takes longer than time specified b...
Definition: ExecutorResourceMgr.cpp:45

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::executing_set_mutex_
std::shared_mutex executing_set_mutex_
RW mutex that protects access to executing_requests_
Definition: ExecutorResourceMgr.h:512

ExecutorResourceMgr_Namespace::RequestStats::enqueue_time
std::chrono::steady_clock::time_point enqueue_time
Definition: ExecutorResourceMgr.h:89

ExecutorResourceMgr_Namespace::ExecutionRequestStage
ExecutionRequestStage
Definition: ExecutorResourceMgr.h:123

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::set_resource
void set_resource(const ResourceType resource_type, const size_t resoure_quantity)
Used to change the total amount available of a specified resource after construction of ExecutorResou...
Definition: ExecutorResourceMgr.cpp:282

ExecutorResourceMgr_Namespace::RequestStats::timeout_in_ms
size_t timeout_in_ms
Definition: ExecutorResourceMgr.h:99

ExecutorResourceMgr_Namespace::RequestStats::execution_finished_time
std::chrono::steady_clock::time_point execution_finished_time
Definition: ExecutorResourceMgr.h:91

ExecutorResourceMgr_Namespace::ExecutorStats::total_execution_time_ms
size_t total_execution_time_ms
Definition: ExecutorResourceMgr.h:64

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::mark_request_timed_out
void mark_request_timed_out(const RequestId request_id)
Internal method: Called if the request times out (i.e. request was made via request_resources_with_ti...
Definition: ExecutorResourceMgr.cpp:485

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::resume_process_queue
void resume_process_queue()
Resumes the process queue in a thread-safe manner. If the process queue is already paused...
Definition: ExecutorResourceMgr.cpp:265

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::processor_queue_condition_
std::condition_variable processor_queue_condition_
Definition: ExecutorResourceMgr.h:514

ExecutorResourceMgr_Namespace::ExecutorResourceMgr
ExecutorResourceMgr is the central manager for resources available to all executors in the system...
Definition: ExecutorResourceMgr.h:137

ExecutorResourceMgr_Namespace::ExecutorStats::total_gpu_time_ms
size_t total_gpu_time_ms
Definition: ExecutorResourceMgr.h:69

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::process_queue_thread_
std::thread process_queue_thread_
The thread started in the ExecutorResourceMgr constructor that continuously loops inside of process_q...
Definition: ExecutorResourceMgr.h:487

ExecutorResourceMgr_Namespace::RequestStats::timed_out
bool timed_out
Definition: ExecutorResourceMgr.h:100

heavyai::shared_mutex
std::shared_timed_mutex shared_mutex
Definition: heavyai_shared_mutex.h:31

ExecutorResourceMgr_Namespace::ChunkRequestInfo
Specifies all DataMgr chunks needed for a query step/request, along with their sizes in bytes...
Definition: ResourceRequest.h:34

ExecutorResourceMgr_Namespace::ExecutorStats::total_cpu_execution_time_ms
size_t total_cpu_execution_time_ms
Definition: ExecutorResourceMgr.h:65

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::set_process_queue_flag
void set_process_queue_flag()
Internal method: Set the should_process_queue_ flag to true, signifying that the queue should be proc...
Definition: ExecutorResourceMgr.h:401

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::max_available_resource_use_ratio_
const double max_available_resource_use_ratio_
Definition: ExecutorResourceMgr.h:562

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::enable_debug_printing_
const bool enable_debug_printing_
Definition: ExecutorResourceMgr.h:558

ExecutorResourceMgr_Namespace::RequestStats::total_time_ms
size_t total_time_ms
Definition: ExecutorResourceMgr.h:98

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::pause_processor_queue_mutex_
std::mutex pause_processor_queue_mutex_
Definition: ExecutorResourceMgr.h:495

ExecutorResourceMgr_Namespace::RequestStats::max_resource_grant
const ResourceGrant max_resource_grant
Definition: ExecutorResourceMgr.h:87

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::print_executor_stats
void print_executor_stats() const
Prints the ExecutorStats struct. Use for debugging.
Definition: ExecutorResourceMgr.cpp:173

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::queued_requests_
std::set< RequestId > queued_requests_
Set of all request ids that are currently queued. Protected by queued_set_mutex_. ...
Definition: ExecutorResourceMgr.h:534

ExecutorResourceMgr_Namespace::RequestStats::RequestStats
RequestStats(const RequestId request_id, const RequestInfo &request_info, const ResourceGrant &min_resource_grant, const ResourceGrant &max_resource_grant, const std::chrono::steady_clock::time_point &enqueue_time, const size_t queue_length_at_entry, const size_t device_type_queue_length_at_entry, const size_t timeout_in_ms)
Definition: ExecutorResourceMgr.h:105

ExecutorResourcePool.h

ExecutorResourceMgr_Namespace::QUEUED
Definition: ExecutorResourceMgr.h:123

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::requests_stats_
std::vector< RequestStats > requests_stats_
Stores a vector of all requests that have been seen by ExecutorResourceMgr, with each incoming reques...
Definition: ExecutorResourceMgr.h:555

ExecutorResourceMgr_Namespace::RequestStats
Stores info pertaining to a single request made to ExecutorResourceMgr, including its request_id...
Definition: ExecutorResourceMgr.h:83

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::stop_process_queue_thread_
bool stop_process_queue_thread_
Definition: ExecutorResourceMgr.h:518

ExecutorResourceMgr_Namespace::ExecutorResourceHandle::resource_mgr_
std::shared_ptr< ExecutorResourceMgr > resource_mgr_
Definition: ExecutorResourceMgr.h:611

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::print_mutex_
std::mutex print_mutex_
Definition: ExecutorResourceMgr.h:496

ExecutorResourceMgr_Namespace::ExecutorStats::cpu_requests_actually_queued
size_t cpu_requests_actually_queued
Definition: ExecutorResourceMgr.h:53

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::enqueue_request
RequestId enqueue_request(const RequestInfo &request_info, const size_t timeout_in_ms, const ResourceGrant &min_resource_grant, const ResourceGrant &max_resource_grant)
Internal method: Invoked from request_resource/request_resource_with_timeout, places request in the r...
Definition: ExecutorResourceMgr.cpp:391

ExecutorResourceMgr_Namespace::ExecutorStats::requests
size_t requests
Definition: ExecutorResourceMgr.h:43

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_request_for_id
RequestStats get_request_for_id(const RequestId request_id) const
Internal method: Returns the RequestStats for a request specified by request_id.
Definition: ExecutorResourceMgr.cpp:120

ExecutorResourceMgr_Namespace::ExecutorStats::total_queue_time_ms
size_t total_queue_time_ms
Definition: ExecutorResourceMgr.h:49