_executor_resource_mgr_8cpp_source.html

 /*

  * Copyright 2022 HEAVY.AI, Inc.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  *     http://www.apache.org/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #include <iostream>

 #include <thread>


 #include "ExecutorResourceMgr.h"

 #include "Logger/Logger.h"


 namespace ExecutorResourceMgr_Namespace {


 ExecutorResourceMgr::ExecutorResourceMgr(

     const std::vector<std::pair<ResourceType, size_t>>& total_resources,

     const std::vector<ConcurrentResourceGrantPolicy>& concurrent_resource_grant_policies,

     const std::vector<ResourceGrantPolicy>& max_per_request_resource_grant_policies,

     const double max_available_resource_use_ratio)

     : executor_resource_pool_(total_resources,

                               concurrent_resource_grant_policies,

                               max_per_request_resource_grant_policies)

     , max_available_resource_use_ratio_(max_available_resource_use_ratio) {

   CHECK_GT(max_available_resource_use_ratio_, 0.0);

   CHECK_LE(max_available_resource_use_ratio_, 1.0);

   process_queue_thread_ = std::thread(&ExecutorResourceMgr::process_queue_loop, this);

   LOG(EXECUTOR) << "Executor Resource Manager queue proccessing thread started";

 }


 ExecutorResourceMgr::~ExecutorResourceMgr() {

   stop_process_queue_thread();

 }


 std::unique_ptr<ExecutorResourceHandle>

 ExecutorResourceMgr::request_resources_with_timeout(const RequestInfo& request_info,

                                                     const size_t timeout_in_ms) {

   std::pair<ResourceGrant, ResourceGrant> min_max_resource_grants;


   // Following can throw

   // Should we put in stats to track errors?

   min_max_resource_grants =

       executor_resource_pool_.calc_min_max_resource_grants_for_request(request_info);


   const auto request_id = enqueue_request(request_info,

                                           timeout_in_ms,

                                           min_max_resource_grants.first,

                                           min_max_resource_grants.second);


   if (enable_debug_printing_) {

     std::unique_lock<std::mutex> print_lock(print_mutex_);

     std::cout << std::endl << "Min resource grant";

     min_max_resource_grants.first.print();

     std::cout << std::endl << "Max resource grant";

     min_max_resource_grants.second.print();

   }


   set_process_queue_flag();

   processor_queue_condition_.notify_one();


   // Following queue_request methods will block until ExecutorResourceMgr lets them

   // execute

   if (timeout_in_ms > 0) {

     try {

       outstanding_queue_requests_.queue_request_and_wait_with_timeout(request_id,

                                                                       timeout_in_ms);

     } catch (QueryTimedOutWaitingInQueue& timeout_exception) {

       // Need to annotate request and executor stats accordingly

       mark_request_timed_out(request_id);

       throw;

     }

   } else {

     outstanding_queue_requests_.queue_request_and_wait(request_id);

   }


   auto this_ptr = shared_from_this();

   std::shared_lock<std::shared_mutex> queue_stats_read_lock(queue_stats_mutex_);

   RequestStats const& request_stats = requests_stats_[request_id];

   if (request_stats.error) {

     throw std::runtime_error("RequestStats error: " + *request_stats.error);

   }

   const ResourceGrant& actual_resource_grant = request_stats.actual_resource_grant;

   // Ensure each resource granted was at least the minimum requested

   CHECK_GE(actual_resource_grant.cpu_slots, min_max_resource_grants.first.cpu_slots);

   CHECK_GE(actual_resource_grant.gpu_slots, min_max_resource_grants.first.gpu_slots);

   CHECK_GE(actual_resource_grant.cpu_result_mem,

            min_max_resource_grants.first.cpu_result_mem);

   return std::make_unique<ExecutorResourceHandle>(

       this_ptr, request_id, actual_resource_grant);

 }


 std::unique_ptr<ExecutorResourceHandle> ExecutorResourceMgr::request_resources(

     const RequestInfo& request_info) {

   return request_resources_with_timeout(

       request_info,

       static_cast<size_t>(0));  // 0 signifies no timeout

 }


 void ExecutorResourceMgr::release_resources(const RequestId request_id,

                                             const ResourceGrant& resource_grant) {

   if (!resource_grant.is_empty()) {  // Should only be empty if request times out, should

                                      // we CHECK for this

     const auto chunk_request_info = get_chunk_request_info(request_id);

     executor_resource_pool_.deallocate_resources(resource_grant, chunk_request_info);

   }

   mark_request_finished(request_id);

   set_process_queue_flag();

   processor_queue_condition_.notify_one();

 }


 RequestStats ExecutorResourceMgr::get_request_for_id(const RequestId request_id) const {

   std::shared_lock<std::shared_mutex> queue_stats_read_lock(queue_stats_mutex_);

   CHECK_LT(request_id, requests_stats_.size());

   return requests_stats_[request_id];

 }


 void ExecutorResourceMgr::mark_request_error(const RequestId request_id,

                                              std::string error_msg) {

   std::unique_lock<std::shared_mutex> queue_stats_write_lock(queue_stats_mutex_);

   CHECK_LT(request_id, requests_stats_.size());

   requests_stats_[request_id].error = std::move(error_msg);

 }


 RequestId ExecutorResourceMgr::choose_next_request() {

   const auto request_ids = get_requests_for_stage(ExecutionRequestStage::QUEUED);

   LOG(EXECUTOR) << "ExecutorResourceMgr Queue Itr: " << process_queue_counter_ - 1

                 << " Queued requests: " << request_ids.size();

   std::unique_lock<std::shared_mutex> queue_stats_lock(queue_stats_mutex_);

   for (const auto request_id : request_ids) {

     auto& request_stats = requests_stats_[request_id];

     try {

       const auto actual_resource_grant =

           executor_resource_pool_.determine_dynamic_resource_grant(

               request_stats.min_resource_grant,

               request_stats.max_resource_grant,

               request_stats.request_info.chunk_request_info,

               max_available_resource_use_ratio_);

       // boolean sentinel first member of returned pair says whether

       // a resource grant was able to be made at all

       if (actual_resource_grant.first) {

         request_stats.actual_resource_grant = actual_resource_grant.second;

         LOG(EXECUTOR) << "ExecutorResourceMgr Queue chosen request ID: " << request_id

                       << " from " << request_ids.size() << " queued requests.";

         LOG(EXECUTOR) << "Request grant: " << actual_resource_grant.second.to_string();

         if (enable_debug_printing_) {

           std::unique_lock<std::mutex> print_lock(print_mutex_);

           std::cout << std::endl << "Actual grant";

           actual_resource_grant.second.print();

         }

         return request_id;

       }

     } catch (std::runtime_error const& e) {

       throw ExecutorResourceMgrError(request_id, e.what());

     }

   }

   return INVALID_REQUEST_ID;

 }


 ExecutorStats ExecutorResourceMgr::get_executor_stats() const {

   std::shared_lock<std::shared_mutex> queue_stats_read_lock(queue_stats_mutex_);

   return executor_stats_;  // Will make copy

 }


 void ExecutorResourceMgr::print_executor_stats() const {

   // Get atomic copy of executor_stats_ first

   const auto executor_stats = get_executor_stats();

   std::unique_lock<std::mutex> print_lock(print_mutex_);

   std::cout << std::endl << "Executor Stats" << std::endl;

   std::cout << "Requests: " << executor_stats.requests << std::endl;

   std::cout << "CPU Requests: " << executor_stats.cpu_requests << std::endl;

   std::cout << "GPU Requests: " << executor_stats.gpu_requests << std::endl;

   std::cout << "Queue Length: " << executor_stats.queue_length << std::endl;

   std::cout << "CPU Queue Length: " << executor_stats.cpu_queue_length << std::endl;

   std::cout << "GPU Queue Length: " << executor_stats.gpu_queue_length << std::endl;

   std::cout << "Total Queue Time(ms): " << executor_stats.total_queue_time_ms

             << std::endl;

   std::cout << "Total CPU Queue Time(ms): " << executor_stats.total_cpu_queue_time_ms

             << std::endl;

   std::cout << "Total GPU Queue Time(ms): " << executor_stats.total_gpu_queue_time_ms

             << std::endl;

   std::cout << "Requests Actually Queued: " << executor_stats.requests_actually_queued

             << std::endl;

   std::cout << "Requests Executing: " << executor_stats.requests_executing << std::endl;

   std::cout << "Requests Executed: " << executor_stats.requests_executed << std::endl;

   std::cout << "Total Execution Time(ms): " << executor_stats.total_execution_time_ms

             << std::endl;

   std::cout << "Total CPU Execution Time(ms): "

             << executor_stats.total_cpu_execution_time_ms << std::endl;

   std::cout << "Total GPU Execution Time(ms): "

             << executor_stats.total_gpu_execution_time_ms << std::endl;

   std::cout << "Total Time(ms): " << executor_stats.total_time_ms << std::endl;

   std::cout << "Total CPU Time(ms): " << executor_stats.total_cpu_time_ms << std::endl;

   std::cout << "Total GPU Time(ms): " << executor_stats.total_gpu_time_ms << std::endl;


   // Below technically not thread safe, but called from process_queue_loop for now so ok


   const double avg_execution_time_ms =

       executor_stats.total_execution_time_ms /

       std::max(executor_stats.requests_executed, size_t(1));

   const double avg_cpu_execution_time_ms =

       executor_stats.total_cpu_execution_time_ms /

       std::max(executor_stats.cpu_requests_executed, size_t(1));

   const double avg_gpu_execution_time_ms =

       executor_stats.total_gpu_execution_time_ms /

       std::max(executor_stats.gpu_requests_executed, size_t(1));

   const double avg_total_time_ms = executor_stats.total_time_ms /

                                    std::max(executor_stats.requests_executed, size_t(1));

   const double avg_cpu_total_time_ms =

       executor_stats.total_cpu_time_ms /

       std::max(executor_stats.cpu_requests_executed, size_t(1));

   const double avg_gpu_total_time_ms =

       executor_stats.total_gpu_time_ms /

       std::max(executor_stats.gpu_requests_executed, size_t(1));


   std::cout << "Avg Execution Time(ms): " << avg_execution_time_ms << std::endl;

   std::cout << "Avg CPU Execution Time(ms): " << avg_cpu_execution_time_ms << std::endl;

   std::cout << "Avg GPU Execution Time(ms): " << avg_gpu_execution_time_ms << std::endl;


   std::cout << "Avg Total Time(ms): " << avg_total_time_ms << std::endl;

   std::cout << "Avg CPU Total Time(ms): " << avg_cpu_total_time_ms << std::endl;

   std::cout << "Avg GPU Total Time(ms): " << avg_gpu_total_time_ms << std::endl;


   std::cout << "Process queue loop counter: " << process_queue_counter_ << std::endl

             << std::endl;

 }


 void ExecutorResourceMgr::stop_process_queue_thread() {

   {

     std::unique_lock<std::mutex> queue_lock(processor_queue_mutex_);

     stop_process_queue_thread_ = true;

   }

   processor_queue_condition_.notify_one();

   process_queue_thread_.join();

 }


 void ExecutorResourceMgr::pause_process_queue() {

   {

     std::unique_lock<std::mutex> queue_lock(processor_queue_mutex_);

     if (pause_process_queue_ || process_queue_is_paused_) {  // Was already true, abort

       LOG(INFO)

           << "Pause of ExecutorResourceMgr queue was called, but was already paused. "

              "Taking no action.";

       return;

     }

     pause_process_queue_ = true;

   }

   processor_queue_condition_.notify_one();


   std::unique_lock<std::mutex> pause_queue_lock(pause_processor_queue_mutex_);

   pause_processor_queue_condition_.wait(pause_queue_lock,

                                         [=] { return process_queue_is_paused_; });


   CHECK_EQ(executor_stats_.requests_executing, size_t(0));

 }


 void ExecutorResourceMgr::resume_process_queue() {

   {

     std::unique_lock<std::mutex> queue_lock(processor_queue_mutex_);

     if (!process_queue_is_paused_) {

       LOG(INFO)

           << "Resume of ExecutorResourceMgr queue was called, but was not paused. Taking "

              "no action.";

       return;

     }

     CHECK_EQ(executor_stats_.requests_executing, size_t(0));

     process_queue_is_paused_ = false;

     pause_process_queue_ = false;

     should_process_queue_ = true;

   }

   processor_queue_condition_.notify_one();

 }


 void ExecutorResourceMgr::set_resource(const ResourceType resource_type,

                                        const size_t resource_quantity) {

   pause_process_queue();

   CHECK_EQ(get_resource_info(resource_type).first, size_t(0));

   executor_resource_pool_.set_resource(resource_type, resource_quantity);

   const auto resource_info = get_resource_info(resource_type);

   CHECK_EQ(resource_info.first, size_t(0));

   CHECK_EQ(resource_info.second, resource_quantity);

   resume_process_queue();

 }


 ConcurrentResourceGrantPolicy ExecutorResourceMgr::get_concurrent_resource_grant_policy(

     const ResourceType resource_type) const {

   return executor_resource_pool_.get_concurrent_resource_grant_policy(resource_type);

 }


 void ExecutorResourceMgr::set_concurrent_resource_grant_policy(

     const ConcurrentResourceGrantPolicy& concurrent_resource_grant_policy) {

   pause_process_queue();

   executor_resource_pool_.set_concurrent_resource_grant_policy(

       concurrent_resource_grant_policy);

   const auto applied_concurrent_resource_grant_policy =

       executor_resource_pool_.get_concurrent_resource_grant_policy(

           concurrent_resource_grant_policy.resource_type);

   CHECK(concurrent_resource_grant_policy.concurrency_policy ==

         applied_concurrent_resource_grant_policy.concurrency_policy);

   CHECK(concurrent_resource_grant_policy.oversubscription_concurrency_policy ==

         applied_concurrent_resource_grant_policy.oversubscription_concurrency_policy);

   resume_process_queue();

 }


 void ExecutorResourceMgr::process_queue_loop() {

   const size_t min_ms_between_print_stats{5000};  // 5 sec

   if (enable_stats_printing_) {

     print_executor_stats();

   }

   std::chrono::steady_clock::time_point last_print_time =

       std::chrono::steady_clock::now();

   while (true) {

     std::unique_lock<std::mutex> queue_lock(processor_queue_mutex_);

     processor_queue_condition_.wait(queue_lock, [=] {

       return should_process_queue_ || stop_process_queue_thread_ || pause_process_queue_;

     });

     // Use the following flag to know when to exit

     // (to prevent leaving this thread dangling at server shutdown)

     if (stop_process_queue_thread_) {

       should_process_queue_ =

           false;  // not strictly neccessary, but would be if we add threads

       return;

     }


     if (pause_process_queue_) {

       should_process_queue_ = false;

       if (executor_stats_.requests_executing == 0) {

         {

           std::unique_lock<std::mutex> pause_queue_lock(pause_processor_queue_mutex_);

           process_queue_is_paused_ = true;

         }

         pause_processor_queue_condition_.notify_one();

       }

       continue;

     }


     process_queue_counter_++;

     RequestId chosen_request_id;

     try {

       chosen_request_id = choose_next_request();

     } catch (ExecutorResourceMgrError const& e) {

       chosen_request_id = e.getRequestId();

       mark_request_error(chosen_request_id, e.getErrorMsg());

     }

     if (enable_debug_printing_) {

       std::unique_lock<std::mutex> print_lock(print_mutex_);

       std::cout << "Process loop iteration: " << process_queue_counter_ - 1 << std::endl;

       std::cout << "Process loop chosen request_id: " << chosen_request_id << std::endl;

     }

     if (chosen_request_id == INVALID_REQUEST_ID) {

       // Means no query was found that could be currently run

       // Below is safe as we hold an exclusive lock on processor_queue_mutex_

       should_process_queue_ = false;

       continue;

     }

     // If here we have a valid request id

     mark_request_dequed(chosen_request_id);

     const auto request_stats = get_request_for_id(chosen_request_id);

     if (!request_stats.error) {

       executor_resource_pool_.allocate_resources(

           request_stats.actual_resource_grant,

           request_stats.request_info.chunk_request_info);

     }

     outstanding_queue_requests_.wake_request_by_id(chosen_request_id);


     if (enable_stats_printing_) {

       std::chrono::steady_clock::time_point current_time =

           std::chrono::steady_clock::now();

       const size_t ms_since_last_print_stats =

           std::chrono::duration_cast<std::chrono::milliseconds>(current_time -

                                                                 last_print_time)

               .count();

       if (ms_since_last_print_stats >= min_ms_between_print_stats) {

         print_executor_stats();

         last_print_time = current_time;

       }

     }

     // Leave should_process_queue_ as true to see if we can allocate resources for another

     // request

   }

 }


 RequestId ExecutorResourceMgr::enqueue_request(const RequestInfo& request_info,

                                                const size_t timeout_in_ms,

                                                const ResourceGrant& min_resource_grant,

                                                const ResourceGrant& max_resource_grant) {

   const std::chrono::steady_clock::time_point enqueue_time =

       std::chrono::steady_clock::now();

   std::unique_lock<std::shared_mutex> queue_stats_write_lock(queue_stats_mutex_);

   const RequestId request_id = requests_count_.fetch_add(1, std::memory_order_relaxed);

   executor_stats_.requests++;

   if (timeout_in_ms > 0) {

     executor_stats_.requests_with_timeouts++;

   }

   const size_t queue_length_at_entry = executor_stats_.queue_length++;

   executor_stats_.sum_queue_size_at_entry += queue_length_at_entry;

   size_t device_type_queue_length_at_entry{0};

   switch (request_info.request_device_type) {

     case ExecutorDeviceType::CPU: {

       executor_stats_.cpu_requests++;

       device_type_queue_length_at_entry = executor_stats_.cpu_queue_length++;

       executor_stats_.sum_cpu_queue_size_at_entry += device_type_queue_length_at_entry;

       break;

     }

     case ExecutorDeviceType::GPU: {

       executor_stats_.gpu_requests++;

       device_type_queue_length_at_entry = executor_stats_.gpu_queue_length++;

       executor_stats_.sum_gpu_queue_size_at_entry += device_type_queue_length_at_entry;

       break;

     }

     default:

       UNREACHABLE();

   }


   requests_stats_.emplace_back(RequestStats(request_id,

                                             request_info,

                                             min_resource_grant,

                                             max_resource_grant,

                                             enqueue_time,

                                             queue_length_at_entry,

                                             device_type_queue_length_at_entry,

                                             timeout_in_ms));

   add_request_to_stage(request_id, ExecutionRequestStage::QUEUED);

   return request_id;

 }


 void ExecutorResourceMgr::mark_request_dequed(const RequestId request_id) {

   const std::chrono::steady_clock::time_point deque_time =

       std::chrono::steady_clock::now();

   // Below is only to CHECK our request_id against high water mark... should be

   // relatively inexpensive though

   const size_t current_request_count = requests_count_.load(std::memory_order_relaxed);

   CHECK_LT(request_id, current_request_count);

   {

     std::unique_lock<std::shared_mutex> queue_stats_write_lock(queue_stats_mutex_);

     RequestStats& request_stats = requests_stats_[request_id];

     request_stats.deque_time = deque_time;

     request_stats.finished_queueing = true;

     request_stats.queue_time_ms =

         std::chrono::duration_cast<std::chrono::milliseconds>(request_stats.deque_time -

                                                               request_stats.enqueue_time)

             .count();

   }

   remove_request_from_stage(request_id, ExecutionRequestStage::QUEUED);

   add_request_to_stage(request_id, ExecutionRequestStage::EXECUTING);


   std::shared_lock<std::shared_mutex> queue_stats_read_lock(queue_stats_mutex_);

   const RequestStats& request_stats = requests_stats_[request_id];

   executor_stats_.queue_length--;

   executor_stats_.requests_executing++;

   if (request_stats.queue_time_ms <= ACTUALLY_QUEUED_MIN_MS) {

     executor_stats_.total_queue_time_ms += request_stats.queue_time_ms;

     executor_stats_.requests_actually_queued++;

   }

   switch (request_stats.request_info.request_device_type) {

     case ExecutorDeviceType::CPU:

       executor_stats_.cpu_queue_length--;

       executor_stats_.cpu_requests_executing++;

       if (request_stats.queue_time_ms <= ACTUALLY_QUEUED_MIN_MS) {

         executor_stats_.total_cpu_queue_time_ms += request_stats.queue_time_ms;

         executor_stats_.cpu_requests_actually_queued++;

       }

       break;

     case ExecutorDeviceType::GPU:

       executor_stats_.gpu_queue_length--;

       executor_stats_.gpu_requests_executing++;

       if (request_stats.queue_time_ms <= ACTUALLY_QUEUED_MIN_MS) {

         executor_stats_.total_gpu_queue_time_ms += request_stats.queue_time_ms;

         executor_stats_.gpu_requests_actually_queued++;

       }

       break;

     default:

       UNREACHABLE();

   }

 }


 void ExecutorResourceMgr::mark_request_timed_out(const RequestId request_id) {

   const size_t current_request_count = requests_count_.load(std::memory_order_relaxed);

   CHECK_LT(request_id, current_request_count);

   {

     std::unique_lock<std::shared_mutex> queue_stats_write_lock(queue_stats_mutex_);

     RequestStats& request_stats = requests_stats_[request_id];

     CHECK(!request_stats.finished_queueing);

     CHECK_GT(request_stats.timeout_in_ms, size_t(0));

     request_stats.timed_out = true;

   }

   remove_request_from_stage(request_id, ExecutionRequestStage::QUEUED);

   std::shared_lock<std::shared_mutex> queue_stats_read_lock(queue_stats_mutex_);

   const RequestStats& request_stats = requests_stats_[request_id];

   CHECK_GT(executor_stats_.queue_length, size_t(0));

   executor_stats_.queue_length--;

   executor_stats_.requests_timed_out++;

   switch (request_stats.request_info.request_device_type) {

     case ExecutorDeviceType::CPU: {

       CHECK_GT(executor_stats_.cpu_queue_length, size_t(0));

       executor_stats_.cpu_queue_length--;

       break;

     }

     case ExecutorDeviceType::GPU: {

       CHECK_GT(executor_stats_.gpu_queue_length, size_t(0));

       executor_stats_.gpu_queue_length--;

       break;

     }

     default:

       UNREACHABLE();

   }

 }


 void ExecutorResourceMgr::mark_request_finished(const RequestId request_id) {

   const std::chrono::steady_clock::time_point execution_finished_time =

       std::chrono::steady_clock::now();

   // Below is only to CHECK our request_id against high water mark... should be

   // relatively inexpensive though

   const size_t current_request_count = requests_count_.load(std::memory_order_relaxed);

   CHECK_LT(request_id, current_request_count);

   std::unique_lock<std::shared_mutex> queue_stats_write_lock(queue_stats_mutex_);

   RequestStats& request_stats = requests_stats_[request_id];

   request_stats.execution_finished_time = execution_finished_time;

   request_stats.finished_executing = true;

   request_stats.execution_time_ms =

       std::chrono::duration_cast<std::chrono::milliseconds>(

           request_stats.execution_finished_time - request_stats.deque_time)

           .count();

   request_stats.total_time_ms =

       std::chrono::duration_cast<std::chrono::milliseconds>(

           request_stats.execution_finished_time - request_stats.enqueue_time)

           .count();

   remove_request_from_stage(request_id, ExecutionRequestStage::EXECUTING);


   executor_stats_.requests_executing--;

   executor_stats_.requests_executed++;

   executor_stats_.total_execution_time_ms += request_stats.execution_time_ms;

   executor_stats_.total_time_ms += request_stats.total_time_ms;

   switch (request_stats.request_info.request_device_type) {

     case ExecutorDeviceType::CPU: {

       executor_stats_.cpu_requests_executing--;

       executor_stats_.cpu_requests_executed++;

       executor_stats_.total_cpu_execution_time_ms += request_stats.execution_time_ms;

       executor_stats_.total_cpu_time_ms += request_stats.total_time_ms;

       break;

     }

     case ExecutorDeviceType::GPU: {

       executor_stats_.gpu_requests_executing--;

       executor_stats_.gpu_requests_executed++;

       executor_stats_.total_gpu_execution_time_ms += request_stats.execution_time_ms;

       executor_stats_.total_gpu_time_ms += request_stats.total_time_ms;

       break;

     }

     default:

       UNREACHABLE();

   }

 }


 std::vector<RequestId> ExecutorResourceMgr::get_requests_for_stage(

     const ExecutionRequestStage request_stage) const {

   auto& chosen_set = request_stage == ExecutionRequestStage::QUEUED ? queued_requests_

                                                                     : executing_requests_;

   auto& chosen_mutex = request_stage == ExecutionRequestStage::QUEUED

                            ? queued_set_mutex_

                            : executing_set_mutex_;

   std::shared_lock<std::shared_mutex> set_read_lock(chosen_mutex);


   const std::vector<RequestId> request_ids_for_stage(chosen_set.begin(),

                                                      chosen_set.end());

   return request_ids_for_stage;

 }


 void ExecutorResourceMgr::add_request_to_stage(

     const RequestId request_id,

     const ExecutionRequestStage request_stage) {

   auto& chosen_set = request_stage == ExecutionRequestStage::QUEUED ? queued_requests_

                                                                     : executing_requests_;

   auto& chosen_mutex = request_stage == ExecutionRequestStage::QUEUED

                            ? queued_set_mutex_

                            : executing_set_mutex_;

   std::unique_lock<std::shared_mutex> set_write_lock(chosen_mutex);


   CHECK(chosen_set.insert(request_id)

             .second);  // Should return true as element should not exist in set

 }


 void ExecutorResourceMgr::remove_request_from_stage(

     const RequestId request_id,

     const ExecutionRequestStage request_stage) {

   auto& chosen_set = request_stage == ExecutionRequestStage::QUEUED ? queued_requests_

                                                                     : executing_requests_;

   auto& chosen_mutex = request_stage == ExecutionRequestStage::QUEUED

                            ? queued_set_mutex_

                            : executing_set_mutex_;

   std::unique_lock<std::shared_mutex> set_write_lock(chosen_mutex);


   CHECK_EQ(chosen_set.erase(request_id),

            size_t(1));  // Should return 1 as element must be in set

 }


 ChunkRequestInfo ExecutorResourceMgr::get_chunk_request_info(const RequestId request_id) {

   std::shared_lock<std::shared_mutex> queue_stats_read_lock(queue_stats_mutex_);

   return requests_stats_[request_id].request_info.chunk_request_info;

 }


 std::shared_ptr<ExecutorResourceMgr> generate_executor_resource_mgr(

     const size_t num_cpu_slots,

     const size_t num_gpu_slots,

     const size_t cpu_result_mem,

     const size_t cpu_buffer_pool_mem,

     const size_t gpu_buffer_pool_mem,

     const double per_query_max_cpu_slots_ratio,

     const double per_query_max_cpu_result_mem_ratio,

     const double per_query_max_pinned_cpu_buffer_pool_mem_ratio,

     const double per_query_max_pageable_cpu_buffer_pool_mem_ratio,

     const bool allow_cpu_kernel_concurrency,

     const bool allow_cpu_gpu_kernel_concurrency,

     const bool allow_cpu_slot_oversubscription_concurrency,

     const bool allow_gpu_slot_oversubscription,

     const bool allow_cpu_result_mem_oversubscription_concurrency,

     const double max_available_resource_use_ratio) {

   CHECK_GT(num_cpu_slots, size_t(0));

   CHECK_GT(cpu_result_mem, size_t(0));

   CHECK_GT(cpu_buffer_pool_mem, size_t(0));

   CHECK_GT(per_query_max_cpu_slots_ratio, size_t(0));

   CHECK_EQ(!(allow_cpu_kernel_concurrency || allow_cpu_gpu_kernel_concurrency) &&

                allow_cpu_slot_oversubscription_concurrency,

            false);

   CHECK_EQ(!(allow_cpu_kernel_concurrency || allow_cpu_gpu_kernel_concurrency) &&

                allow_cpu_result_mem_oversubscription_concurrency,

            false);

   CHECK_GT(max_available_resource_use_ratio, 0.0);

   CHECK_LE(max_available_resource_use_ratio, 1.0);


   const std::vector<std::pair<ResourceType, size_t>> total_resources = {

       std::make_pair(ResourceType::CPU_SLOTS, num_cpu_slots),

       std::make_pair(ResourceType::GPU_SLOTS, num_gpu_slots),

       std::make_pair(ResourceType::CPU_RESULT_MEM, cpu_result_mem),

       std::make_pair(ResourceType::CPU_BUFFER_POOL_MEM, cpu_buffer_pool_mem),

       std::make_pair(ResourceType::GPU_BUFFER_POOL_MEM, gpu_buffer_pool_mem)};


   const auto max_per_request_cpu_slots_grant_policy = gen_ratio_resource_grant_policy(

       ResourceSubtype::CPU_SLOTS, per_query_max_cpu_slots_ratio);


   // Use unlimited policy for now as some GPU query plans can need more kernels than gpus

   const auto max_per_request_gpu_slots_grant_policy =

       gen_unlimited_resource_grant_policy(ResourceSubtype::GPU_SLOTS);

   const auto max_per_request_cpu_result_mem_grant_policy =

       gen_ratio_resource_grant_policy(ResourceSubtype::CPU_RESULT_MEM,

                                       per_query_max_cpu_result_mem_ratio);


   const auto max_per_request_pinned_cpu_buffer_pool_mem =

       gen_ratio_resource_grant_policy(ResourceSubtype::PINNED_CPU_BUFFER_POOL_MEM,

                                       per_query_max_pinned_cpu_buffer_pool_mem_ratio);

   const auto max_per_request_pageable_cpu_buffer_pool_mem =

       gen_ratio_resource_grant_policy(ResourceSubtype::PAGEABLE_CPU_BUFFER_POOL_MEM,

                                       per_query_max_pageable_cpu_buffer_pool_mem_ratio);


   const std::vector<ResourceGrantPolicy> max_per_request_resource_grant_policies = {

       max_per_request_cpu_slots_grant_policy,

       max_per_request_gpu_slots_grant_policy,

       max_per_request_cpu_result_mem_grant_policy,

       max_per_request_pinned_cpu_buffer_pool_mem,

       max_per_request_pageable_cpu_buffer_pool_mem};


   const auto cpu_slots_undersubscription_concurrency_policy =

       allow_cpu_kernel_concurrency ? ResourceConcurrencyPolicy::ALLOW_CONCURRENT_REQUESTS

                                    : ResourceConcurrencyPolicy::ALLOW_SINGLE_REQUEST;

   // Whether a single query can oversubscribe CPU slots should be controlled with

   // per_query_max_cpu_slots_ratio

   const auto cpu_slots_oversubscription_concurrency_policy =

       allow_cpu_slot_oversubscription_concurrency

           ? ResourceConcurrencyPolicy::ALLOW_CONCURRENT_REQUESTS

           : ResourceConcurrencyPolicy::ALLOW_SINGLE_REQUEST;

   const auto gpu_slots_undersubscription_concurrency_policy =

       allow_cpu_gpu_kernel_concurrency

           ? ResourceConcurrencyPolicy::ALLOW_SINGLE_REQUEST

           : ResourceConcurrencyPolicy::ALLOW_SINGLE_REQUEST_GLOBALLY;

   const auto gpu_slots_oversubscription_concurrency_policy =

       !allow_gpu_slot_oversubscription

           ? ResourceConcurrencyPolicy::DISALLOW_REQUESTS

           : (allow_cpu_gpu_kernel_concurrency

                  ? ResourceConcurrencyPolicy::ALLOW_SINGLE_REQUEST

                  : ResourceConcurrencyPolicy::ALLOW_SINGLE_REQUEST_GLOBALLY);


   // Whether a single query can oversubscribe CPU memory should be controlled with

   // per_query_max_cpu_result_mem_ratio

   const auto cpu_result_mem_oversubscription_concurrency_policy =

       allow_cpu_result_mem_oversubscription_concurrency

           ? ResourceConcurrencyPolicy::ALLOW_CONCURRENT_REQUESTS

           : ResourceConcurrencyPolicy::ALLOW_SINGLE_REQUEST;


   const auto concurrent_cpu_slots_grant_policy =

       ConcurrentResourceGrantPolicy(ResourceType::CPU_SLOTS,

                                     cpu_slots_undersubscription_concurrency_policy,

                                     cpu_slots_oversubscription_concurrency_policy);

   const ConcurrentResourceGrantPolicy concurrent_gpu_slots_grant_policy(

       ResourceType::GPU_SLOTS,

       gpu_slots_undersubscription_concurrency_policy,

       gpu_slots_oversubscription_concurrency_policy);


   const auto concurrent_cpu_result_mem_grant_policy =

       ConcurrentResourceGrantPolicy(ResourceType::CPU_RESULT_MEM,

                                     ResourceConcurrencyPolicy::ALLOW_CONCURRENT_REQUESTS,

                                     cpu_result_mem_oversubscription_concurrency_policy);


   const std::vector<ConcurrentResourceGrantPolicy> concurrent_resource_grant_policies{

       concurrent_cpu_slots_grant_policy,

       concurrent_gpu_slots_grant_policy,

       concurrent_cpu_result_mem_grant_policy};


   return std::make_shared<ExecutorResourceMgr>(total_resources,

                                                concurrent_resource_grant_policies,

                                                max_per_request_resource_grant_policies,

                                                max_available_resource_use_ratio);

 }


 }  // namespace ExecutorResourceMgr_Namespace

ExecutorResourceMgr_Namespace::ExecutorStats::gpu_queue_length
size_t gpu_queue_length
Definition: ExecutorResourceMgr.h:48

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::release_resources
void release_resources(const RequestId request_id, const ResourceGrant &resource_grant)
Instructs ExecutorResourceMgr that the resources held by the requestor with the given request_id can ...
Definition: ExecutorResourceMgr.cpp:108

ExecutorResourceMgr_Namespace::ExecutorStats::requests_timed_out
size_t requests_timed_out
Definition: ExecutorResourceMgr.h:71

ExecutorResourceMgr_Namespace::ExecutorStats::sum_gpu_queue_size_at_entry
size_t sum_gpu_queue_size_at_entry
Definition: ExecutorResourceMgr.h:57

ExecutorResourceMgr_Namespace::RequestInfo
A container to store requested and minimum neccessary resource requests across all resource types cur...
Definition: ResourceRequest.h:70

CHECK_EQ
#define CHECK_EQ(x, y)
Definition: Logger.h:301

ExecutorResourceMgr_Namespace::generate_executor_resource_mgr
std::shared_ptr< ExecutorResourceMgr > generate_executor_resource_mgr(const size_t num_cpu_slots, const size_t num_gpu_slots, const size_t cpu_result_mem, const size_t cpu_buffer_pool_mem, const size_t gpu_buffer_pool_mem, const double per_query_max_cpu_slots_ratio, const double per_query_max_cpu_result_mem_ratio, const double per_query_max_pinned_cpu_buffer_pool_mem_ratio, const double per_query_max_pageable_cpu_buffer_pool_mem_ratio, const bool allow_cpu_kernel_concurrency, const bool allow_cpu_gpu_kernel_concurrency, const bool allow_cpu_slot_oversubscription_concurrency, const bool allow_gpu_slot_oversubscription, const bool allow_cpu_result_mem_oversubscription_concurrency, const double max_available_resource_use_ratio)
Convenience factory-esque method that allows us to use the same logic to generate an ExecutorResource...
Definition: ExecutorResourceMgr.cpp:609

ExecutorResourceMgr_Namespace::ResourceType::CPU_SLOTS

ExecutorResourceMgr_Namespace::ResourceGrant::is_empty
bool is_empty() const
Definition: ExecutorResourcePool.h:186

ExecutorResourceMgr_Namespace::ExecutorStats::requests_executed
size_t requests_executed
Definition: ExecutorResourceMgr.h:61

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_chunk_request_info
ChunkRequestInfo get_chunk_request_info(const RequestId request_id)
Get the DataMgr chunk ids and associated sizes pertaining to the input data needed by a request...
Definition: ExecutorResourceMgr.cpp:604

ExecutorResourceMgr_Namespace::ExecutorStats::gpu_requests
size_t gpu_requests
Definition: ExecutorResourceMgr.h:45

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::remove_request_from_stage
void remove_request_from_stage(const RequestId request_id, const ExecutionRequestStage request_status)
Internal method: Removes the request specified by the provided request_id from the specified stage...
Definition: ExecutorResourceMgr.cpp:590

ExecutorResourceMgr_Namespace::ExecutorStats::total_gpu_queue_time_ms
size_t total_gpu_queue_time_ms
Definition: ExecutorResourceMgr.h:51

ExecutorResourceMgr_Namespace::OutstandingQueueRequests::queue_request_and_wait
void queue_request_and_wait(const RequestId request_id)
Submits a request with id request_id into the queue, waiting on a BinarySemaphore until ExecutorResou...
Definition: OutstandingQueueRequests.h:47

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::request_resources
std::unique_ptr< ExecutorResourceHandle > request_resources(const RequestInfo &request_info)
Requests resources from ExecutorResourceMgr, with no timeout (unlike request_resources_with_timeout) ...
Definition: ExecutorResourceMgr.cpp:101

ExecutorResourceMgr_Namespace::ExecutorStats::sum_queue_size_at_entry
size_t sum_queue_size_at_entry
Definition: ExecutorResourceMgr.h:55

ExecutorResourceMgr_Namespace::QueryTimedOutWaitingInQueue
Definition: ExecutorResourceMgrCommon.h:44

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::should_process_queue_
bool should_process_queue_
Definition: ExecutorResourceMgr.h:517

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::pause_processor_queue_condition_
std::condition_variable pause_processor_queue_condition_
Definition: ExecutorResourceMgr.h:515

ExecutorResourceMgr_Namespace::ExecutorStats::sum_cpu_queue_size_at_entry
size_t sum_cpu_queue_size_at_entry
Definition: ExecutorResourceMgr.h:56

ExecutorResourceMgr_Namespace::ResourceType::GPU_BUFFER_POOL_MEM

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::ACTUALLY_QUEUED_MIN_MS
const size_t ACTUALLY_QUEUED_MIN_MS
Definition: ExecutorResourceMgr.h:477

ExecutorResourceMgr.h

ExecutorResourceMgr_Namespace::RequestStats::finished_executing
bool finished_executing
Definition: ExecutorResourceMgr.h:95

LOG
#define LOG(tag)
Definition: Logger.h:285

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::add_request_to_stage
void add_request_to_stage(const RequestId request_id, const ExecutionRequestStage request_status)
Internal method: Adds the request specified by the provided request_id to the specified stage...
Definition: ExecutorResourceMgr.cpp:576

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::executor_stats_
ExecutorStats executor_stats_
Holds a single ExecutorStats struct that pertains to cummulative stats for ExecutorResourceMgr, i.e. number of requests, queue length, total execution time, etc.
Definition: ExecutorResourceMgr.h:475

ExecutorResourceMgr_Namespace::ConcurrentResourceGrantPolicy::resource_type
ResourceType resource_type
The type of a resource this concurrent resource grant policy pertains to.
Definition: ResourceGrantPolicy.h:176

ExecutorResourceMgr_Namespace::ExecutorResourcePool::set_resource
void set_resource(const ResourceType resource_type, const size_t resource_quantity)
Sets the quantity of resource_type to resource_quantity. If pool has outstanding requests, will throw. Responsibility of allowing the pool to empty and preventing concurrent requests while this operation is running is left to the caller (in particular, ExecutorResourceMgr::set_resource pauses the process queue, which waits until all executing requests are finished before yielding to the caller, before calling this method).
Definition: ExecutorResourcePool.cpp:212

ExecutorResourceMgr_Namespace::ExecutorStats::cpu_requests
size_t cpu_requests
Definition: ExecutorResourceMgr.h:44

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::process_queue_is_paused_
bool process_queue_is_paused_
Definition: ExecutorResourceMgr.h:520

ExecutorResourceMgr_Namespace::RequestId
size_t RequestId
Definition: ExecutorResourceMgrCommon.h:30

ExecutorResourceMgr_Namespace::ExecutorResourcePool::deallocate_resources
void deallocate_resources(const ResourceGrant &resource_grant, const ChunkRequestInfo &chunk_request_info)
Deallocates resources granted to a requestor such that they can be used for other requests...
Definition: ExecutorResourcePool.cpp:1087

UNREACHABLE
#define UNREACHABLE()
Definition: Logger.h:338

CHECK_GE
#define CHECK_GE(x, y)
Definition: Logger.h:306

ExecutorResourceMgr_Namespace::ResourceType
ResourceType
Stores the resource type for a ExecutorResourcePool request.
Definition: ExecutorResourceMgrCommon.h:108

ExecutorResourceMgr_Namespace::ALLOW_SINGLE_REQUEST
Definition: ResourceGrantPolicy.h:151

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::queue_stats_mutex_
std::shared_mutex queue_stats_mutex_
RW mutex that protects access to executor_stats_ and request_stats_
Definition: ExecutorResourceMgr.h:502

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::process_queue_loop
void process_queue_loop()
Internal method: A thread is assigned to run this function in the constructor of ExecutorResourceMgr...
Definition: ExecutorResourceMgr.cpp:313

ExecutorResourceMgr_Namespace::ConcurrentResourceGrantPolicy
Specifies the policies for resource grants in the presence of other requests, both under situations o...
Definition: ResourceGrantPolicy.h:172

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::ExecutorResourceMgr
ExecutorResourceMgr(const std::vector< std::pair< ResourceType, size_t >> &total_resources, const std::vector< ConcurrentResourceGrantPolicy > &concurrent_resource_grant_policies, const std::vector< ResourceGrantPolicy > &max_per_request_resource_grant_policies, const double max_available_resource_use_ratio)
The constructor instantiates an ExecutorResourcePool with the provided parameters, and starts the process queue by launching a thread to invoke process_queue_loop.
Definition: ExecutorResourceMgr.cpp:25

ExecutorResourceMgr_Namespace::gen_unlimited_resource_grant_policy
ResourceGrantPolicy gen_unlimited_resource_grant_policy(const ResourceSubtype resource_subtype)
Generates a ResourceGrantPolicy with ResourceGrantPolicySizeType::UNLIMITED
Definition: ResourceGrantPolicy.cpp:82

ExecutorResourceMgr_Namespace::ExecutorStats::cpu_requests_executing
size_t cpu_requests_executing
Definition: ExecutorResourceMgr.h:59

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::stop_process_queue_thread
void stop_process_queue_thread()
Internal method: Invoked from ExecutorResourceMgr destructor, sets stop_process_queue_thread_ to true...
Definition: ExecutorResourceMgr.cpp:236

CHECK_GT
#define CHECK_GT(x, y)
Definition: Logger.h:305

ExecutorResourceMgr_Namespace::ResourceGrant::gpu_slots
size_t gpu_slots
Definition: ExecutorResourcePool.h:178

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::~ExecutorResourceMgr
~ExecutorResourceMgr()
The destructor ensures that the process queue thread (process_queue_thread) is stopped and that any t...
Definition: ExecutorResourceMgr.cpp:40

ExecutorDeviceType::GPU

ExecutorResourceMgr_Namespace::ConcurrentResourceGrantPolicy::concurrency_policy
ResourceConcurrencyPolicy concurrency_policy
The grant policy in effect when there are concurrent requests for the resource specified by resource_...
Definition: ResourceGrantPolicy.h:183

ExecutorResourceMgr_Namespace::ExecutorResourcePool::calc_min_max_resource_grants_for_request
std::pair< ResourceGrant, ResourceGrant > calc_min_max_resource_grants_for_request(const RequestInfo &resource_request) const
Given the provided resource_request, statically calculate the minimum and maximum grantable resources...
Definition: ExecutorResourcePool.cpp:365

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::set_concurrent_resource_grant_policy
void set_concurrent_resource_grant_policy(const ConcurrentResourceGrantPolicy &concurrent_resource_grant_policy)
Set the concurrent resource grant policy for a given resource type (stored in ConcurrentResourceGrant...
Definition: ExecutorResourceMgr.cpp:298

ExecutorResourceMgr_Namespace::ExecutorResourcePool::allocate_resources
void allocate_resources(const ResourceGrant &resource_grant, const ChunkRequestInfo &chunk_request_info)
Given a resource grant (assumed to be computed in determine_dynamic_resource_grant), actually allocate (reserve) the resources in the pool so other requestors (queries) cannot use those resources until returned to the pool.
Definition: ExecutorResourcePool.cpp:1022

ExecutorResourceMgr_Namespace::ExecutorStats::cpu_requests_executed
size_t cpu_requests_executed
Definition: ExecutorResourceMgr.h:62

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::mark_request_error
void mark_request_error(const RequestId request_id, std::string error_msg)
Definition: ExecutorResourceMgr.cpp:126

ExecutorResourceMgr_Namespace::RequestStats::deque_time
std::chrono::steady_clock::time_point deque_time
Definition: ExecutorResourceMgr.h:90

ExecutorResourceMgr_Namespace::gen_ratio_resource_grant_policy
ResourceGrantPolicy gen_ratio_resource_grant_policy(const ResourceSubtype resource_subtype, const double ratio_grant)
Generates a ResourceGrantPolicy with ResourceGrantPolicySizeType::RATIO_TO_TOTAL
Definition: ResourceGrantPolicy.cpp:100

logger::INFO
Definition: Logger.h:108

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_requests_for_stage
std::vector< RequestId > get_requests_for_stage(const ExecutionRequestStage request_status) const
Internal method: Get the request ids for a given stage (QUEUED or EXECUTING)
Definition: ExecutorResourceMgr.cpp:562

ExecutorResourceMgr_Namespace::ExecutorResourceMgrError::getRequestId
RequestId getRequestId() const
Definition: ExecutorResourceMgrCommon.h:36

ExecutorResourceMgr_Namespace::ResourceGrant
Specifies the resources of each type for a given resource grant.
Definition: ExecutorResourcePool.h:176

ExecutorResourceMgr_Namespace::DISALLOW_REQUESTS
Definition: ResourceGrantPolicy.h:153

ExecutorResourceMgr_Namespace::ExecutorResourcePool::set_concurrent_resource_grant_policy
void set_concurrent_resource_grant_policy(const ConcurrentResourceGrantPolicy &concurrent_resource_grant_policy)
Resets the concurrent resource grant policy object, which specifies a ResourceType as well as normal ...
Definition: ExecutorResourcePool.cpp:224

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::processor_queue_mutex_
std::mutex processor_queue_mutex_
RW mutex that protects access to stop_process_queue_thread_ and pause_processor_queue_ ...
Definition: ExecutorResourceMgr.h:493

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::executor_resource_pool_
ExecutorResourcePool executor_resource_pool_
Keeps track of available resources for execution.
Definition: ExecutorResourceMgr.h:461

Logger.h

ExecutorResourceMgr_Namespace::ExecutorStats::requests_executing
size_t requests_executing
Definition: ExecutorResourceMgr.h:58

ExecutorResourceMgr_Namespace::ExecutorStats::gpu_requests_executed
size_t gpu_requests_executed
Definition: ExecutorResourceMgr.h:63

ExecutorResourceMgr_Namespace::ResourceType::CPU_BUFFER_POOL_MEM

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_resource_info
ResourcePoolInfo get_resource_info() const
Returns a struct containing the total and allocated amounts of all resources tracked by ExecutorResou...
Definition: ExecutorResourceMgr.h:237

logger::EXECUTOR
Definition: Logger.h:91

ExecutorResourceMgr_Namespace::ResourceSubtype::PINNED_CPU_BUFFER_POOL_MEM

ExecutorResourceMgr_Namespace::ExecutorStats::total_time_ms
size_t total_time_ms
Definition: ExecutorResourceMgr.h:67

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::INVALID_REQUEST_ID
const RequestId INVALID_REQUEST_ID
Definition: ExecutorResourceMgr.h:560

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::executing_requests_
std::set< RequestId > executing_requests_
Set of all request ids that are currently executing (i.e. post-granting of resources). Protected by executing_set_mutex_.
Definition: ExecutorResourceMgr.h:540

ExecutorResourceMgr_Namespace::ResourceType::GPU_SLOTS

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::requests_count_
std::atomic< size_t > requests_count_
An atomic that is incremented with each incoming request, and used to assign RequestIds to incoming r...
Definition: ExecutorResourceMgr.h:468

ExecutorResourceMgr_Namespace::ResourceSubtype::PAGEABLE_CPU_BUFFER_POOL_MEM

ExecutorResourceMgr_Namespace::RequestStats::actual_resource_grant
ResourceGrant actual_resource_grant
Definition: ExecutorResourceMgr.h:88

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_concurrent_resource_grant_policy
ConcurrentResourceGrantPolicy get_concurrent_resource_grant_policy(const ResourceType resource_type) const
Get the concurrent resource grant policy for a given resource type.
Definition: ExecutorResourceMgr.cpp:293

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::mark_request_dequed
void mark_request_dequed(const RequestId request_id)
Internal method: Moves the request from the QUEUED stage to EXECUTING stage and performs other bookke...
Definition: ExecutorResourceMgr.cpp:435

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::choose_next_request
RequestId choose_next_request()
Internal method: Invoked from process_queue_loop, chooses the next resource request to grant...
Definition: ExecutorResourceMgr.cpp:133

ExecutorResourceMgr_Namespace::ConcurrentResourceGrantPolicy::oversubscription_concurrency_policy
ResourceConcurrencyPolicy oversubscription_concurrency_policy
The grant policy in effect when there are concurrent requests for the resource specified by resource_...
Definition: ResourceGrantPolicy.h:190

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::queued_set_mutex_
std::shared_mutex queued_set_mutex_
RW mutex that protects access to queued_requests_
Definition: ExecutorResourceMgr.h:507

ExecutorResourceMgr_Namespace::ALLOW_SINGLE_REQUEST_GLOBALLY
Definition: ResourceGrantPolicy.h:152

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::enable_stats_printing_
const bool enable_stats_printing_
Definition: ExecutorResourceMgr.h:557

ExecutorResourceMgr_Namespace::RequestStats::request_info
const RequestInfo request_info
Definition: ExecutorResourceMgr.h:85

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::process_queue_counter_
size_t process_queue_counter_
Definition: ExecutorResourceMgr.h:521

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::pause_process_queue_
bool pause_process_queue_
Definition: ExecutorResourceMgr.h:519

CHECK_LT
#define CHECK_LT(x, y)
Definition: Logger.h:303

ExecutorResourceMgr_Namespace::ResourceGrant::cpu_result_mem
size_t cpu_result_mem
Definition: ExecutorResourcePool.h:179

ExecutorResourceMgr_Namespace::ExecutorStats::total_cpu_queue_time_ms
size_t total_cpu_queue_time_ms
Definition: ExecutorResourceMgr.h:50

ExecutorResourceMgr_Namespace::RequestStats::execution_time_ms
size_t execution_time_ms
Definition: ExecutorResourceMgr.h:97

ExecutorResourceMgr_Namespace::ExecutorResourcePool::determine_dynamic_resource_grant
std::pair< bool, ResourceGrant > determine_dynamic_resource_grant(const ResourceGrant &min_resource_grant, const ResourceGrant &max_resource_grant, const ChunkRequestInfo &chunk_request_info, const double max_request_backoff_ratio) const
Determines the actual resource grant to give a query (which will be somewhere between the provided mi...
Definition: ExecutorResourcePool.cpp:936

CHECK_LE
#define CHECK_LE(x, y)
Definition: Logger.h:304

ExecutorResourceMgr_Namespace::ExecutorStats::queue_length
size_t queue_length
Definition: ExecutorResourceMgr.h:46

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::outstanding_queue_requests_
OutstandingQueueRequests outstanding_queue_requests_
Stores and manages a map of request ids to BinarySemaphore objects to allow threads waiting for resou...
Definition: ExecutorResourceMgr.h:528

ExecutorResourceMgr_Namespace::ExecutorStats
Stores current key statistics relating to ExecutorResourceMgr state, particularly around the number o...
Definition: ExecutorResourceMgr.h:42

ExecutorResourceMgr_Namespace::ExecutorStats::requests_with_timeouts
size_t requests_with_timeouts
Definition: ExecutorResourceMgr.h:70

ExecutorResourceMgr_Namespace::ExecutorStats::cpu_queue_length
size_t cpu_queue_length
Definition: ExecutorResourceMgr.h:47

ExecutorResourceMgr_Namespace::ExecutorStats::gpu_requests_executing
size_t gpu_requests_executing
Definition: ExecutorResourceMgr.h:60

ExecutorResourceMgr_Namespace::ExecutorStats::requests_actually_queued
size_t requests_actually_queued
Definition: ExecutorResourceMgr.h:52

ExecutorResourceMgr_Namespace::ExecutorStats::gpu_requests_actually_queued
size_t gpu_requests_actually_queued
Definition: ExecutorResourceMgr.h:54

ExecutorResourceMgr_Namespace::EXECUTING
Definition: ExecutorResourceMgr.h:123

ExecutorResourceMgr_Namespace::RequestStats::finished_queueing
bool finished_queueing
Definition: ExecutorResourceMgr.h:94

ExecutorResourceMgr_Namespace::OutstandingQueueRequests::wake_request_by_id
void wake_request_by_id(const RequestId request_id)
Wakes a waiting thread in the queue. Invoked by ExecutorResourceMgr::process_queue_loop() ...
Definition: OutstandingQueueRequests.h:95

ExecutorResourceMgr_Namespace::ExecutorStats::total_gpu_execution_time_ms
size_t total_gpu_execution_time_ms
Definition: ExecutorResourceMgr.h:66

ExecutorDeviceType::CPU

ExecutorResourceMgr_Namespace::RequestInfo::request_device_type
ExecutorDeviceType request_device_type
Definition: ResourceRequest.h:71

ExecutorResourceMgr_Namespace::RequestStats::error
std::optional< std::string > error
Definition: ExecutorResourceMgr.h:103

ExecutorResourceMgr_Namespace::RequestStats::queue_time_ms
size_t queue_time_ms
Definition: ExecutorResourceMgr.h:96

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::pause_process_queue
void pause_process_queue()
Pauses the process queue in a thread-safe manner, waiting for all queries in the executing stage to f...
Definition: ExecutorResourceMgr.cpp:245

ExecutorResourceMgr_Namespace::ExecutorStats::total_cpu_time_ms
size_t total_cpu_time_ms
Definition: ExecutorResourceMgr.h:68

logger::request_id
RequestId request_id()
Definition: Logger.cpp:876

ExecutorResourceMgr_Namespace::ExecutorResourceMgrError::getErrorMsg
std::string getErrorMsg() const
Definition: ExecutorResourceMgrCommon.h:37

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_executor_stats
ExecutorStats get_executor_stats() const
Returns a copy of the ExecutorStats struct held by ExecutorResourceMgr. Used for testing currently...
Definition: ExecutorResourceMgr.cpp:168

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::mark_request_finished
void mark_request_finished(const RequestId request_id)
Internal method: Invoked on successful completion of a query step from release_resources method...
Definition: ExecutorResourceMgr.cpp:517

ExecutorResourceMgr_Namespace::ResourceType::CPU_RESULT_MEM

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::request_resources_with_timeout
std::unique_ptr< ExecutorResourceHandle > request_resources_with_timeout(const RequestInfo &request_info, const size_t timeout_in_ms)
Requests resources from ExecutorResourceMgr, will throw if request takes longer than time specified b...
Definition: ExecutorResourceMgr.cpp:45

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::executing_set_mutex_
std::shared_mutex executing_set_mutex_
RW mutex that protects access to executing_requests_
Definition: ExecutorResourceMgr.h:512

CHECK
#define CHECK(condition)
Definition: Logger.h:291

ExecutorResourceMgr_Namespace::OutstandingQueueRequests::queue_request_and_wait_with_timeout
void queue_request_and_wait_with_timeout(const RequestId request_id, const size_t max_wait_in_ms)
Submits a request with id request_id into the queue, waiting on a BinarySemaphore until ExecutorResou...
Definition: OutstandingQueueRequests.h:61

ExecutorResourceMgr_Namespace::RequestStats::enqueue_time
std::chrono::steady_clock::time_point enqueue_time
Definition: ExecutorResourceMgr.h:89

ExecutorResourceMgr_Namespace::ExecutionRequestStage
ExecutionRequestStage
Definition: ExecutorResourceMgr.h:123

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::set_resource
void set_resource(const ResourceType resource_type, const size_t resoure_quantity)
Used to change the total amount available of a specified resource after construction of ExecutorResou...
Definition: ExecutorResourceMgr.cpp:282

ExecutorResourceMgr_Namespace::RequestStats::timeout_in_ms
size_t timeout_in_ms
Definition: ExecutorResourceMgr.h:99

ExecutorResourceMgr_Namespace::RequestStats::execution_finished_time
std::chrono::steady_clock::time_point execution_finished_time
Definition: ExecutorResourceMgr.h:91

ExecutorResourceMgr_Namespace::ALLOW_CONCURRENT_REQUESTS
Definition: ResourceGrantPolicy.h:150

ExecutorResourceMgr_Namespace::ExecutorStats::total_execution_time_ms
size_t total_execution_time_ms
Definition: ExecutorResourceMgr.h:64

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::mark_request_timed_out
void mark_request_timed_out(const RequestId request_id)
Internal method: Called if the request times out (i.e. request was made via request_resources_with_ti...
Definition: ExecutorResourceMgr.cpp:485

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::resume_process_queue
void resume_process_queue()
Resumes the process queue in a thread-safe manner. If the process queue is already paused...
Definition: ExecutorResourceMgr.cpp:265

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::processor_queue_condition_
std::condition_variable processor_queue_condition_
Definition: ExecutorResourceMgr.h:514

ExecutorResourceMgr_Namespace::ExecutorStats::total_gpu_time_ms
size_t total_gpu_time_ms
Definition: ExecutorResourceMgr.h:69

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::process_queue_thread_
std::thread process_queue_thread_
The thread started in the ExecutorResourceMgr constructor that continuously loops inside of process_q...
Definition: ExecutorResourceMgr.h:487

ExecutorResourceMgr_Namespace::RequestStats::timed_out
bool timed_out
Definition: ExecutorResourceMgr.h:100

ExecutorResourceMgr_Namespace::ChunkRequestInfo
Specifies all DataMgr chunks needed for a query step/request, along with their sizes in bytes...
Definition: ResourceRequest.h:34

ExecutorResourceMgr_Namespace::ExecutorStats::total_cpu_execution_time_ms
size_t total_cpu_execution_time_ms
Definition: ExecutorResourceMgr.h:65

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::set_process_queue_flag
void set_process_queue_flag()
Internal method: Set the should_process_queue_ flag to true, signifying that the queue should be proc...
Definition: ExecutorResourceMgr.h:401

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::max_available_resource_use_ratio_
const double max_available_resource_use_ratio_
Definition: ExecutorResourceMgr.h:562

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::enable_debug_printing_
const bool enable_debug_printing_
Definition: ExecutorResourceMgr.h:558

ExecutorResourceMgr_Namespace::RequestStats::total_time_ms
size_t total_time_ms
Definition: ExecutorResourceMgr.h:98

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::pause_processor_queue_mutex_
std::mutex pause_processor_queue_mutex_
Definition: ExecutorResourceMgr.h:495

ExecutorResourceMgr_Namespace::ResourceGrant::cpu_slots
size_t cpu_slots
Definition: ExecutorResourcePool.h:177

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::print_executor_stats
void print_executor_stats() const
Prints the ExecutorStats struct. Use for debugging.
Definition: ExecutorResourceMgr.cpp:173

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::queued_requests_
std::set< RequestId > queued_requests_
Set of all request ids that are currently queued. Protected by queued_set_mutex_. ...
Definition: ExecutorResourceMgr.h:534

ExecutorResourceMgr_Namespace::QUEUED
Definition: ExecutorResourceMgr.h:123

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::requests_stats_
std::vector< RequestStats > requests_stats_
Stores a vector of all requests that have been seen by ExecutorResourceMgr, with each incoming reques...
Definition: ExecutorResourceMgr.h:555

ExecutorResourceMgr_Namespace::RequestStats
Stores info pertaining to a single request made to ExecutorResourceMgr, including its request_id...
Definition: ExecutorResourceMgr.h:83

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::stop_process_queue_thread_
bool stop_process_queue_thread_
Definition: ExecutorResourceMgr.h:518

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::print_mutex_
std::mutex print_mutex_
Definition: ExecutorResourceMgr.h:496

ExecutorResourceMgr_Namespace::ExecutorStats::cpu_requests_actually_queued
size_t cpu_requests_actually_queued
Definition: ExecutorResourceMgr.h:53

ExecutorResourceMgr_Namespace::ExecutorResourceMgrError
Definition: ExecutorResourceMgrCommon.h:32

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::enqueue_request
RequestId enqueue_request(const RequestInfo &request_info, const size_t timeout_in_ms, const ResourceGrant &min_resource_grant, const ResourceGrant &max_resource_grant)
Internal method: Invoked from request_resource/request_resource_with_timeout, places request in the r...
Definition: ExecutorResourceMgr.cpp:391

ExecutorResourceMgr_Namespace::ExecutorStats::requests
size_t requests
Definition: ExecutorResourceMgr.h:43

ExecutorResourceMgr_Namespace::ExecutorResourceMgr::get_request_for_id
RequestStats get_request_for_id(const RequestId request_id) const
Internal method: Returns the RequestStats for a request specified by request_id.
Definition: ExecutorResourceMgr.cpp:120

ExecutorResourceMgr_Namespace::ExecutorStats::total_queue_time_ms
size_t total_queue_time_ms
Definition: ExecutorResourceMgr.h:49

ExecutorResourceMgr_Namespace::ExecutorResourcePool::get_concurrent_resource_grant_policy
ConcurrentResourceGrantPolicy get_concurrent_resource_grant_policy(const ResourceType resource_type) const
Definition: ExecutorResourcePool.h:369