_execute_8h_source.html

 /*

  * Copyright 2022 HEAVY.AI, Inc.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  *     http://www.apache.org/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #ifndef QUERYENGINE_EXECUTE_H

 #define QUERYENGINE_EXECUTE_H


 #include <algorithm>

 #include <atomic>

 #include <condition_variable>

 #include <cstddef>

 #include <cstdlib>

 #include <deque>

 #include <functional>

 #include <limits>

 #include <map>

 #include <mutex>

 #include <queue>

 #include <stack>

 #include <unordered_map>

 #include <unordered_set>


 #include <llvm/IR/Function.h>

 #include <llvm/IR/Value.h>

 #include <llvm/Linker/Linker.h>

 #include <llvm/Transforms/Utils/ValueMapper.h>

 #include <rapidjson/document.h>


 #include "QueryEngine/AggregatedColRange.h"

 #include "QueryEngine/BufferCompaction.h"

 #include "QueryEngine/CartesianProduct.h"

 #include "QueryEngine/CgenState.h"

 #include "QueryEngine/CodeCache.h"

 #include "QueryEngine/CodeCacheAccessor.h"

 #include "QueryEngine/CompilationOptions.h"

 #include "QueryEngine/DateTimeUtils.h"

 #include "QueryEngine/Descriptors/QueryCompilationDescriptor.h"

 #include "QueryEngine/Descriptors/QueryFragmentDescriptor.h"

 #include "QueryEngine/ExecutionKernel.h"

 #include "QueryEngine/ExecutorResourceMgr/ExecutorResourceMgr.h"

 #include "QueryEngine/ExternalCacheInvalidators.h"

 #include "QueryEngine/GpuSharedMemoryContext.h"

 #include "QueryEngine/GroupByAndAggregate.h"

 #include "QueryEngine/JoinHashTable/HashJoin.h"

 #include "QueryEngine/LoopControlFlow/JoinLoop.h"

 #include "QueryEngine/NvidiaKernel.h"

 #include "QueryEngine/PlanState.h"

 #include "QueryEngine/QueryPlanDagCache.h"

 #include "QueryEngine/RelAlgExecutionUnit.h"

 #include "QueryEngine/RelAlgTranslator.h"

 #include "QueryEngine/ResultSetRecyclerHolder.h"

 #include "QueryEngine/StringDictionaryGenerations.h"

 #include "QueryEngine/TableGenerations.h"

 #include "QueryEngine/TargetMetaInfo.h"

 #include "QueryEngine/WindowContext.h"


 #include "DataMgr/Chunk/Chunk.h"

 #include "Logger/Logger.h"

 #include "Shared/DbObjectKeys.h"

 #include "Shared/LruCache.h"

 #include "Shared/SystemParameters.h"

 #include "Shared/funcannotations.h"

 #include "Shared/heavyai_shared_mutex.h"

 #include "Shared/measure.h"

 #include "Shared/thread_count.h"

 #include "Shared/toString.h"

 #include "StringDictionary/StringDictionary.h"

 #include "StringDictionary/StringDictionaryProxy.h"

 #include "ThriftHandler/CommandLineOptions.h"


 using QueryCompilationDescriptorOwned = std::unique_ptr<QueryCompilationDescriptor>;

 class QueryMemoryDescriptor;

 using QueryMemoryDescriptorOwned = std::unique_ptr<QueryMemoryDescriptor>;

 using QuerySessionId = std::string;

 using CurrentQueryStatus = std::pair<QuerySessionId, std::string>;

 using InterruptFlagMap = std::map<QuerySessionId, bool>;

 class QuerySessionStatus {

   // A class that is used to describe the query session's info

  public:

   /* todo(yoonmin): support more query status

    * i.e., RUNNING_SORT, RUNNING_CARD_EST, CLEANUP, ... */

   enum QueryStatus {

     UNDEFINED = 0,

     PENDING_QUEUE,

     PENDING_EXECUTOR,

     RUNNING_QUERY_KERNEL,

     RUNNING_REDUCTION,

     RUNNING_IMPORTER

   };


   QuerySessionStatus(const QuerySessionId& query_session,

                      const std::string& query_str,

                      const std::string& submitted_time)

       : query_session_(query_session)

       , executor_id_(0)

       , query_str_(query_str)

       , submitted_time_(submitted_time)

       , query_status_(QueryStatus::UNDEFINED) {}

   QuerySessionStatus(const QuerySessionId& query_session,

                      const size_t executor_id,

                      const std::string& query_str,

                      const std::string& submitted_time)

       : query_session_(query_session)

       , executor_id_(executor_id)

       , query_str_(query_str)

       , submitted_time_(submitted_time)

       , query_status_(QueryStatus::UNDEFINED) {}

   QuerySessionStatus(const QuerySessionId& query_session,

                      const size_t executor_id,

                      const std::string& query_str,

                      const std::string& submitted_time,

                      const QuerySessionStatus::QueryStatus& query_status)

       : query_session_(query_session)

       , executor_id_(executor_id)

       , query_str_(query_str)

       , submitted_time_(submitted_time)

       , query_status_(query_status) {}


   const QuerySessionId getQuerySession() { return query_session_; }

   const std::string getQueryStr() { return query_str_; }

   const size_t getExecutorId() { return executor_id_; }

   const std::string& getQuerySubmittedTime() { return submitted_time_; }

   const QuerySessionStatus::QueryStatus getQueryStatus() { return query_status_; }

   void setQueryStatus(const QuerySessionStatus::QueryStatus& status) {

     query_status_ = status;

   }

   void setExecutorId(const size_t executor_id) { executor_id_ = executor_id; }


  private:

   const QuerySessionId query_session_;

   size_t executor_id_;

   const std::string query_str_;

   const std::string submitted_time_;

   // Currently we use three query status:

   // 1) PENDING_IN_QUEUE: a task is submitted to the dispatch_queue but hangs due to no

   // existing worker (= executor) 2) PENDING_IN_EXECUTOR: a task is assigned to the

   // specific executor but waits to get the resource to run 3) RUNNING: a task is assigned

   // to the specific executor and its execution has been successfully started

   // 4) RUNNING_REDUCTION: a task is in the reduction phase

   QuerySessionStatus::QueryStatus query_status_;

 };

 using QuerySessionMap =

     std::map<const QuerySessionId, std::map<std::string, QuerySessionStatus>>;


 class ColumnFetcher;


 class WatchdogException : public std::runtime_error {

  public:

   WatchdogException(const std::string& cause) : std::runtime_error(cause) {}

 };


 enum FragmentSkipStatus { SKIPPABLE, NOT_SKIPPABLE, INVALID };


 class Executor;


 inline llvm::Value* get_arg_by_name(llvm::Function* func, const std::string& name) {

   for (auto& arg : func->args()) {

     if (arg.getName() == name) {

       return &arg;

     }

   }

   CHECK(false);

   return nullptr;

 }


 inline llvm::Value* get_arg_by_index(llvm::Function* func, unsigned const index) {

 #if 10 <= LLVM_VERSION_MAJOR

   return index < func->arg_size() ? func->getArg(index) : nullptr;

 #else

   return index < func->arg_size() ? func->arg_begin() + index : nullptr;

 #endif

 }


 // Returns func->arg_size() if name is not found.

 inline unsigned get_index_by_name(llvm::Function* func, const std::string& name) {

   unsigned index = 0;

   for (auto& arg : func->args()) {

     if (arg.getName() == name) {

       break;

     }

     ++index;

   }

   return index;

 }


 inline uint32_t log2_bytes(const uint32_t bytes) {

   switch (bytes) {

     case 1:

       return 0;

     case 2:

       return 1;

     case 4:

       return 2;

     case 8:

       return 3;

     default:

       abort();

   }

 }


 inline const ColumnDescriptor* get_column_descriptor(

     const shared::ColumnKey& column_key) {

   CHECK_GT(column_key.db_id, 0);

   CHECK_GT(column_key.table_id, 0);

   const auto col_desc = Catalog_Namespace::get_metadata_for_column(column_key);

   CHECK(col_desc);

   return col_desc;

 }


 inline const Analyzer::Expr* extract_cast_arg(const Analyzer::Expr* expr) {

   const auto cast_expr = dynamic_cast<const Analyzer::UOper*>(expr);

   if (!cast_expr || cast_expr->get_optype() != kCAST) {

     return expr;

   }

   return cast_expr->get_operand();

 }


 inline std::string numeric_type_name(const SQLTypeInfo& ti) {

   CHECK(ti.is_integer() || ti.is_decimal() || ti.is_boolean() || ti.is_time() ||

         ti.is_fp() || (ti.is_string() && ti.get_compression() == kENCODING_DICT) ||

         ti.is_timeinterval());

   if (ti.is_integer() || ti.is_decimal() || ti.is_boolean() || ti.is_time() ||

       ti.is_string() || ti.is_timeinterval()) {

     return "int" + std::to_string(ti.get_logical_size() * 8) + "_t";

   }

   return ti.get_type() == kDOUBLE ? "double" : "float";

 }


 inline const ColumnDescriptor* get_column_descriptor_maybe(

     const shared::ColumnKey& column_key) {

   return column_key.table_id > 0 ? get_column_descriptor(column_key) : nullptr;

 }


 inline const ResultSetPtr& get_temporary_table(const TemporaryTables* temporary_tables,

                                                const int table_id) {

   CHECK_LT(table_id, 0);

   const auto it = temporary_tables->find(table_id);

   CHECK(it != temporary_tables->end());

   return it->second;

 }


 inline const SQLTypeInfo get_column_type(const int col_id,

                                          const int table_id,

                                          const ColumnDescriptor* cd,

                                          const TemporaryTables* temporary_tables) {

   CHECK(cd || temporary_tables);

   if (cd) {

     CHECK_EQ(col_id, cd->columnId);

     CHECK_EQ(table_id, cd->tableId);

     return cd->columnType;

   }

   const auto& temp = get_temporary_table(temporary_tables, table_id);

   return temp->getColType(col_id);

 }


 class CompilationRetryNoLazyFetch : public std::runtime_error {

  public:

   CompilationRetryNoLazyFetch()

       : std::runtime_error("Retry query compilation with no GPU lazy fetch.") {}

 };


 class CompilationRetryNewScanLimit : public std::runtime_error {

  public:

   CompilationRetryNewScanLimit(const size_t new_scan_limit)

       : std::runtime_error("Retry query compilation with new scan limit.")

       , new_scan_limit_(new_scan_limit) {}


   size_t new_scan_limit_;

 };


 class TooManyLiterals : public std::runtime_error {

  public:

   TooManyLiterals() : std::runtime_error("Too many literals in the query") {}

 };


 class CompilationRetryNoCompaction : public std::runtime_error {

  public:

   CompilationRetryNoCompaction()

       : std::runtime_error("Retry query compilation with no compaction.") {}

 };


 // Throwing QueryMustRunOnCpu allows us retry a query step on CPU if

 // g_allow_query_step_cpu_retry is true (on by default) by catching

 // the exception at the query step execution level in RelAlgExecutor,

 // or if g_allow_query_step_cpu_retry is false but g_allow_cpu_retry is true,

 // by retrying the entire query on CPU (if both flags are false, we return an

 // error). This flag is thrown for the following broad categories of conditions:

 // 1) we have not implemented an operator on GPU and so cannot codegen for GPU

 // 2) we catch an unexpected GPU compilation/linking error (perhaps due

 //    to an outdated driver/CUDA installation not allowing a modern operator)

 // 3) when we detect up front that we will not have enough GPU memory to execute

 //    a query.

 // There is a fourth scenerio where our pre-flight GPU memory check passed but for

 // whatever reason we still run out of memory. In those cases we go down the

 // handleOutOfMemoryRetry path, which will first try per-fragment execution on GPU,

 // and if that fails, CPU execution.

 // Note that for distributed execution failures on leaves, we do not retry queries

 // TODO(todd): See if CPU retry of individual steps can be turned on safely for

 // distributed


 class QueryMustRunOnCpu : public std::runtime_error {

  public:

   QueryMustRunOnCpu() : std::runtime_error("Query must run in cpu mode.") {}


   QueryMustRunOnCpu(const std::string& err) : std::runtime_error(err) {}

 };


 class ParseIRError : public std::runtime_error {

  public:

   ParseIRError(const std::string message) : std::runtime_error(message) {}

 };


 class StringConstInResultSet : public std::runtime_error {

  public:

   StringConstInResultSet()

       : std::runtime_error(

             "NONE ENCODED String types are not supported as input result set.") {}

 };


 class ExtensionFunction;


 using RowDataProvider = Fragmenter_Namespace::RowDataProvider;

 using ColumnToFragmentsMap = std::map<const ColumnDescriptor*, std::set<int32_t>>;

 using TableToFragmentIds = std::map<int32_t, std::set<int32_t>>;


 struct TableUpdateMetadata {

   ColumnToFragmentsMap columns_for_metadata_update;

   TableToFragmentIds fragments_with_deleted_rows;

 };


 class UpdateLogForFragment : public RowDataProvider {

  public:

   using FragmentInfoType = Fragmenter_Namespace::FragmentInfo;


   UpdateLogForFragment(FragmentInfoType const& fragment_info,

                        size_t const,

                        const std::shared_ptr<ResultSet>& rs);


   std::vector<TargetValue> getEntryAt(const size_t index) const override;

   std::vector<TargetValue> getTranslatedEntryAt(const size_t index) const override;


   size_t const getRowCount() const override;

   StringDictionaryProxy* getLiteralDictionary() const override {

     return rs_->getRowSetMemOwner()->getLiteralStringDictProxy();

   }

   size_t const getEntryCount() const override;

   size_t const getFragmentIndex() const;

   FragmentInfoType const& getFragmentInfo() const;

   decltype(FragmentInfoType::physicalTableId) const getPhysicalTableId() const {

     return fragment_info_.physicalTableId;

   }

   decltype(FragmentInfoType::fragmentId) const getFragmentId() const {

     return fragment_info_.fragmentId;

   }


   SQLTypeInfo getColumnType(const size_t col_idx) const;


   using Callback = std::function<void(const UpdateLogForFragment&, TableUpdateMetadata&)>;


   auto getResultSet() const { return rs_; }


  private:

   FragmentInfoType const& fragment_info_;

   size_t fragment_index_;

   std::shared_ptr<ResultSet> rs_;

 };


 using LLVMValueVector = std::vector<llvm::Value*>;


 class QueryCompilationDescriptor;


 std::ostream& operator<<(std::ostream&, FetchResult const&);


 namespace ExecutorResourceMgr_Namespace {

 class ExecutorResourceMgr;

 struct ChunkRequestInfo;

 struct ResourcePoolInfo;

 };  // namespace ExecutorResourceMgr_Namespace


 struct CardinalityCacheKey {

   CardinalityCacheKey(const RelAlgExecutionUnit& ra_exe_unit);


   bool operator==(const CardinalityCacheKey& other) const;


   size_t hash() const;


   bool containsTableKey(const shared::TableKey& table_key) const;


  private:

   std::string key;

   std::unordered_set<shared::TableKey> table_keys;

 };


 namespace std {

 template <>

 struct hash<CardinalityCacheKey> {

   size_t operator()(const CardinalityCacheKey& cache_key) const {

     return cache_key.hash();

   }

 };

 }  // namespace std


 class Executor {

   static_assert(sizeof(float) == 4 && sizeof(double) == 8,

                 "Host hardware not supported, unexpected size of float / double.");

   static_assert(sizeof(time_t) == 8,

                 "Host hardware not supported, 64-bit time support is required.");


  public:

   using ExecutorId = size_t;

   static constexpr ExecutorId UNITARY_EXECUTOR_ID = 0;

   static constexpr ExecutorId INVALID_EXECUTOR_ID = SIZE_MAX;


   Executor(const ExecutorId id,

            Data_Namespace::DataMgr* data_mgr,

            const size_t block_size_x,

            const size_t grid_size_x,

            const size_t max_gpu_slab_size,

            const std::string& debug_dir,

            const std::string& debug_file);


   void clearCaches(bool runtime_only = false);


   std::string dumpCache() const;


   static void clearExternalCaches(bool for_update,

                                   const TableDescriptor* td,

                                   const int current_db_id) {

     bool clearEntireCache = true;

     if (td) {

       const auto& table_chunk_key_prefix = td->getTableChunkKey(current_db_id);

       if (!table_chunk_key_prefix.empty()) {

         auto table_key = boost::hash_value(table_chunk_key_prefix);

         ResultSetCacheInvalidator::invalidateCachesByTable(table_key);

         if (for_update) {

           UpdateTriggeredCacheInvalidator::invalidateCachesByTable(table_key);

         } else {

           DeleteTriggeredCacheInvalidator::invalidateCachesByTable(table_key);

         }

         Executor::invalidateCardinalityCacheForTable({current_db_id, td->tableId});

         clearEntireCache = false;

       }

     }

     if (clearEntireCache) {

       ResultSetCacheInvalidator::invalidateCaches();

       if (for_update) {

         UpdateTriggeredCacheInvalidator::invalidateCaches();

       } else {

         DeleteTriggeredCacheInvalidator::invalidateCaches();

       }

       Executor::clearCardinalityCache();

     }

   }


   void reset(bool discard_runtime_modules_only = false);


   template <typename F>

   static void registerExtensionFunctions(F register_extension_functions) {

     // Don't want native code to vanish while executing:

     heavyai::unique_lock<heavyai::shared_mutex> flush_lock(execute_mutex_);

     // Blocks Executor::getExecutor:

     heavyai::unique_lock<heavyai::shared_mutex> lock(executors_cache_mutex_);

     // Lock registration to avoid

     // java.util.ConcurrentModificationException from calcite server

     // when client registrations arrive too fast.  Also blocks

     // Executor::get_rt_udf_module for retrieving runtime UDF/UDTF

     // module until this registration has rebuild it via

     // Executor::update_after_registration:

     std::lock_guard<std::mutex> register_lock(

         register_runtime_extension_functions_mutex_);


     // Reset all executors:

     for (auto& executor_item : Executor::executors_) {

       executor_item.second->reset(/*discard_runtime_modules_only=*/true);

     }

     // Call registration worker, see

     // DBHandler::register_runtime_extension_functions for details. In

     // short, updates Executor::extension_module_sources,

     // table_functions::TableFunctionsFactory, and registers runtime

     // extension functions with Calcite:

     register_extension_functions();


     // Update executors with registered LLVM modules:

     update_after_registration(/*update_runtime_modules_only=*/true);

   }


   static std::shared_ptr<Executor> getExecutor(

       const ExecutorId id,

       const std::string& debug_dir = "",

       const std::string& debug_file = "",

       const SystemParameters& system_parameters = SystemParameters());


   static void nukeCacheOfExecutors() {

     heavyai::unique_lock<heavyai::shared_mutex> flush_lock(

         execute_mutex_);  // don't want native code to vanish while executing

     heavyai::unique_lock<heavyai::shared_mutex> lock(executors_cache_mutex_);

     executors_.clear();

   }


   static void clearMemory(const Data_Namespace::MemoryLevel memory_level);


   static size_t getArenaBlockSize();


   static void addUdfIrToModule(const std::string& udf_ir_filename, const bool is_cuda_ir);


   enum class ExtModuleKinds {

     template_module,     // RuntimeFunctions.bc

     udf_cpu_module,      // Load-time UDFs for CPU execution

     udf_gpu_module,      // Load-time UDFs for GPU execution

     rt_udf_cpu_module,   // Run-time UDF/UDTFs for CPU execution

     rt_udf_gpu_module,   // Run-time UDF/UDTFs for GPU execution

     rt_geos_module,      // geos functions

     rt_libdevice_module  // math library functions for GPU execution

   };

   // Globally available mapping of extension module sources. Not thread-safe.

   static std::map<ExtModuleKinds, std::string> extension_module_sources;

   static void initialize_extension_module_sources();


   // Convenience functions for retrieving executor-local extension modules, thread-safe:

   const std::unique_ptr<llvm::Module>& get_rt_module() const {

     return get_extension_module(ExtModuleKinds::template_module);

   }

   const std::unique_ptr<llvm::Module>& get_udf_module(bool is_gpu = false) const {

     return get_extension_module(

         (is_gpu ? ExtModuleKinds::udf_gpu_module : ExtModuleKinds::udf_cpu_module));

   }

   const std::unique_ptr<llvm::Module>& get_rt_udf_module(bool is_gpu = false) const {

     std::lock_guard<std::mutex> lock(

         Executor::register_runtime_extension_functions_mutex_);

     return get_extension_module(

         (is_gpu ? ExtModuleKinds::rt_udf_gpu_module : ExtModuleKinds::rt_udf_cpu_module));

   }

   const std::unique_ptr<llvm::Module>& get_geos_module() const {

     return get_extension_module(ExtModuleKinds::rt_geos_module);

   }

   const std::unique_ptr<llvm::Module>& get_libdevice_module() const {

     return get_extension_module(ExtModuleKinds::rt_libdevice_module);

   }


   bool has_rt_module() const {

     return has_extension_module(ExtModuleKinds::template_module);

   }

   bool has_udf_module(bool is_gpu = false) const {

     return has_extension_module(

         (is_gpu ? ExtModuleKinds::udf_gpu_module : ExtModuleKinds::udf_cpu_module));

   }

   bool has_rt_udf_module(bool is_gpu = false) const {

     return has_extension_module(

         (is_gpu ? ExtModuleKinds::rt_udf_gpu_module : ExtModuleKinds::rt_udf_cpu_module));

   }

   bool has_geos_module() const {

     return has_extension_module(ExtModuleKinds::rt_geos_module);

   }

   bool has_libdevice_module() const {

     return has_extension_module(ExtModuleKinds::rt_libdevice_module);

   }


   const TemporaryTables* getTemporaryTables() { return temporary_tables_; }


   StringDictionaryProxy* getStringDictionaryProxy(const shared::StringDictKey& dict_key,

                                                   const bool with_generation) const {

     CHECK(row_set_mem_owner_);

     return getStringDictionaryProxy(dict_key, row_set_mem_owner_, with_generation);

   }


   StringDictionaryProxy* getStringDictionaryProxy(

       const shared::StringDictKey& dict_key,

       const std::shared_ptr<RowSetMemoryOwner> row_set_mem_owner,

       const bool with_generation) const;


   const StringDictionaryProxy::IdMap* getStringProxyTranslationMap(

       const shared::StringDictKey& source_dict_key,

       const shared::StringDictKey& dest_dict_key,

       const RowSetMemoryOwner::StringTranslationType translation_type,

       const std::vector<StringOps_Namespace::StringOpInfo>& string_op_infos,

       std::shared_ptr<RowSetMemoryOwner> row_set_mem_owner,

       const bool with_generation) const;


   const StringDictionaryProxy::IdMap* getJoinIntersectionStringProxyTranslationMap(

       const StringDictionaryProxy* source_proxy,

       StringDictionaryProxy* dest_proxy,

       const std::vector<StringOps_Namespace::StringOpInfo>& source_string_op_infos,

       const std::vector<StringOps_Namespace::StringOpInfo>& dest_source_string_op_infos,

       std::shared_ptr<RowSetMemoryOwner> row_set_mem_owner) const;


   const StringDictionaryProxy::TranslationMap<Datum>* getStringProxyNumericTranslationMap(

       const shared::StringDictKey& source_dict_key,

       const std::vector<StringOps_Namespace::StringOpInfo>& string_op_infos,

       std::shared_ptr<RowSetMemoryOwner> row_set_mem_owner,

       const bool with_generation) const;


   bool isCPUOnly() const;


   bool isArchMaxwell(const ExecutorDeviceType dt) const;


   bool containsLeftDeepOuterJoin() const {

     return cgen_state_->contains_left_deep_outer_join_;

   }


   const ColumnDescriptor* getColumnDescriptor(const Analyzer::ColumnVar*) const;


   const ColumnDescriptor* getPhysicalColumnDescriptor(const Analyzer::ColumnVar*,

                                                       int) const;


   Data_Namespace::DataMgr* getDataMgr() const {

     CHECK(data_mgr_);

     return data_mgr_;

   }


   const std::shared_ptr<RowSetMemoryOwner> getRowSetMemoryOwner() const;


   const TemporaryTables* getTemporaryTables() const;


   Fragmenter_Namespace::TableInfo getTableInfo(const shared::TableKey& table_key) const;


   const TableGeneration& getTableGeneration(const shared::TableKey& table_key) const;


   ExpressionRange getColRange(const PhysicalInput&) const;


   size_t getNumBytesForFetchedRow(

       const std::set<shared::TableKey>& table_keys_to_fetch) const;


   std::map<shared::ColumnKey, size_t> getColumnByteWidthMap(

       const std::set<shared::TableKey>& table_ids_to_fetch,

       const bool include_lazy_fetched_cols) const;


   size_t getNumBytesForFetchedRow(const std::set<int>& table_ids_to_fetch) const;


   ExecutorResourceMgr_Namespace::ChunkRequestInfo getChunkRequestInfo(

       const ExecutorDeviceType device_type,

       const std::vector<InputDescriptor>& input_descs,

       const std::vector<InputTableInfo>& query_infos,

       const std::vector<std::pair<int32_t, FragmentsList>>& device_fragment_lists) const;


   bool hasLazyFetchColumns(const std::vector<Analyzer::Expr*>& target_exprs) const;

   std::vector<ColumnLazyFetchInfo> getColLazyFetchInfo(

       const std::vector<Analyzer::Expr*>& target_exprs) const;


   static void registerActiveModule(void* module, const int device_id);

   static void unregisterActiveModule(const int device_id);

   void interrupt(const QuerySessionId& query_session = "",

                  const QuerySessionId& interrupt_session = "");

   void resetInterrupt();


   // only for testing usage

   void enableRuntimeQueryInterrupt(const double runtime_query_check_freq,

                                    const unsigned pending_query_check_freq) const;


   int8_t warpSize() const;

   unsigned gridSize() const;

   void setGridSize(unsigned grid_size);

   void resetGridSize();

   unsigned numBlocksPerMP() const;

   unsigned blockSize() const;

   void setBlockSize(unsigned block_size);

   void resetBlockSize();

   size_t maxGpuSlabSize() const;


   ResultSetPtr executeWorkUnit(size_t& max_groups_buffer_entry_guess,

                                const bool is_agg,

                                const std::vector<InputTableInfo>&,

                                const RelAlgExecutionUnit&,

                                const CompilationOptions&,

                                const ExecutionOptions& options,

                                RenderInfo* render_info,

                                const bool has_cardinality_estimation,

                                ColumnCacheMap& column_cache);


   TableUpdateMetadata executeUpdate(const RelAlgExecutionUnit& ra_exe_unit,

                                     const std::vector<InputTableInfo>& table_infos,

                                     const TableDescriptor* updated_table_desc,

                                     const CompilationOptions& co,

                                     const ExecutionOptions& eo,

                                     const Catalog_Namespace::Catalog& cat,

                                     std::shared_ptr<RowSetMemoryOwner> row_set_mem_owner,

                                     const UpdateLogForFragment::Callback& cb,

                                     const bool is_agg);


   void addTransientStringLiterals(

       const RelAlgExecutionUnit& ra_exe_unit,

       const std::shared_ptr<RowSetMemoryOwner>& row_set_mem_owner);


   int deviceCount(const ExecutorDeviceType) const;


   void logSystemCPUMemoryStatus(std::string const& tag, size_t const thread_idx) const;


   void logSystemGPUMemoryStatus(std::string const& tag, size_t const thread_idx) const;


  private:

   void clearMetaInfoCache();


   int deviceCountForMemoryLevel(const Data_Namespace::MemoryLevel memory_level) const;


   // Generate code for a window function target.

   llvm::Value* codegenWindowFunction(const size_t target_index,

                                      const CompilationOptions& co);


   llvm::Value* codegenConditionalAggregateCondValSelector(

       llvm::Value* cond_lv,

       SQLAgg const aggKind,

       CompilationOptions const& co) const;


   // Generate code for an aggregate window function target.

   llvm::Value* codegenWindowFunctionAggregate(CodeGenerator* code_generator,

                                               const CompilationOptions& co);


   // The aggregate state requires a state reset when starting a new partition. Generate

   // the new partition check and return the continuation basic block.

   std::pair<llvm::BasicBlock*, llvm::Value*> codegenWindowResetStateControlFlow(

       CodeGenerator* code_generator,

       const CompilationOptions& co);


   // Generate code for initializing the state of a window aggregate.

   void codegenWindowFunctionStateInit(CodeGenerator* code_generator,

                                       const CompilationOptions& co,

                                       llvm::Value* aggregate_state);


   // Generates the required calls for an aggregate window function and returns the final

   // result.

   llvm::Value* codegenWindowFunctionAggregateCalls(llvm::Value* aggregate_state,

                                                    const CompilationOptions& co);


   // Generate code for computing window navigation function on frame

   llvm::Value* codegenWindowNavigationFunctionOnFrame(const CompilationOptions& co);


   // Generate code for computing current partition index from a given row_pos

   llvm::Value* codegenCurrentPartitionIndex(

       const WindowFunctionContext* window_func_context,

       CodeGenerator* code_generator,

       const CompilationOptions& co,

       llvm::Value* current_row_pos_lv);


   // Generate code to analyze user-given window frame bound expr

   llvm::Value* codegenFrameBoundExpr(const Analyzer::WindowFunction* window_func,

                                      const Analyzer::WindowFrame* frame_bound,

                                      CodeGenerator& code_generator,

                                      const CompilationOptions& co);


   // Generate code for a given frame bound

   llvm::Value* codegenFrameBound(bool for_start_bound,

                                  bool for_range_mode,

                                  bool for_window_frame_naviation,

                                  const Analyzer::WindowFrame* frame_bound,

                                  bool is_timestamp_type_frame,

                                  llvm::Value* order_key_null_val,

                                  const WindowFrameBoundFuncArgs& args);


   std::pair<std::string, llvm::Value*> codegenLoadOrderKeyBufPtr(

       WindowFunctionContext* window_func_context,

       CodeGenerator* code_generator,

       const CompilationOptions& co) const;


   // Generate code to load null range of the window partition

   std::pair<llvm::Value*, llvm::Value*> codegenFrameNullRange(

       WindowFunctionContext* window_func_context,

       CodeGenerator* code_generator,

       const CompilationOptions& co,

       llvm::Value* partition_index_lv) const;


   // Generate codes for loading various buffers of window partitions

   WindowPartitionBufferPtrs codegenLoadPartitionBuffers(

       WindowFunctionContext* window_func_context,

       CodeGenerator* code_generator,

       const CompilationOptions& co,

       llvm::Value* partition_index_lv) const;


   // Generate code for computing a window frame bound

   std::pair<llvm::Value*, llvm::Value*> codegenWindowFrameBounds(

       WindowFunctionContext* window_func_context,

       const Analyzer::WindowFrame* frame_start_bound,

       const Analyzer::WindowFrame* frame_end_bound,

       llvm::Value* order_key_col_null_val_lv,

       WindowFrameBoundFuncArgs& args,

       CodeGenerator& code_generator);


   // Generate codes for computing a pair of window frame bounds

   std::pair<llvm::Value*, llvm::Value*> codegenFrameBoundRange(

       const Analyzer::WindowFunction* window_func,

       CodeGenerator& code_generator,

       const CompilationOptions& co);


   // frequently used utility functions to generate code for window framing

   std::vector<llvm::Value*> prepareRowModeFuncArgs(

       bool for_start_bound,

       SqlWindowFrameBoundType bound_type,

       const WindowFrameBoundFuncArgs& args) const;

   std::vector<llvm::Value*> prepareRangeModeFuncArgs(

       bool for_start_bound,

       const Analyzer::WindowFrame* frame_bound,

       bool is_timestamp_type_frame,

       llvm::Value* order_key_null_val,

       const WindowFrameBoundFuncArgs& frame_args) const;

   const std::string getOrderKeyTypeName(WindowFunctionContext* window_func_context) const;

   llvm::Value* codegenLoadCurrentValueFromColBuf(

       WindowFunctionContext* window_func_context,

       CodeGenerator& code_generator,

       WindowFrameBoundFuncArgs& args) const;

   size_t getOrderKeySize(WindowFunctionContext* window_func_context) const;

   const SQLTypeInfo getFirstOrderColTypeInfo(

       WindowFunctionContext* window_func_context) const;

   std::string getFramingFuncName(const std::string& bound_type,

                                  const std::string& order_col_type,

                                  const std::string& op_type,

                                  bool for_timestamp_type) const;


   // The AVG window function requires some post-processing: the sum is divided by count

   // and the result is stored back for the current row.

   void codegenWindowAvgEpilogue(CodeGenerator* code_generator,

                                 const CompilationOptions& co,

                                 llvm::Value* crt_val,

                                 llvm::Value* window_func_null_val);


   // Generates code which loads the current aggregate value for the window context.

   llvm::Value* codegenAggregateWindowState(CodeGenerator* code_generator,

                                            const CompilationOptions& co,

                                            llvm::Value* aggregate_state);


   llvm::Value* aggregateWindowStatePtr(CodeGenerator* code_generator,

                                        const CompilationOptions& co);


   CudaMgr_Namespace::CudaMgr* cudaMgr() const {

     CHECK(data_mgr_);

     auto cuda_mgr = data_mgr_->getCudaMgr();

     CHECK(cuda_mgr);

     return cuda_mgr;

   }


   bool isArchPascalOrLater(const ExecutorDeviceType dt) const {

     if (dt == ExecutorDeviceType::GPU) {

       return cudaMgr()->isArchPascalOrLater();

     }

     return false;

   }


   bool needFetchAllFragments(const InputColDescriptor& col_desc,

                              const RelAlgExecutionUnit& ra_exe_unit,

                              const FragmentsList& selected_fragments) const;


   bool needLinearizeAllFragments(const ColumnDescriptor* cd,

                                  const InputColDescriptor& inner_col_desc,

                                  const RelAlgExecutionUnit& ra_exe_unit,

                                  const FragmentsList& selected_fragments,

                                  const Data_Namespace::MemoryLevel memory_level) const;


   using PerFragmentCallBack =

       std::function<void(ResultSetPtr, const Fragmenter_Namespace::FragmentInfo&)>;


   void executeWorkUnitPerFragment(const RelAlgExecutionUnit& ra_exe_unit,

                                   const InputTableInfo& table_info,

                                   const CompilationOptions& co,

                                   const ExecutionOptions& eo,

                                   const Catalog_Namespace::Catalog& cat,

                                   PerFragmentCallBack& cb,

                                   const std::set<size_t>& fragment_indexes_param);


   ResultSetPtr executeExplain(const QueryCompilationDescriptor&);


   ResultSetPtr executeTableFunction(const TableFunctionExecutionUnit exe_unit,

                                     const std::vector<InputTableInfo>& table_infos,

                                     const CompilationOptions& co,

                                     const ExecutionOptions& eo);


   ExecutorDeviceType getDeviceTypeForTargets(

       const RelAlgExecutionUnit& ra_exe_unit,

       const ExecutorDeviceType requested_device_type);


   ResultSetPtr collectAllDeviceResults(

       SharedKernelContext& shared_context,

       const RelAlgExecutionUnit& ra_exe_unit,

       const QueryMemoryDescriptor& query_mem_desc,

       const ExecutorDeviceType device_type,

       std::shared_ptr<RowSetMemoryOwner> row_set_mem_owner);


   ResultSetPtr collectAllDeviceShardedTopResults(

       SharedKernelContext& shared_context,

       const RelAlgExecutionUnit& ra_exe_unit,

       const ExecutorDeviceType device_type) const;


   std::unordered_map<shared::TableKey, const Analyzer::BinOper*> getInnerTabIdToJoinCond()

       const;


   std::vector<std::unique_ptr<ExecutionKernel>> createKernels(

       SharedKernelContext& shared_context,

       const RelAlgExecutionUnit& ra_exe_unit,

       ColumnFetcher& column_fetcher,

       const std::vector<InputTableInfo>& table_infos,

       const ExecutionOptions& eo,

       const bool is_agg,

       const bool allow_single_frag_table_opt,

       const size_t context_count,

       const QueryCompilationDescriptor& query_comp_desc,

       const QueryMemoryDescriptor& query_mem_desc,

       RenderInfo* render_info,

       std::unordered_set<int>& available_gpus,

       int& available_cpus);


   void launchKernelsImpl(SharedKernelContext& shared_context,

                          std::vector<std::unique_ptr<ExecutionKernel>>&& kernels,

                          const ExecutorDeviceType device_type,

                          const size_t requested_num_threads);


   void launchKernelsLocked(SharedKernelContext& shared_context,

                            std::vector<std::unique_ptr<ExecutionKernel>>&& kernels,

                            const ExecutorDeviceType device_type);


   void launchKernelsViaResourceMgr(

       SharedKernelContext& shared_context,

       std::vector<std::unique_ptr<ExecutionKernel>>&& kernels,

       const ExecutorDeviceType device_type,

       const std::vector<InputDescriptor>& input_descs,

       const QueryMemoryDescriptor& query_mem_desc);


   std::vector<size_t> getTableFragmentIndices(

       const RelAlgExecutionUnit& ra_exe_unit,

       const ExecutorDeviceType device_type,

       const size_t table_idx,

       const size_t outer_frag_idx,

       std::map<shared::TableKey, const TableFragments*>& selected_tables_fragments,

       const std::unordered_map<shared::TableKey, const Analyzer::BinOper*>&

           inner_table_id_to_join_condition);


   bool skipFragmentPair(

       const Fragmenter_Namespace::FragmentInfo& outer_fragment_info,

       const Fragmenter_Namespace::FragmentInfo& inner_fragment_info,

       const int inner_table_id,

       const std::unordered_map<shared::TableKey, const Analyzer::BinOper*>&

           inner_table_id_to_join_condition,

       const RelAlgExecutionUnit& ra_exe_unit,

       const ExecutorDeviceType device_type);


   FetchResult fetchChunks(const ColumnFetcher&,

                           const RelAlgExecutionUnit& ra_exe_unit,

                           const int device_id,

                           const Data_Namespace::MemoryLevel,

                           const std::map<shared::TableKey, const TableFragments*>&,

                           const FragmentsList& selected_fragments,

                           std::list<ChunkIter>&,

                           std::list<std::shared_ptr<Chunk_NS::Chunk>>&,

                           DeviceAllocator* device_allocator,

                           const size_t thread_idx,

                           const bool allow_runtime_interrupt);


   FetchResult fetchUnionChunks(const ColumnFetcher&,

                                const RelAlgExecutionUnit& ra_exe_unit,

                                const int device_id,

                                const Data_Namespace::MemoryLevel,

                                const std::map<shared::TableKey, const TableFragments*>&,

                                const FragmentsList& selected_fragments,

                                std::list<ChunkIter>&,

                                std::list<std::shared_ptr<Chunk_NS::Chunk>>&,

                                DeviceAllocator* device_allocator,

                                const size_t thread_idx,

                                const bool allow_runtime_interrupt);


   std::pair<std::vector<std::vector<int64_t>>, std::vector<std::vector<uint64_t>>>

   getRowCountAndOffsetForAllFrags(

       const RelAlgExecutionUnit& ra_exe_unit,

       const CartesianProduct<std::vector<std::vector<size_t>>>& frag_ids_crossjoin,

       const std::vector<InputDescriptor>& input_descs,

       const std::map<shared::TableKey, const TableFragments*>& all_tables_fragments);


   void buildSelectedFragsMapping(

       std::vector<std::vector<size_t>>& selected_fragments_crossjoin,

       std::vector<size_t>& local_col_to_frag_pos,

       const std::list<std::shared_ptr<const InputColDescriptor>>& col_global_ids,

       const FragmentsList& selected_fragments,

       const RelAlgExecutionUnit& ra_exe_unit);


   void buildSelectedFragsMappingForUnion(

       std::vector<std::vector<size_t>>& selected_fragments_crossjoin,

       const FragmentsList& selected_fragments,

       const RelAlgExecutionUnit& ra_exe_unit);


   std::vector<size_t> getFragmentCount(const FragmentsList& selected_fragments,

                                        const size_t scan_idx,

                                        const RelAlgExecutionUnit& ra_exe_unit);


   // pass nullptr to results if it shouldn't be extracted from the execution context

   int32_t executePlanWithGroupBy(const RelAlgExecutionUnit& ra_exe_unit,

                                  const CompilationResult&,

                                  const bool hoist_literals,

                                  ResultSetPtr* results,

                                  const ExecutorDeviceType device_type,

                                  std::vector<std::vector<const int8_t*>>& col_buffers,

                                  const std::vector<size_t> outer_tab_frag_ids,

                                  QueryExecutionContext*,

                                  const std::vector<std::vector<int64_t>>& num_rows,

                                  const std::vector<std::vector<uint64_t>>& frag_offsets,

                                  Data_Namespace::DataMgr*,

                                  const int device_id,

                                  const shared::TableKey& outer_table_key,

                                  const int64_t limit,

                                  const uint32_t start_rowid,

                                  const uint32_t num_tables,

                                  const bool allow_runtime_interrupt,

                                  RenderInfo* render_info,

                                  const bool optimize_cuda_block_and_grid_sizes,

                                  const int64_t rows_to_process = -1);

   // pass nullptr to results if it shouldn't be extracted from the execution context

   int32_t executePlanWithoutGroupBy(

       const RelAlgExecutionUnit& ra_exe_unit,

       const CompilationResult&,

       const bool hoist_literals,

       ResultSetPtr* results,

       const std::vector<Analyzer::Expr*>& target_exprs,

       const ExecutorDeviceType device_type,

       std::vector<std::vector<const int8_t*>>& col_buffers,

       QueryExecutionContext* query_exe_context,

       const std::vector<std::vector<int64_t>>& num_rows,

       const std::vector<std::vector<uint64_t>>& frag_offsets,

       Data_Namespace::DataMgr* data_mgr,

       const int device_id,

       const uint32_t start_rowid,

       const uint32_t num_tables,

       const bool allow_runtime_interrupt,

       RenderInfo* render_info,

       const bool optimize_cuda_block_and_grid_sizes,

       const int64_t rows_to_process = -1);


  public:  // Temporary, ask saman about this

   static std::pair<int64_t, int32_t> reduceResults(const SQLAgg agg,

                                                    const SQLTypeInfo& ti,

                                                    const int64_t agg_init_val,

                                                    const int8_t out_byte_width,

                                                    const int64_t* out_vec,

                                                    const size_t out_vec_sz,

                                                    const bool is_group_by,

                                                    const bool float_argument_input);


  private:

   ResultSetPtr resultsUnion(SharedKernelContext& shared_context,

                             const RelAlgExecutionUnit& ra_exe_unit);

   std::vector<int8_t*> getJoinHashTablePtrs(const ExecutorDeviceType device_type,

                                             const int device_id);

   ResultSetPtr reduceMultiDeviceResults(

       const RelAlgExecutionUnit&,

       std::vector<std::pair<ResultSetPtr, std::vector<size_t>>>& all_fragment_results,

       std::shared_ptr<RowSetMemoryOwner>,

       const QueryMemoryDescriptor&) const;

   std::vector<std::pair<ResultSetPtr, std::vector<size_t>>>

   getUniqueThreadSharedResultSets(

       const std::vector<std::pair<ResultSetPtr, std::vector<size_t>>>& results_per_device)

       const;

   ResultSetPtr reduceMultiDeviceResultSets(

       std::vector<std::pair<ResultSetPtr, std::vector<size_t>>>& all_fragment_results,

       std::shared_ptr<RowSetMemoryOwner>,

       const QueryMemoryDescriptor&) const;

   ResultSetPtr reduceSpeculativeTopN(

       const RelAlgExecutionUnit&,

       std::vector<std::pair<ResultSetPtr, std::vector<size_t>>>& all_fragment_results,

       std::shared_ptr<RowSetMemoryOwner>,

       const QueryMemoryDescriptor&) const;


   ResultSetPtr executeWorkUnitImpl(size_t& max_groups_buffer_entry_guess,

                                    const bool is_agg,

                                    const bool allow_single_frag_table_opt,

                                    const std::vector<InputTableInfo>&,

                                    const RelAlgExecutionUnit&,

                                    const CompilationOptions&,

                                    const ExecutionOptions& options,

                                    std::shared_ptr<RowSetMemoryOwner>,

                                    RenderInfo* render_info,

                                    const bool has_cardinality_estimation,

                                    ColumnCacheMap& column_cache);


   std::vector<llvm::Value*> inlineHoistedLiterals();


   void AutoTrackBuffersInRuntimeIR();


   std::tuple<CompilationResult, std::unique_ptr<QueryMemoryDescriptor>> compileWorkUnit(

       const std::vector<InputTableInfo>& query_infos,

       const PlanState::DeletedColumnsMap& deleted_cols_map,

       const RelAlgExecutionUnit& ra_exe_unit,

       const CompilationOptions& co,

       const ExecutionOptions& eo,

       const CudaMgr_Namespace::CudaMgr* cuda_mgr,

       const bool allow_lazy_fetch,

       std::shared_ptr<RowSetMemoryOwner>,

       const size_t max_groups_buffer_entry_count,

       const int8_t crt_min_byte_width,

       const bool has_cardinality_estimation,

       ColumnCacheMap& column_cache,

       RenderInfo* render_info = nullptr);

   // Generate code to skip the deleted rows in the outermost table.

   llvm::BasicBlock* codegenSkipDeletedOuterTableRow(

       const RelAlgExecutionUnit& ra_exe_unit,

       const CompilationOptions& co);

   std::vector<JoinLoop> buildJoinLoops(RelAlgExecutionUnit& ra_exe_unit,

                                        const CompilationOptions& co,

                                        const ExecutionOptions& eo,

                                        const std::vector<InputTableInfo>& query_infos,

                                        ColumnCacheMap& column_cache);

   // Create a callback which hoists left hand side filters above the join for left joins,

   // eliminating extra computation of the probe and matches if the row does not pass the

   // filters

   JoinLoop::HoistedFiltersCallback buildHoistLeftHandSideFiltersCb(

       const RelAlgExecutionUnit& ra_exe_unit,

       const size_t level_idx,

       const shared::TableKey& inner_table_key,

       const CompilationOptions& co);

   // Create a callback which generates code which returns true iff the row on the given

   // level is deleted.

   std::function<llvm::Value*(const std::vector<llvm::Value*>&, llvm::Value*)>

   buildIsDeletedCb(const RelAlgExecutionUnit& ra_exe_unit,

                    const size_t level_idx,

                    const CompilationOptions& co);

   // Builds a join hash table for the provided conditions on the current level.

   // Returns null iff on failure and provides the reasons in `fail_reasons`.

   std::shared_ptr<HashJoin> buildCurrentLevelHashTable(

       const JoinCondition& current_level_join_conditions,

       size_t level_idx,

       RelAlgExecutionUnit& ra_exe_unit,

       const CompilationOptions& co,

       const std::vector<InputTableInfo>& query_infos,

       ColumnCacheMap& column_cache,

       std::vector<std::string>& fail_reasons);

   void redeclareFilterFunction();

   llvm::Value* addJoinLoopIterator(const std::vector<llvm::Value*>& prev_iters,

                                    const size_t level_idx);

   void codegenJoinLoops(const std::vector<JoinLoop>& join_loops,

                         const RelAlgExecutionUnit& ra_exe_unit,

                         GroupByAndAggregate& group_by_and_aggregate,

                         llvm::Function* query_func,

                         llvm::BasicBlock* entry_bb,

                         QueryMemoryDescriptor& query_mem_desc,

                         const CompilationOptions& co,

                         const ExecutionOptions& eo);

   bool compileBody(const RelAlgExecutionUnit& ra_exe_unit,

                    GroupByAndAggregate& group_by_and_aggregate,

                    QueryMemoryDescriptor& query_mem_desc,

                    const CompilationOptions& co,

                    const GpuSharedMemoryContext& gpu_smem_context = {});


   void createErrorCheckControlFlow(llvm::Function* query_func,

                                    bool run_with_dynamic_watchdog,

                                    bool run_with_allowing_runtime_interrupt,

                                    const std::vector<JoinLoop>& join_loops,

                                    ExecutorDeviceType device_type,

                                    const std::vector<InputTableInfo>& input_table_infos);


   void insertErrorCodeChecker(llvm::Function* query_func,

                               unsigned const error_code_idx,

                               bool hoist_literals,

                               bool allow_runtime_query_interrupt);


   void preloadFragOffsets(const std::vector<InputDescriptor>& input_descs,

                           const std::vector<InputTableInfo>& query_infos);


   struct JoinHashTableOrError {

     std::shared_ptr<HashJoin> hash_table;

     std::string fail_reason;

   };


   JoinHashTableOrError buildHashTableForQualifier(

       const std::shared_ptr<Analyzer::BinOper>& qual_bin_oper,

       const std::vector<InputTableInfo>& query_infos,

       const MemoryLevel memory_level,

       const JoinType join_type,

       const HashType preferred_hash_type,

       ColumnCacheMap& column_cache,

       const HashTableBuildDagMap& hashtable_build_dag_map,

       const RegisteredQueryHint& query_hint,

       const TableIdToNodeMap& table_id_to_node_map);

   void nukeOldState(const bool allow_lazy_fetch,

                     const std::vector<InputTableInfo>& query_infos,

                     const PlanState::DeletedColumnsMap& deleted_cols_map,

                     const RelAlgExecutionUnit* ra_exe_unit);


   std::shared_ptr<CompilationContext> optimizeAndCodegenCPU(

       llvm::Function*,

       llvm::Function*,

       const std::unordered_set<llvm::Function*>&,

       const CompilationOptions&);

   std::shared_ptr<CompilationContext> optimizeAndCodegenGPU(

       llvm::Function*,

       llvm::Function*,

       std::unordered_set<llvm::Function*>&,

       const bool no_inline,

       const CudaMgr_Namespace::CudaMgr* cuda_mgr,

       const bool is_gpu_smem_used,

       const CompilationOptions&);

   std::string generatePTX(const std::string&) const;

   void initializeNVPTXBackend() const;


   int64_t deviceCycles(int milliseconds) const;


   struct GroupColLLVMValue {

     llvm::Value* translated_value;

     llvm::Value* original_value;

   };


   GroupColLLVMValue groupByColumnCodegen(Analyzer::Expr* group_by_col,

                                          const size_t col_width,

                                          const CompilationOptions&,

                                          const bool translate_null_val,

                                          const int64_t translated_null_val,

                                          DiamondCodegen&,

                                          std::stack<llvm::BasicBlock*>&,

                                          const bool thread_mem_shared);


   llvm::Value* castToFP(llvm::Value*,

                         SQLTypeInfo const& from_ti,

                         SQLTypeInfo const& to_ti);

   llvm::Value* castToIntPtrTyIn(llvm::Value* val, const size_t bit_width);


   std::tuple<RelAlgExecutionUnit, PlanState::DeletedColumnsMap> addDeletedColumn(

       const RelAlgExecutionUnit& ra_exe_unit,

       const CompilationOptions& co);


   bool isFragmentFullyDeleted(const InputDescriptor& table_desc,

                               const Fragmenter_Namespace::FragmentInfo& fragment);


   FragmentSkipStatus canSkipFragmentForFpQual(

       const Analyzer::BinOper* comp_expr,

       const Analyzer::ColumnVar* lhs_col,

       const Fragmenter_Namespace::FragmentInfo& fragment,

       const Analyzer::Constant* rhs_const) const;


   std::pair<bool, int64_t> skipFragment(

       const InputDescriptor& table_desc,

       const Fragmenter_Namespace::FragmentInfo& frag_info,

       const std::list<std::shared_ptr<Analyzer::Expr>>& simple_quals,

       const std::vector<uint64_t>& frag_offsets,

       const size_t frag_idx);


   std::pair<bool, int64_t> skipFragmentInnerJoins(

       const InputDescriptor& table_desc,

       const RelAlgExecutionUnit& ra_exe_unit,

       const Fragmenter_Namespace::FragmentInfo& fragment,

       const std::vector<uint64_t>& frag_offsets,

       const size_t frag_idx);


   AggregatedColRange computeColRangesCache(

       const std::unordered_set<PhysicalInput>& phys_inputs);

   StringDictionaryGenerations computeStringDictionaryGenerations(

       const std::unordered_set<PhysicalInput>& phys_inputs);

   TableGenerations computeTableGenerations(

       const std::unordered_set<shared::TableKey>& phys_table_keys);


  public:

   void setupCaching(const std::unordered_set<PhysicalInput>& phys_inputs,

                     const std::unordered_set<shared::TableKey>& phys_table_keys);

   void setColRangeCache(const AggregatedColRange& aggregated_col_range) {

     agg_col_range_cache_ = aggregated_col_range;

   }

   ExecutorId getExecutorId() const { return executor_id_; };

   QuerySessionId& getCurrentQuerySession(

       heavyai::shared_lock<heavyai::shared_mutex>& read_lock);

   QuerySessionStatus::QueryStatus getQuerySessionStatus(

       const QuerySessionId& candidate_query_session,

       heavyai::shared_lock<heavyai::shared_mutex>& read_lock);

   bool checkCurrentQuerySession(const std::string& candidate_query_session,

                                 heavyai::shared_lock<heavyai::shared_mutex>& read_lock);

   void invalidateRunningQuerySession(

       heavyai::unique_lock<heavyai::shared_mutex>& write_lock);

   bool addToQuerySessionList(const QuerySessionId& query_session,

                              const std::string& query_str,

                              const std::string& submitted,

                              const size_t executor_id,

                              const QuerySessionStatus::QueryStatus query_status,

                              heavyai::unique_lock<heavyai::shared_mutex>& write_lock);

   bool removeFromQuerySessionList(

       const QuerySessionId& query_session,

       const std::string& submitted_time_str,

       heavyai::unique_lock<heavyai::shared_mutex>& write_lock);

   void setQuerySessionAsInterrupted(

       const QuerySessionId& query_session,

       heavyai::unique_lock<heavyai::shared_mutex>& write_lock);

   bool checkIsQuerySessionInterrupted(

       const std::string& query_session,

       heavyai::shared_lock<heavyai::shared_mutex>& read_lock);

   bool checkIsQuerySessionEnrolled(

       const QuerySessionId& query_session,

       heavyai::shared_lock<heavyai::shared_mutex>& read_lock);

   bool updateQuerySessionStatusWithLock(

       const QuerySessionId& query_session,

       const std::string& submitted_time_str,

       const QuerySessionStatus::QueryStatus updated_query_status,

       heavyai::unique_lock<heavyai::shared_mutex>& write_lock);

   bool updateQuerySessionExecutorAssignment(

       const QuerySessionId& query_session,

       const std::string& submitted_time_str,

       const size_t executor_id,

       heavyai::unique_lock<heavyai::shared_mutex>& write_lock);

   std::vector<QuerySessionStatus> getQuerySessionInfo(

       const QuerySessionId& query_session,

       heavyai::shared_lock<heavyai::shared_mutex>& read_lock);


   heavyai::shared_mutex& getSessionLock();

   CurrentQueryStatus attachExecutorToQuerySession(

       const QuerySessionId& query_session_id,

       const std::string& query_str,

       const std::string& query_submitted_time);

   void checkPendingQueryStatus(const QuerySessionId& query_session);

   void clearQuerySessionStatus(const QuerySessionId& query_session,

                                const std::string& submitted_time_str);

   void updateQuerySessionStatus(const QuerySessionId& query_session,

                                 const std::string& submitted_time_str,

                                 const QuerySessionStatus::QueryStatus new_query_status);

   void enrollQuerySession(const QuerySessionId& query_session,

                           const std::string& query_str,

                           const std::string& submitted_time_str,

                           const size_t executor_id,

                           const QuerySessionStatus::QueryStatus query_session_status);

   size_t getNumCurentSessionsEnrolled() const;

   // get a set of executor ids that a given session has fired regardless of

   // each executor's status: pending or running

   const std::vector<size_t> getExecutorIdsRunningQuery(

       const QuerySessionId& interrupt_session) const;

   // check whether the current session that this executor manages is interrupted

   // while performing non-kernel time task

   bool checkNonKernelTimeInterrupted() const;

   void registerExtractedQueryPlanDag(const QueryPlanDAG& query_plan_dag);

   const QueryPlanDAG getLatestQueryPlanDagExtracted() const;


   // true when we have matched cardinality, and false otherwise

   using CachedCardinality = std::pair<bool, size_t>;

   void addToCardinalityCache(const CardinalityCacheKey& cache_key,

                              const size_t cache_value);

   CachedCardinality getCachedCardinality(const CardinalityCacheKey& cache_key);

   static void clearCardinalityCache();

   static void invalidateCardinalityCacheForTable(const shared::TableKey& table_key);


   heavyai::shared_mutex& getDataRecyclerLock();

   QueryPlanDagCache& getQueryPlanDagCache();

   ResultSetRecyclerHolder& getResultSetRecyclerHolder();


   CgenState* getCgenStatePtr() const { return cgen_state_.get(); }

   PlanState* getPlanStatePtr() const { return plan_state_.get(); }


   llvm::LLVMContext& getContext() { return *context_.get(); }

   void update_extension_modules(bool update_runtime_modules_only = false);


   static void update_after_registration(bool update_runtime_modules_only = false) {

     for (auto executor_item : Executor::executors_) {

       executor_item.second->update_extension_modules(update_runtime_modules_only);

     }

   }

   static void init_resource_mgr(const size_t num_cpu_slots,

                                 const size_t num_gpu_slots,

                                 const size_t cpu_result_mem,

                                 const size_t cpu_buffer_pool_mem,

                                 const size_t gpu_buffer_pool_mem,

                                 const double per_query_max_cpu_slots_ratio,

                                 const double per_query_max_cpu_result_mem_ratio,

                                 const bool allow_cpu_kernel_concurrency,

                                 const bool allow_cpu_gpu_kernel_concurrency,

                                 const bool allow_cpu_slot_oversubscription_concurrency,

                                 const bool allow_cpu_result_mem_oversubscription,

                                 const double max_available_resource_use_ratio);


   static void pause_executor_queue();

   static void resume_executor_queue();

   static size_t get_executor_resource_pool_total_resource_quantity(

       const ExecutorResourceMgr_Namespace::ResourceType resource_type);

   static ExecutorResourceMgr_Namespace::ResourcePoolInfo

   get_executor_resource_pool_info();

   static void set_executor_resource_pool_resource(

       const ExecutorResourceMgr_Namespace::ResourceType resource_type,

       const size_t resource_quantity);


   static size_t getBaselineThreshold(bool for_count_distinct,

                                      ExecutorDeviceType device_type) {

     return for_count_distinct ? (device_type == ExecutorDeviceType::GPU

                                      ? (Executor::baseline_threshold / 4)

                                      : Executor::baseline_threshold)

                               : Executor::baseline_threshold;

   }

   static const ExecutorResourceMgr_Namespace::ConcurrentResourceGrantPolicy

   get_concurrent_resource_grant_policy(

       const ExecutorResourceMgr_Namespace::ResourceType resource_type);


   static void set_concurrent_resource_grant_policy(

       const ExecutorResourceMgr_Namespace::ConcurrentResourceGrantPolicy&

           concurrent_resource_grant_policy);


  private:

   std::vector<int8_t> serializeLiterals(

       const std::unordered_map<int, CgenState::LiteralValues>& literals,

       const int device_id);


   static size_t align(const size_t off_in, const size_t alignment) {

     size_t off = off_in;

     if (off % alignment != 0) {

       off += (alignment - off % alignment);

     }

     return off;

   }


   const ExecutorId executor_id_;

   std::unique_ptr<llvm::LLVMContext> context_;


  public:

   // CgenStateManager uses RAII pattern to ensure that recursive code

   // generation (e.g. as in multi-step multi-subqueries) uses a new

   // CgenState instance for each recursion depth while restoring the

   // old CgenState instances when returning from recursion.

   class CgenStateManager {

    public:

     CgenStateManager(Executor& executor);

     CgenStateManager(Executor& executor,

                      const bool allow_lazy_fetch,

                      const std::vector<InputTableInfo>& query_infos,

                      const PlanState::DeletedColumnsMap& deleted_cols_map,

                      const RelAlgExecutionUnit* ra_exe_unit);

     ~CgenStateManager();


    private:

     Executor& executor_;

     std::chrono::steady_clock::time_point lock_queue_clock_;

     std::lock_guard<std::mutex> lock_;

     std::unique_ptr<CgenState> cgen_state_;

   };


  private:

   std::unique_ptr<CgenState> cgen_state_;


   const std::unique_ptr<llvm::Module>& get_extension_module(ExtModuleKinds kind) const {

     auto it = extension_modules_.find(kind);

     if (it != extension_modules_.end()) {

       return it->second;

     }

     static const std::unique_ptr<llvm::Module> empty;

     return empty;

   }


   bool has_extension_module(ExtModuleKinds kind) const {

     return extension_modules_.find(kind) != extension_modules_.end();

   }


   std::map<ExtModuleKinds, std::unique_ptr<llvm::Module>> extension_modules_;


   class FetchCacheAnchor {

    public:

     FetchCacheAnchor(CgenState* cgen_state)

         : cgen_state_(cgen_state), saved_fetch_cache(cgen_state_->fetch_cache_) {}

     ~FetchCacheAnchor() { cgen_state_->fetch_cache_.swap(saved_fetch_cache); }


    private:

     CgenState* cgen_state_;

     std::unordered_map<size_t, std::vector<llvm::Value*>> saved_fetch_cache;

   };


   llvm::Value* spillDoubleElement(llvm::Value* elem_val, llvm::Type* elem_ty);


   std::unique_ptr<PlanState> plan_state_;

   std::shared_ptr<RowSetMemoryOwner> row_set_mem_owner_;


   static const int max_gpu_count{16};

   static const size_t auto_num_threads{size_t(0)};

   std::mutex gpu_exec_mutex_[max_gpu_count];


   static std::mutex gpu_active_modules_mutex_;

   static uint32_t gpu_active_modules_device_mask_;

   static void* gpu_active_modules_[max_gpu_count];

   // indicates whether this executor has been interrupted

   std::atomic<bool> interrupted_{false};


   mutable std::mutex str_dict_mutex_;


   mutable std::unique_ptr<llvm::TargetMachine> nvptx_target_machine_;


   static const size_t baseline_threshold{

       1000000};  // if a perfect hash needs more entries, use baseline


   unsigned block_size_x_;

   unsigned grid_size_x_;

   const size_t max_gpu_slab_size_;

   const std::string debug_dir_;

   const std::string debug_file_;


   Data_Namespace::DataMgr* data_mgr_;

   const TemporaryTables* temporary_tables_;

   TableIdToNodeMap table_id_to_node_map_;


   int64_t kernel_queue_time_ms_ = 0;

   int64_t compilation_queue_time_ms_ = 0;


   // Singleton instance used for an execution unit which is a project with window

   // functions.

   std::unique_ptr<WindowProjectNodeContext> window_project_node_context_owned_;

   // The active window function.

   WindowFunctionContext* active_window_function_{nullptr};


   mutable InputTableInfoCache input_table_info_cache_;

   AggregatedColRange agg_col_range_cache_;

   TableGenerations table_generations_;

   static heavyai::shared_mutex executor_session_mutex_;

   // a query session that this executor manages

   QuerySessionId current_query_session_;

   // a pair of <QuerySessionId, interrupted_flag>

   static InterruptFlagMap queries_interrupt_flag_;

   // a pair of <QuerySessionId, query_session_status>

   static QuerySessionMap queries_session_map_;

   static std::map<int, std::shared_ptr<Executor>> executors_;


   // SQL queries take a shared lock, exclusive options (cache clear, memory clear) take a

   // write lock

   static heavyai::shared_mutex execute_mutex_;


   struct ExecutorMutexHolder {

     heavyai::shared_lock<heavyai::shared_mutex> shared_lock;

     heavyai::unique_lock<heavyai::shared_mutex> unique_lock;

   };

   inline ExecutorMutexHolder acquireExecuteMutex() {

     ExecutorMutexHolder ret;

     if (executor_id_ == Executor::UNITARY_EXECUTOR_ID) {

       // Only one unitary executor can run at a time

       ret.unique_lock = heavyai::unique_lock<heavyai::shared_mutex>(execute_mutex_);

     } else {

       ret.shared_lock = heavyai::shared_lock<heavyai::shared_mutex>(execute_mutex_);

     }

     return ret;

   }


   static heavyai::shared_mutex executors_cache_mutex_;


   static QueryPlanDagCache query_plan_dag_cache_;

   static heavyai::shared_mutex recycler_mutex_;


   static std::unordered_map<CardinalityCacheKey, size_t> cardinality_cache_;

   static ResultSetRecyclerHolder resultset_recycler_holder_;


   // a variable used for testing query plan DAG extractor when a query has a table

   // function

   static QueryPlanDAG latest_query_plan_extracted_;


  public:

   // Although compilation is Executor-local, an executor may trigger

   // threaded compilations (see executeWorkUnitPerFragment) that share

   // executor cgen_state and LLVM context, for instance.

   std::mutex compilation_mutex_;


   // Runtime extension function registration updates

   // extension_modules_ that needs to be kept blocked from codegen

   // until the update is complete.

   static std::mutex register_runtime_extension_functions_mutex_;

   static std::mutex kernel_mutex_;  // TODO: should this be executor-local mutex?


   static const size_t auto_cpu_mem_bytes{size_t(0)};

   static std::shared_ptr<ExecutorResourceMgr_Namespace::ExecutorResourceMgr>

       executor_resource_mgr_;


   friend class BaselineJoinHashTable;

   friend class CodeGenerator;

   friend class ColumnFetcher;

   friend struct DiamondCodegen;  // cgen_state_

   friend class ExecutionKernel;

   friend class KernelSubtask;

   friend class HashJoin;  // cgen_state_

   friend class BoundingBoxIntersectJoinHashTable;

   friend class RangeJoinHashTable;

   friend class GroupByAndAggregate;

   friend class QueryCompilationDescriptor;

   friend class QueryMemoryDescriptor;

   friend class QueryMemoryInitializer;

   friend class QueryFragmentDescriptor;

   friend class QueryExecutionContext;

   friend class ResultSet;

   friend class InValuesBitmap;

   friend class StringDictionaryTranslationMgr;

   friend class LeafAggregator;

   friend class PerfectJoinHashTable;

   friend class QueryRewriter;

   friend class PendingExecutionClosure;

   friend class RelAlgExecutor;

   friend class TableOptimizer;

   friend class TableFunctionCompilationContext;

   friend class TableFunctionExecutionContext;

   friend struct TargetExprCodegenBuilder;

   friend struct TargetExprCodegen;

   friend class WindowProjectNodeContext;

 };


 inline std::string get_null_check_suffix(const SQLTypeInfo& lhs_ti,

                                          const SQLTypeInfo& rhs_ti) {

   if (lhs_ti.get_notnull() && rhs_ti.get_notnull()) {

     return "";

   }

   std::string null_check_suffix{"_nullable"};

   if (lhs_ti.get_notnull()) {

     CHECK(!rhs_ti.get_notnull());

     null_check_suffix += "_rhs";

   } else if (rhs_ti.get_notnull()) {

     CHECK(!lhs_ti.get_notnull());

     null_check_suffix += "_lhs";

   }

   return null_check_suffix;

 }


 inline bool is_unnest(const Analyzer::Expr* expr) {

   return dynamic_cast<const Analyzer::UOper*>(expr) &&

          static_cast<const Analyzer::UOper*>(expr)->get_optype() == kUNNEST;

 }


 inline bool is_constructed_point(const Analyzer::Expr* expr) {

   auto uoper = dynamic_cast<const Analyzer::UOper*>(expr);

   auto oper = (uoper && uoper->get_optype() == kCAST) ? uoper->get_operand() : expr;

   auto arr = dynamic_cast<const Analyzer::ArrayExpr*>(oper);

   return (arr && arr->isLocalAlloc() && arr->get_type_info().is_fixlen_array());

 }


 size_t get_loop_join_size(const std::vector<InputTableInfo>& query_infos,

                           const RelAlgExecutionUnit& ra_exe_unit);


 std::unordered_set<int> get_available_gpus(const Catalog_Namespace::Catalog& cat);


 size_t get_context_count(const ExecutorDeviceType device_type,

                          const size_t cpu_count,

                          const size_t gpu_count);


 extern "C" RUNTIME_EXPORT void register_buffer_with_executor_rsm(int64_t exec,

                                                                  int8_t* buffer);


 const Analyzer::Expr* remove_cast_to_int(const Analyzer::Expr* expr);


 inline std::string toString(const Executor::ExtModuleKinds& kind) {

   switch (kind) {

     case Executor::ExtModuleKinds::template_module:

       return "template_module";

     case Executor::ExtModuleKinds::rt_geos_module:

       return "rt_geos_module";

     case Executor::ExtModuleKinds::rt_libdevice_module:

       return "rt_libdevice_module";

     case Executor::ExtModuleKinds::udf_cpu_module:

       return "udf_cpu_module";

     case Executor::ExtModuleKinds::udf_gpu_module:

       return "udf_gpu_module";

     case Executor::ExtModuleKinds::rt_udf_cpu_module:

       return "rt_udf_cpu_module";

     case Executor::ExtModuleKinds::rt_udf_gpu_module:

       return "rt_udf_gpu_module";

   }

   LOG(FATAL) << "Invalid LLVM module kind.";

   return "";

 }


 namespace foreign_storage {

 void populate_string_dictionary(int32_t table_id, int32_t col_id, int32_t db_id);

 }


 #endif  // QUERYENGINE_EXECUTE_H

Executor::createErrorCheckControlFlow
void createErrorCheckControlFlow(llvm::Function *query_func, bool run_with_dynamic_watchdog, bool run_with_allowing_runtime_interrupt, const std::vector< JoinLoop > &join_loops, ExecutorDeviceType device_type, const std::vector< InputTableInfo > &input_table_infos)
Definition: NativeCodegen.cpp:2029

Executor::logSystemGPUMemoryStatus
void logSystemGPUMemoryStatus(std::string const &tag, size_t const thread_idx) const
Definition: Execute.cpp:776

CompilationOptions
Definition: CompilationOptions.h:31

ExecutorResourceMgr_Namespace::ResourcePoolInfo
A container for various stats about the current state of the ExecutorResourcePool. Note that ExecutorResourcePool does not persist a struct of this type, but rather builds one on the fly when ExecutorResourcePool::get_resource_info() is called.
Definition: ExecutorResourcePool.h:98

UpdateLogForFragment::getColumnType
SQLTypeInfo getColumnType(const size_t col_idx) const
Definition: ExecuteUpdate.cpp:61

Data_Namespace::DataMgr::getCudaMgr
CudaMgr_Namespace::CudaMgr * getCudaMgr() const
Definition: DataMgr.h:177

Executor::debug_dir_
const std::string debug_dir_
Definition: Execute.h:1555

Executor::GroupColLLVMValue::translated_value
llvm::Value * translated_value
Definition: Execute.h:1274

Executor::executeWorkUnitPerFragment
void executeWorkUnitPerFragment(const RelAlgExecutionUnit &ra_exe_unit, const InputTableInfo &table_info, const CompilationOptions &co, const ExecutionOptions &eo, const Catalog_Namespace::Catalog &cat, PerFragmentCallBack &cb, const std::set< size_t > &fragment_indexes_param)
Compiles and dispatches a work unit per fragment processing results with the per fragment callback...
Definition: Execute.cpp:2365

anonymous_namespace{RelAlgExecutor.cpp}::is_agg
bool is_agg(const Analyzer::Expr *expr)
Definition: RelAlgExecutor.cpp:1957

SqlWindowFrameBoundType
SqlWindowFrameBoundType
Definition: sqldefs.h:202

CacheInvalidator::invalidateCachesByTable
static void invalidateCachesByTable(size_t table_key)
Definition: CacheInvalidator.h:24

JoinLoop.h

Executor::computeColRangesCache
AggregatedColRange computeColRangesCache(const std::unordered_set< PhysicalInput > &phys_inputs)
Definition: Execute.cpp:4894

Executor::enableRuntimeQueryInterrupt
void enableRuntimeQueryInterrupt(const double runtime_query_check_freq, const unsigned pending_query_check_freq) const
Definition: Execute.cpp:5274

QueryPlanDagCache
Definition: QueryPlanDagCache.h:110

SQLAgg
SQLAgg
Definition: sqldefs.h:76

Analyzer::WindowFunction
Definition: Analyzer.h:2860

CHECK_EQ
#define CHECK_EQ(x, y)
Definition: Logger.h:301

Executor::getLatestQueryPlanDagExtracted
const QueryPlanDAG getLatestQueryPlanDagExtracted() const
Definition: Execute.cpp:5382

Executor::ExtModuleKinds::udf_cpu_module

Executor::createKernels
std::vector< std::unique_ptr< ExecutionKernel > > createKernels(SharedKernelContext &shared_context, const RelAlgExecutionUnit &ra_exe_unit, ColumnFetcher &column_fetcher, const std::vector< InputTableInfo > &table_infos, const ExecutionOptions &eo, const bool is_agg, const bool allow_single_frag_table_opt, const size_t context_count, const QueryCompilationDescriptor &query_comp_desc, const QueryMemoryDescriptor &query_mem_desc, RenderInfo *render_info, std::unordered_set< int > &available_gpus, int &available_cpus)
Definition: Execute.cpp:2907

Executor::ExtModuleKinds
ExtModuleKinds
Definition: Execute.h:518

TableFunctionCompilationContext
Definition: TableFunctionCompilationContext.h:29

Executor::codegenJoinLoops
void codegenJoinLoops(const std::vector< JoinLoop > &join_loops, const RelAlgExecutionUnit &ra_exe_unit, GroupByAndAggregate &group_by_and_aggregate, llvm::Function *query_func, llvm::BasicBlock *entry_bb, QueryMemoryDescriptor &query_mem_desc, const CompilationOptions &co, const ExecutionOptions &eo)
Definition: IRCodegen.cpp:1204

Executor::execute_mutex_
static heavyai::shared_mutex execute_mutex_
Definition: Execute.h:1585

Executor::get_udf_module
const std::unique_ptr< llvm::Module > & get_udf_module(bool is_gpu=false) const
Definition: Execute.h:535

Executor::ExecutorMutexHolder
Definition: Execute.h:1587

Executor::queries_session_map_
static QuerySessionMap queries_session_map_
Definition: Execute.h:1580

Executor::cudaMgr
CudaMgr_Namespace::CudaMgr * cudaMgr() const
Definition: Execute.h:865

QueryFragmentDescriptor
Definition: QueryFragmentDescriptor.h:68

Executor::nvptx_target_machine_
std::unique_ptr< llvm::TargetMachine > nvptx_target_machine_
Definition: Execute.h:1547

Executor::checkIsQuerySessionInterrupted
bool checkIsQuerySessionInterrupted(const std::string &query_session, heavyai::shared_lock< heavyai::shared_mutex > &read_lock)
Definition: Execute.cpp:5254

Executor::has_libdevice_module
bool has_libdevice_module() const
Definition: Execute.h:566

Executor::kernel_queue_time_ms_
int64_t kernel_queue_time_ms_
Definition: Execute.h:1562

JoinType
JoinType
Definition: sqldefs.h:238

Executor::maxGpuSlabSize
size_t maxGpuSlabSize() const
Definition: Execute.cpp:4392

Executor::acquireExecuteMutex
ExecutorMutexHolder acquireExecuteMutex()
Definition: Execute.h:1591

Executor::data_mgr_
Data_Namespace::DataMgr * data_mgr_
Definition: Execute.h:1558

Executor::getTableFragmentIndices
std::vector< size_t > getTableFragmentIndices(const RelAlgExecutionUnit &ra_exe_unit, const ExecutorDeviceType device_type, const size_t table_idx, const size_t outer_frag_idx, std::map< shared::TableKey, const TableFragments * > &selected_tables_fragments, const std::unordered_map< shared::TableKey, const Analyzer::BinOper * > &inner_table_id_to_join_condition)
Definition: Execute.cpp:3236

ExternalCacheInvalidators.h

Executor::compilation_queue_time_ms_
int64_t compilation_queue_time_ms_
Definition: Execute.h:1563

QuerySessionStatus::getQuerySubmittedTime
const std::string & getQuerySubmittedTime()
Definition: Execute.h:134

CompilationRetryNoLazyFetch::CompilationRetryNoLazyFetch
CompilationRetryNoLazyFetch()
Definition: Execute.h:270

Executor::ResultSet
friend class ResultSet
Definition: Execute.h:1645

ColumnToFragmentsMap
std::map< const ColumnDescriptor *, std::set< int32_t >> ColumnToFragmentsMap
Definition: Execute.h:335

Executor::get_geos_module
const std::unique_ptr< llvm::Module > & get_geos_module() const
Definition: Execute.h:545

cat
std::string cat(Ts &&...args)
Definition: StringTransform.h:41

WatchdogException
Definition: Execute.h:159

Executor::initialize_extension_module_sources
static void initialize_extension_module_sources()
Definition: Execute.cpp:298

InValuesBitmap
Definition: InValuesBitmap.h:42

Executor::codegenWindowFunctionStateInit
void codegenWindowFunctionStateInit(CodeGenerator *code_generator, const CompilationOptions &co, llvm::Value *aggregate_state)
Definition: WindowFunctionIR.cpp:339

run_benchmark_import.args
tuple args
Definition: run_benchmark_import.py:247

Executor::CgenStateManager::~CgenStateManager
~CgenStateManager()
Definition: Execute.cpp:467

Executor::checkPendingQueryStatus
void checkPendingQueryStatus(const QuerySessionId &query_session)
Definition: Execute.cpp:5035

Executor::getJoinIntersectionStringProxyTranslationMap
const StringDictionaryProxy::IdMap * getJoinIntersectionStringProxyTranslationMap(const StringDictionaryProxy *source_proxy, StringDictionaryProxy *dest_proxy, const std::vector< StringOps_Namespace::StringOpInfo > &source_string_op_infos, const std::vector< StringOps_Namespace::StringOpInfo > &dest_source_string_op_infos, std::shared_ptr< RowSetMemoryOwner > row_set_mem_owner) const
Definition: Execute.cpp:621

Executor::registerActiveModule
static void registerActiveModule(void *module, const int device_id)
Definition: GpuInterrupt.cpp:20

remove_cast_to_int
const Analyzer::Expr * remove_cast_to_int(const Analyzer::Expr *expr)
Definition: ColumnIR.cpp:618

Executor::CgenStateManager::executor_
Executor & executor_
Definition: Execute.h:1495

Catalog_Namespace::Catalog
class for a per-database catalog. also includes metadata for the current database and the current use...
Definition: Catalog.h:143

CgenState::fetch_cache_
std::unordered_map< size_t, std::vector< llvm::Value * > > fetch_cache_
Definition: CgenState.h:385

Executor::getJoinHashTablePtrs
std::vector< int8_t * > getJoinHashTablePtrs(const ExecutorDeviceType device_type, const int device_id)
Definition: Execute.cpp:4253

PlanState::DeletedColumnsMap
std::unordered_map< shared::TableKey, const ColumnDescriptor * > DeletedColumnsMap
Definition: PlanState.h:44

CodeGenerator
Definition: CodeGenerator.h:29

QuerySessionStatus::RUNNING_REDUCTION
Definition: Execute.h:99

Executor::FetchCacheAnchor::FetchCacheAnchor
FetchCacheAnchor(CgenState *cgen_state)
Definition: Execute.h:1521

BoundingBoxIntersectJoinHashTable
Definition: BoundingBoxIntersectJoinHashTable.h:29

StringDictionary.h

Executor::get_extension_module
const std::unique_ptr< llvm::Module > & get_extension_module(ExtModuleKinds kind) const
Definition: Execute.h:1504

Executor::getRowSetMemoryOwner
const std::shared_ptr< RowSetMemoryOwner > getRowSetMemoryOwner() const
Definition: Execute.cpp:728

UpdateLogForFragment::getLiteralDictionary
StringDictionaryProxy * getLiteralDictionary() const override
Definition: Execute.h:355

Executor::interrupted_
std::atomic< bool > interrupted_
Definition: Execute.h:1543

NOT_SKIPPABLE
Definition: Execute.h:164

Executor::resultset_recycler_holder_
static ResultSetRecyclerHolder resultset_recycler_holder_
Definition: Execute.h:1608

RelAlgTranslator.h

RowDataProvider
Fragmenter_Namespace::RowDataProvider RowDataProvider
Definition: Execute.h:334

GpuSharedMemoryContext.h

QuerySessionStatus
Definition: Execute.h:89

CgenState.h

Executor::max_gpu_count
static const int max_gpu_count
Definition: Execute.h:1535

Executor::groupByColumnCodegen
GroupColLLVMValue groupByColumnCodegen(Analyzer::Expr *group_by_col, const size_t col_width, const CompilationOptions &, const bool translate_null_val, const int64_t translated_null_val, DiamondCodegen &, std::stack< llvm::BasicBlock * > &, const bool thread_mem_shared)
Definition: IRCodegen.cpp:1384

Executor::get_executor_resource_pool_info
static ExecutorResourceMgr_Namespace::ResourcePoolInfo get_executor_resource_pool_info()
Definition: Execute.cpp:5448

ExecutorResourceMgr.h

QuerySessionMap
std::map< const QuerySessionId, std::map< std::string, QuerySessionStatus >> QuerySessionMap
Definition: Execute.h:155

UpdateLogForFragment::getFragmentIndex
size_t const getFragmentIndex() const
Definition: ExecuteUpdate.cpp:57

CodeCacheAccessor.h

CartesianProduct
Definition: CartesianProduct.h:181

LOG
#define LOG(tag)
Definition: Logger.h:285

QueryPlanDAG
std::string QueryPlanDAG
Definition: RelAlgExecutionUnit.h:57

RelAlgExecutor
Definition: RelAlgExecutor.h:53

QueryMemoryDescriptor
Definition: QueryMemoryDescriptor.h:68

Executor::isArchPascalOrLater
bool isArchPascalOrLater(const ExecutorDeviceType dt) const
Definition: Execute.h:872

Executor::AutoTrackBuffersInRuntimeIR
void AutoTrackBuffersInRuntimeIR()
Definition: NativeCodegen.cpp:2303

Catalog_Namespace::operator<<
std::ostream & operator<<(std::ostream &os, const SessionInfo &session_info)
Definition: SessionInfo.cpp:57

thread_count.h

Analyzer::Expr
Definition: Analyzer.h:68

SQLTypeInfo::is_fp
bool is_fp() const
Definition: sqltypes.h:573

AggregatedColRange.h
Cache for physical column ranges. Set by the aggregator on the leaves.

CurrentQueryStatus
std::pair< QuerySessionId, std::string > CurrentQueryStatus
Definition: Execute.h:87

is_constructed_point
bool is_constructed_point(const Analyzer::Expr *expr)
Definition: Execute.h:1682

SystemParameters
Definition: SystemParameters.h:27

Executor::codegenFrameBound
llvm::Value * codegenFrameBound(bool for_start_bound, bool for_range_mode, bool for_window_frame_naviation, const Analyzer::WindowFrame *frame_bound, bool is_timestamp_type_frame, llvm::Value *order_key_null_val, const WindowFrameBoundFuncArgs &args)
Definition: WindowFunctionIR.cpp:649

Executor::ExecutorMutexHolder::unique_lock
heavyai::unique_lock< heavyai::shared_mutex > unique_lock
Definition: Execute.h:1589

StringDictionaryGenerations
Definition: StringDictionaryGenerations.h:23

Executor::executor_resource_mgr_
static std::shared_ptr< ExecutorResourceMgr_Namespace::ExecutorResourceMgr > executor_resource_mgr_
Definition: Execute.h:1628

ColumnDescriptor::tableId
int tableId
Definition: ColumnDescriptor.h:34

JoinLoop::HoistedFiltersCallback
std::function< llvm::BasicBlock *(llvm::BasicBlock *, llvm::BasicBlock *, const std::string &, llvm::Function *, CgenState *)> HoistedFiltersCallback
Definition: JoinLoop.h:62

Executor::getColLazyFetchInfo
std::vector< ColumnLazyFetchInfo > getColLazyFetchInfo(const std::vector< Analyzer::Expr * > &target_exprs) const
Definition: Execute.cpp:1017

Executor::baseline_threshold
static const size_t baseline_threshold
Definition: Execute.h:1549

Executor::updateQuerySessionStatus
void updateQuerySessionStatus(const QuerySessionId &query_session, const std::string &submitted_time_str, const QuerySessionStatus::QueryStatus new_query_status)
Definition: Execute.cpp:5075

Executor::get_rt_udf_module
const std::unique_ptr< llvm::Module > & get_rt_udf_module(bool is_gpu=false) const
Definition: Execute.h:539

WindowPartitionBufferPtrs
Definition: WindowContext.h:123

QueryRewriter
Definition: QueryRewrite.h:28

get_available_gpus
std::unordered_set< int > get_available_gpus(const Data_Namespace::DataMgr *data_mgr)
Definition: Execute.cpp:1752

Executor::INVALID_EXECUTOR_ID
static constexpr ExecutorId INVALID_EXECUTOR_ID
Definition: Execute.h:424

Executor::FetchCacheAnchor::saved_fetch_cache
std::unordered_map< size_t, std::vector< llvm::Value * > > saved_fetch_cache
Definition: Execute.h:1527

InputColDescriptor
Definition: InputDescriptors.h:59

Executor::addDeletedColumn
std::tuple< RelAlgExecutionUnit, PlanState::DeletedColumnsMap > addDeletedColumn(const RelAlgExecutionUnit &ra_exe_unit, const CompilationOptions &co)
Definition: Execute.cpp:4475

DeviceAllocator
Definition: DeviceAllocator.h:45

logger::FATAL
Definition: Logger.h:111

CudaMgr_Namespace::CudaMgr::isArchPascalOrLater
bool isArchPascalOrLater() const
Definition: CudaMgr.h:156

TableUpdateMetadata::fragments_with_deleted_rows
TableToFragmentIds fragments_with_deleted_rows
Definition: Execute.h:340

ExecutionKernel
Definition: ExecutionKernel.h:92

Executor::hasLazyFetchColumns
bool hasLazyFetchColumns(const std::vector< Analyzer::Expr * > &target_exprs) const
Definition: Execute.cpp:1006

Executor::launchKernelsImpl
void launchKernelsImpl(SharedKernelContext &shared_context, std::vector< std::unique_ptr< ExecutionKernel >> &&kernels, const ExecutorDeviceType device_type, const size_t requested_num_threads)
Definition: Execute.cpp:3040

Executor::aggregateWindowStatePtr
llvm::Value * aggregateWindowStatePtr(CodeGenerator *code_generator, const CompilationOptions &co)
Definition: WindowFunctionIR.cpp:242

get_column_type
const SQLTypeInfo get_column_type(const int col_id, const int table_id, const ColumnDescriptor *cd, const TemporaryTables *temporary_tables)
Definition: Execute.h:254

Catalog_Namespace::get_metadata_for_column
const ColumnDescriptor * get_metadata_for_column(const ::shared::ColumnKey &column_key)
Definition: SysCatalog.cpp:3234

ExecutorResourceMgr_Namespace::ResourceType
ResourceType
Stores the resource type for a ExecutorResourcePool request.
Definition: ExecutorResourceMgrCommon.h:108

Executor::fetchUnionChunks
FetchResult fetchUnionChunks(const ColumnFetcher &, const RelAlgExecutionUnit &ra_exe_unit, const int device_id, const Data_Namespace::MemoryLevel, const std::map< shared::TableKey, const TableFragments * > &, const FragmentsList &selected_fragments, std::list< ChunkIter > &, std::list< std::shared_ptr< Chunk_NS::Chunk >> &, DeviceAllocator *device_allocator, const size_t thread_idx, const bool allow_runtime_interrupt)
Definition: Execute.cpp:3642

TableOptimizer
Driver for running cleanup processes on a table. TableOptimizer provides functions for various cleanu...
Definition: TableOptimizer.h:38

Executor::collectAllDeviceShardedTopResults
ResultSetPtr collectAllDeviceShardedTopResults(SharedKernelContext &shared_context, const RelAlgExecutionUnit &ra_exe_unit, const ExecutorDeviceType device_type) const
Definition: Execute.cpp:2830

Executor::reduceResults
static std::pair< int64_t, int32_t > reduceResults(const SQLAgg agg, const SQLTypeInfo &ti, const int64_t agg_init_val, const int8_t out_byte_width, const int64_t *out_vec, const size_t out_vec_sz, const bool is_group_by, const bool float_argument_input)
Definition: Execute.cpp:1337

TooManyLiterals
Definition: Execute.h:283

kCAST
Definition: sqldefs.h:51

Executor::insertErrorCodeChecker
void insertErrorCodeChecker(llvm::Function *query_func, unsigned const error_code_idx, bool hoist_literals, bool allow_runtime_query_interrupt)
Definition: NativeCodegen.cpp:3242

BufferCompaction.h
Macros and functions for groupby buffer compaction.

NvidiaKernel.h

Executor::getStringProxyTranslationMap
const StringDictionaryProxy::IdMap * getStringProxyTranslationMap(const shared::StringDictKey &source_dict_key, const shared::StringDictKey &dest_dict_key, const RowSetMemoryOwner::StringTranslationType translation_type, const std::vector< StringOps_Namespace::StringOpInfo > &string_op_infos, std::shared_ptr< RowSetMemoryOwner > row_set_mem_owner, const bool with_generation) const
Definition: Execute.cpp:606

Executor::current_query_session_
QuerySessionId current_query_session_
Definition: Execute.h:1576

Executor::getResultSetRecyclerHolder
ResultSetRecyclerHolder & getResultSetRecyclerHolder()
Definition: Execute.cpp:4978

extract_cast_arg
const Analyzer::Expr * extract_cast_arg(const Analyzer::Expr *expr)
Definition: Execute.h:222

Executor::ExtModuleKinds::rt_udf_gpu_module

Executor::getSessionLock
heavyai::shared_mutex & getSessionLock()
Definition: Execute.cpp:4982

Executor::getFramingFuncName
std::string getFramingFuncName(const std::string &bound_type, const std::string &order_col_type, const std::string &op_type, bool for_timestamp_type) const
Definition: WindowFunctionIR.cpp:847

QueryPlanDagCache.h

CardinalityCacheKey::table_keys
std::unordered_set< shared::TableKey > table_keys
Definition: Execute.h:403

QuerySessionStatus::getQueryStatus
const QuerySessionStatus::QueryStatus getQueryStatus()
Definition: Execute.h:135

WindowContext.h

RangeJoinHashTable
Definition: RangeJoinHashTable.h:21

QuerySessionStatus::query_str_
const std::string query_str_
Definition: Execute.h:144

QuerySessionStatus::QuerySessionStatus
QuerySessionStatus(const QuerySessionId &query_session, const std::string &query_str, const std::string &submitted_time)
Definition: Execute.h:103

QuerySessionStatus::UNDEFINED
Definition: Execute.h:95

Executor::getChunkRequestInfo
ExecutorResourceMgr_Namespace::ChunkRequestInfo getChunkRequestInfo(const ExecutorDeviceType device_type, const std::vector< InputDescriptor > &input_descs, const std::vector< InputTableInfo > &query_infos, const std::vector< std::pair< int32_t, FragmentsList >> &device_fragment_lists) const
Determines a unique list of chunks and their associated byte sizes for a given query plan...
Definition: Execute.cpp:877

Executor::agg_col_range_cache_
AggregatedColRange agg_col_range_cache_
Definition: Execute.h:1572

TableDescriptor::tableId
int32_t tableId
Definition: TableDescriptor.h:44

ResultSetPtr
std::shared_ptr< ResultSet > ResultSetPtr
Definition: RelAlgExecutionUnit.h:231

Executor::gpu_active_modules_
static void * gpu_active_modules_[max_gpu_count]
Definition: Execute.h:1541

Executor::cgen_state_
std::unique_ptr< CgenState > cgen_state_
Definition: Execute.h:1502

Executor::GroupColLLVMValue::original_value
llvm::Value * original_value
Definition: Execute.h:1275

PlanState
Definition: PlanState.h:43

Executor::enrollQuerySession
void enrollQuerySession(const QuerySessionId &query_session, const std::string &query_str, const std::string &submitted_time_str, const size_t executor_id, const QuerySessionStatus::QueryStatus query_session_status)
Definition: Execute.cpp:5091

TargetExprCodegenBuilder
Definition: TargetExprBuilder.h:81

Executor::init_resource_mgr
static void init_resource_mgr(const size_t num_cpu_slots, const size_t num_gpu_slots, const size_t cpu_result_mem, const size_t cpu_buffer_pool_mem, const size_t gpu_buffer_pool_mem, const double per_query_max_cpu_slots_ratio, const double per_query_max_cpu_result_mem_ratio, const bool allow_cpu_kernel_concurrency, const bool allow_cpu_gpu_kernel_concurrency, const bool allow_cpu_slot_oversubscription_concurrency, const bool allow_cpu_result_mem_oversubscription, const double max_available_resource_use_ratio)
Definition: Execute.cpp:5387

ParseIRError::ParseIRError
ParseIRError(const std::string message)
Definition: Execute.h:322

WindowFunctionContext
Definition: WindowContext.h:136

ExecutorResourceMgr_Namespace::ConcurrentResourceGrantPolicy
Specifies the policies for resource grants in the presence of other requests, both under situations o...
Definition: ResourceGrantPolicy.h:172

Executor::executePlanWithoutGroupBy
int32_t executePlanWithoutGroupBy(const RelAlgExecutionUnit &ra_exe_unit, const CompilationResult &, const bool hoist_literals, ResultSetPtr *results, const std::vector< Analyzer::Expr * > &target_exprs, const ExecutorDeviceType device_type, std::vector< std::vector< const int8_t * >> &col_buffers, QueryExecutionContext *query_exe_context, const std::vector< std::vector< int64_t >> &num_rows, const std::vector< std::vector< uint64_t >> &frag_offsets, Data_Namespace::DataMgr *data_mgr, const int device_id, const uint32_t start_rowid, const uint32_t num_tables, const bool allow_runtime_interrupt, RenderInfo *render_info, const bool optimize_cuda_block_and_grid_sizes, const int64_t rows_to_process=-1)
Definition: Execute.cpp:3834

Executor::gpu_active_modules_device_mask_
static uint32_t gpu_active_modules_device_mask_
Definition: Execute.h:1540

TableFunctionExecutionContext
Definition: TableFunctionExecutionContext.h:27

Executor::executeUpdate
TableUpdateMetadata executeUpdate(const RelAlgExecutionUnit &ra_exe_unit, const std::vector< InputTableInfo > &table_infos, const TableDescriptor *updated_table_desc, const CompilationOptions &co, const ExecutionOptions &eo, const Catalog_Namespace::Catalog &cat, std::shared_ptr< RowSetMemoryOwner > row_set_mem_owner, const UpdateLogForFragment::Callback &cb, const bool is_agg)
Definition: ExecuteUpdate.cpp:65

SQLTypeInfo::get_type
HOST DEVICE SQLTypes get_type() const
Definition: sqltypes.h:391

GroupByAndAggregate.h

Executor::canSkipFragmentForFpQual
FragmentSkipStatus canSkipFragmentForFpQual(const Analyzer::BinOper *comp_expr, const Analyzer::ColumnVar *lhs_col, const Fragmenter_Namespace::FragmentInfo &fragment, const Analyzer::Constant *rhs_const) const
Definition: Execute.cpp:4598

CacheInvalidator::invalidateCaches
static void invalidateCaches()
Definition: CacheInvalidator.h:23

Executor::deviceCount
int deviceCount(const ExecutorDeviceType) const
Definition: Execute.cpp:1322

Executor::castToIntPtrTyIn
llvm::Value * castToIntPtrTyIn(llvm::Value *val, const size_t bit_width)
Definition: Execute.cpp:4428

Executor::reset
void reset(bool discard_runtime_modules_only=false)
Definition: Execute.cpp:327

CompilationRetryNoCompaction::CompilationRetryNoCompaction
CompilationRetryNoCompaction()
Definition: Execute.h:290

DateTimeUtils.h

Executor::kernel_mutex_
static std::mutex kernel_mutex_
Definition: Execute.h:1624

WindowProjectNodeContext
Definition: WindowContext.h:349

Executor::numBlocksPerMP
unsigned numBlocksPerMP() const
Definition: Execute.cpp:4361

Executor::getStringDictionaryProxy
StringDictionaryProxy * getStringDictionaryProxy(const shared::StringDictKey &dict_key, const bool with_generation) const
Definition: Execute.h:578

Executor::CgenStateManager::cgen_state_
std::unique_ptr< CgenState > cgen_state_
Definition: Execute.h:1498

CHECK_GT
#define CHECK_GT(x, y)
Definition: Logger.h:305

QueryCompilationDescriptor.h
Container for compilation results and assorted options for a single execution unit.

Executor::auto_cpu_mem_bytes
static const size_t auto_cpu_mem_bytes
Definition: Execute.h:1626

Executor::isCPUOnly
bool isCPUOnly() const
Definition: Execute.cpp:706

Executor::resetGridSize
void resetGridSize()
Definition: Execute.cpp:4380

Executor::checkCurrentQuerySession
bool checkCurrentQuerySession(const std::string &candidate_query_session, heavyai::shared_lock< heavyai::shared_mutex > &read_lock)
Definition: Execute.cpp:4991

Executor::clearCaches
void clearCaches(bool runtime_only=false)

Executor::window_project_node_context_owned_
std::unique_ptr< WindowProjectNodeContext > window_project_node_context_owned_
Definition: Execute.h:1567

Executor::addTransientStringLiterals
void addTransientStringLiterals(const RelAlgExecutionUnit &ra_exe_unit, const std::shared_ptr< RowSetMemoryOwner > &row_set_mem_owner)
Definition: Execute.cpp:2523

FragmentsList
std::vector< FragmentsPerTable > FragmentsList
Definition: QueryFragmentDescriptor.h:58

SQLTypeInfo::is_time
bool is_time() const
Definition: sqltypes.h:579

Executor::needFetchAllFragments
bool needFetchAllFragments(const InputColDescriptor &col_desc, const RelAlgExecutionUnit &ra_exe_unit, const FragmentsList &selected_fragments) const
Definition: Execute.cpp:3416

QuerySessionStatus::query_session_
const QuerySessionId query_session_
Definition: Execute.h:142

Executor::JoinHashTableOrError::hash_table
std::shared_ptr< HashJoin > hash_table
Definition: Execute.h:1236

Analyzer::ColumnVar
Definition: Analyzer.h:194

ExecutorDeviceType
ExecutorDeviceType
Definition: ExecutorDeviceType.h:23

to_string
std::string to_string(char const *&&v)
Definition: StringTransform.cpp:128

Executor::updateQuerySessionStatusWithLock
bool updateQuerySessionStatusWithLock(const QuerySessionId &query_session, const std::string &submitted_time_str, const QuerySessionStatus::QueryStatus updated_query_status, heavyai::unique_lock< heavyai::shared_mutex > &write_lock)
Definition: Execute.cpp:5158

CompilationResult
Definition: QueryCompilationDescriptor.h:33

Executor::executeWorkUnit
ResultSetPtr executeWorkUnit(size_t &max_groups_buffer_entry_guess, const bool is_agg, const std::vector< InputTableInfo > &, const RelAlgExecutionUnit &, const CompilationOptions &, const ExecutionOptions &options, RenderInfo *render_info, const bool has_cardinality_estimation, ColumnCacheMap &column_cache)
Definition: Execute.cpp:2099

Executor::clearCardinalityCache
static void clearCardinalityCache()
Definition: Execute.cpp:5309

Executor::checkNonKernelTimeInterrupted
bool checkNonKernelTimeInterrupted() const
Definition: Execute.cpp:5363

GpuSharedMemoryContext
Definition: GpuSharedMemoryContext.h:20

Executor::clearMemory
static void clearMemory(const Data_Namespace::MemoryLevel memory_level)
Definition: Execute.cpp:535

QuerySessionStatus::QuerySessionStatus
QuerySessionStatus(const QuerySessionId &query_session, const size_t executor_id, const std::string &query_str, const std::string &submitted_time)
Definition: Execute.h:111

ExtensionFunction
Definition: ExtensionFunctionsWhitelist.h:127

UpdateLogForFragment::Callback
std::function< void(const UpdateLogForFragment &, TableUpdateMetadata &)> Callback
Definition: Execute.h:370

Executor::removeFromQuerySessionList
bool removeFromQuerySessionList(const QuerySessionId &query_session, const std::string &submitted_time_str, heavyai::unique_lock< heavyai::shared_mutex > &write_lock)
Definition: Execute.cpp:5209

Executor::resume_executor_queue
static void resume_executor_queue()
Definition: Execute.cpp:5429

register_buffer_with_executor_rsm
RUNTIME_EXPORT void register_buffer_with_executor_rsm(int64_t exec, int8_t *buffer)
Definition: ExtensionsIR.cpp:232

ExecutorDeviceType::GPU

CardinalityCacheKey::CardinalityCacheKey
CardinalityCacheKey(const RelAlgExecutionUnit &ra_exe_unit)
Definition: Execute.cpp:1960

TargetMetaInfo.h

CudaMgr_Namespace::CudaMgr
Definition: CudaMgr.h:84

Executor::getInnerTabIdToJoinCond
std::unordered_map< shared::TableKey, const Analyzer::BinOper * > getInnerTabIdToJoinCond() const
Definition: Execute.cpp:2882

Executor::get_libdevice_module
const std::unique_ptr< llvm::Module > & get_libdevice_module() const
Definition: Execute.h:548

QueryMustRunOnCpu::QueryMustRunOnCpu
QueryMustRunOnCpu(const std::string &err)
Definition: Execute.h:317

heavyai::shared_lock
std::shared_lock< T > shared_lock
Definition: heavyai_shared_mutex.h:41

Executor::getExecutor
static std::shared_ptr< Executor > getExecutor(const ExecutorId id, const std::string &debug_dir="", const std::string &debug_file="", const SystemParameters &system_parameters=SystemParameters())
Definition: Execute.cpp:513

Executor::preloadFragOffsets
void preloadFragOffsets(const std::vector< InputDescriptor > &input_descs, const std::vector< InputTableInfo > &query_infos)
Definition: Execute.cpp:4288

QuerySessionStatus::PENDING_EXECUTOR
Definition: Execute.h:97

Executor::getRowCountAndOffsetForAllFrags
std::pair< std::vector< std::vector< int64_t > >, std::vector< std::vector< uint64_t > > > getRowCountAndOffsetForAllFrags(const RelAlgExecutionUnit &ra_exe_unit, const CartesianProduct< std::vector< std::vector< size_t >>> &frag_ids_crossjoin, const std::vector< InputDescriptor > &input_descs, const std::map< shared::TableKey, const TableFragments * > &all_tables_fragments)
Definition: Execute.cpp:3367

WindowFrameBoundFuncArgs
Definition: WindowContext.h:105

kDOUBLE
Definition: sqltypes.h:75

QuerySessionStatus::setQueryStatus
void setQueryStatus(const QuerySessionStatus::QueryStatus &status)
Definition: Execute.h:136

Executor::codegenFrameNullRange
std::pair< llvm::Value *, llvm::Value * > codegenFrameNullRange(WindowFunctionContext *window_func_context, CodeGenerator *code_generator, const CompilationOptions &co, llvm::Value *partition_index_lv) const
Definition: WindowFunctionIR.cpp:904

InputDescriptor
Definition: InputDescriptors.h:30

TemporaryTables
std::unordered_map< int, const ResultSetPtr & > TemporaryTables
Definition: InputMetadata.h:31

Executor::executor_id_
const ExecutorId executor_id_
Definition: Execute.h:1476

QuerySessionStatus::RUNNING_QUERY_KERNEL
Definition: Execute.h:98

SKIPPABLE
Definition: Execute.h:164

Executor::updateQuerySessionExecutorAssignment
bool updateQuerySessionExecutorAssignment(const QuerySessionId &query_session, const std::string &submitted_time_str, const size_t executor_id, heavyai::unique_lock< heavyai::shared_mutex > &write_lock)
Definition: Execute.cpp:5184

get_temporary_table
const ResultSetPtr & get_temporary_table(const TemporaryTables *temporary_tables, const int table_id)
Definition: Execute.h:246

Executor::warpSize
int8_t warpSize() const
Definition: Execute.cpp:4344

InterruptFlagMap
std::map< QuerySessionId, bool > InterruptFlagMap
Definition: Execute.h:88

Executor::max_gpu_slab_size_
const size_t max_gpu_slab_size_
Definition: Execute.h:1554

Executor::reduceSpeculativeTopN
ResultSetPtr reduceSpeculativeTopN(const RelAlgExecutionUnit &, std::vector< std::pair< ResultSetPtr, std::vector< size_t >>> &all_fragment_results, std::shared_ptr< RowSetMemoryOwner >, const QueryMemoryDescriptor &) const
Definition: Execute.cpp:1724

TableUpdateMetadata
Definition: Execute.h:338

Executor::collectAllDeviceResults
ResultSetPtr collectAllDeviceResults(SharedKernelContext &shared_context, const RelAlgExecutionUnit &ra_exe_unit, const QueryMemoryDescriptor &query_mem_desc, const ExecutorDeviceType device_type, std::shared_ptr< RowSetMemoryOwner > row_set_mem_owner)
Definition: Execute.cpp:2715

Executor::getPhysicalColumnDescriptor
const ColumnDescriptor * getPhysicalColumnDescriptor(const Analyzer::ColumnVar *, int) const
Definition: Execute.cpp:716

RowSetMemoryOwner::StringTranslationType
StringTranslationType
Definition: RowSetMemoryOwner.h:70

Executor::CgenStateManager::lock_
std::lock_guard< std::mutex > lock_
Definition: Execute.h:1497

Executor::unregisterActiveModule
static void unregisterActiveModule(const int device_id)
Definition: GpuInterrupt.cpp:30

QuerySessionStatus::RUNNING_IMPORTER
Definition: Execute.h:100

StringConstInResultSet
Definition: Execute.h:325

Executor::compileWorkUnit
std::tuple< CompilationResult, std::unique_ptr< QueryMemoryDescriptor > > compileWorkUnit(const std::vector< InputTableInfo > &query_infos, const PlanState::DeletedColumnsMap &deleted_cols_map, const RelAlgExecutionUnit &ra_exe_unit, const CompilationOptions &co, const ExecutionOptions &eo, const CudaMgr_Namespace::CudaMgr *cuda_mgr, const bool allow_lazy_fetch, std::shared_ptr< RowSetMemoryOwner >, const size_t max_groups_buffer_entry_count, const int8_t crt_min_byte_width, const bool has_cardinality_estimation, ColumnCacheMap &column_cache, RenderInfo *render_info=nullptr)
Definition: NativeCodegen.cpp:2816

Executor::table_id_to_node_map_
TableIdToNodeMap table_id_to_node_map_
Definition: Execute.h:1560

Executor::compileBody
bool compileBody(const RelAlgExecutionUnit &ra_exe_unit, GroupByAndAggregate &group_by_and_aggregate, QueryMemoryDescriptor &query_mem_desc, const CompilationOptions &co, const GpuSharedMemoryContext &gpu_smem_context={})
Definition: NativeCodegen.cpp:3347

HashTableBuildDagMap
std::unordered_map< size_t, HashTableBuildDag > HashTableBuildDagMap
Definition: RelAlgExecutionUnit.h:87

QueryMustRunOnCpu
Definition: Execute.h:313

Executor::set_executor_resource_pool_resource
static void set_executor_resource_pool_resource(const ExecutorResourceMgr_Namespace::ResourceType resource_type, const size_t resource_quantity)
Definition: Execute.cpp:5456

get_arg_by_name
llvm::Value * get_arg_by_name(llvm::Function *func, const std::string &name)
Definition: Execute.h:168

LLVMValueVector
std::vector< llvm::Value * > LLVMValueVector
Definition: Execute.h:380

Executor::logSystemCPUMemoryStatus
void logSystemCPUMemoryStatus(std::string const &tag, size_t const thread_idx) const
Definition: Execute.cpp:765

get_context_count
size_t get_context_count(const ExecutorDeviceType device_type, const size_t cpu_count, const size_t gpu_count)
Definition: Execute.cpp:1766

UpdateLogForFragment::getEntryAt
std::vector< TargetValue > getEntryAt(const size_t index) const override
Definition: ExecuteUpdate.cpp:35

SQLTypeInfo::get_logical_size
int get_logical_size() const
Definition: sqltypes.h:421

UpdateLogForFragment::getFragmentId
decltype(FragmentInfoType::fragmentId) const getFragmentId() const
Definition: Execute.h:364

Executor::deviceCycles
int64_t deviceCycles(int milliseconds) const
Definition: Execute.cpp:4396

Executor::generatePTX
std::string generatePTX(const std::string &) const
Definition: NativeCodegen.cpp:1540

Fragmenter_Namespace::FragmentInfo::fragmentId
int fragmentId
Definition: Fragmenter.h:128

TableGenerations
Definition: TableGenerations.h:29

Executor::prepareRangeModeFuncArgs
std::vector< llvm::Value * > prepareRangeModeFuncArgs(bool for_start_bound, const Analyzer::WindowFrame *frame_bound, bool is_timestamp_type_frame, llvm::Value *order_key_null_val, const WindowFrameBoundFuncArgs &frame_args) const
Definition: WindowFunctionIR.cpp:875

Executor::str_dict_mutex_
std::mutex str_dict_mutex_
Definition: Execute.h:1545

SQLTypeInfo::is_integer
bool is_integer() const
Definition: sqltypes.h:567

Executor::JoinHashTableOrError::fail_reason
std::string fail_reason
Definition: Execute.h:1237

Executor::PendingExecutionClosure
friend class PendingExecutionClosure
Definition: Execute.h:1651

RenderInfo
Definition: RenderInfo.h:31

get_column_descriptor_maybe
const ColumnDescriptor * get_column_descriptor_maybe(const shared::ColumnKey &column_key)
Definition: Execute.h:241

UpdateLogForFragment
Definition: Execute.h:343

Executor::getTableInfo
Fragmenter_Namespace::TableInfo getTableInfo(const shared::TableKey &table_key) const
Definition: Execute.cpp:736

Executor::reduceMultiDeviceResults
ResultSetPtr reduceMultiDeviceResults(const RelAlgExecutionUnit &, std::vector< std::pair< ResultSetPtr, std::vector< size_t >>> &all_fragment_results, std::shared_ptr< RowSetMemoryOwner >, const QueryMemoryDescriptor &) const
Definition: Execute.cpp:1589

Executor::getFirstOrderColTypeInfo
const SQLTypeInfo getFirstOrderColTypeInfo(WindowFunctionContext *window_func_context) const
Definition: WindowFunctionIR.cpp:732

Executor::set_concurrent_resource_grant_policy
static void set_concurrent_resource_grant_policy(const ExecutorResourceMgr_Namespace::ConcurrentResourceGrantPolicy &concurrent_resource_grant_policy)
Definition: Execute.cpp:5477

Executor::debug_file_
const std::string debug_file_
Definition: Execute.h:1556

ColumnFetcher
Definition: ColumnFetcher.h:49

foreign_storage::populate_string_dictionary
void populate_string_dictionary(int32_t table_id, int32_t col_id, int32_t db_id)
Definition: Execute.cpp:237

StringDictionaryProxy::TranslationMap
Definition: StringDictionaryProxy.h:89

UpdateLogForFragment::getPhysicalTableId
decltype(FragmentInfoType::physicalTableId) const getPhysicalTableId() const
Definition: Execute.h:361

Executor::row_set_mem_owner_
std::shared_ptr< RowSetMemoryOwner > row_set_mem_owner_
Definition: Execute.h:1533

Fragmenter_Namespace::FragmentInfo
Used by Fragmenter classes to store info about each fragment - the fragment id and number of tuples(r...
Definition: Fragmenter.h:86

Executor::setColRangeCache
void setColRangeCache(const AggregatedColRange &aggregated_col_range)
Definition: Execute.h:1329

ExpressionRange
Definition: ExpressionRange.h:57

Executor::containsLeftDeepOuterJoin
bool containsLeftDeepOuterJoin() const
Definition: Execute.h:614

Executor::latest_query_plan_extracted_
static QueryPlanDAG latest_query_plan_extracted_
Definition: Execute.h:1612

Executor::addToCardinalityCache
void addToCardinalityCache(const CardinalityCacheKey &cache_key, const size_t cache_value)
Definition: Execute.cpp:5289

Logger.h

Executor::executePlanWithGroupBy
int32_t executePlanWithGroupBy(const RelAlgExecutionUnit &ra_exe_unit, const CompilationResult &, const bool hoist_literals, ResultSetPtr *results, const ExecutorDeviceType device_type, std::vector< std::vector< const int8_t * >> &col_buffers, const std::vector< size_t > outer_tab_frag_ids, QueryExecutionContext *, const std::vector< std::vector< int64_t >> &num_rows, const std::vector< std::vector< uint64_t >> &frag_offsets, Data_Namespace::DataMgr *, const int device_id, const shared::TableKey &outer_table_key, const int64_t limit, const uint32_t start_rowid, const uint32_t num_tables, const bool allow_runtime_interrupt, RenderInfo *render_info, const bool optimize_cuda_block_and_grid_sizes, const int64_t rows_to_process=-1)
Definition: Execute.cpp:4061

Executor::getNumCurentSessionsEnrolled
size_t getNumCurentSessionsEnrolled() const
Definition: Execute.cpp:5115

Executor::ExtModuleKinds::template_module

Executor::has_rt_module
bool has_rt_module() const
Definition: Execute.h:552

get_index_by_name
unsigned get_index_by_name(llvm::Function *func, const std::string &name)
Definition: Execute.h:187

QueryMustRunOnCpu::QueryMustRunOnCpu
QueryMustRunOnCpu()
Definition: Execute.h:315

LruCache.h

Executor::optimizeAndCodegenCPU
std::shared_ptr< CompilationContext > optimizeAndCodegenCPU(llvm::Function *, llvm::Function *, const std::unordered_set< llvm::Function * > &, const CompilationOptions &)
Definition: NativeCodegen.cpp:487

get_column_descriptor
const ColumnDescriptor * get_column_descriptor(const shared::ColumnKey &column_key)
Definition: Execute.h:213

Executor::codegenWindowFrameBounds
std::pair< llvm::Value *, llvm::Value * > codegenWindowFrameBounds(WindowFunctionContext *window_func_context, const Analyzer::WindowFrame *frame_start_bound, const Analyzer::WindowFrame *frame_end_bound, llvm::Value *order_key_col_null_val_lv, WindowFrameBoundFuncArgs &args, CodeGenerator &code_generator)
Definition: WindowFunctionIR.cpp:1080

SQLTypeInfo::is_timeinterval
bool is_timeinterval() const
Definition: sqltypes.h:594

Data_Namespace::MemoryLevel
MemoryLevel
Definition: MemoryLevel.h:21

Analyzer::UOper
Definition: Analyzer.h:375

Executor::getCachedCardinality
CachedCardinality getCachedCardinality(const CardinalityCacheKey &cache_key)
Definition: Execute.cpp:5298

Executor::queries_interrupt_flag_
static InterruptFlagMap queries_interrupt_flag_
Definition: Execute.h:1578

DbObjectKeys.h

UpdateLogForFragment::getFragmentInfo
FragmentInfoType const & getFragmentInfo() const
Definition: ExecuteUpdate.cpp:48

heavyai::unique_lock
std::unique_lock< T > unique_lock
Definition: heavyai_shared_mutex.h:39

Executor::plan_state_
std::unique_ptr< PlanState > plan_state_
Definition: Execute.h:1532

Executor::initializeNVPTXBackend
void initializeNVPTXBackend() const
Definition: NativeCodegen.cpp:1545

Executor::get_concurrent_resource_grant_policy
static const ExecutorResourceMgr_Namespace::ConcurrentResourceGrantPolicy get_concurrent_resource_grant_policy(const ExecutorResourceMgr_Namespace::ResourceType resource_type)
Definition: Execute.cpp:5467

TableToFragmentIds
std::map< int32_t, std::set< int32_t >> TableToFragmentIds
Definition: Execute.h:336

QuerySessionStatus::submitted_time_
const std::string submitted_time_
Definition: Execute.h:145

RegisteredQueryHint
Definition: QueryHint.h:190

Executor::executeTableFunction
ResultSetPtr executeTableFunction(const TableFunctionExecutionUnit exe_unit, const std::vector< InputTableInfo > &table_infos, const CompilationOptions &co, const ExecutionOptions &eo)
Compiles and dispatches a table function; that is, a function that takes as input one or more columns...
Definition: Execute.cpp:2445

Executor::castToFP
llvm::Value * castToFP(llvm::Value *, SQLTypeInfo const &from_ti, SQLTypeInfo const &to_ti)
Definition: Execute.cpp:4401

HashJoin.h

UpdateLogForFragment::fragment_index_
size_t fragment_index_
Definition: Execute.h:376

Executor::CachedCardinality
std::pair< bool, size_t > CachedCardinality
Definition: Execute.h:1403

Executor::setupCaching
void setupCaching(const std::unordered_set< PhysicalInput > &phys_inputs, const std::unordered_set< shared::TableKey > &phys_table_keys)
Definition: Execute.cpp:4960

StringDictionaryGenerations.h

Executor::invalidateCardinalityCacheForTable
static void invalidateCardinalityCacheForTable(const shared::TableKey &table_key)
Definition: Execute.cpp:5316

Executor::getColumnDescriptor
const ColumnDescriptor * getColumnDescriptor(const Analyzer::ColumnVar *) const
Definition: Execute.cpp:711

ResultSetRecyclerHolder.h

CardinalityCacheKey::containsTableKey
bool containsTableKey(const shared::TableKey &table_key) const
Definition: Execute.cpp:2020

Executor::checkIsQuerySessionEnrolled
bool checkIsQuerySessionEnrolled(const QuerySessionId &query_session, heavyai::shared_lock< heavyai::shared_mutex > &read_lock)
Definition: Execute.cpp:5265

ColumnDescriptor
specifies the content in-memory of a row in the column metadata table
Definition: ColumnDescriptor.h:33

measure.h

SQLTypeInfo::is_boolean
bool is_boolean() const
Definition: sqltypes.h:582

UpdateLogForFragment::getTranslatedEntryAt
std::vector< TargetValue > getTranslatedEntryAt(const size_t index) const override
Definition: ExecuteUpdate.cpp:39

Executor::executors_
static std::map< int, std::shared_ptr< Executor > > executors_
Definition: Execute.h:1581

Executor::grid_size_x_
unsigned grid_size_x_
Definition: Execute.h:1553

Executor::codegenWindowResetStateControlFlow
std::pair< llvm::BasicBlock *, llvm::Value * > codegenWindowResetStateControlFlow(CodeGenerator *code_generator, const CompilationOptions &co)
Definition: WindowFunctionIR.cpp:299

Executor::getQuerySessionStatus
QuerySessionStatus::QueryStatus getQuerySessionStatus(const QuerySessionId &candidate_query_session, heavyai::shared_lock< heavyai::shared_mutex > &read_lock)
Definition: Execute.cpp:5001

CodeCache.h

TableFunctionExecutionUnit
Definition: RelAlgExecutionUnit.h:209

toString
std::string toString(const Executor::ExtModuleKinds &kind)
Definition: Execute.h:1703

Executor::auto_num_threads
static const size_t auto_num_threads
Definition: Execute.h:1536

Executor::getTemporaryTables
const TemporaryTables * getTemporaryTables()
Definition: Execute.h:573

get_null_check_suffix
std::string get_null_check_suffix(const SQLTypeInfo &lhs_ti, const SQLTypeInfo &rhs_ti)
Definition: Execute.h:1661

shared::ColumnKey
Definition: DbObjectKeys.h:73

Executor::get_rt_module
const std::unique_ptr< llvm::Module > & get_rt_module() const
Definition: Execute.h:532

CardinalityCacheKey::hash
size_t hash() const
Definition: Execute.cpp:2016

CardinalityCacheKey::key
std::string key
Definition: Execute.h:402

Executor::JoinHashTableOrError
Definition: Execute.h:1235

ExecutionOptions
Definition: CompilationOptions.h:68

Chunk.h

PlanState.h

CgenState
Definition: CgenState.h:41

Analyzer::WindowFrame
Definition: Analyzer.h:2820

RUNTIME_EXPORT
#define RUNTIME_EXPORT
Definition: funcannotations.h:77

TooManyLiterals::TooManyLiterals
TooManyLiterals()
Definition: Execute.h:285

Executor::launchKernelsLocked
void launchKernelsLocked(SharedKernelContext &shared_context, std::vector< std::unique_ptr< ExecutionKernel >> &&kernels, const ExecutorDeviceType device_type)
Definition: Execute.cpp:3123

Executor::Executor
Executor(const ExecutorId id, Data_Namespace::DataMgr *data_mgr, const size_t block_size_x, const size_t grid_size_x, const size_t max_gpu_slab_size, const std::string &debug_dir, const std::string &debug_file)
Definition: Execute.cpp:276

Executor::cardinality_cache_
static std::unordered_map< CardinalityCacheKey, size_t > cardinality_cache_
Definition: Execute.h:1607

Executor::dumpCache
std::string dumpCache() const
Definition: Execute.cpp:5520

TableUpdateMetadata::columns_for_metadata_update
ColumnToFragmentsMap columns_for_metadata_update
Definition: Execute.h:339

ExecutionKernel.h

TableIdToNodeMap
std::unordered_map< shared::TableKey, const RelAlgNode * > TableIdToNodeMap
Definition: RelAlgExecutionUnit.h:95

Executor::getExecutorIdsRunningQuery
const std::vector< size_t > getExecutorIdsRunningQuery(const QuerySessionId &interrupt_session) const
Definition: Execute.cpp:5347

Data_Namespace::DataMgr
Definition: DataMgr.h:125

CHECK_LT
#define CHECK_LT(x, y)
Definition: Logger.h:303

Executor::resultsUnion
ResultSetPtr resultsUnion(SharedKernelContext &shared_context, const RelAlgExecutionUnit &ra_exe_unit)
Definition: Execute.cpp:1563

Executor::registerExtractedQueryPlanDag
void registerExtractedQueryPlanDag(const QueryPlanDAG &query_plan_dag)
Definition: Execute.cpp:5376

StringDictionaryProxy.h

UpdateLogForFragment::rs_
std::shared_ptr< ResultSet > rs_
Definition: Execute.h:377

ColumnDescriptor::columnId
int columnId
Definition: ColumnDescriptor.h:35

Executor::buildHashTableForQualifier
JoinHashTableOrError buildHashTableForQualifier(const std::shared_ptr< Analyzer::BinOper > &qual_bin_oper, const std::vector< InputTableInfo > &query_infos, const MemoryLevel memory_level, const JoinType join_type, const HashType preferred_hash_type, ColumnCacheMap &column_cache, const HashTableBuildDagMap &hashtable_build_dag_map, const RegisteredQueryHint &query_hint, const TableIdToNodeMap &table_id_to_node_map)
Definition: Execute.cpp:4309

Executor::getCurrentQuerySession
QuerySessionId & getCurrentQuerySession(heavyai::shared_lock< heavyai::shared_mutex > &read_lock)
Definition: Execute.cpp:4986

Executor::getFragmentCount
std::vector< size_t > getFragmentCount(const FragmentsList &selected_fragments, const size_t scan_idx, const RelAlgExecutionUnit &ra_exe_unit)
Definition: Execute.cpp:3760

Executor::codegenLoadCurrentValueFromColBuf
llvm::Value * codegenLoadCurrentValueFromColBuf(WindowFunctionContext *window_func_context, CodeGenerator &code_generator, WindowFrameBoundFuncArgs &args) const
Definition: WindowFunctionIR.cpp:753

Executor::addUdfIrToModule
static void addUdfIrToModule(const std::string &udf_ir_filename, const bool is_cuda_ir)
Definition: NativeCodegen.cpp:1956

Executor::codegenSkipDeletedOuterTableRow
llvm::BasicBlock * codegenSkipDeletedOuterTableRow(const RelAlgExecutionUnit &ra_exe_unit, const CompilationOptions &co)
Definition: NativeCodegen.cpp:3311

QueryCompilationDescriptorOwned
std::unique_ptr< QueryCompilationDescriptor > QueryCompilationDescriptorOwned
Definition: Execute.h:83

AggregatedColRange
Definition: AggregatedColRange.h:31

Executor::ExecutorId
size_t ExecutorId
Definition: Execute.h:422

Executor::setGridSize
void setGridSize(unsigned grid_size)
Definition: Execute.cpp:4376

SQLTypeInfo::get_compression
HOST DEVICE EncodingType get_compression() const
Definition: sqltypes.h:399

Executor::codegenWindowAvgEpilogue
void codegenWindowAvgEpilogue(CodeGenerator *code_generator, const CompilationOptions &co, llvm::Value *crt_val, llvm::Value *window_func_null_val)
Definition: WindowFunctionIR.cpp:1466

Executor::buildCurrentLevelHashTable
std::shared_ptr< HashJoin > buildCurrentLevelHashTable(const JoinCondition &current_level_join_conditions, size_t level_idx, RelAlgExecutionUnit &ra_exe_unit, const CompilationOptions &co, const std::vector< InputTableInfo > &query_infos, ColumnCacheMap &column_cache, std::vector< std::string > &fail_reasons)
Definition: IRCodegen.cpp:1027

Executor::getOrderKeyTypeName
const std::string getOrderKeyTypeName(WindowFunctionContext *window_func_context) const
Definition: WindowFunctionIR.cpp:743

Executor::recycler_mutex_
static heavyai::shared_mutex recycler_mutex_
Definition: Execute.h:1605

Executor::update_after_registration
static void update_after_registration(bool update_runtime_modules_only=false)
Definition: Execute.h:1420

Executor::serializeLiterals
std::vector< int8_t > serializeLiterals(const std::unordered_map< int, CgenState::LiteralValues > &literals, const int device_id)
Definition: Execute.cpp:1060

shared::ColumnKey::db_id
int32_t db_id
Definition: DbObjectKeys.h:90

Executor::optimizeAndCodegenGPU
std::shared_ptr< CompilationContext > optimizeAndCodegenGPU(llvm::Function *, llvm::Function *, std::unordered_set< llvm::Function * > &, const bool no_inline, const CudaMgr_Namespace::CudaMgr *cuda_mgr, const bool is_gpu_smem_used, const CompilationOptions &)
Definition: NativeCodegen.cpp:1395

Executor::input_table_info_cache_
InputTableInfoCache input_table_info_cache_
Definition: Execute.h:1571

Executor::getNumBytesForFetchedRow
size_t getNumBytesForFetchedRow(const std::set< shared::TableKey > &table_keys_to_fetch) const

TableGeneration
Definition: TableGenerations.h:24

Executor::setBlockSize
void setBlockSize(unsigned block_size)
Definition: Execute.cpp:4384

Analyzer::UOper::get_operand
const Expr * get_operand() const
Definition: Analyzer.h:384

QueryMemoryInitializer
Definition: QueryMemoryInitializer.h:35

Executor::CgenStateManager::lock_queue_clock_
std::chrono::steady_clock::time_point lock_queue_clock_
Definition: Execute.h:1496

Executor::codegenConditionalAggregateCondValSelector
llvm::Value * codegenConditionalAggregateCondValSelector(llvm::Value *cond_lv, SQLAgg const aggKind, CompilationOptions const &co) const
Definition: WindowFunctionIR.cpp:1577

Executor::skipFragment
std::pair< bool, int64_t > skipFragment(const InputDescriptor &table_desc, const Fragmenter_Namespace::FragmentInfo &frag_info, const std::list< std::shared_ptr< Analyzer::Expr >> &simple_quals, const std::vector< uint64_t > &frag_offsets, const size_t frag_idx)
Definition: Execute.cpp:4658

Executor::codegenFrameBoundRange
std::pair< llvm::Value *, llvm::Value * > codegenFrameBoundRange(const Analyzer::WindowFunction *window_func, CodeGenerator &code_generator, const CompilationOptions &co)
Definition: WindowFunctionIR.cpp:1065

Analyzer::ArrayExpr
Definition: Analyzer.h:3009

Executor::gridSize
unsigned gridSize() const
Definition: Execute.cpp:4352

ColumnCacheMap
std::unordered_map< shared::TableKey, std::unordered_map< int, std::shared_ptr< const ColumnarResults >>> ColumnCacheMap
Definition: ColumnarResults.h:214

Executor::spillDoubleElement
llvm::Value * spillDoubleElement(llvm::Value *elem_val, llvm::Type *elem_ty)
Definition: MaxwellCodegenPatch.cpp:19

Executor::computeTableGenerations
TableGenerations computeTableGenerations(const std::unordered_set< shared::TableKey > &phys_table_keys)
Definition: Execute.cpp:4948

Executor::KernelSubtask
friend class KernelSubtask
Definition: Execute.h:1635

Executor::getPlanStatePtr
PlanState * getPlanStatePtr() const
Definition: Execute.h:1415

kUNNEST
Definition: sqldefs.h:53

Executor::extension_module_sources
static std::map< ExtModuleKinds, std::string > extension_module_sources
Definition: Execute.h:528

Executor::computeStringDictionaryGenerations
StringDictionaryGenerations computeStringDictionaryGenerations(const std::unordered_set< PhysicalInput > &phys_inputs)
Definition: Execute.cpp:4922

Executor::block_size_x_
unsigned block_size_x_
Definition: Execute.h:1552

Executor::has_udf_module
bool has_udf_module(bool is_gpu=false) const
Definition: Execute.h:555

Executor::getDataMgr
Data_Namespace::DataMgr * getDataMgr() const
Definition: Execute.h:623

Executor::needLinearizeAllFragments
bool needLinearizeAllFragments(const ColumnDescriptor *cd, const InputColDescriptor &inner_col_desc, const RelAlgExecutionUnit &ra_exe_unit, const FragmentsList &selected_fragments, const Data_Namespace::MemoryLevel memory_level) const
Definition: Execute.cpp:3435

QuerySessionStatus::setExecutorId
void setExecutorId(const size_t executor_id)
Definition: Execute.h:139

Executor::codegenWindowFunctionAggregate
llvm::Value * codegenWindowFunctionAggregate(CodeGenerator *code_generator, const CompilationOptions &co)
Definition: WindowFunctionIR.cpp:265

Type
Type
Definition: ResultSetReductionOps.h:33

SystemParameters.h

Executor::context_
std::unique_ptr< llvm::LLVMContext > context_
Definition: Execute.h:1477

Executor::codegenCurrentPartitionIndex
llvm::Value * codegenCurrentPartitionIndex(const WindowFunctionContext *window_func_context, CodeGenerator *code_generator, const CompilationOptions &co, llvm::Value *current_row_pos_lv)
Definition: WindowFunctionIR.cpp:781

Executor::getCgenStatePtr
CgenState * getCgenStatePtr() const
Definition: Execute.h:1414

UpdateLogForFragment::fragment_info_
FragmentInfoType const & fragment_info_
Definition: Execute.h:375

Executor::nukeOldState
void nukeOldState(const bool allow_lazy_fetch, const std::vector< InputTableInfo > &query_infos, const PlanState::DeletedColumnsMap &deleted_cols_map, const RelAlgExecutionUnit *ra_exe_unit)
Definition: Execute.cpp:4268

Executor::executor_session_mutex_
static heavyai::shared_mutex executor_session_mutex_
Definition: Execute.h:1574

Executor::GroupColLLVMValue
Definition: Execute.h:1273

QuerySessionStatus::getQueryStr
const std::string getQueryStr()
Definition: Execute.h:132

Executor::skipFragmentInnerJoins
std::pair< bool, int64_t > skipFragmentInnerJoins(const InputDescriptor &table_desc, const RelAlgExecutionUnit &ra_exe_unit, const Fragmenter_Namespace::FragmentInfo &fragment, const std::vector< uint64_t > &frag_offsets, const size_t frag_idx)
Definition: Execute.cpp:4861

Executor::buildSelectedFragsMapping
void buildSelectedFragsMapping(std::vector< std::vector< size_t >> &selected_fragments_crossjoin, std::vector< size_t > &local_col_to_frag_pos, const std::list< std::shared_ptr< const InputColDescriptor >> &col_global_ids, const FragmentsList &selected_fragments, const RelAlgExecutionUnit &ra_exe_unit)
Definition: Execute.cpp:3774

Executor::table_generations_
TableGenerations table_generations_
Definition: Execute.h:1573

Executor::codegenWindowNavigationFunctionOnFrame
llvm::Value * codegenWindowNavigationFunctionOnFrame(const CompilationOptions &co)
Definition: WindowFunctionIR.cpp:392

StringConstInResultSet::StringConstInResultSet
StringConstInResultSet()
Definition: Execute.h:327

hash_value
std::size_t hash_value(RexAbstractInput const &rex_ab_input)
Definition: RelAlgDag.cpp:3548

Executor::PerFragmentCallBack
std::function< void(ResultSetPtr, const Fragmenter_Namespace::FragmentInfo &)> PerFragmentCallBack
Definition: Execute.h:890

Executor::resetInterrupt
void resetInterrupt()
Definition: GpuInterrupt.cpp:216

InputTableInfoCache
Definition: InputMetadata.h:38

QuerySessionStatus::getExecutorId
const size_t getExecutorId()
Definition: Execute.h:133

Analyzer::BinOper
Definition: Analyzer.h:433

QuerySessionStatus::executor_id_
size_t executor_id_
Definition: Execute.h:143

CommandLineOptions.h

Executor::codegenFrameBoundExpr
llvm::Value * codegenFrameBoundExpr(const Analyzer::WindowFunction *window_func, const Analyzer::WindowFrame *frame_bound, CodeGenerator &code_generator, const CompilationOptions &co)
Definition: WindowFunctionIR.cpp:598

Executor::buildSelectedFragsMappingForUnion
void buildSelectedFragsMappingForUnion(std::vector< std::vector< size_t >> &selected_fragments_crossjoin, const FragmentsList &selected_fragments, const RelAlgExecutionUnit &ra_exe_unit)
Definition: Execute.cpp:3805

TableGenerations.h

Executor::registerExtensionFunctions
static void registerExtensionFunctions(F register_extension_functions)
Definition: Execute.h:470

QuerySessionId
std::string QuerySessionId
Definition: Execute.h:86

Executor::addJoinLoopIterator
llvm::Value * addJoinLoopIterator(const std::vector< llvm::Value * > &prev_iters, const size_t level_idx)
Definition: IRCodegen.cpp:1186

Executor::reduceMultiDeviceResultSets
ResultSetPtr reduceMultiDeviceResultSets(std::vector< std::pair< ResultSetPtr, std::vector< size_t >>> &all_fragment_results, std::shared_ptr< RowSetMemoryOwner >, const QueryMemoryDescriptor &) const
Definition: Execute.cpp:1664

Analyzer::Constant
Definition: Analyzer.h:319

Executor::getUniqueThreadSharedResultSets
std::vector< std::pair< ResultSetPtr, std::vector< size_t > > > getUniqueThreadSharedResultSets(const std::vector< std::pair< ResultSetPtr, std::vector< size_t >>> &results_per_device) const
Definition: Execute.cpp:1624

BaselineJoinHashTable
Definition: BaselineJoinHashTable.h:49

CHECK
#define CHECK(condition)
Definition: Logger.h:291

Executor::getQueryPlanDagCache
QueryPlanDagCache & getQueryPlanDagCache()
Definition: Execute.cpp:4974

SQLTypeInfo
Definition: sqltypes.h:332

FetchResult
Definition: ColumnFetcher.h:41

Executor::has_extension_module
bool has_extension_module(ExtModuleKinds kind) const
Definition: Execute.h:1513

TargetExprCodegen
Definition: TargetExprBuilder.h:33

Executor::getColumnByteWidthMap
std::map< shared::ColumnKey, size_t > getColumnByteWidthMap(const std::set< shared::TableKey > &table_ids_to_fetch, const bool include_lazy_fetched_cols) const
Definition: Execute.cpp:819

Executor::codegenLoadPartitionBuffers
WindowPartitionBufferPtrs codegenLoadPartitionBuffers(WindowFunctionContext *window_func_context, CodeGenerator *code_generator, const CompilationOptions &co, llvm::Value *partition_index_lv) const
Definition: WindowFunctionIR.cpp:976

Executor::resetBlockSize
void resetBlockSize()
Definition: Execute.cpp:4388

Executor::ExecutorMutexHolder::shared_lock
heavyai::shared_lock< heavyai::shared_mutex > shared_lock
Definition: Execute.h:1588

Executor::clearExternalCaches
static void clearExternalCaches(bool for_update, const TableDescriptor *td, const int current_db_id)
Definition: Execute.h:438

Executor::CgenStateManager::CgenStateManager
CgenStateManager(Executor &executor)
Definition: Execute.cpp:438

Executor::ExtModuleKinds::rt_libdevice_module

funcannotations.h

CompilationOptions.h

CardinalityCacheKey
Definition: Execute.h:392

Executor::compilation_mutex_
std::mutex compilation_mutex_
Definition: Execute.h:1618

CompilationRetryNewScanLimit::new_scan_limit_
size_t new_scan_limit_
Definition: Execute.h:280

Executor::interrupt
void interrupt(const QuerySessionId &query_session="", const QuerySessionId &interrupt_session="")
Definition: GpuInterrupt.cpp:42

Executor::getDataRecyclerLock
heavyai::shared_mutex & getDataRecyclerLock()
Definition: Execute.cpp:4970

Executor::has_rt_udf_module
bool has_rt_udf_module(bool is_gpu=false) const
Definition: Execute.h:559

Executor::pause_executor_queue
static void pause_executor_queue()
Definition: Execute.cpp:5420

Executor::inlineHoistedLiterals
std::vector< llvm::Value * > inlineHoistedLiterals()
Definition: NativeCodegen.cpp:2373

LeafAggregator
Definition: LeafAggregator.h:36

Executor::FetchCacheAnchor::~FetchCacheAnchor
~FetchCacheAnchor()
Definition: Execute.h:1523

Executor::getBaselineThreshold
static size_t getBaselineThreshold(bool for_count_distinct, ExecutorDeviceType device_type)
Definition: Execute.h:1448

Executor::getDeviceTypeForTargets
ExecutorDeviceType getDeviceTypeForTargets(const RelAlgExecutionUnit &ra_exe_unit, const ExecutorDeviceType requested_device_type)
Definition: Execute.cpp:2575

Executor::invalidateRunningQuerySession
void invalidateRunningQuerySession(heavyai::unique_lock< heavyai::shared_mutex > &write_lock)
Definition: Execute.cpp:5013

Fragmenter_Namespace::RowDataProvider
Definition: AbstractFragmenter.h:66

Executor::codegenLoadOrderKeyBufPtr
std::pair< std::string, llvm::Value * > codegenLoadOrderKeyBufPtr(WindowFunctionContext *window_func_context, CodeGenerator *code_generator, const CompilationOptions &co) const
Definition: WindowFunctionIR.cpp:948

Fragmenter_Namespace::TableInfo
Definition: Fragmenter.h:156

ExecutorResourceMgr_Namespace::ExecutorResourceMgr
ExecutorResourceMgr is the central manager for resources available to all executors in the system...
Definition: ExecutorResourceMgr.h:137

log2_bytes
uint32_t log2_bytes(const uint32_t bytes)
Definition: Execute.h:198

Executor::getColRange
ExpressionRange getColRange(const PhysicalInput &) const
Definition: Execute.cpp:746

numeric_type_name
std::string numeric_type_name(const SQLTypeInfo &ti)
Definition: Execute.h:230

Executor::attachExecutorToQuerySession
CurrentQueryStatus attachExecutorToQuerySession(const QuerySessionId &query_session_id, const std::string &query_str, const std::string &query_submitted_time)
Definition: Execute.cpp:5018

StringDictionaryTranslationMgr
Definition: StringDictionaryTranslationMgr.h:48

InputTableInfo
Definition: InputMetadata.h:33

QueryCompilationDescriptor
Definition: QueryCompilationDescriptor.h:53

Executor::skipFragmentPair
bool skipFragmentPair(const Fragmenter_Namespace::FragmentInfo &outer_fragment_info, const Fragmenter_Namespace::FragmentInfo &inner_fragment_info, const int inner_table_id, const std::unordered_map< shared::TableKey, const Analyzer::BinOper * > &inner_table_id_to_join_condition, const RelAlgExecutionUnit &ra_exe_unit, const ExecutorDeviceType device_type)
Definition: Execute.cpp:3278

Executor::redeclareFilterFunction
void redeclareFilterFunction()
Definition: IRCodegen.cpp:1087

kENCODING_DICT
Definition: sqltypes.h:245

ColumnDescriptor::columnType
SQLTypeInfo columnType
Definition: ColumnDescriptor.h:38

QuerySessionStatus::QueryStatus
QueryStatus
Definition: Execute.h:94

QuerySessionStatus::QuerySessionStatus
QuerySessionStatus(const QuerySessionId &query_session, const size_t executor_id, const std::string &query_str, const std::string &submitted_time, const QuerySessionStatus::QueryStatus &query_status)
Definition: Execute.h:120

Executor::launchKernelsViaResourceMgr
void launchKernelsViaResourceMgr(SharedKernelContext &shared_context, std::vector< std::unique_ptr< ExecutionKernel >> &&kernels, const ExecutorDeviceType device_type, const std::vector< InputDescriptor > &input_descs, const QueryMemoryDescriptor &query_mem_desc)
Launches a vector of kernels for a given query step, gated/scheduled by ExecutorResourceMgr.
Definition: Execute.cpp:3135

UpdateLogForFragment::UpdateLogForFragment
UpdateLogForFragment(FragmentInfoType const &fragment_info, size_t const, const std::shared_ptr< ResultSet > &rs)
Definition: ExecuteUpdate.cpp:28

is_unnest
bool is_unnest(const Analyzer::Expr *expr)
Definition: Execute.h:1677

Executor::UNITARY_EXECUTOR_ID
static constexpr ExecutorId UNITARY_EXECUTOR_ID
Definition: Execute.h:423

PhysicalInput
Definition: QueryPhysicalInputsCollector.h:31

SQLTypeInfo::is_string
bool is_string() const
Definition: sqltypes.h:561

Executor::getTableGeneration
const TableGeneration & getTableGeneration(const shared::TableKey &table_key) const
Definition: Execute.cpp:741

TableDescriptor
Definition: TableDescriptor.h:43

SharedKernelContext
Definition: ExecutionKernel.h:29

Executor::buildJoinLoops
std::vector< JoinLoop > buildJoinLoops(RelAlgExecutionUnit &ra_exe_unit, const CompilationOptions &co, const ExecutionOptions &eo, const std::vector< InputTableInfo > &query_infos, ColumnCacheMap &column_cache)
Definition: IRCodegen.cpp:610

Executor::buildIsDeletedCb
std::function< llvm::Value *(const std::vector< llvm::Value * > &, llvm::Value *)> buildIsDeletedCb(const RelAlgExecutionUnit &ra_exe_unit, const size_t level_idx, const CompilationOptions &co)
Definition: IRCodegen.cpp:968

UpdateLogForFragment::getResultSet
auto getResultSet() const
Definition: Execute.h:372

Executor::blockSize
unsigned blockSize() const
Definition: Execute.cpp:4366

setup.name
string name
Definition: setup.in.py:72

heavyai::shared_mutex
std::shared_timed_mutex shared_mutex
Definition: heavyai_shared_mutex.h:31

Executor::register_runtime_extension_functions_mutex_
static std::mutex register_runtime_extension_functions_mutex_
Definition: Execute.h:1623

ExecutorResourceMgr_Namespace::ChunkRequestInfo
Specifies all DataMgr chunks needed for a query step/request, along with their sizes in bytes...
Definition: ResourceRequest.h:34

Executor::getOrderKeySize
size_t getOrderKeySize(WindowFunctionContext *window_func_context) const
Definition: WindowFunctionIR.cpp:738

Executor::buildHoistLeftHandSideFiltersCb
JoinLoop::HoistedFiltersCallback buildHoistLeftHandSideFiltersCb(const RelAlgExecutionUnit &ra_exe_unit, const size_t level_idx, const shared::TableKey &inner_table_key, const CompilationOptions &co)
Definition: IRCodegen.cpp:859

RelAlgExecutionUnit.h
Execution unit for relational algebra. It&#39;s a low-level description of any relational algebra operati...

SQLTypeInfo::get_notnull
HOST DEVICE bool get_notnull() const
Definition: sqltypes.h:398

Executor::getExecutorId
ExecutorId getExecutorId() const
Definition: Execute.h:1332

Executor::FetchCacheAnchor::cgen_state_
CgenState * cgen_state_
Definition: Execute.h:1526

Executor::align
static size_t align(const size_t off_in, const size_t alignment)
Definition: Execute.h:1468

Executor::executors_cache_mutex_
static heavyai::shared_mutex executors_cache_mutex_
Definition: Execute.h:1602

toString.h

QueryMemoryDescriptorOwned
std::unique_ptr< QueryMemoryDescriptor > QueryMemoryDescriptorOwned
Definition: Execute.h:85

UpdateLogForFragment::getRowCount
size_t const getRowCount() const override
Definition: ExecuteUpdate.cpp:44

CardinalityCacheKey::operator==
bool operator==(const CardinalityCacheKey &other) const
Definition: Execute.cpp:2012

QuerySessionStatus::getQuerySession
const QuerySessionId getQuerySession()
Definition: Execute.h:131

Executor::clearQuerySessionStatus
void clearQuerySessionStatus(const QuerySessionId &query_session, const std::string &submitted_time_str)
Definition: Execute.cpp:5061

Executor::codegenAggregateWindowState
llvm::Value * codegenAggregateWindowState(CodeGenerator *code_generator, const CompilationOptions &co, llvm::Value *aggregate_state)
Definition: WindowFunctionIR.cpp:1510

QuerySessionStatus::query_status_
QuerySessionStatus::QueryStatus query_status_
Definition: Execute.h:152

shared::TableKey
Definition: DbObjectKeys.h:51

CartesianProduct.h

SQLTypeInfo::is_decimal
bool is_decimal() const
Definition: sqltypes.h:570

Fragmenter_Namespace::FragmentInfo::physicalTableId
int physicalTableId
Definition: Fragmenter.h:131

Executor::setQuerySessionAsInterrupted
void setQuerySessionAsInterrupted(const QuerySessionId &query_session, heavyai::unique_lock< heavyai::shared_mutex > &write_lock)
Definition: Execute.cpp:5243

INVALID
Definition: Execute.h:164

Executor::ExtModuleKinds::rt_udf_cpu_module

Executor::deviceCountForMemoryLevel
int deviceCountForMemoryLevel(const Data_Namespace::MemoryLevel memory_level) const
Definition: Execute.cpp:1330

Executor::get_executor_resource_pool_total_resource_quantity
static size_t get_executor_resource_pool_total_resource_quantity(const ExecutorResourceMgr_Namespace::ResourceType resource_type)
Definition: Execute.cpp:5438

Executor::ExtModuleKinds::rt_geos_module

Executor::executeWorkUnitImpl
ResultSetPtr executeWorkUnitImpl(size_t &max_groups_buffer_entry_guess, const bool is_agg, const bool allow_single_frag_table_opt, const std::vector< InputTableInfo > &, const RelAlgExecutionUnit &, const CompilationOptions &, const ExecutionOptions &options, std::shared_ptr< RowSetMemoryOwner >, RenderInfo *render_info, const bool has_cardinality_estimation, ColumnCacheMap &column_cache)
Definition: Execute.cpp:2166

Executor::getQuerySessionInfo
std::vector< QuerySessionStatus > getQuerySessionInfo(const QuerySessionId &query_session, heavyai::shared_lock< heavyai::shared_mutex > &read_lock)
Definition: Execute.cpp:5329

QueryFragmentDescriptor.h
Descriptor for the fragments required for an execution kernel.

Executor::codegenWindowFunctionAggregateCalls
llvm::Value * codegenWindowFunctionAggregateCalls(llvm::Value *aggregate_state, const CompilationOptions &co)
Definition: WindowFunctionIR.cpp:1129

UpdateLogForFragment::FragmentInfoType
Fragmenter_Namespace::FragmentInfo FragmentInfoType
Definition: Execute.h:345

shared::ColumnKey::table_id
int32_t table_id
Definition: DbObjectKeys.h:91

Executor::getArenaBlockSize
static size_t getArenaBlockSize()
Definition: Execute.cpp:562

shared::StringDictKey
Definition: DbObjectKeys.h:28

Executor::getStringProxyNumericTranslationMap
const StringDictionaryProxy::TranslationMap< Datum > * getStringProxyNumericTranslationMap(const shared::StringDictKey &source_dict_key, const std::vector< StringOps_Namespace::StringOpInfo > &string_op_infos, std::shared_ptr< RowSetMemoryOwner > row_set_mem_owner, const bool with_generation) const
Definition: Execute.cpp:640

Executor::gpu_exec_mutex_
std::mutex gpu_exec_mutex_[max_gpu_count]
Definition: Execute.h:1537

HashType
HashType
Definition: HashTable.h:19

Executor::ExtModuleKinds::udf_gpu_module

DiamondCodegen
Definition: DiamondCodegen.h:30

ResultSetRecyclerHolder
Definition: ResultSetRecyclerHolder.h:22

Executor::getContext
llvm::LLVMContext & getContext()
Definition: Execute.h:1417

Executor::codegenWindowFunction
llvm::Value * codegenWindowFunction(const size_t target_index, const CompilationOptions &co)
Definition: WindowFunctionIR.cpp:22

TableDescriptor::getTableChunkKey
std::vector< int > getTableChunkKey(const int getCurrentDBId) const
Definition: TableDescriptor.h:105

Executor::addToQuerySessionList
bool addToQuerySessionList(const QuerySessionId &query_session, const std::string &query_str, const std::string &submitted, const size_t executor_id, const QuerySessionStatus::QueryStatus query_status, heavyai::unique_lock< heavyai::shared_mutex > &write_lock)
Definition: Execute.cpp:5120

Analyzer::UOper::get_optype
SQLOps get_optype() const
Definition: Analyzer.h:383

query_mem_desc
query_mem_desc
Definition: QueryMemoryInitializer.cpp:479

Executor::query_plan_dag_cache_
static QueryPlanDagCache query_plan_dag_cache_
Definition: Execute.h:1604

PerfectJoinHashTable
Definition: PerfectJoinHashTable.h:50

std::hash< CardinalityCacheKey >::operator()
size_t operator()(const CardinalityCacheKey &cache_key) const
Definition: Execute.h:409

Executor::FetchCacheAnchor
Definition: Execute.h:1519

Executor::CgenStateManager
Definition: Execute.h:1484

Executor::active_window_function_
WindowFunctionContext * active_window_function_
Definition: Execute.h:1569

StringDictionaryProxy
Definition: StringDictionaryProxy.h:39

CompilationRetryNoCompaction
Definition: Execute.h:288

get_arg_by_index
llvm::Value * get_arg_by_index(llvm::Function *func, unsigned const index)
Definition: Execute.h:178

Executor::gpu_active_modules_mutex_
static std::mutex gpu_active_modules_mutex_
Definition: Execute.h:1539

QuerySessionStatus::PENDING_QUEUE
Definition: Execute.h:96

heavyai_shared_mutex.h

Executor::nukeCacheOfExecutors
static void nukeCacheOfExecutors()
Definition: Execute.h:505

Executor::clearMetaInfoCache
void clearMetaInfoCache()
Definition: Execute.cpp:1054

FragmentSkipStatus
FragmentSkipStatus
Definition: Execute.h:164

GroupByAndAggregate
Definition: GroupByAndAggregate.h:61

RelAlgExecutionUnit
Definition: RelAlgExecutionUnit.h:165

UpdateLogForFragment::getEntryCount
size_t const getEntryCount() const override
Definition: ExecuteUpdate.cpp:53

Executor::temporary_tables_
const TemporaryTables * temporary_tables_
Definition: Execute.h:1559

CompilationRetryNewScanLimit::CompilationRetryNewScanLimit
CompilationRetryNewScanLimit(const size_t new_scan_limit)
Definition: Execute.h:276

CompilationRetryNewScanLimit
Definition: Execute.h:274

ParseIRError
Definition: Execute.h:320

Executor::prepareRowModeFuncArgs
std::vector< llvm::Value * > prepareRowModeFuncArgs(bool for_start_bound, SqlWindowFrameBoundType bound_type, const WindowFrameBoundFuncArgs &args) const
Definition: WindowFunctionIR.cpp:857

HashJoin
Definition: HashJoin.h:135

WatchdogException::WatchdogException
WatchdogException(const std::string &cause)
Definition: Execute.h:161

QueryExecutionContext
Definition: QueryExecutionContext.h:38

Executor::has_geos_module
bool has_geos_module() const
Definition: Execute.h:563

Executor::update_extension_modules
void update_extension_modules(bool update_runtime_modules_only=false)
Definition: Execute.cpp:350

JoinCondition
Definition: RelAlgExecutionUnit.h:158

Executor::fetchChunks
FetchResult fetchChunks(const ColumnFetcher &, const RelAlgExecutionUnit &ra_exe_unit, const int device_id, const Data_Namespace::MemoryLevel, const std::map< shared::TableKey, const TableFragments * > &, const FragmentsList &selected_fragments, std::list< ChunkIter > &, std::list< std::shared_ptr< Chunk_NS::Chunk >> &, DeviceAllocator *device_allocator, const size_t thread_idx, const bool allow_runtime_interrupt)
Definition: Execute.cpp:3458

Executor::isArchMaxwell
bool isArchMaxwell(const ExecutorDeviceType dt) const
Definition: MaxwellCodegenPatch.cpp:25

get_loop_join_size
size_t get_loop_join_size(const std::vector< InputTableInfo > &query_infos, const RelAlgExecutionUnit &ra_exe_unit)
Definition: Execute.cpp:1905

Executor::executeExplain
ResultSetPtr executeExplain(const QueryCompilationDescriptor &)
Definition: Execute.cpp:2519

Executor::extension_modules_
std::map< ExtModuleKinds, std::unique_ptr< llvm::Module > > extension_modules_
Definition: Execute.h:1517

Executor::isFragmentFullyDeleted
bool isFragmentFullyDeleted(const InputDescriptor &table_desc, const Fragmenter_Namespace::FragmentInfo &fragment)
Definition: Execute.cpp:4561

CompilationRetryNoLazyFetch
Definition: Execute.h:268