_query_memory_descriptor_8h_source.html

 /*

  * Copyright 2022 HEAVY.AI, Inc.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  *     http://www.apache.org/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #ifndef QUERYENGINE_QUERYMEMORYDESCRIPTOR_H

 #define QUERYENGINE_QUERYMEMORYDESCRIPTOR_H


 #include "ApproxQuantileDescriptor.h"

 #include "ColSlotContext.h"

 #include "Logger/Logger.h"

 #include "QueryEngine/CompilationOptions.h"

 #include "QueryEngine/CountDistinct.h"

 #include "QueryEngine/enums.h"

 #include "Shared/SqlTypesLayout.h"

 #include "Shared/TargetInfo.h"


 #include <boost/optional.hpp>


 #include <algorithm>

 #include <cstddef>

 #include <cstdint>

 #include <memory>

 #include <numeric>

 #include <unordered_map>

 #include <vector>


 extern bool g_cluster;


 class Executor;

 class QueryExecutionContext;

 class RenderInfo;

 class RowSetMemoryOwner;

 struct InputTableInfo;

 struct RelAlgExecutionUnit;

 class TResultSetBufferDescriptor;

 class GroupByAndAggregate;

 struct ColRangeInfo;

 struct KeylessInfo;


 using heavyai::QueryDescriptionType;


 class StreamingTopNOOM : public std::runtime_error {

  public:

   StreamingTopNOOM(const size_t heap_size_bytes)

       : std::runtime_error("Unable to use streaming top N due to required heap size of " +

                            std::to_string(heap_size_bytes) +

                            " bytes exceeding maximum slab size.") {}

 };


 class QueryMemoryDescriptor {

  public:

   QueryMemoryDescriptor();


   // constructor for init call

   QueryMemoryDescriptor(const Executor* executor,

                         const RelAlgExecutionUnit& ra_exe_unit,

                         const std::vector<InputTableInfo>& query_infos,

                         const bool allow_multifrag,

                         const bool keyless_hash,

                         const bool interleaved_bins_on_gpu,

                         const int32_t idx_target_as_key,

                         const ColRangeInfo& col_range_info,

                         const ColSlotContext& col_slot_context,

                         const std::vector<int8_t>& group_col_widths,

                         const int8_t group_col_compact_width,

                         const std::vector<int64_t>& target_groupby_indices,

                         const size_t entry_count,

                         const ApproxQuantileDescriptors&,

                         const CountDistinctDescriptors,

                         const bool sort_on_gpu_hint,

                         const bool output_columnar,

                         const bool render_output,

                         const bool must_use_baseline_sort,

                         const bool use_streaming_top_n,

                         const bool threads_can_reuse_group_by_buffers);


   QueryMemoryDescriptor(const Executor* executor,

                         const size_t entry_count,

                         const QueryDescriptionType query_desc_type);


   QueryMemoryDescriptor(const QueryDescriptionType query_desc_type,

                         const int64_t min_val,

                         const int64_t max_val,

                         const bool has_nulls,

                         const std::vector<int8_t>& group_col_widths);


   // Serialization

   QueryMemoryDescriptor(const TResultSetBufferDescriptor& thrift_query_memory_descriptor);

   static TResultSetBufferDescriptor toThrift(const QueryMemoryDescriptor&);


   bool operator==(const QueryMemoryDescriptor& other) const;


   static std::unique_ptr<QueryMemoryDescriptor> init(

       const Executor* executor,

       const RelAlgExecutionUnit& ra_exe_unit,

       const std::vector<InputTableInfo>& query_infos,

       const ColRangeInfo& col_range_info,

       const KeylessInfo& keyless_info,

       const bool allow_multifrag,

       const ExecutorDeviceType device_type,

       const int8_t crt_min_byte_width,

       const bool sort_on_gpu_hint,

       const size_t shard_count,

       const size_t max_groups_buffer_entry_count,

       RenderInfo* render_info,

       const ApproxQuantileDescriptors&,

       const CountDistinctDescriptors,

       const bool must_use_baseline_sort,

       const bool output_columnar_hint,

       const bool streaming_top_n_hint,

       const bool threads_can_reuse_group_by_buffers);


   std::unique_ptr<QueryExecutionContext> getQueryExecutionContext(

       const RelAlgExecutionUnit&,

       const Executor* executor,

       const ExecutorDeviceType device_type,

       const ExecutorDispatchMode dispatch_mode,

       const int device_id,

       const shared::TableKey& outer_table_key,

       const int64_t num_rows,

       const std::vector<std::vector<const int8_t*>>& col_buffers,

       const std::vector<std::vector<uint64_t>>& frag_offsets,

       std::shared_ptr<RowSetMemoryOwner>,

       const bool output_columnar,

       const bool sort_on_gpu,

       const size_t thread_idx,

       RenderInfo*) const;


   static bool many_entries(const int64_t max_val,

                            const int64_t min_val,

                            const int64_t bucket) {

     return max_val - min_val > 10000 * std::max(bucket, int64_t(1));

   }


   static bool countDescriptorsLogicallyEmpty(

       const CountDistinctDescriptors& count_distinct_descriptors) {

     return std::all_of(count_distinct_descriptors.begin(),

                        count_distinct_descriptors.end(),

                        [](const CountDistinctDescriptor& desc) {

                          return desc.impl_type_ == CountDistinctImplType::Invalid;

                        });

   }


   bool countDistinctDescriptorsLogicallyEmpty() const {

     return countDescriptorsLogicallyEmpty(count_distinct_descriptors_);

   }


   static int8_t pick_target_compact_width(const RelAlgExecutionUnit& ra_exe_unit,

                                           const std::vector<InputTableInfo>& query_infos,

                                           const int8_t crt_min_byte_width);


   // Getters and Setters

   const Executor* getExecutor() const { return executor_; }


   QueryDescriptionType getQueryDescriptionType() const { return query_desc_type_; }

   void setQueryDescriptionType(const QueryDescriptionType val) { query_desc_type_ = val; }

   bool isSingleColumnGroupByWithPerfectHash() const {

     return getQueryDescriptionType() == QueryDescriptionType::GroupByPerfectHash &&

            getGroupbyColCount() == 1;

   }


   bool hasKeylessHash() const { return keyless_hash_; }

   void setHasKeylessHash(const bool val) { keyless_hash_ = val; }


   bool hasInterleavedBinsOnGpu() const { return interleaved_bins_on_gpu_; }

   void setHasInterleavedBinsOnGpu(const bool val) { interleaved_bins_on_gpu_ = val; }


   int32_t getTargetIdxForKey() const { return idx_target_as_key_; }

   void setTargetIdxForKey(const int32_t val) { idx_target_as_key_ = val; }


   int8_t groupColWidth(const size_t key_idx) const {

     CHECK_LT(key_idx, group_col_widths_.size());

     return group_col_widths_[key_idx];

   }

   size_t getPrependedGroupColOffInBytes(const size_t group_idx) const;

   size_t getPrependedGroupBufferSizeInBytes() const;


   const auto groupColWidthsBegin() const { return group_col_widths_.begin(); }

   const auto groupColWidthsEnd() const { return group_col_widths_.end(); }

   void clearGroupColWidths() { group_col_widths_.clear(); }


   bool isGroupBy() const { return !group_col_widths_.empty(); }


   void setGroupColCompactWidth(const int8_t val) { group_col_compact_width_ = val; }


   size_t getColCount() const;

   size_t getSlotCount() const;


   const int8_t getPaddedSlotWidthBytes(const size_t slot_idx) const;

   const int8_t getLogicalSlotWidthBytes(const size_t slot_idx) const;


   void setPaddedSlotWidthBytes(const size_t slot_idx, const int8_t bytes);


   const int8_t getSlotIndexForSingleSlotCol(const size_t col_idx) const;


   size_t getPaddedColWidthForRange(const size_t offset, const size_t range) const {

     size_t ret = 0;

     for (size_t i = offset; i < offset + range; i++) {

       ret += static_cast<size_t>(getPaddedSlotWidthBytes(i));

     }

     return ret;

   }


   void useConsistentSlotWidthSize(const int8_t slot_width_size);

   size_t getRowWidth() const;


   int8_t updateActualMinByteWidth(const int8_t actual_min_byte_width) const;


   void addColSlotInfo(const std::vector<std::tuple<int8_t, int8_t>>& slots_for_col);


   // FlatBuffer support:

   void addColSlotInfoFlatBuffer(const int64_t flatbuffer_size);

   int64_t getFlatBufferSize(const size_t slot_idx) const {

     return col_slot_context_.getFlatBufferSize(slot_idx);

   }

   bool checkSlotUsesFlatBufferFormat(const size_t slot_idx) const {

     return col_slot_context_.checkSlotUsesFlatBufferFormat(slot_idx);

   }

   int64_t getPaddedSlotBufferSize(const size_t slot_idx) const;


   void clearSlotInfo();


   void alignPaddedSlots();


   int64_t getTargetGroupbyIndex(const size_t target_idx) const {

     CHECK_LT(target_idx, target_groupby_indices_.size());

     return target_groupby_indices_[target_idx];

   }


   void setAllTargetGroupbyIndices(std::vector<int64_t> group_by_indices) {

     target_groupby_indices_ = group_by_indices;

   }


   size_t targetGroupbyIndicesSize() const { return target_groupby_indices_.size(); }

   size_t targetGroupbyNegativeIndicesSize() const {

     return std::count_if(

         target_groupby_indices_.begin(),

         target_groupby_indices_.end(),

         [](const int64_t& target_group_by_index) { return target_group_by_index < 0; });

   }

   void clearTargetGroupbyIndices() { target_groupby_indices_.clear(); }


   size_t getEntryCount() const { return entry_count_; }

   void setEntryCount(const size_t val) { entry_count_ = val; }


   int64_t getMinVal() const { return min_val_; }

   int64_t getMaxVal() const { return max_val_; }

   int64_t getBucket() const { return bucket_; }


   bool hasNulls() const { return has_nulls_; }


   const ApproxQuantileDescriptors& getApproxQuantileDescriptors() const {

     return approx_quantile_descriptors_;

   }


   const CountDistinctDescriptor& getCountDistinctDescriptor(const size_t idx) const {

     CHECK_LT(idx, count_distinct_descriptors_.size());

     return count_distinct_descriptors_[idx];

   }

   size_t getCountDistinctDescriptorsSize() const {

     return count_distinct_descriptors_.size();

   }


   bool sortOnGpu() const { return sort_on_gpu_; }


   bool canOutputColumnar() const;

   bool didOutputColumnar() const { return output_columnar_; }

   void setOutputColumnar(const bool val);


   bool useStreamingTopN() const { return use_streaming_top_n_; }


   bool isLogicalSizedColumnsAllowed() const;


   bool mustUseBaselineSort() const { return must_use_baseline_sort_; }


   bool threadsCanReuseGroupByBuffers() const {

     return threads_can_reuse_group_by_buffers_;

   }


   void setThreadsCanReuseGroupByBuffers(const bool val) {

     threads_can_reuse_group_by_buffers_ = val;

   }


   // TODO(adb): remove and store this info more naturally in another

   // member

   bool forceFourByteFloat() const { return force_4byte_float_; }

   void setForceFourByteFloat(const bool val) { force_4byte_float_ = val; }


   // Getters derived from state

   size_t getGroupbyColCount() const { return group_col_widths_.size(); }

   size_t getKeyCount() const { return keyless_hash_ ? 0 : getGroupbyColCount(); }

   size_t getBufferColSlotCount() const;


   size_t getBufferSizeBytes(const RelAlgExecutionUnit& ra_exe_unit,

                             const unsigned thread_count,

                             const ExecutorDeviceType device_type) const;

   size_t getBufferSizeBytes(const ExecutorDeviceType device_type) const;

   size_t getBufferSizeBytes(const ExecutorDeviceType device_type,

                             const size_t override_entry_count) const;


   const ColSlotContext& getColSlotContext() const { return col_slot_context_; }


   // TODO(alex): remove

   bool usesGetGroupValueFast() const;


   bool blocksShareMemory() const;

   bool threadsShareMemory() const;


   bool lazyInitGroups(const ExecutorDeviceType) const;


   bool interleavedBins(const ExecutorDeviceType) const;


   size_t getColOffInBytes(const size_t col_idx) const;

   size_t getColOffInBytesInNextBin(const size_t col_idx) const;

   size_t getNextColOffInBytes(const int8_t* col_ptr,

                               const size_t bin,

                               const size_t col_idx) const;


   // returns the ptr offset of the next column, 64-bit aligned

   size_t getNextColOffInBytesRowOnly(const int8_t* col_ptr, const size_t col_idx) const;

   // returns the ptr offset of the current column, 64-bit aligned

   size_t getColOnlyOffInBytes(const size_t col_idx) const;

   size_t getRowSize() const;

   size_t getColsSize() const;

   size_t getWarpCount() const;


   size_t getCompactByteWidth() const;


   inline size_t getEffectiveKeyWidth() const {

     return group_col_compact_width_ ? group_col_compact_width_ : sizeof(int64_t);

   }


   bool isWarpSyncRequired(const ExecutorDeviceType) const;


   std::string queryDescTypeToString() const;

   std::string toString() const;


   std::string reductionKey() const;


   bool hasVarlenOutput() const { return col_slot_context_.hasVarlenOutput(); }


   // returns a value if the buffer can be a fixed size; otherwise, we will need to use the

   // bump allocator

   std::optional<size_t> varlenOutputBufferElemSize() const;


   // returns the number of bytes needed for all slots preceeding slot_idx. Used to compute

   // the offset into the varlen buffer for each projected target in a given row.

   size_t varlenOutputRowSizeToSlot(const size_t slot_idx) const;


   bool slotIsVarlenOutput(const size_t slot_idx) const {

     return col_slot_context_.slotIsVarlen(slot_idx);

   }


   size_t getAvailableCpuThreads() const { return num_available_threads_; }


   void setAvailableCpuThreads(size_t num_available_threads) const {

     num_available_threads_ = num_available_threads;

   }


   std::optional<size_t> getMaxPerDeviceCardinality(

       const RelAlgExecutionUnit& ra_exe_unit) const;


   bool canUsePerDeviceCardinality(const RelAlgExecutionUnit& ra_exe_unit) const;


  protected:

   void resetGroupColWidths(const std::vector<int8_t>& new_group_col_widths) {

     group_col_widths_ = new_group_col_widths;

   }


  private:

   const Executor* executor_;

   bool allow_multifrag_;

   QueryDescriptionType query_desc_type_;

   bool keyless_hash_;

   bool interleaved_bins_on_gpu_;

   int32_t idx_target_as_key_;  // If keyless_hash_ enabled, then represents what target

                                // expression should be used to identify the key (e.g., in

                                // locating empty entries). Currently only valid with

                                // keyless_hash_ and single-column GroupByPerfectHash

   std::vector<int8_t> group_col_widths_;

   int8_t group_col_compact_width_;  // compact width for all group

                                     // cols if able to be consistent

                                     // otherwise 0

   std::vector<int64_t> target_groupby_indices_;

   size_t entry_count_;  // the number of entries in the main buffer

   int64_t min_val_;     // meaningful for OneColKnownRange,

                         // MultiColPerfectHash only

   int64_t max_val_;

   int64_t bucket_;

   bool has_nulls_;

   ApproxQuantileDescriptors approx_quantile_descriptors_;

   CountDistinctDescriptors count_distinct_descriptors_;

   bool sort_on_gpu_;

   bool output_columnar_;

   bool render_output_;

   bool must_use_baseline_sort_;

   bool use_streaming_top_n_;

   bool threads_can_reuse_group_by_buffers_;

   bool force_4byte_float_;


   ColSlotContext col_slot_context_;


   // # available CPU threads can be used for this query kernel, i.e., to parallelize rest

   // of query initialization step its default value is one which means we do not

   // parallelize for the query kernel, and it will be updated to a proper value before

   // performing the query initialization

   mutable size_t num_available_threads_{1};


   size_t getTotalBytesOfColumnarBuffers() const;

   size_t getTotalBytesOfColumnarBuffers(const size_t num_entries_per_column) const;

   size_t getTotalBytesOfColumnarProjections(const size_t projection_count) const;


   friend class ResultSet;

   friend class QueryExecutionContext;

 };


 inline void set_notnull(TargetInfo& target, const bool not_null) {

   target.skip_null_val = !not_null;

   auto new_type = get_compact_type(target);

   new_type.set_notnull(not_null);

   set_compact_type(target, new_type);

 }


 std::vector<TargetInfo> target_exprs_to_infos(

     const std::vector<Analyzer::Expr*>& targets,

     const QueryMemoryDescriptor& query_mem_desc);


 #endif  // QUERYENGINE_QUERYMEMORYDESCRIPTOR_H

QueryMemoryDescriptor::varlenOutputRowSizeToSlot
size_t varlenOutputRowSizeToSlot(const size_t slot_idx) const
Definition: QueryMemoryDescriptor.cpp:1355

QueryMemoryDescriptor::isGroupBy
bool isGroupBy() const
Definition: QueryMemoryDescriptor.h:200

heavyai::GroupByPerfectHash
GroupByPerfectHash
Definition: enums.h:58

QueryMemoryDescriptor::output_columnar_
bool output_columnar_
Definition: QueryMemoryDescriptor.h:412

CountDistinctDescriptor
Definition: CountDistinctDescriptor.h:41

set_compact_type
void set_compact_type(TargetInfo &target, const SQLTypeInfo &new_type)
Definition: SqlTypesLayout.h:65

QueryMemoryDescriptor::many_entries
static bool many_entries(const int64_t max_val, const int64_t min_val, const int64_t bucket)
Definition: QueryMemoryDescriptor.h:147

QueryMemoryDescriptor::addColSlotInfoFlatBuffer
void addColSlotInfoFlatBuffer(const int64_t flatbuffer_size)
Definition: QueryMemoryDescriptor.cpp:1229

QueryMemoryDescriptor::col_slot_context_
ColSlotContext col_slot_context_
Definition: QueryMemoryDescriptor.h:419

QueryMemoryDescriptor::getSlotCount
size_t getSlotCount() const
Definition: QueryMemoryDescriptor.cpp:1185

QueryMemoryDescriptor::canUsePerDeviceCardinality
bool canUsePerDeviceCardinality(const RelAlgExecutionUnit &ra_exe_unit) const
Definition: QueryMemoryDescriptor.cpp:1383

QueryMemoryDescriptor::getBufferSizeBytes
size_t getBufferSizeBytes(const RelAlgExecutionUnit &ra_exe_unit, const unsigned thread_count, const ExecutorDeviceType device_type) const
Definition: QueryMemoryDescriptor.cpp:1047

QueryMemoryDescriptor::slotIsVarlenOutput
bool slotIsVarlenOutput(const size_t slot_idx) const
Definition: QueryMemoryDescriptor.h:368

QueryMemoryDescriptor::render_output_
bool render_output_
Definition: QueryMemoryDescriptor.h:413

QueryMemoryDescriptor::countDistinctDescriptorsLogicallyEmpty
bool countDistinctDescriptorsLogicallyEmpty() const
Definition: QueryMemoryDescriptor.h:162

QueryMemoryDescriptor::getEntryCount
size_t getEntryCount() const
Definition: QueryMemoryDescriptor.h:261

QueryMemoryDescriptor::has_nulls_
bool has_nulls_
Definition: QueryMemoryDescriptor.h:408

QueryMemoryDescriptor::getKeyCount
size_t getKeyCount() const
Definition: QueryMemoryDescriptor.h:309

QueryMemoryDescriptor::executor_
const Executor * executor_
Definition: QueryMemoryDescriptor.h:389

ColSlotContext::slotIsVarlen
bool slotIsVarlen(const size_t slot_idx) const
Definition: ColSlotContext.h:124

QueryMemoryDescriptor::getTotalBytesOfColumnarProjections
size_t getTotalBytesOfColumnarProjections(const size_t projection_count) const
Definition: QueryMemoryDescriptor.cpp:885

QueryMemoryDescriptor::alignPaddedSlots
void alignPaddedSlots()
Definition: QueryMemoryDescriptor.cpp:1237

QueryMemoryDescriptor::setEntryCount
void setEntryCount(const size_t val)
Definition: QueryMemoryDescriptor.h:262

SqlTypesLayout.h

QueryMemoryDescriptor::getAvailableCpuThreads
size_t getAvailableCpuThreads() const
Definition: QueryMemoryDescriptor.h:372

QueryMemoryDescriptor::idx_target_as_key_
int32_t idx_target_as_key_
Definition: QueryMemoryDescriptor.h:394

QueryMemoryDescriptor::getTargetGroupbyIndex
int64_t getTargetGroupbyIndex(const size_t target_idx) const
Definition: QueryMemoryDescriptor.h:243

QueryMemoryDescriptor::QueryMemoryDescriptor
QueryMemoryDescriptor()
Definition: QueryMemoryDescriptor.cpp:554

sort_on_gpu
void sort_on_gpu(int64_t *val_buff, int32_t *idx_buff, const uint64_t entry_count, const bool desc, const uint32_t chosen_bytes, ThrustAllocator &alloc, const int device_id)
Definition: InPlaceSortImpl.cu:94

QueryMemoryDescriptor::toString
std::string toString() const
Definition: QueryMemoryDescriptor.cpp:1267

QueryMemoryDescriptor::isLogicalSizedColumnsAllowed
bool isLogicalSizedColumnsAllowed() const
Definition: QueryMemoryDescriptor.cpp:1116

TargetInfo
Definition: TargetInfo.h:49

QueryMemoryDescriptor::sortOnGpu
bool sortOnGpu() const
Definition: QueryMemoryDescriptor.h:282

QueryMemoryDescriptor
Definition: QueryMemoryDescriptor.h:68

QueryMemoryDescriptor::mustUseBaselineSort
bool mustUseBaselineSort() const
Definition: QueryMemoryDescriptor.h:292

QueryMemoryDescriptor::hasVarlenOutput
bool hasVarlenOutput() const
Definition: QueryMemoryDescriptor.h:358

QueryMemoryDescriptor::setHasKeylessHash
void setHasKeylessHash(const bool val)
Definition: QueryMemoryDescriptor.h:181

QueryMemoryDescriptor::setGroupColCompactWidth
void setGroupColCompactWidth(const int8_t val)
Definition: QueryMemoryDescriptor.h:202

QueryMemoryDescriptor::setThreadsCanReuseGroupByBuffers
void setThreadsCanReuseGroupByBuffers(const bool val)
Definition: QueryMemoryDescriptor.h:298

QueryMemoryDescriptor::init
static std::unique_ptr< QueryMemoryDescriptor > init(const Executor *executor, const RelAlgExecutionUnit &ra_exe_unit, const std::vector< InputTableInfo > &query_infos, const ColRangeInfo &col_range_info, const KeylessInfo &keyless_info, const bool allow_multifrag, const ExecutorDeviceType device_type, const int8_t crt_min_byte_width, const bool sort_on_gpu_hint, const size_t shard_count, const size_t max_groups_buffer_entry_count, RenderInfo *render_info, const ApproxQuantileDescriptors &, const CountDistinctDescriptors, const bool must_use_baseline_sort, const bool output_columnar_hint, const bool streaming_top_n_hint, const bool threads_can_reuse_group_by_buffers)
Definition: QueryMemoryDescriptor.cpp:240

QueryMemoryDescriptor::setOutputColumnar
void setOutputColumnar(const bool val)
Definition: QueryMemoryDescriptor.cpp:1105

QueryMemoryDescriptor::hasKeylessHash
bool hasKeylessHash() const
Definition: QueryMemoryDescriptor.h:180

QueryMemoryDescriptor::getColCount
size_t getColCount() const
Definition: QueryMemoryDescriptor.cpp:1181

ApproxQuantileDescriptor.h

QueryMemoryDescriptor::threads_can_reuse_group_by_buffers_
bool threads_can_reuse_group_by_buffers_
Definition: QueryMemoryDescriptor.h:416

QueryMemoryDescriptor::getApproxQuantileDescriptors
const ApproxQuantileDescriptors & getApproxQuantileDescriptors() const
Definition: QueryMemoryDescriptor.h:270

QueryMemoryDescriptor::getNextColOffInBytes
size_t getNextColOffInBytes(const int8_t *col_ptr, const size_t bin, const size_t col_idx) const
Definition: QueryMemoryDescriptor.cpp:996

QueryMemoryDescriptor::getEffectiveKeyWidth
size_t getEffectiveKeyWidth() const
Definition: QueryMemoryDescriptor.h:347

anonymous_namespace{QueryMemoryDescriptor.cpp}::use_streaming_top_n
bool use_streaming_top_n(const RelAlgExecutionUnit &ra_exe_unit, const bool output_columnar)
Definition: QueryMemoryDescriptor.cpp:148

Executor
Definition: Execute.h:415

ApproxQuantileDescriptors
std::vector< ApproxQuantileDescriptor > ApproxQuantileDescriptors
Definition: ApproxQuantileDescriptor.h:26

ColSlotContext::hasVarlenOutput
bool hasVarlenOutput() const
Definition: ColSlotContext.h:120

TargetInfo::skip_null_val
bool skip_null_val
Definition: TargetInfo.h:54

QueryMemoryDescriptor::setQueryDescriptionType
void setQueryDescriptionType(const QueryDescriptionType val)
Definition: QueryMemoryDescriptor.h:174

RowSetMemoryOwner
Definition: RowSetMemoryOwner.h:57

QueryMemoryDescriptor::targetGroupbyNegativeIndicesSize
size_t targetGroupbyNegativeIndicesSize() const
Definition: QueryMemoryDescriptor.h:253

QueryMemoryDescriptor::hasInterleavedBinsOnGpu
bool hasInterleavedBinsOnGpu() const
Definition: QueryMemoryDescriptor.h:183

ExecutorDeviceType
ExecutorDeviceType
Definition: ExecutorDeviceType.h:23

QueryMemoryDescriptor::getWarpCount
size_t getWarpCount() const
Definition: QueryMemoryDescriptor.cpp:849

to_string
std::string to_string(char const *&&v)
Definition: StringTransform.cpp:128

QueryMemoryDescriptor::groupColWidthsBegin
const auto groupColWidthsBegin() const
Definition: QueryMemoryDescriptor.h:196

QueryMemoryDescriptor::getMaxPerDeviceCardinality
std::optional< size_t > getMaxPerDeviceCardinality(const RelAlgExecutionUnit &ra_exe_unit) const
Definition: QueryMemoryDescriptor.cpp:1372

QueryMemoryDescriptor::getRowSize
size_t getRowSize() const
Definition: QueryMemoryDescriptor.cpp:835

QueryMemoryDescriptor::useConsistentSlotWidthSize
void useConsistentSlotWidthSize(const int8_t slot_width_size)
Definition: QueryMemoryDescriptor.cpp:1210

QueryMemoryDescriptor::getColOnlyOffInBytes
size_t getColOnlyOffInBytes(const size_t col_idx) const
Definition: QueryMemoryDescriptor.cpp:892

ExecutorDispatchMode
ExecutorDispatchMode
Definition: CompilationOptions.h:29

QueryMemoryDescriptor::getMaxVal
int64_t getMaxVal() const
Definition: QueryMemoryDescriptor.h:265

get_compact_type
const SQLTypeInfo get_compact_type(const TargetInfo &target)
Definition: SqlTypesLayout.h:37

QueryMemoryDescriptor::blocksShareMemory
bool blocksShareMemory() const
Definition: QueryMemoryDescriptor.cpp:1144

QueryMemoryDescriptor::forceFourByteFloat
bool forceFourByteFloat() const
Definition: QueryMemoryDescriptor.h:304

QueryMemoryDescriptor::max_val_
int64_t max_val_
Definition: QueryMemoryDescriptor.h:406

QueryMemoryDescriptor::groupColWidthsEnd
const auto groupColWidthsEnd() const
Definition: QueryMemoryDescriptor.h:197

QueryMemoryDescriptor::min_val_
int64_t min_val_
Definition: QueryMemoryDescriptor.h:404

StreamingTopNOOM
Definition: QueryMemoryDescriptor.h:60

TargetInfo.h

QueryMemoryDescriptor::bucket_
int64_t bucket_
Definition: QueryMemoryDescriptor.h:407

QueryMemoryDescriptor::groupColWidth
int8_t groupColWidth(const size_t key_idx) const
Definition: QueryMemoryDescriptor.h:189

QueryMemoryDescriptor::setTargetIdxForKey
void setTargetIdxForKey(const int32_t val)
Definition: QueryMemoryDescriptor.h:187

QueryMemoryDescriptor::getCompactByteWidth
size_t getCompactByteWidth() const
Definition: QueryMemoryDescriptor.cpp:853

QueryMemoryDescriptor::useStreamingTopN
bool useStreamingTopN() const
Definition: QueryMemoryDescriptor.h:288

QueryMemoryDescriptor::num_available_threads_
size_t num_available_threads_
Definition: QueryMemoryDescriptor.h:425

CountDistinctDescriptors
std::vector< CountDistinctDescriptor > CountDistinctDescriptors
Definition: CountDistinct.h:34

ColSlotContext.h
Provides column info and slot info for the output buffer and some metadata helpers.

QueryMemoryDescriptor::getGroupbyColCount
size_t getGroupbyColCount() const
Definition: QueryMemoryDescriptor.h:308

RenderInfo
Definition: RenderInfo.h:31

QueryMemoryDescriptor::lazyInitGroups
bool lazyInitGroups(const ExecutorDeviceType) const
Definition: QueryMemoryDescriptor.cpp:1163

QueryMemoryDescriptor::targetGroupbyIndicesSize
size_t targetGroupbyIndicesSize() const
Definition: QueryMemoryDescriptor.h:252

QueryMemoryDescriptor::threadsCanReuseGroupByBuffers
bool threadsCanReuseGroupByBuffers() const
Definition: QueryMemoryDescriptor.h:294

QueryMemoryDescriptor::hasNulls
bool hasNulls() const
Definition: QueryMemoryDescriptor.h:268

Logger.h

QueryMemoryDescriptor::getPrependedGroupBufferSizeInBytes
size_t getPrependedGroupBufferSizeInBytes() const
Definition: QueryMemoryDescriptor.cpp:974

QueryMemoryDescriptor::getTotalBytesOfColumnarBuffers
size_t getTotalBytesOfColumnarBuffers() const
Definition: QueryMemoryDescriptor.cpp:862

QueryMemoryDescriptor::target_groupby_indices_
std::vector< int64_t > target_groupby_indices_
Definition: QueryMemoryDescriptor.h:402

QueryMemoryDescriptor::pick_target_compact_width
static int8_t pick_target_compact_width(const RelAlgExecutionUnit &ra_exe_unit, const std::vector< InputTableInfo > &query_infos, const int8_t crt_min_byte_width)
Definition: QueryMemoryDescriptor.cpp:735

QueryMemoryDescriptor::count_distinct_descriptors_
CountDistinctDescriptors count_distinct_descriptors_
Definition: QueryMemoryDescriptor.h:410

QueryMemoryDescriptor::interleaved_bins_on_gpu_
bool interleaved_bins_on_gpu_
Definition: QueryMemoryDescriptor.h:393

QueryMemoryDescriptor::getPaddedColWidthForRange
size_t getPaddedColWidthForRange(const size_t offset, const size_t range) const
Definition: QueryMemoryDescriptor.h:214

QueryMemoryDescriptor::getPaddedSlotWidthBytes
const int8_t getPaddedSlotWidthBytes(const size_t slot_idx) const
Definition: QueryMemoryDescriptor.cpp:1189

QueryMemoryDescriptor::getPaddedSlotBufferSize
int64_t getPaddedSlotBufferSize(const size_t slot_idx) const
Definition: QueryMemoryDescriptor.cpp:944

QueryMemoryDescriptor::toThrift
static TResultSetBufferDescriptor toThrift(const QueryMemoryDescriptor &)

QueryMemoryDescriptor::getCountDistinctDescriptorsSize
size_t getCountDistinctDescriptorsSize() const
Definition: QueryMemoryDescriptor.h:278

QueryMemoryDescriptor::getQueryDescriptionType
QueryDescriptionType getQueryDescriptionType() const
Definition: QueryMemoryDescriptor.h:173

QueryMemoryDescriptor::getBucket
int64_t getBucket() const
Definition: QueryMemoryDescriptor.h:266

QueryMemoryDescriptor::clearSlotInfo
void clearSlotInfo()
Definition: QueryMemoryDescriptor.cpp:1233

QueryMemoryDescriptor::getCountDistinctDescriptor
const CountDistinctDescriptor & getCountDistinctDescriptor(const size_t idx) const
Definition: QueryMemoryDescriptor.h:274

QueryMemoryDescriptor::varlenOutputBufferElemSize
std::optional< size_t > varlenOutputBufferElemSize() const
Definition: QueryMemoryDescriptor.cpp:1339

CHECK_LT
#define CHECK_LT(x, y)
Definition: Logger.h:303

QueryMemoryDescriptor::isSingleColumnGroupByWithPerfectHash
bool isSingleColumnGroupByWithPerfectHash() const
Definition: QueryMemoryDescriptor.h:175

QueryMemoryDescriptor::getNextColOffInBytesRowOnly
size_t getNextColOffInBytesRowOnly(const int8_t *col_ptr, const size_t col_idx) const
Definition: QueryMemoryDescriptor.cpp:1030

ColSlotContext::checkSlotUsesFlatBufferFormat
bool checkSlotUsesFlatBufferFormat(const size_t slot_idx) const
Definition: ColSlotContext.cpp:285

StreamingTopNOOM::StreamingTopNOOM
StreamingTopNOOM(const size_t heap_size_bytes)
Definition: QueryMemoryDescriptor.h:62

QueryMemoryDescriptor::query_desc_type_
QueryDescriptionType query_desc_type_
Definition: QueryMemoryDescriptor.h:391

QueryMemoryDescriptor::setAvailableCpuThreads
void setAvailableCpuThreads(size_t num_available_threads) const
Definition: QueryMemoryDescriptor.h:374

CountDistinct.h
Functions used to work with (approximate) count distinct sets.

QueryMemoryDescriptor::group_col_compact_width_
int8_t group_col_compact_width_
Definition: QueryMemoryDescriptor.h:399

QueryMemoryDescriptor::updateActualMinByteWidth
int8_t updateActualMinByteWidth(const int8_t actual_min_byte_width) const
Definition: QueryMemoryDescriptor.cpp:1219

enums.h
QueryEngine enum classes with minimal #include files.

QueryMemoryDescriptor::operator==
bool operator==(const QueryMemoryDescriptor &other) const
Definition: QueryMemoryDescriptor.cpp:631

QueryMemoryDescriptor::setForceFourByteFloat
void setForceFourByteFloat(const bool val)
Definition: QueryMemoryDescriptor.h:305

QueryMemoryDescriptor::sort_on_gpu_
bool sort_on_gpu_
Definition: QueryMemoryDescriptor.h:411

QueryMemoryDescriptor::entry_count_
size_t entry_count_
Definition: QueryMemoryDescriptor.h:403

QueryMemoryDescriptor::getColsSize
size_t getColsSize() const
Definition: QueryMemoryDescriptor.cpp:831

ResultSet
Definition: ResultSet.h:157

QueryMemoryDescriptor::canOutputColumnar
bool canOutputColumnar() const
Definition: QueryMemoryDescriptor.cpp:1241

QueryMemoryDescriptor::didOutputColumnar
bool didOutputColumnar() const
Definition: QueryMemoryDescriptor.h:285

QueryMemoryDescriptor::usesGetGroupValueFast
bool usesGetGroupValueFast() const
Definition: QueryMemoryDescriptor.cpp:1135

QueryMemoryDescriptor::isWarpSyncRequired
bool isWarpSyncRequired(const ExecutorDeviceType) const
Definition: QueryMemoryDescriptor.cpp:1173

QueryMemoryDescriptor::interleavedBins
bool interleavedBins(const ExecutorDeviceType) const
Definition: QueryMemoryDescriptor.cpp:1168

QueryMemoryDescriptor::getColSlotContext
const ColSlotContext & getColSlotContext() const
Definition: QueryMemoryDescriptor.h:319

QueryMemoryDescriptor::threadsShareMemory
bool threadsShareMemory() const
Definition: QueryMemoryDescriptor.cpp:1140

QueryMemoryDescriptor::group_col_widths_
std::vector< int8_t > group_col_widths_
Definition: QueryMemoryDescriptor.h:398

QueryMemoryDescriptor::getRowWidth
size_t getRowWidth() const
Definition: QueryMemoryDescriptor.cpp:1214

QueryMemoryDescriptor::getMinVal
int64_t getMinVal() const
Definition: QueryMemoryDescriptor.h:264

QueryMemoryDescriptor::setAllTargetGroupbyIndices
void setAllTargetGroupbyIndices(std::vector< int64_t > group_by_indices)
Definition: QueryMemoryDescriptor.h:248

CompilationOptions.h

KeylessInfo
Definition: GroupByAndAggregate.h:56

g_cluster
bool g_cluster

QueryMemoryDescriptor::setPaddedSlotWidthBytes
void setPaddedSlotWidthBytes(const size_t slot_idx, const int8_t bytes)
Definition: QueryMemoryDescriptor.cpp:1193

QueryMemoryDescriptor::keyless_hash_
bool keyless_hash_
Definition: QueryMemoryDescriptor.h:392

QueryMemoryDescriptor::resetGroupColWidths
void resetGroupColWidths(const std::vector< int8_t > &new_group_col_widths)
Definition: QueryMemoryDescriptor.h:384

QueryMemoryDescriptor::clearTargetGroupbyIndices
void clearTargetGroupbyIndices()
Definition: QueryMemoryDescriptor.h:259

target_exprs_to_infos
std::vector< TargetInfo > target_exprs_to_infos(const std::vector< Analyzer::Expr * > &targets, const QueryMemoryDescriptor &query_mem_desc)
Definition: QueryMemoryDescriptor.cpp:1317

QueryMemoryDescriptor::must_use_baseline_sort_
bool must_use_baseline_sort_
Definition: QueryMemoryDescriptor.h:414

QueryMemoryDescriptor::queryDescTypeToString
std::string queryDescTypeToString() const
Definition: QueryMemoryDescriptor.cpp:1247

InputTableInfo
Definition: InputMetadata.h:33

QueryMemoryDescriptor::clearGroupColWidths
void clearGroupColWidths()
Definition: QueryMemoryDescriptor.h:198

QueryMemoryDescriptor::force_4byte_float_
bool force_4byte_float_
Definition: QueryMemoryDescriptor.h:417

QueryMemoryDescriptor::addColSlotInfo
void addColSlotInfo(const std::vector< std::tuple< int8_t, int8_t >> &slots_for_col)
Definition: QueryMemoryDescriptor.cpp:1224

QueryMemoryDescriptor::setHasInterleavedBinsOnGpu
void setHasInterleavedBinsOnGpu(const bool val)
Definition: QueryMemoryDescriptor.h:184

QueryMemoryDescriptor::use_streaming_top_n_
bool use_streaming_top_n_
Definition: QueryMemoryDescriptor.h:415

QueryMemoryDescriptor::countDescriptorsLogicallyEmpty
static bool countDescriptorsLogicallyEmpty(const CountDistinctDescriptors &count_distinct_descriptors)
Definition: QueryMemoryDescriptor.h:153

QueryMemoryDescriptor::getFlatBufferSize
int64_t getFlatBufferSize(const size_t slot_idx) const
Definition: QueryMemoryDescriptor.h:231

shared::TableKey
Definition: DbObjectKeys.h:51

QueryMemoryDescriptor::getSlotIndexForSingleSlotCol
const int8_t getSlotIndexForSingleSlotCol(const size_t col_idx) const
Definition: QueryMemoryDescriptor.cpp:1203

QueryMemoryDescriptor::checkSlotUsesFlatBufferFormat
bool checkSlotUsesFlatBufferFormat(const size_t slot_idx) const
Definition: QueryMemoryDescriptor.h:234

QueryMemoryDescriptor::getBufferColSlotCount
size_t getBufferColSlotCount() const
Definition: QueryMemoryDescriptor.cpp:1124

QueryMemoryDescriptor::getLogicalSlotWidthBytes
const int8_t getLogicalSlotWidthBytes(const size_t slot_idx) const
Definition: QueryMemoryDescriptor.cpp:1198

QueryMemoryDescriptor::getColOffInBytes
size_t getColOffInBytes(const size_t col_idx) const
Definition: QueryMemoryDescriptor.cpp:905

ColSlotContext
Definition: ColSlotContext.h:46

ColRangeInfo
Definition: GroupByAndAggregate.h:47

QueryMemoryDescriptor::approx_quantile_descriptors_
ApproxQuantileDescriptors approx_quantile_descriptors_
Definition: QueryMemoryDescriptor.h:409

ColSlotContext::getFlatBufferSize
int64_t getFlatBufferSize(const size_t slot_idx) const
Definition: ColSlotContext.cpp:276

QueryMemoryDescriptor::getColOffInBytesInNextBin
size_t getColOffInBytesInNextBin(const size_t col_idx) const
Definition: QueryMemoryDescriptor.cpp:985

QueryMemoryDescriptor::getQueryExecutionContext
std::unique_ptr< QueryExecutionContext > getQueryExecutionContext(const RelAlgExecutionUnit &, const Executor *executor, const ExecutorDeviceType device_type, const ExecutorDispatchMode dispatch_mode, const int device_id, const shared::TableKey &outer_table_key, const int64_t num_rows, const std::vector< std::vector< const int8_t * >> &col_buffers, const std::vector< std::vector< uint64_t >> &frag_offsets, std::shared_ptr< RowSetMemoryOwner >, const bool output_columnar, const bool sort_on_gpu, const size_t thread_idx, RenderInfo *) const
Definition: QueryMemoryDescriptor.cpp:698

query_mem_desc
query_mem_desc
Definition: QueryMemoryInitializer.cpp:479

QueryMemoryDescriptor::reductionKey
std::string reductionKey() const
Definition: QueryMemoryDescriptor.cpp:1293

QueryMemoryDescriptor::allow_multifrag_
bool allow_multifrag_
Definition: QueryMemoryDescriptor.h:390

CountDistinctImplType::Invalid

QueryMemoryDescriptor::getExecutor
const Executor * getExecutor() const
Definition: QueryMemoryDescriptor.h:171

set_notnull
void set_notnull(TargetInfo &target, const bool not_null)
Definition: QueryMemoryDescriptor.h:435

GroupByAndAggregate
Definition: GroupByAndAggregate.h:61

RelAlgExecutionUnit
Definition: RelAlgExecutionUnit.h:165

QueryExecutionContext
Definition: QueryExecutionContext.h:38

QueryMemoryDescriptor::getTargetIdxForKey
int32_t getTargetIdxForKey() const
Definition: QueryMemoryDescriptor.h:186

QueryMemoryDescriptor::getPrependedGroupColOffInBytes
size_t getPrependedGroupColOffInBytes(const size_t group_idx) const
Definition: QueryMemoryDescriptor.cpp:956