_query_memory_initializer_8h_source.html

 /*

  * Copyright 2022 HEAVY.AI, Inc.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  *     http://www.apache.org/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #pragma once


 #include "DataMgr/Allocators/DeviceAllocator.h"

 #include "Descriptors/QueryMemoryDescriptor.h"

 #include "GpuMemUtils.h"

 #include "Rendering/RenderAllocator.h"

 #include "ResultSet.h"


 #include "ThirdParty/robin_hood/robin_hood.h"


 #include <memory>


 #ifdef HAVE_CUDA

 #include <cuda.h>

 #else

 #include <Shared/nocuda.h>

 #endif


 class QueryMemoryInitializer {

  public:

   using ModeIndexSet = robin_hood::unordered_set<size_t>;

   using QuantileParam = std::optional<double>;

   struct TargetAggOpsMetadata {

     bool has_count_distinct{false};

     bool has_mode{false};

     bool has_tdigest{false};

     std::vector<int64_t> count_distinct_buf_size;

     ModeIndexSet mode_index_set;

     std::vector<QuantileParam> quantile_params;

   };


   // Row-based execution constructor

   QueryMemoryInitializer(const RelAlgExecutionUnit& ra_exe_unit,

                          const QueryMemoryDescriptor& query_mem_desc,

                          const int device_id,

                          const ExecutorDeviceType device_type,

                          const ExecutorDispatchMode dispatch_mode,

                          const bool output_columnar,

                          const bool sort_on_gpu,

                          const shared::TableKey& outer_table_key,

                          const int64_t num_rows,

                          const std::vector<std::vector<const int8_t*>>& col_buffers,

                          const std::vector<std::vector<uint64_t>>& frag_offsets,

                          RenderAllocatorMap* render_allocator_map,

                          RenderInfo* render_info,

                          std::shared_ptr<RowSetMemoryOwner> row_set_mem_owner,

                          DeviceAllocator* gpu_allocator,

                          const size_t thread_idx,

                          const Executor* executor);


   // Table functions execution constructor

   QueryMemoryInitializer(const TableFunctionExecutionUnit& exe_unit,

                          const QueryMemoryDescriptor& query_mem_desc,

                          const int device_id,

                          const ExecutorDeviceType device_type,

                          const int64_t num_rows,

                          const std::vector<std::vector<const int8_t*>>& col_buffers,

                          const std::vector<std::vector<uint64_t>>& frag_offsets,

                          std::shared_ptr<RowSetMemoryOwner> row_set_mem_owner,

                          DeviceAllocator* device_allocator,

                          const Executor* executor);


   const auto getCountDistinctBitmapDevicePtr() const {

     return count_distinct_bitmap_device_mem_ptr_;

   }


   const auto getCountDistinctBitmapHostPtr() const {

     return count_distinct_bitmap_host_mem_ptr_;

   }


   const auto getCountDistinctBitmapBytes() const {

     return count_distinct_bitmap_mem_size_;

   }


   // TODO: lazy init (maybe lazy init count distinct above, too?)

   const auto getVarlenOutputHostPtr() const { return varlen_output_buffer_host_ptr_; }


   const auto getVarlenOutputPtr() const { return varlen_output_buffer_; }


   ResultSet* getResultSet(const size_t index) const {

     CHECK_LT(index, result_sets_.size());

     return result_sets_[index].get();

   }


   std::unique_ptr<ResultSet> getResultSetOwned(const size_t index) {

     CHECK_LT(index, result_sets_.size());

     return std::move(result_sets_[index]);

   }


   void resetResultSet(const size_t index) {

     CHECK_LT(index, result_sets_.size());

     result_sets_[index].reset();

   }


   int64_t getAggInitValForIndex(const size_t index) const {

     CHECK_LT(index, init_agg_vals_.size());

     return init_agg_vals_[index];

   }


   const auto getGroupByBuffersPtr() {

     return reinterpret_cast<int64_t**>(group_by_buffers_.data());

   }


   const auto getGroupByBuffersSize() const { return group_by_buffers_.size(); }


   const auto getNumBuffers() const {

     CHECK_EQ(num_buffers_, group_by_buffers_.size());

     return num_buffers_;

   }


   GpuGroupByBuffers setupTableFunctionGpuBuffers(

       const QueryMemoryDescriptor& query_mem_desc,

       const int device_id,

       const unsigned block_size_x,

       const unsigned grid_size_x,

       const bool zero_initialize_buffers);


   void copyFromTableFunctionGpuBuffers(Data_Namespace::DataMgr* data_mgr,

                                        const QueryMemoryDescriptor& query_mem_desc,

                                        const size_t entry_count,

                                        const GpuGroupByBuffers& gpu_group_by_buffers,

                                        const int device_id,

                                        const unsigned block_size_x,

                                        const unsigned grid_size_x);


   void copyGroupByBuffersFromGpu(DeviceAllocator& device_allocator,

                                  const QueryMemoryDescriptor& query_mem_desc,

                                  const size_t entry_count,

                                  const GpuGroupByBuffers& gpu_group_by_buffers,

                                  const RelAlgExecutionUnit* ra_exe_unit,

                                  const unsigned block_size_x,

                                  const unsigned grid_size_x,

                                  const int device_id,

                                  const bool prepend_index_buffer) const;


  private:

   void initGroupByBuffer(int64_t* buffer,

                          const RelAlgExecutionUnit& ra_exe_unit,

                          const QueryMemoryDescriptor& query_mem_desc,

                          TargetAggOpsMetadata& agg_expr_metadata,

                          const ExecutorDeviceType device_type,

                          const bool output_columnar,

                          const Executor* executor);


   void initRowGroups(const QueryMemoryDescriptor& query_mem_desc,

                      int64_t* groups_buffer,

                      const std::vector<int64_t>& init_vals,

                      TargetAggOpsMetadata& agg_expr_metadata,

                      const int32_t groups_buffer_entry_count,

                      const size_t warp_size,

                      const Executor* executor,

                      const RelAlgExecutionUnit& ra_exe_unit);


   void initColumnarGroups(const QueryMemoryDescriptor& query_mem_desc,

                           int64_t* groups_buffer,

                           const std::vector<int64_t>& init_vals,

                           const Executor* executor,

                           const RelAlgExecutionUnit& ra_exe_unit);


   void initColumnsPerRow(const QueryMemoryDescriptor& query_mem_desc,

                          int8_t* row_ptr,

                          const std::vector<int64_t>& init_vals,

                          const TargetAggOpsMetadata& agg_op_metadata);


   void allocateCountDistinctGpuMem(const QueryMemoryDescriptor& query_mem_desc);


   std::vector<int64_t> calculateCountDistinctBufferSize(

       const QueryMemoryDescriptor& query_mem_desc,

       const RelAlgExecutionUnit& ra_exe_unit) const;


   void allocateCountDistinctBuffers(const QueryMemoryDescriptor& query_mem_desc,

                                     const RelAlgExecutionUnit& ra_exe_unit);


   int64_t allocateCountDistinctBitmap(const size_t bitmap_byte_sz);


   int64_t allocateCountDistinctSet();


   ModeIndexSet initializeModeIndexSet(const QueryMemoryDescriptor& query_mem_desc,

                                       const RelAlgExecutionUnit& ra_exe_unit);


   void allocateModeBuffer(const QueryMemoryDescriptor& query_mem_desc,

                           const RelAlgExecutionUnit& ra_exe_unit);


   std::vector<QuantileParam> initializeQuantileParams(

       const QueryMemoryDescriptor& query_mem_desc,

       const RelAlgExecutionUnit& ra_exe_unit);


   void allocateTDigestsBuffer(const QueryMemoryDescriptor& query_mem_desc,

                               const RelAlgExecutionUnit& ra_exe_unit);


   GpuGroupByBuffers prepareTopNHeapsDevBuffer(const QueryMemoryDescriptor& query_mem_desc,

                                               const int8_t* init_agg_vals_dev_ptr,

                                               const size_t n,

                                               const int device_id,

                                               const unsigned block_size_x,

                                               const unsigned grid_size_x);


   GpuGroupByBuffers createAndInitializeGroupByBufferGpu(

       const RelAlgExecutionUnit& ra_exe_unit,

       const QueryMemoryDescriptor& query_mem_desc,

       const int8_t* init_agg_vals_dev_ptr,

       const int device_id,

       const ExecutorDispatchMode dispatch_mode,

       const unsigned block_size_x,

       const unsigned grid_size_x,

       const int8_t warp_size,

       const bool can_sort_on_gpu,

       const bool output_columnar,

       RenderAllocator* render_allocator);


   size_t computeNumberOfBuffers(const QueryMemoryDescriptor& query_mem_desc,

                                 const ExecutorDeviceType device_type,

                                 const Executor* executor) const;


   void compactProjectionBuffersCpu(const QueryMemoryDescriptor& query_mem_desc,

                                    const size_t projection_count);

   void compactProjectionBuffersGpu(const QueryMemoryDescriptor& query_mem_desc,

                                    Data_Namespace::DataMgr* data_mgr,

                                    const GpuGroupByBuffers& gpu_group_by_buffers,

                                    const size_t projection_count,

                                    const int device_id);


   void applyStreamingTopNOffsetCpu(const QueryMemoryDescriptor& query_mem_desc,

                                    const RelAlgExecutionUnit& ra_exe_unit);


   void applyStreamingTopNOffsetGpu(Data_Namespace::DataMgr* data_mgr,

                                    const QueryMemoryDescriptor& query_mem_desc,

                                    const GpuGroupByBuffers& gpu_group_by_buffers,

                                    const RelAlgExecutionUnit& ra_exe_unit,

                                    const unsigned total_thread_count,

                                    const int device_id);


   std::shared_ptr<VarlenOutputInfo> getVarlenOutputInfo();


   const int64_t num_rows_;

   std::shared_ptr<RowSetMemoryOwner> row_set_mem_owner_;

   std::vector<std::unique_ptr<ResultSet>> result_sets_;


   std::vector<int64_t> init_agg_vals_;


   size_t num_buffers_;

   std::vector<int64_t*> group_by_buffers_;

   std::shared_ptr<VarlenOutputInfo> varlen_output_info_;

   CUdeviceptr varlen_output_buffer_;

   int8_t* varlen_output_buffer_host_ptr_;


   CUdeviceptr count_distinct_bitmap_device_mem_ptr_;

   size_t count_distinct_bitmap_mem_size_;

   int8_t* count_distinct_bitmap_host_crt_ptr_;

   int8_t* count_distinct_bitmap_host_mem_ptr_;


   DeviceAllocator* device_allocator_{nullptr};

   std::vector<Data_Namespace::AbstractBuffer*> temporary_buffers_;


   const size_t thread_idx_;


   friend class Executor;  // Accesses result_sets_

   friend class QueryExecutionContext;

 };

QueryMemoryInitializer::setupTableFunctionGpuBuffers
GpuGroupByBuffers setupTableFunctionGpuBuffers(const QueryMemoryDescriptor &query_mem_desc, const int device_id, const unsigned block_size_x, const unsigned grid_size_x, const bool zero_initialize_buffers)
Definition: QueryMemoryInitializer.cpp:1173

QueryMemoryInitializer::initializeModeIndexSet
ModeIndexSet initializeModeIndexSet(const QueryMemoryDescriptor &query_mem_desc, const RelAlgExecutionUnit &ra_exe_unit)
Definition: QueryMemoryInitializer.cpp:931

CHECK_EQ
#define CHECK_EQ(x, y)
Definition: Logger.h:301

QueryMemoryInitializer::Executor
friend class Executor
Definition: QueryMemoryInitializer.h:273

QueryMemoryInitializer::count_distinct_bitmap_device_mem_ptr_
CUdeviceptr count_distinct_bitmap_device_mem_ptr_
Definition: QueryMemoryInitializer.h:263

QueryMemoryInitializer::num_buffers_
size_t num_buffers_
Definition: QueryMemoryInitializer.h:257

QueryMemoryInitializer::prepareTopNHeapsDevBuffer
GpuGroupByBuffers prepareTopNHeapsDevBuffer(const QueryMemoryDescriptor &query_mem_desc, const int8_t *init_agg_vals_dev_ptr, const size_t n, const int device_id, const unsigned block_size_x, const unsigned grid_size_x)
Definition: QueryMemoryInitializer.cpp:1005

QueryMemoryInitializer::resetResultSet
void resetResultSet(const size_t index)
Definition: QueryMemoryInitializer.h:106

QueryMemoryInitializer::createAndInitializeGroupByBufferGpu
GpuGroupByBuffers createAndInitializeGroupByBufferGpu(const RelAlgExecutionUnit &ra_exe_unit, const QueryMemoryDescriptor &query_mem_desc, const int8_t *init_agg_vals_dev_ptr, const int device_id, const ExecutorDispatchMode dispatch_mode, const unsigned block_size_x, const unsigned grid_size_x, const int8_t warp_size, const bool can_sort_on_gpu, const bool output_columnar, RenderAllocator *render_allocator)
Definition: QueryMemoryInitializer.cpp:1059

QueryMemoryInitializer::device_allocator_
DeviceAllocator * device_allocator_
Definition: QueryMemoryInitializer.h:268

sort_on_gpu
void sort_on_gpu(int64_t *val_buff, int32_t *idx_buff, const uint64_t entry_count, const bool desc, const uint32_t chosen_bytes, ThrustAllocator &alloc, const int device_id)
Definition: InPlaceSortImpl.cu:94

QueryMemoryDescriptor
Definition: QueryMemoryDescriptor.h:68

QueryMemoryInitializer::allocateCountDistinctBuffers
void allocateCountDistinctBuffers(const QueryMemoryDescriptor &query_mem_desc, const RelAlgExecutionUnit &ra_exe_unit)
Definition: QueryMemoryInitializer.cpp:890

QueryMemoryInitializer::QueryMemoryInitializer
QueryMemoryInitializer(const RelAlgExecutionUnit &ra_exe_unit, const QueryMemoryDescriptor &query_mem_desc, const int device_id, const ExecutorDeviceType device_type, const ExecutorDispatchMode dispatch_mode, const bool output_columnar, const bool sort_on_gpu, const shared::TableKey &outer_table_key, const int64_t num_rows, const std::vector< std::vector< const int8_t * >> &col_buffers, const std::vector< std::vector< uint64_t >> &frag_offsets, RenderAllocatorMap *render_allocator_map, RenderInfo *render_info, std::shared_ptr< RowSetMemoryOwner > row_set_mem_owner, DeviceAllocator *gpu_allocator, const size_t thread_idx, const Executor *executor)
Definition: QueryMemoryInitializer.cpp:224

CUdeviceptr
unsigned long long CUdeviceptr
Definition: nocuda.h:28

DeviceAllocator
Definition: DeviceAllocator.h:45

QueryMemoryInitializer::getGroupByBuffersPtr
const auto getGroupByBuffersPtr()
Definition: QueryMemoryInitializer.h:116

QueryMemoryInitializer::TargetAggOpsMetadata::has_tdigest
bool has_tdigest
Definition: QueryMemoryInitializer.h:42

QueryMemoryInitializer::QuantileParam
std::optional< double > QuantileParam
Definition: QueryMemoryInitializer.h:38

QueryMemoryInitializer::getCountDistinctBitmapHostPtr
const auto getCountDistinctBitmapHostPtr() const
Definition: QueryMemoryInitializer.h:83

nocuda.h

QueryMemoryInitializer::TargetAggOpsMetadata::has_count_distinct
bool has_count_distinct
Definition: QueryMemoryInitializer.h:40

ExecutorDeviceType
ExecutorDeviceType
Definition: ExecutorDeviceType.h:23

QueryMemoryInitializer::computeNumberOfBuffers
size_t computeNumberOfBuffers(const QueryMemoryDescriptor &query_mem_desc, const ExecutorDeviceType device_type, const Executor *executor) const
Definition: QueryMemoryInitializer.cpp:1251

QueryMemoryInitializer::initializeQuantileParams
std::vector< QuantileParam > initializeQuantileParams(const QueryMemoryDescriptor &query_mem_desc, const RelAlgExecutionUnit &ra_exe_unit)
Definition: QueryMemoryInitializer.cpp:961

QueryMemoryInitializer::count_distinct_bitmap_mem_size_
size_t count_distinct_bitmap_mem_size_
Definition: QueryMemoryInitializer.h:264

QueryMemoryInitializer::row_set_mem_owner_
std::shared_ptr< RowSetMemoryOwner > row_set_mem_owner_
Definition: QueryMemoryInitializer.h:252

ExecutorDispatchMode
ExecutorDispatchMode
Definition: CompilationOptions.h:29

QueryMemoryInitializer::compactProjectionBuffersGpu
void compactProjectionBuffersGpu(const QueryMemoryDescriptor &query_mem_desc, Data_Namespace::DataMgr *data_mgr, const GpuGroupByBuffers &gpu_group_by_buffers, const size_t projection_count, const int device_id)
Definition: QueryMemoryInitializer.cpp:1313

QueryMemoryInitializer::calculateCountDistinctBufferSize
std::vector< int64_t > calculateCountDistinctBufferSize(const QueryMemoryDescriptor &query_mem_desc, const RelAlgExecutionUnit &ra_exe_unit) const
Definition: QueryMemoryInitializer.cpp:865

QueryMemoryInitializer::count_distinct_bitmap_host_mem_ptr_
int8_t * count_distinct_bitmap_host_mem_ptr_
Definition: QueryMemoryInitializer.h:266

QueryMemoryInitializer::init_agg_vals_
std::vector< int64_t > init_agg_vals_
Definition: QueryMemoryInitializer.h:255

QueryMemoryInitializer::getResultSetOwned
std::unique_ptr< ResultSet > getResultSetOwned(const size_t index)
Definition: QueryMemoryInitializer.h:101

QueryMemoryInitializer::applyStreamingTopNOffsetCpu
void applyStreamingTopNOffsetCpu(const QueryMemoryDescriptor &query_mem_desc, const RelAlgExecutionUnit &ra_exe_unit)
Definition: QueryMemoryInitializer.cpp:1372

RenderInfo
Definition: RenderInfo.h:31

QueryMemoryInitializer::getAggInitValForIndex
int64_t getAggInitValForIndex(const size_t index) const
Definition: QueryMemoryInitializer.h:111

RenderAllocator
Definition: RenderAllocator.h:52

QueryMemoryInitializer::initColumnarGroups
void initColumnarGroups(const QueryMemoryDescriptor &query_mem_desc, int64_t *groups_buffer, const std::vector< int64_t > &init_vals, const Executor *executor, const RelAlgExecutionUnit &ra_exe_unit)
Definition: QueryMemoryInitializer.cpp:704

TableFunctionExecutionUnit
Definition: RelAlgExecutionUnit.h:209

QueryMemoryInitializer::varlen_output_buffer_host_ptr_
int8_t * varlen_output_buffer_host_ptr_
Definition: QueryMemoryInitializer.h:261

QueryMemoryInitializer::allocateCountDistinctSet
int64_t allocateCountDistinctSet()
Definition: QueryMemoryInitializer.cpp:925

QueryMemoryInitializer::compactProjectionBuffersCpu
void compactProjectionBuffersCpu(const QueryMemoryDescriptor &query_mem_desc, const size_t projection_count)
Definition: QueryMemoryInitializer.cpp:1295

QueryMemoryInitializer::group_by_buffers_
std::vector< int64_t * > group_by_buffers_
Definition: QueryMemoryInitializer.h:258

QueryMemoryInitializer::initColumnsPerRow
void initColumnsPerRow(const QueryMemoryDescriptor &query_mem_desc, int8_t *row_ptr, const std::vector< int64_t > &init_vals, const TargetAggOpsMetadata &agg_op_metadata)
Definition: QueryMemoryInitializer.cpp:770

QueryMemoryInitializer::copyGroupByBuffersFromGpu
void copyGroupByBuffersFromGpu(DeviceAllocator &device_allocator, const QueryMemoryDescriptor &query_mem_desc, const size_t entry_count, const GpuGroupByBuffers &gpu_group_by_buffers, const RelAlgExecutionUnit *ra_exe_unit, const unsigned block_size_x, const unsigned grid_size_x, const int device_id, const bool prepend_index_buffer) const
Definition: QueryMemoryInitializer.cpp:1338

Data_Namespace::DataMgr
Definition: DataMgr.h:125

CHECK_LT
#define CHECK_LT(x, y)
Definition: Logger.h:303

QueryMemoryInitializer::getVarlenOutputInfo
std::shared_ptr< VarlenOutputInfo > getVarlenOutputInfo()
Definition: QueryMemoryInitializer.cpp:1415

QueryMemoryInitializer::num_rows_
const int64_t num_rows_
Definition: QueryMemoryInitializer.h:251

RenderAllocatorMap
Definition: RenderAllocator.h:80

QueryMemoryInitializer::initGroupByBuffer
void initGroupByBuffer(int64_t *buffer, const RelAlgExecutionUnit &ra_exe_unit, const QueryMemoryDescriptor &query_mem_desc, TargetAggOpsMetadata &agg_expr_metadata, const ExecutorDeviceType device_type, const bool output_columnar, const Executor *executor)
Definition: QueryMemoryInitializer.cpp:568

QueryMemoryInitializer::getNumBuffers
const auto getNumBuffers() const
Definition: QueryMemoryInitializer.h:122

QueryMemoryInitializer::allocateTDigestsBuffer
void allocateTDigestsBuffer(const QueryMemoryDescriptor &query_mem_desc, const RelAlgExecutionUnit &ra_exe_unit)
Definition: QueryMemoryInitializer.cpp:981

QueryMemoryInitializer::allocateModeBuffer
void allocateModeBuffer(const QueryMemoryDescriptor &query_mem_desc, const RelAlgExecutionUnit &ra_exe_unit)
Definition: QueryMemoryInitializer.cpp:946

QueryMemoryInitializer
Definition: QueryMemoryInitializer.h:35

QueryMemoryInitializer::ModeIndexSet
robin_hood::unordered_set< size_t > ModeIndexSet
Definition: QueryMemoryInitializer.h:37

QueryMemoryInitializer::thread_idx_
const size_t thread_idx_
Definition: QueryMemoryInitializer.h:271

DeviceAllocator.h
Abstract class for managing device memory allocations.

QueryMemoryInitializer::getCountDistinctBitmapBytes
const auto getCountDistinctBitmapBytes() const
Definition: QueryMemoryInitializer.h:87

QueryMemoryInitializer::TargetAggOpsMetadata::mode_index_set
ModeIndexSet mode_index_set
Definition: QueryMemoryInitializer.h:44

QueryMemoryDescriptor.h
Descriptor for the result set buffer layout.

GpuGroupByBuffers
Definition: GpuMemUtils.h:55

GpuMemUtils.h

QueryMemoryInitializer::TargetAggOpsMetadata
Definition: QueryMemoryInitializer.h:39

QueryMemoryInitializer::TargetAggOpsMetadata::count_distinct_buf_size
std::vector< int64_t > count_distinct_buf_size
Definition: QueryMemoryInitializer.h:43

QueryMemoryInitializer::getVarlenOutputPtr
const auto getVarlenOutputPtr() const
Definition: QueryMemoryInitializer.h:94

QueryMemoryInitializer::temporary_buffers_
std::vector< Data_Namespace::AbstractBuffer * > temporary_buffers_
Definition: QueryMemoryInitializer.h:269

RenderAllocator.h

QueryMemoryInitializer::copyFromTableFunctionGpuBuffers
void copyFromTableFunctionGpuBuffers(Data_Namespace::DataMgr *data_mgr, const QueryMemoryDescriptor &query_mem_desc, const size_t entry_count, const GpuGroupByBuffers &gpu_group_by_buffers, const int device_id, const unsigned block_size_x, const unsigned grid_size_x)
Definition: QueryMemoryInitializer.cpp:1214

QueryMemoryInitializer::applyStreamingTopNOffsetGpu
void applyStreamingTopNOffsetGpu(Data_Namespace::DataMgr *data_mgr, const QueryMemoryDescriptor &query_mem_desc, const GpuGroupByBuffers &gpu_group_by_buffers, const RelAlgExecutionUnit &ra_exe_unit, const unsigned total_thread_count, const int device_id)
Definition: QueryMemoryInitializer.cpp:1388

QueryMemoryInitializer::getGroupByBuffersSize
const auto getGroupByBuffersSize() const
Definition: QueryMemoryInitializer.h:120

ResultSet.h
Basic constructors and methods of the row set interface.

QueryMemoryInitializer::getCountDistinctBitmapDevicePtr
const auto getCountDistinctBitmapDevicePtr() const
Definition: QueryMemoryInitializer.h:79

QueryMemoryInitializer::varlen_output_info_
std::shared_ptr< VarlenOutputInfo > varlen_output_info_
Definition: QueryMemoryInitializer.h:259

QueryMemoryInitializer::TargetAggOpsMetadata::has_mode
bool has_mode
Definition: QueryMemoryInitializer.h:41

anonymous_namespace{Utm.h}::n
constexpr double n
Definition: Utm.h:38

QueryMemoryInitializer::count_distinct_bitmap_host_crt_ptr_
int8_t * count_distinct_bitmap_host_crt_ptr_
Definition: QueryMemoryInitializer.h:265

QueryMemoryInitializer::varlen_output_buffer_
CUdeviceptr varlen_output_buffer_
Definition: QueryMemoryInitializer.h:260

shared::TableKey
Definition: DbObjectKeys.h:51

QueryMemoryInitializer::getResultSet
ResultSet * getResultSet(const size_t index) const
Definition: QueryMemoryInitializer.h:96

QueryMemoryInitializer::result_sets_
std::vector< std::unique_ptr< ResultSet > > result_sets_
Definition: QueryMemoryInitializer.h:253

QueryMemoryInitializer::initRowGroups
void initRowGroups(const QueryMemoryDescriptor &query_mem_desc, int64_t *groups_buffer, const std::vector< int64_t > &init_vals, TargetAggOpsMetadata &agg_expr_metadata, const int32_t groups_buffer_entry_count, const size_t warp_size, const Executor *executor, const RelAlgExecutionUnit &ra_exe_unit)
Definition: QueryMemoryInitializer.cpp:608

QueryMemoryInitializer::allocateCountDistinctGpuMem
void allocateCountDistinctGpuMem(const QueryMemoryDescriptor &query_mem_desc)
Definition: QueryMemoryInitializer.cpp:835

query_mem_desc
query_mem_desc
Definition: QueryMemoryInitializer.cpp:479

QueryMemoryInitializer::getVarlenOutputHostPtr
const auto getVarlenOutputHostPtr() const
Definition: QueryMemoryInitializer.h:92

QueryMemoryInitializer::allocateCountDistinctBitmap
int64_t allocateCountDistinctBitmap(const size_t bitmap_byte_sz)
Definition: QueryMemoryInitializer.cpp:912

RelAlgExecutionUnit
Definition: RelAlgExecutionUnit.h:165

QueryExecutionContext
Definition: QueryExecutionContext.h:38

QueryMemoryInitializer::TargetAggOpsMetadata::quantile_params
std::vector< QuantileParam > quantile_params
Definition: QueryMemoryInitializer.h:45