_gpu_mem_utils_8h_source.html

 /*

  * Copyright 2022 HEAVY.AI, Inc.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  *     http://www.apache.org/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #ifndef QUERYENGINE_GPUMEMUTILS_H

 #define QUERYENGINE_GPUMEMUTILS_H


 #include "CompilationOptions.h"


 #include <cstddef>

 #include <cstdint>

 #include <memory>

 #include <utility>

 #include <vector>


 #ifdef HAVE_CUDA

 #include <cuda.h>

 #else

 #include "../Shared/nocuda.h"

 #endif  // HAVE_CUDA


 namespace CudaMgr_Namespace {


 class CudaMgr;


 }  // namespace CudaMgr_Namespace


 namespace Data_Namespace {


 class AbstractBuffer;

 class DataMgr;


 }  // namespace Data_Namespace


 class DeviceAllocator;


 void copy_to_nvidia_gpu(Data_Namespace::DataMgr* data_mgr,

                         CUdeviceptr dst,

                         const void* src,

                         const size_t num_bytes,

                         const int device_id);


 struct GpuGroupByBuffers {

   int8_t* ptrs;  // ptrs for individual outputs

   int8_t* data;  // ptr to data allocation

   size_t entry_count;

   int8_t* varlen_output_buffer;

 };


 class QueryMemoryDescriptor;

 class DeviceAllocator;

 class Allocator;


 GpuGroupByBuffers create_dev_group_by_buffers(

     DeviceAllocator* device_allocator,

     const std::vector<int64_t*>& group_by_buffers,

     const QueryMemoryDescriptor&,

     const unsigned block_size_x,

     const unsigned grid_size_x,

     const int device_id,

     const ExecutorDispatchMode dispatch_mode,

     const int64_t num_input_rows,

     const bool prepend_index_buffer,

     const bool always_init_group_by_on_host,

     const bool use_bump_allocator,

     const bool has_varlen_output,

     Allocator* insitu_allocator);


 void copy_group_by_buffers_from_gpu(DeviceAllocator& device_allocator,

                                     const std::vector<int64_t*>& group_by_buffers,

                                     const size_t groups_buffer_size,

                                     const int8_t* group_by_dev_buffers_mem,

                                     const QueryMemoryDescriptor& query_mem_desc,

                                     const unsigned block_size_x,

                                     const unsigned grid_size_x,

                                     const int device_id,

                                     const bool prepend_index_buffer,

                                     const bool has_varlen_output);


 size_t get_num_allocated_rows_from_gpu(DeviceAllocator& device_allocator,

                                        int8_t* projection_size_gpu,

                                        const int device_id);


 void copy_projection_buffer_from_gpu_columnar(Data_Namespace::DataMgr* data_mgr,

                                               const GpuGroupByBuffers& gpu_query_buffers,

                                               const QueryMemoryDescriptor& query_mem_desc,

                                               int8_t* projection_buffer,

                                               const size_t projection_count,

                                               const int device_id);


 #endif  // QUERYENGINE_GPUMEMUTILS_H

create_dev_group_by_buffers
GpuGroupByBuffers create_dev_group_by_buffers(DeviceAllocator *device_allocator, const std::vector< int64_t * > &group_by_buffers, const QueryMemoryDescriptor &query_mem_desc, const unsigned block_size_x, const unsigned grid_size_x, const int device_id, const ExecutorDispatchMode dispatch_mode, const int64_t num_input_rows, const bool prepend_index_buffer, const bool always_init_group_by_on_host, const bool use_bump_allocator, const bool has_varlen_output, Allocator *insitu_allocator)
Definition: GpuMemUtils.cpp:70

get_num_allocated_rows_from_gpu
size_t get_num_allocated_rows_from_gpu(DeviceAllocator &device_allocator, int8_t *projection_size_gpu, const int device_id)
Definition: GpuMemUtils.cpp:277

QueryMemoryDescriptor
Definition: QueryMemoryDescriptor.h:68

CUdeviceptr
unsigned long long CUdeviceptr
Definition: nocuda.h:28

DeviceAllocator
Definition: DeviceAllocator.h:45

GpuGroupByBuffers::entry_count
size_t entry_count
Definition: GpuMemUtils.h:58

ExecutorDispatchMode
ExecutorDispatchMode
Definition: CompilationOptions.h:29

Data_Namespace::DataMgr
Definition: DataMgr.h:125

GpuGroupByBuffers::ptrs
int8_t * ptrs
Definition: GpuMemUtils.h:56

Allocator
Definition: DeviceAllocator.h:37

GpuGroupByBuffers
Definition: GpuMemUtils.h:55

copy_to_nvidia_gpu
void copy_to_nvidia_gpu(Data_Namespace::DataMgr *data_mgr, CUdeviceptr dst, const void *src, const size_t num_bytes, const int device_id)
Definition: GpuMemUtils.cpp:35

CompilationOptions.h

copy_projection_buffer_from_gpu_columnar
void copy_projection_buffer_from_gpu_columnar(Data_Namespace::DataMgr *data_mgr, const GpuGroupByBuffers &gpu_group_by_buffers, const QueryMemoryDescriptor &query_mem_desc, int8_t *projection_buffer, const size_t projection_count, const int device_id)
Definition: GpuMemUtils.cpp:293

GpuGroupByBuffers::data
int8_t * data
Definition: GpuMemUtils.h:57

copy_group_by_buffers_from_gpu
void copy_group_by_buffers_from_gpu(DeviceAllocator &device_allocator, const std::vector< int64_t * > &group_by_buffers, const size_t groups_buffer_size, const int8_t *group_by_dev_buffers_mem, const QueryMemoryDescriptor &query_mem_desc, const unsigned block_size_x, const unsigned grid_size_x, const int device_id, const bool prepend_index_buffer, const bool has_varlen_output)
Definition: GpuMemUtils.cpp:228

query_mem_desc
query_mem_desc
Definition: QueryMemoryInitializer.cpp:479

GpuGroupByBuffers::varlen_output_buffer
int8_t * varlen_output_buffer
Definition: GpuMemUtils.h:59