_fixed_length_array_none_encoder_8h_source.html

 /*

  * Copyright 2022 HEAVY.AI, Inc.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  *     http://www.apache.org/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #ifndef FIXED_LENGTH_ARRAY_NONE_ENCODER_H

 #define FIXED_LENGTH_ARRAY_NONE_ENCODER_H


 #include "Logger/Logger.h"


 #include <cassert>

 #include <cstring>

 #include <memory>

 #include <mutex>

 #include <string>

 #include <vector>

 #include "AbstractBuffer.h"

 #include "ChunkMetadata.h"

 #include "Encoder.h"


 using Data_Namespace::AbstractBuffer;


 class FixedLengthArrayNoneEncoder : public Encoder {

  public:

   FixedLengthArrayNoneEncoder(AbstractBuffer* buffer, size_t as)

       : Encoder(buffer), has_nulls(false), initialized(false), array_size(as) {}


   size_t getNumElemsForBytesEncodedDataAtIndices(const int8_t* index_data,

                                                  const std::vector<size_t>& selected_idx,

                                                  const size_t byte_limit) override {

     size_t data_size = selected_idx.size() * array_size;

     if (data_size > byte_limit) {

       data_size = byte_limit;

     }

     return data_size / array_size;

   }


   size_t getNumElemsForBytesInsertData(const std::vector<ArrayDatum>* srcData,

                                        const int start_idx,

                                        const size_t numAppendElems,

                                        const size_t byteLimit,

                                        const bool replicating = false) {

     size_t dataSize = numAppendElems * array_size;

     if (dataSize > byteLimit) {

       dataSize = byteLimit;

     }

     return dataSize / array_size;

   }


   std::shared_ptr<ChunkMetadata> appendEncodedDataAtIndices(

       const int8_t* index_data,

       int8_t* data,

       const std::vector<size_t>& selected_idx) override {

     std::vector<ArrayDatum> data_subset;

     data_subset.reserve(selected_idx.size());

     for (const auto& index : selected_idx) {

       auto current_data = data + array_size * (index);

       data_subset.emplace_back(ArrayDatum(array_size,

                                           current_data,

                                           is_null_ignore_not_null(current_data),

                                           DoNothingDeleter{}));

     }

     return appendData(&data_subset, 0, selected_idx.size(), false);

   }


   std::shared_ptr<ChunkMetadata> appendEncodedData(const int8_t* index_data,

                                                    int8_t* data,

                                                    const size_t start_idx,

                                                    const size_t num_elements) override {

     std::vector<ArrayDatum> data_subset;

     data_subset.reserve(num_elements);

     for (size_t count = 0; count < num_elements; ++count) {

       auto current_data = data + array_size * (start_idx + count);

       data_subset.emplace_back(

           ArrayDatum(array_size, current_data, false, DoNothingDeleter{}));

     }

     return appendData(&data_subset, 0, num_elements, false);

   }


   std::shared_ptr<ChunkMetadata> appendData(int8_t*& src_data,

                                             const size_t num_elems_to_append,

                                             const SQLTypeInfo& ti,

                                             const bool replicating = false,

                                             const int64_t offset = -1) override {

     UNREACHABLE();  // should never be called for arrays

     return nullptr;

   }


   std::shared_ptr<ChunkMetadata> appendData(const std::vector<ArrayDatum>* srcData,

                                             const int start_idx,

                                             const size_t numAppendElems,

                                             const bool replicating = false) {

     const size_t existing_data_size = num_elems_ * array_size;

     const size_t append_data_size = array_size * numAppendElems;

     buffer_->reserve(existing_data_size + append_data_size);

     std::vector<int8_t> append_buffer(append_data_size);

     int8_t* append_ptr = append_buffer.data();


     // There was some worry about the change implemented to write the append data to an

     // intermediate buffer, but testing on import and ctas of 20M points, we never append

     // more than 1.6MB and 1MB of data at a time, respectively, so at least for fixed

     // length types this should not be an issue (varlen types, which can be massive even

     // for a single field/row, are a different story however)


     if (replicating) {

       const size_t len = (*srcData)[0].length;

       CHECK_EQ(len, array_size);

       const int8_t* replicated_ptr = (*srcData)[0].pointer;

       for (size_t i = 0; i < numAppendElems; ++i) {

         std::memcpy(append_ptr + i * array_size, replicated_ptr, array_size);

       }

     } else {

       for (size_t i = 0; i < numAppendElems; ++i) {

         // Length of the appended array should be equal to the fixed length,

         // all others should have been discarded, assert if something slips through

         const size_t source_idx = start_idx + i;

         const size_t len = (*srcData)[source_idx].length;

         CHECK_EQ(len, array_size);

         // NULL arrays have been filled with subtype's NULL sentinels,

         // should be appended as regular data, same size

         std::memcpy(

             append_ptr + i * array_size, (*srcData)[source_idx].pointer, array_size);

       }

     }


     buffer_->append(append_ptr, append_data_size);


     if (replicating) {

       updateStats(srcData, 0, 1);

     } else {

       updateStats(srcData, start_idx, numAppendElems);

     }


     // make sure buffer_ is flushed even if no new data is appended to it

     // (e.g. empty strings) because the metadata needs to be flushed.

     if (!buffer_->isDirty()) {

       buffer_->setDirty();

     }


     num_elems_ += numAppendElems;

     auto chunk_metadata = std::make_shared<ChunkMetadata>();

     getMetadata(chunk_metadata);

     return chunk_metadata;

   }


   void getMetadata(const std::shared_ptr<ChunkMetadata>& chunkMetadata) override {

     Encoder::getMetadata(chunkMetadata);  // call on parent class

     chunkMetadata->fillChunkStats(elem_min, elem_max, has_nulls);

   }


   // Only called from the executor for synthesized meta-information.

   std::shared_ptr<ChunkMetadata> getMetadata(const SQLTypeInfo& ti) override {

     auto chunk_metadata = std::make_shared<ChunkMetadata>(

         ti, 0, 0, ChunkStats{elem_min, elem_max, has_nulls});

     return chunk_metadata;

   }


   void updateStats(const int64_t, const bool) override { CHECK(false); }


   void updateStats(const double, const bool) override { CHECK(false); }


   void reduceStats(const Encoder&) override { CHECK(false); }


   void updateStats(const int8_t* const src_data, const size_t num_elements) override {

     UNREACHABLE();

   }


   void updateStats(const std::vector<std::string>* const src_data,

                    const size_t start_idx,

                    const size_t num_elements) override {

     UNREACHABLE();

   }


   void updateStats(const std::vector<ArrayDatum>* const src_data,

                    const size_t start_idx,

                    const size_t num_elements) override {

     for (size_t n = start_idx; n < start_idx + num_elements; n++) {

       update_elem_stats((*src_data)[n]);

     }

   }


   void writeMetadata(FILE* f) override {

     // assumes pointer is already in right place

     fwrite((int8_t*)&num_elems_, sizeof(size_t), 1, f);

     fwrite((int8_t*)&elem_min, sizeof(Datum), 1, f);

     fwrite((int8_t*)&elem_max, sizeof(Datum), 1, f);

     fwrite((int8_t*)&has_nulls, sizeof(bool), 1, f);

     fwrite((int8_t*)&initialized, sizeof(bool), 1, f);

   }


   void readMetadata(FILE* f) override {

     // assumes pointer is already in right place

     fread((int8_t*)&num_elems_, sizeof(size_t), 1, f);

     fread((int8_t*)&elem_min, sizeof(Datum), 1, f);

     fread((int8_t*)&elem_max, sizeof(Datum), 1, f);

     fread((int8_t*)&has_nulls, sizeof(bool), 1, f);

     fread((int8_t*)&initialized, sizeof(bool), 1, f);

   }


   void copyMetadata(const Encoder* copyFromEncoder) override {

     num_elems_ = copyFromEncoder->getNumElems();

     auto array_encoder =

         dynamic_cast<const FixedLengthArrayNoneEncoder*>(copyFromEncoder);

     elem_min = array_encoder->elem_min;

     elem_max = array_encoder->elem_max;

     has_nulls = array_encoder->has_nulls;

     initialized = array_encoder->initialized;

   }


   void updateMetadata(int8_t* array) {

     update_elem_stats(ArrayDatum(array_size, array, is_null(array), DoNothingDeleter()));

   }


   static bool is_null_ignore_not_null(const SQLTypeInfo& type, int8_t* array) {

     switch (type.get_subtype()) {

       case kBOOLEAN: {

         return (array[0] == NULL_ARRAY_BOOLEAN);

       }

       case kINT: {

         const int32_t* int_array = (int32_t*)array;

         return (int_array[0] == NULL_ARRAY_INT);

       }

       case kSMALLINT: {

         const int16_t* smallint_array = (int16_t*)array;

         return (smallint_array[0] == NULL_ARRAY_SMALLINT);

       }

       case kTINYINT: {

         const int8_t* tinyint_array = (int8_t*)array;

         return (tinyint_array[0] == NULL_ARRAY_TINYINT);

       }

       case kBIGINT:

       case kNUMERIC:

       case kDECIMAL: {

         const int64_t* bigint_array = (int64_t*)array;

         return (bigint_array[0] == NULL_ARRAY_BIGINT);

       }

       case kFLOAT: {

         const float* flt_array = (float*)array;

         return (flt_array[0] == NULL_ARRAY_FLOAT);

       }

       case kDOUBLE: {

         const double* dbl_array = (double*)array;

         return (dbl_array[0] == NULL_ARRAY_DOUBLE);

       }

       case kTIME:

       case kTIMESTAMP:

       case kDATE: {

         const int64_t* tm_array = reinterpret_cast<int64_t*>(array);

         return (tm_array[0] == NULL_ARRAY_BIGINT);

       }

       case kCHAR:

       case kVARCHAR:

       case kTEXT: {

         CHECK_EQ(type.get_compression(), kENCODING_DICT);

         const int32_t* int_array = (int32_t*)array;

         return (int_array[0] == NULL_ARRAY_INT);

       }

       default:

         UNREACHABLE();

     }

     return false;

   }


   static bool is_null(const SQLTypeInfo& type, int8_t* array) {

     if (type.get_notnull()) {

       return false;

     }

     return is_null_ignore_not_null(type, array);

   }


   bool resetChunkStats(const ChunkStats& stats) override {

     auto elem_type = buffer_->getSqlType().get_elem_type();

     if (initialized && DatumEqual(elem_min, stats.min, elem_type) &&

         DatumEqual(elem_max, stats.max, elem_type) && has_nulls == stats.has_nulls) {

       return false;

     }

     elem_min = stats.min;

     elem_max = stats.max;

     has_nulls = stats.has_nulls;

     return true;

   }


   void resetChunkStats() override {

     has_nulls = false;

     initialized = false;

   }


   Datum elem_min;

   Datum elem_max;

   bool has_nulls;

   bool initialized;


  private:

   std::mutex EncoderMutex_;

   std::mutex print_mutex_;

   size_t array_size;


   bool is_null(int8_t* array) { return is_null(buffer_->getSqlType(), array); }


   bool is_null_ignore_not_null(int8_t* array) {

     return is_null_ignore_not_null(buffer_->getSqlType(), array);

   }


   void update_elem_stats(const ArrayDatum& array) {

     if (array.is_null) {

       has_nulls = true;

     }

     switch (buffer_->getSqlType().get_subtype()) {

       case kBOOLEAN: {

         if (!initialized) {

           elem_min.boolval = true;

           elem_max.boolval = false;

         }

         if (array.is_null) {

           break;

         }

         const int8_t* bool_array = array.pointer;

         for (size_t i = 0; i < array.length / sizeof(bool); i++) {

           if (bool_array[i] == NULL_BOOLEAN) {

             has_nulls = true;

           } else if (initialized) {

             elem_min.boolval = std::min(elem_min.boolval, bool_array[i]);

             elem_max.boolval = std::max(elem_max.boolval, bool_array[i]);

           } else {

             elem_min.boolval = bool_array[i];

             elem_max.boolval = bool_array[i];

             initialized = true;

           }

         }

         break;

       }

       case kINT: {

         if (!initialized) {

           elem_min.intval = 1;

           elem_max.intval = 0;

         }

         if (array.is_null) {

           break;

         }

         const int32_t* int_array = (int32_t*)array.pointer;

         for (size_t i = 0; i < array.length / sizeof(int32_t); i++) {

           if (int_array[i] == NULL_INT) {

             has_nulls = true;

           } else if (initialized) {

             elem_min.intval = std::min(elem_min.intval, int_array[i]);

             elem_max.intval = std::max(elem_max.intval, int_array[i]);

           } else {

             elem_min.intval = int_array[i];

             elem_max.intval = int_array[i];

             initialized = true;

           }

         }

         break;

       }

       case kSMALLINT: {

         if (!initialized) {

           elem_min.smallintval = 1;

           elem_max.smallintval = 0;

         }

         if (array.is_null) {

           break;

         }

         const int16_t* smallint_array = (int16_t*)array.pointer;

         for (size_t i = 0; i < array.length / sizeof(int16_t); i++) {

           if (smallint_array[i] == NULL_SMALLINT) {

             has_nulls = true;

           } else if (initialized) {

             elem_min.smallintval = std::min(elem_min.smallintval, smallint_array[i]);

             elem_max.smallintval = std::max(elem_max.smallintval, smallint_array[i]);

           } else {

             elem_min.smallintval = smallint_array[i];

             elem_max.smallintval = smallint_array[i];

             initialized = true;

           }

         }

         break;

       }

       case kTINYINT: {

         if (!initialized) {

           elem_min.tinyintval = 1;

           elem_max.tinyintval = 0;

         }

         if (array.is_null) {

           break;

         }

         const int8_t* tinyint_array = (int8_t*)array.pointer;

         for (size_t i = 0; i < array.length / sizeof(int8_t); i++) {

           if (tinyint_array[i] == NULL_TINYINT) {

             has_nulls = true;

           } else if (initialized) {

             elem_min.tinyintval = std::min(elem_min.tinyintval, tinyint_array[i]);

             elem_max.tinyintval = std::max(elem_max.tinyintval, tinyint_array[i]);

           } else {

             elem_min.tinyintval = tinyint_array[i];

             elem_max.tinyintval = tinyint_array[i];

             initialized = true;

           }

         }

         break;

       }

       case kBIGINT:

       case kNUMERIC:

       case kDECIMAL: {

         if (!initialized) {

           elem_min.bigintval = 1;

           elem_max.bigintval = 0;

         }

         if (array.is_null) {

           break;

         }

         const int64_t* bigint_array = (int64_t*)array.pointer;

         for (size_t i = 0; i < array.length / sizeof(int64_t); i++) {

           if (bigint_array[i] == NULL_BIGINT) {

             has_nulls = true;

           } else if (initialized) {

             decimal_overflow_validator_.validate(bigint_array[i]);

             elem_min.bigintval = std::min(elem_min.bigintval, bigint_array[i]);

             elem_max.bigintval = std::max(elem_max.bigintval, bigint_array[i]);

           } else {

             decimal_overflow_validator_.validate(bigint_array[i]);

             elem_min.bigintval = bigint_array[i];

             elem_max.bigintval = bigint_array[i];

             initialized = true;

           }

         }

         break;

       }

       case kFLOAT: {

         if (!initialized) {

           elem_min.floatval = 1.0;

           elem_max.floatval = 0.0;

         }

         if (array.is_null) {

           break;

         }

         const float* flt_array = (float*)array.pointer;

         for (size_t i = 0; i < array.length / sizeof(float); i++) {

           if (flt_array[i] == NULL_FLOAT) {

             has_nulls = true;

           } else if (initialized) {

             elem_min.floatval = std::min(elem_min.floatval, flt_array[i]);

             elem_max.floatval = std::max(elem_max.floatval, flt_array[i]);

           } else {

             elem_min.floatval = flt_array[i];

             elem_max.floatval = flt_array[i];

             initialized = true;

           }

         }

         break;

       }

       case kDOUBLE: {

         if (!initialized) {

           elem_min.doubleval = 1.0;

           elem_max.doubleval = 0.0;

         }

         if (array.is_null) {

           break;

         }

         const double* dbl_array = (double*)array.pointer;

         for (size_t i = 0; i < array.length / sizeof(double); i++) {

           if (dbl_array[i] == NULL_DOUBLE) {

             has_nulls = true;

           } else if (initialized) {

             elem_min.doubleval = std::min(elem_min.doubleval, dbl_array[i]);

             elem_max.doubleval = std::max(elem_max.doubleval, dbl_array[i]);

           } else {

             elem_min.doubleval = dbl_array[i];

             elem_max.doubleval = dbl_array[i];

             initialized = true;

           }

         }

         break;

       }

       case kTIME:

       case kTIMESTAMP:

       case kDATE: {

         if (!initialized) {

           elem_min.bigintval = 1;

           elem_max.bigintval = 0;

         }

         if (array.is_null) {

           break;

         }

         const int64_t* tm_array = reinterpret_cast<int64_t*>(array.pointer);

         for (size_t i = 0; i < array.length / sizeof(int64_t); i++) {

           if (tm_array[i] == NULL_BIGINT) {

             has_nulls = true;

           } else if (initialized) {

             elem_min.bigintval = std::min(elem_min.bigintval, tm_array[i]);

             elem_max.bigintval = std::max(elem_max.bigintval, tm_array[i]);

           } else {

             elem_min.bigintval = tm_array[i];

             elem_max.bigintval = tm_array[i];

             initialized = true;

           }

         }

         break;

       }

       case kCHAR:

       case kVARCHAR:

       case kTEXT: {

         CHECK_EQ(buffer_->getSqlType().get_compression(), kENCODING_DICT);

         if (!initialized) {

           elem_min.intval = 1;

           elem_max.intval = 0;

         }

         if (array.is_null) {

           break;

         }

         const int32_t* int_array = (int32_t*)array.pointer;

         for (size_t i = 0; i < array.length / sizeof(int32_t); i++) {

           if (int_array[i] == NULL_INT) {

             has_nulls = true;

           } else if (initialized) {

             elem_min.intval = std::min(elem_min.intval, int_array[i]);

             elem_max.intval = std::max(elem_max.intval, int_array[i]);

           } else {

             elem_min.intval = int_array[i];

             elem_max.intval = int_array[i];

             initialized = true;

           }

         }

         break;

       }

       default:

         UNREACHABLE();

     }

   };


 };  // class FixedLengthArrayNoneEncoder


 #endif  // FIXED_LENGTH_ARRAY_NONE_ENCODER_H

Datum::tinyintval
int8_t tinyintval
Definition: Datum.h:73

SQLTypeInfo::get_subtype
HOST DEVICE SQLTypes get_subtype() const
Definition: sqltypes.h:392

CHECK_EQ
#define CHECK_EQ(x, y)
Definition: Logger.h:301

Encoder
Definition: Encoder.h:146

NULL_DOUBLE
#define NULL_DOUBLE
Definition: InlineNullValues.h:35

FixedLengthArrayNoneEncoder::updateStats
void updateStats(const int8_t *const src_data, const size_t num_elements) override
Definition: FixedLengthArrayNoneEncoder.h:181

FixedLengthArrayNoneEncoder::EncoderMutex_
std::mutex EncoderMutex_
Definition: FixedLengthArrayNoneEncoder.h:311

Encoder::num_elems_
size_t num_elems_
Definition: Encoder.h:288

kTIME
Definition: sqltypes.h:76

FixedLengthArrayNoneEncoder::elem_max
Datum elem_max
Definition: FixedLengthArrayNoneEncoder.h:306

NULL_ARRAY_INT
#define NULL_ARRAY_INT
Definition: InlineNullValues.h:40

FixedLengthArrayNoneEncoder::is_null
bool is_null(int8_t *array)
Definition: FixedLengthArrayNoneEncoder.h:315

NULL_FLOAT
#define NULL_FLOAT
Definition: InlineNullValues.h:34

FixedLengthArrayNoneEncoder::is_null_ignore_not_null
bool is_null_ignore_not_null(int8_t *array)
Definition: FixedLengthArrayNoneEncoder.h:317

Encoder::decimal_overflow_validator_
DecimalOverflowValidator decimal_overflow_validator_
Definition: Encoder.h:292

NULL_BIGINT
#define NULL_BIGINT
Definition: InlineNullValues.h:33

FixedLengthArrayNoneEncoder::appendEncodedData
std::shared_ptr< ChunkMetadata > appendEncodedData(const int8_t *index_data, int8_t *data, const size_t start_idx, const size_t num_elements) override
Definition: FixedLengthArrayNoneEncoder.h:83

NULL_ARRAY_SMALLINT
#define NULL_ARRAY_SMALLINT
Definition: InlineNullValues.h:39

Datum::boolval
int8_t boolval
Definition: Datum.h:72

UNREACHABLE
#define UNREACHABLE()
Definition: Logger.h:338

kFLOAT
Definition: sqltypes.h:74

ChunkStats::has_nulls
bool has_nulls
Definition: ChunkMetadata.h:30

report.stats
dictionary stats
Definition: report.py:116

NULL_ARRAY_TINYINT
#define NULL_ARRAY_TINYINT
Definition: InlineNullValues.h:38

AbstractBuffer.h

Datum::intval
int32_t intval
Definition: Datum.h:75

Data_Namespace::AbstractBuffer::isDirty
bool isDirty() const
Definition: AbstractBuffer.h:98

FixedLengthArrayNoneEncoder::resetChunkStats
void resetChunkStats() override
Definition: FixedLengthArrayNoneEncoder.h:300

NULL_INT
#define NULL_INT
Definition: InlineNullValues.h:32

FixedLengthArrayNoneEncoder::updateMetadata
void updateMetadata(int8_t *array)
Definition: FixedLengthArrayNoneEncoder.h:227

Encoder::getMetadata
virtual void getMetadata(const std::shared_ptr< ChunkMetadata > &chunkMetadata)
Definition: Encoder.cpp:231

FixedLengthArrayNoneEncoder::updateStats
void updateStats(const double, const bool) override
Definition: FixedLengthArrayNoneEncoder.h:177

kBOOLEAN
Definition: sqltypes.h:67

ArrayDatum
std::conditional_t< is_cuda_compiler(), DeviceArrayDatum, HostArrayDatum > ArrayDatum
Definition: sqltypes.h:229

kDOUBLE
Definition: sqltypes.h:75

Datum::floatval
float floatval
Definition: Datum.h:77

FixedLengthArrayNoneEncoder::FixedLengthArrayNoneEncoder
FixedLengthArrayNoneEncoder(AbstractBuffer *buffer, size_t as)
Definition: FixedLengthArrayNoneEncoder.h:42

FixedLengthArrayNoneEncoder::getMetadata
void getMetadata(const std::shared_ptr< ChunkMetadata > &chunkMetadata) override
Definition: FixedLengthArrayNoneEncoder.h:163

FixedLengthArrayNoneEncoder::appendData
std::shared_ptr< ChunkMetadata > appendData(int8_t *&src_data, const size_t num_elems_to_append, const SQLTypeInfo &ti, const bool replicating=false, const int64_t offset=-1) override
Definition: FixedLengthArrayNoneEncoder.h:97

Encoder::buffer_
Data_Namespace::AbstractBuffer * buffer_
Definition: Encoder.h:290

ChunkMetadata.h

FixedLengthArrayNoneEncoder::getMetadata
std::shared_ptr< ChunkMetadata > getMetadata(const SQLTypeInfo &ti) override
Definition: FixedLengthArrayNoneEncoder.h:169

DatumEqual
bool DatumEqual(const Datum a, const Datum b, const SQLTypeInfo &ti)
Definition: Datum.cpp:408

FixedLengthArrayNoneEncoder::elem_min
Datum elem_min
Definition: FixedLengthArrayNoneEncoder.h:305

FixedLengthArrayNoneEncoder::getNumElemsForBytesEncodedDataAtIndices
size_t getNumElemsForBytesEncodedDataAtIndices(const int8_t *index_data, const std::vector< size_t > &selected_idx, const size_t byte_limit) override
Definition: FixedLengthArrayNoneEncoder.h:45

FixedLengthArrayNoneEncoder::copyMetadata
void copyMetadata(const Encoder *copyFromEncoder) override
Definition: FixedLengthArrayNoneEncoder.h:217

Datum::bigintval
int64_t bigintval
Definition: Datum.h:76

Logger.h

Encoder::getNumElems
size_t getNumElems() const
Definition: Encoder.h:284

NULL_ARRAY_FLOAT
#define NULL_ARRAY_FLOAT
Definition: InlineNullValues.h:42

FixedLengthArrayNoneEncoder::array_size
size_t array_size
Definition: FixedLengthArrayNoneEncoder.h:313

FixedLengthArrayNoneEncoder::appendEncodedDataAtIndices
std::shared_ptr< ChunkMetadata > appendEncodedDataAtIndices(const int8_t *index_data, int8_t *data, const std::vector< size_t > &selected_idx) override
Definition: FixedLengthArrayNoneEncoder.h:67

Datum::smallintval
int16_t smallintval
Definition: Datum.h:74

Data_Namespace::AbstractBuffer
An AbstractBuffer is a unit of data management for a data manager.
Definition: AbstractBuffer.h:48

FixedLengthArrayNoneEncoder::writeMetadata
void writeMetadata(FILE *f) override
Definition: FixedLengthArrayNoneEncoder.h:199

kBIGINT
Definition: sqltypes.h:78

FixedLengthArrayNoneEncoder::readMetadata
void readMetadata(FILE *f) override
Definition: FixedLengthArrayNoneEncoder.h:208

NULL_BOOLEAN
#define NULL_BOOLEAN
Definition: InlineNullValues.h:29

FixedLengthArrayNoneEncoder::has_nulls
bool has_nulls
Definition: FixedLengthArrayNoneEncoder.h:307

Data_Namespace::AbstractBuffer::setDirty
void setDirty()
Definition: AbstractBuffer.h:109

kTEXT
Definition: sqltypes.h:79

kDATE
Definition: sqltypes.h:80

FixedLengthArrayNoneEncoder::updateStats
void updateStats(const std::vector< std::string > *const src_data, const size_t start_idx, const size_t num_elements) override
Definition: FixedLengthArrayNoneEncoder.h:185

SQLTypeInfo::get_compression
HOST DEVICE EncodingType get_compression() const
Definition: sqltypes.h:399

kTINYINT
Definition: sqltypes.h:88

FixedLengthArrayNoneEncoder::print_mutex_
std::mutex print_mutex_
Definition: FixedLengthArrayNoneEncoder.h:312

FixedLengthArrayNoneEncoder::initialized
bool initialized
Definition: FixedLengthArrayNoneEncoder.h:308

kSMALLINT
Definition: sqltypes.h:73

DoNothingDeleter
Definition: sqltypes.h:183

f
torch::Tensor f(torch::Tensor x, torch::Tensor W_target, torch::Tensor b_target)
Definition: TestTorchTableFunctions.cpp:103

kTIMESTAMP
Definition: sqltypes.h:77

kDECIMAL
Definition: sqltypes.h:71

kCHAR
Definition: sqltypes.h:68

ChunkStats
Definition: ChunkMetadata.h:27

Data_Namespace::AbstractBuffer::append
virtual void append(int8_t *src, const size_t num_bytes, const MemoryLevel src_buffer_type=CPU_LEVEL, const int device_id=-1)=0

Data_Namespace::AbstractBuffer::getSqlType
SQLTypeInfo getSqlType() const
Definition: AbstractBuffer.h:102

NULL_TINYINT
#define NULL_TINYINT
Definition: InlineNullValues.h:30

NULL_ARRAY_DOUBLE
#define NULL_ARRAY_DOUBLE
Definition: InlineNullValues.h:43

FixedLengthArrayNoneEncoder::update_elem_stats
void update_elem_stats(const ArrayDatum &array)
Definition: FixedLengthArrayNoneEncoder.h:321

FixedLengthArrayNoneEncoder::reduceStats
void reduceStats(const Encoder &) override
Definition: FixedLengthArrayNoneEncoder.h:179

false
bool g_enable_watchdog false
Definition: Execute.cpp:80

CHECK
#define CHECK(condition)
Definition: Logger.h:291

SQLTypeInfo
Definition: sqltypes.h:332

FixedLengthArrayNoneEncoder::updateStats
void updateStats(const int64_t, const bool) override
Definition: FixedLengthArrayNoneEncoder.h:175

NULL_SMALLINT
#define NULL_SMALLINT
Definition: InlineNullValues.h:31

Encoder.h

ChunkStats::min
Datum min
Definition: ChunkMetadata.h:28

NULL_ARRAY_BIGINT
#define NULL_ARRAY_BIGINT
Definition: InlineNullValues.h:41

kVARCHAR
Definition: sqltypes.h:69

FixedLengthArrayNoneEncoder::is_null
static bool is_null(const SQLTypeInfo &type, int8_t *array)
Definition: FixedLengthArrayNoneEncoder.h:281

kNUMERIC
Definition: sqltypes.h:70

kINT
Definition: sqltypes.h:72

kENCODING_DICT
Definition: sqltypes.h:245

FixedLengthArrayNoneEncoder::updateStats
void updateStats(const std::vector< ArrayDatum > *const src_data, const size_t start_idx, const size_t num_elements) override
Definition: FixedLengthArrayNoneEncoder.h:191

NULL_ARRAY_BOOLEAN
#define NULL_ARRAY_BOOLEAN
Definition: InlineNullValues.h:37

anonymous_namespace{Utm.h}::n
constexpr double n
Definition: Utm.h:38

SQLTypeInfo::get_notnull
HOST DEVICE bool get_notnull() const
Definition: sqltypes.h:398

FixedLengthArrayNoneEncoder::is_null_ignore_not_null
static bool is_null_ignore_not_null(const SQLTypeInfo &type, int8_t *array)
Definition: FixedLengthArrayNoneEncoder.h:231

FixedLengthArrayNoneEncoder::getNumElemsForBytesInsertData
size_t getNumElemsForBytesInsertData(const std::vector< ArrayDatum > *srcData, const int start_idx, const size_t numAppendElems, const size_t byteLimit, const bool replicating=false)
Definition: FixedLengthArrayNoneEncoder.h:55

DecimalOverflowValidator::validate
void validate(T value) const
Definition: Encoder.h:54

Datum
Definition: Datum.h:71

ChunkStats::max
Datum max
Definition: ChunkMetadata.h:29

SQLTypeInfo::get_elem_type
SQLTypeInfo get_elem_type() const
Definition: sqltypes.h:977

Data_Namespace::AbstractBuffer::reserve
virtual void reserve(size_t num_bytes)=0

FixedLengthArrayNoneEncoder
Definition: FixedLengthArrayNoneEncoder.h:40

Datum::doubleval
double doubleval
Definition: Datum.h:78

FixedLengthArrayNoneEncoder::appendData
std::shared_ptr< ChunkMetadata > appendData(const std::vector< ArrayDatum > *srcData, const int start_idx, const size_t numAppendElems, const bool replicating=false)
Definition: FixedLengthArrayNoneEncoder.h:106

FixedLengthArrayNoneEncoder::resetChunkStats
bool resetChunkStats(const ChunkStats &stats) override
: Reset chunk level stats (min, max, nulls) using new values from the argument.
Definition: FixedLengthArrayNoneEncoder.h:288

run_benchmark_import.type
type
Definition: run_benchmark_import.py:89