_join_filter_push_down_8cpp_source.html

 /*

  * Copyright 2022 HEAVY.AI, Inc.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  *     http://www.apache.org/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #include "JoinFilterPushDown.h"

 #include "DeepCopyVisitor.h"

 #include "RelAlgExecutor.h"


 namespace {


 class BindFilterToOutermostVisitor : public DeepCopyVisitor {

   std::shared_ptr<Analyzer::Expr> visitColumnVar(

       const Analyzer::ColumnVar* col_var) const override {

     return makeExpr<Analyzer::ColumnVar>(

         col_var->get_type_info(), col_var->getColumnKey(), 0);

   }

 };


 class CollectInputColumnsVisitor

     : public ScalarExprVisitor<std::unordered_set<InputColDescriptor>> {

   std::unordered_set<InputColDescriptor> visitColumnVar(

       const Analyzer::ColumnVar* col_var) const override {

     const auto& column_key = col_var->getColumnKey();

     return {InputColDescriptor(

         column_key.column_id, column_key.table_id, column_key.db_id, 0)};

   }


  public:

   std::unordered_set<InputColDescriptor> aggregateResult(

       const std::unordered_set<InputColDescriptor>& aggregate,

       const std::unordered_set<InputColDescriptor>& next_result) const override {

     auto result = aggregate;

     result.insert(next_result.begin(), next_result.end());

     return result;

   }

 };


 }  // namespace


 FilterSelectivity RelAlgExecutor::getFilterSelectivity(

     const std::vector<std::shared_ptr<Analyzer::Expr>>& filter_expressions,

     const CompilationOptions& co,

     const ExecutionOptions& eo) {

   CollectInputColumnsVisitor input_columns_visitor;

   std::list<std::shared_ptr<Analyzer::Expr>> quals;

   std::unordered_set<InputColDescriptor> input_column_descriptors;

   BindFilterToOutermostVisitor bind_filter_to_outermost;

   for (const auto& filter_expr : filter_expressions) {

     input_column_descriptors = input_columns_visitor.aggregateResult(

         input_column_descriptors, input_columns_visitor.visit(filter_expr.get()));

     quals.push_back(bind_filter_to_outermost.visit(filter_expr.get()));

   }

   std::vector<InputDescriptor> input_descs;

   std::list<std::shared_ptr<const InputColDescriptor>> input_col_descs;

   for (const auto& input_col_desc : input_column_descriptors) {

     if (input_descs.empty()) {

       input_descs.push_back(input_col_desc.getScanDesc());

     } else {

       CHECK(input_col_desc.getScanDesc() == input_descs.front());

     }

     input_col_descs.push_back(std::make_shared<const InputColDescriptor>(input_col_desc));

   }

   const auto count_expr =

       makeExpr<Analyzer::AggExpr>(SQLTypeInfo(g_bigint_count ? kBIGINT : kINT, false),

                                   kCOUNT,

                                   nullptr,

                                   false,

                                   nullptr);

   RelAlgExecutionUnit ra_exe_unit{input_descs,

                                   input_col_descs,

                                   {},

                                   quals,

                                   {},

                                   {},

                                   {count_expr.get()},

                                   {},

                                   nullptr,

                                   SortInfo(),

                                   0};

   size_t one{1};

   ResultSetPtr filtered_result;

   const auto table_infos = get_table_infos(input_descs, executor_);

   CHECK_EQ(size_t(1), table_infos.size());

   const size_t total_rows_upper_bound = table_infos.front().info.getNumTuplesUpperBound();

   try {

     ColumnCacheMap column_cache;

     filtered_result = executor_->executeWorkUnit(

         one, true, table_infos, ra_exe_unit, co, eo, nullptr, false, column_cache);

   } catch (...) {

     return {false, 1.0, 0};

   }

   const auto count_row = filtered_result->getNextRow(false, false);

   CHECK_EQ(size_t(1), count_row.size());

   const auto& count_tv = count_row.front();

   const auto count_scalar_tv = boost::get<ScalarTargetValue>(&count_tv);

   CHECK(count_scalar_tv);

   const auto count_ptr = boost::get<int64_t>(count_scalar_tv);

   CHECK(count_ptr);

   const auto rows_passing = *count_ptr;

   const auto rows_total = std::max(total_rows_upper_bound, size_t(1));

   return {true, static_cast<float>(rows_passing) / rows_total, total_rows_upper_bound};

 }


 std::vector<PushedDownFilterInfo> RelAlgExecutor::selectFiltersToBePushedDown(

     const RelAlgExecutor::WorkUnit& work_unit,

     const CompilationOptions& co,

     const ExecutionOptions& eo) {

   const auto all_push_down_candidates =

       find_push_down_filters(work_unit.exe_unit,

                              work_unit.input_permutation,

                              work_unit.left_deep_join_input_sizes);

   std::vector<PushedDownFilterInfo> selective_push_down_candidates;

   const auto ti = get_table_infos(work_unit.exe_unit.input_descs, executor_);

   if (to_gather_info_for_filter_selectivity(ti)) {

     for (const auto& candidate : all_push_down_candidates) {

       const auto selectivity = getFilterSelectivity(candidate.filter_expressions, co, eo);

       if (selectivity.is_valid && selectivity.isFilterSelectiveEnough()) {

         selective_push_down_candidates.push_back(candidate);

       }

     }

   }

   return selective_push_down_candidates;

 }


 ExecutionResult RelAlgExecutor::executeRelAlgQueryWithFilterPushDown(

     const RaExecutionSequence& seq,

     const CompilationOptions& co,

     const ExecutionOptions& eo,

     RenderInfo* render_info,

     const int64_t queue_time_ms) {

   // we currently do not fully support filter push down with

   // multi-step execution and/or with subqueries

   // TODO(Saman): add proper caching to enable filter push down for all cases

   const auto& subqueries = getSubqueries();

   if (seq.size() > 1 || !subqueries.empty()) {

     if (eo.just_calcite_explain) {

       return ExecutionResult(std::vector<PushedDownFilterInfo>{},

                              eo.find_push_down_candidates);

     }

     auto eo_modified = eo;

     eo_modified.find_push_down_candidates = false;

     eo_modified.just_calcite_explain = false;


     // Dispatch the subqueries first

     for (auto subquery : subqueries) {

       // Execute the subquery and cache the result.

       RelAlgExecutor ra_executor(executor_);

       const auto subquery_ra = subquery->getRelAlg();

       CHECK(subquery_ra);

       RaExecutionSequence subquery_seq(subquery_ra, executor_);

       auto result =

           ra_executor.executeRelAlgSeq(subquery_seq, co, eo_modified, nullptr, 0);

       subquery->setExecutionResult(std::make_shared<ExecutionResult>(result));

     }

     return executeRelAlgSeq(seq, co, eo_modified, render_info, queue_time_ms);

   }

   // else

   return executeRelAlgSeq(seq, co, eo, render_info, queue_time_ms);

 }

 bool to_gather_info_for_filter_selectivity(

     const std::vector<InputTableInfo>& table_infos) {

   if (table_infos.size() < 2) {

     return false;

   }

   // we currently do not support filter push down when there is a self-join involved:

   // TODO(Saman): prevent Calcite from optimizing self-joins to remove this exclusion

   std::unordered_set<shared::TableKey> table_keys;

   for (auto ti : table_infos) {

     if (table_keys.find(ti.table_key) == table_keys.end()) {

       table_keys.insert(ti.table_key);

     } else {

       // a self-join is involved

       return false;

     }

   }

   // TODO(Saman): add some extra heuristics to avoid preflight count and push down if it

   // is not going to be helpful.

   return true;

 }


 std::vector<PushedDownFilterInfo> find_push_down_filters(

     const RelAlgExecutionUnit& ra_exe_unit,

     const std::vector<size_t>& input_permutation,

     const std::vector<size_t>& left_deep_join_input_sizes) {

   std::vector<PushedDownFilterInfo> result;

   if (left_deep_join_input_sizes.empty()) {

     return result;

   }

   std::vector<size_t> input_size_prefix_sums(left_deep_join_input_sizes.size());

   std::partial_sum(left_deep_join_input_sizes.begin(),

                    left_deep_join_input_sizes.end(),

                    input_size_prefix_sums.begin());

   std::vector<int> to_original_rte_idx(ra_exe_unit.input_descs.size(),

                                        ra_exe_unit.input_descs.size());

   if (!input_permutation.empty()) {

     CHECK_EQ(to_original_rte_idx.size(), input_permutation.size());

     for (size_t i = 0; i < input_permutation.size(); ++i) {

       CHECK_LT(input_permutation[i], to_original_rte_idx.size());

       CHECK_EQ(static_cast<size_t>(to_original_rte_idx[input_permutation[i]]),

                to_original_rte_idx.size());

       to_original_rte_idx[input_permutation[i]] = i;

     }

   } else {

     std::iota(to_original_rte_idx.begin(), to_original_rte_idx.end(), 0);

   }

   std::unordered_map<int, std::vector<std::shared_ptr<Analyzer::Expr>>>

       filters_per_nesting_level;

   for (const auto& level_conditions : ra_exe_unit.join_quals) {

     AllRangeTableIndexVisitor visitor;

     for (const auto& cond : level_conditions.quals) {

       const auto rte_indices = visitor.visit(cond.get());

       if (rte_indices.size() > 1) {

         continue;

       }

       const int rte_idx = (!rte_indices.empty()) ? *rte_indices.cbegin() : 0;

       if (!rte_idx) {

         continue;

       }

       CHECK_GE(rte_idx, 0);

       CHECK_LT(static_cast<size_t>(rte_idx), to_original_rte_idx.size());

       filters_per_nesting_level[to_original_rte_idx[rte_idx]].push_back(cond);

     }

   }

   for (const auto& kv : filters_per_nesting_level) {

     CHECK_GE(kv.first, 0);

     CHECK_LT(static_cast<size_t>(kv.first), input_size_prefix_sums.size());

     size_t input_prev = (kv.first > 1) ? input_size_prefix_sums[kv.first - 2] : 0;

     size_t input_start = kv.first ? input_size_prefix_sums[kv.first - 1] : 0;

     size_t input_next = input_size_prefix_sums[kv.first];

     result.emplace_back(

         PushedDownFilterInfo{kv.second, input_prev, input_start, input_next});

   }

   return result;

 }

CompilationOptions
Definition: CompilationOptions.h:31

CHECK_EQ
#define CHECK_EQ(x, y)
Definition: Logger.h:301

ExecutionOptions::find_push_down_candidates
bool find_push_down_candidates
Definition: CompilationOptions.h:79

RelAlgExecutor::WorkUnit::left_deep_join_input_sizes
const std::vector< size_t > left_deep_join_input_sizes
Definition: RelAlgExecutor.h:294

FilterSelectivity
Definition: JoinFilterPushDown.h:49

PushedDownFilterInfo
Definition: JoinFilterPushDown.h:38

RelAlgExecutor::executeRelAlgSeq
ExecutionResult executeRelAlgSeq(const RaExecutionSequence &seq, const CompilationOptions &co, const ExecutionOptions &eo, RenderInfo *render_info, const int64_t queue_time_ms, const bool with_existing_temp_tables=false)
Definition: RelAlgExecutor.cpp:890

RelAlgExecutor
Definition: RelAlgExecutor.h:53

RelAlgExecutor::WorkUnit::exe_unit
RelAlgExecutionUnit exe_unit
Definition: RelAlgExecutor.h:289

RelAlgExecutor::executeRelAlgQueryWithFilterPushDown
ExecutionResult executeRelAlgQueryWithFilterPushDown(const RaExecutionSequence &seq, const CompilationOptions &co, const ExecutionOptions &eo, RenderInfo *render_info, const int64_t queue_time_ms)
Definition: JoinFilterPushDown.cpp:148

RelAlgExecutor::getFilterSelectivity
FilterSelectivity getFilterSelectivity(const std::vector< std::shared_ptr< Analyzer::Expr >> &filter_expressions, const CompilationOptions &co, const ExecutionOptions &eo)
Definition: JoinFilterPushDown.cpp:59

InputColDescriptor
Definition: InputDescriptors.h:59

RelAlgExecutionUnit::input_descs
std::vector< InputDescriptor > input_descs
Definition: RelAlgExecutionUnit.h:166

CHECK_GE
#define CHECK_GE(x, y)
Definition: Logger.h:306

RelAlgExecutor::selectFiltersToBePushedDown
std::vector< PushedDownFilterInfo > selectFiltersToBePushedDown(const RelAlgExecutor::WorkUnit &work_unit, const CompilationOptions &co, const ExecutionOptions &eo)
Definition: JoinFilterPushDown.cpp:127

ResultSetPtr
std::shared_ptr< ResultSet > ResultSetPtr
Definition: RelAlgExecutionUnit.h:231

ScalarExprVisitor::visit
T visit(const Analyzer::Expr *expr) const
Definition: ScalarExprVisitor.h:25

RelAlgExecutor::getSubqueries
const std::vector< std::shared_ptr< RexSubQuery > > & getSubqueries() const noexcept
Definition: RelAlgExecutor.h:164

Analyzer::ColumnVar
Definition: Analyzer.h:194

anonymous_namespace{JoinFilterPushDown.cpp}::CollectInputColumnsVisitor::aggregateResult
std::unordered_set< InputColDescriptor > aggregateResult(const std::unordered_set< InputColDescriptor > &aggregate, const std::unordered_set< InputColDescriptor > &next_result) const override
Definition: JoinFilterPushDown.cpp:41

ExecutionOptions::just_calcite_explain
bool just_calcite_explain
Definition: CompilationOptions.h:80

ExecutionResult
Definition: RelAlgExecutionDescriptor.h:29

to_gather_info_for_filter_selectivity
bool to_gather_info_for_filter_selectivity(const std::vector< InputTableInfo > &table_infos)
Definition: JoinFilterPushDown.cpp:188

RenderInfo
Definition: RenderInfo.h:31

RelAlgExecutionUnit::join_quals
const JoinQualsPerNestingLevel join_quals
Definition: RelAlgExecutionUnit.h:170

RaExecutionSequence
A container for relational algebra descriptors defining the execution order for a relational algebra ...
Definition: RelAlgExecutionDescriptor.h:133

gpu_enabled::partial_sum
DEVICE void partial_sum(ARGS &&...args)
Definition: gpu_enabled.h:87

find_push_down_filters
std::vector< PushedDownFilterInfo > find_push_down_filters(const RelAlgExecutionUnit &ra_exe_unit, const std::vector< size_t > &input_permutation, const std::vector< size_t > &left_deep_join_input_sizes)
Definition: JoinFilterPushDown.cpp:215

g_bigint_count
bool g_bigint_count
Definition: GroupByAndAggregate.cpp:54

RelAlgExecutor::WorkUnit::input_permutation
const std::vector< size_t > input_permutation
Definition: RelAlgExecutor.h:293

kBIGINT
Definition: sqltypes.h:78

RelAlgExecutor.h

DeepCopyVisitor.h

Analyzer::Expr::get_type_info
const SQLTypeInfo & get_type_info() const
Definition: Analyzer.h:79

ExecutionOptions
Definition: CompilationOptions.h:68

anonymous_namespace{JoinFilterPushDown.cpp}::BindFilterToOutermostVisitor
Definition: JoinFilterPushDown.cpp:23

CHECK_LT
#define CHECK_LT(x, y)
Definition: Logger.h:303

Analyzer::ColumnVar::getColumnKey
const shared::ColumnKey & getColumnKey() const
Definition: Analyzer.h:198

SortInfo
Definition: RelAlgExecutionUnit.h:117

anonymous_namespace{JoinFilterPushDown.cpp}::BindFilterToOutermostVisitor::visitColumnVar
std::shared_ptr< Analyzer::Expr > visitColumnVar(const Analyzer::ColumnVar *col_var) const override
Definition: JoinFilterPushDown.cpp:24

gpu_enabled::iota
DEVICE void iota(ARGS &&...args)
Definition: gpu_enabled.h:69

kCOUNT
Definition: sqldefs.h:81

ColumnCacheMap
std::unordered_map< shared::TableKey, std::unordered_map< int, std::shared_ptr< const ColumnarResults >>> ColumnCacheMap
Definition: ColumnarResults.h:214

DeepCopyVisitor
Definition: DeepCopyVisitor.h:19

JoinFilterPushDown.h

RaExecutionSequence::size
size_t size() const
Definition: RelAlgExecutionDescriptor.h:188

ScalarExprVisitor
Definition: ScalarExprVisitor.h:23

anonymous_namespace{JoinFilterPushDown.cpp}::CollectInputColumnsVisitor::visitColumnVar
std::unordered_set< InputColDescriptor > visitColumnVar(const Analyzer::ColumnVar *col_var) const override
Definition: JoinFilterPushDown.cpp:33

CHECK
#define CHECK(condition)
Definition: Logger.h:291

get_table_infos
std::vector< InputTableInfo > get_table_infos(const std::vector< InputDescriptor > &input_descs, Executor *executor)
Definition: InputMetadata.cpp:513

SQLTypeInfo
Definition: sqltypes.h:332

AllRangeTableIndexVisitor
Definition: RangeTableIndexVisitor.h:44

kINT
Definition: sqltypes.h:72

anonymous_namespace{JoinFilterPushDown.cpp}::CollectInputColumnsVisitor
Definition: JoinFilterPushDown.cpp:31

RelAlgExecutor::WorkUnit
Definition: RelAlgExecutor.h:288

RelAlgExecutor::executor_
Executor * executor_
Definition: RelAlgExecutor.h:439

RelAlgExecutionUnit
Definition: RelAlgExecutionUnit.h:165

run_benchmark_import.result
dictionary result
Definition: run_benchmark_import.py:441