StarRocks
diff --git a/‎fe/fe-core/src/main/java/com/starrocks/qe/SessionVariable.java
+12 b/‎fe/fe-core/src/main/java/com/starrocks/qe/SessionVariable.java
+12
diff --git a/‎fe/fe-core/src/main/java/com/starrocks/sql/optimizer/Utils.java
+22 b/‎fe/fe-core/src/main/java/com/starrocks/sql/optimizer/Utils.java
+22
diff --git a/‎fe/fe-core/src/main/java/com/starrocks/sql/optimizer/statistics/BinaryPredicateStatisticCalculator.java
+1-1 b/‎fe/fe-core/src/main/java/com/starrocks/sql/optimizer/statistics/BinaryPredicateStatisticCalculator.java
+1-1
diff --git a/‎fe/fe-core/src/main/java/com/starrocks/sql/optimizer/statistics/PredicateStatisticsCalculator.java
+19 b/‎fe/fe-core/src/main/java/com/starrocks/sql/optimizer/statistics/PredicateStatisticsCalculator.java
+19
diff --git a/‎fe/fe-core/src/main/java/com/starrocks/sql/optimizer/statistics/StatisticsEstimateUtils.java
+212 b/‎fe/fe-core/src/main/java/com/starrocks/sql/optimizer/statistics/StatisticsEstimateUtils.java
+212
@@ -358,6 +358,7 @@ public class SessionVariable implements Serializable, Writable, Cloneable {
     public static final String CBO_MAX_REORDER_NODE_USE_GREEDY = "cbo_max_reorder_node_use_greedy";
     public static final String CBO_ENABLE_REPLICATED_JOIN = "cbo_enable_replicated_join";
     public static final String CBO_USE_CORRELATED_JOIN_ESTIMATE = "cbo_use_correlated_join_estimate";
+    public static final String CBO_USE_CORRELATED_PREDICATE_ESTIMATE = "cbo_use_correlated_predicate_estimate";
     public static final String ALWAYS_COLLECT_LOW_CARD_DICT = "always_collect_low_card_dict";
     public static final String ALWAYS_COLLECT_LOW_CARD_DICT_ON_LAKE = "always_collect_low_card_dict_on_lake";
     public static final String CBO_ENABLE_LOW_CARDINALITY_OPTIMIZE = "cbo_enable_low_cardinality_optimize";
@@ -1144,6 +1145,9 @@ public static MaterializedViewRewriteMode parse(String str) {
     @VariableMgr.VarAttr(name = CBO_USE_CORRELATED_JOIN_ESTIMATE, flag = VariableMgr.INVISIBLE)
     private boolean useCorrelatedJoinEstimate = true;
 
+    @VariableMgr.VarAttr(name = CBO_USE_CORRELATED_PREDICATE_ESTIMATE)
+    private boolean useCorrelatedPredicateEstimate = true;
+
     @VariableMgr.VarAttr(name = CBO_USE_NTH_EXEC_PLAN, flag = VariableMgr.INVISIBLE)
     private int useNthExecPlan = 0;
 
@@ -3661,6 +3665,14 @@ public void setUseCorrelatedJoinEstimate(boolean useCorrelatedJoinEstimate) {
         this.useCorrelatedJoinEstimate = useCorrelatedJoinEstimate;
     }
 
+    public boolean isUseCorrelatedPredicateEstimate() {
+        return useCorrelatedPredicateEstimate;
+    }
+
+    public void setUseCorrelatedPredicateEstimate(boolean useCorrelatedPredicateEstimate) {
+        this.useCorrelatedPredicateEstimate = useCorrelatedPredicateEstimate;
+    }
+
     public boolean isAlwaysCollectDict() {
         return alwaysCollectDict;
     }
 
@@ -70,10 +70,12 @@
 import java.time.Instant;
 import java.time.LocalDateTime;
 import java.time.ZoneId;
+import java.util.ArrayList;
 import java.util.Arrays;
 import java.util.BitSet;
 import java.util.Collection;
 import java.util.Collections;
+import java.util.HashMap;
 import java.util.HashSet;
 import java.util.LinkedList;
 import java.util.List;
@@ -983,4 +985,24 @@ public static List<Pair<Table, Column>> resolveColumnRefRecursive(ColumnRefOpera
 
         return null;
     }
+
+    public static Pair<Map<ColumnRefOperator, ConstantOperator>, List<ScalarOperator>> separateEqualityPredicates(
+            ScalarOperator predicate) {
+        List<ScalarOperator> conjunctivePredicates = extractConjuncts(predicate);
+        Map<ColumnRefOperator, ConstantOperator> columnConstMap = new HashMap<>();
+        List<ScalarOperator> otherPredicates = new ArrayList<>();
+
+        for (ScalarOperator op : conjunctivePredicates) {
+            if (ScalarOperator.isColumnEqualConstant(op)) {
+                BinaryPredicateOperator binaryOp = (BinaryPredicateOperator) op;
+                ColumnRefOperator column = (ColumnRefOperator) binaryOp.getChild(0);
+                ConstantOperator constant = (ConstantOperator) binaryOp.getChild(1);
+                columnConstMap.put(column, constant);
+            } else {
+                otherPredicates.add(op);
+            }
+        }
+
+        return new Pair<>(columnConstMap, otherPredicates);
+    }
 }
@@ -106,7 +106,7 @@ private static Statistics estimateColumnEqualToConstant(Optional<ColumnRefOperat
                     .setNullsFraction(0)
                     .setMinValue(min)
                     .setMaxValue(max)
-                    .setDistinctValuesCount(1)
+                    .setDistinctValuesCount(columnStatistic.getDistinctValuesCount())
                     .build();
 
             double predicateFactor;
 
@@ -16,6 +16,7 @@
 
 import com.google.common.base.Preconditions;
 import com.starrocks.analysis.BinaryType;
+import com.starrocks.common.Pair;
 import com.starrocks.sql.optimizer.Utils;
 import com.starrocks.sql.optimizer.operator.OperatorType;
 import com.starrocks.sql.optimizer.operator.scalar.BinaryPredicateOperator;
@@ -31,9 +32,12 @@
 import org.apache.commons.math3.util.Precision;
 
 import java.util.List;
+import java.util.Map;
 import java.util.Optional;
 import java.util.stream.Collectors;
 
+import static com.starrocks.sql.optimizer.statistics.StatisticsEstimateUtils.computeCompoundStatsWithMultiColumnOptimize;
+
 public class PredicateStatisticsCalculator {
     public static Statistics statisticsCalculate(ScalarOperator predicate, Statistics statistics) {
         if (predicate == null) {
@@ -330,6 +334,13 @@ public Statistics visitCompoundPredicate(CompoundPredicateOperator predicate, Vo
             }
 
             if (predicate.isAnd()) {
+                Pair<Map<ColumnRefOperator, ConstantOperator>, List<ScalarOperator>> extracted =
+                        Utils.separateEqualityPredicates(predicate);
+
+                if (extracted.first.size() > 1) {
+                    return computeCompoundStatsWithMultiColumnOptimize(predicate, statistics);
+                }
+
                 Statistics leftStatistics = predicate.getChild(0).accept(this, null);
                 Statistics andStatistics =
                         predicate.getChild(1).accept(new BaseCalculatingVisitor(leftStatistics), null);
@@ -411,6 +422,13 @@ public Statistics visitCompoundPredicate(CompoundPredicateOperator predicate, Vo
             }
 
             if (predicate.isAnd()) {
+                Pair<Map<ColumnRefOperator, ConstantOperator>, List<ScalarOperator>> extracted =
+                        Utils.separateEqualityPredicates(predicate);
+
+                if (extracted.first.size() > 1) {
+                    return computeCompoundStatsWithMultiColumnOptimize(predicate, statistics);
+                }
+
                 Statistics leftStatistics = predicate.getChild(0).accept(this, null);
                 Statistics andStatistics = predicate.getChild(1)
                         .accept(new LargeOrCalculatingVisitor(leftStatistics), null);
@@ -461,5 +479,6 @@ protected Statistics computeOrPredicateStatistics(Statistics baseStatistics, Sta
             });
             return builder.build();
         }
+
     }
 }
@@ -15,6 +15,26 @@
 
 package com.starrocks.sql.optimizer.statistics;
 
+import com.starrocks.analysis.BinaryType;
+import com.starrocks.common.Pair;
+import com.starrocks.qe.ConnectContext;
+import com.starrocks.sql.optimizer.Utils;
+import com.starrocks.sql.optimizer.operator.scalar.BinaryPredicateOperator;
+import com.starrocks.sql.optimizer.operator.scalar.ColumnRefOperator;
+import com.starrocks.sql.optimizer.operator.scalar.ConstantOperator;
+import com.starrocks.sql.optimizer.operator.scalar.ScalarOperator;
+import com.starrocks.statistic.StatisticUtils;
+
+import java.util.ArrayList;
+import java.util.HashMap;
+import java.util.List;
+import java.util.Map;
+import java.util.Set;
+
+import static java.lang.Double.NEGATIVE_INFINITY;
+import static java.lang.Double.POSITIVE_INFINITY;
+import static java.lang.Double.isInfinite;
+
 public class StatisticsEstimateUtils {
     public static ColumnStatistic unionColumnStatistic(ColumnStatistic left, double leftRowCount, ColumnStatistic right,
                                                        double rightRowCount) {
@@ -64,4 +84,196 @@ public static Statistics adjustStatisticsByRowCount(Statistics statistics, doubl
         });
         return builder.build();
     }
+
+    public static double getPredicateSelectivity(ScalarOperator predicate, Statistics statistics) {
+        Statistics estimatedStatistics = PredicateStatisticsCalculator.statisticsCalculate(predicate, statistics);
+
+        // avoid sample statistics filter all data, save one rows least
+        if (statistics.getOutputRowCount() > 0 && estimatedStatistics.getOutputRowCount() == 0) {
+            return 1 / statistics.getOutputRowCount();
+        } else {
+            return estimatedStatistics.getOutputRowCount() / statistics.getOutputRowCount();
+        }
+    }
+
+    /**
+     * Estimates selectivity for conjunctive equality predicates across multiple columns.
+     *
+     * This method implements a hybrid approach that:
+     * 1. Leverages multi-column combined statistics when available to capture column correlations
+     * 2. Falls back to a weighted combination model with exponential decay for columns without joint statistics
+     * 3. Applies selectivity bounds to avoid both overestimation and underestimation
+     *
+     * Key formulas:
+     * - Multi-column combined statistics based: S_mc = max(min(1/NDV, min_sel), prod_sel)
+     *   Where:
+     *     - 1/NDV is the selectivity based on multi-columns ndv
+     *     - min_sel is the minimum selectivity among correlated columns
+     *     - prod_sel is the product of individual column selectivities
+     *
+     * - Exponential decay for additional columns: S_final = S_base * ∏(S_i^(0.5^i))
+     *   Where:
+     *     - S_base is the initial selectivity (from multi-column stats or most selective column)
+     *     - S_i is the selectivity of the i-th additional column (sorted by ascending selectivity)
+     *     - 0.5^i is the exponential decay weight (0.5, 0.25, 0.125, etc.)
+     *
+     * @param equalityPredicates Map of column references to their equality constant values
+     * @param statistics
+     * @return Estimated selectivity in range [0,1], or -1 if estimation cannot be performed
+     */
+    private static double estimateConjunctiveEqualitySelectivity(
+            Map<ColumnRefOperator, ConstantOperator> equalityPredicates,
+            Statistics statistics) {
+        // Require at least two columns for multi-column estimation
+        if (equalityPredicates.size() < 2) {
+            return -1;
+        }
+
+        // Compute individual selectivity factors for each predicate and sort in ascending order
+        Map<ColumnRefOperator, Double> columnToSelectivityMap = new HashMap<>();
+        for (Map.Entry<ColumnRefOperator, ConstantOperator> entry : equalityPredicates.entrySet()) {
+            ColumnRefOperator columnRef = entry.getKey();
+            ConstantOperator constantValue = entry.getValue();
+            BinaryPredicateOperator equalityPredicate = new BinaryPredicateOperator(BinaryType.EQ, columnRef, constantValue);
+            columnToSelectivityMap.put(columnRef, getPredicateSelectivity(equalityPredicate, statistics));
+        }
+
+        List<Map.Entry<ColumnRefOperator, Double>> selectivityEntriesSorted =
+                new ArrayList<>(columnToSelectivityMap.entrySet());
+
+        // Sort by ascending selectivity (most selective first)
+        selectivityEntriesSorted.sort(Map.Entry.comparingByValue());
+
+        // Retrieve available multi-column combined statistics for the target columns
+        Set<ColumnRefOperator> targetColumnRefs = equalityPredicates.keySet();
+        Pair<Set<ColumnRefOperator>, MultiColumnCombinedStats> multiColumnStatsPair =
+                statistics.getLargestSubsetMCStats(targetColumnRefs);
+
+        double estimatedSelectivity;
+
+        // Primary estimation path: utilize multi-column statistics when available
+        if (multiColumnStatsPair != null &&
+                !multiColumnStatsPair.first.isEmpty() &&
+                multiColumnStatsPair.second.getNdv() > 0) {
+
+            Set<ColumnRefOperator> correlatedColumns = multiColumnStatsPair.first;
+            double distinctValueCount = Math.max(1.0, multiColumnStatsPair.second.getNdv());
+
+            // Formula: S_corr = 1/NDV
+            // NDV-based selectivity estimation for correlated columns
+            double correlationBasedSelectivity = 1.0 / distinctValueCount;
+
+            double maxNullFraction = correlatedColumns.stream()
+                    .map(statistics::getColumnStatistic)
+                    .mapToDouble(ColumnStatistic::getNullsFraction)
+                    .max()
+                    .orElse(0.0);
+            correlationBasedSelectivity = correlationBasedSelectivity * (1.0 - maxNullFraction);
+
+            // Formula: S_ind = ∏(S_i) for all i in correlatedColumns
+            // Calculate independence-assumption selectivity product as lower bound
+            double independentSelectivityProduct = correlatedColumns.stream()
+                    .map(columnToSelectivityMap::get)
+                    .reduce(1.0, (a, b) -> a * b);
+
+            // Formula: S_min = min(S_i) for all i in correlatedColumns
+            // Identify minimum column selectivity as upper bound
+            double minColumnSelectivity = correlatedColumns.stream()
+                    .map(columnToSelectivityMap::get)
+                    .min(Double::compare)
+                    .orElse(1.0);
+
+            // Formula: S_mc = max(min(S_corr, S_min), S_ind)
+            // Apply selectivity bounds to balance correlation effects
+            // Because a single column may build a histogram or mcv, the selection will be much larger than using only ndv.
+            estimatedSelectivity = Math.max(
+                    Math.min(correlationBasedSelectivity, minColumnSelectivity),
+                    independentSelectivityProduct);
+
+            // Process remaining columns not covered by multi-column combined statistics
+            // Formula ordering: S_final = S_mc * ∏(S_i^(0.5^(i+1))) where S_i are sorted by ascending selectivity
+            List<Double> uncorrelatedSelectivities = selectivityEntriesSorted.stream()
+                    .filter(entry -> !correlatedColumns.contains(entry.getKey()))
+                    .map(Map.Entry::getValue)
+                    .toList();
+
+            // Apply exponential decay weights to uncorrelated columns (max 3)
+            // Multi-column selectivity is used as base, then apply remaining columns in ascending selectivity order
+            for (int i = 0; i < Math.min(3, uncorrelatedSelectivities.size()); i++) {
+                double decayFactor = 1;
+                if (ConnectContext.get().getSessionVariable().isUseCorrelatedPredicateEstimate()) {
+                    decayFactor = Math.pow(0.5, i + 1); // Weights: 0.5, 0.25, 0.125
+                }
+                estimatedSelectivity *= Math.pow(uncorrelatedSelectivities.get(i), decayFactor);
+            }
+        } else {
+            // Fallback estimation path: weighted combination of individual selectivities
+            // Formula: S_base = S_0 (most selective predicate)
+            // Use most selective predicate as base (first in the sorted list)
+            estimatedSelectivity = selectivityEntriesSorted.get(0).getValue();
+
+            // Formula: S_final = S_base * ∏(S_i^(0.5^i)) for i=1,2,3
+            // Apply exponential decay weights to additional columns (max 4)
+            // Columns are already sorted by ascending selectivity, so most selective is first
+            for (int i = 1; i < Math.min(4, selectivityEntriesSorted.size()); i++) {
+                double decayFactor = 1;
+                if (ConnectContext.get().getSessionVariable().isUseCorrelatedPredicateEstimate()) {
+                    decayFactor = Math.pow(0.5, i);
+                }
+                estimatedSelectivity *= Math.pow(selectivityEntriesSorted.get(i).getValue(), decayFactor);
+            }
+        }
+
+        // Clamp final selectivity to valid probability range
+        return Math.min(1.0, Math.max(0.0, estimatedSelectivity));
+    }
+
+    public static Statistics computeCompoundStatsWithMultiColumnOptimize(ScalarOperator predicate, Statistics inputStats) {
+        Pair<Map<ColumnRefOperator, ConstantOperator>, List<ScalarOperator>> decomposedPredicates =
+                Utils.separateEqualityPredicates(predicate);
+
+        Map<ColumnRefOperator, ConstantOperator> equalityPredicates = decomposedPredicates.first;
+        List<ScalarOperator> nonEqualityPredicates = decomposedPredicates.second;
+
+        double conjunctiveSelectivity = estimateConjunctiveEqualitySelectivity(equalityPredicates, inputStats);
+        double filteredRowCount = inputStats.getOutputRowCount() * conjunctiveSelectivity;
+
+        Statistics.Builder filteredStatsBuilder = Statistics.buildFrom(inputStats)
+                .setOutputRowCount(filteredRowCount);
+
+        for (Map.Entry<ColumnRefOperator, ConstantOperator> entry : equalityPredicates.entrySet()) {
+            ColumnRefOperator columnRef = entry.getKey();
+            ConstantOperator constantOperator = entry.getValue();
+            ColumnStatistic originalColumnStats = inputStats.getColumnStatistic(columnRef);
+
+            double constantValue = StatisticUtils.convertStatisticsToDouble(
+                    constantOperator.getType(), constantOperator.toString()).orElse(NEGATIVE_INFINITY);
+            ColumnStatistic updatedColumnStats = ColumnStatistic.buildFrom(originalColumnStats)
+                    .setDistinctValuesCount(originalColumnStats.getDistinctValuesCount())
+                    .setNullsFraction(0.0)
+                    .setMinValue(constantValue)
+                    .setMaxValue(isInfinite(constantValue) ? POSITIVE_INFINITY : constantValue)
+                    .build();
+
+            filteredStatsBuilder.addColumnStatistic(columnRef, updatedColumnStats);
+        }
+
+        Statistics equalityFilteredStats = filteredStatsBuilder.build();
+
+        if (nonEqualityPredicates.isEmpty()) {
+            return StatisticsEstimateUtils.adjustStatisticsByRowCount(equalityFilteredStats, filteredRowCount);
+        }
+
+        // Apply remaining non-equality predicates sequentially
+        Statistics combinedFilteredStats = equalityFilteredStats;
+
+        for (ScalarOperator nonEqualityPredicate : nonEqualityPredicates) {
+            combinedFilteredStats = PredicateStatisticsCalculator.statisticsCalculate(
+                    nonEqualityPredicate, combinedFilteredStats);
+        }
+
+        return StatisticsEstimateUtils.adjustStatisticsByRowCount(
+                combinedFilteredStats,
+                combinedFilteredStats.getOutputRowCount());
+    }
 }