ClickHouse实时分析(八)- ClickHouse Explain详解

1. 执行计划简介

  执行计划是进行查询调优的重要参考。ClickHouse 中,可以使用explain语句很方便的查看 SQL 语句的执行计划。   在 ClickHouse 20.6 版本之前要查看 SQL 语句的执行计划需要设置日志级别为 trace 才能可以看到,并且只能真正执行 SQL,在执行日志里面查看。在 20.6 版本引入了原生的执行计划的语法,在 20.6.3 版本成为正式版本的功能。

2. 基本语法

EXPLAIN [AST | SYNTAX | PLAN | PIPELINE | TABLE OVERRIDE] [setting = value, ...]
    [
      SELECT ... |
      tableFunction(...) [COLUMNS (...)] [ORDER BY ...] [PARTITION BY ...] [PRIMARY KEY] [SAMPLE BY ...] [TTL ...]
    ]
    [FORMAT ...]
    AST: 用于查看语法树; 支持查看所有类型的语句,不光是 select 语句: explain ast select number from system.numbers limit 10; SYNTAX: 查询优化后的 SQL 语句; EXPLAIN SYNTAX SELECT * FROM system.numbers AS a, system.numbers AS b, system.numbers AS c; PLAN: 用于查看执行计划,可以指定五个参数; header:打印计划中各个步骤的 header 说明,默认 0(关闭); description:打印计划中各个步骤的描述,默认 1(开启); indexes:显示索引使用情况,默认 0(关闭); actions:打印计划中各个步骤的详细信息,默认 0(关闭); json:以 JSON 格式打印执行计划的详细信息,默认 0(关闭); EXPLAIN SELECT sum(number) FROM numbers(10) GROUP BY number % 4; EXPLAIN json = 1, description = 0 SELECT 1 UNION ALL SELECT 2 FORMAT TSVRaw; PIPELINE: 用于查看 pipeline 计划,可以指定三个参数; header:打印计划中各个步骤的 header 说明,默认 0(关闭); graph:用 DOT 图形语言描述管道图,默认 0(关闭); compact:如果开启了 graph,紧凑打印行,默认 1(开启); EXPLAIN PIPELINE SELECT sum(number) FROM numbers_mt(100000) GROUP BY number % 4;

3. 案例实操

3.1 查看PLAN

  简单查询:

explain plan select arrayJoin([1,2,3,null,null]);

  复杂 SQL 的执行计划:

explain select
	database,
	table,
	count(1) cnt
from system.parts 
where database in (datasets,system)
group by
	database,
	table
order by
	database,
	cnt desc
limit 2 by database;

3.2 AST语法树

EXPLAIN AST SELECT number from system.numbers limit 10;

3.3 SYNTAX语法优化

  先做一次查询:

SELECT number = 1 ? hello : (number = 2 ? world : atguigu) FROM numbers(10);

  查看语法优化:

EXPLAIN SYNTAX SELECT number = 1 ? hello : (number = 2 ? world : atguigu) FROM numbers(10);

  开启三元运算符优化:

SET optimize_if_chain_to_multiif = 1;

  再次查看语法优化:

EXPLAIN SYNTAX SELECT number = 1 ? hello : (number = 2 ? world : atguigu) FROM numbers(10);

  返回优化后的语句

SELECT multiIf(number = 1, hello, number = 2, world, xyz) FROM numbers(10)

3.4 查看PIPELINE

EXPLAIN PIPELINE SELECT sum(number) FROM numbers_mt(100000) GROUP BY number % 20;

  打开其他参数:

EXPLAIN PIPELINE header=1,graph=1 SELECT sum(number) FROM numbers_mt(10000) GROUP BY number%20;

参考文献

  【1】   【2】   【3】

经验分享 程序员 微信小程序 职场和发展