以下是一个使用 NOT IN 子查询的 SQL 语句示例。该查询从 Grade 表中检索记录,条件是当 emp_id 大于 3,000 时,grd_id 不与 employee 表中的任何 grd_id 匹配:
select *
from grade
where grd_id not in (select b.emp_grade
from employee b
where b.emp_id > 3000)
当前执行计划耗时异常漫长,需要 50 分 10 秒 才能完成。
该查询计划显示,系统先在Employee表上对Emp_id > 3000进行顺序扫描,生成物化临时存储,随后用Grade表的Grd_id进行过滤。这种查询计划效率极低——因为当Grade表的5000行记录需要逐行处理时,需反复扫描Employee表约300万条记录。
为解决此问题,我将SQL语句重写为NOT (EXISTS …)形式:
select *
from grade g1
where not (exists (select ‘x’
from employee b
where g1.grd_id = b.emp_grade and
b.emp_id > 3000))
优化后的查询计划显示:现在通过嵌套循环连接(Nest Loop),以Grade表为驱动,配合Employee表上的索引扫描(emps_grade_inx) 进行操作。
重写后的SQL语句执行时间降至0.07秒,性能得到显著提升。
重写后的SQL比原始版本提速超过43,000倍。这类优化同样可通过Tosska SQL Tuning Expert Pro for PostgreSQL工具实现。下图展示了几种性能更优的SQL替代方案,但因篇幅所限不便在本文详述,也许我们可以稍后再讨论这个话题。
Tosska SQL Tuning Expert Pro for PostgreSQL – Tosska Technologies Limited