接下来进行 SQL2 的调优,和优化 SQL1 时一样首先开始查看分析 SQL2 语句的执行
计划,发现 SQL2 的执行计划也是全表扫描,这里 t1.name=的取值为 cc 的返回仅仅 10 条
记录,而 T1 表记录都在 5 千万左右, T2 表在 200 万左右,需要全扫这么大的两个表而获
取仅有的 10 记录吗?
这里又要再次利用到索引的原理, SQL1 是利用到了索引一般比表小的多的特点,现在
又是要利用啥呢?哦,利用索引的快速定位原理。假如我们在 name 列建了一个索引,而现
在是利用了索引的快速检索原理。索引有个最大的特点是有序排列,当表记录检索到 dc 等
以 d 打头的记录后, ORACLE 就停止遍历了!为啥,因为索引是有序的,当出现 d 打头的
记录后,绝对后面不可能再出现 c 打头的记录了,因为我们是查询=cc 的值,当然停住了。
随时停止检索相比遍历全表,明显是少做事和不做事,效率可以意料会提升不少。
那 SQL2 如何优化,哦,好简单,就是在 name 列建一个索引就好了。索引在这条 SQL
中因为可以让应用少做事和不做事,最终到了速度大幅度提升,果然,优化后的执行速度从
原来的 20 秒缩减为 1 秒。
到此优化完毕,短息后台进程由原来的每次执行 1 分钟多变为 2 秒多,速度提升了 30
多倍,积压情况大大缓解,系统运行恢复正常。
应该说这次优化总体是很成功的,客户也非常满意。不过我个人心中还是有少许疑惑之
处,什么疑问呢?
1. SQL1(Select count(*) from t1) 为什么要统计条数,得到条数的真正目的是什么?
2. SQL2 中的 distinct 取唯一值是为啥,难道表有重复记录? distinct 可是需要排序
的。
3. SQL2 中的 order by t1.col5; 排序是 T1 表的 col5 字段,展现字段又没有这个字
段,真的需要这个排序吗