没有合适的资源?快使用搜索试试~ 我知道了~
ORACLE_SQL语句优化技术分析
4星 · 超过85%的资源 需积分: 10 21 下载量 89 浏览量
2015-01-09
10:46:24
上传
评论 2
收藏 259KB PDF 举报
温馨提示
试读
33页
ORACLE_SQL语句优化技术分析,语句优化技术是DBA必备的技能,此教材适合新手
资源推荐
资源详情
资源评论
ORACLE SQL 语句优化技术分析
一、问题的提出
在应用系统开发初期,由于开发数据库数据比较少,对于查询 SQL 语句,复杂视图的的编写等体会不出 SQL
语句各种写法的性能优劣,但是如果将应用系统提交实际应用后,随着数据库中数据的增加,系统的响应
速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是 SQL 语句的优化。
对于海量数据,劣质 SQL 语句和优质 SQL 语句之间的速度差别可以达到上百倍,可见对于一个系统不是简
单地能实现其功能就可,而是要写出高质量的 SQL 语句,提高系统的可用性。
在多数情况下,Oracle 使用索引来更快地遍历表,优化器主要根据定义的索引来提高性能。但是,如果在
SQL 语句的 where 子句中写的 SQL 代码不合理,就会造成优化器删去索引而使用全表扫描,一般就这种 SQL
语句就是所谓的劣质 SQL 语句。在编写 SQL 语句时我们应清楚优化器根据何种原则来删除索引,这有助于
写出高性能的 SQL 语句。
二、SQL 语句编写注意问题
下面就某些 SQL 语句的 where 子句编写中需要注意的问题作详细介绍。在这些 where 子句中,即使某些列
存在索引,但是由于编写了劣质的 SQL,系统在运行该 SQL 语句时也不能使用该索引,而同样使用全表扫
描,这就造成了响应速度的极大降低。
1、 IS NULL 或IS NOT NULL操作(判断字段是否为空)
不能用 null 作索引,任何包含 null 值的列都将不会被包含在索引中。即使索引有多列这样的情况下,只
要这些列中有一列含有 null,该列就会从索引中排除。也就是说如果某列存在空值,即使对该列建索引也
不会提高性能。
任何在 where 子句中使用 is null 或 is not null 的语句优化器是不允许使用索引的。
推荐方案:
用其它相同功能的操作运算代替,如
a is not null 改为 a>0 或 a>’’等。
建立位图索引(有分区的表不能建,位图索引比较难控制,如字段值太多索引会使性能下降,多人更
新操作会增加数据块锁的现象)
2、 联接列 ‘||’
对于有联接的列,即使最后的联接值为一个静态值,优化器是不会使用索引的。我们一起来看一个例子,
假定有一个职工表(employee),对于一个职工的姓和名分成两列存放(FIRST_NAME和LAST_NAME),现在
要查询一个叫比尔.克林顿(Bill Cliton)的职工。
下面是一个采用联接查询的SQL语句,
select * from employss
where
first_name||''||last_name ='Beill Cliton';
上面这条语句完全可以查询出是否有Bill Cliton这个员工,但是这里需要注意,系统优化器对基于
last_name创建的索引没有使用。
当采用下面这种SQL语句的编写,Oracle系统就可以采用基于last_name创建的索引。
Select * from employee
where
first_name ='Beill' and last_name ='Cliton';
遇到下面这种情况又如何处理呢?如果一个变量(name)中存放着Bill Cliton这个员工的姓名,对于这
种情况我们又如何避免全程遍历,使用索引呢?可以使用一个函数,将变量name中的姓和名分开就可以了,
但是有一点需要注意,这个函数是不能作用在索引列上。下面是SQL查询脚本:
select * from employee
where
first_name = SUBSTR('&&name',1,INSTR('&&name',' ')-1)
and
last_name = SUBSTR('&&name',INSTR('&&name’,' ')+1)
3、带通配符(%)的like语句
同样以上面的例子来看这种情况。目前的需求是这样的,要求在职工表中查询名字中包含cliton的人。可
以采用如下的查询SQL语句:
select * from employee where last_name like '%cliton%';
这里由于通配符(%)在搜寻词首出现,所以Oracle系统不使用last_name的索引,而是进行全表查询。在
很多情况下可能无法避免这种情况,但是一定要心中有底,通配符如此使用会降低查询速度。然而当通配
符出现在字符串其他位置时,优化器就能利用索引。在下面的查询中索引得到了使用:
select * from employee where last_name like 'c%';
4、 Order by语句
ORDER BY语句决定了Oracle如何将返回的查询结果排序。Order by语句对要排序的列没有什么特别的限制,
也可以将函数加入列中(象联接或者附加等)。任何在Order by语句的非索引项或者有计算表达式都将降
低查询速度。
仔细检查order by语句以找出非索引项或者表达式,它们会降低性能。解决这个问题的办法就是重写order
by语句以使用索引,也可以为所使用的列建立另外一个索引,同时应绝对避免在order by子句中使用表达
式。
5、 NOT
我们在查询时经常在where子句使用一些逻辑表达式,如大于、小于、等于以及不等于等等,也可以使用
and(与)、or(或)以及not(非)。NOT可用来对任何逻辑运算符号取反。下面是一个NOT子句的例子:
... where not (status ='VALID')
如果要使用NOT,则应在取反的短语前面加上括号,并在短语前面加上NOT运算符。NOT运算符包含在另外
一个逻辑运算符中,这就是不等于(<>)运算符。换句话说,即使不在查询where子句中显式地加入NOT词,
NOT仍在运算符中,见下例:
... where status <>'INVALID';
再看下面这个例子:
select * from employee where salary<>3000;
对这个查询,可以改写为不使用NOT:
select * from employee where salary<3000 or salary>3000;
虽然这两种查询的结果一样,但是第二种查询方案会比第一种查询方案更快些。第二种查询允许Oracle对
salary列使用索引,而第一种查询则不能使用索引。
6、 IN和EXISTS (存在于….)
有时候会将一列和一系列值相比较。最简单的办法就是在where子句中使用子查询。在where子句中可以使
用两种格式的子查询。
第一种格式是使用IN操作符:
... where column in(select * from ... where ...);
第二种格式是使用EXIST操作符:
... where exists (select 'X' from ...where ...);
我相信绝大多数人会使用第一种格式,因为它比较容易编写,而实际上第二种格式要远比第一种格式的效
率高。在Oracle中可以几乎将所有的IN操作符子查询改写为使用EXISTS的子查询。
第二种格式中,子查询以‘select 'X'开始。运用EXISTS子句不管子查询从表中抽取什么数据它只查看where
子句。这样优化器就不必遍历整个表而仅根据索引就可完成工作(这里假定在where语句中使用的列存在
索引)。相对于IN子句来说,EXISTS使用相连子查询,构造起来要比IN子查询困难一些。
通过使用EXISTS,Oracle系统会首先检查主查询,然后运行子查询直到它找到第一个匹配项,这就节省了
时间。Oracle系统在执行IN子查询时,首先执行子查询,并将获得的结果列表存放在在一个加了索引的临
时表中。在执行子查询之前,系统先将主查询挂起,待子查询执行完毕,存放在临时表中以后再执行主查
询。这也就是使用EXISTS比使用IN通常查询速度快的原因。
同时应尽可能使用NOT EXISTS来代替NOT IN,尽管二者都使用了NOT(不能使用索引而降低速度),NOT EXISTS
要比NOT IN查询效率更高。
用 IN 写出来的 SQL 的优点是比较容易写及清晰易懂,这比较适合现代软件开发的风格。
但是用 IN 的 SQL 性能总是比较低的,从 ORACLE 执行的步骤来分析用 IN 的 SQL 与不用 IN 的 SQL 有以下区
别:
ORACLE 试图将其转换成多个表的连接,如果转换不成功则先执行 IN 里面的子查询,再查询外层的表
记录,如果转换成功则直接采用多个表的连接方式查询。由此可见用 IN 的 SQL 至少多了一个转换的过程。
一般的 SQL 都可以转换成功,但对于含有分组统计等方面的 SQL 就不能转换了。
推荐方案:在业务密集的 SQL 当中尽量不采用 IN 操作符。
NOT IN 操作符
此操作是强列推荐不使用的,因为它不能应用表的索引。
推荐方案:用 NOT EXISTS 或(外连接+判断为空)方案代替
7、<> 操作符(不等于)
不等于操作符是永远不会用到索引的,因此对它的处理只会产生全表扫描。
推荐方案:用其它相同功能的操作运算代替,如
a<>0 改为 a>0 or a<0
a<>’’ 改为 a>’’
8、> 及 < 操作符(大于或小于操作符)
大于或小于操作符一般情况下是不用调整的,因为它有索引就会采用索引查找,但有的情况下可以对
它进行优化,如一个表有 100 万记录,一个数值型字段 A,30 万记录的 A=0,30 万记录的 A=1,39 万记录
的 A=2,1 万记录的 A=3。那么执行 A>2 与 A>=3 的效果就有很大的区别了,因为 A>2 时 ORACLE 会先找出为
2 的记录索引再进行比较,而 A>=3 时 ORACLE 则直接找到=3 的记录索引。
9、IS NULL 或IS NOT NULL操作(判断字段是否为空)
判断字段是否为空一般是不会应用索引的,因为 B 树索引是不索引空值的。
推荐方案:
用其它相同功能的操作运算代替,如
a is not null 改为 a>0 或 a>’’等。
不允许字段为空,而用一个缺省值代替空值,如业扩申请中状态字段不允许为空,缺省为申请。
建立位图索引(有分区的表不能建,位图索引比较难控制,如字段值太多索引会使性能下降,多人更
新操作会增加数据块锁的现象)
10、union操作符
union 在进行表链接后会筛选掉重复的记录,所以在表链接后会对所产生的结果集进行排序运算,删
除重复的记录再返回结果。实际大部分应用中是不会产生重复的记录,最常见的是过程表与历史表 union。
如:
select * from gc_dfys
union
select * from ls_jg_dfys
这个 sql 在运行时先取出两个表的结果,再用排序空间进行排序删除重复的记录,最后返回结果集,
如果表数据量大的话可能会导致用磁盘进行排序。
推荐方案:采用 union all 操作符替代 union,因为 union all 操作只是简单的将两个结果合并后就
返回。
select * from gc_dfys
union all
select * from ls_jg_dfys
11、SELECT子句中避免使用 ‘ * ‘
当你想在SELECT子句中列出所有的COLUMN时,使用动态SQL列引用 ‘*’ 是一个方便的方法.不幸的
是,这是一个非常低效的方法. 实际上,ORACLE在解析的过程中, 会将’*’ 依次转换成所有的列名, 这个工
作是通过查询数据字典完成的, 这意味着将耗费更多的时间.
12、使用DECODE函数来减少处理时间
使用DECODE函数可以避免重复扫描相同记录或重复连接相同的表.
例如:
SELECT COUNT(*),SUM(SAL) FROM EMP
WHERE DEPT_NO = 0020 AND ENAME LIKE ‘SMITH%’;
SELECT COUNT(*),SUM(SAL) FROM EMP
WHERE DEPT_NO = 0030 AND ENAME LIKE ‘SMITH%’;
你可以用DECODE函数高效地得到相同结果:
SELECT COUNT(DECODE(DEPT_NO,0020,’X’,NULL)) D0020_COUNT,
COUNT(DECODE(DEPT_NO,0030,’X’,NULL)) D0030_COUNT,
SUM(DECODE(DEPT_NO,0020,SAL,NULL)) D0020_SAL,
SUM(DECODE(DEPT_NO,0030,SAL,NULL)) D0030_SAL
FROM EMP WHERE ENAME LIKE ‘SMITH%’;
类似的,DECODE函数也可以运用于GROUP BY 和ORDER BY子句中.
13、计算记录条数
和一般的观点相反, count(*) 比count(1)稍快 , 当然如果可以通过索引检索,对索引列的计数仍旧是最
快的. 例如 COUNT(EMPNO)
(译者按: 在 CSDN 论坛中,曾经对此有过相当热烈的讨论, 作者的观点并不十分准确,通过实际的测试,上述
三种方法并没有显著的性能差别)
14、用Where子句替换HAVING子句
避免使用HAVING子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤. 这个处理需要排
序,总计等操作. 如果能通过WHERE子句限制记录的数目,那就能减少这方面的开销. 例如:
低效:SELECT REGION,AVG(LOG_SIZE)
FROM LOCATION
GROUP BY REGION
HAVING REGION REGION != ‘SYDNEY’
AND REGION != ‘PERTH’
高效:SELECT REGION,AVG(LOG_SIZE)
FROM LOCATION
WHERE REGION REGION != ‘SYDNEY’
AND REGION != ‘PERTH’
GROUP BY REGION
剩余32页未读,继续阅读
资源评论
- u0101887632015-01-11不错,说的很详细
- luguoyuan7012015-10-22还行,建议大家还是买实体书,支持原创
qq_16384173
- 粉丝: 0
- 资源: 13
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功