51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

测试开发精英班,通向高级软件测试工程师论坛测试积点免费获取渠道攻略20+企业级实战项目就在这里!横扫BAT,Python全栈测试开发技能大全
【113期】:Web安全测试你来问我来答!中国软件测试行业现状调查报告新鲜出炉! 【杂志】做测试行业不偏科的尖子生! 【活动】为视频UP主打CALL,互动领福利!
查看: 1451|回复: 0

数据库调优的方法

[复制链接]

该用户从未签到

发表于 2019-4-16 13:37:20 | 显示全部楼层 |阅读模式
SQL语句优化方法整理

我们要做到不但会写SQL,还要做到写出性能优良的SQL,以下为笔者学习、摘录、并汇总部分资料与大家分享!
(1)      选择最有效率的表名顺序(只在基于规则的优化器中有效):
ORACLE 的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表(基础表 driving table)将被最先处理,在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表。如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表.
(2)      WHERE子句中的连接顺序.:
ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他WHERE条件之前, 那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾.
(3)      SELECT子句中避免使用 ‘ * ‘:
ORACLE在解析的过程中, 会将'*' 依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 这意味着将耗费更多的时间
(4)      减少访问数据库的次数:
ORACLE在内部执行了许多工作: 解析SQL语句, 估算索引的利用率, 绑定变量 , 读数据块等;
(5)      在SQL*Plus , SQL*Forms和Pro*C中重新设置ARRAYSIZE参数, 可以增加每次数据库访问的检索数据量 ,建议值为200
(6)      使用DECODE函数来减少处理时间:
使用DECODE函数可以避免重复扫描相同记录或重复连接相同的表.
(7)      整合简单,无关联的数据库访问:
如果你有几个简单的数据库查询语句,你可以把它们整合到一个查询中(即使它们之间没有关系)
(8)      删除重复记录:
最高效的删除重复记录方法 ( 因为使用了ROWID)例子:
DELETE  FROM  EMP E WHERE  E.ROWID > (SELECTMIN(X.ROWID)
FROM  EMP X  WHERE X.EMP_NO = E.EMP_NO);
(9)      用TRUNCATE替代DELETE:
当删除表中的记录时,在通常情况下, 回滚段(rollback segments ) 用来存放可以被恢复的信息. 如果你没有COMMIT事务,ORACLE会将数据恢复到删除之前的状态(准确地说是恢复到执行删除命令之前的状况) 而当运用TRUNCATE时, 回滚段不再存放任何可被恢复的信息.当命令运行后,数据不能被恢复.因此很少的资源被调用,执行时间也会很短. (译者按: TRUNCATE只在删除全表适用,TRUNCATE是DDL不是DML)
(10) 尽量多使用COMMIT:
只要有可能,在程序中尽量多使用COMMIT, 这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少:
COMMIT所释放的资源:
a. 回滚段上用于恢复数据的信息.
b. 被程序语句获得的锁
c. redo log buffer 中的空间
d. ORACLE为管理上述3种资源中的内部花费
(11) 用Where子句替换HAVING子句:
避免使用HAVING子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤. 这个处理需要排序,总计等操作. 如果能通过WHERE子句限制记录的数目,那就能减少这方面的开销. (非oracle中)on、where、having这三个都可以加条件的子句中,on是最先执行,where次之,having最后,因为on是先把不符合条件的记录过滤后才进行统计,它就可以减少中间运算要处理的数据,按理说应该速度是最快的,where也应该比having快点的,因为它过滤数据后才进行sum,在两个表联接时才用on的,所以在一个表的时候,就剩下where跟having比较了。在这单表查询统计的情况下,如果要过滤的条件没有涉及到要计算字段,那它们的结果是一样的,只是where可以使用rushmore技术,而having就不能,在速度上后者要慢如果要涉及到计算的字段,就表示在没计算之前,这个字段的值是不确定的,根据上篇写的工作流程,where的作用时间是在计算之前就完成的,而having就是在计算后才起作用的,所以在这种情况下,两者的结果会不同。在多表联接查询时,on比where更早起作用。系统首先根据各个表之间的联接条件,把多个表合成一个临时表后,再由where进行过滤,然后再计算,计算完后再由having进行过滤。由此可见,要想过滤条件起到正确的作用,首先要明白这个条件应该在什么时候起作用,然后再决定放在那里
(12) 减少对表的查询:
在含有子查询的SQL语句中,要特别注意减少对表的查询.例子:
    SELECT  TAB_NAME FROM TABLES WHERE (TAB_NAME,DB_VER)= ( SELECT
TAB_NAME,DB_VER FROM  TAB_COLUMNS  WHERE VERSION = 604)
(13) 通过内部函数提高SQL效率.:
复杂的SQL往往牺牲了执行效率. 能够掌握上面的运用函数解决问题的方法在实际工作中是非常有意义的
(14) 使用表的别名(Alias):
当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column上.这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误.
(15) 用EXISTS替代IN、用NOT EXISTS替代NOT IN:
在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(或NOT EXISTS)通常将提高查询的效率. 在子查询中,NOT IN子句将执行一个内部的排序和合并. 无论在哪种情况下,NOT IN都是最低效的 (因为它对子查询中的表执行了一个全表遍历). 为了避免使用NOT IN ,我们可以把它改写成外连接(Outer Joins)或NOT EXISTS.
例子:
(高效)SELECT *FROM  EMP (基础表)  WHERE  EMPNO > 0 AND  EXISTS (SELECT ‘X'  FROM DEPT WHERE  DEPT.DEPTNO =EMP.DEPTNO  AND  LOC = ‘MELB')
(低效)SELECT  * FROM EMP (基础表)  WHERE EMPNO > 0  AND  DEPTNO IN(SELECT DEPTNO  FROM DEPT  WHERE  LOC = ‘MELB')
(16) 识别'效率最低'的SQL语句:

V_$SQLAREA视图提供了执行的细节。(执行、读取磁盘和读取缓冲区的次数)
--性能最差的SQL.
虽然目前各种关于SQL优化的图形化工具层出不穷,但是写出自己的SQL工具来解决问题始终是一个最好的方法:
SELECT  EXECUTIONS , DISK_READS,BUFFER_GETS,
ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio,
ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run,
SQL_TEXT
FROM  V$SQLAREA
WHERE  EXECUTIONS>0
AND  BUFFER_GETS > 0
AND  (BUFFER_GETS-DISK_READS)/BUFFER_GETS< 0.8
ORDER BY  4 DESC;

(17) 识别'性能最差'的SQL语句:

V_$SQLAREA视图提供了执行的细节。(执行、读取磁盘和读取缓冲区的次数)
--性能最差的SQL
SELECT * FROM ( SELECT PARSING_USER_IDEXECUTIONS,SORTS,COMMAND_TYPE,DISK_READS,sql_text
                FROM v$sqlarea
                ORDER BY disk_reads DESC)
WHERE ROWNUM<200


(18)建好索引后,索引应该怎样用?

应该建索引的字段:1.经常作为查询条件的字段2.外键3.经常需要排序的字段4.分组排序的字段

 

应该少建或者不建索引的字段有:1.表记录太少,2.经常需要插入,删除,修改的表,3.表中数据重复且分布平均的字段

 

一些SQL的写法会限制索引的使用:1.where子句中如果使用in、or、like、!= <>,均会导致索引不能正常使用,将"<>"换成">and<";将"is not null "换成">=chr(0)";2.使用函数时,该列就不能使用索引。3.比较不匹配数据类型时,该索引将会被忽略。

 

一些SQL语句优化的写法:1.如果from是双表的查询时,大表放在前面,小表放在后面(基础表)。最后面的表是基础表。(只在基于规则的优化器中有效)2.如果三表查询时,选择交叉表(intersection table)作为基础表.(只在基于规则的优化器中有效)3.写where条件时,有索引字段的判断在前,其它字段的判断在后;如果where条件中用到复合索引,按照索引列在复合索引中出现的顺序来依次写where条件;4.查询数量较大时,使用表连接代替IN,EXISTS,NOT IN,NOT EXISTS等。5.ORACLE采用自下而上的顺序解析WHERE子句,那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾.

 

哈哈,划重点的时候到了。。。。~~~

 

精华部分:

优化方法:建索引。

举例:

            创建索引:createindexIDX_DI_DWCASA_50 on DI_DWCASA (V_CASA_ACCTNUMB,V_CASA_CUST_REF_CODE);

            删除索引:drop  index IDX_DI_DWCASA_50;

查看执行计划方法:将SQL语句写在窗口,按F5键即可。

注意事项:

1.       根据表的大小。

2.       在连接条件上加索引。

3.       索引中不要加入太多列字段,否则可能造成索引无效,所以一般最多4个字段。

4.       注意索引的先后顺序,使用频度高的字段放在前面。

5.       即使在一个表上建立多个索引,运行时也只能走一个索引。

6.       离散度大的字段放在前面,离散度小的字段放在后面。

7.       增加索引后,要判断生效区域。

收集统计信息

在进行执行SQL语句前,最好收集一次统计信息,(当数据库中有数时),

收集统计信息的语句:

-- Use system or sys user login in database if you need to rebuildstatistics,

 

BEGIN

  DBMS_STATS.GATHER_SCHEMA_STATS(

    OWNNAME => 'abc',--此处填写数据库名

    ESTIMATE_PERCENT =>DBMS_STATS.AUTO_SAMPLE_SIZE,

    --METHOD_OPT => 'FOR ALLCOLUMNS SIZE AUTO',

         METHOD_OPT => 'FOR ALLCOLUMNS SIZE 1',

    DEGREE =>DBMS_STATS.AUTO_DEGREE,

    CASCADE => TRUE

  );

END;
回复

使用道具 举报

本版积分规则

关闭

站长推荐上一条 /3 下一条

小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

GMT+8, 2020-7-11 03:10 , Processed in 0.057446 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2020 Comsenz Inc.

快速回复 返回顶部 返回列表