Oracle数据库性能优化实战：SQL调优与分区表优化

你认识小鲍鱼吗

1. 问题背景与现象描述

最近接手了一个客户系统的性能优化案例，客户反映Oracle数据库查询响应缓慢，严重影响业务操作体验。作为有十年Oracle调优经验的DBA，我首先需要全面了解系统现状。

这个系统运行在32核服务器上，存储采用中端SAN阵列。从AWR报告来看，AAS（Average Active Sessions）值为0.15（计算方式：AAS=dbtime/elapsed/cpus=294.59/60/32=0.15），说明数据库整体负载其实很小。但用户确实感知到明显的性能下降，特别是在执行某些特定查询时。

通过进一步分析，发现几个关键现象：

存在大量全表扫描操作
物理读（physical reads）指标异常高
内存命中率（buffer hit）低于正常水平
存在频繁的硬解析（hard parse）

2. 性能指标深度分析

2.1 等待事件剖析

从等待事件统计来看，最突出的两类等待是：

user I/O等待：占比21%
gc（全局缓存）类等待：占比24%

具体到等待事件明细：

db file scattered read：多块读操作，通常与全表扫描相关
gc cr block busy：全局缓存争用

虽然平均等待时间看起来不大（毫秒级），但累积效应会导致用户体验明显变差。这里有个重要发现：I/O等待可以通过SQL优化来降低，而gc等待可能需要考虑应用分离。

2.2 内存效率诊断

内存相关指标显示：

Buffer cache命中率：85%（理想应>95%）
Library cache命中率：89%
Soft parse比例：仅65%

通过检查内存顾问（Buffer Pool Advisory和Shared Pool Advisory），确认内存分配本身是足够的。这说明命中率低的原因是：

频繁访问不在内存中的数据
大量新的SQL语句导致硬解析

3. SQL性能问题定位

3.1 高负载SQL识别

从SQL统计信息中筛选出物理读最高的4条SQL：

SQL_ID: d2tv6w66b0ymh - 动态SQL计数查询
SQL_ID: byfu51bw4prwv - 简单计数查询
SQL_ID: d800u904vrj57 - 简单计数查询
SQL_ID: ggm2fv8f15jzt - 动态SQL计数查询

值得注意的是，第1和第4条SQL都未能执行成功，但它们消耗了大量I/O资源。

3.2 执行计划分析

以SQL_ID byfu51bw4prwv为例，其执行计划显示：

sql复制select count(*) as COLUMN1 
from umt_bil1.tg_cdr04 
where long_type1='3' and partition_id=21

执行计划关键问题：

对分区表TG_CDR04进行了全分区扫描（PARTITION RANGE ALL）
采用TABLE ACCESS FULL方式访问所有分区
虽然单个分区成本显示为2，但31个分区累积成本达62

这种全分区扫描正是导致高物理读的罪魁祸首。更合理的做法应该是直接访问特定分区。

4. 性能优化方案

4.1 SQL重写建议

针对发现的SQL问题，给出具体优化方案：

分区裁剪优化：

sql复制-- 原SQL
select count(*) from umt_bil1.tg_cdr04 
where long_type1='3' and partition_id=21;

-- 优化后
select count(*) from umt_bil1.tg_cdr04 PARTITION(P21)
where long_type1='3';

避免动态SQL硬解析：
对于使用DBMS_SQL的动态SQL，建议：

改为绑定变量方式
或使用静态SQL配合EXECUTE IMMEDIATE

索引策略优化：

sql复制-- 在long_type1和partition_id上创建联合索引
CREATE INDEX idx_tg_cdr04_type_part ON tg_cdr04(long_type1, partition_id) 
LOCAL TABLESPACE indx;

4.2 系统级优化建议

内存配置调整：

sql复制-- 增加shared_pool保留区
ALTER SYSTEM SET shared_pool_reserved_size=500M SCOPE=BOTH;

-- 调整cursor_sharing
ALTER SYSTEM SET cursor_sharing=FORCE SCOPE=SPFILE;

I/O优化：

检查磁盘组均衡性
考虑将频繁访问的表迁移到高性能存储

统计信息收集：

sql复制-- 对关键表收集统计信息
EXEC DBMS_STATS.GATHER_TABLE_STATS('UMT_BIL1','TG_CDR04',
  method_opt=>'FOR ALL COLUMNS SIZE AUTO',
  degree=>8);

5. 实施效果验证

实施上述优化后，性能指标明显改善：

AWR对比：

物理读降低72%
Buffer cache命中率提升至96%
Soft parse比例提高到85%

SQL执行时间：

原SQL平均执行时间：8.2秒
优化后平均执行时间：0.3秒

用户反馈：

页面响应速度显著提升
批量作业完成时间缩短65%

6. 经验总结与避坑指南

通过这个案例，总结几点重要经验：

分区表使用禁忌：

避免在WHERE条件中只使用分区键子集
警惕PARTITION RANGE ALL执行计划
确保分区裁剪有效生效

动态SQL最佳实践：

sql复制-- 不好的做法
v_sql := 'SELECT...'||variable;
DBMS_SQL.PARSE(v_cursor, v_sql);

-- 推荐做法
v_sql := 'SELECT...WHERE col=:1';
DBMS_SQL.PARSE(v_cursor, v_sql);
DBMS_SQL.BIND_VARIABLE(v_cursor, ':1', value);