使用索引列作为过滤器,将其置于’两个文字值之间’. (该列位于索引的第二个位置,实际上使执行速度变慢;我将在稍后处理).令我困惑的是Oracle(11.2.0.3.0)根据提供给to_date的值的格式和格式字符串使用或忽略所述索引:
这忽略了索引:
SQL> SELECT *
2 FROM gprs_history_import gh
3 WHERE start_call_date_time BETWEEN
4 to_date('20140610 000000','yyyymmdd hh24miss') AND
5 to_date('20140610 235959','yyyymmdd hh24miss')
6 /
Execution Plan
----------------------------------------------------------
Plan hash value: 990804809
--------------------------------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | Pstart| Pstop |
--------------------------------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 350 | 219K| 242K (1)| 00:56:42 | | |
| 1 | PARTITION RANGE SINGLE| | 350 | 219K| 242K (1)| 00:56:42 | 74 | 74 |
| 2 | PARTITION LIST ALL | | 350 | 219K| 242K (1)| 00:56:42 | 1 | 3 |
|* 3 | TABLE ACCESS FULL | GPRS_HISTORY_IMPORT | 350 | 219K| 242K (1)| 00:56:42 | 220 | 222 |
--------------------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
3 - filter("START_CALL_DATE_TIME" SELECT *
2 FROM gprs_history_import gh
3 WHERE start_call_date_time BETWEEN
4 to_date('20140610 ','yyyymmdd ') AND
5 to_date('20140610 235959','yyyymmdd hh24miss')
6 /
Execution Plan
----------------------------------------------------------
Plan hash value: 464458373
---------------------------------------------------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | Pstart| Pstop |
---------------------------------------------------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 350 | 219K| 2795K (1)| 10:52:15 | | |
|* 1 | FILTER | | | | | | | |
| 2 | PARTITION RANGE ITERATOR | | 350 | 219K| 2795K (1)| 10:52:15 | KEY | 74 |
| 3 | PARTITION LIST ALL | | 350 | 219K| 2795K (1)| 10:52:15 | 1 | 3 |
| 4 | TABLE ACCESS BY LOCAL INDEX ROWID| GPRS_HISTORY_IMPORT | 350 | 219K| 2795K (1)| 10:52:15 | KEY | 222 |
|* 5 | INDEX SKIP SCAN | GPRS_HISTORY_IMPORT_IDX1 | 1 | | 2795K (1)| 10:52:15 | KEY | 222 |
---------------------------------------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter(TO_DATE('20140610 ','yyyymmdd ')=TO_DATE('20140610 ','yyyymmdd ') AND "START_CALL_DATE_TIME"=TO_DATE('20140610 ','syyyy-mm-dd hh24:mi:ss'))
((1)中的过滤器似乎有点傻,好像Oracle不理解表达式)
同样,这个没有(我删除了尾随空格):
SQL> SELECT *
2 FROM gprs_history_import gh
3 WHERE start_call_date_time BETWEEN
4 to_date('20140610','yyyymmdd') AND
5 to_date('20140610 235959','syyyy-mm-dd hh24:mi:ss'))
在空间周围加上引号可以排除索引的使用.
是什么赋予了?
解决方法
好的 – 我会试一试,这主要是从可用信息中扣除的:为什么Oracle选择不同的执行计划?
在您的第二个查询中,似乎有不寻常的日期格式,优化器不知道结果日期的值是什么.你看到过滤器谓词:
1 – 过滤器(TO_DATE(‘20140610′,’yyyymmdd’)< = TO_DATE('2014-06-10 23:59:59','syyyy-mm-dd hh24:mi:ss')) 这意味着优化器甚至不确定第一个日期是否小于第二个日期!这意味着优化器不知道返回行的数量,并且只使用通用计划而不考虑特定的统计信息.如果你有一个用户定义的函数xyt(),它将返回该范围的日期,这将是相同的.优化器无法知道将导致的日期值 – 这意味着您将获得一个通用的通用计划,对于指定的任何日期范围,该计划应该相当不错. 在第一种情况和第三种情况下,优化器似乎直接理解日期,并可以使用统计信息猜测日期范围内的行数.因此,虽然第二个查询对于优化器,如BETWEEN X和3,但此查询就像BETWEEN 1和3 所以他优化了预测返回行数的查询计划!
奇怪的事情似乎是,查询优化器有一个奇怪的日期格式的问题,可以作为一个错误/改进请求提交…
但重要的一点:
>全表扫描不一定是BAD计划……使用索引并不总是更快! >查询计划中的成本绝不与实际执行时间或性能直接相关 – 它是比较SAME QUERY的不同计划的内部度量(因此您无法比较查询等不同查询的成本1,2和3)
基本上,如果从表中返回大量行,则在没有索引访问的情况下进行全表扫描会在很多情况下快得多,尤其是在某些分区上运行时! – 表扫描仅访问匹配日期范围的相关性 – 因此仅针对相关日期并返回此分区中的所有行.这比查询每一行的索引要快得多,然后通过索引访问来提取行…尝试分析查询 – 分区上的全表扫描速度应该快3倍,IO要少得多.