首页 > 代码库 > PLSQL_性能优化系列09_Oracle Partition Table大数据分区表

PLSQL_性能优化系列09_Oracle Partition Table大数据分区表

2014-08-22 BaoXinjian

一、摘要


1、分区表:

    随着表的不断增大,对于新纪录的增加、查找、删除等(DML)的维护也更加困难。对于数据库中的超大型表,可通过把它的数据分成若干个小表,从而简化数据库的管理活动。对于每一个简化后的小表,我们称为一个单个的分区

    对于分区的访问,我们不需要使用特殊的SQL查询语句或特定的DML语句,而且可以单独的操作单个分区,而不是整个表。同时可以将不同分区的数据放置到不 同的表空间,比如将不同年份的销售数据,存放在不同的表空间,即年的销售数据存放到TBS_2001,2002年的销售数据存放到TBS_2002,依次 类推,从而实现了分散存储,这将大大的简化大容量表的管理,提高查询性能及I/O并发等。

    对于外部应用程序来说,虽然存在不同的分区,且数据位于不同的表空间,但逻辑上仍然是一张表

    可以使用SQL*Loader,IMPDP,EXPDP,Import,Export等工具来装载或卸载分区表中的数据

    关于分区表的功能实际上同SQL server 中的分区表是同样的概念,只不过SQL server中的数据存放到了文件组,相当于Oracle概念中的表空间

    分区信息管控表:DBA_TAB_SUBPARTITIONS

 

2、何时分区

    当表达到GB大小且继续增长

    需要将历史数据和当前的数据分开单独处理,比如历史数据仅仅需要只读,而当前数据则实现DML

 

3、分区的条件及特性

  • 共性:不同的分区之间必须有相同的逻辑属性,比如表名,列名,数据类型,约束等,
  • 个性:各个分区可以有不同的物理属性,比如pctfree, pctused, and tablespaces.
  • 分区独立性:即使某些分区不可用,其他分区仍然可用。
  • 特殊性:含有LONG、LONGRAW数据类型的表不能进行分区

 

4、分区的优点

  • 提高查询性能:只需要搜索特定分区,而非整张表,提高查询速度
  • 节约维护时间:单个分区的数据装载,索引重建,备份,维护等将远小于整张表的维护时间。
  • 节约维护成本:可以单独备份和恢复每个分区
  • 均衡I/O:将不同的分区映射到不同的磁盘以平衡I/O,提高并发

 

5、分区表类型

  • 范围分区表
  • 列表分区表
  • 哈希分区表
  • 组合分区表

 

6、 分区索引类型

  • 全局索引
  • 全局分区索引
  • 本地分区索引

 

7、 分区表建立四种方式语法

(1)、范围分区表

CREATE TABLE range_example(   range_key_column   DATE,   DATA               VARCHAR2 (20),   ID                 INTEGER)PARTITION BY RANGE (range_key_column)   (PARTITION part01       VALUES LESS THAN          (TO_DATE (2008-07-1 00:00:00‘, yyyy-mm-dd hh24:mi:ss))       TABLESPACE tbs01,    PARTITION part02       VALUES LESS THAN          (TO_DATE (2008-08-1 00:00:00‘, yyyy-mm-dd hh24:mi:ss))       TABLESPACE tbs02,    PARTITION part03       VALUES LESS THAN          (TO_DATE (2008-09-1 00:00:00‘, yyyy-mm-dd hh24:mi:ss))       TABLESPACE tbs03);

(2)、列表分区表

CREATE TABLE list_example (dname VARCHAR2 (10), DATA VARCHAR2 (20))PARTITION BY LIST (dname)   (PARTITION part01       VALUES (ME‘, PE‘, QC‘, RD),    PARTITION part02       VALUES (SMT‘, SALE‘));

(3)、哈希分区表

CREATE TABLE hash_example(   hash_key_column   DATE,   DATA              VARCHAR2 (20))PARTITION BY HASH (hash_key_cloumn)   (PARTITION part01, PARTITION part02);

(4)、组合分区表

CREATE TABLE range_hash_example(   range_column_key   DATE,   hash_column_key    INT,   DATA               VARCHAR2 (20))PARTITION BY RANGE (range_column_key)   SUBPARTITION BY HASH (hash_column_key)      SUBPARTITIONS 2   (PARTITION part_1       VALUES LESS THAN (TO_DATE (2008-08-01‘, yyyy-mm-dd)) (       SUBPARTITION part_1_sub_1 ,       SUBPARTITION part_1_sub_2 ,       SUBPARTITION part_1_sub_3    ),    PARTITION part_2       VALUES LESS THAN (TO_DATE (2008-09-01‘, yyyy-mm-dd))    (SUBPARTITION part_2_sub_1 , SUBPARTITION part_2_sub_2 ));

 

8、 分区索引的结构图

注:hash partitioned table 新增partition时,现有表的中所有data都有重新计算hash值,然后重新分配到分区中。所以被重新分配的分区的 indexes需要rebuild 。

 

二、案例 - 创建分区表


案例: 创建分区表bxj_emp,以性别区分数据分区方式,将资料分别存放两个男女表空间中

1. 创建两个表空空间

CREATE TABLESPACE bxj_emp_ts1 LOGGING DATAFILE /opt/oracle/oradata/gavinsit/bxj_emp_data01.dbf  SIZE 32M  AUTOEXTEND ON  NEXT 32M MAXSIZE 2048M EXTENT MANAGEMENT LOCAL CREATE TABLESPACE bxj_emp_ts2 LOGGING DATAFILE /opt/oracle/oradata/gavinsit/bxj_emp_data02.dbf  SIZE 32M  AUTOEXTEND ON  NEXT 32M MAXSIZE 2048M EXTENT MANAGEMENT LOCAL

 

2. 创建分区表,以sex栏位区分

CREATE TABLE bxj_emp_tb(   emp_id           NUMBER,   employeee_name   VARCHAR (50),   sex              VARCHAR (10),   salary           NUMBER)PARTITION BY LIST (sex)   (PARTITION bxj_emp_ts1       VALUES (male),    PARTITION bxj_emp_ts2       VALUES (female‘));

 

3. 建立测试资料,男女各一笔

insert into apps.bxj_emp_tb values (1, gavin.bao‘, male‘, 100000);       insert into apps.bxj_emp_tb values (2, gavin.bao‘, female‘, 200000); 

 

4.  以条件sex = male进行查询时,系统只遍历tablespace 1 male

 

5.  以条件sex = female进行查询时,系统只遍历tablespace 1 female 

 

6.  无分区条件查询,系统需全部遍历tablespace 1 and 2 / male and female

 

 三、 案例 - 本地分区索引


1. 创建本地分区索引

CREATE INDEX bxj_emp_tb_localindex ON apps.bxj_emp_tb(sex)LOCAL (     PARTITION idx_1 TABLESPACE bxj_emp_ts1,     PARTITION idx_2 TABLESPACE bxj_emp_ts2  );

2. 解析计划中索引遍历方式

 

四、案例 - 全局分区索引


1.  创建全局分区索引

CREATE INDEX bxj_emp_tb_globalindexON bxj_emp_tb (salary)GLOBAL PARTITION BY RANGE ( salary ) (   PARTITION idx_1 VALUES LESS THAN (10000)    TABLESPACE bxj_emp_ts1,   PARTITION idx_2 VALUES LESS THAN (MAXVALUE) TABLESPACE bxj_emp_ts2 );

2. 条件为salary <= 100, 索引只遍历tablespace1 

3. 条件为salary >=100000, 索引只遍历tablespace2

 4. 无分区条件时,索引遍历全部

 

五、案例 - Oracle Erp交易表mtl_material_transactions的结构


 

select * from dba_tab_subpartitions

where table_name = ‘MTL_MATERIAL_TRANSACTIONS‘

 

 

 ********************作者: 鲍新建********************

 

参考:http://www.linuxidc.com/Linux/2011-08/40763.htm

参考:http://mingyue19850801.blog.163.com/blog/static/19520820201071712231671/

PLSQL_性能优化系列09_Oracle Partition Table大数据分区表