首页 > 代码库 > 浅谈Oracle数据库分区表

浅谈Oracle数据库分区表

 

Oracle数据库分区是作为Oracle数据库性能优化的一种重要的手段和方法,之前,只听过分区的大名,却总未用过,最近简单学习了一下,总结如下,不对之处,还希望朋友们多多指点,交流!

    1.表空间及分区表的概念
    2.表分区的具体作用
    3.表分区的优缺点
    4.表分区的几种类型及操作方法
    5.对表分区的维护性操作.

( 1.) 表空间及分区表的概念
    表空间:
       是一个或多个数据文件的集合,所有的数据对象都存放在指定的表空间中,但主要存放的是表, 所以称作表空间。
    分区表:
       当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至于每次都扫描整张表。

( 2.)表分区的具体作用

       Oracle的表分区功能通过改善可管理性、性能和可用性,从而为各式应用程序带来了极大的好处。通常,分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务,分区是构建千兆字节数据系统或超高可用性系统的关键工具。

      分区功能能够将表、索引或索引组织表进一步细分为段,这些数据库对象的段叫做分区。每个分区有自己的名称,还可以选择自己的存储特性。从数据库管理员的角度来看,一个分区后的对象具有多个段,这些段既可进行集体管理,也可单独管理,这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是,从应用程序的角度来看,分区后的表与非分区表完全相同,使用 SQL DML 命令访问分区后的表时,无需任何修改。

    什么时候使用分区表:
    1、表的大小超过2GB。
    2、表中包含历史数据,新的数据被增加都新的分区中。

( 3.)表分区的优缺点

     表分区有以下优点:

   1) 增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;

   2) 维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;

   3) 均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能;

   4) 改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。

   缺点:
       分区表相关:已经存在的表没有方法可以直接转化为分区表。不过 Oracle 提供了在线重定义表的功能。

( 4.)表分区的几种类型及操作方法

    Oracle数据库提供对表或索引的分区方法有三种:

      ü 范围分区

      ü Hash分区(散列分区)

      ü 复合分区

  1、范围分区详细说明

  范围分区就是对数据表中的某个值的范围进行分区,根据某个值的范围,决定将该数据存储在哪个分区上。如根据序号分区根据时间等来进行分区,也可以使用这两个字段共同来进行分区具体需要根据项目需求等原因。根据序号,比如小于2000000的放在part01, 2000000~4000000的放在part02。。。

create table AAA(

 id number primary key,  

 indate date not null

)partition by range(indate)(

 partition part_01 values less than(to_date(‘2006-01-01‘,‘yyyy-mm-dd‘))tablespace space01,  

 partition part_02 values less than(to_date(‘2010-01-01‘,‘yyyy-mm-dd‘))tablespace space02,

 partition part_03 values less than(maxvalue)tablespace space03

);

space01\ space02\ space03为建立的三个表空间,相当于把建立的一个大的表分在了3个不同的表空间的分区上了。

  2、Hash分区(散列分区)详细说明

     散列分区为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。也就是只命名分区名称,这样均匀进行数据分布。

create table AAA(

 id number primary key,  

 indate date not null

)partition by range( indate ) subpartition by hash( id )(

  partition part_01 tablespace space01,

  partition part_02 tablespace space02,

  partition part_03 tablespace space03
);

  3、复合分区详细说明

     有时候我们需要根据范围分区后,每个分区内的数据再散列地分布在几个表空间中,这样我们就要使用复合分区。复合分区是先使用范围分区,然后在每个分区内再使用

散列分区的一种分区方法。

partition by range(indate)subpartition by hash(id)

subpartitions 3 store in (space01, space02, space03) (

  partition part_01 values less than(to_date(’2006-01-01’,’yyyy-mm-dd’)),

  partition part_02 values less than(to_date(’2010-01-01’,’yyyy-mm-dd’)),

  partition part_03 values less than(maxvalue)

 );

( 5.) 有关表分区的一些维护性操作:

  1、插入记录:

    insert into AAA values(1 ,sysdate);

    insert into AAA values(2 ,to_date(‘2006-01-01‘,‘yyyy-mm-dd‘));

    insert into AAA values(3 ,to_date(‘2011-01-01‘,‘yyyy-mm-dd‘));

  2、查询分区表记录:select * from AAA partition(part_01);

  3、更新分区表的记录:update AAA partition(part_01) t set indate=’2015-01-30’  where t.id=1;

      但是当更新的时候指定了分区,而根据查询的记录不在该分区中时,将不会更新数据

  4、删除分区表记录:delete from AAA partition(part_02) t where t.id=4;

       如果指定了分区,而条件中的数据又不在该分区中时,将不会删除任何数据。

  5、增加一个分区:

      alter table AAA add partition part_04 values less than(to_date(’2012-01-01’,’yyyy-mm-dd’)) tablespace dinya_spa ce03;

      增加一个分区的时候,增加的分区的条件必须大于现有分区的最大值,否则系统将提示ORA-14074 partition bound must collate

      higher than that of the last partition 错误。

  6、合并一个分区:

      alter table AAA merge partitions part_01,part_02 into partition part_02;

      如果在合并的时候把合并后的分区定为part_01的时候,系统将提示ORA-14275 cannot reuse lower-bound partition as resulting

      partition 错误。

  7、删除分区:alter table AAA drop partition part_01; 删除分区表的一个分区后,查询该表的数据时显示,该分区中的数据已全部丢失,所以执行删除分区动作时要慎重,确保先备份数据后再执行,或将分区合并。

( 6.) 建立索引

    分区表和一般表一样可以建立索引,分区表可以创建局部索引和全局索引。当分区中出现许多事务并且要保证所有分区中的数据记录的唯一性时采用全局索引。

   1. 局部索引分区的建立:

  create index idx_t on AAA(id)  local (

    partition idx_1 tablespace space01,

    partition idx_2 tablespace space02,

    partition idx_3 tablespace space03

  );

 2. 全局索引建立时global 子句允许指定索引的范围值,这个范围值为索引字段的范围值:

  create index idx_t on AAA(id) global partition by range(id) (

     partition idx_1 values less than (1000) tablespace space01,

     partition idx_2 values less than (10000) tablespace space02,

     partition idx_3 values less than (maxvalue) tablespace space03

   );

      当然也可以不指定索引分区名直接对整个表建立索引:

  create index idx_t on AAA(id);

  

总结:
    需要说明的是,以上距离分区表事务操作的的时候,都指定了分区,因为指定了分区系统在执行的时候只操作了该分区的记录,提高了数据的处理速度。不要指定分区直接操作数据也是可以的。在分区表上建索引及多索引的使用和非分区表一样。此外,因为在维护分区的时候可能会对分区的索引会产生一定的影响,可能需要在维护之后重建索引,相关内容请参考分区表索引部分的文档。

 

浅谈Oracle数据库分区表