400-920-0692
技术资源

表分区的几种类型及操作方法

一.范围分区:

范围分区将数据基于范围映射到每一个分区,这个范围是你在创建分区时指定的分区键决定的。这种分区方式是最为常用的,并且分区键经常采用日期。举个例子:你可能会将销售数据按照月份进行分区。

当使用范围分区时,请考虑以下几个规则:

1、每一个分区都必须有一个VALUESLESS THEN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。

2、所有分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。

3、在最高的分区中,MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值,也可以理解为高于任何分区中指定的VALUELESS THEN的值,同时包括空值。

例一:

假设有一个CUSTOMER表,表中有数据200000行,我们将此表通过CUSTOMER_ID进行分区,每个分区存储100000行,我们将每个分区保存到单独的表空间中,这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码,如下:

CREATE TABLE CUSTOMER

(

    CUSTOMER_IDNUMBER NOT NULL PRIMARY KEY,

    FIRST_NAME  VARCHAR2(30)NOT NULL,

    LAST_NAME   VARCHAR2(30)NOT NULL,

    PHONE        VARCHAR2(15)NOT NULL,

    EMAIL        VARCHAR2(80),

    STATUS       CHAR(1)

)

PARTITION BY RANGE(CUSTOMER_ID)

(

    PARTITIONCUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01,

    PARTITIONCUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02

)

例二:按时间划分

CREATE TABLEORDER_ACTIVITIES

(

    ORDER_ID      NUMBER(7)NOT NULL,

    ORDER_DATE    DATE,

    TOTAL_AMOUNTNUMBER,

    CUSTOTMER_IDNUMBER(7),

    PAID           CHAR(1)

)

PARTITION BY RANGE(ORDER_DATE)

(

  PARTITIONORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01- MAY-2003','DD-MON-YYYY')) TABLESPACEORD_TS01,

  PARTITIONORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUN-2003','DD-MON-YYYY'))TABLESPACE ORD_TS02,

  PARTITIONORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUL-2003','DD-MON-YYYY')) TABLESPACEORD_TS03

)

例三:MAXVALUE

CREATE TABLERangeTable

(

  idd   INTPRIMARY KEY ,

  iNAMEVARCHAR(10),

  gradeINT 

)

PARTITION  BY  RANGE(grade)

(

      PARTITION  part1VALUES  LESS  THEN (1000) TABLESPACE  Part1_tb,

      PARTITION  part2VALUES  LESS  THEN (MAXVALUE) TABLESPACE  Part2_tb

);

 

二.列表分区:

该分区的特点是某列的值只有几个,基于这样的特点我们可以采用列表分区。

例一:

CREATE TABLEPROBLEM_TICKETS

(

    PROBLEM_ID   NUMBER(7)NOT NULL PRIMARY KEY,

    DESCRIPTION  VARCHAR2(2000),

    CUSTOMER_ID  NUMBER(7)NOT NULL,

    DATE_ENTEREDDATE NOT NULL,

    STATUS       VARCHAR2(20)

)

PARTITION BY LIST(STATUS)

(

      PARTITIONPROB_ACTIVE   VALUES ('ACTIVE') TABLESPACE PROB_TS01,

      PARTITIONPROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02

例二:

CREATE  TABLE  ListTable

(

    id    INT  PRIMARY  KEY,

    name  VARCHAR(20),

    area  VARCHAR(10)

)

PARTITION  BY  LIST(area)

(

    PARTITION  part1VALUES ('guangdong','beijing')TABLESPACE  Part1_tb,

    PARTITION  part2VALUES ('shanghai','nanjing')  TABLESPACE  Part2_tb

);

)

 

三.散列分区:

这类分区是在列值上使用散列算法,以确定将行放入哪个分区中。当列的值没有合适的条件时,建议使用散列分区。

散列分区为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。

例一:

CREATE TABLEHASH_TABLE

(

  COLNUMBER(8),

  INFVARCHAR2(100)

)

PARTITION BY HASH(COL)

(

  PARTITIONPART01 TABLESPACE HASH_TS01,

  PARTITIONPART02 TABLESPACE HASH_TS02,

  PARTITIONPART03 TABLESPACE HASH_TS03

)

简写:

CREATE TABLE emp

(

    empnoNUMBER (4),

    enameVARCHAR2 (30),

    sal   NUMBER

)

PARTITIONBY  HASH (empno) PARTITIONS 8

STORE IN(emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8);

hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪个分区中,hash算法中最重要的是hash函数,Oracle中如果你要使用hash分区,只需指定分区的数量即可。建议分区的数量采用2的n次方,这样可以使得各个分区间数据分布更加均匀。

 

四.组合范围散列分区

这种分区是基于范围分区和列表分区,表首先按某列进行范围分区,然后再按某列进行列表分区,分区之中的分区被称为子分区。

CREATE TABLE SALES

(

PRODUCT_IDVARCHAR2(5),

SALES_DATE DATE,

SALES_COST NUMBER(10),

STATUS VARCHAR2(20)

)

PARTITION BYRANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS)

(

   PARTITIONP1 VALUES LESS THAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACE rptfact2009

          (

              SUBPARTITIONP1SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,

              SUBPARTITIONP1SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009

          ),

   PARTITIONP2 VALUES LESS THAN (TO_DATE('2003-03-01','YYYY-MM-DD')) TABLESPACE rptfact2009

          (

              SUBPARTITIONP2SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,

              SUBPARTITIONP2SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009

          )

五.复合范围散列分区:

这种分区是基于范围分区和散列分区,表首先按某列进行范围分区,然后再按某列进行散列分区。

create tabledinya_test

 (

 transaction_idnumber primary key,

 item_idnumber(8) not null,

 item_descriptionvarchar2(300),

 transaction_datedate

 )

 partition byrange(transaction_date)subpartition byhash(transaction_id)  subpartitions 3 store in(dinya_space01,dinya_space02,dinya_space03)

 (

     partitionpart_01 values less than(to_date(‘2006-01-01’,’yyyy-mm-dd’)),

     partitionpart_02 values less than(to_date(‘2010-01-01’,’yyyy-mm-dd’)),

     partitionpart_03 values less than(maxvalue)

 );