1. 程式人生 > >oracle 分區表

oracle 分區表

重定義 ldb 根據 空間 大於 但是 以及 行集 結果

. 分區表理論知識

Oracle提供了分區技術以支持VLDB(Very Large DataBase)。分區表通過對分區列的判斷,把分區列不同的記錄,放到不同的分區中。分區完全對應用透明。

Oracle的分區表可以包括多個分區,每個分區都是一個獨立的段(SEGMENT),可以存放到不同的表空間中。查詢時可以通過查詢表來訪問各個分區中的數據,也可以通過在查詢時直接指定分區的方法來進行查詢。

When to Partition a Table什麽時候需要分區表,官網的2個建議如下:

(1)Tables greater than 2GB should always be considered for partitioning.

(2)Tables containing historical data, in which new data is added into the newest partition. A typical example is a historical table where only the current month‘s data is updatable and the other 11 months are read only.

oracle 10g中最多支持:1024k-1個分區:

Tables can be partitioned into up to 1024K-1 separate partitions

聯機文檔上有關分區表和索引的說明:

Partitioned Tables and Indexes

http://download.oracle.com/docs/cd/B19306_01/server.102/b14220/partconc.htm#sthref2604

分區提供以下優點:

(1)由於將數據分散到各個分區中,減少了數據損壞的可能性;

(2)可以對單獨的分區進行備份和恢復;

(3)可以將分區映射到不同的物理磁盤上,來分散IO;

(4)提高可管理性、可用性和性能。

Oracle 10g提供了以下幾種分區類型:

(1)範圍分區(range);

(2)哈希分區(hash);

(3)列表分區(list);

(4)範圍-哈希復合分區(range-hash);

(5)範圍-列表復合分區(range-list)。

Range分區:

  Range分區是應用範圍比較廣的表分區方式,它是以列的值的範圍來做為分區的劃分條件,將記錄存放到列值所在的range分區中。

如按照時間劃分,2010年1月的數據放到a分區,2月的數據放到b分區,在創建的時候,需要指定基於的列,以及分區的範圍值。

在按時間分區時,如果某些記錄暫無法預測範圍,可以創建maxvalue分區,所有不在指定範圍內的記錄都會被存儲到maxvalue所在分區中。

如:

create table pdba (id number, time date) partition by range (time)

(

partition p1 values less than (to_date(‘2010-10-1‘, ‘yyyy-mm-dd‘)),

partition p2 values less than (to_date(‘2010-11-1‘, ‘yyyy-mm-dd‘)),

partition p3 values less than (to_date(‘2010-12-1‘, ‘yyyy-mm-dd‘)),

partition p4 values less than (maxvalue)

)

Hash分區:

  對於那些無法有效劃分 範圍的表,可以使用hash分區,這樣對於提高性能還是會有一定的幫助。hash分區會將表中的數據平均分配到你指定的幾個分區中,列所在分區是依據分區 列的hash值自動分配,因此你並不能控制也不知道哪條記錄會被放到哪個分區中,hash分區也可以支持多個依賴列。

如:

create table test

(

transaction_id number primary key,

item_id number(8) not null

)

partition by hash(transaction_id)

(

partition part_01 tablespace tablespace01,

partition part_02 tablespace tablespace02,

partition part_03 tablespace tablespace03

);

在這裏,我們指定了每個分區的表空間。

List分區:

  List分區也需要指定列的值,其分區值必須明確指定,該分區列只能有一個,不能像range或者hash分區那樣同時指定多個列做為分區依賴列,但它的單個分區對應值可以是多個。

  在分區時必須確定分區列可能存在的值,一旦插入的列值不在分區範圍內,則插入/更新就會失敗,因此通常建議使用list分區時,要創建一個default分區存儲那些不在指定範圍內的記錄,類似range分區中的maxvalue分區。

在根據某字段,如城市代碼分區時,可以指定default,把非分區規則的數據,全部放到這個default分區。

如:

create table custaddr
(

id varchar2(15 byte) not null,

areacode varchar2(4 byte)
)

partition by list (areacode)
( partition t_list025 values (‘025‘),
partition t_list372 values (‘372‘) ,
partition t_list510 values (‘510‘),

partition p_other values (default)

)

組合分區:

如果某表按照某列分區之後,仍然較大,或者是一些其它的需求,還可以通過分區內再建子分區的方式將分區再分區,即組合分區的方式。

  組合分區呢在10g中有兩種:range-hash,range-list。註意順序,根分區只能是range分區,子分區可以是hash分區或list分區。

如:

create table test

(

transaction_id number primary key,

transaction_date date

)

partition by range(transaction_date) subpartition by hash(transaction_id)

subpartitions 3 store in (tablespace01,tablespace02,tablespace03)

(

partition part_01 values less than(to_date(’2009-01-01’,’yyyy-mm-dd’)),

partition part_02 values less than(to_date(’2010-01-01’,’yyyy-mm-dd’)),

partition part_03 values less than(maxvalue)

);

此文從以下幾個方面來整理關於分區表的概念及操作:
1.表空間及分區表的概念
2.表分區的具體作用
3.表分區的優缺點
4.表分區的幾種類型及操作方法
5.對表分區的維護性操作.
(1.) 表空間及分區表的概念
表空間:
是一個或多個數據文件的集合,所有的數據對象都存放在指定的表空間中,但主要存放的是表, 所以稱作表空間。

分區表:
當表中的數據量不斷增大,查詢數據的速度就會變慢,應用程序的性能就會下降,這時就應該考慮對表進行分區。表進行分區後,邏輯上表仍然是一張完整的表,只是將表中的數據在物理上存放到多個表空間(物理文件上),這樣查詢數據時,不至於每次都掃描整張表。

( 2).表分區的具體作用
Oracle的表分區功能通過改善可管理性、性能和可用性,從而為各式應用程序帶來了極大的好處。通常,分區可以使某些查詢以及維護操作的性能大大提高。此外,分區還可以極大簡化常見的管理任務,分區是構建千兆字節數據系統或超高可用性系統的關鍵工具。

分 區功能能夠將表、索引或索引組織表進一步細分為段,這些數據庫對象的段叫做分區。每個分區有自己的名稱,還可以選擇自己的存儲特性。從數據庫管理員的角度 來看,一個分區後的對象具有多個段,這些段既可進行集體管理,也可單獨管理,這就使數據庫管理員在管理分區後的對象時有相當大的靈活性。但是,從應用程序 的角度來看,分區後的表與非分區表完全相同,使用 SQL DML 命令訪問分區後的表時,無需任何修改。

什麽時候使用分區表:
1、表的大小超過2GB。
2、表中包含歷史數據,新的數據被增加都新的分區中。

(3).表分區的優缺點
表分區有以下優點:
1、改善查詢性能:對分區對象的查詢可以僅搜索自己關心的分區,提高檢索速度。
2、增強可用性:如果表的某個分區出現故障,表在其他分區的數據仍然可用;
3、維護方便:如果表的某個分區出現故障,需要修復數據,只修復該分區即可;
4、均衡I/O:可以把不同的分區映射到磁盤以平衡I/O,改善整個系統性能。

缺點:
分區表相關:已經存在的表沒有方法可以直接轉化為分區表。不過 Oracle 提供了在線重定義表的功能。

(4).表分區的幾種類型及操作方法

一.範圍分區:

範圍分區將數據基於範圍映射到每一個分區,這個範圍是你在創建分區時指定的分區鍵決定的。這種分區方式是最為常用的,並且分區鍵經常采用日期。舉個例子:你可能會將銷售數據按照月份進行分區。
當使用範圍分區時,請考慮以下幾個規則:
1、每一個分區都必須有一個VALUES LESS THEN子句,它指定了一個不包括在該分區中的上限值。分區鍵的任何值等於或者大於這個上限值的記錄都會被加入到下一個高一些的分區中。
2、所有分區,除了第一個,都會有一個隱式的下限值,這個值就是此分區的前一個分區的上限值。
3、在最高的分區中,MAXVALUE被定義。MAXVALUE代表了一個不確定的值。這個值高於其它分區中的任何分區鍵的值,也可以理解為高於任何分區中指定的VALUE LESS THEN的值,同時包括空值。

例一:
假設有一個CUSTOMER表,表中有數據200000行,我們將此表通過CUSTOMER_ID進行分區,每個分區存儲100000行,我們將每個分區保存到單獨的表空間中,這樣數據文件就可以跨越多個物理磁盤。下面是創建表和分區的代碼,如下:

復制代碼 代碼如下:


CREATE TABLE CUSTOMER
(
CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY,
FIRST_NAME VARCHAR2(30) NOT NULL,
LAST_NAME VARCHAR2(30) NOT NULL,
PHONEVARCHAR2(15) NOT NULL,
EMAILVARCHAR2(80),
STATUS CHAR(1)
)
PARTITION BY RANGE (CUSTOMER_ID)
(
PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01,
PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02
)



例二:按時間劃分

復制代碼 代碼如下:


CREATE TABLE ORDER_ACTIVITIES
(
ORDER_ID NUMBER(7) NOT NULL,
ORDER_DATE DATE,
TOTAL_AMOUNT NUMBER,
CUSTOTMER_ID NUMBER(7),
PAID CHAR(1)
)
PARTITION BY RANGE (ORDER_DATE)
(
PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE(‘01- MAY -2003‘,‘DD-MON-YYYY‘)) TABLESPACEORD_TS01,
PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE(‘01-JUN-2003‘,‘DD-MON-YYYY‘)) TABLESPACE ORD_TS02,
PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE(‘01-JUL-2003‘,‘DD-MON-YYYY‘)) TABLESPACE ORD_TS03
)

例三:MAXVALUE

復制代碼 代碼如下:


CREATE TABLE RangeTable
(
idd INT PRIMARY KEY ,
iNAME VARCHAR(10),
grade INT
)
PARTITION BY RANGE (grade)
(
PARTITION part1 VALUES LESS THEN (1000) TABLESPACE Part1_tb,
PARTITION part2 VALUES LESS THEN (MAXVALUE) TABLESPACE Part2_tb
);

二.列表分區:

該分區的特點是某列的值只有幾個,基於這樣的特點我們可以采用列表分區。

例一

復制代碼 代碼如下:


CREATE TABLE PROBLEM_TICKETS
(
PROBLEM_ID NUMBER(7) NOT NULL PRIMARY KEY,
DESCRIPTION VARCHAR2(2000),
CUSTOMER_ID NUMBER(7) NOT NULL,
DATE_ENTERED DATE NOT NULL,
STATUS VARCHAR2(20)
)
PARTITION BY LIST (STATUS)
(
PARTITION PROB_ACTIVE VALUES (‘ACTIVE‘) TABLESPACE PROB_TS01,
PARTITION PROB_INACTIVE VALUES (‘INACTIVE‘) TABLESPACE PROB_TS02

)


例二

復制代碼 代碼如下:


CREATE TABLE ListTable
(
id INT PRIMARY KEY ,
name VARCHAR (20),
area VARCHAR (10)
)
PARTITION BY LIST (area)
(
PARTITION part1 VALUES (‘guangdong‘,‘beijing‘) TABLESPACE Part1_tb,
PARTITION part2 VALUES (‘shanghai‘,‘nanjing‘) TABLESPACE Part2_tb
);
)



三.散列分區:

這類分區是在列值上使用散列算法,以確定將行放入哪個分區中。當列的值沒有合適的條件時,建議使用散列分區。
散列分區為通過指定分區編號來均勻分布數據的一種分區類型,因為通過在I/O設備上進行散列分區,使得這些分區大小一致。

例一:

復制代碼 代碼如下:


CREATE TABLE HASH_TABLE
(
COL NUMBER(8),
INF VARCHAR2(100)
)
PARTITION BY HASH (COL)
(
PARTITION PART01 TABLESPACE HASH_TS01,
PARTITION PART02 TABLESPACE HASH_TS02,
PARTITION PART03 TABLESPACE HASH_TS03
)



簡寫:

復制代碼 代碼如下:


CREATE TABLE emp
(
empno NUMBER (4),
ename VARCHAR2 (30),
sal NUMBER
)
PARTITION BY HASH (empno) PARTITIONS 8
STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8);

hash分區最主要的機制是根據hash算法來計算具體某條紀錄應該插入到哪個分區中,hash算法中最重要的是hash函數,Oracle中如果你要使用hash分區,只需指定分區的數量即可。建議分區的數量采用2的n次方,這樣可以使得各個分區間數據分布更加均勻。

四.組合範圍散列分區

這種分區是基於範圍分區和列表分區,表首先按某列進行範圍分區,然後再按某列進行列表分區,分區之中的分區被稱為子分區。

復制代碼 代碼如下:


CREATE TABLE SALES
(
PRODUCT_ID VARCHAR2(5),
SALES_DATE DATE,
SALES_COST NUMBER(10),
STATUS VARCHAR2(20)
)
PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS)
(
PARTITION P1 VALUES LESS THAN(TO_DATE(‘2003-01-01‘,‘YYYY-MM-DD‘))TABLESPACE rptfact2009
(
SUBPARTITION P1SUB1 VALUES (‘ACTIVE‘) TABLESPACE rptfact2009,
SUBPARTITION P1SUB2 VALUES (‘INACTIVE‘) TABLESPACE rptfact2009
),
PARTITION P2 VALUES LESS THAN (TO_DATE(‘2003-03-01‘,‘YYYY-MM-DD‘)) TABLESPACE rptfact2009
(
SUBPARTITION P2SUB1 VALUES (‘ACTIVE‘) TABLESPACE rptfact2009,
SUBPARTITION P2SUB2 VALUES (‘INACTIVE‘) TABLESPACE rptfact2009
)
)



五.復合範圍散列分區:

這種分區是基於範圍分區和散列分區,表首先按某列進行範圍分區,然後再按某列進行散列分區。

復制代碼 代碼如下:


create table dinya_test
(
transaction_id number primary key,
item_id number(8) not null,
item_description varchar2(300),
transaction_date date
)
partition by range(transaction_date)subpartition by hash(transaction_id) subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03)
(
partition part_01 values less than(to_date(‘2006-01-01‘,‘yyyy-mm-dd‘)),
partition part_02 values less than(to_date(‘2010-01-01‘,‘yyyy-mm-dd‘)),
partition part_03 values less than(maxvalue)
);

(5).有關表分區的一些維護性操作:

一、添加分區

以下代碼給SALES表添加了一個P3分區

復制代碼 代碼如下:


ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE(‘2003-06-01‘,‘YYYY-MM-DD‘));

註意:以上添加的分區界限應該高於最後一個分區界限。
以下代碼給SALES表的P3分區添加了一個P3SUB1子分區

復制代碼 代碼如下:


ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES(‘COMPLETE‘);

二、刪除分區
以下代碼刪除了P3表分區:

復制代碼 代碼如下:


ALTER TABLE SALES DROP PARTITION P3;

在以下代碼刪除了P4SUB1子分區:

復制代碼 代碼如下:


ALTER TABLE SALES DROP SUBPARTITION P4SUB1;

註意:如果刪除的分區是表中唯一的分區,那麽此分區將不能被刪除,要想刪除此分區,必須刪除表。
三、截斷分區

截斷某個分區是指刪除某個分區中的數據,並不會刪除分區,也不會刪除其它分區中的數據。當表中即使只有一個分區時,也可以截斷該分區。通過以下代碼截斷分區:

復制代碼 代碼如下:


ALTER TABLE SALES TRUNCATE PARTITION P2;

通過以下代碼截斷子分區:

復制代碼 代碼如下:


ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2;

四、合並分區

合並分區是將相鄰的分區合並成一個分區,結果分區將采用較高分區的界限,值得註意的是,不能將分區合並到界限較低的分區。以下代碼實現了P1 P2分區的合並:

復制代碼 代碼如下:


ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;

五、拆分分區

拆分分區將一個分區拆分兩個新分區,拆分後原來分區不再存在。註意不能對HASH類型的分區進行拆分。

ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE(‘2003-02-01‘,‘YYYY-MM-DD‘)) INTO (PARTITION P21,PARTITION P22);

六、接合分區(coalesca)
結合分區是將散列分區中的數據接合到其它分區中,當散列分區中的數據比較大時,可以增加散列分區,然後進行接合,值得註意的是,接合分區只能用於散列分區中。通過以下代碼進行接合分區:

復制代碼 代碼如下:


ALTER TABLE SALES COALESCA PARTITION;

七、重命名表分區

以下代碼將P21更改為P2

復制代碼 代碼如下:


ALTER TABLE SALES RENAME PARTITION P21 TO P2;

八、相關查詢

跨分區查詢

復制代碼 代碼如下:


select sum( *) from
(select count(*) cn from t_table_SS PARTITION (P200709_1)
union all
select count(*) cn from t_table_SS PARTITION (P200709_2)
);

查詢表上有多少分區

復制代碼 代碼如下:


SELECT * FROM useR_TAB_PARTITIONS WHERE TABLE_NAME=‘tableName‘

查詢索引信息

復制代碼 代碼如下:


select object_name,object_type,tablespace_name,sum(value)
from v$segment_statistics
where statistic_name IN (‘physical reads‘,‘physical write‘,‘logical reads‘)and object_type=‘INDEX‘
group by object_name,object_type,tablespace_name
order by 4 desc

--顯示數據庫所有分區表的信息:
select * from DBA_PART_TABLES

--顯示當前用戶可訪問的所有分區表信息:
select * from ALL_PART_TABLES

--顯示當前用戶所有分區表的信息:
select * from USER_PART_TABLES

--顯示表分區信息 顯示數據庫所有分區表的詳細分區信息:
select * from DBA_TAB_PARTITIONS

--顯示當前用戶可訪問的所有分區表的詳細分區信息:
select * from ALL_TAB_PARTITIONS

--顯示當前用戶所有分區表的詳細分區信息:
select * from USER_TAB_PARTITIONS

--顯示子分區信息 顯示數據庫所有組合分區表的子分區信息:
select * from DBA_TAB_SUBPARTITIONS

--顯示當前用戶可訪問的所有組合分區表的子分區信息:
select * from ALL_TAB_SUBPARTITIONS

--顯示當前用戶所有組合分區表的子分區信息:
select * from USER_TAB_SUBPARTITIONS

--顯示分區列 顯示數據庫所有分區表的分區列信息:
select * from DBA_PART_KEY_COLUMNS

--顯示當前用戶可訪問的所有分區表的分區列信息:
select * from ALL_PART_KEY_COLUMNS

--顯示當前用戶所有分區表的分區列信息:
select * from USER_PART_KEY_COLUMNS

--顯示子分區列 顯示數據庫所有分區表的子分區列信息:
select * from DBA_SUBPART_KEY_COLUMNS

--顯示當前用戶可訪問的所有分區表的子分區列信息:
select * from ALL_SUBPART_KEY_COLUMNS

--顯示當前用戶所有分區表的子分區列信息:
select * from USER_SUBPART_KEY_COLUMNS

--怎樣查詢出oracle數據庫中所有的的分區表
select * from user_tables a where a.partitioned=‘YES‘

--刪除一個表的數據是
truncate table table_name;

--刪除分區表一個分區的數據是
alter table table_name truncate partition p5;

oracle 分區表