expdp/impdp 資料泵parallel 引數優化測試

阿新 • • 發佈：2018-12-24

expdp/impdp在進行資料遷移時速度極快,通過一定的優化方法，我們讓expdp和impdp跑得更加快
1,parallel,在很多oracle的程式中都離不開並行操作，通過利用多core cpu的處理能力（根據自己機器實際情況優化一般不要超過core的2倍），速度增加相當明顯
例:frank使用者主要有表T1,T2,T3,每個表

中資料有500萬行
[[email protected] abc]$ time expdp frank/frank directory=abc dumpfile=abc.dmp
real 0m41.692s
user 0m0.011s
sys 0m0.032s
[

[email protected] abc]$ time expdp frank/frank directory=abc dumpfile=abc.dmp parallel=3
real 0m26.710s
user 0m0.019s
sys 0m0.007s
速度提升相當明顯,如果每個dw程序都使用單獨的dmp檔案會更快
[[email protected] abc]$ time expdp frank/frank directory=abc dumpfile=abc%U.dmp parallel=3
real 0m22.928s
user 0m0.017s
sys 0m0.008s
一般建議parall設定不要超過cpu*2.
2,transport_tablespace方法，直接複製表空間檔案的方式。使用expdp和impdp只匯出了資料字典資訊.表空間
要是自包含的
SQL> exec dbms_tts.transport_set_check('USERS',true);
PL/SQL procedure successfully completed.
SQL> select * from transport_set_violations;
no rows selected
transport tablespace的方法是遷移資料最快的方法。因為資料本身是不需要oracle的sql層來處理.但是表空間
在expdp期間要設定成只讀狀態

3,network_link模式.當資料檔案比較大的時候，這時候在目標庫上直接通過network_link模式在目標
庫上進行匯入，而不需要在源庫上進行expdp操作，處理方式和正常的expdp/impdmp過程類似。這樣做的
好處主要是可以避免了在源庫上寫大檔案，然後還需要移動到目標庫上.
dongdongtang> grant datapump_exp_full_database to frank;
Grant succeeded.
目標庫
dongdongtang> create database link frank connect to frank identified by frank using 'frank';
Database link created.
[

[email protected] admin]$ impdp \'/ as sysdba\' network_link=frank schemas=frank
network_link 定義了一個db_link名稱，該過程把源端的frank schemas匯入到目標庫上.

4,使用適當的方法.expdp/impdp包括了兩種主要方法direct_path和external_table
使用direct_path會skip掉sql layer，速度會更快，但是不能定義query
[[email protected] ~]$ expdp frank/frank dumpfile=abc.dmp query=T1:"where a>5" access_method=direct_path
ORA-39033: Data cannot be filtered under the direct path access method.
其他的方法還有一些限制，具體可以參考mos相關文件。datapump一般會在啟動的時候自動決定使用哪種方式，而且一
旦決定不可以通過interactive的方式修改.可以使用400300來進行trace使用了哪種方式
KUPW:02:03:30.332: 1: TABLE_DATA:"FRANK"."T1" direct path, parallel: 1
KUPW:02:03:30.332: 1: In function GATHER_PARSE_ITEMS
KUPW:02:03:30.332: 1: In function CHECK_FOR_REMAP_NETWORK

5,對於index不會並行，對大表有索引的情況下，考慮索引以後單獨使用parallel,nologging重建。事實上在
expdp的匯出過程中對索引不會像表資料那樣需要匯出，索引只匯出了ddl語句.

6,statistics的匯入可能會非常慢，特別是在10.2之前。在expdp中儘量exclude，在impdp後，使用單獨的收集
任務來完成.

7,利用強大的過濾功能，主要的選項有tables,include,exclude和query。tables定義只匯出某些需要的表,
include表示只匯出某些對像，exclude表示排除某些對像.query可以對錶中資料進行過濾,只匯出我們需要的
那部分資料.

8,利用壓縮過功能可以減少dump檔案的大小
[[email protected] dpdump]$ expdp frank/frank dumpfile=abc.dmp tables=t1
[[email protected] dpdump]$ ls -l abc.dmp
-rw-r----- 1 oracle oinstall 1583874048 Jan 20 03:54 abc.dmp

[[email protected] dpdump]$ expdp frank/frank dumpfile=abc.dmp tables=t1 compression=all
[[email protected] dpdump]$ ls -l abc.dmp
-rw-r----- 1 oracle oinstall 197234688 Jan 20 04:29 abc.dmp
可以看到壓縮前1.5G,壓縮過後只有190M左右.
在12c的版本中，可以通過compression_algorithm來定義壓縮演算法，常用的壓縮級別有:basic,low,medium,high。
結合paralell,可以非常好的利用多core cpu的處理能力.

在11G以前的版本中也有很多的bug會導致datapump變慢的情況,可以查詢相關的mos文件.datapump是使用dbms_metadata
和dbms_datapump兩個包來完成的，所以shared pool要保證不會太小.

expdp/impdp 資料泵parallel 引數優化測試

expdp/impdp 資料泵parallel 引數優化測試

EXPDP/IMPDP 資料泵命令引數

【Oracle】匯入和匯出 EXP / IMP 和 EXPDP / IMPDP 資料泵匯出匯入的方法

使用expdp/impdp資料泵匯出/匯入資料！

ORACLE使用EXPDP和IMPDP資料泵進行匯出匯入的方法

expdp,impdp 資料庫泵方式 oracle 資料庫備份

impdp資料泵匯入詳解

oracle 12c 資料泵新引數transform減少歸檔的產生

impdp 資料泵匯入更改所屬使用者使用remap_schema方法的問題

Oracle利用exp和imp,資料泵impdp和expdp匯入匯出資料，spool匯出資料

資料泵impdp和expdp

使用EXPDP/IMPDP匯入匯出表中資料/元資料測試

Oracle資料泵expdp/impdp筆記

EXPDP/IMPDP 中的並行度PARALLEL引數

oracle11g 使用資料泵匯入/匯出資料（expdp/impdp）

ORACLE--匯入匯出/資料泵（imp/exp impdp/expdp）

expdp與impdp（資料泵匯出與匯入）

補：Oracle 的資料泵匯出（expdp）及匯入（impdp）

使用Oracle資料泵EXPDP/IMPDP匯入匯出

資料泵(expdp/impdp)跨版本匯入，11g匯出10g匯入

expdp/impdp 資料泵parallel 引數優化測試

相關推薦