首页 > 代码库 > 数据泵EXPDP导出工具和IMPDP导入工具的使用
数据泵EXPDP导出工具和IMPDP导入工具的使用
数据泵EXPDP导出工具和IMPDP导入工具的使用
一、EXPDP和IMPDP使用说明
Oracle Database 10g引入了最新的数据泵(Data Dump)技术,数据泵导出导入(EXPDP和IMPDP)的作用
1)实现逻辑备份和逻辑恢复。
2)在数据库用户之间移动对象。
3)在数据库之间移动对象。
4)实现表空间搬移。
二、数据泵导出导入与传统导出导入的区别
在10g之前,传统的导出和导入分别使用EXP工具和IMP工具,从10g开始,不仅保留了原有的EXP和IMP工具,还提供了数据泵导出导入工具EXPDP和IMPDP。使用EXPDP和IMPDP时应该注意的事项:
1)EXP和IMP是客户端工具程序,它们既可以在可以客户端使用,也可以在服务端使用。
2)EXPDP和IMPDP是服务端的工具程序,他们只能在ORACLE服务端使用,不能在客户端使用。
3)IMP只适用于EXP导出文件,不适用于EXPDP导出文件;IMPDP只适用于EXPDP导出文件,而不适用于EXP导出文件。
4)数据泵导出包括按表导出,按用户导出,按表空间导出,按数据库导出4种方式。
三、EXPDP参数说明
EXPDP命令行选项,可通过expdp help=y查看:
E:\emp>expdp help=y
1)ATTACH
该选项用于在客户会话与已存在导出作用之间建立关联.语法如下
ATTACH=[schema_name.]job_name
Schema_name用于指定方案名,job_name用于指定导出作业名。注意,如果使用ATTACH选项在命令行除了连接字符串和ATTACH选项外,不能指定任何其他选项,示例如下:
$ expdp scott/tiger ATTACH=scott.export_job;
2)CONTENT
该选项用于指定要导出的内容.默认值为ALL
CONTENT={ALL | DATA_ONLY | METADATA_ONLY}
当设置CONTENT为ALL 时,将导出对象定义及其所有数据.为DATA_ONLY时,只导出对象数据,为METADATA_ONLY时,只导出对象定义
$ expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dump CONTENT=METADATA_ONLY;
3)DIRECTORY
指定转储文件和日志文件所在的目录
DIRECTORY=directory_object
Directory_object用于指定目录对象名称.需要注意,目录对象是使用CREATE DIRECTORY语句建立的对象,而不是OS 目录
$ expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dump;
创建目录
SQL> create directory dump_dir as ‘d:\dump‘; SQL> grant read,write on directory dump_dir to scott;
查询创建了那些子目录:
SQL> SELECT * FROM dba_directories;
4)DUMPFILE
用于指定转储文件的名称,默认名称为expdat.dmp
DUMPFILE=[directory_object:]file_name [,….]
Directory_object用于指定目录对象名,file_name用于指定转储文件名.需要注意,如果不指定directory_object,导出工具会自动使用DIRECTORY选项指定的目录对象
$ expdp scott/tiger DIRECTORY=dump1 DUMPFILE=dump2:a.dmp;
5)EXTIMATE
指定估算被导出表所占用磁盘空间分方法.默认值是BLOCKS
EXTIMATE={BLOCKS | STATISTICS}
设置为BLOCKS时,oracle会按照目标对象所占用的数据块个数乘以数据块尺寸估算对象占用的空间,设置为STATISTICS时,根据最近统计值估算对象占用空间
$expdp scott/tiger TABLES=emp ESTIMATE=STATISTICS DIRECTORY=dump DUMPFILE=a.dump;
6)EXTIMATE_ONLY
指定是否只估算导出作业所占用的磁盘空间,默认值为N
EXTIMATE_ONLY={Y | N}
设置为Y时,导出作用只估算对象所占用的磁盘空间,而不会执行导出作业,为N时,不仅估算对象所占用的磁盘空间,还会执行导出操作.
$expdp scott/tiger ESTIMATE_ONLY=y NOLOGFILE=y;
7)EXCLUDE
该选项用于指定执行操作时释放要排除对象类型或相关对象
EXCLUDE=object_type[:name_clause] [,….]
Object_type用于指定要排除的对象类型,name_clause用于指定要排除的具体对象.EXCLUDE和INCLUDE不能同时使用
$expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dup EXCLUDE=VIEW;
8)FLASHBACK_SCN
指定导出特定SCN时刻的表数据
FLASHBACK_SCN=scn_value
Scn_value用于标识SCN值.FLASHBACK_SCN和FLASHBACK_TIME不能同时使用
$expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dmp FLASHBACK_SCN=358523;
9)FLASHBACK_TIME
指定导出特定时间点的表数据
FLASHBACK_TIME="TO_TIMESTAMP(time_value)"
$ expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dmp FLASHBACK_TIME="TO_TIMESTAMP(‘25-08-200414:35:00‘,‘DD-MM-YYYYHH24:MI:SS‘)"
10)FULL
指定数据库模式导出,默认为N
FULL={Y | N}
为Y时,标识执行数据库导出
11)HELP
指定是否显示EXPDP命令行选项的帮助信息,默认为N
当设置为Y时,会显示导出选项的帮助信息.
Expdp help=y
12)INCLUDE
指定导出时要包含的对象类型及相关对象
INCLUDE = object_type[:name_clause] [,… ]
13)JOB_NAME
指定要导出作用的名称,默认为SYS_XXX
JOB_NAME=jobname_string
14)LOGFILE
指定导出日志文件文件的名称,默认名称为export.log
LOGFILE=[directory_object:]file_name
Directory_object用于指定目录对象名称,file_name用于指定导出日志文件名.如果不指定directory_object.导出作用会自动使用DIRECTORY的相应选项值.
Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dmp logfile=a.log
15)NETWORK_LINK
指定数据库链名,如果要将远程数据库对象导出到本地例程的转储文件中,必须设置该选项
16)NOLOGFILE
该选项用于指定禁止生成导出日志文件,默认值为N
17)PARALLEL
指定执行导出操作的并行进程个数,默认值为1
18)PARFILE
指定导出参数文件的名称
PARFILE=[directory_path] file_name
19)QUERY
用于指定过滤导出数据的where条件
QUERY=[schema.] [table_name:] query_clause
Schema用于指定方案名,table_name用于指定表名,query_clause用于指定条件限制子句.QUERY选项不能与CONNECT=METADATA_ONLY,EXTIMATE_ONLY,TRANSPORT_TABLESPACES等选项同时使用
$ expdp scott/tiger directory=dump dumpfiel=a.dmp Tables=emp query=’WHERE deptno=20’
20)SCHEMAS
该方案用于指定执行方案模式导出,默认为当前用户方案
21)STATUS
指定显示导出作用进程的详细状态,默认值为0
22)TABLES
指定表模式导出
TABLES=[schema_name.]table_name[:partition_name][,…]
Schema_name用于指定方案名,table_name用于指定导出的表名,partition_name用于指定要导出的分区名
23)TABLESPACES
指定要导出表空间列表
24)TRANSPORT_FULL_CHECK
该选项用于指定被搬移表空间和未搬移表空间关联关系的检查方式,默认为N.
当设置为Y时,导出作用会检查表空间直接的完整关联关系,如果表空间所在表空间或其索引所在的表空间只有一个表空间被搬移,将显示错误信息.当设置为N时,导出作用只检查单端依赖,如果搬移索引所在表空间,但未搬移表所在表空间,将显示出错信息,如果搬移表所在表空间,未搬移索引所在表空间,则不会显示错误信息
25)TRANSPORT_TABLESPACES
指定执行表空间模式导出
26)VERSION
指定被导出对象的数据库版本,默认值为COMPATIBLE.
VERSION={COMPATIBLE | LATEST |version_string}
为COMPATIBLE时,会根据初始化参数COMPATIBLE生成对象元数据;为LATEST时,会根据数据库的实际版本生成对象元数据.version_string用于指定数据库版本字符串
四、EXPDP实战案例
使用EXPDP工具时,其转储文件只能被存放在DIRECTORY对象对应的OS目录中,而不能直接指定转储文件所在的OS目录.因此,使用EXPDP工具时,必须首先建立DIRECTORY对象.并且需要为数据库用户授予使用DIRECTORY对象权限。
操作步骤如下:
>>命令行打开sqlplus
sqlplus /nolog conn / as sysdba
>>创建逻辑目录,该命令不会在操作系统创建真正的目录(最好手工先建好),最好以administrator等管理员创建。
SQL>create directory dir as ‘d:\dump‘; --dir名称可以随便命名 需要手工创建d:\dump
>>查看管理理员目录(同时查看操作系统中是否存在,因为Oracle并不关心该目录是否存在,如果不存在,则出错)
SQL>select * from dba_directories;
>>给scott用户赋予在指定目录的操作权限,最好以sys,system等管理员赋予。
SQL>grant read,write on directory dir to scott;
1)按表导出表
$ expdp scott/tiger directory=dump_dir DUMPFILE=dept.dmp TABLES=dept;
>>多表导出用逗号分隔:
$ expdp scott/tiger tables=emp,dept dumpfile=expdp.dmp directory=dump_dir;
>>注:在unix下要注意directory目录的读写权限问题,如:
看dump_dir所在的目录:用sys用户查看数据字典dba_directories
更该该文件夹的权限:chown -R oracle:dba /dump_dir,问题解决。
2)按用户导出
$ expdp scott/tiger directory=dump_dir dumpfile=schema.dmp logfile=schema.log schemas=system;
3)按表空间导出
$ expdp scott/tiger directory=dump_dir dumpfile=tb.dmp logfile=tb.log tablespaces=users
4)全库导出
$ expdp system/manager directory=dump_dir dumpfile=full.dmp full=Y; $ expdp scott/tiger directory=dump_dir dumpfile=full.dmp full=Y;
注:提示scott用户没有相应的权限,给scott相应的权限或使用system来做全库导出 。
SQL> grant exp_full_database to scott; Grant succeeded.
5)并行进程parallel导出
$ expdp scott/tiger@orcl directory=dump_dir dumpfile=scott3.dmp parallel=40 job_name=scott3;
6)按查询条件导
$ expdp scott/tiger directory=dump_dir dumpfile=expdp.dmp Tables=emp query=‘WHERE deptno=20‘;
五、IMPDP参数说明
IMPDP与EXPDP的不同参数:
1)REMAP_DATAFILE
该选项用于将源数据文件名转变为目标数据文件名,在不同平台之间搬移表空间时可能需要该选项.
REMAP_DATAFIEL=source_datafie:target_datafile
2)REMAP_SCHEMA
该选项用于将源方案的所有对象装载到目标方案中.
REMAP_SCHEMA=source_schema:target_schema
3)REMAP_TABLESPACE
将源表空间的所有对象导入到目标表空间中
REMAP_TABLESPACE=source_tablespace:target:tablespace
4)REUSE_DATAFILES
该选项指定建立表空间时是否覆盖已存在的数据文件.默认为N
REUSE_DATAFIELS={Y | N}
5)SKIP_UNUSABLE_INDEXES
指定导入是是否跳过不可使用的索引,默认为N
6)SQLFILE
指定将导入要指定的索引DDL操作写入到SQL脚本中
SQLFILE=[directory_object:]file_name
$ impdp scott/tiger DIRECTORY=dump DUMPFILE=tab.dmp SQLFILE=a.sql
7)STREAMS_CONFIGURATION
指定是否导入流元数据(StreamMatadata),默认值为Y.
8)TABLE_EXISTS_ACTION
该选项用于指定当表已经存在时导入作业要执行的操作,默认为SKIP
TABBLE_EXISTS_ACTION={SKIP | APPEND |TRUNCATE | FRPLACE }
当设置该选项为SKIP时,导入作业会跳过已存在表处理下一个对象;当设置为APPEND时,会追加数据,为TRUNCATE时,导入作业会截断表,然后为其追加新数据;当设置为REPLACE时,导入作业会删除已存在表,重建表并追加数据,注意,TRUNCATE选项不适用与簇表和NETWORK_LINK选项
9)TRANSFORM
该选项用于指定是否修改建立对象的DDL语句
TRANSFORM=transform_name:value[:object_type]
Transform_name用于指定转换名,其中SEGMENT_ATTRIBUTES用于标识段属性(物理属性,存储属性,表空间,日志等信息),STORAGE用于标识段存储性,VALUE用于指定是否包含段属性或段存储属性,object_type用于指定对象类型.
$ impdp scott/tiger directory=dump dumpfile=tab.dmp Transform=segment_attributes:n:table
10)TRANSPORT_DATAFILES
该选项用于指定搬移空间时要被导入到目标数据库的数据文件
TRANSPORT_DATAFILE=datafile_name
Datafile_name用于指定被复制到目标数据库的数据文件
$ impdp system/manager DIRECTORY=dump DUMPFILE=tts.dmp TRANSPORT_DATAFILES=‘/user01/data/tbs1.f‘
六、IMPDP 实战案例
1)按表导入
>>删除用户scott的emp表,在full.dmp中导入emp到用户scott
$ impdp backup/backup1 directory=dump_dir dumpfile=full.dmp tables=scott.emp remap_schema=scott:scott
>>将scott.test表导入的SYSTEM用户下
$ impdp backup/backup1 directory=dump_dir dumpfile=full.dmp tables=scott.test remap_schema=scott:system
注意,如果要将表导入到其他方案中,必须指定REMAP SCHEMA选项
2)导到指定用户下
>>按用户导入
impdp scott/tiger@orcl DIRECTORY=dump_dir DUMPFILE=expdp.dmp SCHEMAS=scott logfile=impdp.log;
>>导入时将scott用户所属对象转换为system用户
$ impdp system/manager DIRECTORY=dump_dir DUMPFILE=schema.dmp SCHEMAS=scott REMAP_SCHEMA=scott:system;
3)按表空间导入
$ impdp system/manager DIRECTORY=dump_dir DUMPFILE=tablespace.dmp TABLESPACES=user01
4)全库导入
$ impdp system/manager DIRECTORY=dump_dir DUMPFILE=full.dmp FULL=y
5)expdp/impdp 不同用户,不同表空间的使用
>>假设a用户的默认表空间是a,导出用户a所有数据:
SQL> conn / as sysdba SQL> create directory dir as ‘/home/oracle/‘; SQL> grant read,write on directory dir to system;
$ expdp system/oracle directory=dir dumpfile=data.dmp schemas=a logfile=data.log
>>impdp导入a用户所有数据到b,并且转换表空间a为b:
SQL> conn sys / as sysdba SQL> create directory dir as ‘/home/oracle/‘; SQL> grant read,write on directory dir to system;
$ impdp system/oracle directory=dir dumpfile=data.dmp remap_tablespace=a:b remap_schema=a:b logfile=data.log
>>解释:
remap_schema=a:b 将数据的schema从a 转换为b
remap_tablespace=a:b 将数据的tablespace 从a 转换为b
>>注意:
如果oracle是10g的,要加参数 EXCLUDE=TABLE_STATISTICS 选项将 table_statistics 对象过滤。 否则会出现数据泵导入中table_statistics长时间等待、用impdp 导入,检查 table_statistics 时等待了很长时间。
>>总结:
执行impdp时无需创建b用户,在导入时会自动创建并改名用户a为b(拥有a的所有权限等),自动设置默认表空间为转换后的表空间b。如果有多个表空间需要转换,则使用多个remap_tablespace=源表空间:目标表空间。此种方法只限于支持oracle10g以上版本。
6)在全库备份文件中导入一张表到数据库
$ impdp backup/backup1 directory=PUMP_DIR dumpfile=expdp.dmp include=table:\"=\‘T_DEPT\‘\" logfile=impdp.log table_exists_action=replace;
7)在全库备份文件中导入一张表并转换表空间和owner
$impdp backup/backup1 directory=dump_dir dumpfile=expdp.dmp tables= T_DEPT REMAP_TABLESPACE=DATA:USERS remap_schema=scott:system table_exists_action=replace;
8)通过dblink远程导入
$ impdp system/admin directory=mydir network_link=dblink16_zk schemas=lgb_zk remap_schema=lgb_zk:lgb_zk logfile=lgbzk1018.log PARALLEL=2
9)通过dblink指定参数文件远程导入
>>参数说明
NETWORK_LINK=dblink
schemas=源用户
remap_schema=源用户:目标用户
PARALLEL=2
EXCLUDE=TABLE:"IN(‘A‘,‘B‘,‘C‘,‘D‘)" 排除的表
>>通过参数文件远程导入
vim mypar.par network_link=dblink16 schemas=zs2new remap_schema=zs2new:zs2new EXCLUDE=TABLE:"IN(‘T_PHOTO‘,‘BAK_T_RC_JZZ_XX‘,‘BAK_T_SYS_USER_ROLE‘,‘DIFER_T_DIC_CITY‘,‘DIFFER_T_DIC_COUNTY‘,‘PPP‘)" PARALLEL=2
$ impdp system/admin directory=mydir parfile=h:\dump\mypar.par;
数据泵EXPDP导出工具和IMPDP导入工具的使用