1.sqlldr介绍
用法: SQLLDR keyword=value [,keyword=value,...]
有效的关键字:
    userid -- ORACLE 用户名/口令        
   control -- 控制文件名                
       log -- 日志文件名                    
       bad -- 错误文件名                   
      data -- 数据文件名                  
   discard -- 废弃文件名
discardmax -- 允许废弃的文件的数目         (全部默认)
      skip -- 要跳过的逻辑记录的数目  (默认 0)
      load -- 要加载的逻辑记录的数目  (全部默认)
    errors -- 允许的错误的数目         (默认 50)
      rows -- 常规路径绑定数组中或直接路径保存数据间的行数
               (默认: 常规路径 64, 所有直接路径)
  bindsize -- 常规路径绑定数组的大小 (以字节计)  (默认 256000)
    silent -- 运行过程中隐藏消息 (标题,反馈,错误,废弃,分区)
    direct -- 使用直接路径                     (默认 FALSE)
   parfile -- 参数文件: 包含参数说明的文件的名称
  parallel -- 执行并行加载                    (默认 FALSE)
      file -- 要从以下对象中分配区的文件     
skip_unusable_indexes -- 不允许/允许使用无用的索引或索引分区  (默认 FALSE)
skip_index_maintenance -- 没有维护索引, 将受到影响的索引标记为无用  (默认 FALSE)
commit_discontinued -- 提交加载中断时已加载的行  (默认 FALSE)
  readsize -- 读取缓冲区的大小               (默认 1048576)
external_table -- 使用外部表进行加载; NOT_USED, GENERATE_ONLY, EXECUTE  (默认 NOT_USED)
columnarrayrows -- 直接路径列数组的行数  (默认 5000)
streamsize -- 直接路径流缓冲区的大小 (以字节计)  (默认 256000)
multithreading -- 在直接路径中使用多线程
 resumable -- 启用或禁用当前的可恢复会话  (默认 FALSE)
resumable_name -- 有助于标识可恢复语句的文本字符串
resumable_timeout -- RESUMABLE 的等待时间 (以秒计)  (默认 7200)
date_cache -- 日期转换高速缓存的大小 (以条目计)  (默认 1000)
no_index_errors -- 出现任何索引错误时中止加载  (默认 FALSE)
PLEASE NOTE: 命令行参数可以由位置或关键字指定
。前者的例子是 'sqlldr
scott/tiger foo'; 后一种情况的一个示例是 'sqlldr control=foo
userid=scott/tiger'。位置指定参数的时间必须早于
但不可迟于由关键字指定的参数。例如,
允许'sqlldr scott/tiger control=foo logfile=log', 但是
不允许'sqlldr scott/tiger control=foo log', 即使
参数'log' 的位置正确。
2.实战
先有需求:
将000000_0.txt文件导入oracle数据库
000000_0.txt大小:123MB,几十万行
 
000000_0.txt内容格式:
 
20160514|未知|未知|未知|3G|057431041116|55349|41116|28173301261774|460007863660008|1.224609375|13.0|\N|\N
 20160514|HTC|手机|D728w|3G|057431001157|55097|1157|35153907023514|460006620667069|0.513671875|10.0|\N|\N
 20160514|HTC|手机|D728w|3G|057431043861|55084|43861|35153907033487|460027685036740|2937.208984375|8052.0|\N|\N
 20160514|HTC|手机|D728w|3G|057431003011|55084|3011|35153907033487|460027685036740|1.755859375|56.0|\N|\N
 
 
导入的数据库表结构:
 
create table TEST201605
(SHI_JIAN,ZDCS,ZDFL,ZDXH,XQWLLX,XQWYBH,LAC,CI,IMEI,IMSI,THREEG_LL,THREEG_SZ,FOURG_LL
)
 
2.1编写控制文件 load.ctl:
load data
 CHARACTERSET UTF8  //查看下文件的编码,设为同一个编码
 infile "E:\datafile\000000_0.txt"   //只能一个个导入,可以把多个文件合并到一个里,然后导入
 append
 into table TEST201605
 fields terminated by '|'
 trailing nullcols
 (
     --"时间",
     SHI_JIAN,
     ZDCS,
     ZDFL,
     ZDXH,
     XQWLLX,
     XQWYBH,
     LAC,
     CI,
     IMEI,
     IMSI,
     THREEG_LL,
     THREEG_SZ,
     FOURG_LL
 )
 
 
2.2 windows下
dos命令窗,cd 到load.ctl所在目录
使用命令:
sqlldr daily/mdasil@daily-74 control=load.ctl log=log.log bad=bad.log errors=5000 rows=1000 bindsize=10485760
 
 
linux:
 
load data
 CHARACTERSET UTF8
 infile "/datafile-import/000021_0.txt"
 append
 into table jingfen_201605_1415
 fields terminated by '|'
 trailing nullcols
 (
     SHI_JIAN,
     ZDCS,
     ZDFL,
     ZDXH,
     XQWLLX,
     XQWYBH,
     LAC,
     CI,
     IMEI,
     IMSI,
     THREEG_LL,
     THREEG_SZ,
     FOURG_LL
 )
 
 
oracle用户下执行:
 
sqlldr daily/mdasil control=/datafile-import/ctl/44.ctl log=/datafile-import/log/log20160526.log  bad=/datafile-import/log/bad20160526.log
 
 
rows与bindsize相关,rows默认64行,如果不修改bindsize,只修改rows无效。
bindsize --( 每次提交记录的缓冲区的大小,字节为单位,默认256000)
 
dos窗口会打印:
达到提交点 - 逻辑记录计数 441884
 达到提交点 - 逻辑记录计数 441954
 达到提交点 - 逻辑记录计数 442024
 达到提交点 - 逻辑记录计数 442094
 
 
sqllder 导入的时候,不支持中文列名,因为文件里的都是string,导入的表字段也要 字符串 类型 。
 
(可以控制类型,但是如果数据内容格式不对,导入出错就比较麻烦,还是以string文本导入后,再修改表结构)