oracle clob 查询换行,sqoop clob从Oracle导入到hive   回车换行导致记录增多

sqoop clob从Oracle导入到hive   回车换行导致记录增多

发布时间:2020-06-27 02:45:01

来源:51CTO

阅读:3159

作者:jackwxh

sqoop import --hive-import --hive-overwrite  --connect jdbc:oracle:thin:@192.168.92.136:1521:cyporcl --username ODS --password 'od154DS$!('  -m 1  --hive-database ODS --table Q_TRA_DISPUTESTATUS --fields-terminated-by '\001' --hive-drop-import-delims  --null-string '\\N' --null-non-string '\\N'  --map-column-java DISPUTERESULT=String

DISPUTERESULT 这个字段是Oracleclob 类型的,里面有回车, 加载到hive 里面导致 记录增多。

--map-column-java和--map-column-hive两个参数都要显示给出;还需要设置--hive-drop-import-delims这样才能顺利导出数据。

.导入的列有换行符如何解决

本以为万事大吉,万万没想到导入的列有nclob类型,里面存储了一篇篇文章,势必有着换行符。果不其然,hive查询数据全部错乱, 查询资料发现--hive-delims-replacement(替换/n,/r等符号用你指定的字符)和--hive-drop-import-delims参数。可添加上去发现并没有什么卵用,没有起作用。百度goole很久,终于发现一篇帖子,http://stackoverflow.com/questions/28076200/hive-drop-import-delims-not-removing-newline-while-using-hcatalog-in-sqoop

意思是要用--map-column-java参数来显示指定列为String类型。我的解决方案为 --map-column-java 我的CLOB列=String 果然,问题解决,换行符全部被去掉。不过听说改变存储格式 或许也可以避免这个问题,希望有着经验的大神来回答一下。总结下来就这么多,希望能帮助大家

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/303893.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

对于scanf的使用一点体会心得

今天非常的突发气象的在acm上面做了一下题目,悲剧的是多年不用c的人忘记了怎么样的使用scanf了,今天还学到了一点东西。 题目里面提示了输入两个数,规定第1~6列是第一个数的范围,第8~9列是第二个数的范围。…

毕业二十年,为什么人和人之间的差距那么大?

这是头哥侃码的第237篇原创最近天气逐渐转暖,身边的各种聚会也开始多了起来。找个周末,朋友之间喝点小酒,或者跟高中同学来一场久违的重逢,重温着曾经的回忆,加深着彼此之间的感情,想必都是不错的选择。什么…

oracle查询案例,2道经典的oracle查询案例

第一题:第一题:直接贴代码:select Id,Name,Money,(select Money from test1 a where a.Id decode(b.Id - 1,0,null,b.Id-1)) Money1 from test1 b;经典的子查询,注意的就是null值的处理问题,decode或者case是oracle很…

在一起的时候很好,离开后就感觉像是路上的陌生人,没有交点的平行线,也许它们在很遥远的地方交汇了,也许是下辈子吧! 你对我的好,我不是很清楚,你是伪装的,其实用的着那么辛苦吗&…

oracle 12c 多线程,Oracle 12c(12.1)中性能优化功能增强之通过参数THREADED_EXECTION使用多线程模型...

1. 后台UNIX/Linux系统上,Oracle用多进程模型。例如:linux上一个常规安装的数据库会有如下进程列:$ ps -ef | grep [o]ra_oracle 15356 1 0 10:53 ? 00:00:00 ora_pmon_db12coracle 15358 1 0 10:53 ? 00:00:00 o…

使用工作单元UnitOfWork实现事务

概述工作单元模式有如下几个特性:1、使用同一上下文2、跟踪实体的状态3、保障事务一致性。工作单元用来维护一个由已经被业务事物修改的业务对象组成的列表。Unit Of Work模式负责协调这些修改的持久化工作以及所有标记的并发问题。在数据访问层中采用Unit Of Work…

MyEclipse配置Tomcat(图解)

1) 安装完MyEclipse后,在Eclpise的菜单栏可看到MyEclipse一项, 下面的工具栏中可看到MyEclipse的Tomcat图标2) 进行MyEclipse的配置, 从菜单栏中进入“Windows --> Preferences”3) 先要进行JDK的配置&#x…

Python难懂?买一次西瓜就懂了!

什么是code?code就就是一种语言,一种计算机能读懂的语言。计算机是一个傻*,他理解不了默认两可的任何东西。比如,你让你老公去买个西瓜,你老公会自己决定去哪里买,买几个,找个搞活动打折的买,总…

制作oracle11g yum源,利用安装盘简单制作yum源

第一步:创建一个新文件夹,并挂载光驱.[rootlocalhost ~]# mkdir /yum[rootlocalhost ~]# mount /dev/cdrom /mnt/cdrom第二步:安装工具包:[rootlocalhost ~]# rpm -ivh /mnt/cdrom/CentOS/createrepo-0.4.11-3.el5.noarch.rpm第三步&#xff…

安全删除U盘时,遇到提示“无法停止‘通用卷’设备时解决方法

安全删除U盘时,大家常常会遇到提示“无法停止‘通用卷’设备,请稍候再停止该设备。” 这种情况下可以强行拔下U盘吗?当然不可以!这时候如果强行拔除的话,很容易损坏计算机U口或者你的U盘。如果你的U盘上有重要的资料&a…

宠粉老鱼皮带你 “入坑” GitHub!

昨天刚刚教大家 如何更快地访问 GitHub,按照惯例,今天不得来一个 GitHub 教程?最近,鱼皮在持续完善自己 GitHub 上的开源项目,也分享给了很多小伙伴,苦苦哀求大家可以给个 star。liyupi 的 GitHub但是&…

linux中显示目录名,在linux下显示中文目录和文件名

选择一个一劳永逸的方法,就是修改/etc/下的fstab文件,我的fstab内容如下:/dev/hda9 / ext2 defaults 1 1/dev/hda8 /boot ext2 defaults 1 2none /dev/pts devpts gid5,mode620 0 0none /proc proc defaults 0 0none /dev/shm tmpfs defaults…

统计学入门需掌握的四点思想

大家晚上好,自从小天悄悄报名Power Query课程并利用休息时间学习,结果因为太嗨被超模君发现了之后,小天又多了一个任务:利用统计学知识处理和分析之前累积的大量数据。(抱歉,暴露超模君老是鞭策我的事实了&…

PIX的AAA认证配置

#vir telnet 10.1.1.1 (一般使用global地址) #access-list auth permit tcp any any eq http #access-list auth permit tcp any any eq telnet //http和telnet协议捆绑抓流量#aaa-server 3a protocol tacacst #aaa-server 3a host 20.1.1.241 //20.1.1.241是aaa服务器…

UML常用图的几种关系的总结

在UML的类图中,常见的有以下几种关系: 泛化(Generalization), 实现(Realization), 关联(Association), 聚合(Aggregation), 组合(Composition), 依赖(Dependency)1. 泛化&…

linux编程两个子进程,Linux中fork同时创建多个子进程的方法

怎么创建多个进程呢&#xff1f;我说那还不容易&#xff0c;看下边代码://省略必要头文件int main(){pid_t pid[2];int i;printf("This is %d\n",getpid());for(i 0;i < 2;i ){if((pid[0] fork()) < 0){printf("Fork() Error!");exit(-1);}if(pid[…

我为什么鼓励你读计算机博士

看过《水浒传》的朋友都知道&#xff0c;梁山的一百单八将因为各种理由加入了水寨&#xff0c;走上了劫富济贫、替天行道的路。我2006年从南京大学本科毕业以后&#xff0c;耳闻目睹了数百位计算机专业的博士&#xff08;生&#xff09;&#xff0c;他们选择读博士的理由可以说…

重构者的20种死法

最近涉及重构话题的文章不少啊&#xff0c;其实我也一直在憧憬重构&#xff0c;重构很绿色&#xff0c;重构很河蟹&#xff0c;重构令人很激动&#xff0c;重构可能让人死得很惨。 我在这里&#xff0c;就列举一下Refactorman的种种死法&#xff0c;以警后人&#xff1a; 一、一…

一日一技:在Ocelot网关中统一配置Swagger

概述Swagger 是一个规范和完整的框架&#xff0c;用于生成、描述、调用和可视化 RESTful 风格的 Web 服务。在Ocelot网关中&#xff0c;我们提供给前端的直接是Swagger&#xff0c;如果Swagger分布在各个API中&#xff0c;前端查看Swagger的时候非常不便&#xff0c;Ocelot与Sw…

linux命令行模式kvm,Linux命令行管理KVM虚拟机【一】 | C/C++程序员之家

Linux命令行管理KVM虚拟机&#xff0c;几个常见的Linux-KVM虚拟机 管理命令&#xff0c;保存备用&#xff0c;方便快速部署搭建Linux开发环境&#xff0c;搞来搞去还是Linux下虚拟化好使&#xff0c;方便Linux和Win&#xff01;virsh$ sudo virsh -c qemu:///system listId Nam…