【kettle抽取Orecle/Mysql数据至HDFS】诸如‘\u0001’等特殊分隔符表示法

Lecea ·

更新时间:2024-11-13

· 659 次阅读

【kettle抽取Orecle/Mysql数据至HDFS】诸如‘\u0001’等特殊分隔符表示法前言设计问题分析解决办法后记前言

由于需要设计一个每天多批次的定时作业，由于单端逻辑不能抽取出目标数据，其中涉及了跨库问题，因此需要从mysql、Oracle数据库中将数据同步至一个统一的环境中（hive），那么由于数据量大（百亿级），关联数据要从各个业务部门自有的数据库导入，kettle无疑成了最好的选择。

设计

由于要推张业务支持表出去，因为在这里我根据四张业务表的前置表依赖关系做了个聚类，把四项业务的数据导入流程分在了四个方向上，方便日后有针对性的修改，效果如下：
在这里插入图片描述
设计完成后提交生产集群上跑，一切都很顺利：

查看了一下中间文件，问题来了：

‘\u0001’分隔符失效！

问题分析

按照公司的规范，hive外部表的文件分隔符统一使用‘\u0001’，但是笔者在job中设置的变量失效了，很明显kettle不支持特殊字符的这种写法：
在这里插入图片描述
问题的关键在于，找到一种kettle支持的特殊字符的写法。

解决办法

查阅网上的一些现有资料后，笔者找到了解决办法，根据ASCII码表，我们在kettle中采用$[十六进制值]方式来表示：
在这里插入图片描述

比如‘\u0001’的十六进制是01，就用$[01]来表示：
在这里插入图片描述
随后再执行，去hdfs上查看文件就看到可以正常分隔了：

后记

根据自己的需要，需要什么样的分隔符，就在ASCII码表上找到对应的分隔符十六进制数，写入$[]即可。

作者：Jack_Roy

kettle hdfs 分隔符 Mysql

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

HTML 实例

Kamaria 2021-07-24

846

Foundation 网格 - 水平堆叠

Fawn 2020-01-20

900

SQL FORMAT() 函数

Dara 2020-04-19

625

ASP.NET数据绑定之DataList控件

Vanora 2020-02-14

993

MySQL中定时器的底层实现原理及使用方法

Olathe 2023-07-20

227

一文带你搞懂MySQL的事务隔离级别

Talia 2023-07-20

334

MySQL实现主从复制的原理详解

Serafina 2023-07-20

608

MySQL死锁产生的原因和解决方法

Hazel 2023-07-20

1060

MySQL中如何给一个字段递增赋值

Ebony 2023-07-20

978

mysql中如何将时间戳转换为年月日格式进行查询

Olga 2023-07-20

1661

mysql8中如何设置sql-mode

Elizabeth 2023-07-20

1618

MySQL之同表一个字段如何赋值给另一个字段

Ianthe 2023-07-20

567

MYSQL查询时间范围内的数据示例代码

Valora 2023-07-20

665

MySQL数据库字符集修改中文UTF8(永久修改)

Phemia 2023-07-20

298

MySQL数据库node使用详解

Tia 2023-07-20

1452

MYSQL根据分组获取组内多条数据中符合条件的一条(实例详解)

Summer 2023-07-20

1622

MySQL实现查询处理JSON数据的示例详解

Fredrica 2023-07-20

859

Docker部署Mysql数据库步骤详解

Maha 2023-07-21

1426

docker 容器中安装mysql服务的方法

Edie 2023-07-21

583

Android连接MySQL数据库详细教程

Bonnie 2023-07-21

533

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座