kettle数据迁移实战
ccwgpt 2024-12-17 12:58 72 浏览 0 评论
背景
目前有两个数据库AB, 想把A库指定的表数据迁移到B库中,因为涉及到数据量比较大,所以考虑使用kettle。 闲话少说,真货搞起来
Kettle 说明
- Kettle 本身是做数据抽取、清洗、转换和装载的工具。能支持在多个平台上进行操作,比如window、linux、unix 上运行。
- 支持多种数据源配置。
- 可视化图形界面操作
- kettle流程图本质上都是配置文件,比如.ktr/.kjb文件。
这样的一个好处就是,流程图一旦画好之后,就可放到其他平台使用。
下载
下载就不说了,自己找官网下载就行,文件挺大,下载也挺慢,如果下载不下来的话,可以在下边评论处@我
安装和启动
在window上,双击Spoon.bat, 打开即可,如图
在启动之前,最好是修改下 启动脚本,添加字符集utf-8, 比如
set OPT=%OPT% %PENTAHO_DI_JAVA_OPTIONS% "-Dfile.encoding=UTF-8" "-Djava.library.path=%LIBSPATH%;%HADOOP_HOME%/bin" %JAVA_ENDORSED_DIRS% %JAVA_LOCALE_COMPAT% "-DKETTLE_HOME=%KETTLE_HOME%" "-DKETTLE_REPOSITORY=%KETTLE_REPOSITORY%" "-DKETTLE_USER=%KETTLE_USER%" "-DKETTLE_PASSWORD=%KETTLE_PASSWORD%" "-DKETTLE_PLUGIN_PACKAGES=%KETTLE_PLUGIN_PACKAGES%" "-DKETTLE_LOG_SIZE_LIMIT=%KETTLE_LOG_SIZE_LIMIT%" "-DKETTLE_JNDI_ROOT=%KETTLE_JNDI_ROOT%"
主要在spoon.bat 脚本中,添加-Dfile.encoding=UTF-8 ,指定字符集,否则导入的数据中文都是乱码。
安装mysql或oracle驱动包
mysql驱动包自行下载,放到安装目录下的/lib 目录下重启即可。我是下载的 5.1.49版本
创建数据源
点击 “转换”-》“主对象树”-》“DB链接”-》“新建”-》Test
然后输入数据库的链接信息,并点击测试,是否连接成功。
我这个是Myql DB ,你可以选择你那边支持的数据库。
需要创建两个,一个源数据库和一个目标数据库。
配置源数据源
点击“核心对象”-》“输入”-》选择“表输入”,如下图
双击 “表输入”,然后选择源数据库,并输入要迁移的表的sql, 并点击确定即可
目标库入库数据配置
点击“核心对象”-》“输出”-》“插入/更新”,如下图
双击“插入/更新2”,配置源表字段和目标表字段的之前的映射关系。
点击保存或者 ctrl+s ,会把这个流程,保存成 ktr格式的文件。
此文件的用处,下边会说。
现在这个映射关系,已经配置完成,可以点击 数据迁移了。
最后一步,是如何把流程图从window迁移到linux上运行
为什么要使用kettle呢,因为他的流程图文件,能支持跨系统使用,同一个ktr即可以在window上使用,也可以放到linux上执行。
在linux上,主要是使用kettle的pan.sh 脚本去执行这个ktr文件,具体执行的命令如下
sh $Kettle_Home/pan.sh -file=/home/test/kettle/ktr/data_transfer.ktr -norep
然后,我们可以定时执行这个脚本,从而实现增量数据的定时更新和迁移。当然目标源数据脚本得能查询出来当天的增量数据。
下边我配置的定时执行脚本任务。如下
TIME=$(date "+%Y%m%d")
sh /data/data-integration/pan.sh -file=/home/data-integration/ktr/data_transfer.ktr -norep >> /home/data-integration/ktr/log/log-"$TIME".log
这样,通过日志,可直接查看任务的执行情况。
记录一下: Kettle中文网
http://www.kettle.org.cn/
好了,通过Kettle 定时迁移大数据量的逻辑,是上边写的这部分了,欢迎大家拍砖。
望不吝小手,给点个赞,在此多谢啦!
相关推荐
- 丨公司丨公司大架构整理汇总
-
注:本文转自团队成员原创作品,特此鸣谢(公号:法海图鉴)今日话题公司大架构整理背景介绍经过前几期话题对各种企业类型的介绍,想必大家已经有了初步认识。之后我将带着大家开启对公司的深入了解。本期...
- 图解物理--八年级物理下册最全知识框架导图
-
第七章力1力2弹力3重力第八章运动和力1牛顿第一定律2二力平衡3摩擦力第九章压强1压强2液体压强3大气压强4流体压强与流速的关系第十章浮力1浮力2阿基米德原理3物体的浮沉条件及应用第十一章功...
- 八年级上册生物,思维导图,期末高分必备资料,家长收藏
-
这是八年级上册生物的思维导图,孩子在背诵知识点的时候,可以看一下知识点在导图中的位置,形成对知识点整体的把握,有助于学生拿高分,特别是图片中带红色星星的部分,更是要注意背诵,是重点内容。家长可以把图片...
- 2019政府工作报告精华,这张思维导图里全都有
-
每经记者:李可愚每经编辑:陈星每日经济新闻
- 图解薪酬体系结构设计
-
...
- 司考复习独家总结!一张图总结行政法知识结构体系
-
作为三大实体法之一,行政法的分值在60分左右,行政法在司法考试中一直比较平稳常规,没有偏题怪题,还是比较容易得分的。小编要提醒大家,在3月之前要把三大实体法学习一遍。下图是厚大在线360导学师小周总结...
- 实用干货!高中物理框架图,让零碎知识“串联”起来
-
高中物理学习一定要抓好逻辑结构大框架!了解整个知识框架体系后,更易抓住骨干知识,干掉重难知识点~今天给大家分享高中物理的框架图同学们赶紧收藏起来吧!力学知识结构图光学知识结构图热学、原子物理知识结构图...
- 254m超高层办公楼型钢砼框架-核心筒结构图
-
高度类别:超高层建筑钢筋混凝土结构:框架,框架核心筒钢结构:钢框架建筑功能:办公包含:办公楼57层(-3层)254.150m钻孔灌注桩桩+筏板型钢混凝土框架-钢筋混凝土核心筒西裙房2层(-...
- 砖混结构与框架结构,究竟有何区别?千万别被坑!
-
现在买房装修的人最怕啥?不是价格高,而是房子不安全!两种主流建筑结构,砖混靠墙,框架靠柱子,选错了隔墙都可能要命。简单说,砖混便宜但别碰高层,框架贵点但能保命。砖混那些承重墙根本不能拆,想砸墙改个开放...
- 大师一百——高中化学必考:《元素周期律》考点框架图
-
今天大师给大家带来的是高中化学的《元素周期律》考点框架图,高中的同学必须牢记于心,这种重要的考点,考试是一定会考的!化学大师...
- 需求分析框架图
-
需求分析框架图
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- 框架图 (58)
- flask框架 (53)
- quartz框架 (51)
- abp框架 (47)
- jpa框架 (47)
- springmvc框架 (49)
- 分布式事务框架 (65)
- scrapy框架 (56)
- shiro框架 (61)
- 定时任务框架 (56)
- java日志框架 (61)
- JAVA集合框架 (47)
- mfc框架 (52)
- abb框架断路器 (48)
- beego框架 (52)
- java框架spring (58)
- grpc框架 (65)
- tornado框架 (48)
- 前端框架bootstrap (54)
- orm框架有哪些 (51)
- ppt框架 (48)
- 内联框架 (52)
- cad怎么画框架 (58)
- ssm框架实现登录注册 (49)
- oracle字符串长度 (48)