Pentaho 和他的五位成员(五灵威力) kettle spoon pancarte kitchen (pdi的前生今世)

Pentaho是个合成词

Penta是希腊数字 “五”的前缀

ho是夏威夷文化词语发音氛围,

pdi的(Pentaho Data Intergation)软件的作者是个夏威夷文化推崇者,作者希望借用

五种灵力,和五种构成世界的五种元素来代表,数据就像是信息世界的各种由五种基本元素组成的物质一样,需要精心爱护,夏威夷文化中的语言氛围前缀 "ho"

地球

空气

精神

等五种灵力来构建一个文明的完美的系统Pentaho 由此诞生

Pentaho Kettle 是一个强大的 ETL(Extract, Transform, Load)工具,其主要组件包括 Spoon、Pan、Kitchen 和 Carte,它们之间的关系如下:

Spoon (勺子)(从数据湖中取出一勺水)pentaho世界的五灵之一

  • 作用:Spoon 是 Kettle 的图形化用户界面工具,用于设计和编辑 ETL 作业(Job)和转换(Transformation)。用户可以通过拖拽组件的方式构建数据流。

  • 与其他组件的关系:Spoon 设计好的作业和转换文件分别保存为.kjb.ktr格式,这些文件可以被 Pan 和 Kitchen 执行。

Pan (平底锅) (容量比勺子大从数据湖中可捞一锅水)pentaho世界的五灵之一

  • 作用:Pan 是一个命令行工具,用于执行由 Spoon 设计的转换文件(.ktr)。它适合在服务器环境中运行,支持批处理和自动化任务。

  • 与其他组件的关系:Pan 从 Spoon 设计的.ktr文件中读取转换定义,并执行相应的数据处理任务。

Kitchen(厨房,厨师)(自行大作业编排,像厨师烹饪一样)pentaho世界的五灵之一

  • 作用:Kitchen 是一个命令行工具,用于执行由 Spoon 设计的作业文件(.kjb)。作业通常包含多个转换和其他控制流程,如条件判断、循环等。

  • 与其他组件的关系:Kitchen 从 Spoon 设计的.kjb文件中读取作业定义,并按照作业的流程执行多个转换。

Carte (菜单,菜单卡)(显示与调度)pentaho世界的五灵之一

  • 作用:Carte 是一个轻量级的 Web 服务器,用于远程执行和监控由 Spoon 设计的转换和作业。它支持分布式执行,可以在多台服务器上并行处理任务,提高处理效率。

  • 与其他组件的关系:Carte 可以接收远程请求,执行 Spoon 设计的转换和作业,并提供 Web 界面用于监控任务的执行状态。

  • kettle就是大水壶 是pentaho世界的五灵之一

其实数据湖的概念就是由pentaho这个公司提出的

总结

  • Spoon是设计工具,用于创建和编辑.ktr.kjb文件。

  • PanKitchen是执行工具,分别用于执行.ktr.kjb文件。

  • Carte是分布式服务器,用于远程执行和监控转换和作业。

这些组件共同构成了 Kettle 的完整 ETL 解决方案,支持从设计、开发到执行和监控的全流程数据处理

pdi和kettle的关系呢

PDI(Pentaho Data Integration)和 Kettle 实际上是同一个工具,只是名称不同。它们之间的关系可以总结为:PDI 是 Kettle 的正式名称,而 Kettle 是其社区版的名称。

背景

  • Kettle:最初是一个开源的 ETL(Extract, Transform, Load)工具,由 Matt Casters 开发,并在 2006 年左右被 Pentaho 收购。

  • PDI:在 Pentaho 收购 Kettle 后,将其整合到 Pentaho 的商业智能平台中,并正式命名为Pentaho Data Integration(PDI)。这个名字更符合其在 Pentaho 生态系统中的定位。

功能和用途

无论是 Kettle 还是 PDI,它们的核心功能和用途是相同的:

  1. 数据提取(Extract):从各种数据源(如数据库、文件、API 等)中提取数据。

  2. 数据转换(Transform):对数据进行清洗、转换、聚合等操作。

  3. 数据加载(Load):将处理后的数据加载到目标数据仓库或数据库中。

版本差异

  • 社区版(Kettle):完全开源,由社区维护和开发,适用于个人开发者和小型项目。

  • 企业版(PDI):包含在 Pentaho 的商业产品中,提供额外的企业级功能,如更好的性能优化、高级调度、安全性和支持服务。

总结

PDI 和 Kettle 是同一个工具的不同名称:

  • Kettle是社区版的名称,主要用于开源社区的开发和使用。

  • PDI是 Pentaho Data Integration 的缩写,是 Pentaho 官方的正式名称,适用于企业级应用。

两者在功能上完全一致,只是在使用场景和目标用户群体上有所不同。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1206494.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

javafx程序启动cmd.exe调用其他软件或者脚本指令

举个例子 ProcessBuilder pb new ProcessBuilder("cmd.exe", "/c", command); pb.directory(new File( ConfigContextUtils.pdiConfig.getPdiHome())); pb.start(); 解释下这三句 1. ProcessBuilder pb new ProcessBuilder("cmd.exe", &q…

如何解决 Spoon 与 Carte 互联的 UTF-8 编码问题

问题背景 在 Windows 10 环境下配置 PDI 9.4,使用 Spoon 连接 Carte 服务器时遇到以下问题: HTTP 400 Bad Request - Invalid byte 2/3 of 2/3-byte UTF-8 sequence Spoon 无法连接到 Carte 服务器 转换文件无法远程执行 根本原因 Windows 系统默认…

spoon如何连接carte如何将.ktr任务或者.kjb任务提交个远程carte服务让,carte的服务端来执行 etl脚本的任务呢?

前提是你的carte远程服务已经启动了 第一步打开 spoon,打开文件选中你的.ktr或者.kjb 第二步spoon与carte服务的通信连接配置,就是通过.ktr任务配置文件的子服务器选项来配置 第三步 对.ktr任务进行运行时配置 .ktr有两种运行模式 第一种 Pentaho loc…

Pentaho Data Integration:Spoon与Carte的对比

在数据集成和ETL(Extract, Transform, Load)任务中,Pentaho Data Integration(PDI)是一个强大的工具。PDI提供了两个主要的组件:Spoon和Carte,它们在执行转换(.ktr 文件)…

mast3r-smf测试 - MKT

mast3r-smf测试 1 关闭代理# 清除代理环境变量unset http_proxy https_proxy all_proxy HTTP_PROXY HTTPS_PROXY ALL_PROXY # 运行MASt3R demopython3 demo.py \ --model_name checkpoints/MASt3R_ViTLarge_BaseDe…

备份 还原 系统 数据保护

操作系统备份直接找方案厂商给备份方案:硬件还原卡冰点还原Acronis True Image(克隆与恢复软件)Acronis备份还原方案http://www.tieten.cnhttp://www.acronis.com/en-us影子系统赛门铁克傲梅 http://www.disktool.cn/…

nodejs基于vue的教学质量评价管理系统的设计与实现 评教系统39j06

文章目录摘要关键词--nodejs技术栈--结论源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要 该系统基于Node.js和Vue.js构建,旨在实现高校教学质量评价的数字化管理。后端采用Node.js的Express框架提供RESTful API接口&am…

中小厂 AI 招聘隐藏要求:除了技术,这 2 点更关键

在AI人才竞争白热化的当下,中小厂往往无法像大厂那样比拼薪资福利与品牌光环,其招聘逻辑也更贴近业务本质。多数求职者误以为只要夯实Python、TensorFlow等技术栈,就能顺利通关,但实际上面试官在技术达标后,会更看重两…

二叉树递归实现

二叉树链式结构的实现详解(C语言) 前置说明 在学习二叉树的基本操作前,需先创建一棵二叉树。为降低学习成本,我们手动快速构建一棵简单二叉树,待掌握基本操作后再深入研究真正的创建方式(如通过前序序列构…

nodejs基于vue的教师科研项目申报信息管理系统的设计与实现_c7z6m

文章目录设计背景技术架构核心功能创新点实现效果--nodejs技术栈--结论源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!设计背景 教师科研项目申报信息管理系统旨在简化科研项目申报流程,提高管理效率。系统基于Node.js后端…

nodejs基于vue二手商品物品商城网站_s926p

文章目录 基于Node.js与Vue的二手商品商城网站摘要技术栈核心功能部署与优化扩展性 --nodejs技术栈--结论源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式! 基于Node.js与Vue的二手商品商城网站摘要 技术栈 后端框架: Node.js (Express…

nodejs基于vue基于MVC模式的考研论坛互动交流系统的私信设计与实现

文章目录 考研论坛私信系统的设计与实现摘要 --nodejs技术栈--结论源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式! 考研论坛私信系统的设计与实现摘要 背景与目标 考研论坛作为信息交流平台,需高效安全的私信功能支持用户间…

nodejs基于vue技术人人美食菜谱分享点餐配送平台的设计与实现

文章目录 摘要内容技术实现要点创新点与价值 --nodejs技术栈--结论源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式! 摘要内容 该平台基于Node.js与Vue.js技术栈,构建了一个集美食菜谱分享、在线点餐及配送服务于一体的综合性…

税筹园区助力企业合规减负与税务优化

税筹园区的作用在于为企业提供税务筹划的有效平台,使其能够以更低的成本合规经营。特捷税在江苏徐州的园区模式,让企业能够享受到增值税垫付及各类税收优惠,显著降低了运营负担。企业通过参与园区,不仅能快速获得专业合规支持&…

气体涡轮流量计 本土精造 精准守护气体管控

2019年,大连格恩朗扎根滨城,承袭本土工业测控技术积淀,深耕气体计量领域,打造适配北方严寒、工业复杂环境的气体涡轮流量计。以“稳定精准、耐用易管”为核心,严守国家工业计量标准,覆盖燃气供应、工业气体…

企业级邮件服务优化实战:从550错误到高可用架构

本文将通过实战案例,分享如何从零构建一个稳定、高效、可扩展的企业级邮件服务架构。 一、问题诊断:550错误背后的真相 1.1 常见的邮件发送问题 java // 问题代码示例:简单的邮件发送方法 public class ProblematicEmailSender {public b…

格恩朗金属管浮子流量计 本土精造 稳控流体计量

2019年,大连格恩朗扎根滨城,承袭本土工业测控领域的技术积淀,专注打造适配北方复杂工况的金属管浮子流量计。以“稳定耐用、精准计量”为核心,遵循国家工业计量标准,覆盖化工生产、环保处理、能源输送等多场景&#xf…

Excel动态生成SQL更新语句:批量处理数据的高效技巧

在日常数据处理和数据库维护工作中,我们经常需要将Excel中的数据转换为SQL语句进行批量操作。特别是当需要根据Excel表格中的数据更新数据库记录时,手动编写每一条SQL语句既耗时又容易出错。本文将详细介绍如何使用Excel公式高效地生成"update"…

救命神器9个AI论文平台,自考学生轻松搞定毕业论文!

救命神器9个AI论文平台,自考学生轻松搞定毕业论文! AI 工具助力论文写作,自考学生迎来新希望 在当今信息化快速发展的时代,AI 技术正以前所未有的速度改变着我们的学习方式。对于自考学生而言,撰写毕业论文是一项既重要…

vLLM 推理 GPU 选型指南:显存、KV Cache 与性能瓶颈全解析

为 vLLM 推理有效规划 GPU 规模并进行合理配置,首先需要清晰理解大语言模型处理的两个基本阶段——Prefill(预填充)和 Decode(解码),以及这两个阶段对硬件提出的不同需求。 本指南深入剖析了 vLLM 运行时行…