《Kettle保姆级教学-界面介绍》

目录

    • 一、Kettle介绍
    • 二、界面介绍
      • 1.界面构成
      • 2、菜单栏详细介绍
        • 2.1 【文件F】
        • 2.2 【编辑】
        • 2.3 【视图】
        • 2.4 【执行】
        • 2.5 【工具】
        • 2.6 【帮助】
      • 3、转换界面介绍
      • 4、作业界面介绍
      • 5、执行结果

一、Kettle介绍

Kettle 是一个开源的 ETL(Extract, Transform, Load,提取、转换、加载)工具,全称为KDE Extraction, Transportation, Transformation and Loading Environment,广泛应用于数据集成、数据清洗、数据迁移等领域。它的名字“Kettle”源自其“装置”功能的含义,即“把各种数据源像水一样提取出来并进行处理”。在2006年被Pentaho公式收购后,重命名为 Pentaho Data Integration(PDI),这个工具能够帮助用户在不同的数据源和目标系统之间进行数据转换、清洗和加载。Kettle 被广泛用于构建数据仓库、数据集成平台等。

二、界面介绍

在这里插入图片描述

1.界面构成

菜单栏:包括【文件(F)】【编辑】【视图】【执行】【工具】【帮助】6个菜单项
在这里插入图片描述

快捷菜单图标栏:从左到右分别为【新建文件】【打开文件】【探索资源库】【保存文件】【使用不同名称保存文件】【视图类型】
在这里插入图片描述

标题栏:显示界面标题名称,欢迎界面的标题为“欢迎!"
在这里插入图片描述

2、菜单栏详细介绍

2.1 【文件F】

在这里插入图片描述

菜单项功能说明
新建 → 转换依次单击【新建】→【转换】菜单项,或使用Ctrl+N快捷键,创建一个转换工程
新建 → 作业(J)依次单击【新建】→【作业(J)】菜单项,或使用Ctrl+Alt+N快捷键,创建一个任务工程
新建 → 数据库连接在转换工程或任务过程中,依次单击【新建】→【数据库连接】菜单项,创建一个数据库连接
打开提供打开现有Kettle文件(如转换、作业等)的功能
打开最近的配置显示最近打开过的文件列表,方便快速重新打开
关闭关闭当前打开的Kettle文件
关闭所有关闭所有打开的Kettle文件
保存保存当前打开的Kettle文件的更改
另存为将当前打开的Kettle文件保存到新的位置或文件名下
打印提供打印当前打开的Kettle文件内容的功能
从XML文件导入从XML格式的文件中导入Kettle对象或配置
导出将当前打开的Kettle文件或对象导出为XML格式或其他指定格式
退出关闭Kettle应用程序
2.2 【编辑】

在这里插入图片描述

菜单项功能说明
撤销撤销上一步对转换或作业所做的更改
新步骤在转换或作业中添加一个新的步骤(具体步骤类型需用户选择)
重做如果之前进行了撤销操作,此选项将允许您重做那一步。但在某些情况下,如果撤销操作不可逆转或没有可重做的步骤,此选项可能不可用
剪切剪切当前选中的步骤或对象,将其移动到剪贴板中,以便在其他位置粘贴
复制所选的步骤到剪贴板将当前选中的步骤或对象复制到剪贴板中,以便在其他位置粘贴相同的步骤或对象
复制文件此功能可能用于复制转换或作业中引用的文件到指定位置,但具体实现可能依赖于Kettle的版本和上下文环境
从剪贴板复制步骤从剪贴板中粘贴之前剪切或复制的步骤或对象到当前位置
复制转换图片到剪贴板将当前转换的图形表示复制到剪贴板中,以便在其他应用程序(如图像编辑器或文档处理器)中粘贴
清除选择取消当前所有选中的步骤或对象的选择状态
选择所有的步骤选择转换或作业中的所有步骤或对象
搜索元数据在转换或作业中搜索特定的元数据,如数据库连接、变量名等
设置环境变量添加或修改环境变量,这些变量可以在转换或作业执行时被引用
显示环境变量显示当前可用的所有环境变量及其值
编辑kettle.properties文件打开并编辑Kettle的配置文件kettle.properties,该文件包含Kettle的全局设置和配置
显示参数(u)显示当前转换或作业中定义的参数及其值。参数可以用于在转换或作业之间传递信息或控制行为
2.3 【视图】

在这里插入图片描述

菜单项功能说明
视图类型选中此菜单项,显示视图类型为Data Integration
放大放大当前转换或作业的图形表示,以便更清楚地查看细节。这通常通过增加图形元素(如步骤和连接线)的大小来实现。
缩小缩小当前转换或作业的图形表示,以便在屏幕上查看更多内容。这通常通过减小图形元素的大小来实现。
等比例将当前转换或作业的图形表示恢复到其原始大小或等比例缩放状态。这有助于在用户进行了放大或缩小操作后恢复到标准视图。
执行结果面板显示或隐藏执行结果面板,该面板用于显示转换或作业执行过程中的输出、错误和日志信息。这对于调试和监控转换或作业的执行非常有用。
2.4 【执行】

在这里插入图片描述

菜单项功能说明
运行执行当前打开的转换或作业。这将启动转换或作业的处理流程,并根据定义的步骤和逻辑执行相应的操作。
Run Options提供运行转换或作业时的附加选项。这可能包括设置并行处理、指定日志级别、定义变量等。用户可以根据需要配置这些选项以影响转换或作业的执行方式。
预览在不实际执行转换或作业的情况下,预览其处理结果。这通常用于查看转换或作业中某个步骤的输出数据,以便在正式运行之前进行验证和调整。
调试(D)进入调试模式,逐步执行转换或作业中的步骤,并查看每个步骤的输入和输出数据。这对于诊断和处理转换或作业中的错误和问题非常有用。用户可以在调试过程中设置断点、单步执行和查看变量值等。
重放®重新执行最近一次成功运行的转换或作业。这通常用于在修改转换或作业后,快速验证其是否按预期工作,而无需从头开始执行整个流程。
校验对转换或作业进行语法和逻辑校验,以确保其没有错误或不一致之处。这有助于在正式运行之前发现并修复潜在的问题。
影响分析分析转换或作业对数据库或其他数据源的影响。这通常用于评估转换或作业执行后可能产生的数据更改、表结构变化等。影响分析有助于用户了解转换或作业的作用范围和潜在后果。
获取SQL对于包含数据库操作的转换或作业步骤,获取其生成的SQL语句。这有助于用户理解步骤如何在数据库级别上执行操作,并进行相应的优化和调整。
显示最近一次的操作显示最近一次执行转换或作业时的操作记录,包括执行时间、状态、日志信息等。这有助于用户跟踪转换或作业的历史执行情况,并快速定位问题所在。
2.5 【工具】

在这里插入图片描述

菜单项功能说明
数据库单击此菜单项,浏览当前工程的数据库连接,或清除缓存
资源库单击此菜单项,探索、导入、导出当前的工程的资源库,或清除共享对象缓东
向导(W)单击此菜单项,在当前工程中,创建数据库连接向导,或复制单表向导,或复制多表向导单击此菜单项
选项打开Kettle的选项对话框,允许用户配置Kettle的全局设置。这些设置包括用户界面偏好、日志记录级别、数据库连接池配置等。
Show plugin information显示有关已安装Kettle插件的信息。
2.6 【帮助】

在这里插入图片描述

菜单项功能说明
显示欢迎屏幕打开Kettle的欢迎屏幕,该屏幕通常包含有关Kettle的简要介绍、最新更新和提示、快速入门指南或教程链接等信息。
Documentation提供对Kettle官方文档的访问。
关于显示有关Kettle版本的信息,包括版本号、发布日期、版权信息、开发者或维护者联系信息等。

3、转换界面介绍

在Kettle欢迎界面中,依次单击【新建】一【转换】菜单项,或使用Ctr+N快捷键,创建【写日志】转换工程。

  • 在【写日志】转换工程中,与欢迎界面不同,在左边的组件区域中,以树形结构的形式,列出了【核心对象】选项卡中所有的类别对象。

  • 例如,单击【输入】对象,系统会列出【输入】对象下所有的组件,选择【CSV文件输入】组件,拖曳至右边的工作区域中,完成【CSV文件输入】组件的创建,如图所示。
    在这里插入图片描述
    在这里插入图片描述
    从左到右分别为

  • 运行工程

  • 暂停运行工程

  • 停止运行工程

  • 预览数据

  • 调试运行的工程

  • 重放转换工程

  • 校验转换

  • 影响分析

  • 获取SQL

  • 选择数据库连接

  • 显示/隐藏执行结果面板

4、作业界面介绍

在Kettle欢迎界面中,依次单击【新建】→【作业(J)】菜单项,或使用Ctrl+Alt+N快捷键,创建【作业1】任务工程。

  • 在【作业1】任务工程中,单击左边的组件区域中的【通用】对象,显示出【通用】对象下所有的组件选择【Start】组件,拖曳至右边的工作区域中,完成【Start】组件的创建,如图所示。【Start】组件创建后即可设置该组件的参数,运行任务。
    在这里插入图片描述
    在这里插入图片描述

从左到右分别为

  • 运行作业
  • 停止运行作业
  • 重放作业工程
  • 获取SQL
  • 选择数据库连接
  • 显示/隐藏执行结果面板

5、执行结果

在这里插入图片描述

转换的【执行结果】面板有【日志】【执行历史】【步骤度量】【性能图】【Metrics】【Preview data】6个选项卡,每个选项卡的具体说明如下。

  • 【日志】选项卡。默认选项,显示转换中的日志信息,这些信息一般包括转换成功、失败、失败的错误提示信息等。

  • 【执行历史】选项卡。显示【转换日志表】【步骤日志表】【日志通道日志表】【Metrics log table】等表的信息。

  • 【步骤度量】选项卡。显示组件一些可以度量的数据信息,如复制的记录行数,读、写记录数等。

  • 【性能图】选项卡。配置转换属性的参数,以便能够有效地重新执行转换。

  • 【Metrics】选项卡。显示有关转换的组件执行时间、读取数据文件时间等指标数据。

  • 【Preview data】选项卡。预览转换的结果数据。

在这里插入图片描述

作业的【执行结果】面板有【日志】【历史】【作业度量】【Metrics】4个选项卡,每个选项卡的具体说明如下。

  • 【日志】选项卡。默认选项,显示执行任务中的日志信息,这些信息一般包括执行任务成功、失败、失败的错误提示信息等。
  • 【历史】选项卡。显示【作业日志表】【作业项日志表】【日志通道日志表】等表的信息。
  • 【作业度量】选项卡。显示组件一些可以度量的数据信息,如执行任务中的结果、原因等信息。
  • 【Metrics】选项卡。显示有关任务的组件执行时间、读取数据文件时间等指标数据。根据实际需求,读者可以查看有关选项的信息,了解任务的执行情况,定位和分析出错的地方,维护和优
    化任务工程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13125.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新型智慧城市建设方案-1

智慧城市建设的背景与需求 随着信息技术的飞速发展,新型智慧城市建设成为推动城市现代化、提升城市管理效率的重要途径。智慧城市通过整合信息资源,优化城市规划、建设和管理,旨在打造更高效、便捷、宜居的城市环境。 智慧城市建设的主要内容…

【Java计算机毕业设计】基于Springboot的物业信息管理系统【源代码+数据库+LW文档+开题报告+答辩稿+部署教程+代码讲解】

源代码数据库LW文档(1万字以上)开题报告答辩稿 部署教程代码讲解代码时间修改教程 一、开发工具、运行环境、开发技术 开发工具 1、操作系统:Window操作系统 2、开发工具:IntelliJ IDEA或者Eclipse 3、数据库存储&#xff1a…

ollama部署deepseek实操记录

1. 安装 ollama 1.1 下载并安装 官网 https://ollama.com/ Linux安装命令 https://ollama.com/download/linux curl -fsSL https://ollama.com/install.sh | sh安装成功截图 3. 开放外网访问 1、首先停止ollama服务:systemctl stop ollama 2、修改ollama的servic…

Agentic Automation:基于Agent的企业认知架构重构与数字化转型跃迁---我的AI经典战例

文章目录 Agent代理Agent组成 我在企业实战AI Agent企业痛点我构建的AI Agent App 项目开源 & 安装包下载 大家好,我是工程师令狐,今天想给大家讲解一下AI智能体,以及企业与AI智能体的结合,文章中我会列举自己在企业中Agent实…

图论常见算法

图论常见算法 算法prim算法Dijkstra算法 用途最小生成树(MST):最短路径:拓扑排序:关键路径: 算法用途适用条件时间复杂度Kruskal最小生成树无向图(稀疏图)O(E log E)Prim最小生成树无…

手机上运行AI大模型(Deepseek等)

最近deepseek的大火,让大家掀起新一波的本地部署运行大模型的热潮,特别是deepseek有蒸馏的小参数量版本,电脑上就相当方便了,直接ollamaopen-webui这种类似的组合就可以轻松地实现,只要硬件,如显存&#xf…

Java进阶学习之路

Java进阶之路 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 目录 Java进阶之路前言一、Java入门 Java基础 1、Java概述 1.1 什…

SpringBoot使用 easy-captcha 实现验证码登录功能

文章目录 一、 环境准备1. 解决思路2. 接口文档3. redis下载 二、后端实现1. 引入依赖2. 添加配置3. 后端代码实现4. 前端代码实现 在前后端分离的项目中,登录功能是必不可少的。为了提高安全性,通常会加入验证码验证。 easy-captcha 是一个简单易用的验…

Android 常用命令和工具解析之Battery Historian

Batterystats是包含在 Android 框架中的一种工具,用于收集设备上的电池数据。您可以使用adb bugreport命令抓取日志,将收集的电池数据转储到开发机器,并生成可使用 Battery Historian 分析的报告。Battery Historian 会将报告从 Batterystats…

如何安装PHP依赖库 更新2025.2.3

要在PHP项目中安装依赖,首先需要确保你的系统已经安装了Composer。Composer是PHP的依赖管理工具,它允许你声明项目所需的库,并管理它们。以下是如何安装Composer和在PHP项目中安装依赖的步骤: 一. 安装Composer 对于Windows用户…

DeepSeek各版本说明与优缺点分析

DeepSeek各版本说明与优缺点分析 DeepSeek是最近人工智能领域备受瞩目的一个语言模型系列,其在不同版本的发布过程中,逐步加强了对多种任务的处理能力。本文将详细介绍DeepSeek的各版本,从版本的发布时间、特点、优势以及不足之处&#xff0…

【机器学习与数据挖掘实战】案例11:基于灰色预测和SVR的企业所得税预测分析

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈机器学习与数据挖掘实战 ⌋ ⌋ ⌋ 机器学习是人工智能的一个分支,专注于让计算机系统通过数据学习和改进。它利用统计和计算方法,使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联…

InnoDB和MyISAM的比较、水平切分和垂直切分、主从复制中涉及的三个线程、主从同步的延迟产生和解决

InnoDB和MyISAM的比较 事务支持: InnoDB支持:支持事务 (ACID 属性)。支持 Commit、Rollback 和 Savepoint 操作。适合需要事务处理的应用,例如银行系统。MyISAM:不支持事务。每次操作都是自动提交,不能回滚或中止。适合对事务要求…

【免费】2007-2019年各省科技支出占一般公共预算支出的比重数据

2007-2019年各省科技支出占一般公共预算支出的比重数据 1、时间:2007-2019年 2、来源:国家统计局、统计年鉴 3、指标:行政区划代码、地区名称、年份、科技支出占一般公共预算支出的比重 4、范围:31省 5、指标解释&#xff1a…

tkvue 入门,像写html一样写tkinter

介绍 没有官网&#xff0c;只有例子 安装 像写vue 一样写tkinter 代码 pip install tkvue作者博客 修改样式 import tkvue import tkinter.ttk as ttktkvue.configure_tk(theme"clam")class RootDialog(tkvue.Component):template """ <Top…

哪些专业跟FPGA有关?

FPGA产业作为近几年新兴的技术领域&#xff0c;薪资高、待遇好&#xff0c;吸引了大量的求职者。特别是对于毕业生&#xff0c;FPGA领域的岗位需求供不应求。那么&#xff0c;哪些专业和FPGA相关呢&#xff1f; 哪些专业跟FPGA有关&#xff1f; 微电子学与固体电子学、微电子科…

pytorch实现门控循环单元 (GRU)

人工智能例子汇总&#xff1a;AI常见的算法和例子-CSDN博客 特性GRULSTM计算效率更快&#xff0c;参数更少相对较慢&#xff0c;参数更多结构复杂度只有两个门&#xff08;更新门和重置门&#xff09;三个门&#xff08;输入门、遗忘门、输出门&#xff09;处理长时依赖一般适…

【大数据技术】搭建完全分布式高可用大数据集群(Hadoop+MapReduce+Yarn)

搭建完全分布式高可用大数据集群(Hadoop+MapReduce+Yarn) jdk-8u361-linux-x64.tarhadoop-3.3.6.tar.gz注:请在阅读本篇文章前,将以上资源下载下来。 写在前面 本文主要介绍搭建完全分布式高可用集群Hadoop+MapReduce+Yarn的详细步骤。 注意: 统一约定将软件安装包存放…

移动机器人规划控制入门与实践:基于navigation2 学习笔记(一)

课程实践: (1)手写A*代码并且调试,总结优缺点 (2)基于Gazebo仿真,完成给定机器人在给定地图中的导航调试 (3)使用Groot设计自己的导航行为树 掌握一门技术 规划控制概述 常见移动机器人

两种文件类型(pdf/图片)打印A4半张纸方法

环境:windows10、Adobe Reader XI v11.0.23 Pdf: 1.把内容由横排变为纵排&#xff1a; 2.点击打印按钮&#xff1a; 3.选择打印页范围和多页&#xff1a; 4.内容打印在纸张上部 图片&#xff1a; 1.右键图片点击打印&#xff1a; 2.选择打印类型&#xff1a; 3.打印配置&am…