其他分享
首页 > 其他分享> > 数据清洗第三章转换和作业实例

数据清洗第三章转换和作业实例

作者:互联网

一.转换实例

1、数据准备

创建一个数据库personal,并在该数据库中创建两张数据表,即数据表personal_a和数据库personal_b。

  
2.打开kettle工具,创建转换

通过使用Kettle工具创建一个转换field_stitching,并添加“表输入”控件、“JavaScript代码”控件、“插入/更新”控件以及跳连接线。

3.配置“表输入”控件

双击“表输入”控件,进入“表输入”界面。

单击“获取SQL查询语句”按钮,弹出“数据库浏览器”窗口,展开LCT,并选中“表”菜单下的数据表personal_a

点击下图的“确定”按钮。​ 

点击确定按钮完成“表输入”控件的配置。

4、配置“JavaScript"控件​ 5.配置“插入/更新”控件

双击“插入/更新”控件进入,单击“新建”按钮,配置数据库连接,配置完成后单击“确认”按钮

单击目标表右侧的“浏览”按钮,弹出“数据库浏览器”窗口,展开field_stitching,选中“表”下的数据表personal_b,单击“确定”按钮,完成 

单击“获取字段”按钮,用来指定查询数据需要的关键字,这里选择的是数据表personal_b中的id字段和输入流里​的id字段 

单击“编辑映射”按钮,弹出“映射匹配”窗口,选中其中的“源字段”选项框中的字段和“目标字段”选项框中的字段,然后单击Add按钮,依次将一对对映射字段添加至“映射”选项框中,若“源字段”选项框的字段和“目标字段”选项框的字段相同,则可以单击“猜一猜”按钮,让kettle自动实现映射​ 

单击“确定”按钮,完成“插入/更新”控件的配置​ 

6.运行转换field_stitching 

单击转换工作区顶部的运行按钮,运行创建的转换field_stitching,实现将数据表personal_a中的surname字段和name字段进行拼接,并将结果数据插入到数据表personal_b中

7.查看数据表personal_b中的数据 

查看数据表personal_b是否已成功插入7条数据

从表中可以看出,数据表personal_b中已插入了数据,并且username字段显示的是数据表personal_a中surname字段和name字段进行拼接后的结果数据,因此可以说明成功实现了将数据表personal_a中的surname字段和name字段进行拼接,并将结果数据插入到数据表personal_b中。


二.作业实例

1.打开kettle工具,创建作业

通过kettle工具创建一个作业send_email,并添加Start控件、“发送邮件”控件、“成功”控件以及作业跳连接线

2. 配置Start控件 

 3. 配置“发送邮件”控件

在“地址”选项中添加收件人地址、发件人的回复名称以及发件人地址

在“服务器”选项中添加邮件服务器的相关参数和验证发件人的信息;邮件服务器与发件人的账号对应,如果发件人的邮件是263企业邮箱,所以SMTP服务器和端口号分别填写smtp.263.net和25。若所填发件人的邮箱是QQ邮箱,则填写smtp.qq.com和465(或587);若所填发件人的邮箱是网易163邮箱,则填写smtp.163.com和25;密码处填写的是自己邮箱的授权码

4、运行send_email作业 

5、查看邮箱的收件箱 

标签:控件,第三章,单击,personal,数据表,字段,实例,按钮,清洗
来源: https://blog.csdn.net/ll1050723826/article/details/121106132