Talend 数据准备中文使用说明 Talend 数据准备是一个自助式应用程序,使信息工作者能够通过简化和加快为分析或其他数据驱动的任务准备数据的费时费力的过程来减少工作时间。该应用程序包括集成编目、数据发现与分析、净化、标准化、整形、丰富和连接数据集、数据准备操作化、数据准备概念等功能块。 1. 数据集:数据集是原始数据的集合,可以作为一种或多种制剂的原料。它是一个表格,您可以在不影响原始数据的情况下应用配方步骤。数据集可以在准备工作中重复使用。 2. 制备:制备是将数据集和配方链接在一起,产生最终的结果。可以将此结果导出为文件或将其连接到数据目标。原始数据集从不被修改。 3. 配方:配方是指一个食谱被字面地定义为“一组方向,有一个制作或准备东西的成分清单”。在 TalendDataPreparement 中,成分是原始数据,称为数据集,方向是应用于数据集的函数集。在视觉上,配方是左折叠面板中函数的自顶向下序列。配方通过准备与数据集链接。 4. 功能:函数是应用于行、列或整个数据集的动作,例如移除空行。当函数被用作准备的一部分时,它们不修改原始数据。应用函数按顺序记录到配方中。 5. 数据准备体系结构:该架构图标识了 Talend 数据准备的功能块,以及它们之间的相互作用。定义了五个不同的功能块:客户端、服务器块、数据库块、执行服务器模块和 Hadoop 集群块。 6. 客户端:客户端使用 Web 浏览器和 TaleStudio 来阻止。从 Web 浏览器中,您可以访问 Talend 数据准备 Web 应用程序。这就是您将数据导入、本地文件或其他来源,净化或浓缩创造这个数据的新制剂。 7. 服务器块:服务器块包括 Talend 数据制备中的应用服务器,连接到人才管理中心,并选择 Talend 字典服务服务器和流转轮服务器。这一块还包括卡夫卡服务器用于 Talend 数据准备和人才词典服务之间的内部消息。Taland 身份和访问管理服务用于启用单点登录。 8. 数据库块:数据库块包含与 TalEngPrimeCenter 和 MangoDB 数据库一起使用的数据库。管理数据库用于管理用户帐户和权限。审计数据库是用来评估的工作才干的工作室和监控数据库中实现不同的方面是用于监测技术和服务的执行要求。MongoDB 数据库用于存储您所有的数据和准备,以及用于验证应用中数据的语义类型。 9. 执行服务器模块:执行服务器模块包含一个用于管理的出口,将对 Hadoop 集群进行火花作业服务器,和零件目录。由于目录服务的组件,您可以导入存储在各种数据库中的数据和创建远程数据直接在人才数据准备。 10. Hadoop 集群块:Hadoop 集群的块,在准备从 HDFS 或 JDBC 进口数据可以用在大数据背景下人才数据制备加工时。 11. 管理数据准备:管理数据准备创建 TalED 数据准备用户 TalEngPrimeCenter 允许您定义 TaleDebug 准备用户并为其分配预定义角色。这使得用户列表可从 Talend 数据准备共享数据集或制备与其他上市用户为例。这些用户可以只涉及公司的数据准备,或与数据准备和其他项目类型的混合项目,例如数据集成。仅创建用户类型的数据准备这种类型的用户可以访问 TALND 数据准备,但不能访问其他项目。
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![ppt](https://img-home.csdnimg.cn/images/20210720083527.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![txt](https://img-home.csdnimg.cn/images/20210720083642.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/release/download_crawler_static/10760268/bg1.jpg)
![](https://csdnimg.cn/release/download_crawler_static/10760268/bg2.jpg)
![](https://csdnimg.cn/release/download_crawler_static/10760268/bg3.jpg)
![](https://csdnimg.cn/release/download_crawler_static/10760268/bg4.jpg)
![](https://csdnimg.cn/release/download_crawler_static/10760268/bg5.jpg)
剩余63页未读,继续阅读
![avatar-default](https://csdnimg.cn/release/downloadcmsfe/public/img/lazyLogo2.1882d7f4.png)
- 唐僧经常不洗头2020-05-10好多内容是用翻译工具翻译的,标上出处就好了。
- kxg1232019-03-05用处不大,还是谢谢了。
![avatar](https://profile-avatar.csdnimg.cn/default.jpg!1)
- 粉丝: 0
- 资源: 1
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
最新资源
- 打包和分发Rust工具.pdf
- SQL中的CREATE LOGFILE GROUP 语句.pdf
- C语言-leetcode题解之第172题阶乘后的零.zip
- C语言-leetcode题解之第171题Excel列表序号.zip
- C语言-leetcode题解之第169题多数元素.zip
- ocr-图像识别资源ocr-图像识别资源
- 图像识别:基于Resnet50 + VGG16模型融合的人体细胞癌症分类模型实现-图像识别资源
- C语言-leetcode题解之第168题Excel列表名称.zip
- C语言-leetcode题解之第167题两数之和II-输入有序数组.zip
- C语言-leetcode题解之第166题分数到小数.zip
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback-tip](https://img-home.csdnimg.cn/images/20220527035111.png)
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)