没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
列名称 数据类型 查找表 查找列
AverageRate float 无 无
CurrencyKey int (FK) DimCurrency CurrencyKey (PK)
SSIS 教程
第一课
在本课中,将创建一个简单 ETL 包,该包可以从单个平面文件源提取数据,使用两个查找转换组件转换
该数据,然后将该数据写入 AdventureWorksDW 中的 FactCurrencyRate 事实数据表。在本课中,
还将学习如何创建新包、添加和配置数据源和目标连接以及使用新的控制流和数据流组件。
了解包要求
在创建包之前,需要充分了解在源数据和目标数据中使用的格式。了解了这些数据格式后,便可定义将
源数据映射到目标数据所需的转换。
查看源
在本教程中,源数据是平面文件 SampleCurrencyData.txt 中包含的一组历史货币数据。源数据具有以
下四列:货币的平均汇率、货币键、日期键和收盘汇率。
下面是 SampleCurrencyData.txt 文件中所包含的源数据示例:
1.00010001 ARS 9/3/2001 0:00 0.99960016
1.00010001 ARS 9/4/2001 0:00 1.001001001
1.00020004 ARS 9/5/2001 0:00 0.99990001
1.00020004 ARS 9/6/2001 0:00 1.00040016
1.00050025 ARS 9/7/2001 0:00 0.99990001
1.00050025 ARS 9/8/2001 0:00 1.001001001
1.00050025 ARS 9/9/2001 0:00 1
1.00010001 ARS 9/10/2001 0:00 1.00040016
1.00020004 ARS 9/11/2001 0:00 0.99990001
1.00020004 ARS 9/12/2001 0:00 1.001101211
在使用平面文件源数据时,需要了解平面文件连接管理器如何解释平面文件数据,这一点很重要。如果
平面文件源是 Unicode 编码的,则平面文件连接管理将所有列定义为 [DT_WSTR],默认列宽为 50。如
果平面文件源是 ANSI 编码的,则将列定义为 [DT_STR],默认列宽为 50。您可能必须更改这些默认设
置,才能使字符串列类型与所使用的数据更相符。为此,您需要查看将写入数据的目标的数据类型,然
后在平面文件连接管理器中选择正确的类型。
查看目标
源数据的最终目标是 AdventureWorksDW 中的 FactCurrencyRate 事实数据表。
FactCurrencyRate 事实数据表有四列,并且与两个维度表有关系,如下表所示。
列名称 数据类型 查找表 查找列
TimeKey Int (FK) DimTime TimeKey (PK)
EndOfDayRate float 无 无
平面文件列 表名 列名称 数据类型
0 FactCurrencyRate AverageRate Float
1 DimCurrency CurrencyAlternateKey nchar(3)
2 DimTime FullDateAlternateKey Datetime
3 FactCurrencyRate EndOfDayRate Float
将源数据映射为与目标兼容
对源数据和目标数据的分析指出需要查找 CurrencyKey 和 TimeKey 值。将执行这些查找的转换通过
使用 DimCurrency 和 DimTime 维度表中的备用键来获取 CurrencyKey 和 TimeKey 值。
任务 1:创建新的 Integration Services 项目
1. 在“开始”菜单上,依次指向“所有程序”和 Microsoft SQL Server,再单击 SQL Server、
Business Intelligence Development Studio。
2. 在“文件”菜单中,指向“新建”,再单击“项目”,以创建一个新的 Integration Services 项目。
3. 在“新建项目”对话框的“模板”窗格中,选择“Integration Services 项目”。
4. 在“名称”框中,将默认名称更改为 SSIS Tutorial。或者,清除“创建解决方案的目录”复选框。
默认情况下,将创建一个名为 Package.dtsx 的空包,并将该包添加到项目中。
5. 在解决方案资源管理器工具栏中,右键单击 Package.dtsx,再单击“重命名”,将默认包重命名为
Lesson 1.dtsx。
6. 当系统提示重命名包对象时,单击“是”。
设置受区域设置影响的属性
1. 在“视图”菜单上,单击“属性窗口”。
2. 在“属性”窗口中,将 LocaleID 属性设置为“英语(美国)“。
任务 2:添加并配置平面文件连接管理器
在本任务中,将在刚创建的包中添加一个平面文件连接管理器。通过平面文件连接管理器,包可从
平面文件中提取数据。使用平面文件连接管理器,可以指定包从平面文件中提取数据时要应用的文
件的名称与位置、区域设置与代码页以及文件格式,其中包括列分隔符。另外,还可以为各个列手
动指定数据类型;也可以使用“提供列类型建议”对话框,自动将提取出来的数据列映射到
Integration Services 数据类型。
必须为要使用的每种文件格式创建一个新的平面文件连接管理器。因为本教程从多个数据格式完全
相同的平面文件提取数据,所以只需为包添加和配置一个平面文件连接管理器。
在本教程中,将在平面文件连接管理器中配置以下属性:
Column names 因为平面文件没有列名,因此平面文件连接管理器将创建默认的列名。这
些默认名称不能用于标识每个列代表的内容。若要使这些默认名称更有用,需要将默认名称
改为要加载平面文件数据的事实数据表匹配的名称。
Data mappings 为平面文件连接管理器指定的数据类型映射,将由所有引用该连接管理器
的平面文件数据源组件使用。可以使用平面文件连接管理器,或者使用“提供列类型建议”对
话框来手动映射数据类型。在本教程中,将查看“提供列类型建议”对话框中建议的映射,然
后在“平面文件连接管理器编辑器”对话框中手动设置必要的映射。
平面文件连接管理器提供了有关数据文件的区域设置信息。如果未将您的计算机配置为使用区域设
置选项“英语(美国)”,则必须在“平面文件连接管理器编辑器”对话框中设置其他属性。
添加一个平面文件连接管理器
1. 右键单击“连接管理器”区域中的任意位置,再单击“新建平面文件连接”。
2. 在“平面文件连接管理器编辑器”对话框的“连接管理器名称”字段中,键入 Sample Flat File
Source Data。
3. 单击“浏览”。
4. 在“打开”对话框中,找到示例数据文件夹,再打开 SampleCurrencyData.txt 文件。默认情
况下,教程示例数据安装在 c:\Program Files\Microsoft SQL
Server\100\Samples\Integration Services\Tutorial\Creating a Simple ETL
Package\Sample Data 文件夹中。
设置受区域设置影响的属性
1. 在“平面文件连接管理器编辑器”对话框中,单击“常规”。
2. 将“区域设置”设置为“英语(美国)”,并将“代码页”设置为 1252。
重命名平面文件连接管理器中的列
1. 在“平面文件连接管理器编辑器”对话框中,单击“高级”。
2. 在“属性”窗格中,进行如下更改:
将 Column 0 名称属性改为 AverageRate。
将 Column 1 名称属性改为 CurrencyID。
将 Column 2 名称属性改为 CurrencyDate。
将 Column 3 名称属性改为 EndOfDayRate。
重新映射列数据类型
1. 在“平面文件连接管理器编辑器”对话框中,单击“建议类型”。
Integration Services 将根据前 100 行数据自动建议最合适的数据类型。您还可以将这些建议
选项改为增加或减少取样数据,以便指定整数数据或布尔数据的默认数据类型,或添加作为
填充量添加到字符串列中的空格。
剩余17页未读,继续阅读
资源评论
小邹子
- 粉丝: 398
- 资源: 2
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功